阿里云狂砍82%英伟达芯片需求，又一个DeepSeek时刻？阿里云新研究Aegaeon直接砍掉82%的英伟达GPU需求，近日于顶会SOSP亮相。首次实现token级别调度，模型切换的初始化时间压缩至0.8秒，有效吞吐量最多能提升9倍