阿里云狂砍82%英伟达芯片需求,又一个DeepSeek时刻? 阿里云新研究Aegaeon直接砍掉82%的英伟达GPU需求,近日于顶会SOSP亮相。首次实现token级别调度,模型切换的初始化时间压缩至0.8秒,有效吞吐量最多能提升9倍

添加新评论