Cursor重写Blackwell上的MoE解码路径,1.84倍提速推动Composer更快迭代 Cursor 近日披露,其在 Blackwell GPU 上重构了 MoE 模型 的 token 生成路径,并将这套方法命名为 warp decode。官方称,这项底层优化带来 1.84 倍推理吞吐提升,同时让输出结果更接近 FP32 参考值;相关改进也已用于 Composer 的训练流程,以加快模... AI资讯 • Admin • 2026/4/7 104