warp decode

找到 1 篇相关文章

Cursor重写Blackwell上的MoE解码路径，1.84倍提速推动Composer更快迭代

Cursor 近日披露，其在 Blackwell GPU 上重构了 MoE 模型的 token 生成路径，并将这套方法命名为 warp decode。官方称，这项底层优化带来 1.84 倍推理吞吐提升，同时让输出结果更接近 FP32 参考值；相关改进也已用于 Composer 的训练流程，以加快模...

AI资讯 • Admin • 2026/4/7

121

warp decode

Cursor重写Blackwell上的MoE解码路径，1.84倍提速推动Composer更快迭代

推荐工具

提交AI工具

请确认提交信息