返回AI资讯
Grok 4.5进入SpaceX与特斯拉私测:先看三项不确定性

Grok 4.5进入SpaceX与特斯拉私测:先看三项不确定性

AI资讯 Admin 16 次浏览

2026年6月28日,Elon Musk在X上表示,Grok 4.5已进入SpaceX和特斯拉的内部私测。按其披露,这一版本基于1.5万亿参数的V9基础模型,并在补充训练中加入了Cursor相关数据;早期评估被描述为接近、甚至可能超过Opus。此时更准确的判断是:Grok 4.5已经进入真实企业环境验证,但还不能等同于正式发布或完成独立评测。

私测地点比参数数字更值得注意

SpaceX与特斯拉分别拥有工程研发、制造、车辆软件和大量内部知识流程。模型若在这两家公司接受测试,考察的不会只有聊天成绩,更可能包括代码生成、长任务执行、内部资料检索以及工具调用。对xAI而言,这类环境能快速暴露模型在权限、稳定性和复杂工作流中的问题,也能为后续产品化积累反馈。

加入Cursor数据同样指向编程能力,但“加入了什么数据、授权范围如何、数据占比多大”目前都没有公开。参数量也只是规模信息,不能直接证明回答质量、推理效率或使用成本。

“接近Opus”暂时只能视为开发方判断

Musk没有说明这里的Opus具体指哪个版本,也未公开评测集、样本量和测试条件。模型在内部任务上占优,不代表它在通用问答、代码仓库修改或长上下文任务中都更强。尤其是私测阶段,系统提示词、工具链和推理预算都会显著影响结果。

因此,现阶段不宜据此做模型迁移。企业开发者真正需要等待的是API是否开放、上下文长度与价格、速率限制、工具调用表现,以及可复现的第三方评测。

这次动向释放了什么信号

Grok的竞争重点正从单次模型发布转向“模型加企业场景加执行框架”。Musk还提到Grok Build工具链持续改进,并称SpaceX今年计划按月训练新模型。高频迭代能缩短反馈周期,但也会带来版本稳定性和迁移成本问题。若Grok 4.5正式上线,判断它是否值得用,首先应看真实任务成功率,而不是只看参数量或开发方给出的横向评价。

信息来源

Elon Musk在X发布的原始消息Investing.com于2026年6月28日的报道

推荐工具

更多