OpenAI发布《评估思维链可监测性》报告:探讨模型推理可审计性
OpenAI发布研究报告《Evaluating Chain-of-Thought Monitorability》,系统评估大型语言模型内部“思维链”(Chain-of-Thought, CoT)的可监测性及安全影响。报告指出,尽管模型生成的推理过程可通过外部提示或代理模型在一定程度上预测,但其完整、...
OpenAI发布研究报告《Evaluating Chain-of-Thought Monitorability》,系统评估大型语言模型内部“思维链”(Chain-of-Thought, CoT)的可监测性及安全影响。报告指出,尽管模型生成的推理过程可通过外部提示或代理模型在一定程度上预测,但其完整、...
法国AI公司Mistral宣布推出第三代光学字符识别模型Mistral OCR 3,并将其定位为“文档智能”核心能力,面向表单、扫描PDF、复杂表格与手写内容等企业常见场景。官方披露,该模型在其对比评测中取得约74%的“整体胜率”,并宣称在准确率与效率上优于传统企业文档处理方案及部分AI原生OCR系...
Anthropic发布公告,介绍其聊天机器人Claude在“用户身心健康”方面的最新安全措施与评估结果,重点聚焦自杀与自伤话题的应对,以及减少模型“阿谀式迎合”的倾向,并再次强调Claude的18岁以上使用要求。公告指出,Claude并非专业医疗或心理替代服务,当对话出现自伤风险迹象时,应以同理回应...
火山引擎在2025冬季Force原动力大会上发布豆包大模型1.8。火山引擎总裁谭待介绍,新版本面向智能体(Agent)任务进行了增强,同时提升多模态理解能力,并提供更灵活的上下文管理,以适配更长、更复杂的业务流程与交互场景。 大会同步披露运行数据称,截至今年12月,豆包大模型日均调用量已超过50万亿...
近日,社交平台与开发者社区出现消息称,OpenAI 正在筹备对 Codex 进行升级,新版本可能被命名为“GPT-5.2-Codex-Max”,并被解读为今年内的最后一次重要能力跃迁。不过,截至目前,OpenAI 尚未就 Codex 的版本号、发布时间或具体能力作出任何官方确认,上述说法仍停留在传闻...
OpenAI宣布正式开放ChatGPT应用提交流程,开发者现可通过官方平台提交自研App以供审核与发布。该机制标志着ChatGPT从对话助手进一步演进为开放应用生态系统,允许第三方开发者为ChatGPT构建可直接在对话中调用的交互式功能。 根据OpenAI介绍,开发者需遵循应用提交指南,提供应用元数...