联手 CAISI×AISI:OpenAI 把 ChatGPT Agent 与 GPT-5 的安全评测做成“全周期”
OpenAI 公布与美国 CAISI、英国 AISI 的最新合作进展:围绕 ChatGPT Agent 与 GPT-5 开展联合作恶评估与端到端红队,发现并修复关键漏洞,迭代生物安全与产品安全栈,示范“政府×产业”协作评测的新范式。 一、要点速览 1、合作版图与时间线 OpenAI 与 CAISI ...
OpenAI 公布与美国 CAISI、英国 AISI 的最新合作进展:围绕 ChatGPT Agent 与 GPT-5 开展联合作恶评估与端到端红队,发现并修复关键漏洞,迭代生物安全与产品安全栈,示范“政府×产业”协作评测的新范式。 一、要点速览 1、合作版图与时间线 OpenAI 与 CAISI ...
Midjourney 网站更新:Style Explorer 样式量×7、热榜持续刷新、Likes 可按图片/视频/样式筛选 Midjourney 上线一组与 AI 创作效率强相关的改动:Style Explorer 样式数量扩大至原来的 7 倍并支持搜索;Style 的 Hot/Top 信息流修复...
GPT-5 与 GPT-5-mini API 限流上调:多倍提升的 TPM,为大规模推理与批处理提速 本次上调覆盖多档 Usage Tier:GPT-5 的 Tier 1 由 30K 提至 500K TPM(批处理上限 1.5M),Tier 2 提至 1M(批处理 3M),Tier 3 提至 2M,...
Fellou 将 AI 情感分析与可视化报告合一:自动聚类正负反馈,量化情绪指标,生成 Canva 风格图表与表格,报告可持续更新、可分享,助力品牌与电商在几分钟内把原始评论变成决策级洞察。 一、为什么选 Fellou 做品牌情感分析 1、自动聚类正负反馈 Fellou 的 AI 深度搜索与代理执行...
Cursor 宣布全新 Tab 模型成为默认模型:在实际使用中,Tab 建议次数减少约二成,同时建议被接受的概率显著提升。核心做法是在线强化学习与在位评测闭环,把“少而准”的代码编辑建议带入日常开发。 一、关键结论与原理 1、少提示但更可用 新版 Tab 在真实编码流中学习,整体建议量下降,开发者分...
Anthropic 发布工程方法:用 Claude 等 AI 代理参与工具设计、评测与迭代。核心抓手是 MCP 工具化、系统化评测与描述优化,让代理少走弯路、少耗 token、多做成事。 一、结论先行:好工具的五条铁律 1、选对而非做多 AI 代理不是开发者,冗余工具会分散注意力。围绕高价值工作流设...