OpenAIは「思考の連鎖の監視可能性の評価」という報告書を発表しました:モデル推論の監査可能性の探求
OpenAIは「Evaluating Chain-of-Thought Monitorability」という研究報告書を発表し、大規模言語モデルにおける「Chain-of-Thought(CoT)」の監視可能性とセキュリティへの影響を体系的に評価しています。 報告書は、モデルが生成する推論過程は外部...
OpenAIは「Evaluating Chain-of-Thought Monitorability」という研究報告書を発表し、大規模言語モデルにおける「Chain-of-Thought(CoT)」の監視可能性とセキュリティへの影響を体系的に評価しています。 報告書は、モデルが生成する推論過程は外部...
フランスのAI企業Mistralは、第3世代光学文字認識モデルMistral OCR 3の発売を発表し、フォーム、スキャンPDF、複雑なフォーム、手書きコンテンツなど一般的な企業シナリオをターゲットにした「ドキュメントインテリジェンス」の中核機能として位置づけました。 関係者は、このモデルが比較評価...
Anthropicは、チャットボットClaudeの最新のセキュリティ対策と評価結果を「ユーザーの身体的・精神的健康」の観点から発表し、自殺や自傷行為のテーマへの対応、モデルの「お世辞的なケータリング」傾向の軽減、そしてClaudeの使用が18歳以上であることを改めて強調しました。 発表では、Clau...
Volcano Engineは2025年のウィンターフォースプライムパワーカンファレンスでDoubao Model 1.8を発表しました。 Volcano Engineの社長タン・ダイ氏は、新バージョンがエージェントタスク向けに強化され、マルチモーダル理解能力が向上し、より長く複雑なビジネスプロセス...
最近、ソーシャルプラットフォームや開発者コミュニティでOpenAIがCodexのアップグレード準備を進めているというニュースが流れ、新バージョンは「GPT-5.2-Codex-Max」と名付けられ、今年最後の重要な能力向上と解釈される可能性があります。 しかし現時点でOpenAIはCodexのバージ...
OpenAIはChatGPTアプリケーション提出プロセスの正式開始を発表し、開発者は公式プラットフォームを通じて自分のアプリを審査・公開するために提出できるようになりました。 この仕組みは、ChatGPTが会話型アシスタントからオープンなアプリケーションエコシステムへと進化し、サードパーティ開発者が...