OpenAIは「告白」メカニズムを開始し、研究によるとGPT-5モデルを告白を通じて訓練することで「自己申告」率を大幅に向上させることができるとされています
OpenAIは「How to Make Language Models More Honest Through Confession(自白を通じて言語モデルをより正直にする方法)」に関する研究を発表し、モデルに別の「自白出力」を追加することを提案しました。これは、答えが指示に違反しているか、不正行為...
OpenAIは「How to Make Language Models More Honest Through Confession(自白を通じて言語モデルをより正直にする方法)」に関する研究を発表し、モデルに別の「自白出力」を追加することを提案しました。これは、答えが指示に違反しているか、不正行為...
ニューヨーク・タイムズの DealBookサミットで、AnthropicのCEOダリオ・アモデイ氏は、最先端のAI技術が徐々に「成長し独自の能力」となっていると強調し、こうした能力は「独自の国家安全保障上の影響」を持つと率直に述べました。 この分野では、民主主義国家が技術の最前線に最初に到達し、責任...
MITや他の機関の研究者たちはarXivに「Self-adapting language models」という論文を発表し、大規模言語モデルが展開後に「自己編集」機構を通じて重みを継続的に更新できる適応型言語モデルフレームワークSEALを提案しました。 一部のソーシャルメディア投稿では、将来のGPT...
ダートマス大学は、AnthropicおよびAmazon Web Services(AWS)との新たなAIパートナーシップを発表し、キャンパス全体で生成AIツールを展開し、アイビーリーグで初めて大規模にこの技術を大学レベルで採用しました。 このコラボレーションには、教育シナリオ向けにカスタマイズされた...
騰訊のHunyuanチームはオープンソースのエンドツーエンドOCR専門家モデルHunyuanOCRを正式にリリースし、関連プラットフォームのスター数とダウンロード数が急速に上昇する中、Hugging Faceモデルのトレンドリストでトップに入りました。 このモデルは約10億のパラメータを使用し、複数...
Perplexityは、実際のウェブ環境におけるAIブラウザのセキュリティ強化を目的としたBrowseSafeシステムとその伴うベンチマークであるBrowseSafe-Benchのリリースを発表しました。 このソリューションはCometブラウザのシナリオを対象としており、その核心はウェブページ内の悪...