GLM-OCRオンライン体験 Z.ai 開始:PDFおよび画像レイアウト解析をサポート
Z.ai マルチモーダルOCRモデルGLM-OCRをリリースし、Hugging Faceの重みを開放し、オンライン体験とAPIコール方式を提供します。 公式には約9億パラメータしか含まれていませんが、式認識、テーブル認識、キー情報抽出などのシナリオをカバーする複雑な文書理解タスクでリード的な性能を達...
Z.ai マルチモーダルOCRモデルGLM-OCRをリリースし、Hugging Faceの重みを開放し、オンライン体験とAPIコール方式を提供します。 公式には約9億パラメータしか含まれていませんが、式認識、テーブル認識、キー情報抽出などのシナリオをカバーする複雑な文書理解タスクでリード的な性能を達...
OpenAIはCodexアプリケーションをリリースし、macOSでダウンロード可能にしました。これにより「エージェント構築コマンドセンター」として位置づけられ、複数のエージェントを同時に管理して長期的なタスクを並行して実行できるようになり、機能開発、リファクタリング、移行、コードレビューなどのエンジ...
Google DeepMindとGoogle Labsは、テキストと画像のプロンプトを使って仮想世界の創造、編集、探索に焦点を当てた実験的なプロトタイプ「Project Genie」をリリースしました。 このプロセスでは、ユーザーが世界とキャラクターをデザインし、まずNano Banana Proに...
OpenAIは、米国でログイン中の成人向けのChatGPT広告テストを「今後数週間以内に」開始すると発表し、広告表示をウェブやモバイルアプリに拡大する計画です。 広告は通常回答の下部に「スポンサー」という形で別に表示され、担当者は広告がモデルの回答に影響を与えないと述べています。 パーソナライズに関...
Anthropicは「AI支援がコーディングスキル形成に与える影響」調査を発表し、「AI支援プログラミング」と「手書きコード」の条件下で同様のタスクを完了した開発者のスキル習得を比較しました。 研究は、AI支援の使用が統計的に有意な「習熟度の低下」をもたらすと結論づけました。すなわち、使用したばかり...
Cursorチームは agent-trace.dev 年に「Agent Trace」仕様(バージョン0.1.0、RFCステータス)を公開し、「どの変更がAIから生じ、どれが人間によるものか」をバージョン管理されたコードベース上で文書化し、モデル情報と関連する会話を特定のコード貢献と関連付けるオープン...