OpenAI Codexは、$.skill名コールと自動選択をサポートするAgent Skillsをリリースしました
OpenAI開発者のドキュメントによると、Codexは現在「エージェントスキル」をサポートしており、これはタスク固有の命令、リソース、オプションスクリプトを再利用可能な機能にまとめ、CodexのCLIやIDE拡張機能で利用可能です。 ユーザーは $.skill-name を通じてスキルを明示的に呼び...
OpenAI開発者のドキュメントによると、Codexは現在「エージェントスキル」をサポートしており、これはタスク固有の命令、リソース、オプションスクリプトを再利用可能な機能にまとめ、CodexのCLIやIDE拡張機能で利用可能です。 ユーザーは $.skill-name を通じてスキルを明示的に呼び...
音声とビデオ人工知能の分野では最近、複数の技術が発表され、マルチモーダル生成モデルWan 2.6と音声モデルFun-ASR、Fun-CosyVoice 3が相次いで発表され、クリエイターと開発者の注目を集めている。関連モデルはキャラクターの外観、声、叙事スタイルにおける一貫性のある表現を主とし、ビデ...
Gemini 3 Flashは、Google検索の「AIモード」のデフォルトモデルとしてグローバルにリリースされます。 公式には、新モデルは推論力や理解力を向上させつつ検索速度を維持し、より複雑な多条件問題や比較・計画のニーズに対してより構造化され読みやすい回答を出力でき、ウェブページやクリック可能...
1. オープンソースとアクセス MiMo は重みと支援データを公開しました。 Hugging FaceのXiaomiMiMo組織ページでモデル(MiMo-V2-Flash/Baseなど)を優先的に入手し、技術レポートや一部のコードはGitHubで入手可能です。 オンラインスタジオおよびAPIプラット...
OpenAIは、プログラミングおよびソフトウェアエンジニアリングのシナリオに焦点を当てたGPT-5シリーズのコードモデル版であるGPT-5.2 Codexを正式にリリースしました。 公式導入によると、モデルはコード生成、理解、デバッグ、リファクタリングなどのコア機能が前バージョンと比べて向上しており...
Metaの子会社であるMetaのAIは、オープンソースのPerception Encoder Audiovisual(PE-AV)を発表し、SAM Audioを推進して最先端の音声分離効果を実現する重要な技術エンジンとして位置づけました。 従来のPerception Encoderシステムをベースに...