戻るAI Q&A(英語)
もしHermesエージェントがファイルを読みすぎてトークンを焼いたらどうすればいいですか?

もしHermesエージェントがファイルを読みすぎてトークンを焼いたらどうすればいいですか?

AI Q&A(英語) Admin 83 回閲覧

Hermesエージェントはファイルを読み込みすぎてトークン消費が高くなるので、まずタスク範囲を調整してからfile_read_max_charsを確認してください。リポジトリ全体を無差別に読み込ませないでください。まず場所を検索させ、その後関連する断片だけを読み込むように指示してください。

なぜファイルの読み込みが高価なのか

ファイル内容はモデルコンテキスト、特にログ、ビルドプロダクト、圧縮コード、大きなJSON、大規模なマークダウン文書などに入り込み、一度に数万トークンを詰め込むことができます。公式構成では、file_read_max_charsはデフォルトで1回の読み取り文字数を制限するために使われており、大きなコンテキストモデルは増やせ、小さなコンテキストやローカルモデルは縮小することが推奨されます。

すぐにできる最適化

  • Hermesはローカルファイルを読む前にキーワードを検索でターゲットにさせてください。
  • node_modulesdistbuild、大きなログ、キャッシュディレクトリを読み取らないように頼みましょう。
  • 小型モデルのシナリオではfile_read_max_charsをより保守的な値に還元します。
  • 大きなファイルをセクションごとに読み、まとめを一度に詰めずに各段落の後に結論を抽出します。

自動重複除去の境界に注目してください

Hermesは重複ファイル読み取りの重複除去を行います。同じファイル領域が変更されない場合、その後の読み取りでは全コンテンツを繰り返し送信する代わりにライトプロンプトが返されることがあります。しかし、コンテキスト圧縮後は重要なファイルを再読み込む必要があるため、読み取り範囲の制御は依然として必要です。

プロンプトの最良の方法は「読むべきファイルとその理由をリストアップし、私が確認するまで待ってから読む」ことです。これにより、エージェントに予算でルートを考えさせるのではなく、本当に関連性の高いコンテキストにトークンを使えます。

関連記事

Hermes Agentにとってどちらのモデルがより安定していますか?

Hermes Agentにとってどちらのモデルがより安定していますか?

Hermes Agentのモデルを選ぶ際は、リストスコアだけを見るのではなく、最も重要なのは3つのことです:ツール呼び出しの安定性、コンテキストの長さ、そしてタスクがコードを書くか、調査するか、日々の...

ヘルメスエージェントの圧縮後に文脈を失ったらどうすればいいですか?

ヘルメスエージェントの圧縮後に文脈を失ったらどうすればいいですか?

圧縮後に以前に言われたことを忘れてしまったと感じた場合、Hermes Agentは圧縮モデルのコンテキストウィンドウと圧縮設定のチェックに注力します。圧縮はロスレスアーカイブではなく、中間の対話を短い...

Hermes Agentの生産ツールはどのように接続しますか? まずは読み取り専用権限から始めましょう

Hermes Agentの生産ツールはどのように接続しますか? まずは読み取り専用権限から始めましょう

Hermes Agentが本番データベース、クラウドアカウント、チケットシステム、コードリポジトリに接続する必要がある場合、最初のステップは読み取り専用権限であり、直接書き込みキーを発行するのではあり...

Hermes Agent Telegramのターミナルツールが使えませんか? まずはプラットフォーム、Toolsetを見てみましょう

Hermes Agent Telegramのターミナルツールが使えませんか? まずはプラットフォーム、Toolsetを見てみましょう

HermesエージェントはCLIのターミナルツールは使えますが、Telegramでは使えません。まずプラットフォームのツールセットを確認し、インストールが壊れているとは疑わないでください。 異なるエン...

おすすめツール

もっと見る