L’agent Hermes lit trop de fichiers, ce qui entraîne une forte consommation de tokens, donc ajustez d’abord la portée de la tâche, puis regardez le file_read_max_chars. Ne le laissez pas lire tout le dépôt à la légère, vous devriez lui demander de chercher d’abord l’emplacement, puis de ne lire que les fragments pertinents.
Pourquoi la lecture de fichiers est-elle coûteuse
Le contenu du fichier entrera dans le contexte du modèle, en particulier les journaux, les produits de compilation, le code compressé, les documents JSON volumineux et les grands documents markdown, qui peuvent facilement entasser des dizaines de milliers de jetons à la fois. Dans la configuration officielle, file_read_max_chars est utilisé pour limiter par défaut le nombre de caractères par lecture, et les grands modèles contextuels peuvent être augmentés, et il est recommandé de réduire les petits contextes ou modèles locaux.
Optimisation qui peut être réalisée immédiatement
- Laissez Hermès utiliser la recherche pour cibler les mots-clés avant de lire les fichiers locaux qui apparaissent.
- Demandez-lui de ne pas lire
node_modules,dist,build, gros journaux et répertoires de cache. - Le scénario du petit modèle réduit
file_read_max_charsà une valeur plus conservatrice. - Que le grand dossier soit lu en sections et extrais la conclusion après chaque paragraphe, sans tout boucher d’un coup.
Notez les limites de la déduplication automatique
Hermes effectue une certaine déduplication des lectures de fichiers dupliqués : si la même zone de fichier reste inchangée, les lectures suivantes peuvent renvoyer une invite lumineuse au lieu d’envoyer tout le contenu en boucle. Cependant, après compression contextuelle, le modèle peut devoir relire les fichiers critiques, donc vous devez toujours contrôler la plage de lecture.
La meilleure façon de vous demander est : « Listez les fichiers que vous devez lire et pourquoi, et attendez que je confirme avant de les lire. » Cela vous permet de dépenser des jetons pour des contextes vraiment pertinents, plutôt que de laisser l’agent gérer l’itinéraire avec le budget.