돌아가기 AI Q&A
Hermes 에이전트가 너무 많은 파일을 읽고 토큰을 태우면 어떻게 해야 하나요?

Hermes 에이전트가 너무 많은 파일을 읽고 토큰을 태우면 어떻게 해야 하나요?

AI Q&A Admin 83 회 조회

Hermes 에이전트는 너무 많은 파일을 읽어 토큰 소모가 많으니, 먼저 작업 범위를 조정한 후 file_read_max_chars을 확인하세요. 저장소 전체를 무분별하게 읽게 하지 말고, 먼저 위치를 검색하게 한 뒤 관련 조각만 읽도록 하세요.

파일 읽기가 왜 비용이 많이 드는 이유

파일 내용은 모델 컨텍스트, 특히 로그, 빌드 제품, 압축 코드, 대형 JSON, 대형 마크다운 문서 등을 입력하며, 이들은 한 번에 수만 개의 토큰을 쉽게 압축할 수 있습니다. 공식 구성에서는 기본적으로 읽을 수 있는 문자 수를 제한하는 데 file_read_max_chars 사용되며, 큰 컨텍스트 모델은 늘릴 수 있고, 작은 컨텍스트나 로컬 모델은 축소하는 것이 권장됩니다.

바로 할 수 있는 최적화

  • Hermes가 검색 기능을 이용해 키워드를 타겟팅한 후 클릭한 로컬 파일을 읽게 하세요.
  • node_modules, dist, build, 큰 로그, 캐시 디렉터리를 읽지 않도록 요청하세요.
  • 작은 모델 시나리오는 file_read_max_chars를 보다 보수적인 값으로 환원합니다.
  • 큰 파일을 섹션별로 나누어 읽고, 각 단락 뒤에 결론을 추출하되, 한 번에 모두 막지 마세요.

자동 중복 제거의 경계에 주목하세요

Hermes는 중복 파일 읽기 제거를 일부 수행합니다: 동일한 파일 영역이 변경되지 않으면 이후 읽기에서는 전체 콘텐츠를 반복 전송하는 대신 라이트 프롬프트가 반환될 수 있습니다. 하지만 컨텍스트 압축 후에는 모델이 중요한 파일을 다시 읽어야 할 수 있으므로 읽기 범위를 여전히 제어해야 합니다.

가장 좋은 안내 방법은 "읽어야 할 파일과 그 이유를 나열하고, 제가 확인한 후에 읽으세요."입니다. 이렇게 하면 예산으로 에이전트가 경로를 알아내지 않고, 정말 관련 있는 맥락에 토큰을 쓸 수 있습니다.

추천 도구

더보기