공식 음성 문서는 사용자 ID가 DISCORD_ALLOWED_USERS에 있는지, 봇이 연결/말하기 권한을 가지고 있는지, 그리고 특권 의도가 완전히 열려 있는지 등을 매우 집중적으로 확인합니다. 하나가 빠져 있다면, "들어갈 수는 있지만 들을 수 없습니다"라는 가짜 온라인 상태가 있을 수 있습니다.
가장 짧은 체크리스트
- 본인의 디스코드 사용자 ID가
DISCORD_ALLOWED_USERS에 등록되었는지 확인하세요. - 개발자 백그라운드에서 프레즌스 의도, 서버 멤버 의도, 메시지 콘텐츠 의도를 열어보세요.
- 로봇 초대 권한은 최소한 Connect와 Speak가 있어야 하며, Use Voice Activity를 추가하는 것이 가장 좋습니다.
- 음소거 상태가 아니고, 로봇이 들어올 수 없는 음성실에 있지 않은지 확인하세요.
왜 방에 들어올 수는 있는데도 귀가 안 들리는 것처럼 보이는 걸까요?
음성 방에 가입했다는 것은 연결이 확립되었다는 의미일 뿐, Hermes가 이미 화자를 허용 목록에 매핑하거나 음성 스트림을 얻을 수 있다는 뜻은 아닙니다. 특히 서버 멤버 의도가 없으면 봇이 누가 말하는지 인식하지 못할 수도 있습니다.
한마디로: 디스코드 음성 모드에서 가장 흔한 문제는 TTS가 아니라 허용 목록과 의도가 완전히 일치하지 않는 것입니다.
공식 오픈 소스 주소: https://github.com/NousResearch/hermes-agent; 공식 문서 기록: https://hermes-agent.nousresearch.com/.