구글은 새롭게 업그레이드된 Gemini Deep Research 에이전트가 새로운 상호작용 API를 통해 개발자들에게 제공될 것이라고 발표했습니다. 이 에이전트는 Gemini 3 Pro를 핵심 추론 모델로 사용하며, 장기적이고 다단계 연구 작업에 특화되어 있으며, 자동 계획 및 쿼리, 반복적인 정보 검색 및 정렬을 통해 사용자에게 구조화되고 출처가 있는 연구 보고서를 생성합니다.
공식 소개에 따르면, Gemini Deep Research는 여러 딥 서치 벤치마크에서 최신 결과를 달성했습니다: Humanity's Last Exam 전체 세트에서 46.4%, DeepSearchQA에서 66.1%, BrowseComp에서 59.2%를 기록했으며, 모두 기본 Gemini 3 Pro 모델보다 우수한 성능을 보였습니다. 개발자는 상호작용 API를 사용해 에이전트를 호출해 애플리케이션에서 백그라운드 긴 작업을 수행하고, 웹 검색과 자신의 데이터 소스를 결합해 자동화된 데이터 수집, 비교, 요약을 구현할 수 있습니다.
현재 Gemini Deep Research 에이전트는 아직 미리보기 단계이며, Interactions API를 통해 에이전트 이름을 지정해야만 호출할 수 있습니다. 이 API는 파일 검색, 스트리밍 출력 및 기타 기능을 지원합니다. 구글은 또한 이 프록시를 Gemini Apps, Google Search, NotebookLM, Google Finance 같은 제품에 점진적으로 도입하여 최종 사용자에게 더 강력한 심층 연구 기능을 제공할 것이라고 발표했습니다.
FAQ
Q: Gemini Deep Research 요원이란 정확히 무엇인가요?
A: Gemini Deep Research는 구글이 출시한 '딥 리서치' 에이전트로, 다중 단계 검색 계획, 웹 페이지 및 사용자 문서 읽기, 구조화된 연구 보고서를 출력할 수 있습니다.
Q: 제미니 딥 리서치와 일반 제미니 3 프로 모델의 차이점은 무엇인가요?
A: 이들은 Gemini 3 Pro를 핵심 모델로 공유하지만, Deep Research는 장기 검색 훈련 및 향상, 환각 감소, 보고서 품질 향상을 위한 전용 에이전트 워크플로우를 추가했습니다.
Q: 개발자들은 어떻게 API에서 Gemini Deep Research를 호출할 수 있나요?
A: 개발자는 Gemini API 키를 사용해 Interactions API를 통해 상호작용 세션을 생성하고, Deep Research 에이전트 이름을 지정하며, 백그라운드 매개변수를 true로 설정해 백그라운드 긴 작업을 수행해야 합니다.
Q: 제미니 딥 리서치는 벤치마크에서 어떻게 성과를 냈나요?
답변: 공식 공개는 Humanity's Last Exam, DeepSearchQA, BrowseComp 등 세 가지 심층 연구 벤치마크에서 최신 선도적 성과를 거두었으며, 이는 에이전트 프로세스가 없는 재단 모델보다 훨씬 우수합니다.
Q: 일반 사용자는 언제 소비자 제품에서 딥 리서치를 경험할 수 있나요?
답변: 구글은 Gemini Deep Research를 Gemini 앱, 검색, NotebookLM, Google 파이낸스 제품에 "곧" 통합할 것이라고 밝혔으며, 구체적인 지역과 계정 개설 패턴은 구글의 후속 발표에 따라 달라질 예정입니다.