Google hat angekündigt, dass der neu aufgerüstete Gemini Deep Research Agent Entwicklern über die neue Interactions API zur Verfügung stehen wird. Der Agent verwendet Gemini 3 Pro als zentrales Denkmodell, speziell für langfristige, mehrstufige Forschungsaufgaben, und erstellt strukturierte und belegte Forschungsberichte für die Nutzer durch automatische Planung und Abfragen, wiederholte Abrufe und Sortierung von Informationen.
Laut offizieller Einführung hat Gemini Deep Research die neuesten Ergebnisse bei einer Reihe von Deep-Search-Benchmarks erzielt: 46,4 % im vollständigen Set von Humanity's Last Exam, 66,1 % bei DeepSearchQA und 59,2 % bei BrowseComp, was alle besser ist als die Leistung des einfachen Gemini 3 Pro-Modells. Entwickler können die Interactions-API nutzen, um den Agenten aufzurufen und lange Hintergrundaufgaben in der Anwendung auszuführen, und Websuche mit eigenen Datenquellen kombinieren, um automatisierte Datenerhebung, -vergleich und -zusammenfassung zu ermöglichen.
Derzeit befindet sich der Gemini Deep Research-Agent noch in der Vorschau und kann nur durch Angabe des Agentennamens über die Interactions-API aufgerufen werden, die die Arbeit mit Dateiabruf, Streaming-Ausgabe und anderen Funktionen unterstützt. Google kündigte außerdem an, dass es diesen Proxy schrittweise in Produkte wie Gemini Apps, Google Search, NotebookLM und Google Finance einführen wird, um Endnutzern stärkere, tiefgehende Forschungsmöglichkeiten zu bieten.
FAQ
F: Was genau ist ein Gemini Deep Research Agent?
A: Gemini Deep Research ist ein von Google gestarteter "Deep Research"-Agent, der automatisch mehrstufige Suchanfragen planen, Webseiten und Benutzerdokumente lesen und strukturierte Forschungsberichte erstellen kann.
F: Was ist der Unterschied zwischen Gemini Deep Research und dem regulären Gemini 3 Pro Modell?
A: Sie teilen Gemini 3 Pro als Kernmodell, aber Deep Research hat einen dedizierten Agenten-Workflow hinzugefügt, um die Langzeitabrufe zu trainieren und zu verbessern, Halluzinationen zu reduzieren und die Berichtsqualität zu verbessern.
F: Wie können Entwickler Gemini Deep Research in der API nennen?
A: Entwickler müssen den Gemini-API-Schlüssel verwenden, um eine Interaktionssitzung über die Interaktions-API zu erstellen, den Namen des Deep Research-Agenten angeben und den Hintergrundparameter auf true setzen, um die lange Hintergrundaufgabe auszuführen.
F: Wie schnitt Gemini Deep Research in den Benchmarks ab?
A: Die offizielle Offenlegung hat die neuesten führenden Ergebnisse in drei tiefgehenden Forschungsbenchmarks erzielt: Humanity's Last Exam, DeepSearchQA und BrowseComp, was deutlich besser ist als das Foundation-Modell ohne Agentenprozess.
F: Wann kann der durchschnittliche Nutzer Deep Research in einem Konsumprodukt erleben?
A: Google hat angekündigt, Gemini Deep Research "bald" in Gemini App, Search, NotebookLM und Google Finance Produkte zu integrieren, und die genaue Region sowie der Kontoeröffnungsrhythmus werden von Googles anschließenden Ankündigungen angekündigt.