Google präsentiert Gemini 2.0: Der Schritt in die Ära der smarten Assistenten
Google hat die nächste Generation seines KI-Systems Gemini enthüllt, die neue Maßstäbe für die autonome Assistenz setzt. Anlässlich des Jubiläumsjahres der ersten Gemini-Einführung in Mountain View gibt der Suchmaschinengigant einen tiefen Einblick in die Funktionsweise der innovativen Technik. Im Mittelpunkt steht die Fähigkeit des sogenannten "KI-Agenten", Aufgaben selbstständig durchzuführen, wie etwa das Erkennen und Auswählen von Bauteilen für ein Hobbyprojekt in Online-Shops. Der finale Klick zum Kauf verbleibt jedoch beim Benutzer, sodass ein menschlicher Entscheidungsprozess nicht umgangen wird.
Nach Google-CEO Sundar Pichai vollzieht Gemini 2.0 einen Paradigmenwechsel von der bloßen Informationsverarbeitung hin zu einem nützlicheren Tool im Alltag. Dieser Entwicklungsschritt ist Teil des "Project Mariner", das die Geburtsstunde der neuen KI-Generationen markiert. Tulsee Doshi, eine führende Managerin bei Google, beschreibt Gemini 2.0 als ein System, das intelligent mit Google-Produkten interagiert, einschneidende Tools verwendet und Programm-Code direkt ausführen kann. Diese Eigenschaften stärken die Autonomie der Assistenten und schaffen Möglichkeiten, die Planung und Aktion im Namen der Nutzer übernehmen.
"Project Mariner" ahmt das Benutzerverhalten im digitalen Raum nach: Klicken, Tippen und Scrollen – der Agent agiert wie ein menschlicher Nutzer. Dennoch erkennt das System klare Grenzen seiner Einsatzmöglichkeiten. Es bleibt dem Benutzer überlassen, ob ein Kauf abgeschlossen wird, wobei dies stets durch eine letzte Rückfrage abgesichert wird. Tester des Systems bleiben zunächst engmaschig ausgewählte Vertrauenspersonen, bevor das System auf breiterer Basis in die Welt entlassen wird.
Parallel dazu verfolgt Google mit "Project Astra" einen ehrgeizigen Forschungsansatz zur Umgebungswahrnehmung mittels Gemini 2.0, der auf der letztjährigen Google I/O seinen ersten Auftritt hatte. Dabei wird der Übergang von Smartphones zu smarten Brillen angepeilt, die den Benutzer mit nützlichen Informationen versorgen sollen, ähnlich der von Meta konzipierten Ray-Ban-Brille.
Für Softwareentwickler ist insbesondere die Gemini Flash-Variante von Interesse, da sie sowohl in großen Datenzentren als auch lokal auf Personal Computern und ausgewählten Smartphones einsetzbar ist. Am Mittwoch stellte Google Gemini Flash 2.0 vor, das laut Unternehmensangaben durch verbesserte Leistung und agil reagierende Geschwindigkeit überzeugt.