Google präsentiert Gemini 2.5 Pro: KI-Agent, der Webseiten für Sie bedient

VentureBeat – AI Original ≈1 Min. Lesezeit
Anzeige

Google hat mit der Einführung von Gemini 2.5 Pro Computer Use einen bedeutenden Schritt in Richtung voll funktionsfähiger KI-Agenten gemacht. Das neue Modell, das auf dem leistungsstarken Gemini 2.5 Pro basiert, ist speziell dafür trainiert, einen virtuellen Browser zu steuern und damit Webseiten zu durchsuchen, Informationen abzurufen, Formulare auszufüllen und sogar Aktionen wie das Klicken von Buttons auszuführen – alles aus einem einzigen Textbefehl heraus.

Der Einsatz eines „headless“ Browsers, der keine grafische Oberfläche benötigt, ermöglicht es dem Agenten, nahtlos im Hintergrund zu arbeiten. Google arbeitet dafür mit Browserbase zusammen, einem Dienst, der auf die Bereitstellung solcher Browserlösungen für KI-Anwendungen spezialisiert ist. Browserbase zeigt zwar eine grafische Darstellung, lässt die KI jedoch eigenständig navigieren.

Obwohl das Modell noch nicht direkt für Endverbraucher verfügbar ist, signalisiert Google damit einen wichtigen Fortschritt in der Entwicklung von Allzweck-Agenten. Die Fähigkeit, Webseiten zu scrollen, Dropdowns zu bedienen und komplexe Interaktionen zu übernehmen, legt den Grundstein für zukünftige Anwendungen, bei denen KI nicht nur chatbasiert, sondern auch aktiv im Web agieren kann.

Ähnliche Artikel