Google präsentiert Gemini 3: Mehr Logik, flüssige Multimodalität

MIT Technology Review – Artificial Intelligence Original ≈1 Min. Lesezeit
Anzeige

Google hat heute die neue Version seines multimodalen Modells, Gemini 3, vorgestellt. Das Update verspricht verbesserte Rechenleistung und ein noch flüssigeres Zusammenspiel von Text, Bild und Sprache. Nutzer können Gemini 3 mit Text, Bildern und Sprachbefehlen füttern und erhalten dadurch konsistente, kontextbezogene Antworten.

Ein besonderes Highlight ist die Agentenfunktion. Gemini 3 kann Aufgaben übernehmen, die zuvor nur von spezialisierten Systemen erledigt wurden, und dabei als eigenständiger Agent agieren. Damit erweitert Google die Einsatzmöglichkeiten seiner KI-Plattform deutlich, während die Vorgängerversion Gemini 2.5 bereits multimodale Eingaben unterstützte.

Ähnliche Artikel