MOUNTAIN VIEW / LONDON (IT BOLTWISE) – Google hat mit Gemini 2.5 Computer Use ein neues KI-Modell vorgestellt, das die Nutzung von Webbrowsern auf eine neue Ebene hebt. Durch den Einsatz von visuellen und reasoning-Fähigkeiten kann das Modell menschliches Verhalten im Internet nachahmen und Aufgaben effizienter erledigen. Entwickler können von dieser Technologie profitieren, um ihre Softwaretests zu optimieren.

Google hat mit Gemini 2.5 Computer Use ein KI-Modell entwickelt, das die Art und Weise, wie wir das Internet nutzen, revolutionieren könnte. Dieses Modell ist darauf spezialisiert, Webbrowser so zu verwenden, wie es Menschen tun, und nutzt dabei fortschrittliche visuelle und reasoning-Fähigkeiten. Diese Fähigkeiten ermöglichen es Gemini, menschliches Verhalten im Internet präzise nachzuahmen und Aufgaben effizient zu erfüllen.
Im Vergleich zu früheren Versionen bietet Gemini 2.5 eine verbesserte Interaktion mit Benutzeroberflächen. Es kann Formulare ausfüllen, durch Webseiten navigieren und sogar Entscheidungen treffen, die normalerweise menschliches Eingreifen erfordern würden. Diese agentischen Fähigkeiten waren bereits in der Gemini API verfügbar, jedoch in einer weniger spezialisierten Form. Das neue Modell verspricht eine deutlich bessere Handhabung von Interfaces, was es besonders für Entwickler interessant macht, die ihre Software testen möchten.
Ein bemerkenswertes Merkmal von Gemini 2.5 ist die Fähigkeit, Screenshots zu nutzen, um die Benutzeroberfläche zu analysieren und darauf basierend Aktionen durchzuführen. Dies minimiert das Risiko von Fehlentscheidungen, wie dem Kauf von Produkten in der falschen Größe. Das Modell fragt den Benutzer gegebenenfalls vor der Durchführung einer Aktion, um unerwünschte Ergebnisse zu vermeiden. Diese Funktionalität ist besonders nützlich, um komplexe Aufgaben im Internet sicher und effizient zu erledigen.
Während Gemini 2.5 für das Browsen im Web optimiert ist, zeigt es bei mobilen Benutzeroberflächen noch Verbesserungspotenzial. Google sieht die Hauptzielgruppe in Entwicklern, die mithilfe dieser Technologie ihre Softwaretests verbessern können. Darüber hinaus unterstützt das Modell Funktionen in Google AI Mode und dem Project Mariner, Googles Version eines KI-Agenten. Auch andere Unternehmen wie Anthropic und OpenAI arbeiten an ähnlichen Technologien, was den Wettbewerb in diesem Bereich weiter anheizt.


- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote

Berufsbegleitendes Master+ Studium Data Science & Artificial Intelligence (m/w/d)

AI Compliance Manager

Spezialist (d/m/w) – Schwerpunkt KI-Plattform

Bauprojektleiter Technische Gebäudeausrüstung (TGA) für KI- Rechenzentrumprojekte (m/w/d); HN oder B

- Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Google präsentiert Gemini 2.5: KI-Modell für Browsernutzung" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "Google präsentiert Gemini 2.5: KI-Modell für Browsernutzung" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Google präsentiert Gemini 2.5: KI-Modell für Browsernutzung« bei Google Deutschland suchen, bei Bing oder Google News!