LONDON (IT BOLTWISE) – Google hat die Vorschau auf das Gemini 2.5 Computer Use Modell gestartet, das hinter Project Mariner und den agentischen Funktionen im KI-Modus steht. Dieses spezialisierte Modell ermöglicht die Interaktion mit grafischen Benutzeroberflächen, insbesondere mit Browsern und Websites, und zeigt vielversprechende Ergebnisse in der mobilen und Web-Umgebung.

 Heutige Tagesdeals bei Amazon!  ˗ˋˏ$ˎˊ˗

Google hat kürzlich die Vorschau auf das Gemini 2.5 Computer Use Modell veröffentlicht, das im Rahmen von Project Mariner entwickelt wurde und agentische Funktionen im KI-Modus unterstützt. Dieses spezialisierte Modell ist darauf ausgelegt, mit grafischen Benutzeroberflächen, insbesondere mit Browsern und Websites, zu interagieren. Der Prozess erfolgt in einem Loop, der so lange wiederholt wird, bis die Aufgabe abgeschlossen ist.

Der Ablauf beginnt mit der Übermittlung einer Anfrage an das Modell, wobei Eingaben wie die Benutzeranfrage, ein Screenshot der Umgebung und eine Historie der letzten Aktionen berücksichtigt werden. Das Modell analysiert diese Eingaben und generiert eine Antwort, die typischerweise einen Funktionsaufruf darstellt, der eine der Benutzeroberflächenaktionen wie Klicken oder Tippen repräsentiert.

Nach der Ausführung der Aktion wird ein neuer Screenshot der Benutzeroberfläche und die aktuelle URL als Funktionsantwort an das Computer Use Modell zurückgesendet, wodurch der Loop neu gestartet wird. Zu den weiteren unterstützten Benutzeroberflächenaktionen gehören das Vor- und Zurückgehen, das Suchen im Web, das Navigieren zu einer bestimmten URL, das Bewegen des Cursors, Tastenkombinationen, Scrollen und Drag & Drop.

Google hat zwei Beispiele geteilt, die die Leistungsfähigkeit des Modells demonstrieren. In einem Szenario wird eine Aufgabe beschrieben, bei der Informationen über Haustiere mit Wohnsitz in Kalifornien gesammelt und in ein CRM-System eingetragen werden sollen. In einem anderen Beispiel wird das Modell verwendet, um Aufgaben auf einem virtuellen Whiteboard zu organisieren.

Das Gemini 2.5 Computer Use Modell ist primär für Webbrowser optimiert, zeigt jedoch auch vielversprechende Ergebnisse bei mobilen Benutzeroberflächenkontrollaufgaben, wie der AndroidWorld-Benchmark belegt. Es ist jedoch noch nicht für die Steuerung auf Betriebssystemebene von Desktops optimiert.

Im Vergleich zu Angeboten von Claude und OpenAI demonstriert das Modell von Google eine starke Leistung bei Web- und mobilen Kontrollbenchmarks sowie eine führende Qualität bei der Browsersteuerung mit der geringsten Latenz. Das Modell basiert auf den visuellen Verständnis- und Argumentationsfähigkeiten von Gemini 2.5 Pro und wird intern für UI-Tests verwendet, um die Softwareentwicklung zu beschleunigen.

Gemini 2.5 Computer Use ist ab sofort in der öffentlichen Vorschau über die Gemini API in Google AI Studio und Vertex AI verfügbar. Entwickler können es in einer Demo-Umgebung, die von Browserbase gehostet wird, ausprobieren.

*Amazon-Kreditkarte ohne Jahresgebühr mit 2.000 Euro Verfügungsrahmen bestellen! a‿z




Hat Ihnen der Artikel bzw. die News - Google stellt Gemini 2.5 vor: Fortschritte in der KI-gestützten Web-Interaktion - gefallen? Dann abonnieren Sie uns doch auf Insta: AI News, Tech Trends & Robotics - Instagram - Boltwise

Unseren KI-Morning-Newsletter «Der KI News Espresso» mit den besten KI-News des letzten Tages gratis per eMail - ohne Werbung: Hier kostenlos eintragen!


Google stellt Gemini 2.5 vor: Fortschritte in der KI-gestützten Web-Interaktion
Google stellt Gemini 2.5 vor: Fortschritte in der KI-gestützten Web-Interaktion (Foto: DALL-E, IT BOLTWISE)



Folgen Sie aktuellen Beiträge über KI & Robotik auf Twitter, Telegram, Facebook oder LinkedIn!
Hinweis: Teile dieses Textes könnten mithilfe Künstlicher Intelligenz generiert worden sein. Die auf dieser Website bereitgestellten Informationen stellen keine Finanzberatung dar und sind nicht als solche gedacht. Die Informationen sind allgemeiner Natur und dienen nur zu Informationszwecken. Wenn Sie Finanzberatung für Ihre individuelle Situation benötigen, sollten Sie den Rat von einem qualifizierten Finanzberater einholen. IT BOLTWISE® schließt jegliche Regressansprüche aus.









Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de. Da wir bei KI-erzeugten News und Inhalten selten auftretende KI-Halluzinationen nicht ausschließen können, bitten wir Sie bei Falschangaben und Fehlinformationen uns via eMail zu kontaktieren und zu informieren. Bitte vergessen Sie nicht in der eMail die Artikel-Headline zu nennen: "Google stellt Gemini 2.5 vor: Fortschritte in der KI-gestützten Web-Interaktion".
Stichwörter AI Android Artificial Intelligence Benutzeroberfläche Browser Gemini Google KI Künstliche Intelligenz Projekt Mariner Web
Alle Märkte in Echtzeit verfolgen - 30 Tage kostenlos testen!

Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Google stellt Gemini 2.5 vor: Fortschritte in der KI-gestützten Web-Interaktion" für unsere Leser?

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

  • Die aktuellen intelligenten Ringe, intelligenten Brillen, intelligenten Uhren oder KI-Smartphones auf Amazon entdecken! (Sponsored)


  • Es werden alle Kommentare moderiert!

    Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.

    Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.

    Du willst nichts verpassen?

    Du möchtest über ähnliche News und Beiträge wie "Google stellt Gemini 2.5 vor: Fortschritte in der KI-gestützten Web-Interaktion" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
    Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Google stellt Gemini 2.5 vor: Fortschritte in der KI-gestützten Web-Interaktion« bei Google Deutschland suchen, bei Bing oder Google News!

    398 Leser gerade online auf IT BOLTWISE®
    KI-Jobs