MOUNTAIN VIEW / LONDON (IT BOLTWISE) – Google hat ein neues KI-Modell namens Gemini 2.5 vorgestellt, das in der Lage ist, mit Webbrowsern zu interagieren. Diese Technologie ermöglicht es KI-Agenten, Aufgaben in Benutzeroberflächen auszuführen, die für Menschen konzipiert sind, ohne dass eine API erforderlich ist.

 Heutige Tagesdeals bei Amazon!  ˗ˋˏ$ˎˊ˗

Google hat kürzlich das Gemini 2.5 Computer Use Modell vorgestellt, das eine neue Ära der Interaktion zwischen Künstlicher Intelligenz und Webbrowsern einläutet. Diese Technologie ermöglicht es KI-Agenten, in Browsern zu navigieren und Aufgaben zu erledigen, die bisher menschlichen Nutzern vorbehalten waren. Durch die Fähigkeit, zu klicken, zu scrollen und Text einzugeben, kann das Modell Daten abrufen, die nicht über eine API verfügbar sind. Dies eröffnet neue Möglichkeiten für die Automatisierung von Aufgaben, die bisher manuelle Eingriffe erforderten.

Das Modell nutzt fortschrittliche visuelle Verständnis- und Argumentationsfähigkeiten, um Benutzeranfragen zu analysieren und Aufgaben wie das Ausfüllen und Absenden von Formularen auszuführen. Diese Funktionalität ist besonders nützlich für die Benutzeroberflächentests oder die Navigation in Schnittstellen, die keine direkte API-Verbindung bieten. Google hat bereits andere Versionen dieses Modells in Projekten wie AI Mode und Project Mariner eingesetzt, um Aufgaben autonom in einem Browser auszuführen.

Die Ankündigung von Google erfolgt nur einen Tag nach der Vorstellung neuer Apps für ChatGPT durch OpenAI. Während OpenAI weiterhin auf seine ChatGPT-Agentenfunktion setzt, die komplexe Aufgaben im Namen des Nutzers erledigen kann, hat Google mit Gemini 2.5 einen anderen Weg eingeschlagen. Im Gegensatz zu den Lösungen von OpenAI und Anthropic, die umfassendere Computerumgebungen nutzen, beschränkt sich Google auf die Interaktion mit Webbrowsern, was jedoch auf mehreren Web- und Mobil-Benchmarks führend ist.

Gemini 2.5 Computer Use ist über Google AI Studio und Vertex AI für Entwickler verfügbar. Eine Demo ist auf Browserbase zu sehen, wo das Modell Aufgaben wie das Spielen von 2048 oder das Durchsuchen von Hacker News für aktuelle Debatten erledigt. Diese Entwicklung zeigt, dass Google weiterhin bestrebt ist, die Grenzen der KI-Interaktion mit bestehenden Technologien zu erweitern und neue Anwendungsfälle zu erschließen.

*Amazon-Kreditkarte ohne Jahresgebühr mit 2.000 Euro Verfügungsrahmen bestellen! a‿z




Hat Ihnen der Artikel bzw. die News - Google präsentiert neues KI-Modell für Browserinteraktion - gefallen? Dann abonnieren Sie uns doch auf Insta: AI News, Tech Trends & Robotics - Instagram - Boltwise

Unseren KI-Morning-Newsletter «Der KI News Espresso» mit den besten KI-News des letzten Tages gratis per eMail - ohne Werbung: Hier kostenlos eintragen!


Google präsentiert neues KI-Modell für Browserinteraktion
Google präsentiert neues KI-Modell für Browserinteraktion (Foto: DALL-E, IT BOLTWISE)



Folgen Sie aktuellen Beiträge über KI & Robotik auf Twitter, Telegram, Facebook oder LinkedIn!
Hinweis: Teile dieses Textes könnten mithilfe Künstlicher Intelligenz generiert worden sein. Die auf dieser Website bereitgestellten Informationen stellen keine Finanzberatung dar und sind nicht als solche gedacht. Die Informationen sind allgemeiner Natur und dienen nur zu Informationszwecken. Wenn Sie Finanzberatung für Ihre individuelle Situation benötigen, sollten Sie den Rat von einem qualifizierten Finanzberater einholen. IT BOLTWISE® schließt jegliche Regressansprüche aus.









Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de. Da wir bei KI-erzeugten News und Inhalten selten auftretende KI-Halluzinationen nicht ausschließen können, bitten wir Sie bei Falschangaben und Fehlinformationen uns via eMail zu kontaktieren und zu informieren. Bitte vergessen Sie nicht in der eMail die Artikel-Headline zu nennen: "Google präsentiert neues KI-Modell für Browserinteraktion".
Stichwörter Agenten AI Artificial Intelligence Browser Entwickler Gemini Google KI Künstliche Intelligenz Webinteraktion
Alle Märkte in Echtzeit verfolgen - 30 Tage kostenlos testen!
Nächster Artikel

Bitcoin bleibt trotz Kursrückgang im Aufwind

Vorheriger Artikel

OranjeBTC treibt Bitcoin-Adoption in Lateinamerika voran


Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Google präsentiert neues KI-Modell für Browserinteraktion" für unsere Leser?

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

  • Die aktuellen intelligenten Ringe, intelligenten Brillen, intelligenten Uhren oder KI-Smartphones auf Amazon entdecken! (Sponsored)


  • Es werden alle Kommentare moderiert!

    Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.

    Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.

    Du willst nichts verpassen?

    Du möchtest über ähnliche News und Beiträge wie "Google präsentiert neues KI-Modell für Browserinteraktion" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
    Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Google präsentiert neues KI-Modell für Browserinteraktion« bei Google Deutschland suchen, bei Bing oder Google News!

    405 Leser gerade online auf IT BOLTWISE®
    KI-Jobs