MÜNCHEN (IT BOLTWISE) – Google hat kürzlich bedeutende Erweiterungen für sein KI-Modell Gemini 2.5 Pro vorgestellt, die sowohl die Denkfähigkeiten als auch die Audioausgabe betreffen.
Google hat sein KI-Modell Gemini 2.5 Pro mit einem neuen Modus namens „Deep Think“ ausgestattet, der es dem Modell ermöglicht, komplexe Schlussfolgerungen zu ziehen. Dieser Modus erlaubt es dem Modell, mehrere Hypothesen zu erwägen, bevor es eine endgültige Antwort generiert. Diese Funktion basiert auf neuen Forschungstechniken und wird derzeit mit ausgewählten Nutzern der Gemini-API getestet. Laut Google übertrifft Gemini 2.5 Pro in Benchmarks wie dem mathematischen USAMO-Test 2025 und dem Programmier-Benchmark LiveCodeBench die Konkurrenz.
Zusätzlich zur Einführung des Deep Think-Modus hat Google auch die Audiofähigkeiten des Modells verbessert. Die native Audioausgabe unterstützt nun mehrere Sprecher und kann Flüstern sowie andere stimmliche Nuancen abbilden. Diese Funktionalität ermöglicht es, zwischen über 24 Sprachen zu wechseln und den Tonfall, Akzent und Stil in der Live-API zu steuern. Die neuen Audiofunktionen „Affective Dialogue“ und „Proactive Audio“ sollen die Interaktion mit der KI natürlicher gestalten, indem sie Emotionen in der Stimme des Nutzers erkennen und entsprechend reagieren.
Ein weiteres Highlight ist die Integration von Project Mariner in die Gemini API und Vertex AI, wodurch das Modell in der Lage ist, Computeranwendungen wie Browser zu bedienen. Entwickler können nun Thought Summaries nutzen, um die Überlegungen des Modells strukturiert darzustellen. Zudem können sogenannte Thinking Budgets gesetzt werden, um den Rechenaufwand und die Antwortqualität zu steuern.
Google plant, die allgemeine Verfügbarkeit von Gemini 2.5 Flash für Produktionsumgebungen Anfang Juni zu ermöglichen. Diese Version ist auf Geschwindigkeit und niedrige Kosten ausgelegt und erreicht nun bessere Werte in den Bereichen Schlussfolgern, Multimodalität und Codegenerierung bei gleichzeitig geringerem Token-Verbrauch.
Ein weiterer Neuzugang in Googles KI-Portfolio ist das Modell Gemma 3n, das speziell für den Einsatz auf mobilen Geräten entwickelt wurde. Es unterstützt Text-, Audio- und Bildverarbeitung und kann Sprache transkribieren und übersetzen. Die multilingualen Fähigkeiten wurden insbesondere für Sprachen wie Deutsch, Japanisch und Spanisch verbessert.

- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- Service Directory für AI Adult Services erkunden!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote

Duales Studium BWL - Spezialisierung Artificial Intelligence (B.A.) am Campus oder virtuell

KI Zukunftsgestalter (m/w/d)

Werkstudent*in (m/w/d) Data Quality für AI Services

Bauprojektmanager/ Projektleiter als Bauherrenvertretung für den KI-Campus, Heilbronn (m/w/d)

- Die Zukunft von Mensch und MaschineIm neuen Buch des renommierten Zukunftsforschers und Technologie-Visionärs Ray Kurzweil wird eine faszinierende Vision der kommenden Jahre und Jahrzehnte entworfen – eine Welt, die von KI durchdrungen sein wird
- Künstliche Intelligenz: Expertenwissen gegen Hysterie Der renommierte Gehirnforscher, Psychiater und Bestseller-Autor Manfred Spitzer ist ein ausgewiesener Experte für neuronale Netze, auf denen KI aufbaut
- Obwohl Künstliche Intelligenz (KI) derzeit in aller Munde ist, setzen bislang nur wenige Unternehmen die Technologie wirklich erfolgreich ein
- Wie funktioniert Künstliche Intelligenz (KI) und gibt es Parallelen zum menschlichen Gehirn? Was sind die Gemeinsamkeiten von natürlicher und künstlicher Intelligenz, und was die Unterschiede? Ist das Gehirn nichts anderes als ein biologischer Computer? Was sind Neuronale Netze und wie kann der Begriff Deep Learning einfach erklärt werden?Seit der kognitiven Revolution Mitte des letzten Jahrhunderts sind KI und Hirnforschung eng miteinander verflochten
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Google erweitert Gemini 2.5 Pro mit neuem Denkmodus" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "Google erweitert Gemini 2.5 Pro mit neuem Denkmodus" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Google erweitert Gemini 2.5 Pro mit neuem Denkmodus« bei Google Deutschland suchen, bei Bing oder Google News!