MÜNCHEN (IT BOLTWISE) – Google verfolgt ehrgeizige Pläne, seine KI-Modelle zu vereinen, um die Wahrnehmung der physischen Welt zu verbessern.

Google hat in der Welt der Künstlichen Intelligenz erneut für Aufsehen gesorgt. Der CEO von DeepMind, Demis Hassabis, kündigte kürzlich in einem Podcast an, dass Google plant, seine Gemini-Modelle mit den Veo-Video-Generierungsmodellen zu kombinieren. Diese Fusion soll die Fähigkeit der KI verbessern, die physische Welt zu verstehen und zu interpretieren. Die Gemini-Modelle von Google sind von Anfang an als multimodale Plattform konzipiert worden.
Dies bedeutet, dass sie in der Lage sind, verschiedene Medienformen wie Text, Bilder und Audio zu verarbeiten. Der nächste Schritt, so Hassabis, sei die Integration von Video, um eine umfassendere digitale Assistenz zu ermöglichen, die nicht nur in der digitalen, sondern auch in der physischen Welt hilfreich ist. Der Trend in der KI-Industrie geht zunehmend in Richtung sogenannter ‘Omni-Modelle’. Diese Modelle sind darauf ausgelegt, eine Vielzahl von Medienformen zu verstehen und zu synthetisieren.
Neben Google arbeiten auch andere große Unternehmen wie OpenAI und Amazon an ähnlichen Projekten. OpenAI hat bereits ein Modell entwickelt, das in der Lage ist, Bilder im Stil von Studio Ghibli zu erstellen, während Amazon plant, noch in diesem Jahr ein ‘Any-to-Any’-Modell auf den Markt zu bringen. Die Entwicklung solcher Modelle erfordert eine enorme Menge an Trainingsdaten. Für Veo, das Video-generierende Modell von Google, stammen diese Daten hauptsächlich von YouTube, einer Plattform, die Google gehört. Laut Hassabis kann Veo durch das Ansehen von unzähligen YouTube-Videos die physikalischen Eigenschaften der Welt besser verstehen.
Google hat bereits im Vorfeld angedeutet, dass seine Modelle möglicherweise mit Inhalten von YouTube trainiert werden, sofern dies im Einklang mit den Vereinbarungen mit den YouTube-Erstellern steht. Im vergangenen Jahr hat Google seine Nutzungsbedingungen erweitert, um mehr Daten für das Training seiner KI-Modelle nutzen zu können. Diese Entwicklungen werfen jedoch auch Fragen zum Datenschutz und zur Einhaltung von Urheberrechten auf.
Die Nutzung von YouTube-Inhalten für das Training von KI-Modellen könnte rechtliche und ethische Herausforderungen mit sich bringen, insbesondere in Bezug auf die Zustimmung der Ersteller und die Transparenz gegenüber den Nutzern. Dennoch könnte die Kombination von Gemini und Veo einen bedeutenden Fortschritt in der KI-Forschung darstellen und die Art und Weise, wie digitale Assistenten in der physischen Welt agieren, revolutionieren.


- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote

Senior Consultant AI Governance, Compliance & Risk (m/w/d)

Werkstudent im Bereich KI-Entwicklung (w/m/d)

Werkstudent AI-gestützte HDL-Tests & FPGA Power Management Optimierung (m/w/d)

AI Solution Architect (m/w/d)

- Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Google plant Integration von Gemini und Veo zur Verbesserung der KI-Weltwahrnehmung" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "Google plant Integration von Gemini und Veo zur Verbesserung der KI-Weltwahrnehmung" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Google plant Integration von Gemini und Veo zur Verbesserung der KI-Weltwahrnehmung« bei Google Deutschland suchen, bei Bing oder Google News!