Von Stimmen zu Musik: Generative KI-Innovationen in der Audio- und Videoproduktion - IT BOLTWISE® x Artificial Intelligence

MÜNCHEN (IT BOLTWISE) – Die KI-gestützte Audioproduktion und Videogeneration erleben eine signifikante Revolution, dank neuer Entwicklungen von Unternehmen wie ElevenLabs, Pika und Adobe. Diese Innovationen versprechen, die Art und Weise, wie wir Inhalte erstellen und erleben, grundlegend zu verändern.

Nach der Meisterung von maschinenlerngestützter Sprachklonung und -synthese erweitert das von ehemaligen Google- und Palantir-Mitarbeitern gegründete Startup ElevenLabs sein Portfolio um ein neues Text-zu-Sound-Modell. Dieses ermöglicht es Kreativen, Soundeffekte allein durch die Beschreibung ihrer Vorstellung in Worte zu generieren. Eine ähnliche Innovation wird von Adobe mit seinem Projekt Music GenAI vorgestellt, das Benutzern ermöglicht, Musik durch einfache Texteingaben zu erzeugen und zu bearbeiten, von „kraftvollem Rock“ bis hin zu „fröhlichem Tanz“.

Pika, ein Rivale in der AI-Video-Generierung, fügt seiner Plattform mit Unterstützung von ElevenLabs eine Lip-Sync-Funktion hinzu, die es ermöglicht, gesprochenen Dialog mit passender Mundbewegungsanimation zu AI-generierten Videos hinzuzufügen. Dies vereinfacht die Erstellung vollständiger AI-narrativer Filme erheblich.

Adobes Projekt Music GenAI und Project Music GenAI Control stellen eine neue Ära der Musikproduktion dar, bei der Benutzer ohne musikalische Vorerfahrung Hintergrundtracks erstellen und anpassen können. Diese Tools könnten in einer Vielzahl von Anwendungen zum Einsatz kommen, von der Videokonferenz über Bildung bis hin zur Unterhaltung.

Die Entwicklungen in der generativen KI rücken nicht nur die technologische Machbarkeit, sondern auch ethische Bedenken in den Vordergrund. Die Möglichkeit, realistisch wirkende Videos von Personen zu erstellen, die sprechen oder singen, nur basierend auf einem Foto und einem Audio-Clip, wie es das von Alibaba’s Institute for Intelligent Computing entwickelte System EMO ermöglicht, wirft Fragen bezüglich Missbrauch und Desinformation auf. Trotz dieser Bedenken geht die Forschung in Richtung Methoden zur Erkennung synthetischer Videos voran.

Die rasante Entwicklung in diesem Bereich zeigt das Potenzial generativer KI, die Landschaft der digitalen Inhalte zu revolutionieren, während sie gleichzeitig neue Herausforderungen und Möglichkeiten für Kreativität und ethische Überlegungen bietet.

Von Stimmen zu Musik: Die Revolution der Generativen KI in der Audio- und Videoproduktion
Von Stimmen zu Musik: Die Revolution der Generativen KI in der Audio- und Videoproduktion (Foto:DALL-E, IT BOLTWISE)
Hinweis: Teile dieses Textes könnten mithilfe Künstlicher Intelligenz generiert worden sein.



Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de
Stichwörter
Alle Märkte in Echtzeit verfolgen - 30 Tage kostenlos testen!


#Abo
LinkedIn
Facebook
Twitter
#Podcast
YouTube
Spotify
Apple

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert



Es werden alle Kommentare moderiert!

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.

Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.

Du willst nichts verpassen?

Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.