HONGKONG / LONDON (IT BOLTWISE) – Forscher der Hong Kong University of Science and Technology und das Startup Soul AI haben ein neues System entwickelt, das die Übersetzung von gesprochener Sprache revolutionieren könnte. UniSS, ein einheitliches System für expressive Sprach-zu-Sprach-Übersetzung, bewahrt die Stimme, den Ton und die Emotionen des Sprechers. Diese Innovation verspricht, die Genauigkeit und Natürlichkeit von Übersetzungen zu verbessern und könnte die Art und Weise, wie wir mit KI interagieren, grundlegend verändern.

Die Hong Kong University of Science and Technology (HKUST) und das Startup Soul AI haben mit UniSS ein System entwickelt, das die Übersetzung von gesprochener Sprache revolutionieren könnte. UniSS steht für Unified Expressive Speech-to-Speech Translation und zielt darauf ab, nicht nur den Inhalt, sondern auch die Stimme, den Ton und die Emotionen des Sprechers zu bewahren. Diese Innovation könnte die Art und Weise, wie wir mit Künstlicher Intelligenz interagieren, grundlegend verändern.
Traditionelle Systeme zur Sprach-zu-Sprach-Übersetzung arbeiten oft in mehreren Stufen, die Fehler verstärken können. UniSS hingegen integriert den gesamten Prozess in ein einziges System, das auf dem Qwen2.5-1.5B-Instruct-Modell basiert. Dieses Modell nutzt Sprach-Tokenisierer, um Audio in verständliche Einheiten zu verwandeln, und Sprach-Dekodierer, um die übersetzten Ergebnisse in natürliche Sprache zurückzuverwandeln. Durch diese Methode wird nicht nur die Übersetzungsgenauigkeit verbessert, sondern auch die emotionale Tiefe der Sprache bewahrt.
Ein zentrales Problem bei der Entwicklung solcher Systeme ist der Mangel an qualitativ hochwertigen Trainingsdaten. Um diesem Problem zu begegnen, haben die Forscher UniST entwickelt, ein umfangreiches chinesisch-englisches Datenset mit 44.800 Stunden paralleler Sprachdaten. Dieses Datenset ermöglicht es, Modelle wie UniSS effektiv zu trainieren und könnte auch auf mehrsprachige Szenarien ausgeweitet werden.
UniSS wurde gegen führende Systeme wie Meta’s Seamless-Expressive und OpenAI’s GPT-4o getestet und zeigte überlegene Ergebnisse in Bezug auf Übersetzungsgenauigkeit und emotionale Natürlichkeit. Die Forscher sind zuversichtlich, dass ihre Arbeit einen einfachen und effektiven Ansatz für die nächste Generation von Sprach-zu-Sprach-Übersetzungssystemen darstellt. Die Möglichkeit, die emotionale Tiefe und Identität eines Sprechers zu bewahren, könnte weitreichende Auswirkungen auf die Art und Weise haben, wie wir mit Technologie kommunizieren.

- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote

Projektmanager Frontend & KI-Lösungen (m/w/d)

AI Developer (all genders) Münster, Düsseldorf, Kiel, Hamburg, Detmold

Working Student AI (f/m/x)

Werkstudent AI & Data Product Management (m/w/d)

- Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "UniSS: Fortschrittliche KI-Übersetzung mit emotionaler Tiefe" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "UniSS: Fortschrittliche KI-Übersetzung mit emotionaler Tiefe" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »UniSS: Fortschrittliche KI-Übersetzung mit emotionaler Tiefe« bei Google Deutschland suchen, bei Bing oder Google News!