CAMBRIDGE / MÜNCHEN (IT BOLTWISE) – Eine neue Entwicklung im Bereich der Künstlichen Intelligenz ermöglicht es Maschinen, menschliche Lautäußerungen nachzuahmen und zu verstehen. Diese Technologie könnte die Art und Weise, wie wir mit Computern interagieren, grundlegend verändern.
- Die besten Bücher rund um KI & Robotik
präsentiert von Amazon!
- Unsere täglichen KI-News von IT Boltwise® bei LinkedIn abonnieren!
- KI-Meldungen bequem via Telegram oder per Newsletter erhalten!
- IT Boltwise® bei Facy oder Insta als Fan markieren und abonnieren!
- AI Morning Podcast bei Spotify / Amazon / Apple verfolgen!
- RSS-Feed 2.0 von IT Boltwise® für KI-News speichern!
Die Forscher des MIT Computer Science and Artificial Intelligence Laboratory (CSAIL) haben ein KI-Modell entwickelt, das in der Lage ist, menschliche Lautäußerungen zu imitieren und zu verstehen. Inspiriert von der menschlichen Sprachproduktion, nutzt das System ein Modell des menschlichen Vokaltrakts, um Geräusche zu erzeugen und zu interpretieren. Diese Technologie könnte neue Möglichkeiten für die Entwicklung von Klangschnittstellen in den Bereichen Unterhaltung und Bildung eröffnen.
Das Konzept der vokalen Imitation ist vergleichbar mit dem Zeichnen eines schnellen Bildes, um etwas zu kommunizieren, das man gesehen hat. Anstatt jedoch einen Stift zu verwenden, um ein Bild zu illustrieren, wird der Vokaltrakt genutzt, um einen Klang auszudrücken. Diese Fähigkeit, Geräusche mit der Stimme nachzuahmen, ist etwas, das wir alle intuitiv tun. Die Forscher haben es geschafft, diese menschliche Fähigkeit in ein KI-Modell zu übertragen, das ohne vorheriges Training menschliche Lautimitationen erzeugen kann.
Um dies zu erreichen, haben die Forscher ein Modell des menschlichen Vokaltrakts entwickelt, das simuliert, wie Vibrationen aus dem Kehlkopf durch Rachen, Zunge und Lippen geformt werden. Ein kognitiv inspiriertes KI-Algorithmus steuert dieses Modell, um Imitationen zu erzeugen, wobei die kontextspezifischen Kommunikationsweisen der Menschen berücksichtigt werden. Das Modell kann viele Geräusche aus der Welt aufnehmen und eine menschenähnliche Imitation erzeugen, darunter Geräusche wie raschelnde Blätter, das Zischen einer Schlange und das Herannahen einer Sirene.
Die Forscher entwickelten drei zunehmend nuanciertere Versionen des Modells, um es mit menschlichen Imitationen zu vergleichen. Zunächst wurde ein Basismodell erstellt, das Imitationen erzeugen sollte, die den realen Geräuschen so ähnlich wie möglich sind. Dieses Modell entsprach jedoch nicht gut dem menschlichen Verhalten. Ein zweites, kommunikativeres Modell wurde entwickelt, das berücksichtigt, was für einen Zuhörer an einem Geräusch besonders auffällig ist. Schließlich wurde eine letzte Schicht des Denkens hinzugefügt, die die Anstrengung berücksichtigt, die Menschen in die Erzeugung von Lautäußerungen investieren.
In einem Experiment bevorzugten die Teilnehmer das KI-Modell in 25 Prozent der Fälle, insbesondere bei der Imitation eines Motorbootes und eines Schusses. Diese Ergebnisse zeigen das Potenzial der Technologie, die in Zukunft zu intuitiveren Schnittstellen für Klangdesigner und realistischeren KI-Charakteren in virtuellen Welten führen könnte. Die Forscher untersuchen auch die Auswirkungen ihres Modells auf andere Bereiche, einschließlich der Sprachentwicklung und der Imitationsverhalten bei Vögeln.
Die Technologie steht jedoch noch vor Herausforderungen, wie der Nachahmung bestimmter Konsonanten und der Replikation von Sprach- und Musikimitationen. Dennoch stellt das Modell einen bedeutenden Schritt in Richtung eines besseren Verständnisses der Prozesse dar, die der menschlichen Lautäußerung zugrunde liegen, und könnte in Zukunft neue Wege für die Interaktion mit KI eröffnen.
Amazon-Trendangebote der letzten 24 Stunden mit bis zu 78% Rabatt (Sponsored)
- NIEDLICHER BEGLEITER: Eilik ist der ideale Begleiter für Kinder und Erwachsene, die Haustiere, Spiele und intelligente Roboter lieben. Mit vielen Emotionen, Bewegungen und interaktiven Funktionen.
- Die Zukunft von Mensch und MaschineIm neuen Buch des renommierten Zukunftsforschers und Technologie-Visionärs Ray Kurzweil wird eine faszinierende Vision der kommenden Jahre und Jahrzehnte entworfen – eine Welt, die von KI durchdrungen sein wird
- Künstliche Intelligenz: Expertenwissen gegen Hysterie Der renommierte Gehirnforscher, Psychiater und Bestseller-Autor Manfred Spitzer ist ein ausgewiesener Experte für neuronale Netze, auf denen KI aufbaut
- Obwohl Künstliche Intelligenz (KI) derzeit in aller Munde ist, setzen bislang nur wenige Unternehmen die Technologie wirklich erfolgreich ein
- Wie funktioniert Künstliche Intelligenz (KI) und gibt es Parallelen zum menschlichen Gehirn? Was sind die Gemeinsamkeiten von natürlicher und künstlicher Intelligenz, und was die Unterschiede? Ist das Gehirn nichts anderes als ein biologischer Computer? Was sind Neuronale Netze und wie kann der Begriff Deep Learning einfach erklärt werden?Seit der kognitiven Revolution Mitte des letzten Jahrhunderts sind KI und Hirnforschung eng miteinander verflochten
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "KI-Modell ahmt menschliche Lautäußerungen nach" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.