CUPERTINO / LONDON (IT BOLTWISE) – Apple hat in Zusammenarbeit mit der Ohio State University ein bahnbrechendes Sprachmodell entwickelt, das die Textgenerierung revolutionieren könnte. Das neue Hybridmodell, bekannt als Few-Step Discrete Flow-Matching (FS-DFM), kombiniert die Präzision von Diffusionsmodellen mit der Effizienz des Flow-Matching-Ansatzes. Diese Innovation verspricht, die Erstellung komplexer Texte erheblich zu beschleunigen und Ressourcen zu sparen.

Apple hat in Zusammenarbeit mit der Ohio State University ein neues Sprachmodell entwickelt, das die Textgenerierung erheblich beschleunigen könnte. Das Modell, bekannt als Few-Step Discrete Flow-Matching (FS-DFM), kombiniert die Präzision von Diffusionsmodellen mit der Effizienz des Flow-Matching-Ansatzes. Diese Kombination ermöglicht es, Texte in nur acht Verfeinerungsschritten zu erstellen, was im Vergleich zu herkömmlichen Modellen, die über tausend Schritte benötigen, eine enorme Zeitersparnis darstellt.
Traditionelle Sprachmodelle wie ChatGPT arbeiten autoregressiv und erzeugen Texte Wort für Wort. Dieser Ansatz sorgt zwar für hohe Kohärenz, ist jedoch vergleichsweise langsam. Diffusionsmodelle, die bisher vor allem in der Bildgenerierung genutzt werden, bieten eine Alternative, indem sie mehrere Token parallel generieren. Allerdings sind sie sehr rechenintensiv, da viele Iterationen erforderlich sind, um ein qualitativ hochwertiges Ergebnis zu erzielen.
Das neue Hybridmodell FS-DFM von Apple und der Ohio State University nutzt die Vorteile beider Ansätze. Es verkürzt den iterativen Prozess der Diffusionsmodelle erheblich, indem es lernt, den gewünschten Text in einem einzigen Durchgang zu erzeugen. Dies wird durch einen dreistufigen Trainingsansatz erreicht, der das Modell darauf vorbereitet, mit unterschiedlich vielen Verfeinerungsrunden umzugehen. Ein sogenanntes Lehrer-Modell unterstützt das FS-DFM dabei, pro Iteration größere und präzisere Verbesserungen vorzunehmen.
Die Leistungsfähigkeit des neuen Modells wurde anhand von zwei zentralen Kennzahlen bewertet: Perplexität und Entropie. Während die Perplexität misst, wie gut ein Sprachmodell vorhersagen kann, welches Wort als nächstes folgt, beschreibt die Entropie die Sicherheit des Modells bei der Wortauswahl. Im Vergleich zu etablierten Diffusionsmodellen konnte FS-DFM selbst mit weniger Parametern präzisere und stabilere Texte erstellen. Die Methode ist bis zu 128-mal schneller als andere gängige Modelle.
Die Ergebnisse dieser Forschung sind vielversprechend und deuten darauf hin, dass hochwertige Textgenerierung künftig mit weniger Rechenleistung und Zeitaufwand möglich sein könnte. Um die weitere Forschung zu fördern, planen die Apple-Forscher:innen, den Code und die Modell-Checkpoints öffentlich zugänglich zu machen. Dies könnte anderen Teams ermöglichen, die Methode zu reproduzieren und die Forschung weiter voranzutreiben.

- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote

Junior Consultant – Real-Time Data & AI (m/w/d)

Vertriebsprofi (m/w/d) für KI-basierte Softwarelösungen in der Autohausbranche

Compliance Manager Datenschutz für Artificial Intelligence (m/w/d)

Staff Product Analyst - Agentic AI Tracking

- Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Apples neues Sprachmodell revolutioniert Textgenerierung" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "Apples neues Sprachmodell revolutioniert Textgenerierung" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Apples neues Sprachmodell revolutioniert Textgenerierung« bei Google Deutschland suchen, bei Bing oder Google News!