LONDON (IT BOLTWISE) – Apple hat in Zusammenarbeit mit der Ohio State University ein neues Sprachmodell entwickelt, das Texte bis zu 128-mal schneller generieren kann als bestehende Modelle. Diese Innovation könnte die Art und Weise, wie wir Textverarbeitungstechnologien nutzen, revolutionieren und erhebliche Einsparungen bei Ressourcen und Zeit ermöglichen.

Apple hat in Zusammenarbeit mit der Ohio State University ein bahnbrechendes Sprachmodell entwickelt, das die Textgenerierung revolutionieren könnte. Dieses neue Hybridmodell, bekannt als Few-Step Discrete Flow-Matching (FS-DFM), kombiniert die Präzision von Diffusionsmodellen mit der Effizienz des Flow-Matching-Ansatzes. Im Vergleich zu herkömmlichen Modellen, die oft tausende Schritte benötigen, um qualitativ hochwertige Texte zu erzeugen, benötigt FS-DFM lediglich acht Verfeinerungsschritte. Dies könnte die Geschwindigkeit der Textgenerierung erheblich steigern und gleichzeitig die benötigten Ressourcen reduzieren.
Die Textgenerierung mit großen Sprachmodellen wie ChatGPT ist traditionell ein zeitintensiver Prozess. Diese Modelle arbeiten autoregressiv, das heißt, sie erzeugen Texte Wort für Wort, basierend auf der Eingabe der Nutzer und den zuvor generierten Wörtern. Diese Methode sorgt zwar für eine hohe Kohärenz, ist jedoch vergleichsweise langsam. Diffusionsmodelle, die bisher vor allem in der Bildgenerierung eingesetzt werden, bieten eine Alternative, indem sie mehrere Token parallel generieren und in vielen kleinen Iterationen verfeinern. Obwohl sie hochwertige Ergebnisse liefern, sind sie sehr rechenintensiv.
Das neue Modell von Apple und der Ohio State University zielt darauf ab, die Vorteile beider Ansätze zu vereinen. Durch den Einsatz eines dreistufigen Trainingsansatzes, bei dem das Modell lernt, mit unterschiedlich vielen Verfeinerungsrunden umzugehen, bleibt es flexibel und effizient. Ein sogenanntes Lehrer-Modell unterstützt FS-DFM dabei, pro Iteration größere und präzisere Verbesserungen vorzunehmen, ohne vom gewünschten Textziel abzuweichen. Diese Innovation könnte die Generierung komplexer Texte erheblich beschleunigen und die benötigte Rechenleistung reduzieren.
Die Leistungsfähigkeit des neuen Modells wurde anhand der Kennzahlen Perplexität und Entropie bewertet. Während die Perplexität misst, wie gut ein Sprachmodell vorhersagen kann, welches Wort als nächstes folgt, beschreibt die Entropie die Sicherheit des Modells bei der Wortauswahl. Im Vergleich zu etablierten Diffusionsmodellen konnte FS-DFM selbst mit deutlich weniger Parametern präzisere und stabilere Texte erstellen. Die Forscher von Apple planen, den Code und die Modell-Checkpoints öffentlich zugänglich zu machen, um die weitere Forschung zu fördern und anderen Teams die Möglichkeit zu geben, die Methode zu reproduzieren und weiterzuentwickeln.

- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote

AI Enablement Specialist - GenAI & Automation (M/W/D)

Wissenschaftlicher Mitarbeiter Projektassistenz & Netzwerkkoordination (m/w/d) im Bereich KI-Forschung

Projektmanager (m/w/d) KI-Enablement befristet auf 2 Jahre

Bauprojektleiter Technische Gebäudeausrüstung (TGA) für KI- Rechenzentrumprojekte (m/w/d); HN oder B

- Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Apples neues Sprachmodell: Effizienzsteigerung durch Hybridansatz" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "Apples neues Sprachmodell: Effizienzsteigerung durch Hybridansatz" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Apples neues Sprachmodell: Effizienzsteigerung durch Hybridansatz« bei Google Deutschland suchen, bei Bing oder Google News!