MÜNCHEN (IT BOLTWISE) – Ein Forscherteam der Tsinghua University in Zusammenarbeit mit Zhipu AI hat ein großes Sprachmodell (LLM) namens LongWriter entwickelt, das in der Lage ist, Textausgaben von bis zu 10.000 Wörtern zu generieren.

Die zunehmende Verbreitung großer Sprachmodelle hat gezeigt, dass sie bislang nicht in der Lage waren, extrem lange Texte wie Bücher oder Manuskripte zu erstellen. Die Obergrenze lag meist bei rund 2.000 Wörtern. Die Forscher der Tsinghua University und von Zhipu AI vermuten, dass dies darauf zurückzuführen ist, dass diese Modelle mit kürzeren Texten trainiert werden. Durch eine gezielte Anpassung und den Einsatz längerer Dokumente konnten sie dieses Limit jedoch erheblich erweitern.
Um ihre These zu überprüfen, trainierte das Team zunächst ein LLM mit 9 Milliarden Parametern, das auf einem konventionellen Datensatz basierte. Dieser Datensatz umfasste überwiegend Dokumente mit weniger als 2.000 Wörtern. Wie erwartet, konnte das Modell keine Texte generieren, die diese Grenze überschritten.
Im nächsten Schritt modifizierten die Forscher ein traditionelles LLM mithilfe einer Pipeline namens AgentWrite, die das Trainingsmaterial in kleinere Aufgaben aufteilt. Mit einem speziellen Datensatz namens „LongWriter-6k“, der 6.000 Dokumente mit einer Länge von 2.000 bis 32.000 Wörtern enthält, wurde das angepasste Modell trainiert. Das Ergebnis: LongWriter konnte Texte mit einer Länge von bis zu 10.000 Wörtern generieren.
Das Team untersuchte die erzeugten langen Texte und stellte fest, dass sie kohärent und in verschiedenen Kontexten brauchbar waren. Der Quellcode für das Modell wurde auf GitHub veröffentlicht, um es der Community zu ermöglichen, auf der Arbeit des Teams aufzubauen. Ein Video zeigt LongWriter bei der Erstellung eines 10.000 Wörter umfassenden Reiseführers für Touristen in China.
Die Forscher betonen jedoch, dass mit dieser Entwicklung auch ethische Fragen aufkommen, da nun Sprachmodelle in der Lage sind, komplette Forschungsarbeiten, Bücher oder sogar Drehbücher zu verfassen.

- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote

Data Engineer / KI Engineer (m/w/d) – Python, Azure, Generative AI

Werkstudent:in (all genders) AI & Data Analytics - Energy Knowledge Mangement

Dozent Tourismusmanagement Technologien und KI (m/w/d)

Duales Studium BWL - Spezialisierung Artificial Intelligence (B.A.) am Campus oder virtuell

- Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Chinesische Forscher entwickeln KI für extrem lange Textausgaben" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "Chinesische Forscher entwickeln KI für extrem lange Textausgaben" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Chinesische Forscher entwickeln KI für extrem lange Textausgaben« bei Google Deutschland suchen, bei Bing oder Google News!