PEKING / LONDON (IT BOLTWISE) – DeepSeek hat kürzlich ein neues, kompaktes KI-Modell vorgestellt, das auf einer einzigen GPU betrieben werden kann und dennoch beeindruckende Leistungen zeigt.
DeepSeek, ein führendes chinesisches KI-Labor, hat mit seinem neuesten Modell DeepSeek-R1-0528-Qwen3-8B die Aufmerksamkeit der KI-Community auf sich gezogen. Dieses Modell, eine kleinere, sogenannte ‘distillierte’ Version des neuen R1, basiert auf dem Qwen3-8B-Modell, das Alibaba im Mai eingeführt hat. Trotz seiner reduzierten Größe übertrifft es vergleichbare Modelle in bestimmten Benchmarks, insbesondere bei anspruchsvollen mathematischen Aufgaben.
Das DeepSeek-R1-0528-Qwen3-8B-Modell zeigt eine überlegene Leistung gegenüber Googles Gemini 2.5 Flash auf dem AIME 2025, einer Sammlung herausfordernder mathematischer Fragen. Zudem erreicht es fast die Leistungsfähigkeit von Microsofts kürzlich veröffentlichtem Phi 4 Reasoning Plus Modell bei einem weiteren Test der mathematischen Fähigkeiten, dem HMMT.
Distillierte Modelle wie das DeepSeek-R1-0528-Qwen3-8B sind in der Regel weniger leistungsfähig als ihre vollwertigen Gegenstücke. Der Vorteil liegt jedoch in ihrem geringeren Bedarf an Rechenressourcen. Laut der Cloud-Plattform NodeShift benötigt das Qwen3-8B-Modell eine GPU mit 40GB-80GB RAM, wie etwa eine NVIDIA H100. Im Vergleich dazu erfordert das vollwertige R1-Modell etwa ein Dutzend 80GB-GPUs.
DeepSeek hat das DeepSeek-R1-0528-Qwen3-8B trainiert, indem es Texte, die vom aktualisierten R1 generiert wurden, zur Feinabstimmung des Qwen3-8B-Modells verwendet hat. Auf einer speziellen Webseite für das Modell auf der KI-Entwicklungsplattform Hugging Face beschreibt DeepSeek das Modell als geeignet sowohl für die akademische Forschung an Reasoning-Modellen als auch für die industrielle Entwicklung, die sich auf kleine Modelle konzentriert.
Das Modell ist unter einer permissiven MIT-Lizenz verfügbar, was bedeutet, dass es kommerziell ohne Einschränkungen genutzt werden kann. Mehrere Anbieter, darunter LM Studio, bieten das Modell bereits über eine API an.

- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- Service Directory für AI Adult Services erkunden!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote

Senior IT-Sicherheitskoordinator KI (m/w/d)

IT-Architekt:in (KI/BI)

Laboringenieur*in im Bereich Virtuelle Infrastruktur für Big Data und Künstliche Intelligenz - Kennziffer: 418a/2024 I

Senior Solution Customer Success Manager (f/m/d) for SAP Business AI

- Die Zukunft von Mensch und MaschineIm neuen Buch des renommierten Zukunftsforschers und Technologie-Visionärs Ray Kurzweil wird eine faszinierende Vision der kommenden Jahre und Jahrzehnte entworfen – eine Welt, die von KI durchdrungen sein wird
- Künstliche Intelligenz: Expertenwissen gegen Hysterie Der renommierte Gehirnforscher, Psychiater und Bestseller-Autor Manfred Spitzer ist ein ausgewiesener Experte für neuronale Netze, auf denen KI aufbaut
- Obwohl Künstliche Intelligenz (KI) derzeit in aller Munde ist, setzen bislang nur wenige Unternehmen die Technologie wirklich erfolgreich ein
- Wie funktioniert Künstliche Intelligenz (KI) und gibt es Parallelen zum menschlichen Gehirn? Was sind die Gemeinsamkeiten von natürlicher und künstlicher Intelligenz, und was die Unterschiede? Ist das Gehirn nichts anderes als ein biologischer Computer? Was sind Neuronale Netze und wie kann der Begriff Deep Learning einfach erklärt werden?Seit der kognitiven Revolution Mitte des letzten Jahrhunderts sind KI und Hirnforschung eng miteinander verflochten
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "DeepSeek stellt kompaktes KI-Modell vor: Effiziente Leistung auf einer einzigen GPU" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "DeepSeek stellt kompaktes KI-Modell vor: Effiziente Leistung auf einer einzigen GPU" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »DeepSeek stellt kompaktes KI-Modell vor: Effiziente Leistung auf einer einzigen GPU« bei Google Deutschland suchen, bei Bing oder Google News!