PEKING / LONDON (IT BOLTWISE) – Das chinesische KI-Startup Deepseek hat mit der Einführung seines neuen Modells Deepseek-V3.2-Exp eine bedeutende Preissenkung von bis zu 75 Prozent angekündigt. Diese Entwicklung könnte den Druck auf westliche Anbieter erhöhen, die ähnliche Modelle zu höheren Preisen anbieten. Gleichzeitig hat Deepseek eine effizientere Attention-Architektur implementiert, die die Verarbeitung langer Kontexte verbessert.

Das chinesische KI-Startup Deepseek hat mit der Einführung seines neuen Modells Deepseek-V3.2-Exp eine bedeutende Preissenkung von bis zu 75 Prozent angekündigt. Diese Entwicklung könnte den Druck auf westliche Anbieter erhöhen, die ähnliche Modelle zu höheren Preisen anbieten. Gleichzeitig hat Deepseek eine effizientere Attention-Architektur implementiert, die die Verarbeitung langer Kontexte verbessert.
Im Zentrum dieser Innovation steht die DeepSeek Sparse Attention (DSA), die es ermöglicht, nur die relevanten Teile eines Kontexts auszuwählen und dadurch die Inferenzkosten bei sehr langen Eingaben erheblich zu senken. Bei Eingaben von bis zu 128.000 Tokens sind die Kosten für das Prefilling um etwa das 3,5-fache und für das Decoding um das 6- bis 7-fache niedriger. Diese Effizienzsteigerung könnte insbesondere für Unternehmen von Interesse sein, die mit großen Datenmengen arbeiten.
Ein weiterer strategischer Schritt von Deepseek ist die Einführung von TileLang als High-Level-Programmiermodell, das nicht auf eine einzelne Hardware-Plattform beschränkt ist. Dies ermöglicht es dem Modell, auch auf KI-Chips chinesischer Anbieter wie Huawei Ascend und Cambricon zu laufen. Diese Entscheidung könnte als Teil einer größeren Strategie gesehen werden, Chinas Abhängigkeit von US-amerikanischen KI-Chips, insbesondere von NVIDIA, zu verringern.
In Benchmarks zeigt sich, dass Deepseek-V3.2-Exp in vielen Bereichen mit seinem Vorgänger V3.1-Terminus vergleichbar ist. In einigen Tests gibt es leichte Unterschiede, die auf kürzere Antworten bei reasoning-lastigen Aufgaben zurückzuführen sind. Diese Lücke schließt sich jedoch bei Tests mit vergleichbarer Tokenlänge. Die Preisreduktion könnte den Markt erheblich beeinflussen, insbesondere da westliche Anbieter wie Anthropic weiterhin höhere Preise für ähnliche Leistungen verlangen.
Deepseek-V3.2-Exp ist ab sofort über mehrere Kanäle verfügbar, darunter eine Web-Oberfläche und mobile Apps für iOS und Android. Entwickler können das Modell über eine API in eigene Anwendungen integrieren. Die Modell-Checkpoints sind zudem auf Hugging Face zum Download bereit. Das Vorgängermodell V3.1-Terminus bleibt für Vergleichstests bis Oktober 2025 über eine temporäre API erreichbar.


- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote

Anwendungsberater KI m/w/d

Duales Studium Informatik/Künstliche Intelligenz (B.Sc.), Campusmodell Bremen/Stuttgart 2026 (w/m/d)

IT Application Specialist (m/w/d) – ERP & KI-gestützte Prozessintegration

Programmierschullehrer (m/w/d) für Algorithmen, Webprogrammierung und KI

- Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Deepseek senkt KI-Preise drastisch und optimiert Effizienz" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "Deepseek senkt KI-Preise drastisch und optimiert Effizienz" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Deepseek senkt KI-Preise drastisch und optimiert Effizienz« bei Google Deutschland suchen, bei Bing oder Google News!