LONDON (IT BOLTWISE) – NVIDIA steht vor einem Problem mit seinen neuen Blackwell-Grafikkarten, die in virtuellen Maschinen eingesetzt werden. Diese GPUs, darunter die Geforce RTX 5090 und RTX Pro 6000, neigen dazu, nach einigen Tagen des Dauerbetriebs einzufrieren. Cloud-Anbieter wie Cloud Rift sind betroffen und haben ein Kopfgeld für eine Lösung ausgesetzt.

Die neuen Blackwell-Grafikkarten von NVIDIA, insbesondere die Modelle Geforce RTX 5090 und RTX Pro 6000, stehen im Mittelpunkt eines technischen Problems, das den Betrieb in virtuellen Maschinen erheblich beeinträchtigt. Diese GPUs, die in der AI-Cloud-Infrastruktur von Anbietern wie Cloud Rift eingesetzt werden, neigen dazu, nach einigen Tagen des Dauerbetriebs einzufrieren. Dies stellt eine erhebliche Herausforderung für die betroffenen Unternehmen dar, da die Systeme dadurch nicht wie gewünscht ausgelastet werden können.
Das Problem tritt typischerweise nach mehreren Tagen ununterbrochenen Betriebs auf, kann aber auch beim Hoch- oder Herunterfahren der Systeme auftreten. Die Grafikkarten werden in einem für Cloud-Anbieter üblichen Setup betrieben, bei dem sie per Kernel-Virtualisierung verschiedenen Nutzern zugewiesen werden. Diese Nutzer haben dann direkten Zugriff auf die Hardware, was jedoch zu einem Einfrieren der GPUs führen kann, das einen kompletten Neustart des Systems erforderlich macht.
Cloud Rift hat bereits verschiedene Kernel und Grafiktreiber ausprobiert, um das Problem zu lösen, jedoch ohne Erfolg. Beim Versuch eines Software-Resets bleiben die Grafikkarten hängen, und kurz darauf friert auch der Prozessor ein. Ein PCI-Rescan bringt keine Abhilfe, und die GPUs werden für den Nvidia-Treiber unsichtbar. Interessanterweise tritt dieses Problem bei älteren RTX-Grafikkarten sowie den KI-Beschleunigern H100 und B200 nicht auf, was darauf hindeutet, dass der Gaming-Blackwell-Chip GB202 oder die entsprechende Architektur die Ursache sein könnte.
In der Community, insbesondere auf Plattformen wie Reddit, wird das Problem ebenfalls diskutiert. NVIDIA hat das Problem bereits bestätigt und arbeitet an einer Lösung, doch bisher gibt es keine konkreten Fortschritte. Cloud Rift hat daher ein Kopfgeld von 1.000 US-Dollar für eine Lösung ausgesetzt, um die Zuverlässigkeit der Systeme wiederherzustellen. Dies zeigt, wie wichtig es für Cloud-Anbieter ist, dass ihre Infrastruktur stabil und zuverlässig funktioniert, um den Anforderungen ihrer Kunden gerecht zu werden.
Die Auswirkungen auf den Markt sind erheblich, da die Unzuverlässigkeit der neuen GPUs die Wettbewerbsfähigkeit der betroffenen Cloud-Anbieter beeinträchtigen könnte. Es bleibt abzuwarten, ob und wann NVIDIA ein Software-Update bereitstellen wird, um das Einfrieren der Grafikkarten zu verhindern. Bis dahin bleibt das Problem eine Herausforderung für die betroffenen Unternehmen und ein potenzielles Risiko für ihre Geschäftsmodelle.


- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote

Wissenschaftlicher Mitarbeiter im Bereich Artificial Intelligence and Security (all genders)

Senior Software Architect Conversational AI (all genders)

Duales Studium Bachelor of Science - Data Science und Künstliche Intelligenz (m/w/d) 2026

Dozent Tourismusmanagement Technologien und KI (m/w/d)

- Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "NVIDIA Blackwell GPUs: Herausforderungen in virtuellen Maschinen" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "NVIDIA Blackwell GPUs: Herausforderungen in virtuellen Maschinen" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »NVIDIA Blackwell GPUs: Herausforderungen in virtuellen Maschinen« bei Google Deutschland suchen, bei Bing oder Google News!