LONDON (IT BOLTWISE) – Die neuesten NVIDIA-GPUs, die RTX 5090 und RTX PRO 6000, stehen im Mittelpunkt eines Virtualisierungsproblems, das die Nutzung in Cloud-Umgebungen erheblich beeinträchtigt. Ein Reset-Fehler führt dazu, dass die GPUs nach einem virtuellen Maschinen-Shutdown nicht mehr ansprechbar sind, was einen kompletten Neustart des Systems erfordert. CloudRift bietet nun eine Belohnung für die Lösung dieses Problems an.

Die neuesten Grafikkarten von NVIDIA, die RTX 5090 und RTX PRO 6000, stehen derzeit im Fokus der Aufmerksamkeit, da sie von einem schwerwiegenden Virtualisierungsproblem betroffen sind. Dieses Problem tritt auf, wenn die GPUs in einer virtualisierten Umgebung eingesetzt werden, insbesondere bei der Nutzung von KVM und VFIO zur Durchleitung an virtuelle Maschinen. Bei einem Shutdown der virtuellen Maschine oder einer Neuzuweisung der GPU versucht das Host-System, einen PCIe-Funktions-Reset durchzuführen. Statt jedoch in einen betriebsbereiten Zustand zurückzukehren, reagieren die GPUs nicht mehr und verursachen Kernel-Fehler.
CloudRift, ein Anbieter von GPU-Computing-Cloud-Diensten, hat dieses Problem in seinen Produktionssystemen beobachtet und bietet nun eine Belohnung von 1.000 US-Dollar für eine Lösung an. Die GPUs werden nach dem Auftreten des Fehlers nicht mehr von Tools wie lspci erkannt, und die einzige Möglichkeit zur Wiederherstellung besteht in einem vollständigen Neustart des Systems. Dies ist besonders problematisch, da laufende virtuelle Maschinen dadurch unterbrochen werden.
Interessanterweise sind ältere Modelle wie die RTX 4090 sowie die NVIDIA H100 und B200 nicht von diesem Problem betroffen. Dies deutet darauf hin, dass das Problem spezifisch für die neuen Blackwell-basierten Karten ist. In verschiedenen Foren, darunter Proxmox und Level1Techs, haben Nutzer ähnliche Probleme berichtet, die von Systemabstürzen bis hin zu CPU-Softlocks reichen, die durch FLR-Timeouts verursacht werden.
CloudRift hat angekündigt, dass die Belohnung nicht nur für eine direkte Lösung des Problems, sondern auch für die Identifizierung der Ursache oder die Bereitstellung reproduzierbarer Tests vergeben wird. NVIDIA hat bisher keine offizielle Stellungnahme zu diesem Problem abgegeben, obwohl Berichten zufolge das Unternehmen das Problem reproduzieren konnte. Die Auswirkungen auf die Nutzung dieser GPUs in Cloud-Umgebungen sind erheblich, da ein vollständiger Systemneustart in produktiven Umgebungen äußerst unerwünscht ist.


- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote

Dozent Tourismusmanagement Technologien und KI (m/w/d)

IT Application Specialist (m/w/d) – ERP & KI-gestützte Prozessintegration

Software Developer AI (w/m/d) Backend-Entwicklung

Senior Specialist - Data, AI Value & Portfolio Steering (m/f/d)

- Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "NVIDIA-GPUs der neuen Generation mit Virtualisierungsproblemen" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "NVIDIA-GPUs der neuen Generation mit Virtualisierungsproblemen" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »NVIDIA-GPUs der neuen Generation mit Virtualisierungsproblemen« bei Google Deutschland suchen, bei Bing oder Google News!