SEOUL / LONDON (IT BOLTWISE) – Alibaba Cloud hat ein neues Pooling-System namens Aegaeon entwickelt, das die Nutzung von NVIDIA-GPUs um 82 % reduziert. Diese Innovation ermöglicht es, dass 213 GPUs die Leistung von 1.192 GPUs erbringen, was insbesondere in Märkten mit begrenztem Zugang zu moderner Hardware von Bedeutung ist.

Alibaba Cloud hat mit seinem neuen Aegaeon-Pooling-System einen bedeutenden Fortschritt in der effizienten Nutzung von NVIDIA-GPUs erzielt. Während eines mehrmonatigen Beta-Tests im Model Studio Marketplace konnte die Anzahl der benötigten GPUs um 82 % reduziert werden. Diese Entwicklung ist besonders relevant in Märkten wie China, wo der Zugang zu den neuesten NVIDIA H20-GPUs aufgrund von Exportbeschränkungen eingeschränkt ist.
Im Gegensatz zu herkömmlichen Trainingsmethoden, die auf Modellqualität oder Geschwindigkeit abzielen, konzentriert sich Aegaeon auf die Optimierung der GPU-Auslastung während der Inferenzzeit. Durch die Virtualisierung des GPU-Zugriffs auf Token-Ebene kann das System winzige Arbeitseinheiten über einen gemeinsamen Pool verteilen. Dies ermöglicht es einer einzigen H20-GPU, mehrere Modelle gleichzeitig zu bedienen, was die effektive Leistung um das bis zu Neunfache im Vergleich zu älteren serverlosen Systemen steigert.
Die Tests wurden in Zusammenarbeit mit der Peking-Universität durchgeführt und zeigten, dass die Anzahl der benötigten GPUs zur Unterstützung verschiedener großer Sprachmodelle von 1.192 auf nur 213 gesenkt werden konnte. Die Ergebnisse wurden auf dem ACM Symposium on Operating Systems (SOSP) 2025 in Seoul vorgestellt. Die Haupttechniken, die zu diesen Einsparungen führten, waren das Packen mehrerer Modelle pro GPU und die dynamische Zuweisung von Rechenleistung auf Token-Ebene.
Obwohl die Ergebnisse beeindruckend sind, bleibt abzuwarten, ob sie auch außerhalb der Alibaba-Umgebung reproduzierbar sind. Alibaba Cloud nutzt eine eigene eRDMA-Netzwerkinfrastruktur, die möglicherweise entscheidend für die erzielten Ergebnisse ist. Dennoch könnten andere große Cloud-Anbieter an dieser Technologie interessiert sein, um ihre begrenzten GPU-Ressourcen besser auszunutzen, da die Nachfrage nach Inferenzkapazitäten weiter steigt.


- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote

Manager für KI und Informationssicherheit (m/w/d)

Managing Consultant Azure AI Services (all genders)

Duales Studium BWL - Spezialisierung Artificial Intelligence (B.A.) am Campus oder virtuell

Wissenschaftliche Sachverständige / Wissenschaftlicher Sachverständiger Bild- und Videoforensik mit Schwerpunkt KI (w/m/d)

- Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Alibaba Cloud reduziert GPU-Nutzung durch neues Pooling-System drastisch" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "Alibaba Cloud reduziert GPU-Nutzung durch neues Pooling-System drastisch" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Alibaba Cloud reduziert GPU-Nutzung durch neues Pooling-System drastisch« bei Google Deutschland suchen, bei Bing oder Google News!