SEOUL / LONDON (IT BOLTWISE) – Alibaba Cloud hat ein neues Pooling-System namens Aegaeon entwickelt, das die Nutzung von NVIDIA-GPUs um 82 % reduziert. Diese Innovation ermöglicht es, dass 213 GPUs die Leistung von 1.192 GPUs erbringen, was insbesondere in Märkten mit begrenztem Zugang zu moderner Hardware von Bedeutung ist.

 Heutige Tagesdeals bei Amazon!  ˗ˋˏ$ˎˊ˗

Alibaba Cloud hat mit seinem neuen Aegaeon-Pooling-System einen bedeutenden Fortschritt in der effizienten Nutzung von NVIDIA-GPUs erzielt. Während eines mehrmonatigen Beta-Tests im Model Studio Marketplace konnte die Anzahl der benötigten GPUs um 82 % reduziert werden. Diese Entwicklung ist besonders relevant in Märkten wie China, wo der Zugang zu den neuesten NVIDIA H20-GPUs aufgrund von Exportbeschränkungen eingeschränkt ist.

Im Gegensatz zu herkömmlichen Trainingsmethoden, die auf Modellqualität oder Geschwindigkeit abzielen, konzentriert sich Aegaeon auf die Optimierung der GPU-Auslastung während der Inferenzzeit. Durch die Virtualisierung des GPU-Zugriffs auf Token-Ebene kann das System winzige Arbeitseinheiten über einen gemeinsamen Pool verteilen. Dies ermöglicht es einer einzigen H20-GPU, mehrere Modelle gleichzeitig zu bedienen, was die effektive Leistung um das bis zu Neunfache im Vergleich zu älteren serverlosen Systemen steigert.

Die Tests wurden in Zusammenarbeit mit der Peking-Universität durchgeführt und zeigten, dass die Anzahl der benötigten GPUs zur Unterstützung verschiedener großer Sprachmodelle von 1.192 auf nur 213 gesenkt werden konnte. Die Ergebnisse wurden auf dem ACM Symposium on Operating Systems (SOSP) 2025 in Seoul vorgestellt. Die Haupttechniken, die zu diesen Einsparungen führten, waren das Packen mehrerer Modelle pro GPU und die dynamische Zuweisung von Rechenleistung auf Token-Ebene.

Obwohl die Ergebnisse beeindruckend sind, bleibt abzuwarten, ob sie auch außerhalb der Alibaba-Umgebung reproduzierbar sind. Alibaba Cloud nutzt eine eigene eRDMA-Netzwerkinfrastruktur, die möglicherweise entscheidend für die erzielten Ergebnisse ist. Dennoch könnten andere große Cloud-Anbieter an dieser Technologie interessiert sein, um ihre begrenzten GPU-Ressourcen besser auszunutzen, da die Nachfrage nach Inferenzkapazitäten weiter steigt.

*Amazon-Kreditkarte ohne Jahresgebühr mit 2.000 Euro Verfügungsrahmen bestellen! a‿z




Hat Ihnen der Artikel bzw. die News - Alibaba Cloud reduziert GPU-Nutzung durch neues Pooling-System drastisch - gefallen? Dann abonnieren Sie uns doch auf Insta: AI News, Tech Trends & Robotics - Instagram - Boltwise

Unseren KI-Morning-Newsletter «Der KI News Espresso» mit den besten KI-News des letzten Tages gratis per eMail - ohne Werbung: Hier kostenlos eintragen!


Alibaba Cloud reduziert GPU-Nutzung durch neues Pooling-System drastisch
Alibaba Cloud reduziert GPU-Nutzung durch neues Pooling-System drastisch (Foto: DALL-E, IT BOLTWISE)



Folgen Sie aktuellen Beiträge über KI & Robotik auf Twitter, Telegram, Facebook oder LinkedIn!
Hinweis: Teile dieses Textes könnten mithilfe Künstlicher Intelligenz generiert worden sein. Die auf dieser Website bereitgestellten Informationen stellen keine Finanzberatung dar und sind nicht als solche gedacht. Die Informationen sind allgemeiner Natur und dienen nur zu Informationszwecken. Wenn Sie Finanzberatung für Ihre individuelle Situation benötigen, sollten Sie den Rat von einem qualifizierten Finanzberater einholen. IT BOLTWISE® schließt jegliche Regressansprüche aus.









Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de. Da wir bei KI-erzeugten News und Inhalten selten auftretende KI-Halluzinationen nicht ausschließen können, bitten wir Sie bei Falschangaben und Fehlinformationen uns via eMail zu kontaktieren und zu informieren. Bitte vergessen Sie nicht in der eMail die Artikel-Headline zu nennen: "Alibaba Cloud reduziert GPU-Nutzung durch neues Pooling-System drastisch".
Stichwörter AI Alibaba Artificial Intelligence Cloud GPU Inferenz KI Künstliche Intelligenz Nvidia Pooling
Alle Märkte in Echtzeit verfolgen - 30 Tage kostenlos testen!

Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Alibaba Cloud reduziert GPU-Nutzung durch neues Pooling-System drastisch" für unsere Leser?

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

  • Die aktuellen intelligenten Ringe, intelligenten Brillen, intelligenten Uhren oder KI-Smartphones auf Amazon entdecken! (Sponsored)


  • Es werden alle Kommentare moderiert!

    Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.

    Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.

    Du willst nichts verpassen?

    Du möchtest über ähnliche News und Beiträge wie "Alibaba Cloud reduziert GPU-Nutzung durch neues Pooling-System drastisch" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
    Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Alibaba Cloud reduziert GPU-Nutzung durch neues Pooling-System drastisch« bei Google Deutschland suchen, bei Bing oder Google News!

    967 Leser gerade online auf IT BOLTWISE®
    KI-Jobs