MENLO PARK / MÜNCHEN (IT BOLTWISE) – Meta hat in Zusammenarbeit mit Cerebras Systems eine neue Ära der KI-Inferenz eingeleitet. Die Einführung der Llama API verspricht eine bis zu 18-fache Geschwindigkeitssteigerung im Vergleich zu herkömmlichen GPU-basierten Lösungen und markiert Metas Eintritt in den kommerziellen KI-Infrastrukturmarkt.
Meta hat kürzlich eine bedeutende Partnerschaft mit Cerebras Systems bekannt gegeben, um seine neue Llama API zu betreiben. Diese Kooperation ermöglicht es Entwicklern, Inferenzgeschwindigkeiten zu erreichen, die bis zu 18-mal schneller sind als herkömmliche GPU-basierte Lösungen. Die Ankündigung erfolgte auf der ersten LlamaCon Entwicklerkonferenz in Menlo Park und positioniert Meta als ernstzunehmenden Konkurrenten zu OpenAI, Anthropic und Google im wachsenden Markt für KI-Inferenzdienste.
Durch die Nutzung der spezialisierten KI-Chips von Cerebras kann die Llama API über 2.600 Tokens pro Sekunde verarbeiten, was einen erheblichen Vorteil gegenüber den etwa 130 Tokens pro Sekunde von ChatGPT darstellt. Diese Geschwindigkeit eröffnet neue Möglichkeiten für Anwendungen, die bisher aufgrund von Latenzproblemen nicht praktikabel waren, wie Echtzeit-Agenten und interaktive Code-Generierung.
Die Partnerschaft mit Cerebras markiert Metas formellen Einstieg in den Verkauf von KI-Rechenleistung. Während die Llama-Modelle von Meta bereits über eine Milliarde Downloads verzeichnet haben, bietet das Unternehmen nun erstmals eine eigene Cloud-Infrastruktur an, um Entwicklern den Aufbau von Anwendungen zu erleichtern.
James Wang von Cerebras betonte, dass die Geschwindigkeit der Llama API neue Kategorien von Anwendungen ermöglicht, die zuvor undenkbar waren. Dies umfasst unter anderem Echtzeit-Agenten und sofortige mehrstufige Schlussfolgerungen, die nun in Sekunden statt Minuten abgeschlossen werden können.
Meta plant, mit der Llama API nicht nur eine neue Einnahmequelle zu erschließen, sondern auch seine Investitionen in offene Modelle zu monetarisieren. Entwicklern wird die Möglichkeit geboten, ihre Modelle zu verfeinern und zu evaluieren, wobei Meta versichert, keine Kundendaten für das Training eigener Modelle zu verwenden.
Die Infrastruktur für diesen Dienst wird von Cerebras über ein Netzwerk von Rechenzentren in Nordamerika bereitgestellt. Diese strategische Partnerschaft folgt dem klassischen Modell eines Compute-Anbieters für einen Hyperscaler, ähnlich wie NVIDIA Hardware an große Cloud-Anbieter liefert.
Zusätzlich zur Partnerschaft mit Cerebras hat Meta auch eine Zusammenarbeit mit Groq angekündigt, um Entwicklern weitere schnelle Inferenzoptionen zu bieten. Diese strategischen Schritte könnten die bestehende Marktordnung, die von OpenAI, Google und Anthropic dominiert wird, erheblich stören.
Für Cerebras stellt die Partnerschaft mit Meta einen wichtigen Meilenstein dar und bestätigt den Ansatz, spezialisierte KI-Hardware zu entwickeln. Die Llama API ist derzeit in einer begrenzten Vorschau verfügbar, und Meta plant eine breitere Einführung in den kommenden Wochen.
Die Wahl von Meta für spezialisierte Siliziumlösungen signalisiert eine tiefgreifende Veränderung: In der nächsten Phase der KI geht es nicht nur darum, was Modelle wissen, sondern wie schnell sie denken können. Geschwindigkeit ist nicht nur ein Merkmal, sondern der zentrale Punkt.
- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- Service Directory für AI Adult Services erkunden!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote

Software-Entwickler/in Ferndiagnose KI künstliche Intellegenz (m/w/d)

Abschlussarbeit (Bachelor / Master) im Bereich Datenmanagement: Störungsanalysekonzept mit Hilfe von KI

Teamassistenz - Internal Audit IT, AI & Corporate Affairs (m/w/d)

KI-Ingenieur (m/w/d) mit Schwerpunkt Infrastruktur

- Die Zukunft von Mensch und MaschineIm neuen Buch des renommierten Zukunftsforschers und Technologie-Visionärs Ray Kurzweil wird eine faszinierende Vision der kommenden Jahre und Jahrzehnte entworfen – eine Welt, die von KI durchdrungen sein wird
- Künstliche Intelligenz: Expertenwissen gegen Hysterie Der renommierte Gehirnforscher, Psychiater und Bestseller-Autor Manfred Spitzer ist ein ausgewiesener Experte für neuronale Netze, auf denen KI aufbaut
- Obwohl Künstliche Intelligenz (KI) derzeit in aller Munde ist, setzen bislang nur wenige Unternehmen die Technologie wirklich erfolgreich ein
- Wie funktioniert Künstliche Intelligenz (KI) und gibt es Parallelen zum menschlichen Gehirn? Was sind die Gemeinsamkeiten von natürlicher und künstlicher Intelligenz, und was die Unterschiede? Ist das Gehirn nichts anderes als ein biologischer Computer? Was sind Neuronale Netze und wie kann der Begriff Deep Learning einfach erklärt werden?Seit der kognitiven Revolution Mitte des letzten Jahrhunderts sind KI und Hirnforschung eng miteinander verflochten
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Meta und Cerebras: Neue Maßstäbe in der KI-Inferenz" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "Meta und Cerebras: Neue Maßstäbe in der KI-Inferenz" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Meta und Cerebras: Neue Maßstäbe in der KI-Inferenz« bei Google Deutschland suchen, bei Bing oder Google News!