BERKELEY / MÜNCHEN (IT BOLTWISE) – Eine neue Studie von Cohere, Stanford, MIT und Ai2 erhebt schwere Vorwürfe gegen LM Arena, die Organisation hinter dem beliebten KI-Benchmark Chatbot Arena. Die Studie behauptet, dass LM Arena einigen führenden KI-Unternehmen wie Meta, OpenAI, Google und Amazon geholfen habe, bessere Platzierungen auf der Rangliste zu erzielen, indem sie ihnen exklusive Testmöglichkeiten bot.

Die Studie, die von Forschern von Cohere, Stanford, MIT und Ai2 durchgeführt wurde, wirft LM Arena vor, einigen der führenden KI-Unternehmen wie Meta, OpenAI, Google und Amazon bevorzugten Zugang zu Testmöglichkeiten auf der Plattform Chatbot Arena gewährt zu haben. Diese Unternehmen konnten demnach mehrere Varianten ihrer KI-Modelle privat testen und die Ergebnisse der weniger erfolgreichen Modelle verbergen, um so bessere Platzierungen auf der Rangliste zu erreichen.

Sara Hooker, Vizepräsidentin für KI-Forschung bei Cohere und Mitautorin der Studie, erklärte in einem Interview, dass nur eine Handvoll Unternehmen über die Möglichkeit privater Tests informiert wurden. Diese Praxis, so Hooker, sei eine Form der Gamification, die den Wettbewerb verzerrt. Chatbot Arena, ursprünglich als akademisches Forschungsprojekt an der UC Berkeley gestartet, hat sich zu einem wichtigen Benchmark für KI-Unternehmen entwickelt.

Die Plattform funktioniert, indem sie Antworten von zwei verschiedenen KI-Modellen nebeneinanderstellt und Benutzer auffordert, die bessere auszuwählen. Über die Zeit tragen diese Stimmen zu einem Modell-Score bei, der die Platzierung auf der Rangliste bestimmt. Während viele kommerzielle Akteure an Chatbot Arena teilnehmen, hat LM Arena stets behauptet, dass ihr Benchmark unparteiisch und fair sei.

Die Autoren der Studie, die ihre Forschung im November 2024 begannen, fanden jedoch Hinweise darauf, dass LM Arena bestimmten Unternehmen erlaubte, mehr Daten aus Chatbot Arena zu sammeln, indem ihre Modelle in einer höheren Anzahl von Modellkämpfen auftraten. Diese erhöhte Stichprobenrate verschaffte diesen Unternehmen einen unfairen Vorteil, so die Autoren.

In einer Stellungnahme wies LM Arena die Vorwürfe zurück und erklärte, dass die Studie voller Ungenauigkeiten und fragwürdiger Analysen sei. Armand Joulin von Google DeepMind kritisierte ebenfalls die Genauigkeit der Zahlen in der Studie. Hooker versprach, dass die Autoren eine Korrektur vornehmen würden.

Die Studie fordert LM Arena auf, Maßnahmen zu ergreifen, um Chatbot Arena fairer zu gestalten. Dazu gehört die Einführung eines klaren und transparenten Limits für die Anzahl privater Tests, die KI-Labore durchführen können, sowie die öffentliche Offenlegung der Ergebnisse dieser Tests. LM Arena hat diese Vorschläge jedoch abgelehnt und erklärt, dass es keinen Sinn mache, Ergebnisse für Vorabmodelle zu zeigen, die nicht öffentlich verfügbar sind.

Die Veröffentlichung der Studie erfolgt zu einem Zeitpunkt, an dem LM Arena plant, ein Unternehmen zu gründen und Kapital von Investoren zu beschaffen. Dies wirft Fragen auf, ob private Benchmark-Organisationen in der Lage sind, KI-Modelle ohne Einflussnahme von Unternehmen objektiv zu bewerten.

Unseren KI-Morning-Newsletter «Der KI News Espresso» mit den besten KI-News des letzten Tages gratis per eMail - ohne Werbung: Hier kostenlos eintragen!


Studie wirft LM Arena Bevorzugung führender KI-Labore vor
Studie wirft LM Arena Bevorzugung führender KI-Labore vor (Foto: DALL-E, IT BOLTWISE)



Folgen Sie aktuellen Beiträge über KI & Robotik auf Twitter, Telegram, Facebook oder LinkedIn!
Hinweis: Teile dieses Textes könnten mithilfe Künstlicher Intelligenz generiert worden sein. Die auf dieser Website bereitgestellten Informationen stellen keine Finanzberatung dar und sind nicht als solche gedacht. Die Informationen sind allgemeiner Natur und dienen nur zu Informationszwecken. Wenn Sie Finanzberatung für Ihre individuelle Situation benötigen, sollten Sie den Rat von einem qualifizierten Finanzberater einholen. IT BOLTWISE® schließt jegliche Regressansprüche aus.








Die nächste Stufe der Evolution: Wenn Mensch und Maschine eins werden | Wie Futurist, Tech-Visionär und Google-Chef-Ingenieur Ray Kurzweil die Zukunft der Künstlichen Intelligenz sieht
61 Bewertungen
Die nächste Stufe der Evolution: Wenn Mensch und Maschine eins werden | Wie Futurist, Tech-Visionär und Google-Chef-Ingenieur Ray Kurzweil die Zukunft der Künstlichen Intelligenz sieht
  • Die Zukunft von Mensch und MaschineIm neuen Buch des renommierten Zukunftsforschers und Technologie-Visionärs Ray Kurzweil wird eine faszinierende Vision der kommenden Jahre und Jahrzehnte entworfen – eine Welt, die von KI durchdrungen sein wird
Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«
129 Bewertungen
Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«
  • Künstliche Intelligenz: Expertenwissen gegen Hysterie Der renommierte Gehirnforscher, Psychiater und Bestseller-Autor Manfred Spitzer ist ein ausgewiesener Experte für neuronale Netze, auf denen KI aufbaut
KI Exzellenz: Erfolgsfaktoren im Management jenseits des Hypes. Zukunftstechnologien verstehen und künstliche Intelligenz erfolgreich in der Arbeitswelt nutzen. (Haufe Fachbuch)
71 Bewertungen
KI Exzellenz: Erfolgsfaktoren im Management jenseits des Hypes. Zukunftstechnologien verstehen und künstliche Intelligenz erfolgreich in der Arbeitswelt nutzen. (Haufe Fachbuch)
  • Obwohl Künstliche Intelligenz (KI) derzeit in aller Munde ist, setzen bislang nur wenige Unternehmen die Technologie wirklich erfolgreich ein
Künstliche Intelligenz und Hirnforschung: Neuronale Netze, Deep Learning und die Zukunft der Kognition
43 Bewertungen
Künstliche Intelligenz und Hirnforschung: Neuronale Netze, Deep Learning und die Zukunft der Kognition
  • Wie funktioniert Künstliche Intelligenz (KI) und gibt es Parallelen zum menschlichen Gehirn? Was sind die Gemeinsamkeiten von natürlicher und künstlicher Intelligenz, und was die Unterschiede? Ist das Gehirn nichts anderes als ein biologischer Computer? Was sind Neuronale Netze und wie kann der Begriff Deep Learning einfach erklärt werden?Seit der kognitiven Revolution Mitte des letzten Jahrhunderts sind KI und Hirnforschung eng miteinander verflochten

Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de. Da wir bei KI-erzeugten News und Inhalten selten auftretende KI-Halluzinationen nicht ausschließen können, bitten wir Sie bei Falschangaben und Fehlinformationen uns via eMail zu kontaktieren und zu informieren. Bitte vergessen Sie nicht in der eMail die Artikel-Headline zu nennen: "Studie wirft LM Arena Bevorzugung führender KI-Labore vor".
Stichwörter AI Amazon Artificial Intelligence Benchmark Chatbot Google KI Künstliche Intelligenz Lm Arena Meta OpenAI
Alle Märkte in Echtzeit verfolgen - 30 Tage kostenlos testen!

Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Studie wirft LM Arena Bevorzugung führender KI-Labore vor" für unsere Leser?

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

  • Die aktuellen intelligenten Ringe, intelligenten Brillen, intelligenten Uhren oder KI-Smartphones auf Amazon entdecken! (Sponsored)


  • Es werden alle Kommentare moderiert!

    Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.

    Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.

    Du willst nichts verpassen?

    Du möchtest über ähnliche News und Beiträge wie "Studie wirft LM Arena Bevorzugung führender KI-Labore vor" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
    Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Studie wirft LM Arena Bevorzugung führender KI-Labore vor« bei Google Deutschland suchen, bei Bing oder Google News!

    585 Leser gerade online auf IT BOLTWISE®
    KI-Jobs