Studie wirft LM Arena Bevorzugung führender KI-Labore vor

BERKELEY / MÜNCHEN (IT BOLTWISE) – Eine neue Studie von Cohere, Stanford, MIT und Ai2 erhebt schwere Vorwürfe gegen LM Arena, die Organisation hinter dem beliebten KI-Benchmark Chatbot Arena. Die Studie behauptet, dass LM Arena einigen führenden KI-Unternehmen wie Meta, OpenAI, Google und Amazon geholfen habe, bessere Platzierungen auf der Rangliste zu erzielen, indem sie ihnen exklusive Testmöglichkeiten bot.

Die besten Bücher rund um KI & Robotik präsentiert von Amazon!
Unsere täglichen KI-News von IT Boltwise® bei LinkedIn abonnieren!
KI-Meldungen bequem via Telegram oder per Newsletter erhalten!
IT Boltwise® bei Facy oder Insta als Fan markieren und abonnieren!
AI Morning Podcast bei Spotify / Amazon / Apple verfolgen!
RSS-Feed 2.0 von IT Boltwise® für KI-News speichern!

Die Studie, die von Forschern von Cohere, Stanford, MIT und Ai2 durchgeführt wurde, wirft LM Arena vor, einigen der führenden KI-Unternehmen wie Meta, OpenAI, Google und Amazon bevorzugten Zugang zu Testmöglichkeiten auf der Plattform Chatbot Arena gewährt zu haben. Diese Unternehmen konnten demnach mehrere Varianten ihrer KI-Modelle privat testen und die Ergebnisse der weniger erfolgreichen Modelle verbergen, um so bessere Platzierungen auf der Rangliste zu erreichen.

Sara Hooker, Vizepräsidentin für KI-Forschung bei Cohere und Mitautorin der Studie, erklärte in einem Interview, dass nur eine Handvoll Unternehmen über die Möglichkeit privater Tests informiert wurden. Diese Praxis, so Hooker, sei eine Form der Gamification, die den Wettbewerb verzerrt. Chatbot Arena, ursprünglich als akademisches Forschungsprojekt an der UC Berkeley gestartet, hat sich zu einem wichtigen Benchmark für KI-Unternehmen entwickelt.

Die Plattform funktioniert, indem sie Antworten von zwei verschiedenen KI-Modellen nebeneinanderstellt und Benutzer auffordert, die bessere auszuwählen. Über die Zeit tragen diese Stimmen zu einem Modell-Score bei, der die Platzierung auf der Rangliste bestimmt. Während viele kommerzielle Akteure an Chatbot Arena teilnehmen, hat LM Arena stets behauptet, dass ihr Benchmark unparteiisch und fair sei.

Die Autoren der Studie, die ihre Forschung im November 2024 begannen, fanden jedoch Hinweise darauf, dass LM Arena bestimmten Unternehmen erlaubte, mehr Daten aus Chatbot Arena zu sammeln, indem ihre Modelle in einer höheren Anzahl von Modellkämpfen auftraten. Diese erhöhte Stichprobenrate verschaffte diesen Unternehmen einen unfairen Vorteil, so die Autoren.

In einer Stellungnahme wies LM Arena die Vorwürfe zurück und erklärte, dass die Studie voller Ungenauigkeiten und fragwürdiger Analysen sei. Armand Joulin von Google DeepMind kritisierte ebenfalls die Genauigkeit der Zahlen in der Studie. Hooker versprach, dass die Autoren eine Korrektur vornehmen würden.

Die Studie fordert LM Arena auf, Maßnahmen zu ergreifen, um Chatbot Arena fairer zu gestalten. Dazu gehört die Einführung eines klaren und transparenten Limits für die Anzahl privater Tests, die KI-Labore durchführen können, sowie die öffentliche Offenlegung der Ergebnisse dieser Tests. LM Arena hat diese Vorschläge jedoch abgelehnt und erklärt, dass es keinen Sinn mache, Ergebnisse für Vorabmodelle zu zeigen, die nicht öffentlich verfügbar sind.

Die Veröffentlichung der Studie erfolgt zu einem Zeitpunkt, an dem LM Arena plant, ein Unternehmen zu gründen und Kapital von Investoren zu beschaffen. Dies wirft Fragen auf, ob private Benchmark-Organisationen in der Lage sind, KI-Modelle ohne Einflussnahme von Unternehmen objektiv zu bewerten.

Hat Ihnen der Artikel bzw. die News - Studie wirft LM Arena Bevorzugung führender KI-Labore vor - gefallen? Dann abonnieren Sie uns doch auf Insta: AI News, Tech Trends & Robotics - Instagram - Boltwise

Zu den Top-Stories!

Studie wirft LM Arena Bevorzugung führender KI-Labore vor (Foto: DALL-E, IT BOLTWISE)

Folgen Sie uns

Tweet #itboltwise

Stellenangebote

DHBW Studium - Data Science und Künstliche Intelligenz

Liebherr-International Deutschland GmbH

Biberach

Praktikant*in Entwicklungsarbeit und AI-Unterstützung (Pflicht-Praktikum)

Mercedes-Benz AG

Stuttgart

Duales Studium BWL - Spezialisierung Artificial Intelligence (B.A.) am Campus oder virtuell

IU Internationale Hochschule

Hannover

Duales Studium BWL - Spezialisierung Artificial Intelligence (B.A.) am Campus oder virtuell

IU Internationale Hochschule

Stuttgart

Duales Studium BWL - Spezialisierung Artificial Intelligence (B.A.) am Campus oder virtuell

IU Internationale Hochschule

Hamburg

Doktorand*in für Promotion im Bereich UX/UI für Agentic AI gesteuerte multimodale, adaptive Interaktionskonzepte im Fahrzeug

Mercedes-Benz AG

Böblingen

Folgen Sie aktuellen Beiträge über KI & Robotik auf Twitter, Telegram, Facebook oder LinkedIn!

Hinweis: Teile dieses Textes könnten mithilfe Künstlicher Intelligenz generiert worden sein. Die auf dieser Website bereitgestellten Informationen stellen keine Finanzberatung dar und sind nicht als solche gedacht. Die Informationen sind allgemeiner Natur und dienen nur zu Informationszwecken. Wenn Sie Finanzberatung für Ihre individuelle Situation benötigen, sollten Sie den Rat von einem qualifizierten Finanzberater einholen. IT BOLTWISE® schließt jegliche Regressansprüche aus.

Diesen Artikel kommentieren

77 Bewertungen

Die nächste Stufe der Evolution: Wenn Mensch und Maschine eins werden | Wie Futurist, Tech-Visionär und Google-Chef-Ingenieur Ray Kurzweil die Zukunft der Künstlichen Intelligenz sieht

Die Zukunft von Mensch und MaschineIm neuen Buch des renommierten Zukunftsforschers und Technologie-Visionärs Ray Kurzweil wird eine faszinierende Vision der kommenden Jahre und Jahrzehnte entworfen – eine Welt, die von KI durchdrungen sein wird

135 Bewertungen

Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«

Künstliche Intelligenz: Expertenwissen gegen Hysterie Der renommierte Gehirnforscher, Psychiater und Bestseller-Autor Manfred Spitzer ist ein ausgewiesener Experte für neuronale Netze, auf denen KI aufbaut

71 Bewertungen

KI Exzellenz: Erfolgsfaktoren im Management jenseits des Hypes. Zukunftstechnologien verstehen und künstliche Intelligenz erfolgreich in der Arbeitswelt nutzen. (Haufe Fachbuch)

Obwohl Künstliche Intelligenz (KI) derzeit in aller Munde ist, setzen bislang nur wenige Unternehmen die Technologie wirklich erfolgreich ein

51 Bewertungen

Künstliche Intelligenz und Hirnforschung: Neuronale Netze, Deep Learning und die Zukunft der Kognition

Wie funktioniert Künstliche Intelligenz (KI) und gibt es Parallelen zum menschlichen Gehirn? Was sind die Gemeinsamkeiten von natürlicher und künstlicher Intelligenz, und was die Unterschiede? Ist das Gehirn nichts anderes als ein biologischer Computer? Was sind Neuronale Netze und wie kann der Begriff Deep Learning einfach erklärt werden?Seit der kognitiven Revolution Mitte des letzten Jahrhunderts sind KI und Hirnforschung eng miteinander verflochten

Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de. Da wir bei KI-erzeugten News und Inhalten selten auftretende KI-Halluzinationen nicht ausschließen können, bitten wir Sie bei Falschangaben und Fehlinformationen uns via eMail zu kontaktieren und zu informieren. Bitte vergessen Sie nicht in der eMail die Artikel-Headline zu nennen: "Studie wirft LM Arena Bevorzugung führender KI-Labore vor".

Stichwörter AI Amazon Artificial Intelligence Benchmark Chatbot Google KI Künstliche Intelligenz Lm Arena Meta OpenAI

Alle Märkte in Echtzeit verfolgen - 30 Tage kostenlos testen!

Nächster Artikel

ADT integriert Fingerabdruck-Türschloss in Nest-Sicherheitssystem

1. Mai 2025

Vorheriger Artikel

Solana: Steigende Futures-Interessen und mögliche Kursentwicklung

1. Mai 2025

Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Studie wirft LM Arena Bevorzugung führender KI-Labore vor" für unsere Leser?

Schreibe einen Kommentar Antworten abbrechen

Die aktuellen intelligenten Ringe, intelligenten Brillen, intelligenten Uhren oder KI-Smartphones auf Amazon entdecken! (Sponsored)

Es werden alle Kommentare moderiert!

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.

Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.

Du willst nichts verpassen?

Du möchtest über ähnliche News und Beiträge wie "Studie wirft LM Arena Bevorzugung führender KI-Labore vor" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.

Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Studie wirft LM Arena Bevorzugung führender KI-Labore vor« bei Google Deutschland suchen, bei Bing oder Google News!

462 Leser gerade online auf IT BOLTWISE®

KI-Schutz gegen Hacker #Sophos

Gesundheit: Berliner Charité setzt auf innovative Versorgungskonzepte

Zwei neue Projekte sollen helfen, Pflegebedürftigkeit vorzubeugen und neurologisch Erkrankte auf dem Land telemedizinisch zu versorgen. Wie die Konzepte aussehen.
Gematik: Neue Sicherheitsarchitektur für die TI

Ab 2026 beginnt die Einführung der Zero-Trust-Architektur in der TI 2.0. Sie soll Zugriffe auf Gesundheitsdaten sicherer machen – ohne die Nutzung zu erschweren.
Start-up: KI-Firma Parloa will Weltmarktführer im Kundendienst werden

Parloa ist nach einer neuen Finanzierungsrunde das zweite deutsche Einhorn 2025. Die weiteren Pläne der Gründer sind ambitioniert, Investoren bewerten sie aber als realistisch.
Start-ups: Mehr KI, Sorgen vor EU-Regulierung

Bitkom-Umfrage: 82 Prozent der Start-ups nutzen Künstliche Intelligenz – doch viele warnen vor zu viel Regulierung durch die EU.
KI-Anbieter: Aleph Alpha bekommt einen Co-CEO – Plant die Schwarz-Gruppe die Übernahme?

Bei Deutschlands prominentestem KI-Anbieter gibt es mehrere Veränderungen im Führungsteam um Mitgründer Jonas Andrulis. Besonders die Top-Personalie heizt die Spekulationen an.
Weltweiter Ausfall: Musks Starlink für mehr als zwei Stunden ausgefallen

Mit tausenden Satelliten soll das Starlink-System schnelles Internet überall auf der Welt bieten. Doch ein Software-Problem sorgte für stundenlange Probleme. Es ist nicht der erste Ausfall.
Autobauer: Neuer Gewinneinbruch verschärft Teslas Krise: Musk warnt vor „harten Quartalen“ – Aktie fällt

Der US-Autobauer leidet unter den deutlich gesunkenen Verkäufen. Analysten sehen eine Milliarden-Einnahmequelle bald versiegen. Elon Musk kündigt einen neuen „Masterplan“ an.
Ulrike Attenberger: „Man darf KI nach wie vor differenziert betrachten“

Digital-Health-Expertin Ulrike Attenberger warnt davor, der Künstlichen Intelligenz blind zu vertrauen. Diese reflektierte Haltung macht sie zu einer der Vordenkerinnen auf diesem Gebiet.
Raumfahrt: Rund 20 Prozent der Mitarbeiter sollen Nasa verlassen

Im März fiel bereits eine leitende Nasa-Wissenschaftlerin den enormen Kürzungen der Trump-Regierung zum Opfer. Jetzt soll ein bedeutender Teil der Belegschaft folgen.
Biotechnologie: „Wir können uns nicht ausmalen, was KI alles schaffen wird“

Christian Gnam ist Geschäftsführer des Innovations- und Gründerzentrums Biotechnologie (IZB) bei München. Er hat eine klare Meinung dazu, warum KI noch unterschätzt wird.

#1 Fachmagazin in Deutschland mit Fokus auf Künstliche Intelligenz und Robotik

Studie wirft LM Arena Bevorzugung führender KI-Labore vor

Junior Projektmanager (m/w/d) Customer Service & AI

Duales Studium BWL - Spezialisierung Artificial Intelligence (B.A.) am Campus oder virtuell

Junior Projektmanager Frontend & KI-Lösungen (m/w/d)

Stellenangebote

Stellenangebote

DHBW Studium - Data Science und Künstliche Intelligenz

Praktikant*in Entwicklungsarbeit und AI-Unterstützung (Pflicht-Praktikum)

Duales Studium BWL - Spezialisierung Artificial Intelligence (B.A.) am Campus oder virtuell

Duales Studium BWL - Spezialisierung Artificial Intelligence (B.A.) am Campus oder virtuell

Duales Studium BWL - Spezialisierung Artificial Intelligence (B.A.) am Campus oder virtuell

Doktorand*in für Promotion im Bereich UX/UI für Agentic AI gesteuerte multimodale, adaptive Interaktionskonzepte im Fahrzeug

Aktuelle News über «Künstliche Intelligenz» automatisch per eMail erhalten

ADT integriert Fingerabdruck-Türschloss in Nest-Sicherheitssystem

Solana: Steigende Futures-Interessen und mögliche Kursentwicklung

Schreibe einen Kommentar Antworten abbrechen

Die besten Bücher rund um KI & Robotik

Wie eine rumänische App die christliche KI weltweit bekannt machte

Adobe bringt KI-Bildgenerierung auf Smartphones

Apples Siri-Update: KI-Verbesserungen erst 2026 erwartet

Die besten KI-Gadgets auf Amazon

Sophos X-Ops: Wie Kriminelle KI nutzen – und was Unternehmen tun können

OpenAI startet KI-Datenzentrum in Norwegen zur Förderung europäischer Innovation

KI-Startup Conversion: Erfolgreiche Finanzierungsrunde und neue Perspektiven

Philips steigert Margen durch KI und sinkende Zollkosten

Meta investiert in selbstverbessernde KI-Modelle

Amazon finanziert KI-Plattform zur Erstellung eigener TV-Shows

Zuckerberg prognostiziert kognitive Vorteile durch KI-Brillen

Meta setzt auf KI-Investitionen und beeindruckt mit Quartalszahlen