SAN FRANCISCO / LONDON (IT BOLTWISE) – OpenAI hat mit seinem neuen Benchmark GDPval die Leistungsfähigkeit seiner KI-Modelle im Vergleich zu menschlichen Fachleuten in verschiedenen Branchen getestet. Die Ergebnisse zeigen, dass GPT-5 und Anthropic’s Claude Opus 4.1 in vielen Aufgaben bereits mit Experten mithalten können.

 Heutige Tagesdeals bei Amazon!  ˗ˋˏ$ˎˊ˗

OpenAI hat kürzlich einen neuen Benchmark namens GDPval vorgestellt, der die Leistung seiner KI-Modelle im Vergleich zu menschlichen Fachleuten in verschiedenen Branchen bewertet. Dieser Test ist ein früher Versuch, zu verstehen, wie nah OpenAI’s Systeme daran sind, Menschen in wirtschaftlich wertvollen Arbeiten zu übertreffen, was ein wesentlicher Bestandteil der Mission des Unternehmens zur Entwicklung einer allgemeinen Künstlichen Intelligenz (AGI) ist.

Der Benchmark umfasst neun Industrien, die maßgeblich zum Bruttoinlandsprodukt der USA beitragen, darunter Bereiche wie Gesundheitswesen, Finanzen, Fertigung und Regierung. Die Leistung der KI-Modelle wird in 44 Berufen innerhalb dieser Industrien getestet, von Software-Ingenieuren über Krankenschwestern bis hin zu Journalisten.

In der ersten Version des Tests, GDPval-v0, wurden erfahrene Fachleute gebeten, von KI generierte Berichte mit denen anderer Fachleute zu vergleichen und das beste auszuwählen. Beispielsweise wurden Investmentbanker aufgefordert, eine Wettbewerbslandschaft für die letzte Meile der Lieferindustrie zu erstellen und diese mit KI-generierten Berichten zu vergleichen. OpenAI ermittelt dann die “Gewinnrate” eines KI-Modells im Vergleich zu menschlichen Berichten über alle 44 Berufe hinweg.

Für das Modell GPT-5-high, eine leistungsstärkere Version von GPT-5, gibt OpenAI an, dass das KI-Modell in 40,6% der Fälle als besser oder gleichwertig mit Branchenexperten bewertet wurde. Auch das Modell Claude Opus 4.1 von Anthropic wurde getestet und in 49% der Aufgaben als besser oder gleichwertig mit Branchenexperten eingestuft. OpenAI vermutet, dass Claude so hoch bewertet wurde, weil es dazu neigt, ansprechende Grafiken zu erstellen, anstatt durch reine Leistung zu überzeugen.

Es ist wichtig zu beachten, dass die meisten Berufstätigen weit mehr tun, als nur Forschungsberichte an ihren Chef zu übermitteln, was alles ist, was GDPval-v0 testet. OpenAI erkennt dies an und plant, in Zukunft robustere Tests zu entwickeln, die mehr Industrien und interaktive Arbeitsabläufe berücksichtigen können.

Dennoch sieht das Unternehmen den Fortschritt bei GDPval als bemerkenswert an. In einem Interview erklärte Dr. Aaron Chatterji, Chefökonom von OpenAI, dass die Ergebnisse von GDPval darauf hindeuten, dass Menschen in diesen Berufen nun KI-Modelle nutzen können, um mehr Zeit für bedeutungsvollere Aufgaben zu haben.

Tejal Patwardhan, Leiterin der Evaluierungen bei OpenAI, zeigt sich ermutigt von der Fortschrittsrate bei GDPval. Das GPT-4o-Modell von OpenAI erzielte vor etwa 15 Monaten nur 13,7% (Gewinne und Unentschieden gegenüber Menschen). Jetzt erreicht GPT-5 fast das Dreifache, ein Trend, den Patwardhan erwartet, dass er sich fortsetzt.

In der Tech-Branche gibt es eine Vielzahl von Benchmarks, um den Fortschritt von KI-Modellen zu messen und zu bewerten, ob ein bestimmtes Modell dem Stand der Technik entspricht. Zu den beliebtesten gehören AIME 2025 (ein Test von Wettbewerbs-Mathematikproblemen) und GPQA Diamond (ein Test von Wissenschaftsfragen auf PhD-Niveau). Allerdings nähern sich mehrere KI-Modelle bei einigen dieser Benchmarks der Sättigung, und viele KI-Forscher haben den Bedarf an besseren Tests geäußert, die die Kompetenz von KI bei realen Aufgaben messen können. Benchmarks wie GDPval könnten in diesem Gespräch zunehmend an Bedeutung gewinnen, da OpenAI argumentiert, dass seine KI-Modelle für eine Vielzahl von Industrien wertvoll sind.

*Amazon-Kreditkarte ohne Jahresgebühr mit 2.000 Euro Verfügungsrahmen bestellen! a‿z




Hat Ihnen der Artikel bzw. die News - OpenAI’s GPT-5 erreicht menschliches Niveau in vielen Berufen - gefallen? Dann abonnieren Sie uns doch auf Insta: AI News, Tech Trends & Robotics - Instagram - Boltwise

Unseren KI-Morning-Newsletter «Der KI News Espresso» mit den besten KI-News des letzten Tages gratis per eMail - ohne Werbung: Hier kostenlos eintragen!


OpenAI’s GPT-5 erreicht menschliches Niveau in vielen Berufen
OpenAI’s GPT-5 erreicht menschliches Niveau in vielen Berufen (Foto: DALL-E, IT BOLTWISE)



Folgen Sie aktuellen Beiträge über KI & Robotik auf Twitter, Telegram, Facebook oder LinkedIn!
Hinweis: Teile dieses Textes könnten mithilfe Künstlicher Intelligenz generiert worden sein. Die auf dieser Website bereitgestellten Informationen stellen keine Finanzberatung dar und sind nicht als solche gedacht. Die Informationen sind allgemeiner Natur und dienen nur zu Informationszwecken. Wenn Sie Finanzberatung für Ihre individuelle Situation benötigen, sollten Sie den Rat von einem qualifizierten Finanzberater einholen. IT BOLTWISE® schließt jegliche Regressansprüche aus.









Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de. Da wir bei KI-erzeugten News und Inhalten selten auftretende KI-Halluzinationen nicht ausschließen können, bitten wir Sie bei Falschangaben und Fehlinformationen uns via eMail zu kontaktieren und zu informieren. Bitte vergessen Sie nicht in der eMail die Artikel-Headline zu nennen: "OpenAI’s GPT-5 erreicht menschliches Niveau in vielen Berufen".
Stichwörter AI Arbeitsmarkt Artificial Intelligence Benchmark Gpt5 KI Künstliche Intelligenz Modelle Wirtschaft
Alle Märkte in Echtzeit verfolgen - 30 Tage kostenlos testen!

Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "OpenAI’s GPT-5 erreicht menschliches Niveau in vielen Berufen" für unsere Leser?

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

  • Die aktuellen intelligenten Ringe, intelligenten Brillen, intelligenten Uhren oder KI-Smartphones auf Amazon entdecken! (Sponsored)


  • Es werden alle Kommentare moderiert!

    Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.

    Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.

    Du willst nichts verpassen?

    Du möchtest über ähnliche News und Beiträge wie "OpenAI’s GPT-5 erreicht menschliches Niveau in vielen Berufen" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
    Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »OpenAI’s GPT-5 erreicht menschliches Niveau in vielen Berufen« bei Google Deutschland suchen, bei Bing oder Google News!

    474 Leser gerade online auf IT BOLTWISE®
    KI-Jobs