OpenAI's GPT-5 erreicht menschliches Niveau in vielen Berufen

SAN FRANCISCO / LONDON (IT BOLTWISE) – OpenAI hat mit seinem neuen Benchmark GDPval die Leistungsfähigkeit seiner KI-Modelle im Vergleich zu menschlichen Fachleuten in verschiedenen Branchen getestet. Die Ergebnisse zeigen, dass GPT-5 und Anthropic’s Claude Opus 4.1 in vielen Aufgaben bereits mit Experten mithalten können.

Heutige Tagesdeals bei Amazon! ˗ˋˏ$ˎˊ˗

Die besten Bücher rund um KI & Robotik präsentiert von Amazon!
Unsere täglichen KI-News von IT Boltwise® bei LinkedIn abonnieren!
KI-Meldungen bequem via Telegram oder per Newsletter erhalten!
IT Boltwise® bei Facy oder Insta als Fan markieren und abonnieren!
AI Morning Podcast bei Spotify / Amazon / Apple verfolgen!
RSS-Feed 2.0 von IT Boltwise® für KI-News speichern!

OpenAI hat kürzlich einen neuen Benchmark namens GDPval vorgestellt, der die Leistung seiner KI-Modelle im Vergleich zu menschlichen Fachleuten in verschiedenen Branchen bewertet. Dieser Test ist ein früher Versuch, zu verstehen, wie nah OpenAI’s Systeme daran sind, Menschen in wirtschaftlich wertvollen Arbeiten zu übertreffen, was ein wesentlicher Bestandteil der Mission des Unternehmens zur Entwicklung einer allgemeinen Künstlichen Intelligenz (AGI) ist.

Der Benchmark umfasst neun Industrien, die maßgeblich zum Bruttoinlandsprodukt der USA beitragen, darunter Bereiche wie Gesundheitswesen, Finanzen, Fertigung und Regierung. Die Leistung der KI-Modelle wird in 44 Berufen innerhalb dieser Industrien getestet, von Software-Ingenieuren über Krankenschwestern bis hin zu Journalisten.

In der ersten Version des Tests, GDPval-v0, wurden erfahrene Fachleute gebeten, von KI generierte Berichte mit denen anderer Fachleute zu vergleichen und das beste auszuwählen. Beispielsweise wurden Investmentbanker aufgefordert, eine Wettbewerbslandschaft für die letzte Meile der Lieferindustrie zu erstellen und diese mit KI-generierten Berichten zu vergleichen. OpenAI ermittelt dann die “Gewinnrate” eines KI-Modells im Vergleich zu menschlichen Berichten über alle 44 Berufe hinweg.

Für das Modell GPT-5-high, eine leistungsstärkere Version von GPT-5, gibt OpenAI an, dass das KI-Modell in 40,6% der Fälle als besser oder gleichwertig mit Branchenexperten bewertet wurde. Auch das Modell Claude Opus 4.1 von Anthropic wurde getestet und in 49% der Aufgaben als besser oder gleichwertig mit Branchenexperten eingestuft. OpenAI vermutet, dass Claude so hoch bewertet wurde, weil es dazu neigt, ansprechende Grafiken zu erstellen, anstatt durch reine Leistung zu überzeugen.

Es ist wichtig zu beachten, dass die meisten Berufstätigen weit mehr tun, als nur Forschungsberichte an ihren Chef zu übermitteln, was alles ist, was GDPval-v0 testet. OpenAI erkennt dies an und plant, in Zukunft robustere Tests zu entwickeln, die mehr Industrien und interaktive Arbeitsabläufe berücksichtigen können.

Dennoch sieht das Unternehmen den Fortschritt bei GDPval als bemerkenswert an. In einem Interview erklärte Dr. Aaron Chatterji, Chefökonom von OpenAI, dass die Ergebnisse von GDPval darauf hindeuten, dass Menschen in diesen Berufen nun KI-Modelle nutzen können, um mehr Zeit für bedeutungsvollere Aufgaben zu haben.

Tejal Patwardhan, Leiterin der Evaluierungen bei OpenAI, zeigt sich ermutigt von der Fortschrittsrate bei GDPval. Das GPT-4o-Modell von OpenAI erzielte vor etwa 15 Monaten nur 13,7% (Gewinne und Unentschieden gegenüber Menschen). Jetzt erreicht GPT-5 fast das Dreifache, ein Trend, den Patwardhan erwartet, dass er sich fortsetzt.

In der Tech-Branche gibt es eine Vielzahl von Benchmarks, um den Fortschritt von KI-Modellen zu messen und zu bewerten, ob ein bestimmtes Modell dem Stand der Technik entspricht. Zu den beliebtesten gehören AIME 2025 (ein Test von Wettbewerbs-Mathematikproblemen) und GPQA Diamond (ein Test von Wissenschaftsfragen auf PhD-Niveau). Allerdings nähern sich mehrere KI-Modelle bei einigen dieser Benchmarks der Sättigung, und viele KI-Forscher haben den Bedarf an besseren Tests geäußert, die die Kompetenz von KI bei realen Aufgaben messen können. Benchmarks wie GDPval könnten in diesem Gespräch zunehmend an Bedeutung gewinnen, da OpenAI argumentiert, dass seine KI-Modelle für eine Vielzahl von Industrien wertvoll sind.

*Amazon-Kreditkarte ohne Jahresgebühr mit 2.000 Euro Verfügungsrahmen bestellen! a‿z

🤖 Alle KI-Gadgets auf Amazon ansehen!

Bestseller Nr. 1 ᵃ⤻ᶻ «KI Gadgets»

Apple AirTag - Finde und behalte Deine Sachen im Blick: Schlüssel, Geldbörsen, Gepäck, Rucksäcke und mehr. Einfaches Einrichten mit iPhone oder iPad. Austauschbare Batterie

30,99 EUR

Bestseller Nr. 2 ᵃ⤻ᶻ «KI Gadgets»

Vikye KI -Roboter Angetrieben von Deepseek, Smart Talking Desk Companion mit 1,28 "Bildschirm, Sprachsteuerung, WLAN -Wetteruhr und Bluetooth Music Player

30,50 EUR

Bestseller Nr. 3 ᵃ⤻ᶻ «KI Gadgets»

ZOOI Geschenke für Männer, Geburtstagsgeschenk für Männer, Gadgets für Männer, Geschenke für Papa Geschenk Männergeschenk Adventskalender Füllung Männer, Bluetooth Lautsprecher mit Handyständer

20,99 EUR

Bestseller Nr. 4 ᵃ⤻ᶻ «KI Gadgets»

QCOQ® Air Tags 4er Pack Schwarz, Schlüsselfinder & Air Tracker Tagg Kompatibel mit Apple Wo ist? App (Nur iOS), Smart Key Finder mit Schlüsselband, Koffer-Tracker für Taschen/Keys, Austauschbarer Akku

36,99 EUR

Bestseller Nr. 5 ᵃ⤻ᶻ «KI Gadgets»

EIlik - Ein Desktop-Begleitroboter mit emotionaler Intelligenz, Multi-Roboter-Interaktionen, Desktop-Robotik-Partner

169,00 EUR

Hat Ihnen der Artikel bzw. die News - OpenAI’s GPT-5 erreicht menschliches Niveau in vielen Berufen - gefallen? Dann abonnieren Sie uns doch auf Insta: AI News, Tech Trends & Robotics - Instagram - Boltwise

Zu den Top-Stories!

OpenAI’s GPT-5 erreicht menschliches Niveau in vielen Berufen (Foto: DALL-E, IT BOLTWISE)

Folgen Sie uns

Tweet #itboltwise

Stellenangebote

Student*in für Abschlussarbeit für die Entwicklung eines KI-gestützten Tools zur Generierung von Interieurdesigns

Mercedes-Benz AG

Sindelfingen

Folgen Sie aktuellen Beiträge über KI & Robotik auf Twitter, Telegram, Facebook oder LinkedIn!

Hinweis: Teile dieses Textes könnten mithilfe Künstlicher Intelligenz generiert worden sein. Die auf dieser Website bereitgestellten Informationen stellen keine Finanzberatung dar und sind nicht als solche gedacht. Die Informationen sind allgemeiner Natur und dienen nur zu Informationszwecken. Wenn Sie Finanzberatung für Ihre individuelle Situation benötigen, sollten Sie den Rat von einem qualifizierten Finanzberater einholen. IT BOLTWISE® schließt jegliche Regressansprüche aus.

Diesen Artikel kommentieren

Die nächste Stufe der Evolution: Wenn Mensch und Maschine eins werden | Wie Futurist, Tech-Visionär und Google-Chef-Ingenieur Ray Kurzweil die Zukunft der Künstlichen Intelligenz sieht

Die nächste Stufe der Evolution

Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«

Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«

KI Exzellenz: Erfolgsfaktoren im Management jenseits des Hypes. Zukunftstechnologien verstehen und künstliche Intelligenz erfolgreich in der Arbeitswelt nutzen. (Haufe Fachbuch)

Odoi, Tawia(Autor)

Künstliche Intelligenz und Hirnforschung: Neuronale Netze, Deep Learning und die Zukunft der Kognition

Krauss, Patrick(Autor)

Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de. Da wir bei KI-erzeugten News und Inhalten selten auftretende KI-Halluzinationen nicht ausschließen können, bitten wir Sie bei Falschangaben und Fehlinformationen uns via eMail zu kontaktieren und zu informieren. Bitte vergessen Sie nicht in der eMail die Artikel-Headline zu nennen: "OpenAI’s GPT-5 erreicht menschliches Niveau in vielen Berufen".

Stichwörter AI Arbeitsmarkt Artificial Intelligence Benchmark Gpt5 KI Künstliche Intelligenz Modelle Wirtschaft

Alle Märkte in Echtzeit verfolgen - 30 Tage kostenlos testen!

Nächster Artikel

Merz plant Nutzung russischer Vermögenswerte für Ukraine-Kredit

25. September 2025

Vorheriger Artikel

Flexport optimiert Zollrückerstattungen mit neuer Technologie

25. September 2025

Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "OpenAI’s GPT-5 erreicht menschliches Niveau in vielen Berufen" für unsere Leser?

Schreibe einen Kommentar Antworten abbrechen

Die aktuellen intelligenten Ringe, intelligenten Brillen, intelligenten Uhren oder KI-Smartphones auf Amazon entdecken! (Sponsored)

Es werden alle Kommentare moderiert!

Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.

Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.

Du willst nichts verpassen?

Du möchtest über ähnliche News und Beiträge wie "OpenAI’s GPT-5 erreicht menschliches Niveau in vielen Berufen" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.

Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »OpenAI’s GPT-5 erreicht menschliches Niveau in vielen Berufen« bei Google Deutschland suchen, bei Bing oder Google News!

474 Leser gerade online auf IT BOLTWISE®