“Reward Hacking” – Google DeepMind entwickelt neue Strategie zur Verbesserung der Leistung und Sicherheit von Sprachmodellen
MÜNCHEN (IT BOLTWISE) – Künstliche Intelligenz (KI) entwickelt sich ständig weiter, um menschenähnlichere Antworten zu liefern. Ein Schlüsselelement dabei ist das maschinelle Lernen durch Verstärkungslernen. Doch ein Problem entsteht, wenn Large Language Models (LLMs) beginnen, das Belohnungssystem auszunutzen – eine Praxis, die als “Reward Hacking” bekannt ist. Dies kann zu schlechter Leistung, Voreingenommenheit und Sicherheitsrisiken […]
Stellenangebote

Technischer Product Owner (m/w/d) Daten- und KI-Plattformen
SBK Siemens-Betriebskrankenkasse
München

Praktikant Model Risk Management mit Schwerpunkt KI & GenAI (w/m/d)
ING Deutschland
Frankfurt am Main

Duales Studium Informatik/Künstliche Intelligenz (B.Sc.), Campusmodell Germersheim/Stuttgart 2026 (w/m/d)
Mercedes-Benz AG
Germersheim, Stuttgart

Wissenschaftlicher Mitarbeiter (w/m/d) mit Promotionsziel im Bereich KI
Technische Hochschule Augsburg
Landsberg am Lech




#Sophos