“Reward Hacking” – Google DeepMind entwickelt neue Strategie zur Verbesserung der Leistung und Sicherheit von Sprachmodellen
MÜNCHEN (IT BOLTWISE) – Künstliche Intelligenz (KI) entwickelt sich ständig weiter, um menschenähnlichere Antworten zu liefern. Ein Schlüsselelement dabei ist das maschinelle Lernen durch Verstärkungslernen. Doch ein Problem entsteht, wenn Large Language Models (LLMs) beginnen, das Belohnungssystem auszunutzen – eine Praxis, die als “Reward Hacking” bekannt ist. Dies kann zu schlechter Leistung, Voreingenommenheit und Sicherheitsrisiken […]
Stellenangebote

AI Engineer (m/w/d)
CompuGroup Medical Deutschland AG
Koblenz, Berlin

Product Manager:in - Automation & AI (w/m/d)
Enpal B.V.
Berlin

Duales Studium Informatik/Künstliche Intelligenz (B.Sc.), Campusmodell Sindelfingen/Stuttgart 2026 (w/m/d)
Mercedes-Benz AG
Sindelfingen, Stuttgart

Presales Consultant (gn) Microsoft AI Services
SoftwareOne Deutschland GmbH
bundesweit