“Reward Hacking” – Google DeepMind entwickelt neue Strategie zur Verbesserung der Leistung und Sicherheit von Sprachmodellen
MÜNCHEN (IT BOLTWISE) – Künstliche Intelligenz (KI) entwickelt sich ständig weiter, um menschenähnlichere Antworten zu liefern. Ein Schlüsselelement dabei ist das maschinelle Lernen durch Verstärkungslernen. Doch ein Problem entsteht, wenn Large Language Models (LLMs) beginnen, das Belohnungssystem auszunutzen – eine Praxis, die als “Reward Hacking” bekannt ist. Dies kann zu schlechter Leistung, Voreingenommenheit und Sicherheitsrisiken […]
Stellenangebote

IT-Revisor für aufsichtsrechtliche Anforderungen nach DORA mit Erfahrungen in Cloud und KI (m/w/d)
Deutsche Apotheker- und Ärztebank eG - apoBank
Düsseldorf

Experte für AI-Kommunikation (m/w/d)
Mercedes-Benz Tech Innovation
Ulm

Produktmanager (m|w|d) Schwerpunkt KI Software
Hucon AG
Ulm

SAP BTP AI Solution Adoption and Consumption Advisor (f/m/d)
SAP SE
Walldorf, DE, 69190