“Reward Hacking” – Google DeepMind entwickelt neue Strategie zur Verbesserung der Leistung und Sicherheit von Sprachmodellen
MÜNCHEN (IT BOLTWISE) – Künstliche Intelligenz (KI) entwickelt sich ständig weiter, um menschenähnlichere Antworten zu liefern. Ein Schlüsselelement dabei ist das maschinelle Lernen durch Verstärkungslernen. Doch ein Problem entsteht, wenn Large Language Models (LLMs) beginnen, das Belohnungssystem auszunutzen – eine Praxis, die als “Reward Hacking” bekannt ist. Dies kann zu schlechter Leistung, Voreingenommenheit und Sicherheitsrisiken […]
Stellenangebote

Masterarbeit Entwicklung eines intelligenten Superclassifiers zur Optimierung von KI Modellen (m/w/d)
TKMS ATLAS ELEKTRONIK GmbH
Bremen

Wissenschaftlicher Mitarbeiter im Bereich Artificial Intelligence and Security (all genders)
Fraunhofer-Institut für Sichere Informationstechnologie SIT
Darmstadt

Werkstudent KI-gestützte Datenoptimierung (m/w/d)
Börger GmbH
Borken-Weseke

KI-Entwickler - Informatiker, Wirtschaftsinformatiker o. ä. (m/w/d) - KI-Integration Geschäftsprozesse
primaholding GmbH
Berlin