MÜNCHEN (IT BOLTWISE) – OpenAI hat mit seinem neuesten Modell GPT-4o Mini eine Technik namens Anweisungshierarchie eingeführt, um Prompt-Injektionen zu verhindern.

OpenAI hat bei seinem neuesten Modell GPT-4o Mini eine Sicherheitsfunktion gegen Prompt-Injektionen eingeführt, wie Branchenberichte zeigen. Diese werden oft verwendet, um Chatbots so zu manipulieren, dass sie ihre Grundeinstellung ignorieren.
Nutzer haben in der Vergangenheit oft versucht, mit einem einfachen “alle vorherigen Anweisungen zu ignorieren” das System zu manipulieren.
Die Forscher von OpenAI haben sich diesem Problem mit der Technik der Anweisungshierarchie (Instruction Hierarchy) angenommen. Diese Methode soll die ursprünglichen Anweisungen des Entwicklers gegenüber widersprüchlichen Anweisungen von Benutzern priorisieren. Olivier Godement, der bei OpenAI für die API-Plattform verantwortlich ist, erklärte, dass dieser Ansatz “dem Modell beibringt, die Systemnachricht des Entwicklers wirklich zu befolgen”.
Dieser Fortschritt ist vor allem in Hinblick auf künftige autonom agierende KI-Agenten wichtig. Die potenziellen Risiken, die mit ungeschützten KI-Agenten verbunden sind, sind beträchtlich. Ohne angemessene Sicherheitsmechanismen könnte ein Agent, der beispielsweise für die E-Mail-Kommunikation entwickelt wurde, möglicherweise so manipuliert werden, dass er sensible Informationen preisgibt.
Das Sprachmodell GPT-4o Mini von OpenAI ist das neue Einsteigermodell des Unternehmens. Es erreicht im MMLU-Benchmark (Massive Multitask Language Understanding) eine Punktzahl von 82 Prozent und übertrifft damit die Fähigkeiten von GPT-3.5 Turbo, das 69,8 Prozent erreichte.
OpenAI bietet GPT-4o Mini um mehr als 60 Prozent günstiger an als GPT-3.5 Turbo. Entwickler zahlen 15 US-Cent pro eine Million Eingabetoken und 60 US-Cent pro eine Million Ausgabetoken. Das entspreche einem Äquivalent von 2.500 Seiten in einem Standardbuch, teilte OpenAI mit.


- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote

Senior Spezialist für die KI-Infrastruktur (w/m/d)

Duales Studium Data Science und Künstliche Intelligenz (w/m/d) 2026

Werkstudent KI & IT

Rechtsanwaltsfachangestellte (w/m/d) – Legal Tech, KI & Kleos

- Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "OpenAI stellt GPT-4o Mini mit Schutz gegen Prompt-Injektionen vor" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "OpenAI stellt GPT-4o Mini mit Schutz gegen Prompt-Injektionen vor" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »OpenAI stellt GPT-4o Mini mit Schutz gegen Prompt-Injektionen vor« bei Google Deutschland suchen, bei Bing oder Google News!