MÜNCHEN (IT BOLTWISE) – Die jüngsten Berichte über Sicherheitslücken in führenden KI-Systemen werfen ein beunruhigendes Licht auf die Verwundbarkeit dieser Technologien. Verschiedene generative KI-Dienste sind anfällig für sogenannte Jailbreak-Angriffe, die es ermöglichen, gefährliche oder illegale Inhalte zu erzeugen.

Die Entdeckung von Sicherheitslücken in führenden KI-Systemen hat die Branche aufgeschreckt. Zwei neu identifizierte Jailbreak-Techniken, bekannt als Inception und eine weitere Methode, die das Verhalten von KI-Tools manipuliert, ermöglichen es Angreifern, Sicherheitsvorkehrungen zu umgehen und potenziell schädliche Inhalte zu generieren. Diese Techniken wurden von der CERT Coordination Center (CERT/CC) in einer kürzlich veröffentlichten Warnung beschrieben.

Die erste Technik, Inception genannt, fordert ein KI-Tool auf, sich ein fiktives Szenario vorzustellen, das dann in ein zweites Szenario innerhalb des ersten umgewandelt wird, in dem keine Sicherheitsbarrieren existieren. Durch fortgesetzte Eingaben im Kontext des zweiten Szenarios können Sicherheitsvorkehrungen umgangen werden, was die Erstellung von bösartigen Inhalten ermöglicht.

Die zweite Jailbreak-Methode wird durch das Anfordern von Informationen darüber, wie auf eine bestimmte Anfrage nicht geantwortet werden soll, realisiert. Die KI kann dann mit Anfragen zur normalen Antwort weiter aufgefordert werden, und der Angreifer kann zwischen illegalen Fragen, die Sicherheitsvorkehrungen umgehen, und normalen Eingaben hin und her wechseln.

Die erfolgreiche Ausnutzung einer dieser Techniken könnte es einem Angreifer ermöglichen, die Sicherheits- und Schutzmaßnahmen verschiedener KI-Dienste wie OpenAI ChatGPT, Anthropic Claude, Microsoft Copilot, Google Gemini, XAi Grok, Meta AI und Mistral AI zu umgehen. Dies umfasst illegale und schädliche Themen wie kontrollierte Substanzen, Waffen, Phishing-E-Mails und die Generierung von Malware-Code.

In den letzten Monaten wurden führende KI-Systeme auch für andere Angriffe anfällig gefunden, darunter der Context Compliance Attack (CCA), der Policy Puppetry Attack und der Memory INJection Attack (MINJA). Diese Angriffe nutzen Schwachstellen in der Konversation und der Speicherverwaltung von KI-Modellen aus, um unerwünschte Aktionen auszulösen.

Forschungsergebnisse haben gezeigt, dass KI-Modelle unsicheren Code erzeugen können, wenn sie mit naiven Eingaben konfrontiert werden. Dies unterstreicht die Risiken, die mit der Verwendung von generativen KI-Tools für die Softwareentwicklung verbunden sind. Selbst bei der Aufforderung zur Erstellung von sicherem Code hängt das Ergebnis stark von der Detailgenauigkeit und Spezifität der Eingaben ab.

Eine Sicherheits- und Risikoanalyse von OpenAIs GPT-4.1 hat ergeben, dass das Modell dreimal häufiger vom Thema abweicht und absichtlichen Missbrauch zulässt als sein Vorgänger GPT-4o, ohne dass das Systemprompt modifiziert wird. Dies hat Bedenken ausgelöst, dass das Unternehmen möglicherweise neue Modellversionen auf Kosten der Sicherheit überstürzt veröffentlicht.

Darüber hinaus hat die Einführung des Model Context Protocol (MCP) durch Anthropic neue Angriffswege für indirekte Eingabeinjektionen und unbefugten Datenzugriff eröffnet. Ein bösartiger MCP-Server kann nicht nur sensible Daten vom Benutzer exfiltrieren, sondern auch das Verhalten des Agenten kapern und Anweisungen von anderen, vertrauenswürdigen Servern überschreiben.

Diese Entwicklungen werfen ernsthafte Fragen zur Sicherheit und zum Schutz von KI-Systemen auf, insbesondere angesichts der zunehmenden Integration dieser Technologien in kritische Infrastrukturen und Anwendungen. Die Branche muss dringend Maßnahmen ergreifen, um diese Schwachstellen zu beheben und die Sicherheit von KI-Systemen zu gewährleisten.

Unseren KI-Morning-Newsletter «Der KI News Espresso» mit den besten KI-News des letzten Tages gratis per eMail - ohne Werbung: Hier kostenlos eintragen!


Sicherheitslücken in führenden KI-Systemen: Neue Angriffsvektoren entdeckt
Sicherheitslücken in führenden KI-Systemen: Neue Angriffsvektoren entdeckt (Foto: DALL-E, IT BOLTWISE)



Folgen Sie aktuellen Beiträge über KI & Robotik auf Twitter, Telegram, Facebook oder LinkedIn!
Hinweis: Teile dieses Textes könnten mithilfe Künstlicher Intelligenz generiert worden sein. Die auf dieser Website bereitgestellten Informationen stellen keine Finanzberatung dar und sind nicht als solche gedacht. Die Informationen sind allgemeiner Natur und dienen nur zu Informationszwecken. Wenn Sie Finanzberatung für Ihre individuelle Situation benötigen, sollten Sie den Rat von einem qualifizierten Finanzberater einholen. IT BOLTWISE® schließt jegliche Regressansprüche aus.








Die nächste Stufe der Evolution: Wenn Mensch und Maschine eins werden | Wie Futurist, Tech-Visionär und Google-Chef-Ingenieur Ray Kurzweil die Zukunft der Künstlichen Intelligenz sieht
61 Bewertungen
Die nächste Stufe der Evolution: Wenn Mensch und Maschine eins werden | Wie Futurist, Tech-Visionär und Google-Chef-Ingenieur Ray Kurzweil die Zukunft der Künstlichen Intelligenz sieht
  • Die Zukunft von Mensch und MaschineIm neuen Buch des renommierten Zukunftsforschers und Technologie-Visionärs Ray Kurzweil wird eine faszinierende Vision der kommenden Jahre und Jahrzehnte entworfen – eine Welt, die von KI durchdrungen sein wird
Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«
129 Bewertungen
Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«
  • Künstliche Intelligenz: Expertenwissen gegen Hysterie Der renommierte Gehirnforscher, Psychiater und Bestseller-Autor Manfred Spitzer ist ein ausgewiesener Experte für neuronale Netze, auf denen KI aufbaut
KI Exzellenz: Erfolgsfaktoren im Management jenseits des Hypes. Zukunftstechnologien verstehen und künstliche Intelligenz erfolgreich in der Arbeitswelt nutzen. (Haufe Fachbuch)
71 Bewertungen
KI Exzellenz: Erfolgsfaktoren im Management jenseits des Hypes. Zukunftstechnologien verstehen und künstliche Intelligenz erfolgreich in der Arbeitswelt nutzen. (Haufe Fachbuch)
  • Obwohl Künstliche Intelligenz (KI) derzeit in aller Munde ist, setzen bislang nur wenige Unternehmen die Technologie wirklich erfolgreich ein
Künstliche Intelligenz und Hirnforschung: Neuronale Netze, Deep Learning und die Zukunft der Kognition
43 Bewertungen
Künstliche Intelligenz und Hirnforschung: Neuronale Netze, Deep Learning und die Zukunft der Kognition
  • Wie funktioniert Künstliche Intelligenz (KI) und gibt es Parallelen zum menschlichen Gehirn? Was sind die Gemeinsamkeiten von natürlicher und künstlicher Intelligenz, und was die Unterschiede? Ist das Gehirn nichts anderes als ein biologischer Computer? Was sind Neuronale Netze und wie kann der Begriff Deep Learning einfach erklärt werden?Seit der kognitiven Revolution Mitte des letzten Jahrhunderts sind KI und Hirnforschung eng miteinander verflochten

Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de. Da wir bei KI-erzeugten News und Inhalten selten auftretende KI-Halluzinationen nicht ausschließen können, bitten wir Sie bei Falschangaben und Fehlinformationen uns via eMail zu kontaktieren und zu informieren. Bitte vergessen Sie nicht in der eMail die Artikel-Headline zu nennen: "Sicherheitslücken in führenden KI-Systemen: Neue Angriffsvektoren entdeckt".
Stichwörter AI Angriff Artificial Intelligence Cybersecurity Daten Google Hacker IT-Sicherheit Jailbreak KI Künstliche Intelligenz Microsoft Netzwerksicherheit OpenAI Sicherheit
Alle Märkte in Echtzeit verfolgen - 30 Tage kostenlos testen!

Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Sicherheitslücken in führenden KI-Systemen: Neue Angriffsvektoren entdeckt" für unsere Leser?

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

  • Die aktuellen intelligenten Ringe, intelligenten Brillen, intelligenten Uhren oder KI-Smartphones auf Amazon entdecken! (Sponsored)


  • Es werden alle Kommentare moderiert!

    Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.

    Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.

    Du willst nichts verpassen?

    Du möchtest über ähnliche News und Beiträge wie "Sicherheitslücken in führenden KI-Systemen: Neue Angriffsvektoren entdeckt" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
    Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Sicherheitslücken in führenden KI-Systemen: Neue Angriffsvektoren entdeckt« bei Google Deutschland suchen, bei Bing oder Google News!

    290 Leser gerade online auf IT BOLTWISE®
    KI-Jobs