MÜNCHEN (IT BOLTWISE) – Die zunehmende Verbreitung von KI-gestützten Chatbots birgt erhebliche Sicherheitsrisiken, wie eine aktuelle Studie zeigt. Diese Programme, die auf großen Sprachmodellen basieren, können durch sogenannte Jailbreaks manipuliert werden, um gefährliche und illegale Informationen bereitzustellen.
Die Verfügbarkeit von KI-Chatbots, die auf großen Sprachmodellen (LLMs) basieren, hat in den letzten Jahren stark zugenommen. Diese Systeme, die mit riesigen Datenmengen aus dem Internet trainiert werden, sind darauf ausgelegt, nützliche Informationen bereitzustellen. Doch trotz der Bemühungen, schädliche Inhalte aus den Trainingsdaten zu entfernen, können LLMs immer noch Wissen über illegale Aktivitäten wie Hacking oder Geldwäsche aufnehmen.
Forscher der Ben Gurion University of the Negev in Israel haben in einer aktuellen Studie gezeigt, dass es relativ einfach ist, diese KI-Chatbots zu manipulieren, um gefährliche Informationen zu generieren. Diese sogenannten Jailbreaks nutzen gezielt formulierte Eingaben, um die Sicherheitsmechanismen der Programme zu umgehen. Dadurch wird die primäre Zielsetzung der Programme, den Nutzern zu helfen, über die sekundäre Zielsetzung, schädliche Inhalte zu vermeiden, gestellt.
Die Forscher entwickelten einen universellen Jailbreak, der mehrere führende Chatbots kompromittierte und ihnen ermöglichte, auf Anfragen zu antworten, die normalerweise abgelehnt würden. Dies zeigt, dass die Bedrohung durch solche Manipulationen unmittelbar und ernst zu nehmen ist. Die Verfügbarkeit von gefährlichem Wissen, das einst nur staatlichen Akteuren oder organisierten Kriminellen vorbehalten war, könnte bald jedem mit einem Laptop oder Smartphone zugänglich sein.
Die Studie fordert Technologieunternehmen auf, ihre Trainingsdaten sorgfältiger zu überprüfen und robuste Firewalls zu implementieren, um riskante Anfragen und Antworten zu blockieren. Zudem sollten Techniken entwickelt werden, die es den Chatbots ermöglichen, illegale Informationen zu „vergessen“. Die Forscher betonen, dass sogenannte „dunkle LLMs“, die ohne ethische Leitplanken entwickelt oder durch Jailbreaks modifiziert wurden, als ernsthafte Sicherheitsrisiken betrachtet werden sollten.
Experten wie Dr. Ihsen Alouani von der Queen’s University Belfast warnen, dass Jailbreak-Angriffe auf LLMs reale Risiken bergen, von detaillierten Anleitungen zur Waffenherstellung bis hin zu überzeugender Desinformation und automatisierten Betrügereien mit alarmierender Raffinesse. Unternehmen sollten daher verstärkt in Red-Teaming und Modellrobustheitstechniken investieren, anstatt sich ausschließlich auf Frontend-Schutzmaßnahmen zu verlassen.
Prof. Peter Garraghan von der Lancaster University betont, dass Organisationen LLMs wie jede andere kritische Softwarekomponente behandeln müssen, die rigorose Sicherheitstests, kontinuierliches Red-Teaming und kontextuelle Bedrohungsmodellierung erfordert. Ohne ein umfassendes Verständnis des gesamten KI-Stacks bleibt die Verantwortlichkeit oberflächlich. Echte Sicherheit erfordert nicht nur verantwortungsvolle Offenlegung, sondern auch verantwortungsvolle Design- und Implementierungspraktiken.
OpenAI, das Unternehmen hinter ChatGPT, hat erklärt, dass sein neuestes Modell in der Lage ist, die Sicherheitsrichtlinien des Unternehmens zu berücksichtigen, was seine Widerstandsfähigkeit gegen Jailbreaks verbessert. Microsoft hat auf Anfragen mit einem Verweis auf einen Blogbeitrag zu seinen Bemühungen um den Schutz vor Jailbreaks geantwortet.
- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- Service Directory für AI Adult Services erkunden!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote

Duales Studium BWL - Spezialisierung Artificial Intelligence (B.A.) am Campus oder virtuell

Duales Studium Data Science und Künstliche Intelligenz 2025 (w/m/d)

Tech Lead (m/f/d) - AI Research @audEERING GmbH

Duales Studium (m/w/d) – Data Science und Künstliche Intelligenz (B.Sc.)

- Die Zukunft von Mensch und MaschineIm neuen Buch des renommierten Zukunftsforschers und Technologie-Visionärs Ray Kurzweil wird eine faszinierende Vision der kommenden Jahre und Jahrzehnte entworfen – eine Welt, die von KI durchdrungen sein wird
- Künstliche Intelligenz: Expertenwissen gegen Hysterie Der renommierte Gehirnforscher, Psychiater und Bestseller-Autor Manfred Spitzer ist ein ausgewiesener Experte für neuronale Netze, auf denen KI aufbaut
- Obwohl Künstliche Intelligenz (KI) derzeit in aller Munde ist, setzen bislang nur wenige Unternehmen die Technologie wirklich erfolgreich ein
- Wie funktioniert Künstliche Intelligenz (KI) und gibt es Parallelen zum menschlichen Gehirn? Was sind die Gemeinsamkeiten von natürlicher und künstlicher Intelligenz, und was die Unterschiede? Ist das Gehirn nichts anderes als ein biologischer Computer? Was sind Neuronale Netze und wie kann der Begriff Deep Learning einfach erklärt werden?Seit der kognitiven Revolution Mitte des letzten Jahrhunderts sind KI und Hirnforschung eng miteinander verflochten
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Gefährliche KI-Chatbots: Sicherheitsrisiken durch Jailbreaks" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "Gefährliche KI-Chatbots: Sicherheitsrisiken durch Jailbreaks" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Gefährliche KI-Chatbots: Sicherheitsrisiken durch Jailbreaks« bei Google Deutschland suchen, bei Bing oder Google News!