SAN FRANCISCO / LONDON (IT BOLTWISE) – Die Entschlüsselung der inneren Abläufe von KI-Modellen stellt eine der größten Herausforderungen der modernen KI-Forschung dar. Anthropic, ein Unternehmen, das sich auf die Entwicklung sicherer und verständlicher KI-Systeme spezialisiert hat, hat nun einen bedeutenden Schritt in Richtung Transparenz unternommen.

Anthropic hat kürzlich ein neues Open-Source-Tool veröffentlicht, das es Forschern ermöglicht, die internen Entscheidungsprozesse von großen Sprachmodellen besser zu verstehen. Diese Methode, die auf der Erstellung von Attributionsgraphen basiert, bietet Einblicke in die Schritte, die ein Modell intern unternimmt, um zu einem bestimmten Output zu gelangen. Die Veröffentlichung dieser Tools soll die Forschungsgemeinschaft dabei unterstützen, die Funktionsweise von KI-Modellen besser zu verstehen und weiterzuentwickeln.

Die Attributionsgraphen, die mit diesen Tools generiert werden können, bieten eine visuelle Darstellung der internen Prozesse eines Modells. Diese Graphen sind besonders nützlich, um komplexe Verhaltensweisen wie mehrstufiges Denken oder mehrsprachige Repräsentationen zu analysieren. Die Tools wurden von Teilnehmern des Anthropic Fellows Programms in Zusammenarbeit mit Decode Research entwickelt und sind nun für die breite Öffentlichkeit zugänglich.

Ein interaktives Frontend, das von Neuronpedia gehostet wird, ermöglicht es Nutzern, die Attributionsgraphen zu erkunden und zu analysieren. Dies bietet Forschern die Möglichkeit, Hypothesen zu testen, indem sie Merkmalswerte ändern und beobachten, wie sich die Modelloutputs verändern. Die Tools wurden bereits erfolgreich eingesetzt, um interessante Verhaltensweisen in Modellen wie Gemma-2-2b und Llama-3.2-1b zu untersuchen.

Die Dringlichkeit der Interpretationsforschung wird von Dario Amodei, dem CEO von Anthropic, betont. Er weist darauf hin, dass unser Verständnis der inneren Abläufe von KI-Systemen weit hinter den Fortschritten in der KI-Fähigkeit zurückbleibt. Durch die Bereitstellung dieser Open-Source-Tools hofft Anthropic, es der breiteren Gemeinschaft zu erleichtern, die Vorgänge innerhalb von Sprachmodellen zu studieren und zu verstehen.

Die Entwicklung der Open-Source-Bibliothek zur Schaltkreisfindung wurde von den Anthropic Fellows Michael Hanna und Mateusz Piotrowski unter der Anleitung von Emmanuel Ameisen und Jack Lindsey geleitet. Die Integration von Neuronpedia wurde von Decode Research umgesetzt, wobei Johnny Lin als Neuronpedia-Leiter und Curt Tigges als wissenschaftlicher Leiter fungierten. Die Gemma-Graphen basieren auf Transkodern, die im Rahmen des GemmaScope-Projekts trainiert wurden.

Anthropic lädt die Gemeinschaft ein, weitere interessante Schaltkreise zu entdecken und die Tools zu erweitern. Als Inspiration stellt das Unternehmen zusätzliche Attributionsgraphen zur Verfügung, die noch nicht analysiert wurden. Für Fragen oder Feedback können Interessierte ein Issue auf GitHub eröffnen.

Unseren KI-Morning-Newsletter «Der KI News Espresso» mit den besten KI-News des letzten Tages gratis per eMail - ohne Werbung: Hier kostenlos eintragen!


Neue Open-Source-Tools zur Entschlüsselung von KI-Modellen
Neue Open-Source-Tools zur Entschlüsselung von KI-Modellen (Foto: DALL-E, IT BOLTWISE)



Folgen Sie aktuellen Beiträge über KI & Robotik auf Twitter, Telegram, Facebook oder LinkedIn!
Hinweis: Teile dieses Textes könnten mithilfe Künstlicher Intelligenz generiert worden sein. Die auf dieser Website bereitgestellten Informationen stellen keine Finanzberatung dar und sind nicht als solche gedacht. Die Informationen sind allgemeiner Natur und dienen nur zu Informationszwecken. Wenn Sie Finanzberatung für Ihre individuelle Situation benötigen, sollten Sie den Rat von einem qualifizierten Finanzberater einholen. IT BOLTWISE® schließt jegliche Regressansprüche aus.








Die nächste Stufe der Evolution: Wenn Mensch und Maschine eins werden | Wie Futurist, Tech-Visionär und Google-Chef-Ingenieur Ray Kurzweil die Zukunft der Künstlichen Intelligenz sieht
65 Bewertungen
Die nächste Stufe der Evolution: Wenn Mensch und Maschine eins werden | Wie Futurist, Tech-Visionär und Google-Chef-Ingenieur Ray Kurzweil die Zukunft der Künstlichen Intelligenz sieht
  • Die Zukunft von Mensch und MaschineIm neuen Buch des renommierten Zukunftsforschers und Technologie-Visionärs Ray Kurzweil wird eine faszinierende Vision der kommenden Jahre und Jahrzehnte entworfen – eine Welt, die von KI durchdrungen sein wird
Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«
131 Bewertungen
Künstliche Intelligenz: Dem Menschen überlegen – wie KI uns rettet und bedroht | Der Neurowissenschaftler, Psychiater und SPIEGEL-Bestsellerautor von »Digitale Demenz«
  • Künstliche Intelligenz: Expertenwissen gegen Hysterie Der renommierte Gehirnforscher, Psychiater und Bestseller-Autor Manfred Spitzer ist ein ausgewiesener Experte für neuronale Netze, auf denen KI aufbaut
KI Exzellenz: Erfolgsfaktoren im Management jenseits des Hypes. Zukunftstechnologien verstehen und künstliche Intelligenz erfolgreich in der Arbeitswelt nutzen. (Haufe Fachbuch)
71 Bewertungen
KI Exzellenz: Erfolgsfaktoren im Management jenseits des Hypes. Zukunftstechnologien verstehen und künstliche Intelligenz erfolgreich in der Arbeitswelt nutzen. (Haufe Fachbuch)
  • Obwohl Künstliche Intelligenz (KI) derzeit in aller Munde ist, setzen bislang nur wenige Unternehmen die Technologie wirklich erfolgreich ein
Künstliche Intelligenz und Hirnforschung: Neuronale Netze, Deep Learning und die Zukunft der Kognition
43 Bewertungen
Künstliche Intelligenz und Hirnforschung: Neuronale Netze, Deep Learning und die Zukunft der Kognition
  • Wie funktioniert Künstliche Intelligenz (KI) und gibt es Parallelen zum menschlichen Gehirn? Was sind die Gemeinsamkeiten von natürlicher und künstlicher Intelligenz, und was die Unterschiede? Ist das Gehirn nichts anderes als ein biologischer Computer? Was sind Neuronale Netze und wie kann der Begriff Deep Learning einfach erklärt werden?Seit der kognitiven Revolution Mitte des letzten Jahrhunderts sind KI und Hirnforschung eng miteinander verflochten

Ergänzungen und Infos bitte an die Redaktion per eMail an de-info[at]it-boltwise.de. Da wir bei KI-erzeugten News und Inhalten selten auftretende KI-Halluzinationen nicht ausschließen können, bitten wir Sie bei Falschangaben und Fehlinformationen uns via eMail zu kontaktieren und zu informieren. Bitte vergessen Sie nicht in der eMail die Artikel-Headline zu nennen: "Neue Open-Source-Tools zur Entschlüsselung von KI-Modellen".
Stichwörter AI Artificial Intelligence Attributionsgraphen Interpretation KI Künstliche Intelligenz Neuronpedia Open-Source
Alle Märkte in Echtzeit verfolgen - 30 Tage kostenlos testen!

Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Neue Open-Source-Tools zur Entschlüsselung von KI-Modellen" für unsere Leser?

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

  • Die aktuellen intelligenten Ringe, intelligenten Brillen, intelligenten Uhren oder KI-Smartphones auf Amazon entdecken! (Sponsored)


  • Es werden alle Kommentare moderiert!

    Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.

    Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.

    Du willst nichts verpassen?

    Du möchtest über ähnliche News und Beiträge wie "Neue Open-Source-Tools zur Entschlüsselung von KI-Modellen" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
    Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Neue Open-Source-Tools zur Entschlüsselung von KI-Modellen« bei Google Deutschland suchen, bei Bing oder Google News!

    444 Leser gerade online auf IT BOLTWISE®
    KI-Jobs