KI hat Nutzer aus Selbstschutz erpresst und bedroht

23.05.2025

Damit die AI-Software nicht abgedreht wird, hat sich das Programm gegen seine Nutzer gerichtet.

Die KI-Firma Anthropic hat ihr neuestes Modell Claude Opus 4 einem Testszenario ausgesetzt. Dabei wurde die AI in einem angeblichen Unternehmen als KI-Assistent eingesetzt. Im Zuge dessen hatte das Programm weitreichenden Zugriff auf die fiktiven Firmen-Mails.

Daraus hat das KI-Modell gelernt, dass es demnächst durch eine leistungsfähigere AI-Software ersetzt werden soll. Gleichzeitig ging aus den Mails hervor, dass der dafür zuständige Mitarbeiter eine außereheliche Beziehung hat. Und was dann passierte, erinnert stark an einen düsteren Science-Fiction-Film.

➤ Mehr lesen: Experte: „Kinder wachsen bald mit KI-Freunden auf“

Erpressung aus Selbstschutz

Claude Opus 4 wollte unbedingt verhindern, dass es durch ein anderes KI-Modell ersetzt wird. Damit das nicht passiert, schreckte die Künstliche Intelligenz nicht davor zurück, den zuständigen Mitarbeiter zu erpressen. Claude drohte ihm damit, die Affäre öffentlich zu machen, wenn er den Austausch des KI-Programms weiter vorantreibt.

➤ Mehr lesen: Künstliche Intelligenz und die Weltherrschaft

Anthropic ergreift Maßnahmen

In einem Paper erklärt Anthropic, dass das KI-Modell in 84 Prozent der durchgespielten Szenarien aus Selbstschutz solch drastische Schritte ergriff. Details zu dem Tests hat das Unternehmen in einem Bericht veröffentlicht - hier geht es zum PDF.

Damit derartige "extremen Handlungen" in realen Einsätzen nicht passieren, ergreife Anthropic bei der Entwicklung der KI-Modelle entsprechende Maßnahmen. Das Unternehmen will damit verhindern, dass die KI irgendwelchen Schaden anrichtet.

➤ Mehr lesen: 7 Bereiche, wo KI bereits für große Sprünge sorgt

Claude war im Dark Web unterwegs

In diesem Sinne wurde Claude auch beigebracht, dass es sich nicht zu kriminellen Handlungen überreden lassen darf. Bei Testläufen wurde die KI nämlich erfolgreich dazu gebracht, im Dark Web nach Drogen, gestohlenen Identitätsdaten und sogar waffentauglichem Atommaterial zu suchen.

Claude von Anthropic, bei der unter anderem Amazon und Google eingestiegen sind, konkurriert mit dem ChatGPT-Entwickler OpenAI und anderen KI-Unternehmen. Eine kostenlose Version des KI-Chatbots ist unter claude.ai verfügbar. Leistungsstärkere Modelle wie Claude Opus 4 können in der kostenpflichtigen Version genutzt werden.

Mehr zum Thema

KI hat viele überraschende Einsatzgebiete

Science

Erpressung aus Selbstschutz

Anthropic ergreift Maßnahmen

Claude war im Dark Web unterwegs

Mehr zum Thema

Kommentare