News UK

„Claude Mythos“: Anthropic’s neuestes KI-Modell zu gefährlich für Veröffentlichung

Der US-amerikanische KI-Entwickler Anthropic hat ein neues Sprachmodell namens Claude Mythos Preview vorgestellt, das nach Unternehmensangaben in der Lage ist, Sicherheitslücken in Software eigenständig zu finden und auszunutzen. Das Modell soll dabei die Fähigkeiten aller außer den besten menschlichen Sicherheitsexperten übertreffen. Wegen seines Gefährdungspotenzials plant Anthropic keine allgemeine Veröffentlichung.

Wie bereits berichtet, wurden die Entwicklungen zu Mythos vor kurzem bereits nach einem Leak bekannt. Bereits zuvor hatte Anthropic durch die Veröffentlichung von Claude Code Security die Aktien von Cybersecurity-Unternehmen auf Talfahrt geschickt. Die News zu Mythos, wo etwa Palo Alto Networks, CrowdStrike, CloudFlare, Cisco oder Broadcom Partner via „Project Glasswing“ sind, haben deren Aktien am Dienstag teilweise beflügelt.

Warum Mythos nicht öffentlich zugänglich sein soll

Anthropic begründet die Entscheidung gegen eine öffentliche Freigabe mit den außergewöhnlichen Fähigkeiten des Modells. Claude Mythos Preview kann laut Unternehmen Sicherheitslücken nahezu vollständig autonom identifizieren und Exploits entwickeln, ohne menschliche Steuerung. Die Befürchtung: Sollten solche Fähigkeiten unkontrolliert in die Hände von Akteuren gelangen, die nicht zu einem verantwortungsvollen Umgang verpflichtet sind, könnten die Folgen für Wirtschaft, öffentliche Sicherheit und nationale Sicherheit gravierend sein.

Langfristig strebt Anthropic an, Modelle dieser Leistungsklasse sicher und in großem Maßstab bereitzustellen. Dafür müssen jedoch zunächst geeignete Schutzmaßnahmen entwickelt werden, die gefährliche Ausgaben erkennen und blockieren. Diese Sicherheitsmechanismen sollen zunächst mit einem weniger riskanten Modell, einem kommenden Claude-Opus-Modell, erprobt werden.

Gefundene Schwachstellen: Jahrzehntealte Lücken in kritischen Systemen

Im Rahmen interner Tests hat Anthropic Claude Mythos Preview eingesetzt, um sogenannte Zero-Day-Schwachstellen zu identifizieren, also Sicherheitslücken, die den jeweiligen Entwicklern bislang unbekannt waren. Nach Unternehmensangaben wurden dabei tausende kritische Lücken in allen großen Betriebssystemen und Webbrowsern entdeckt. Drei konkrete Beispiele wurden öffentlich gemacht:

  • Eine 27 Jahre alte Schwachstelle in OpenBSD, einem als besonders sicher geltenden Betriebssystem, das häufig für Firewalls und kritische Infrastruktur eingesetzt wird. Die Lücke ermöglichte es, jeden betroffenen Rechner allein durch eine Netzwerkverbindung zum Absturz zu bringen.
  • Eine 16 Jahre alte Schwachstelle in FFmpeg, einer weit verbreiteten Bibliothek zur Video-Verarbeitung. Besonders bemerkenswert: Automatisierte Testtools hatten die betreffende Codezeile bereits fünf Millionen Mal ausgeführt, ohne das Problem zu entdecken.
  • Mehrere miteinander verknüpfte Schwachstellen im Linux-Kernel, dem Betriebssystemkern, der den Großteil der weltweiten Server antreibt. Durch die Kombination dieser Lücken konnte ein Angreifer von einfachem Nutzerzugang zur vollständigen Kontrolle über eine Maschine gelangen.

Alle genannten Schwachstellen wurden den jeweiligen Softwarepflegern gemeldet und sind inzwischen behoben. Für weitere entdeckte Lücken hat Anthropic zunächst nur einen kryptografischen Hash der Details veröffentlicht und will die vollständigen Informationen erst nach einer Behebung preisgeben.

Project Glasswing: Defensive Nutzung durch ausgewählte Partner

Um die Fähigkeiten des Modells gezielt für Verteidigungszwecke einzusetzen, hat Anthropic die Initiative Project Glasswing ins Leben gerufen. Ziel ist es, Claude Mythos Preview im Rahmen defensiver Sicherheitsarbeit zu nutzen und die gewonnenen Erkenntnisse mit der gesamten Branche zu teilen.

Zu den Gründungspartnern gehören namhafte Unternehmen aus Technologie, Finanzen und Cybersicherheit:

  • Amazon Web Services
  • Anthropic
  • Apple
  • Broadcom
  • Cisco
  • CrowdStrike
  • Google
  • JPMorganChase
  • Linux Foundation
  • Microsoft
  • NVIDIA
  • Palo Alto Networks

Darüber hinaus erhalten mehr als 40 weitere Organisationen, die kritische Softwareinfrastruktur entwickeln oder betreiben, Zugang zum Modell. Sie sollen es nutzen, um sowohl eigene als auch Open-Source-Systeme auf Schwachstellen zu prüfen und abzusichern.

Finanzielle Zusagen und Ausblick

Anthropic stellt für Project Glasswing bis zu 100 Millionen US-Dollar an Nutzungsguthaben für Claude Mythos Preview bereit. Zusätzlich werden 4 Millionen US-Dollar als direkte Spenden an Open-Source-Sicherheitsorganisationen vergeben.

„Die Arbeit zur Verteidigung der weltweiten Cyberinfrastruktur könnte Jahre dauern; die Fähigkeiten von Frontier-KI werden sich wahrscheinlich in den nächsten Monaten erheblich weiterentwickeln. Damit Cyberverteidiger die Oberhand behalten, müssen wir jetzt handeln“, heißt es in einer Stellungnahme des Unternehmens.

Anthropic betont, dass Project Glasswing nur ein Ausgangspunkt sei. Keine einzelne Organisation könne die Cybersicherheitsprobleme allein lösen. Frontier-KI-Entwickler, Softwareunternehmen, Sicherheitsforscher, Open-Source-Entwickler und Regierungen weltweit seien gefragt, gemeinsam zu handeln.

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button