Heute ist der 21.05.2026 und es brodelt gewaltig in der Welt der Smart Contracts. Cloudflare hat kürzlich in einem Blogpost, veröffentlicht von Chief Security Officer Grant Bourzikas, enthüllt, dass das Mythos Preview-Modell von Anthropic in der Lage ist, Bugs zu funktionierenden Exploits über mehr als 50 Repositories zu verketten. Das ist schon ein ganz schöner Hammer! Die Informationen zeigen, wie weit KI-Modelle bei der Sicherheitsforschung bereits gekommen sind.

Das Mythos Preview-Modell, das speziell auf Produktivcode ausgelegt wurde, hat es geschafft, mehrere kleine Angriffsprimitiven zu funktionierenden Proofs of Concept zusammenzuführen. Es ist nicht nur eine Frage der Theorie, denn das Modell kompilierte und führte Exploit-Code in einer Scratch-Umgebung aus – und das mit einer bemerkenswerten Fähigkeit, Hypothesen bei Fehlschlägen zu überarbeiten. Komischerweise gab es jedoch auch inkonsistente Weigerungen des Modells. In einem Fall weigerte es sich zuerst, einen Demonstrations-Exploit zu schreiben, nachdem es Speicherfehler bestätigt hatte, kam der Aufgabe jedoch später nach, als sie anders formuliert wurde. Das zeigt, dass selbst die fortschrittlichsten KI-Modelle noch ihre Eigenheiten haben.

Fortschritte und Herausforderungen

Cloudflare hat sich nicht einfach mit den Ergebnissen zufrieden gegeben. Bourzikas entwickelte ein mehrstufiges Harness mit rund 50 parallelen Agenten, die spezifische Aufgaben übernehmen. Diese Pipeline umfasst Aufklärung, Hunting, adversarielle Validierung, Deduplizierung und Reachability-Tracing. Ein unabhängiger Agent versucht sogar, jeden Fund zu widerlegen, bevor er in die Triage-Warteschlange gelangt, um die Zahl der False Positives zu reduzieren – ein wichtiger Schritt, um die Effizienz der Sicherheitsforschung zu steigern. Dabei bleibt die Frage im Raum: Wie sicher sind unsere Systeme wirklich?

Immerhin kommt Cloudflares Enthüllung zu einem Zeitpunkt, an dem die On-Chain-Verluste zunehmen. Erst kürzlich verlor die Verus-Ethereum-Bridge in einem Cross-Chain-Angriff 11 Millionen US-Dollar. Dabei wurde auch festgestellt, dass Anthropic-Forscher gezeigt haben, dass KI-Agenten eigenständig Live-Contracts ausnutzen können. In einem Test wurden 2.849 deployte Contracts gescannt, was zu Exploits im Wert von 3.694 US-Dollar führte. Das ist ein weiteres Alarmzeichen! CertiK warnt sogar, dass Legacy-Smart-Contracts im Zentrum einer KI-getriebenen Jagdwelle stehen – das klingt schon fast nach Science-Fiction, ist aber die Realität, mit der sich Entwickler und Unternehmen auseinandersetzen müssen.

Kosten und Engagement

Im Rahmen von Project Glasswing hat sich Anthropic nicht nur zu 100 Millionen US-Dollar an Modell-Credits verpflichtet, sondern auch 4 Millionen US-Dollar an Spenden für Open-Source-Sicherheitsgruppen zur Verfügung gestellt. Ein lobenswerter Schritt, der zeigt, dass das Unternehmen Verantwortung übernimmt und die Sicherheitslage ernst nimmt. Dennoch bleibt das Mythos Preview-Modell aufgrund seiner potenziellen Risiken und Fähigkeiten nicht öffentlich zugänglich. Die Entwickler scheinen sich bewusst zu sein, dass die Technologie sowohl als Werkzeug für Fortschritt als auch als Bedrohung fungieren kann.

Werbung
Hier könnte Ihr Advertorial stehen
Ein Advertorial bietet Unternehmen die Möglichkeit, ihre Botschaft direkt im redaktionellen Umfeld zu platzieren

Zusammengefasst – oder besser gesagt, ohne zusammenzufassen – ist die Entwicklung der KI im Bereich der Sicherheit eine spannende, wenn auch herausfordernde Reise. Wenn wir uns die letzten Monate anschauen, in denen DeFi-Protokolle im April über 605 Millionen US-Dollar verloren haben, wird klar: Die Risiken sind allgegenwärtig. Wir stehen an einem Wendepunkt, an dem Technologie und Sicherheit Hand in Hand gehen müssen, um die drohenden Gefahren zu mindern. Und während einige vielleicht noch an den Möglichkeiten der Blockchain festhalten, könnte die Realität der KI-gestützten Angriffe sie bald einholen. Ein ständiges Aufeinandertreffen von Fortschritt und Bedrohung – und wir sind mittendrin!