KI-Agenten sollen Aufgaben planen, Tools bedienen, E-Mails schreiben, Code ausführen oder Zahlungen vorbereiten. Genau darin liegt das Problem. Eine neue Forschungsarbeit argumentiert, dass solche Systeme sicherheitstechnisch nicht wie normale Chatbots behandelt werden dürfen.
KI-Agenten sind mehr als nur Modelle mit besserem Interface
Die überarbeitete Arbeit wurde am 20. Mai von Forschern von Google, Gray Swan AI, EmbraceTheRed und mehreren Universitäten veröffentlicht. Der zentrale Punkt ist ziemlich klar: Agentensicherheit ist kein reines Modellproblem. Sie ist ein Systemproblem.
Bisher konzentriert sich ein großer Teil der Debatte auf robustere Modelle. Also auf KI-Systeme, die weniger anfällig für Manipulation, Prompt Injection oder falsche Anweisungen sind.
Die Forscher halten das für wichtig, aber nicht ausreichend. Sobald ein KI-Agent Zugriff auf externe Werkzeuge, Dateien, Browser, APIs oder Unternehmenssysteme bekommt, entsteht eine andere Risikoklasse.
Ein Sprachmodell kann sich irren. Ein Agent kann handeln. Er kann Daten weitergeben, Transaktionen auslösen, Berechtigungen nutzen oder falsche Informationen in reale Arbeitsprozesse einspeisen. Damit wird aus einem Softwareassistenten schnell ein Teil der operativen Infrastruktur.
Systemsicherheit statt Vertrauen in das Modell
Die Autoren schlagen deshalb vor, KI-Agenten als untrusted component zu behandeln. Also als Systembestandteil, dem man nicht blind vertraut, selbst wenn er meistens korrekt arbeitet.
Dieser Gedanke ist aus der klassischen IT-Sicherheit bekannt. Dort wird seit Jahrzehnten mit Angreifern gerechnet, die Systeme manipulieren, Eingaben missbrauchen oder Privilegien ausweiten wollen.
Für KI-Agenten würde das bedeuten: strikte Berechtigungen, klare Zugriffskontrollen, Protokollierung, isolierte Ausführungsumgebungen und technische Grenzen für gefährliche Aktionen. Ein Agent sollte nicht einfach alles dürfen, nur weil der Nutzer einmal zugestimmt hat.
Besonders relevant ist das für Unternehmen, die KI-Agenten in interne Prozesse integrieren. Kundenservice, Finanzabteilungen, Entwicklerteams und Compliance-Bereiche testen solche Systeme bereits. Je stärker Agenten dort mit echten Daten und echten Entscheidungen arbeiten, desto weniger reicht die Frage, ob das Modell „gut genug“ antwortet.