KI schreibt nicht nur Code-Snippets, sondern plant, entwickelt und testet ganze Software-Projekte eigenständig über mehrere Schritte.
Agentic Coding ist der Unterschied zwischen "KI schlägt mir eine Funktion vor" und "KI analysiert mein Repo, plant die Architektur, schreibt alle Dateien, führt Tests aus und korrigiert Fehler". Claude Code, Cursor, Devin und ähnliche Tools arbeiten agentisch: Sie führen mehrere Tool-Calls in Folge aus, können Terminal-Befehle ausführen, Dateien lesen/schreiben und sich selbst korrigieren. SWE-Bench misst genau diese Fähigkeit: Wie viele echte GitHub-Issues kann ein Modell selbstständig lösen?
Claude Code liest ein Projekt, findet einen Bug in der Datenbank-Abfrage, schreibt den Fix, testet ihn und deployed den Worker — alles ohne manuellen Eingriff.