Vibe Coding vs. Agentic Coding: Was sich für Entwicklungsteams wirklich ändert

Foto von Scott Graham auf Unsplash Source

Andrej Karpathy prägte Anfang 2025 den Begriff “Vibe Coding” für eine bewusst lässige Art der Softwareentwicklung: ein LLM prompten, die Ausgabe akzeptieren, den Diff nicht lesen, Fehlermeldungen zurückpasten, bis es läuft. Ein Jahr später erklärte er den Begriff für überholt und schlug “Agentic Engineering” als Nachfolger vor. Der Name änderte sich, weil sich die Tätigkeit geändert hatte. Entwickler tippten nicht mehr Prompts in Chatfenster, sondern orchestrierten autonome Agenten, die Code planen, schreiben, testen und in mehrstufigen Workflows iterieren. Dieser Wechsel von konversationellem Prompting zu strukturierter Agentenorchestrierung ist die eigentliche Geschichte. Für Unternehmen bringt er Governance-Implikationen mit sich, die die meisten Organisationen noch nicht adressiert haben.

Nur 9% der Unternehmen haben laut Deloitte ein “Ready”-Level bei der KI-Governance erreicht. Die restlichen 91% bewegen sich irgendwo zwischen “Wir haben ein Richtliniendokument” und “Wir tun so, als gäbe es das Problem nicht.” In dieser Lücke hört der Unterschied zwischen Vibe Coding und Agentic Coding auf, akademisch zu sein, und fängt an, Geld zu kosten.

Was Vibe Coding wirklich bedeutet (und was nicht)

Vibe Coding ist promptgesteuerte Entwicklung mit minimaler Kontrolle. Man beschreibt, was man will, die KI generiert den Code, man führt ihn aus. Wenn etwas bricht, kopiert man den Stack Trace zurück. Man prüft die Implementierung nicht. Man schreibt keine Tests. Man denkt nicht über Architektur nach. Man vermittelt die “Stimmung” und das Modell füllt die Details.

Für Prototypen, Hackathons und interne Tools mit einem einzigen Nutzer funktioniert das erstaunlich gut. Ein Produktmanager kann an einem Nachmittag ein funktionierendes Dashboard hochziehen. Ein Researcher kann eine Datenpipeline bauen, ohne auf Engineering-Kapazitäten zu warten. Die Geschwindigkeit ist real.

Das Problem beginnt, wenn vibe-gecodete Artefakte vom Prototyp in die Produktion wandern. Googles DORA-Forschung hat eine 7,2%-ige Reduktion der Delivery-Stabilität gemessen, wenn die KI-Nutzung in Teams zunahm. KI-generierter Code enthält durchschnittlich 2,74-mal mehr Sicherheitslücken, besonders bei Passwort-Handling und Input-Validierung. Das sind keine theoretischen Risiken. Sie tauchen in echten Incident-Logs auf.

Ein Team von zwanzig Entwicklern, die ohne Governance vibe coden, ist nicht zwanzigmal produktiver. Es ist zehnmal chaotischer. Jeder Entwickler erzeugt Code in einem Tempo, das niemandes Reviewkapazität hinterherkommt, und niemand reviewt, weil der ganze Sinn von Vibe Coding darin besteht, die Diffs nicht zu lesen.

Das Shadow-AI-Problem

Das Unternehmensproblem ist nicht, dass Vibe Coding existiert. Es ist, dass Unternehmen es nicht verhindern können. 60% der Befragten einer aktuellen Umfrage haben im letzten Jahr Software außerhalb der IT-Aufsicht gebaut. Wenn Unternehmen keine sanktionierten KI-Coding-Tools bereitstellen, nutzen Entwickler sie auf privaten Geräten, über Consumer-APIs, deren Nutzungsbedingungen das Training mit den Eingaben erlauben. Organisationen mit hoher Shadow-AI-Aktivität zahlen im Schnitt $670.000 mehr pro Datenpanne als solche mit robuster Governance.

Die Ironie: KI-Coding-Tools zu verbieten reduziert nicht die KI-Nutzung beim Coding. Es drängt sie in den Untergrund, wo man null Einblick hat, welcher Code ausgeliefert wird und welche Daten das Unternehmen verlassen.

Für DACH-Unternehmen verschärft sich die Lage zusätzlich durch die DSGVO. Wenn Entwickler proprietären Quellcode in Consumer-KI-Tools einspeisen, die auf US-Servern laufen, ist das potenziell ein DSGVO-Verstoß, sobald personenbezogene Daten im Code auftauchen. Der EU AI Act wird diese Anforderungen ab 2026 weiter verschärfen.

Was Agentic Coding verändert

Agentic Coding verschiebt das Modell von “Mensch promptet, KI generiert” zu “Mensch definiert Ziele, KI-Agenten planen und führen aus.” Der Unterschied ist entscheidend, weil agentic Systems Struktur einführen, die Vibe Coding bewusst verwirft: Aufgabenzerlegung, automatisiertes Testing, iterative Verfeinerung und Audit-Trails.

Als Karpathy “Agentic Engineering” vorschlug, definierte er es präzise: “‘agentic’, weil die neue Normalität ist, dass man den Code nicht mehr direkt schreibt, sondern Agenten orchestriert, die das tun, und als Oversight fungiert. ‘Engineering’, um zu betonen, dass es eine Kunst und Wissenschaft und Expertise dafür gibt.”

Anthropics 2026 Agentic Coding Trends Report ergab, dass Entwickler KI in 60% ihrer Arbeit einsetzen und dabei 80-100% der delegierten Aufgaben aktiv beaufsichtigen. Dieses Oversight-Verhältnis ist der entscheidende Unterschied. Vibe Coding hat per Design ein Oversight-Ziel von 0%. Agentic Coding setzt voraus, dass Oversight die Hauptaufgabe des Engineers ist.

Wie agentic Workflows in Unternehmen aussehen

In der Praxis sieht agentic Coding in Unternehmen so aus: Ein Engineer schreibt eine Spezifikation mit gewünschtem Verhalten, Constraints und Akzeptanzkriterien. Ein Coding-Agent (Claude Code, Codex, Cursor oder eine eigene Orchestrierungsschicht) zerlegt die Spec in Aufgaben. Jede Aufgabe wird implementiert, gegen die Spec-Kriterien getestet und entweder von einem anderen Agenten oder einem Menschen geprüft. Der Agent iteriert, bis die Tests bestehen.

Das entspricht im Prinzip dem Ansatz von StrongDMs Agate-Framework oder dem Projekt, bei dem Anthropic mit 16 parallelen Claude-Agenten einen 100.000-Zeilen-C-Compiler gebaut hat. Das Muster ist gleich: Spezifikation, Zerlegung, Implementierung, Konvergenz durch iteratives Testing. Menschen besitzen die Spec und die Akzeptanzkriterien. Agenten besitzen die Implementierungszyklen.

Der Compliance-Vorteil ist erheblich. Jeder Schritt erzeugt Logs. Jede Entscheidung hat einen Trace. Wenn ein Auditor fragt “Wer hat diesen Code geschrieben und wie wurde er geprüft?”, gibt es eine Antwort jenseits von “Jemand hat ChatGPT gepromptet und die Ausgabe gepusht.”

Der Sandwich-Ansatz: Warum Hybridmodelle gewinnen

Die effektivsten Unternehmens-Teams 2026 wählen nicht zwischen Vibe Coding und Agentic Coding. Sie nutzen beides, sequenziell, in dem, was Praktiker den Sandwich-Ansatz nennen.

Schicht 1: Vibe Coding für Exploration. Rapid Prototyping, Machbarkeitstests, UI-Mockups. Ein Produktmanager und ein Engineer sitzen zusammen, prompten sich zu einem funktionierenden Konzept und validieren die Richtung. Nichts davon berührt die Produktionsinfrastruktur.

Schicht 2: Agentic Coding für die Implementierung. Das validierte Konzept bekommt eine formale Spec. Coding-Agenten bauen die Produktionsversion mit Linting, Security-Scanning, Testabdeckungsanforderungen und architektonischen Constraints, die auf Orchestrierungsebene erzwungen werden. Hier übernimmt das Software-Factory-Modell von Tools wie Agate und Factory.ai.

Schicht 3: Menschliche Prüfung an den Nahtstellen. Engineers prüfen die Zuordnung von Spec zu Implementierung, kontrollieren, ob agentengenerierter Code der architektonischen Absicht entspricht, und geben sicherheitskritische Komponenten frei. Sie prüfen nicht jede Zeile. Sie prüfen jede Entscheidungsgrenze.

Dieses Modell bewahrt den Geschwindigkeitsvorteil von Vibe Coding (Exploration ist schnell) und ergänzt die Governance-Schicht, die Unternehmen brauchen (Produktionscode ist nachvollziehbar und testbar). Teams, die diesen Hybridansatz nutzen, berichten von 40-60% schnellerer Auslieferung im Vergleich zu reiner manueller Entwicklung bei gleichzeitig niedrigeren Fehlerquoten als Teams, die alles per Vibe Coding in Produktion bringen.

Was die Governance-Lücke kostet

Gartner prognostiziert, dass die Ausgaben für KI-Governance 2026 $492 Millionen erreichen und bis 2030 die Milliarden-Dollar-Marke überschreiten werden. Diese Ausgaben sind reaktiv. Unternehmen kaufen Governance-Lösungen, nachdem sie die Kosten des Fehlens entdeckt haben.

Die realen Kosten ungesteuerter KI-Entwicklung fallen in drei Kategorien:

Comprehension Debt. Wenn kein Mensch die Codebasis versteht, weil kein Mensch sie geschrieben hat, wird jeder Bug zu einem Archäologieprojekt. Der trick77-Enterprise-Guide nennt diese “Haunted Codebases”: Code, der funktioniert, aber niemand erklären kann warum, und niemand weiß, was bricht, wenn man ihn ändert.

IP-Abfluss. Entwickler, die proprietären Code in Consumer-KI-Tools einfügen, die mit den Eingaben trainieren. 75% der Builder arbeiten inzwischen unter irgendeiner Form von KI-Richtlinie, aber 35% der Organisationen haben noch immer keine KI-Produktivitätsmetriken etabliert, geschweige denn Datenverarbeitungsrichtlinien für die KI-Tool-Nutzung.

Compliance-Risiko. Regulierte Branchen brauchen Audit-Trails für Softwareänderungen. Vibe-gecodete Software hat keinen Trail. Wenn der Wirtschaftsprüfer fragt, wie eine Finanzberechnung funktioniert, ist “die KI hat es geschrieben und wir haben es nicht geprüft” keine akzeptable Antwort unter SOX, DORA oder dem EU AI Act. Für Unternehmen im DACH-Raum kommt die BaFin-Regulierung bei Finanzdienstleistungen hinzu, die explizite Nachvollziehbarkeit von IT-Systemen verlangt (MaRisk/BAIT).

Unternehmen, die die Governance-Lücke am schnellsten schließen, verbieten nicht KI-Coding. Sie schreiben den agentic Ansatz vor: strukturierte Workflows mit Specs, Tests und Logs, die KI-generierten Code genauso prüfbar machen wie menschlich geschriebenen.

Wie es weitergeht

Anthropics Trends-Report identifiziert die nächste Stufe: Multi-Agent-Systeme, in denen spezialisierte Agenten verschiedene Teile des Entwicklungslebenszyklus parallel bearbeiten. Ein Planungsagent schreibt die Spec. Implementierungsagenten bauen Features in separaten Kontextfenstern. Review-Agenten prüfen die Ausgabe gegen Akzeptanzkriterien und Sicherheitsrichtlinien. Menschliche Engineers überwachen die Koordinierungsschicht.

Das passiert bereits in großem Maßstab. Stripe führt 1.300 autonome Pull Requests pro Woche über die gesamte Codebasis durch. Anthropics eigene Teams haben mit 16 parallelen Agenten einen Compiler gebaut, der 99% der GCC-Testsuite besteht. Das Muster funktioniert. Die Frage ist nicht, ob Agentic Coding in Unternehmen Vibe Coding ablöst. Die Frage ist, wie schnell die Governance nachzieht.

Für Engineering-Leader ist der praktische Schluss klar: Vibe Coding ist ein Werkzeug für Exploration. Agentic Coding ist ein Werkzeug für Produktion. Governance ist die Schicht, die zeigt, welches Werkzeug das Team gerade nutzt und ob das für den Kontext angemessen ist. Wer diese Schicht nicht hat, hat Shadow AI mit einem Namensschild, auf dem “Produktivität” steht.

Häufig gestellte Fragen

Was ist der Unterschied zwischen Vibe Coding und Agentic Coding?

Vibe Coding ist promptgesteuerte Entwicklung, bei der man beschreibt, was man will, und die KI-Ausgabe akzeptiert, ohne sie zu prüfen. Agentic Coding nutzt autonome KI-Agenten, die Code planen, implementieren, testen und iterieren, unter strukturierter menschlicher Aufsicht. Der Kernunterschied ist Governance: Vibe Coding hat per Design null Oversight, während bei Agentic Coding die Aufsicht die Hauptaufgabe des Engineers ist.

Wer hat den Begriff Vibe Coding geprägt?

Andrej Karpathy, ehemaliger OpenAI-Mitgründer und Tesla-KI-Direktor, prägte “Vibe Coding” Anfang 2025. Anfang 2026 erklärte er den Begriff für überholt und schlug “Agentic Engineering” als genauere Beschreibung vor, wie professionelle Entwickler KI einsetzen: strukturierte Agentenorchestrierung statt lockeres Prompting.

Ist Vibe Coding sicher für den Unternehmenseinsatz?

Vibe Coding birgt erhebliche Risiken für den Unternehmenseinsatz. KI-generierter Code enthält durchschnittlich 2,74-mal mehr Sicherheitslücken, und Organisationen mit unkontrollierter Shadow-AI-Aktivität zahlen im Schnitt $670.000 mehr pro Datenpanne. Nur 9% der Unternehmen haben eine ausreichende KI-Governance-Reife. Vibe Coding sollte auf Prototyping und Exploration beschränkt bleiben, während für Produktionscode agentic Ansätze genutzt werden.

Was ist der Sandwich-Ansatz beim KI-gestützten Coding?

Der Sandwich-Ansatz kombiniert Vibe Coding für schnelle Exploration (Prototypen, Machbarkeitstests) mit Agentic Coding für die Produktionsimplementierung (strukturierte Specs, automatisiertes Testing, Security-Scanning). Menschliche Prüfung erfolgt an Entscheidungsgrenzen statt bei jeder Codezeile. Dieses Hybridmodell bewahrt Geschwindigkeit und bietet gleichzeitig die Governance und Nachvollziehbarkeit, die Unternehmen brauchen.

Was sagt Anthropics 2026 Agentic Coding Trends Report?

Anthropics Report ergab, dass Entwickler KI in 60% ihrer Arbeit einsetzen und dabei 80-100% der delegierten Aufgaben aktiv beaufsichtigen. Zentrale Trends sind der Wechsel von Single-Agent zu Multi-Agent-Workflows, erweiterte Agenten-Sessions über Stunden oder Tage und die Verlagerung von Engineering-Rollen hin zu Architektur, Systemdesign und Agentenaufsicht statt direktem Codeschreiben.

Was Vibe Coding wirklich bedeutet (und was nicht)#

Das Shadow-AI-Problem#

Was Agentic Coding verändert#

Wie agentic Workflows in Unternehmen aussehen#

Der Sandwich-Ansatz: Warum Hybridmodelle gewinnen#

Was die Governance-Lücke kostet#

Wie es weitergeht#

Häufig gestellte Fragen#

Was ist der Unterschied zwischen Vibe Coding und Agentic Coding?#

Wer hat den Begriff Vibe Coding geprägt?#

Ist Vibe Coding sicher für den Unternehmenseinsatz?#

Was ist der Sandwich-Ansatz beim KI-gestützten Coding?#

Was sagt Anthropics 2026 Agentic Coding Trends Report?#