Die KI-Produktivitätsfalle: Warum KI-Tools mehr Arbeit schaffen statt weniger

Q: Was ist das Jevons-Paradoxon und wie gilt es für KI?

Das Jevons-Paradoxon besagt, dass größere Effizienz bei der Ressourcennutzung den Gesamtverbrauch erhöht statt senkt. Auf KI angewendet bedeutet es: Schnellere Aufgabenbearbeitung führt zu mehr zugewiesenen Aufgaben, höheren Qualitätsstandards und erweitertem Arbeitsumfang statt zu weniger Arbeitsstunden.

Foto von Tima Miroshnichenko auf Pexels Source

77 Prozent der Beschäftigten, die KI-Tools nutzen, sagen: Die Technologie hat ihre Arbeitsbelastung erhöht. Nicht verringert. Erhöht. Diese Zahl aus der Upwork-Studie 2024 sollte jedem CTO den Pitch-Deck-Stift aus der Hand fallen lassen. Das Versprechen war weniger Stunden, weniger Routinearbeit, mehr Raum für Kreativität. Die Realität, dokumentiert von Forschern aus Berkeley, dem MIT und Carnegie Mellon, sieht anders aus: KI macht dich schneller darin, Dinge zu produzieren, die niemand bestellt hat, bis dein Chef merkt, dass du sie produzieren kannst. Dann bestellt sie jeder. Willkommen in der KI-Produktivitätsfalle.

Die UC-Berkeley-Professoren Aruna Ranganathan und Hatim Rahman haben dieses Problem im Harvard Business Review auf den Punkt gebracht. Ihr Befund: KI-Tools erzeugen am Arbeitsplatz eine Variante des Jevons-Paradoxons. Effizienzgewinne führen nicht zu weniger Arbeit, sondern zu mehr, über zwei sich verstärkende Mechanismen.

Das Jevons-Paradoxon: Von der Dampfmaschine zum Chatbot

In den 1860er Jahren beobachtete der Ökonom William Stanley Jevons etwas Kontraintuitives: Je effizienter Dampfmaschinen wurden, desto mehr Kohle wurde verbraucht, nicht weniger. Günstigere Dampfkraft ermöglichte neue Anwendungen, und die Gesamtnachfrage überstieg die Einsparungen bei Weitem.

Ranganathan und Rahman identifizierten zwei Mechanismen, die genau diese Dynamik in KI-gestützten Arbeitsumgebungen erzeugen.

Mechanismus 1: Die Erwartungsspirale

Wenn KI einen Bericht in zwei Stunden statt acht ermöglicht, gibt dir dein Vorgesetzter keine sechs Stunden frei. Er vergibt vier weitere Berichte. Eine Studie über Data Scientists ergab: Generative KI-Tools verbesserten anfangs die Effizienz, aber Vorgesetzte reagierten mit mehr Aufgaben und engeren Deadlines. Die Zeitersparnis löste sich auf.

Dasselbe Muster zeigte sich auf Upwork: KI senkte Kosten und Zeit der Content-Produktion, also forderten Auftraggeber mehr Inhalte, kürzere Fristen und niedrigere Preise. Die Freelancer arbeiteten genauso hart, nur schneller und mit schlechteren Margen.

„Die Zeitersparnis wird von steigenden Erwartungen aufgefressen", erklärte Ranganathan in einem Haas-Podcast. „Vorgesetzte sehen, dass die Arbeit schneller erledigt wird und denken: Gut, dann mach mehr. Das Laufband wird schneller."

Mechanismus 2: Der Qualitätsaufzug

Wenn jeder Anwalt KI-Recherchetools hat, reichen fünf zitierte Präzedenzfälle nicht mehr. Du brauchst zwanzig. Wenn jeder Designer Midjourney nutzt, sind drei Konzeptvorschläge kein Alleinstellungsmerkmal mehr. Du brauchst zwölf.

KI hebt das Minimum dessen an, was als professionelle Qualität gilt. Die National Science Foundation dokumentierte, dass wissenschaftliche Publikationen zwischen 2010 und 2022 um über 50% gestiegen sind, ein Trend, der sich durch KI-Schreibtools beschleunigt. Mehr Papers werden veröffentlicht, aber kein einzelner Forscher hat es leichter.

In der Rechtsbranche beschleunigten KI-Recherchetools die Vorbereitung von Schriftsätzen. Die Branche reagierte, indem sie neu definierte, was ein „gut recherchiertes" Argument ausmacht. Anwälte verbringen jetzt mehr Zeit mit der Überarbeitung von Dokumenten, weil ihre KI-ausgestatteten Kollegen dasselbe tun.

Was die Produktivitätszahlen wirklich zeigen

Die Unternehmenserzählung sagt: KI befeuert die Produktivität. Die Forschung sagt: Es ist komplizierter.

Der MIT-Realitätscheck

MIT-Forscher Daniel Rock und Neil Thompson führten eine der gründlichsten KI-Produktivitätsstudien durch. Ergebnis: Die durch generative KI gesparte Zeit war 0,50 Dollar pro Arbeitnehmer pro Tag wert, etwa 0,5% der Gesamtarbeitszeit. Das ist der Preis eines Kaugummis, keine Produktivitätsrevolution.

Die Studie kontrollierte für Aufgabentyp, Qualifikation und Tool-Zugang. Die geringen Gewinne lagen nicht daran, dass Beschäftigte KI nicht nutzten. Sie taten es. Aber die Vorteile wurden durch den Overhead beim Management der KI-Outputs neutralisiert: Fehler prüfen, Formatierungen korrigieren, Halluzinationen aussortieren.

Googles 6%-Befund

Google führte eine interne Studie mit über 10.000 Entwicklern über sechs Monate durch. Ergebnis: 6% mehr Code-Output. Entwickler akzeptierten etwa 25% der KI-Vorschläge. Junior-Entwickler profitierten stärker als erfahrene, was logisch ist: KI-Coding-Assistenten geben Anfängern Zugriff auf Muster-Bibliotheken, die Senioren bereits im Kopf haben.

Die GitHub-Copilot-Studie, die eine 55% schnellere Aufgabenbearbeitung behauptete, wurde vielfach kritisiert, weil sie einfache HTTP-Server-Tasks in unbekannten Codebases testete. GitHubs eigene Umfrage unter 2.000 Entwicklern ergab: 88% fühlten sich produktiver, aber nur 10% berichteten von „signifikanten" Verbesserungen. Stack Overflows Daten sind ernüchternder: 97% der Entwickler nutzten KI-Tools, aber nur 3,4% sahen Produktivitätszuwächse über 25%.

Das Burnout-Signal

Microsofts Work Trend Index ergab: 68% der Beschäftigten sagen, sie haben nicht genug konzentrierte Arbeitszeit. Gallups Daten für 2025 zeigen das globale Engagement auf dem niedrigsten Stand seit einem Jahrzehnt. Das Pew Research Center fand: Nur 36% der KI-nutzenden Beschäftigten sagen, die Technologie habe sie produktiver gemacht.

Marc Zao-Sanders formulierte es in seinem HBR-Beitrag über KI-Burnout treffend: „Es ist, als würde man jemandem ein Auto geben, das gelegentlich gegen Wände fährt, und erwarten, dass er sich am Steuer entspannt." KI-Tools ersetzen keine anderen Tools. Sie kommen obendrauf. Beschäftigte jonglieren jetzt KI-Chatbots neben E-Mail, Slack, Projektmanagement-Plattformen und Videokonferenzen.

Das historische Muster, das niemand hören will

Das ist alles schon mal passiert. Jedes Mal.

E-Mail sollte die Kommunikation vereinfachen. Der durchschnittliche Büroangestellte bearbeitet heute über 120 E-Mails pro Tag. Von „vereinfacht" keine Spur.

Tabellenkalkulationen sollten Buchhaltern Rechenarbeit abnehmen. Stattdessen ermöglichten sie immer komplexere Modelle und Berichtsanforderungen. Die Gesamtstunden für Finanzanalysen stiegen.

Smartphones versprachen Flexibilität: Arbeite von überall, nach deinem Zeitplan. Das Ergebnis war die Auflösung der Grenze zwischen Arbeit und Privatleben.

Jede dieser Technologien hielt ihr Kernversprechen (schnellere Kommunikation, schnellere Berechnungen, mobiles Arbeiten) und erweiterte gleichzeitig den Umfang dessen, was erwartet wurde. Der Effizienzgewinn war real. Die Arbeitsentlastung nicht. KI folgt demselben Drehbuch, nur schneller.

Der Unterschied bei KI ist das Adoptions-Tempo. Frühere Technologien brauchten Jahre, um eine Belegschaft zu durchdringen. 79% der Organisationen betreiben bereits KI-Agenten in Produktion, laut Mercer. Der Jevons-Paradoxon-Zyklus, den E-Mail ein Jahrzehnt brauchte, läuft bei KI in Monaten ab.

Für den DACH-Raum kommt eine weitere Dimension hinzu: Der DGB berichtet, dass bereits 27% der deutschen Arbeitnehmer KI-Tools nutzen. Die DSGVO und der EU AI Act setzen zwar Grenzen beim Datenschutz, aber sie regulieren nicht, wie Unternehmen die Erwartungsspirale intern managen. Betriebsräte, die im deutschen Arbeitsrecht eine starke Rolle spielen, könnten hier zum entscheidenden Korrektiv werden.

Das Laufband stoppen: Was tatsächlich funktioniert

Die Falle zu erkennen ist der erste Schritt. Was die Forschung an konkreten Gegenmaßnahmen vorschlägt.

Subtrahieren vor dem Addieren

Kelly Monahan, Managing Director des Upwork Research Institute, argumentiert: Das Kernproblem ist additiv. Unternehmen legen KI auf bestehende Workloads drauf, ohne etwas wegzunehmen. „Noch mehr Technologie auf ohnehin übervolle Teller zu stapeln, wird keine Produktivitätsprobleme lösen."

Vor dem Einsatz von KI-Tools sollte feststehen, welche Aufgaben komplett entfallen, nicht nur schneller werden. Ein Bericht, der nicht existieren sollte, braucht keine KI, die ihn schneller schreibt.

Output-Limits statt Geschwindigkeitsziele

Die Erwartungsspirale setzt ein, wenn Organisationen KI-Erfolg am Output-Volumen messen. „Wir haben 4x mehr Berichte produziert" ist kein Produktivitätsgewinn, wenn die zusätzlichen drei niemand liest.

Organisationen, die der Falle entkommen, setzen Output-Limits: gleiche Anzahl an Ergebnissen, höhere Qualität, die gesparte Zeit fließt in strategisches Denken, Weiterbildung oder (radikaler Gedanke) pünktlichen Feierabend. ActivTraks Gabriela Mauch formulierte es direkt: „Wenn man neue Technologie auf bestehende Workloads drauflegt, ohne etwas wegzunehmen, steigert man nicht die Produktivität. Man steigert den Burnout."

Beschäftigten die Kontrolle über die Integration geben

Ein systematischer Review im Journal of Occupational Health ergab: KI-bedingter Technostress ist ein signifikanter Prädiktor für Burnout, besonders wenn Beschäftigte keine Autonomie darüber haben, wie KI-Tools in ihre Arbeit integriert werden. Die Lösung ist nicht „mehr Schulung". Es ist, Beschäftigte entscheiden zu lassen, welche Teile ihres Workflows von KI profitieren und welche nicht.

Calix-CEO Michael Weening verfolgte diesen Ansatz: Er ließ Beschäftigte ihre eigenen KI-Agenten bauen, was zu über 700 selbst erstellten Agenten führte. Wenn Beschäftigte die Automatisierung kontrollieren, sehen sie sich als Vorgesetzter des Agenten, nicht als sein Ersatz.

Messen, was zählt

Hört auf, KI-ROI an verarbeiteten Tokens, erledigten Aufgaben oder gesparter Zeit bei Einzelaktivitäten zu messen. Messt stattdessen Mitarbeiterzufriedenheit, konzentrierte Arbeitszeit, Arbeitsstunden und Output-Qualität. Wenn eure KI-Einführung zwei Stunden pro Person pro Tag spart, aber alle eine Stunde länger arbeiten, weil die Erwartungen gewachsen sind, habt ihr einen Nettogewinn von einer Stunde und ein Kulturproblem, das euch in der Fluktuation teuer zu stehen kommt.

HR-Technologie-Analyst Josh Bersin nennt es das Burnout-Paradoxon: Organisationen optimieren auf Effizienz-Kennzahlen und ignorieren die Wellbeing-Kennzahlen, die tatsächlich Retention und langfristige Leistung vorhersagen. Die Unternehmen, die von KI profitieren werden, sind diejenigen, die bereit sind, Effizienzgewinne in weniger Arbeit umzuwandeln, nicht nur in andere Arbeit.

Häufig gestellte Fragen

Was ist die KI-Produktivitätsfalle?

Die KI-Produktivitätsfalle ist ein Phänomen, das von UC-Berkeley-Forschern Aruna Ranganathan und Hatim Rahman beschrieben wurde. KI-Tools reduzieren die Arbeitsbelastung nicht, sondern erhöhen sie durch steigende Arbeitgebererwartungen und eskalierende Qualitätsstandards. Es handelt sich um eine Arbeitsplatz-Variante des Jevons-Paradoxons, bei der größere Effizienz zu größerer Gesamtnachfrage führt.

Erhöht KI tatsächlich die Arbeitsbelastung?

Ja, laut mehreren Studien. Upwork fand, dass 77% der Beschäftigten sagen, KI habe ihre Arbeitsbelastung erhöht. MIT-Forscher ermittelten eine Ersparnis von nur 0,50 Dollar pro Tag. Nur 36% der KI-nutzenden Beschäftigten sagten dem Pew Research Center, dass KI sie produktiver gemacht habe. Die Gewinne bei einzelnen Aufgaben werden durch erweiterte Erwartungen und neue Arbeit absorbiert.

Was ist das Jevons-Paradoxon und wie gilt es für KI?

Das Jevons-Paradoxon, erstmals in den 1860er Jahren beobachtet, besagt, dass größere Effizienz bei der Ressourcennutzung den Gesamtverbrauch erhöht statt senkt. Auf KI angewendet bedeutet es: Schnellere Aufgabenbearbeitung führt zu mehr zugewiesenen Aufgaben, höheren Qualitätsstandards und erweitertem Arbeitsumfang statt zu weniger Arbeitsstunden.

Wie können Unternehmen KI-bedingten Burnout vermeiden?

Die Forschung empfiehlt vier Strategien: Aufgaben komplett streichen statt nur beschleunigen (subtrahieren vor addieren), Output-Limits statt Geschwindigkeitsziele setzen, Beschäftigten Kontrolle über die KI-Integration geben, und Wellbeing-Kennzahlen wie konzentrierte Arbeitszeit und Zufriedenheit neben Effizienzkennzahlen messen.

Wie produktiv macht KI Beschäftigte wirklich?

Weniger als erwartet. Das MIT ermittelte 0,50 Dollar Ersparnis pro Tag. Googles interne Studie mit 10.000 Entwicklern zeigte 6% mehr Output. Stack-Overflow-Daten zeigen, dass nur 3,4% der Entwickler Produktivitätszuwächse über 25% sahen. Die Kluft zwischen wahrgenommener und gemessener Produktivität ist erheblich.

Das Jevons-Paradoxon: Von der Dampfmaschine zum Chatbot#

Mechanismus 1: Die Erwartungsspirale#

Mechanismus 2: Der Qualitätsaufzug#

Was die Produktivitätszahlen wirklich zeigen#

Der MIT-Realitätscheck#

Googles 6%-Befund#

Das Burnout-Signal#

Das historische Muster, das niemand hören will#

Das Laufband stoppen: Was tatsächlich funktioniert#

Subtrahieren vor dem Addieren#

Output-Limits statt Geschwindigkeitsziele#

Beschäftigten die Kontrolle über die Integration geben#

Messen, was zählt#

Häufig gestellte Fragen#

Was ist die KI-Produktivitätsfalle?#

Erhöht KI tatsächlich die Arbeitsbelastung?#

Was ist das Jevons-Paradoxon und wie gilt es für KI?#

Wie können Unternehmen KI-bedingten Burnout vermeiden?#

Wie produktiv macht KI Beschäftigte wirklich?#