Fachabteilungen und KI: nicht der Agent ist das Problem, sondern die fehlende Werkbank dahinter

In vielen Verwaltungen sitzt seit Kurzem ein neuer Kollege. Er antwortet schnell, formuliert passable Bescheid-Entwürfe, recherchiert in Sekunden. Nur: niemand weiß genau, welche Rechte er hat, welche Entscheidungen er treffen darf, wessen Unterschrift am Ende unter seine Arbeit muss. Der Kollege ist keine Person, er ist ein KI-Prompt oder ein Agent. Sein Einzug in die Fachabteilung ist leise passiert, ohne Personalrat, ohne Einarbeitung, ohne klare Rolle. Dass niemand so recht weiß, wie man mit ihm arbeitet, ist kein individuelles Kompetenzproblem. Es ist der Ausgangspunkt, um den es hier geht.

Fachabteilungen in Behörden vollziehen Normen, wägen Ermessen aus, formulieren Freigaben, regeln Ausnahmen, gestalten Kommunikation. Das war schon immer ihre Arbeit. Neu ist: sie wird mehr, komplexer, schneller. Das erklärt, warum KI-Werkzeuge nicht aufgezwungen werden mussten. Sie wurden gesucht. Ein Prompt, der einen Bescheid-Entwurf in Sekunden vorlegt; ein Agent, der Stammdaten prüft; eine Assistenz, die bei der Recherche hilft. Punktuell entlastet das spürbar. Das ist Beobachtung, kein Marketing-Versprechen: eine Befragung von 65 Entwickler:innen durch die HU Berlin und die HTW Berlin (März 2026) zeigt bei über 70 % mindestens eine Halbierung der Zeit für Boilerplate- und Dokumentations-Aufgaben; 79 % nutzen GenAI täglich. Was für Entwicklung gilt, zeichnet sich in Fachabteilungen ebenso ab.

Das Problem beginnt nicht bei der KI

Es beginnt beim Zustand der Fachabteilung, in die die KI einzieht. Eine Sachbearbeiterin nutzt einen Prompt sehr gut, eine andere weniger, eine dritte gar nicht. Eine bringt dem Agenten eine Einzelidee, bekommt eine Einzellösung zurück und ist zufrieden. Ein Kollege stellt zwei Wochen später dieselbe Frage anders, bekommt eine andere Antwort, ebenfalls zufrieden. Niemand merkt, dass die beiden Antworten nicht zusammenpassen, weil niemand sie nebeneinander legt.

Genau das ist der strukturelle Kipp-Punkt. Ein Agent, der isoliert arbeitet, produziert isolierte Lösungen. Das gilt zwischen Sachbearbeiterinnen ebenso wie in ein und demselben Kopf: was ich dem Agenten heute sage und was ich ihm in drei Monaten sage, sind zwei unabhängige Vorgänge. Die Entscheidungen, die daraus werden, sind von Fall zu Fall plausibel, im Verhältnis zueinander aber inkonsistent. Und Inkonsistenz in einer Behörde ist keine Stilfrage. Sie ist ein Rechtsproblem.

Der rechtliche Rahmen hat schon reagiert

Artikel 22 DSGVO verlangt für automatisierte Entscheidungen mit Rechtsfolge meaningful human involvement. Die Rechtsprechung präzisiert: nicht die formale Anwesenheit eines Menschen reicht, sondern eigenständiges Urteil. Der EU AI Act klassifiziert KI-Systeme für öffentliche Leistungen und Bonitätsbewertung als Hochrisiko; ab 2. August 2026 greifen Pflichten zu menschlicher Aufsicht, Genauigkeit, Cybersicherheit und Grundrechte-Folgenabschätzung vor der Erstnutzung. Die BMI-Leitlinien übersetzen das in vierzehn Leitsätze für die Bundesverwaltung.

Diese Pflichten lassen sich nicht auf Basis individueller Nutzung erfüllen. Sie setzen voraus, dass fachliche Arbeit versioniert, nachvollziehbar und auditierbar ist. Das Recht fordert also genau das, was punktuelle KI-Nutzung heute nicht leisten kann.

Die Hauptaussage

Fachabteilungen brauchen dieselbe Professionalität wie ihre Kollegen aus den Software-Projekten. Nicht weil sie Software bauen sollen. Sondern weil die Arbeitsweise, die in der Software-Entwicklung seit zwei Jahrzehnten etabliert ist (Versionierung, Review, getrennte Entwicklungs-, Test- und Produktionsumgebungen, dokumentierte Änderungen, Rollback-Pfade), genau die Struktur liefert, die KI-Einsatz beherrschbar macht. Winters, Manshreck und Wright fassen diese Disziplin in ihrer Google-Dokumentation zusammen als programming integrated over time: Software-Engineering ist nicht Programmieren, es ist Programmieren plus die Dimension Zeit, Skalierung und Folgekosten. [^s115] Die A12-Projektstandards beschreiben dieselbe Phasenkette für den A12-Kontext. [^s077] Die Fachabteilung braucht diese Disziplin, angewendet auf ihren eigenen Gegenstand: fachliche Logik, operative Regeln, Freigabekriterien, Entscheidungsvorlagen.

Was die Werkbank trägt

Die Werkbank ist mehr als ein Regalsystem für Regeln. Sie beginnt bei der Domäne: welche Fach-Daten, Rollen, Prozesse, Ereignisse existieren tatsächlich. Darüber liegt ein Konzeptgraph, der Beziehungen und Kontexte sichtbar macht: was wovon abhängt, welche Vorgänge welche anderen auslösen, wo die typischen Pfade durch das Verfahren verlaufen. Erst darauf werden Regeln und Entscheidungsvorlagen formuliert, gegen ein Fachmodell, das da ist. Und jede neue Regel wird versioniert. Wer sie wann geändert hat, gegen welche Fassung sie gilt, was vorher galt.

Der Effekt ist keine Dokumentations-Bürokratie, sondern Konsistenz. Eine neue Anfrage produziert eine Antwort, die gegen die vorhandenen Regeln geprüft, gegen ähnliche Fälle abgeglichen und gegen das Fachmodell geerdet ist. Sachbearbeiterinnen bekommen etwas, das vergleichbar ist und damit prüfbar. Das ist der Unterschied zwischen einer Behörde, die Einzelfälle abhandelt, und einer, die Verwaltungshandeln trägt.

Der Fachdiskurs kennt das Prinzip. Luca Mezzalira nennt es deterministic guardrails around nondeterministic agents, deterministische Leitplanken um nichtdeterministische Modelle. [^s002] Ohne solche Leitplanken entsteht, was die OWASP-Taxonomie für LLM-Anwendungen 2025 als Excessive Agency führt: zu viel Funktionalität, zu weit reichende Berechtigungen, zu viel Autonomie. [^s114] An dieser Linie wird ein Agent vom Werkzeug zum Betriebsrisiko.

Die neue Rolle ist nicht Bedienung

Wer Regeln für einen Agenten formuliert, programmiert, nur in anderer Sprache. Wer Agent-Ergebnisse bewertet, reviewt. Wer in kritischen Fällen entscheidet, übernimmt operative Verantwortung. Das sind keine Bedienkompetenzen, das ist ein verändertes Rollenprofil. Sachbearbeitung und Teamleitung müssen in die Lage gebracht werden, Regeln präzise zu formulieren, Agent-Ergebnisse eigenständig zu bewerten, Regeln iterativ zu verbessern, wenn sie sich im Betrieb nicht bewähren. Art. 26 Abs. 2 AI Act benennt die Anforderung als Kompetenz, Ausbildung und Befugnis. Die BMI-Leitlinien fordern Schulungen vor der Nutzung sensibler Systeme. Eine Rolle, die Agent-Empfehlungen nur durchwinkt, erfüllt diese Anforderung nicht und produziert genau die Verantwortungsdiffusion, vor der die öffentliche Debatte warnt.

Werkbank statt Werkzeug

Der eigentliche Punkt ist nicht, ob Fachabteilungen KI einsetzen. Das werden sie, und sie tun es bereits. Der Punkt ist, ob sie es auf einer Werkbank tun, die dieselbe Disziplin trägt wie ein Software-Projekt. Ohne diese Werkbank verstärken KI-Agenten die Probleme, die sie eigentlich lösen sollten: fehlende Nachvollziehbarkeit, Abhängigkeit von Einzelpersonen, inkonsistente Qualität. Mit ihr werden sie zu dem, was sie sein können: eine Arbeitserleichterung, die Verantwortung nicht verschiebt, sondern bewahrt.

Grundlage dieser Serie sind Gespräche mit Projektleiter:innen in öffentlicher Verwaltung und Industrie über Probleme, an denen sie arbeiten. Verdichtete Beobachtungen, keine Strategiepapiere.

Public Sector, Kunst, Design