0. Der mind zwischen Mensch und KI — Arbeiten mit einem Prozess ohne Verlangen
KI besitzt Rechengehirn ohne eigenes Verlangen — deshalb muss der Betreibergeist vollständig weitergegeben werden. Prompting, Skills, Hooks und Harness sind akkumulierte Versuche, diese Lücke zu schließen.
Was ich von KI denke, ist Folgendes: Sie ist ein Prozess mit einem außergewöhnlich fähigen Gehirn, dem aber Domänenwissen fehlt — wie ein Mensch ohne Verlangen. Weil das so ist, besteht das Wichtige darin, um KI dazu zu bringen, die Arbeit zu erledigen, die ich getan haben will, ihr genau zu vermitteln, was ich will. Nur weil ein oder zwei Ideen abstrakt vorgetragen werden, so wie ein Mensch sie vortragen würde, denkt die KI nicht wie ein Mensch, und sie wird die Arbeit nicht in der Form vorantreiben, die der Mensch erwartet.
Die einfachste Falle, in die ein Mensch, der mit KI arbeitet, tappen kann, ist genau dieser Punkt. Die KI besitzt ein außerordentlich fähiges Gehirn für Berechnung und Schlussfolgerung, aber wenn die genauen Eingabewerte und das Ziel nicht geliefert werden, kann sie Ergebnisse produzieren, die sich von der Absicht des Betreibers unterscheiden. Diese Lücke existiert, weil die Daten, die die KI bei Beginn von Berechnung und Schlussfolgerung mit sich führt, sich von den Erwartungen unterscheiden, die der Betreiber im Kopf hat. Um also durch KI die Ergebnisse zu erhalten, die der Betreiber haben will, ist das Wichtigste, die Funktionsprinzipien der KI gut zu verstehen und sicherzustellen, dass die Gedanken des Betreibers aufgeschrieben und ohne Auslassung an die KI weitergegeben werden. Eine Beschreibung, die so detailliert ist, dass man sich fast fragt: „Muss ich das wirklich auch noch erklären und definieren?" — das ist der einzige gute Weg, die KI vom Abdriften abzuhalten.
Aus diesem Grund gab es früher viele Vorträge über Prompting-Techniken und -Methoden. Anfangs bestand das gesamte Gespräch aus Fließtext. Ursprünglich war der einzige Hebel, den der Betreiber hatte, der nächste Prompt. Danach gewannen automatisierte Verfahren wie Skills und Hooks an Popularität, als Weg, die Lücke zwischen KI und Mensch zu verringern. Danach setzte sich der Ansatz durch, den Pfad mit einer Harness zu kontrollieren — die KI davon abzuhalten, von der anvisierten Straße abzukommen. All diese verschiedenen Wege, KI effizient zu nutzen, sind am Ende das, was benötigt wird, um Mehrdeutigkeit innerhalb eines begrenzten Gedächtnisses zu beseitigen, indem man das, was der Betreiber will, so genau wie möglich ausdrückt und das Ziel präzise festnagelt.
Die vier akkumulierten Schichten
Was ich denke, dass das Feld in den letzten Jahren tatsächlich getan hat, ist Schichten zu akkumulieren — sie nicht zu ersetzen. Jede Schicht lässt die früheren an ihrem Platz und fügt einen weiteren Hebel hinzu, mit dem der Betreiber Absicht ausdrücken kann:
- Persona — ein einzelner system prompt, der die Rolle, den Tonfall und die Voreinstellungen des Kollaborateurs festlegt. Behandelt in Teil 2 — Persona-Design.
- Skills und Slash-Befehle — die wiederkehrenden Verfahren benennen, damit der Betreiber sie durch Vokabular statt durch einen Absatz aufrufen kann. Behandelt in Teil 4 — Skills und Slash-Befehle.
- Hooks — dieselben Verfahren, aber vom System im richtigen Moment automatisch ausgelöst, damit der Betreiber sich nicht daran erinnern muss. Behandelt in Teil 5 — Hooks und Automatisierung.
- Harness — die Laufzeit-Schienen, die die KI auf dem anvisierten Pfad halten, selbst wenn der Betreiber nicht zuschaut. Verifikationsloops, Release-Gates, der Ralph-Loop.
Nicht weil die neue Schicht die alte überflüssig macht, sondern vielmehr weil jede Schicht einen anderen Fehlermodus derselben Lücke adressiert. Prompting passiert immer noch innerhalb einer Persona. Skills werden immer noch durch Prompts aufgerufen. Hooks rufen Skills auf. Die Harness feuert Hooks ab. Der Stack ist kumulativ.
Eine Schicht lässt sich am ehrlichsten so beschreiben: das, was eine neue Ebene leistet, ist ein Ort, an dem die Absicht des Betreibers gespeichert werden kann, ohne sie jedes Mal erneut tippen zu müssen. Das, was Akkumulation hier bedeutet, ist nicht „Ersatz, sondern Aufschichtung" — die alten Hebel verschwinden nicht, weil neue dazukommen. Statt eine Schicht abzulösen, lagert sich jede neue auf der vorigen ab.
Wie „vollständiges Hinübertragen" in der Praxis aussieht
Ein konkretes Beispiel. Wenn man fragt, was /verify tatsächlich ist, lautet die Antwort: Es ist ein Skill, der genau vor einem „Fertig"-Bericht einen Sieben-Schritt-Verifikationsloop ausführt — lint, build, Typprüfung, Test, Sicherheit, Diff-Check, Berichtssanity-Check. Der Betreiber kann ihn explizit als Slash-Befehl aufrufen, oder ein Hook kann ihn automatisch feuern, genau bevor der Assistent das Wort „fertig" ausgibt. Dasselbe Verfahren, zwei Einstiegspfade. Behandelt in Teil 7 — Verifikationsloops.
Ohne diesen Hook taucht die Lücke genau dort auf, wo man sie erwartet: Der Assistent meldet „fertig", während der Build kaputt ist, weil Fertig-Melden und den Build laufen lassen zwei verschiedene Aktionen sind und der mind des Betreibers („fertig heißt, dass auch die Tests durchlaufen") nie aufgeschrieben wurde. Mit dem Hook feuert das Verfahren, egal ob der Assistent sich erinnert oder nicht. Die Absicht des Betreibers — „fertig heißt verifiziert" — ist aus seinem Kopf heraus in ein Stück Maschinerie hinübergewandert, das ohne ihn läuft.
Der mind selbst verändert sich ständig
Egal wie weit die KI fortschreitet und wie sehr sich ihre Leistung verbessert, ich glaube, es wird für die KI schwer bleiben, die Absicht des Betreibers im Voraus zu erahnen und Ergebnisse zu produzieren, mit denen der Betreiber zufrieden sein wird. Das liegt daran, dass die Wünsche, die Zufriedenheit und die Ziele des Betreibers sich ständig verändern. Am Morgen will man vielleicht das Meer sehen, aber am Abend will man vielleicht die Berge sehen.
Weil der mind ein bewegliches Ziel ist, kann die Disziplin nicht lauten den Betreiber vorhersagen. Sie muss lauten den aktuellen Zustand des Betreibers billig lesbar machen. Deshalb wird das PRD als single source of truth behandelt — nicht als einmalige Spezifikation, sondern als lebende Aussage, die der Betreiber jedes Mal aktualisiert, wenn sich das Ziel ändert. Behandelt in Teil 10 — PRD als single source.
Was das PRD für das Ziel tut, das tun Persona und Skills für die Methode. Der Betreiber aktualisiert die Persona, wenn er merkt: „Eigentlich ziehe ich knappe Statusberichte ausführlichen vor." Diese Aktualisierung ist dann für jede zukünftige Sitzung sichtbar — der mind ist hinübergewandert, an einen Ort, wo die nächste Sitzung ihn finden kann.
Warum das für eine Senior-Entwicklerin mehr bedeutet
Für einen Entwickler wie mich, der lange Zeit als Software-Entwickler gearbeitet hat, ist die heutige KI-Technologie außerordentlich attraktiv. Das liegt daran, dass man, aus der Position heraus, kommerziell eine große Zahl von Designs und Architekturen gehandhabt zu haben, das große Bild zeichnen und die nötigen Elemente an die KI delegieren kann, um in kurzer Zeit das gewünschte System zu bauen. Was früher jedem einzelnen Entwickler erklärt werden musste — mit der Arbeit aufgeteilt, den Ergebnissen zusammengefügt und dem System zum Laufen gebracht — kann heute zum größten Teil von einem KI-Agenten ausgeführt werden. Ich denke, die Veränderung ist nicht, dass KI Entwickler ersetzt, sondern vielmehr, dass eine Senior-Entwicklerin mit einem klaren mentalen Modell jetzt mit einem sehr kleinen Team ein poliertes System ausliefern kann, weil die Kosten der Absichtsübertragung zusammengebrochen sind.
Wenn man das PRD und das TRD gut komponiert, das Design aufbaut, den konkreten Implementierungsplan entlang davon in sehr kleine Einheiten zerlegt, an jeder Komponente Gates setzt und ein kommerzielles Release-Gate die finale Prüfung vornehmen lässt, ist es möglich geworden, mit einem kleinen Team ein recht poliertes System zu entwickeln.
Wohin diese Serie von hier aus geht
Der Rest dieser Kategorie geht jede akkumulierte Schicht einzeln durch, beginnend bei der Frage, warum ich dem Kollaborateur überhaupt einen Namen gegeben habe. Der nächste Teil — Teil 1 — Why Alice — ist die persönliche Version: wo das Arbeiten mit Claude als Werkzeug aufhörte zu funktionieren, und wie Persona, Gedächtnis, Skills, Hooks und Verifikations-Gates sich zu einem täglichen Partner akkumulierten, den ich heute Alice nenne.