AI Harness | Simeon Zickert

Nicht das Modell entscheidet über Erfolg oder Misserfolg meiner Arbeit. Es ist das Drumherum: der Kontext, das Gedächtnis, Skills, MCPs, Hooks, Systemprompts.

Im Januar habe ich ein Video gehsehen auf dem Kanal von NetworkChuck, und kurz danach saß ich zum ersten Mal in PAI. Seitdem hat sich die Art wie ich Arbeite komplette geändert.

Alle schauen auf die neuesten modelle. GPT oder Claude, welche Version, welcher Benchmark, lohnt sich der Umstieg. Ich glaube, das ist die falsche Ebene. Ja klar sind die Modelle nicht unwichtig. Aber den größeren Unterschied macht das Drumherum.

Ein nacktes Sprachmodell beantwortet deine Frage. Einmal. Dann ist es fertig, und beim nächsten Mal fängt es wieder bei null an, ohne zu wissen, was ihr letzte Woche zusammen gemacht habt. Das Drumherum nennt sich Harness. Ein Agent Harness ist der Code rund um ein Sprachmodell, der ihm ein Gedächtnis gibt, Werkzeuge und einen festen Ablauf, also genau das, was ein nacktes Modell allein nicht hat. Seit ich PAI nutze, muss ich nicht mehr jedes Mal von vorn anfangen. Mein Assistent weiß, wo ich in den Projekten stehe, er hat ein ordentliches Gedächtnis, und er wählt selbst, wie viel Aufwand eine Aufgabe braucht.

Das Modell allein bringt nichts ans Ziel

Ein Sprachmodell allein ist ein Fahrradrahmen mit zwei Rädern. Erst Kurbel, Kette, Kiste, Gurte und Gepäckträger machen daraus das, was morgens die Kinder zur Kita bringt.

Den Begriff Harness Engineering, also das gezielte Bauen an diesem Drumherum, hat Anfang des Jahres Mitchell Hashimoto geprägt, der Mann hinter Terraform.

Das Modell liefert die Rohleistung. Das Harness macht daraus etwas, das sich erinnert, Werkzeuge benutzt und eine Aufgabe zu Ende bringt.

Was ein Agent Harness wirklich ist

Das Herz davon ist eine Schleife. Das Harness ruft das Modell auf, lässt es ein Werkzeug benutzen, gibt ihm das Ergebnis zurück und lässt es weitermachen, bis die Aufgabe erledigt ist. Ohne diese Schleife hast du einen Chat. Mit ihr einen Agenten.

Wenn du so ein Harness aufschraubst, findest du fast immer dieselben Teile:

Den Systemprompt: die feste Grundanweisung, die dem Modell seine Rolle und seine Regeln gibt.
Werkzeuge, Skills und MCPs: alles, was das Modell handeln lässt statt nur antworten.
Die Infrastruktur: ein Dateisystem als Gedächtnis, eine abgeschottete Sandbox, ein Browser.
Die Orchestrierung: das Abspalten von Unteragenten, das Hin- und Herreichen zwischen Modellen.
Hooks und Middleware: die festen Eingriffe zwischen den Schritten, die das Modell nicht umgehen kann.

Klingt nach viel. Ist es auch. Aber genau da steckt die Arbeit, nicht im Modell.

Und das Ganze stapelt sich

Jetzt wirds wild.

Claude Code ist schon ein Harness um die Modelle von Anthropic. Codex eins um die von OpenAI. Mein Harness “PAI” legt sich nochmal um Claude Code. Jede Schicht macht die darunter brauchbarer. Und je weiter oben du im Stapel bist, desto egaler wird, welches Modell ganz unten läuft.

Daniel Miessler, der Kopf hinter PAI, bringt es auf den Punkt: Der Abstand zwischen den Modellen ist klein, sobald das Geschirr sitzt. Das Modell wird austauschbar, das Drumherum wird der Vorteil.

Zwei Arten, ein Drumherum zu bauen

Das ist der Teil, der mich am meisten interessiert.

Du kannst dem System genau sagen, wie es etwas tun soll. Oder du sagst ihm, was für dich ein gutes Ergebnis ist.

Das Erste ist das Übliche, es kommt aus den alten Prompt-Tagen. Und es wird verschwinden, weil die Modelle von selbst immer besser wissen, wie.

Das Zweite bleibt. Dein Maßstab, dein Kontext, deine Projekte. Das kann dir kein besseres Modell abnehmen, weil es nur du hast.

Also such dir kein besseres Modell. Bau dir eine bessere Umgebung.

Die Umgebung, die lernt, gewinnt

Und die besten Umgebungen lernen mit.

Es gibt ein Harness namens Hermes von Nous Research, das sich nach jeder Aufgabe selbst eine neue Fähigkeit schreibt und behält. Es wird mit jedem Lauf ein Stück mehr deins. Genau das ist PAI für mich. Mein Harness sammelt, was ich ihm beibringe, legt sich Notizen und Skills an und kennt mich nächste Woche besser als heute. Ich habe es nicht von der Stange, ich habe es mir auf mich zugeschnitten, und es wächst mit jeder Sitzung weiter in meine Arbeit hinein. Was alles in meinem Stack steckt, steht auf meiner Tool-Seite.

Du musst dafür kein eigenes PAI bauen. Es gibt fertige Harnesses von der Stange. Claude Code merkt sich deinen Projektkontext, und von da aus schneidest du es dir Stück für Stück auf dich zu. Der Unterschied zwischen einem Werkzeug, das dich jeden Montag wie einen Fremden behandelt, und einem, das mit dir wächst, ist genau das.

Wenn du KI im Betrieb einsetzen willst, ist das die einzige Frage, die zählt: Lernt die Umgebung mit?

Und dann verschwindet das Geschirr

Irgendwann siehst du das Geschirr gar nicht mehr. Es rutscht dahin, wo heute das Betriebssystem sitzt: unsichtbar, immer da, kein Mensch redet drüber. Modell, Harness, Schichten, alles verschwindet im Hintergrund.

Übrig bleibt ein Assistent, mit dem du einfach redest und der den ganzen Stapel darunter für dich bedient.

Das ist keine ferne Vision. Das passiert gerade.

Worauf das hinausläuft

Das Modell wird immer austauschbarer. Ja, klar macht es einen Unterschied, ob ich ein State-of-the-Art-Opus-4.8 nutze oder ein Google Gemma 4. Aber bei den Spitzenmodellen wird es egaler, und Open Source holt auf. Wichtig ist die Umgebung, in der du dich bewegst. Die Umgebung, die dich kennt, die mit dir lernt, und die irgendwann so selbstverständlich wird, dass du sie vergisst.

Und daran baue ich gerade für mich. Seit Anfang des Jahres auf Claude Code mit PAI als Harness. Jeden Tag lernt mein Assistent Klaas ein Stück mehr, wie ich funktioniere, was mir wichtig ist, was ich nicht leiden kann und was für mich gut heißt. Und ich muss mich Woche für Woche weniger daran anpassen, wie mein Harness funktioniert. Ich glaube, in einem Jahr haben wir das alle. Ohne Nerdigkeit im Terminal und ohne große Sicherheitslücken.

Bis dahin: weniger aufs Modell schauen, mehr aufs Drumherum.