Ich dachte, ich sei nah dran. Dann kam der Realitätscheck. - 50

Lesezeit: 499 Sekunden

Seit ChatGPT im Spätjahr 2022 herauskam, habe ich mitgemacht. Gelesen, ausprobiert, die Werkzeuge in meinen Alltag geholt, sogar eigene kleine Anwendungen gebaut. „Du bist da echt ein Nerd“, hieß es aus einem Umfeld nicht selten. Und tatsächlich: Ich war überzeugt, dicht am Puls zu sein. Dann ergab sich die Gelegenheit, eine Weiterbildung mitzumachen – dreieinhalb Monate, Vollzeit, veranstaltet von HERZBLUT. Das erste Drittel liegt hinter mir, zwanzig Tage. Und, ehrlich: Ich hatte doch ein paar Wissenslöcher. Die sind jetzt gefüllt. Aber da kommt ja noch mehr.

Es ist ein ganz normaler Wochenvormittag. Kein Hackathon, keine Sonderlage. Headset auf, der Bildschirm geteilt: links ein digitales Whiteboard voller bunter Kärtchen, rechts die Kacheln der anderen Teilnehmenden. Auf dem Board steht eine Frage, die ich für eine leichte hielt. Was ist eigentlich der Unterschied zwischen Machine Learning und Deep Learning?

Und ich merke: Ich komme ins Schwimmen. Ich benutze diese Begriffe seit Jahren. Ich habe sie in Artikel geschrieben, in Diskussionen geworfen, in Präsentationen fallen lassen. Aber sie sauber auseinanderhalten, ohne zu raten? Das gelingt mir gerade nicht. Und das heißt, ich muss es zugeben: Ich weiß weniger, als ich dachte.

Dreieinhalb Monate, und der Reihe nach

Kurz zur Einordnung: Diese Weiterbildung ist nichts, was man abends nebenher macht. Sie läuft in Vollzeit, über dreieinhalb Monate. Zwanzig Tage davon sind vorbei, das erste von drei Dritteln. Alles online und live, und erstaunlich wenig Frontalunterricht. Der Rhythmus wechselt ständig: kurzer Impulsvortrag, dann Diskussion, dann selber machen. Vieles läuft in Zweiergruppen, manches als Fallstudie, fast alles landet auf dem gemeinsamen Whiteboard. Dazu jede Woche ein Test und die Arbeit an einem eigenen Abschlussprojekt.

Was das Format ausmacht, ist die Mischung aus Tempo und Tiefe. Es ist ein Parforce-Ritt, an manchen Tagen ganz offen als „Druckbetankung“ angekündigt. Aber eben kein oberflächlicher. Wir haben nicht nur Knöpfe gedrückt, sondern gefragt, warum ein Werkzeug tut, was es tut. Und wo es lügt.

Ein Wort noch zur Gruppe, weil das nicht selbstverständlich ist: Der Kreis der Teilnehmenden war stark. Fast jede/r brachte ein eigenes Spezialgebiet mit, und die Felder haben sich gegenseitig ergänzt und befruchtet. Da war echter Zug hinter der gemeinsamen Arbeit. Und das, obwohl wir uns nur per Videokonferenz gesehen haben. So ein Remote-Format kann schnell zäh werden, bei uns war es konzentriert und intensiv. Die gemeinsame Basis war die Affinität zu allem Digitalen. Dazu kam, dass sich alle an die Spielregeln gehalten haben und die Coaches gut und ruhig durch die Tage gesteuert haben. So konnten wir trotz der Distanz konzentriert, effizient und zielgerichtet erkunden, lernen und arbeiten. Und am Ende kam dabei richtig was heraus.

Unter die Motorhaube

Am meisten gebracht hat mir in den ersten Wochen kein neues Tool, sondern zu verstehen, was unter der Motorhaube passiert.

Ein Sprachmodell ist keine Datenbank, sondern eine Wahrscheinlichkeitsmaschine. Ok, wusste ich schon, aber hier ging die Diskussion in die Tiefe. An die Basis. Wir konnten experimentieren, vergleichen, die Maschine herausfordern, testen. Systematischer und damit besser, als das alleine oder nach Feierabend gegangen wäre, selbst als interessierter User. Kurz erklärt: Das Modell schlägt nichts nach. Es sagt das nächste Wort voraus, Stück für Stück, auf Basis von allem, was es in riesigen Textmengen gesehen hat. Aus dieser einen Einsicht folgt fast alles andere. Warum diese Systeme halluzinieren, also überzeugend klingende Dinge einfach erfinden. Warum sie Verzerrungen aus ihren Trainingsdaten übernehmen, den sogenannten Bias. Und warum „faktisch korrekt“ und „fair“ zwei völlig verschiedene Fragen sind.

Das haben wir nicht nur besprochen, wir haben es fühlbar gemacht. An einem Nachmittag hat jeder von uns ein winziges eigenes Modell trainiert. Hund oder Katze, mehr nicht. Ein paar Bilder rein, trainieren, testen. Und dann kommt der Elefant, und das Modell sagt mit voller Überzeugung: Hund. Zu 90 Prozent. Es kennt eben nur zwei Schubladen, also presst es die Welt da hinein. Wer einmal gesehen hat, wie ein System aus zu wenigen, zu einseitigen Daten einen selbstbewussten Unsinnproduzenten macht, versteht Bias nicht mehr als Vokabel, sondern als Mechanik. Diese eine Übung hat mir mehr erklärt als ein Dutzend Artikel, die ich darüber gelesen hatte.

Prompten ist ein Handwerk, kein Zauberspruch

Ich hatte lange die romantische Vorstellung, es gäbe den einen perfekten Mega-Prompt, den man nur finden muss. Die Zeit ist vorbei, falls es sie je gab.

Was bleibt, ist handfester. Ein guter Prompt hat eine erkennbare DNA: Rolle, Kontext, Ziel, Format, Beispiele, Einschränkungen. Das ist der gemeinsame Kern hinter all den Frameworks, die gerade durchs Netz geistern. Der am meisten unterschätzte Teil ist der Kontext, der am meisten überschätzte die Länge. Und der eigentliche Hebel ist nicht der geniale erste Wurf, sondern der Dialog. Ziel klar benennen. Auch sagen, was man nicht will. Iterieren. Den Output kritisch prüfen. Und einen Chat, der abgedriftet ist, notfalls wegwerfen.

Und je besser man versteht, wie ein Modell mit einem Prompt umgeht, desto besser kann man die Maschine briefen. Desto präziser und steuerbarer werden die Ergebnisse. Das ist keine Rocket Science, sondern eher ein Handwerk: Je öfter man ein Werkzeug in der Hand hat und je mehr man sich in dem Feld weiterbildet, desto besser und effektiver nutzt man es.

Dazu kamen ein paar Techniken, die man tatsächlich beim Namen nennen kann und die das Modell auch versteht. Schrittweises Denken. Mehrere Lösungswege parallel auffächern. Die zweistufige Tiefenrecherche, bei der man erst den Auftrag schärft und die Maschine dann losschickt. Kleine Dinge, große Wirkung. Und eine unbequeme Studie am Rande: Wer erst selbst denkt und dann die KI nutzt, wird schärfer. Wer das Denken überspringt, bei dem lässt es messbar nach. Das habe ich mir gemerkt.

Der Zoo der Werkzeuge

Und dann, ja, die Tools. Viele. Sehr viele.

Wir sind durch die großen Sprachmodelle gegangen und haben sie nicht nur benutzt, sondern gegeneinander laufen lassen. ChatGPT, Claude, Gemini, Mistral, dazu Perplexity fürs Recherchieren und Microsoft Copilot, das seine Stärke weniger aus roher Modellkraft zieht als daraus, dass es tief in einer bestehenden Office-Welt sitzt. Man bekommt ein Gefühl für die „Persönlichkeiten“ der Modelle, wenn man denselben Prompt durch mehrere schickt und die Antworten nebeneinanderlegt.

Es blieb nicht beim Text. Bildgenerierung, mit allem, was dazugehört. Dass ein Bildmodell kein Weltmodell hat, sondern eine Absicht interpretiert. Dass man das passende Modell für die Aufgabe wählen und Sackgassen früh erkennen muss. Dann Bild wird zu Video: erst ein bewusstes Startbild bauen, dann mit einem eigenen Prompt nur die Bewegung animieren, in kleinen Schritten, wie eine Miniatur-Filmproduktion. Stimme und Ton, bis hin zum Klonen der eigenen Stimme in verblüffender Qualität. Transkription, die längst ein Standardwerkzeug ist, immer mit der Mahnung im Hinterkopf, dass die Stimme ein biometrisches Datum ist und vor jeder Aufnahme die Einwilligung aller steht.

Und weiter. Wissenszentralen, die nur mit den Quellen arbeiten, die man ihnen selbst gibt, und daraus fast jedes Format machen, vom Podcast bis zur Infografik. Maßgeschneiderte Assistenten, gebaut aus dem immer gleichen Grundmuster: ein Systemprompt fürs Verhalten, eine Wissensbasis für die Fakten. Prozessautomation, bei der man einmal sauber verkettet und die Sache dann rund um die Uhr läuft. Chatbots, von der reinen KI-Variante bis zum hybriden Bot, der feste Logik mit KI kombiniert und die gesammelten Daten am Ende in andere Systeme weiterreicht. Und die ersten Schritte in Richtung Agenten, die wiederkehrende Aufgaben selbst planen und ausführen.

Wichtig war an dieser Fülle nicht die Menge, sondern zu sehen, wie die Dinge zusammenpassen. Eine Transkription füttert eine Wissensdatenbank. Ein Chatbot sammelt Daten und übergibt sie an eine Automation. Ein Rechercheergebnis wird zur Quelle für den nächsten Schritt. Kombination schlägt Einzelwerkzeug.

Nicht das Tool entscheidet, sondern der Fall

Wenn ein Satz diese zwanzig Tage zusammenfasst, dann dieser: Es gibt nicht die eine beste KI. Es gibt nur den richtigen Weg für den jeweiligen Zweck. Der Anwendungsfall entscheidet, nicht das Werkzeug mit den schönsten Benchmarks.

Damit rückte etwas in den Vordergrund, das ich als geübter Anwender gern übersprungen hätte: die Rahmenbedingungen. Datenschutz war der rote Faden über alle Tage. Was gehört in ein privates Konto, was in ein Firmenkonto, was gar nicht erst in eine Cloud? Dazu der rechtliche Rahmen, der gerade konkret wird. Die europäische KI-Verordnung mit ihrem risikobasierten Ansatz, die Unterscheidung von Anbietern und Betreibern, Schulungspflichten, Dokumentation. Die nüchterne Botschaft dahinter: Hundertprozentige Compliance gibt es nicht. Es geht um ehrliche Risikominderung und im Zweifel um juristischen Rat.

Und immer wieder, in fast jeder Diskussion, dasselbe Prinzip. Human in the Loop. Die verlässlichsten Systeme, die wir gesehen haben, kombinieren ein Sprachmodell für die kreative und die Fleißarbeit mit festen Leitplanken – Faktencheck, Belegpflicht, klare Grenzen – und mit einer erzwungenen menschlichen Freigabe. KI ist Assistent, nicht Autopilot. Die eigentliche Kunst liegt darin, bewusst zu entscheiden, wo automatisiert wird und wo der Mensch bleiben muss.

Was bleibt

Das ist, offen gesagt, kein neuer Gedanke für mich. Es ist derselbe, zu dem ich schon bei meinen eigenen kleinen Programmierprojekten gekommen war. Was die KI gut kann, ist sammeln, strukturieren, annähern. Was sie nicht kann und nicht soll, ist entscheiden, bewerten, verantworten. Neu ist, dass ich diesen Gedanken jetzt nicht mehr nur als Bauchgefühl mit mir herumtrage, sondern ihn mit Begriffen, Beispielen und einem geordneten Überblick unterlegen kann.

Nach zwanzig Tagen sehe ich nicht plötzlich alles anders. Ich habe gemerkt, dass „viel benutzen“ und „wirklich verstehen“ zwei verschiedene Dinge sind, und das reicht schon. Die Löcher, von denen ich am Anfang nicht mal wusste, dass ich sie habe, sind gefüllt. Und ich habe eine ziemlich klare Vorstellung davon bekommen, wie viel ich noch nicht weiß.

Zwei Drittel liegen noch vor mir. Ich bin, ehrlich gesagt, ziemlich gespannt.

(Hinweis – und nicht sehr überraschend: Text und Bild erstellt mit Unterstützung von KI.)

Mehr zum Thema: