Multi-Agent für Mittelstand — welches Muster überlebt den Alltag?
Sie lesen aktuell überall, dass Multi-Agent-Systeme der nächste Schritt sind. Frameworks, Demos, Konferenz-Talks. Wenn Sie für einen Mittelständler entscheiden, lohnt der nüchterne Blick: Welche Muster halten in echten Workflows, welche fallen auseinander, sobald reale Daten und reale Fehler durchlaufen?
Was die Forschung sagt:
Die Lanham-Studie hat verschiedene Multi-Agent-Architekturen unter Last gesetzt. Das Ergebnis ist deutlich: Flow-dominante Muster und klare Orchestration-Patterns überleben in Produktion. Kollaborative Mesh-Architekturen, in denen mehrere Agenten frei miteinander reden und sich gegenseitig korrigieren sollen, scheitern reproduzierbar.
Die Zahl, die hängenbleibt: gpt-4.1-mini erreicht 90,7 Prozent Genauigkeit bei einer einzigen Stufe. Bei fünf Stufen fällt die Genauigkeit auf 22,5 Prozent. Der Grund ist trivial und gleichzeitig fatal — Fehlerfortpflanzung. Jede Stufe in einem Mesh-Setup erbt die Unsicherheit der vorherigen, und wenn die Agenten zusätzlich miteinander verhandeln, addieren sich Halluzinationen statt sich zu korrigieren.
Shopifys Empfehlung — und was sie für den Mittelstand heißt:
Shopify hat in einem viel beachteten Engineering-Post empfohlen: "Avoid multi-agent systems early." Im Klartext: Bauen Sie zuerst einen Single-Agent sauber, bis Sie die Grenze konkret spüren. Erst dann lohnt der Sprung zu mehreren Agenten — und auch dann nur in einer disziplinierten Topologie.
Für Mittelständler ist das wichtig, weil der Hype-Cycle gerade in die Region kippt, in der Berater und Tool-Anbieter Multi-Agent als Standardlösung verkaufen. Sie zahlen dann doppelt: einmal für Komplexität, die Sie nicht brauchen, und einmal für die Zeit, die der Workflow im Betrieb instabil ist.
Praxisbeleg Solarize:
Ich habe bei Solarize einen Vertriebs-Workflow für die Energie-Beratung gebaut, der genau diesen Pfad gegangen ist. Vier Stufen, sauber getrennt:
- Firmenresearch — automatische Recherche zu Ziel-Unternehmen, Anlagengröße, regulatorischer Lage.
- Briefing — Verdichtung der Recherche zu einem strukturierten Gesprächs-Briefing für den Berater.
- Cold Call und E-Mail — KI-gestützte Erstansprache auf Basis des Briefings, mit klaren Templates pro Segment.
- KI-Meeting-Analyse — Transkript-Auswertung nach dem Termin, Extraktion offener Punkte und nächster Schritte.
Das ist ein Flow-Pattern. Jede Stufe übergibt einen klar definierten Output an die nächste. Kein Round-Trip, kein Mesh, kein Agent, der einen anderen Agenten korrigiert. Wir haben den Workflow bewusst so geschnitten, dass jede Stufe einzeln testbar bleibt und bei Fehlern an genau einem Punkt nachgebessert werden kann.
Das Ergebnis: stabil, nachvollziehbar und im Alltag belastbar. Wenn der Cold-Call-Schritt schlecht performt, weiß ich, wo ich ansetzen muss. In einem Mesh-Setup wäre die Ursachenanalyse ein Tag Arbeit.
Entscheidungsbaum — drei Fragen als Filter:
Bevor Sie überhaupt über Multi-Agent nachdenken, prüfen Sie:
- Ist die Aufgabe klar genug, dass ein gut strukturierter Single-Agent mit Tool-Calls sie lösen kann? Wenn ja, bleiben Sie da. Sie gewinnen Stabilität und sparen sich die Orchestration-Schicht komplett.
- Wechselt die Aufgabe das Werkzeug oder den Datenraum mehrfach (Recherche-Tool, CRM, E-Mail, Transkript-Engine)? Dann lohnt Multi-Agent — aber als Flow, nicht als Mesh.
- Gibt es klare Stage-Übergänge mit definiertem Output pro Stufe? Wenn ja, ist Flow-Orchestration der richtige Ansatz. Wenn nein, schneiden Sie die Stufen sauberer, bevor Sie Agenten draufsetzen.
Die häufigste Fehlentscheidung im Mittelstand: ein unklarer Prozess wird mit mehreren Agenten "gelöst", weil die Agenten den Prozess flexibel zuschneiden sollen. Das funktioniert in der Demo und scheitert ab Woche zwei.
n8n als realistischer Einstieg:
Wenn Sie einen Orchestrationslayer brauchen, fangen Sie mit n8n an. Die Lernkurve von LangGraph ist real, und Sie zahlen sie für ein erstes Projekt nicht zurück. n8n bietet:
- Visueller Flow, in dem Stufen und Übergaben sichtbar bleiben — auch für Kollegen, die nicht den ganzen Code lesen.
- Selbsthosting möglich, wenn Datenraum oder Compliance das verlangen.
- Fehler-Recovery pro Knoten, das heißt Sie können einzelne Schritte retryen, ohne den ganzen Workflow neu zu starten.
Wer LangGraph wirklich braucht, merkt das spätestens am dritten Projekt — wenn dynamische Routing-Logik, persistente Agent-States oder komplexe Bedingungen über Knoten hinweg auftauchen. Bis dahin ist n8n der pragmatische Pfad, der Ihnen die Aufmerksamkeit für die eigentliche Frage lässt: Sitzt der Workflow-Schnitt, oder versuchen Sie gerade, Komplexität mit Agenten zu kaschieren?
Kurzfassung: Single-Agent zuerst. Flow-Orchestration, wenn der Werkzeug-Wechsel das verlangt. Mesh nur, wenn Sie wirklich wissen, warum — und das wird seltener sein, als der Hype suggeriert.