Eine Timeline des Zielvorfalls und mindestens zwei verdächtig ähnlicher Vorgängervorfälle liegen vor, mit Datum, Ort, Beteiligten, Schaden und vermuteten Ursachen.
Family Tree Analysis
Vorbedingung
Was vorher fertig sein muss
Vorbereitung
Was vor Start vorliegen muss
Whiteboard oder Diagramm-Tool (drawio, Miro, FigJam) mit Stammbaum-Layout (Zielvorfall unten, Vorfahren oben); Incident-Datenbank-Auszug oder Postmortem-Archiv; Vergleichstabelle mit Spalten Vorfall, Datum, Faktoren, Wiederholungsindikator; Pattern-Tags.
Ein Analyst mit RCA-Erfahrung (lead); ein bis zwei Beteiligte am Zielvorfall; ein Archivkundiger oder Owner früherer Postmortems; optional ein systemischer Reviewer aus angrenzendem Bereich.
Zielvorfall-Beschreibung; Liste vermuteter ähnlicher Vorfälle aus den letzten 3-24 Monaten; Postmortem-Archiv oder Incident-Tracker; gemeinsame Tags oder Kategorien.
2-4 h
Zielvorfall als Wurzel-Knoten unten. Leere Eltern-Reihen darüber. Pattern-Tags vorbereitet (z. B. Deploy-Window, Cron-Conflict, Dependency-Drift). Vergleichstabelle als zweites Sheet.
Kernfrage
Die eine Frage, die diese Methode beantwortet
Welche früheren oder parallelen Vorfälle bilden mit dem Zielvorfall eine Familie, und welche systemischen Muster werden durch diese Beziehung sichtbar?
Ablauf
Marker: Phase
| Schritt | Dauer | Aktion | Hinweis |
|---|---|---|---|
1Phase 1: Zielvorfall als Anker | 20-30 min | Zielvorfall als Wurzel: Symptom, Auslöser, beitragende Faktoren, betroffene Komponenten. Tags vergeben (z. B. payment, retry-loop, deploy-window). Maximal 5 charakteristische Faktoren markieren. | Wenn der Zielvorfall nicht in 5 Faktoren komprimierbar ist, ist er ein Multi-Event, das in mehrere Stammbäume zerfallen sollte. |
2Phase 2: Eltern-Generation suchen | 30-45 min | Incident-Archiv nach Vorfällen mit überlappenden Tags durchsuchen. Pro Kandidat prüfen: gemeinsame Faktoren, Zeitabstand, Owner, Komponente. Mindestens 2-Faktor-Überlappung als Eltern-Kriterium. | Wer alle ähnlichen Vorfälle als Eltern listet, verwässert das Bild. Strenge Aufnahmekriterien: mindestens zwei überlappende Faktoren, sonst Geschwister oder Cousine. |
3Phase 3: Vorfahren-Generationen ergänzen | 30-45 min | Für identifizierte Eltern wiederum Eltern suchen. Maximal 3 Generationen, sonst wird der Baum unleserlich. Generationsübergreifende Verbindungen als gestrichelte Linien markieren. | Wer in der dritten Generation noch Verbindungen findet, hat oft eine systemische Ursache, die sich seit Jahren reproduziert. Das ist der wertvollste Befund. |
4Phase 4: Muster benennen | 30-45 min | Wiederkehrende Faktoren generationsübergreifend markieren (z. B. immer Deploy-Freitag, immer Service X, immer derselbe On-Call-Wechsel). Pro Muster benannte Ursache mit Reichweite (wie viele Vorfälle). | Muster sind keine Korrelationen. Pro Muster Mechanismus erklären: warum reproduziert sich genau dieser Faktor? Ohne Mechanismus ist Muster reine Statistik. |
5Phase 5: Systemische Maßnahmen | 30-45 min | Pro Muster systemische Maßnahme: nicht Vorfall-spezifisch, sondern für das gesamte Pattern. Owner mit Mandat über Single-Service hinaus. Erfolgskriterium: Pattern verschwindet aus Zukunfts-Stammbäumen. | Maßnahmen auf Single-Service-Ebene heilen Symptome. Wer das Pattern „Deploy-Freitag“ durch ein Freeze ablöst, adressiert die ganze Familie. |
Artefakt
Was am Ende rauskommt
Stammbaum-Diagramm (3 Generationen) plus Vergleichstabelle mit Faktoren-Matrix, identifizierte Muster mit Mechanismus und Reichweite, systemische Maßnahmen mit Owner und Deadline. Ergänzt klassische Postmortems.
- Miro oder FigJam mit Stammbaum-Frame
- drawio oder Lucidchart mit Hierarchie-Layout
- Notion-Datenbank mit Parent-Relationship
- Causelink oder TapRoot für integrierte Multi-Event-Analyse
Datum und Zielvorfall im Header. Bei späteren ähnlichen Vorfällen neue Wurzel mit Verweis auf bestehenden Baum, oder bestehenden Baum erweitern. Muster-Liste als laufendes Dokument.
Family Tree Analysis Arbeitsvorlage
Kompakte Arbeitsvorlage für Family Tree Analysis mit Kontext, Input, Ergebnisartefakten und nächstem Schritt.
# Family Tree Analysis Canvas
## Kontext
Wofür wird die Methode eingesetzt?
## Kernfrage
Welche Frage soll am Ende beantwortet sein?
## Input
Welche Daten, Beobachtungen oder Materialien liegen vor?
## Arbeitsfläche
- Bereich 1:
- Bereich 2:
- Bereich 3:
- Beziehungen / Muster:
## Ergebnisartefakte
- Family Tree Diagram:
- Pattern-Notizen:
- Systemische Maßnahmen:
## Offene Fragen
- ...
## Nächster Schritt
Owner, Datum, Erfolgssignal.Beispielausgabe
Konkret gefülltes Szenario
## Family Tree — Checkout-500er-Welle 14.05.2026 (Analyse 18.05.2026)
**Wurzel (Zielvorfall)**: 14.05. 09:12 UTC, 8% Order-API HTTP 500, Connection Pool ausgelastet durch neuen Batch-Job. Tags: connection-pool, batch-job, friday-deploy.
**Eltern (Generation 1)**:
- 22.02.2026, Payment-API Latenz, Batch-Job ohne Pool-Quota. Tags: connection-pool, batch-job, monday-deploy.
- 03.11.2025, Checkout-Timeout, neuer Reporting-Job ohne Quota. Tags: connection-pool, batch-job, friday-deploy.
**Großeltern (Generation 2)**:
- 17.05.2024, Order-DB CPU 100%, neue Migration ohne off-peak Window. Tags: batch-job, no-window.
**Muster**:
1. „Batch-Job ohne Quota teilt Online-Pool“ (3 Vorfälle in 15 Monaten). Mechanismus: keine Code-Review-Checkliste für Batch-Workloads.
2. „Friday-Deploys mit Folgeschäden“ (2 Vorfälle). Mechanismus: kein Deploy-Freeze ab Freitag 14:00.
**Systemische Maßnahmen**:
1. CODEOWNERS-Checkliste für Batch-Jobs (eigener Pool oder dokumentierter Workaround). Owner @ben, bis 28.05.
2. Deploy-Freeze Freitag 14:00 bis Montag 08:00 für Order-Domain. Owner @lisa, RFC bis 30.05.
3. Pool-Saturation-Alert auf 80%, 5-min-Trigger. Owner @anna, bis 10.06.Stolperfallen
Symptome erkennen, gegensteuern
Lockere Verwandtschaftskriterien
Stammbaum enthält 15 Vorfälle aus 2 Jahren, gemeinsame Faktoren sind generisch (alle waren in Produktion).
Mindestens zwei überlappende Faktoren als Eltern-Kriterium. Generische Tags wie production oder live nicht zählen. Lieber kleiner, aber spezifischer Baum.
Muster ohne Mechanismus
Muster wird genannt, aber niemand erklärt, warum sich der Faktor reproduziert.
Pro Muster zwingend Mechanismus-Beschreibung: welcher Prozess, welcher Anreiz, welche Lücke erzeugt die Wiederholung? Ohne Mechanismus keine Maßnahme.
Maßnahme auf Vorfall-Ebene
Empfehlungen behandeln nur den Zielvorfall, das Pattern bleibt.
Maßnahmen müssen für das gesamte Pattern wirken, nicht für eine Instanz. Erfolgskriterium: Pattern darf in nächsten 12 Monaten nicht mehr auftauchen.
Zu viele Generationen
Baum hat 6+ Generationen, niemand kann das Bild noch interpretieren.
Maximal 3 Generationen. Ältere Vorgänger als Anhang oder eigene Baumanalyse. Visualisierung schlägt Vollständigkeit.
Archiv unvollständig
Postmortem-Datenbank reicht nur 6 Monate zurück, ältere Vorfälle nicht greifbar.
Befund als Limitation dokumentieren. Mit verfügbarer Tiefe arbeiten, aber Empfehlung „Postmortem-Archiv etablieren“ als systemische Maßnahme aufnehmen.
Abbruchkriterien
Done-Signale, in unter einer Minute prüfbar
Run Sheet durchgearbeitet?
Zum Steckbrief für Zweck, ähnliche Methoden und Quellen — oder direkt zur nächsten Methode im Katalog.