methodatlas
Run SheetOperationsRoot Cause Analysis

Family Tree Analysis

KomplexitätMedium
Zeit2-4 h
Teilnehmende2-6
FormatBoth
MaturityEmerging
01

Vorbedingung

Was vorher fertig sein muss

Vorher abschließenIncident Timeline Analysis

Eine Timeline des Zielvorfalls und mindestens zwei verdächtig ähnlicher Vorgängervorfälle liegen vor, mit Datum, Ort, Beteiligten, Schaden und vermuteten Ursachen.

Ohne: Ohne Vorgängervorfälle entsteht kein Stammbaum, die Methode liefert eine triviale Einzelfall-Sicht ohne Mehrwert gegenüber 5-Whys.
02

Vorbereitung

Was vor Start vorliegen muss

Materialien

Whiteboard oder Diagramm-Tool (drawio, Miro, FigJam) mit Stammbaum-Layout (Zielvorfall unten, Vorfahren oben); Incident-Datenbank-Auszug oder Postmortem-Archiv; Vergleichstabelle mit Spalten Vorfall, Datum, Faktoren, Wiederholungsindikator; Pattern-Tags.

Personen / Rollen

Ein Analyst mit RCA-Erfahrung (lead); ein bis zwei Beteiligte am Zielvorfall; ein Archivkundiger oder Owner früherer Postmortems; optional ein systemischer Reviewer aus angrenzendem Bereich.

Vorabinfos

Zielvorfall-Beschreibung; Liste vermuteter ähnlicher Vorfälle aus den letzten 3-24 Monaten; Postmortem-Archiv oder Incident-Tracker; gemeinsame Tags oder Kategorien.

Zeitbedarf

2-4 h

Setup

Zielvorfall als Wurzel-Knoten unten. Leere Eltern-Reihen darüber. Pattern-Tags vorbereitet (z. B. Deploy-Window, Cron-Conflict, Dependency-Drift). Vergleichstabelle als zweites Sheet.

03

Kernfrage

Die eine Frage, die diese Methode beantwortet

Welche früheren oder parallelen Vorfälle bilden mit dem Zielvorfall eine Familie, und welche systemischen Muster werden durch diese Beziehung sichtbar?

04

Ablauf

Marker: Phase

SchrittDauerAktionHinweis
1Phase 1: Zielvorfall als Anker
20-30 minZielvorfall als Wurzel: Symptom, Auslöser, beitragende Faktoren, betroffene Komponenten. Tags vergeben (z. B. payment, retry-loop, deploy-window). Maximal 5 charakteristische Faktoren markieren.Wenn der Zielvorfall nicht in 5 Faktoren komprimierbar ist, ist er ein Multi-Event, das in mehrere Stammbäume zerfallen sollte.
2Phase 2: Eltern-Generation suchen
30-45 minIncident-Archiv nach Vorfällen mit überlappenden Tags durchsuchen. Pro Kandidat prüfen: gemeinsame Faktoren, Zeitabstand, Owner, Komponente. Mindestens 2-Faktor-Überlappung als Eltern-Kriterium.Wer alle ähnlichen Vorfälle als Eltern listet, verwässert das Bild. Strenge Aufnahmekriterien: mindestens zwei überlappende Faktoren, sonst Geschwister oder Cousine.
3Phase 3: Vorfahren-Generationen ergänzen
30-45 minFür identifizierte Eltern wiederum Eltern suchen. Maximal 3 Generationen, sonst wird der Baum unleserlich. Generationsübergreifende Verbindungen als gestrichelte Linien markieren.Wer in der dritten Generation noch Verbindungen findet, hat oft eine systemische Ursache, die sich seit Jahren reproduziert. Das ist der wertvollste Befund.
4Phase 4: Muster benennen
30-45 minWiederkehrende Faktoren generationsübergreifend markieren (z. B. immer Deploy-Freitag, immer Service X, immer derselbe On-Call-Wechsel). Pro Muster benannte Ursache mit Reichweite (wie viele Vorfälle).Muster sind keine Korrelationen. Pro Muster Mechanismus erklären: warum reproduziert sich genau dieser Faktor? Ohne Mechanismus ist Muster reine Statistik.
5Phase 5: Systemische Maßnahmen
30-45 minPro Muster systemische Maßnahme: nicht Vorfall-spezifisch, sondern für das gesamte Pattern. Owner mit Mandat über Single-Service hinaus. Erfolgskriterium: Pattern verschwindet aus Zukunfts-Stammbäumen.Maßnahmen auf Single-Service-Ebene heilen Symptome. Wer das Pattern „Deploy-Freitag“ durch ein Freeze ablöst, adressiert die ganze Familie.
05

Artefakt

Was am Ende rauskommt

Form

Stammbaum-Diagramm (3 Generationen) plus Vergleichstabelle mit Faktoren-Matrix, identifizierte Muster mit Mechanismus und Reichweite, systemische Maßnahmen mit Owner und Deadline. Ergänzt klassische Postmortems.

Tool-Alternativen
  • Miro oder FigJam mit Stammbaum-Frame
  • drawio oder Lucidchart mit Hierarchie-Layout
  • Notion-Datenbank mit Parent-Relationship
  • Causelink oder TapRoot für integrierte Multi-Event-Analyse
Versionierung / Ownership

Datum und Zielvorfall im Header. Bei späteren ähnlichen Vorfällen neue Wurzel mit Verweis auf bestehenden Baum, oder bestehenden Baum erweitern. Muster-Liste als laufendes Dokument.

canvas

Family Tree Analysis Arbeitsvorlage

Kompakte Arbeitsvorlage für Family Tree Analysis mit Kontext, Input, Ergebnisartefakten und nächstem Schritt.

# Family Tree Analysis Canvas

## Kontext

Wofür wird die Methode eingesetzt?

## Kernfrage

Welche Frage soll am Ende beantwortet sein?

## Input

Welche Daten, Beobachtungen oder Materialien liegen vor?

## Arbeitsfläche

- Bereich 1:
- Bereich 2:
- Bereich 3:
- Beziehungen / Muster:

## Ergebnisartefakte
- Family Tree Diagram:
- Pattern-Notizen:
- Systemische Maßnahmen:

## Offene Fragen

- ...

## Nächster Schritt

Owner, Datum, Erfolgssignal.
06

Beispielausgabe

Konkret gefülltes Szenario

family-tree-analysis-beispiel.md
markdown
## Family Tree — Checkout-500er-Welle 14.05.2026 (Analyse 18.05.2026)

**Wurzel (Zielvorfall)**: 14.05. 09:12 UTC, 8% Order-API HTTP 500, Connection Pool ausgelastet durch neuen Batch-Job. Tags: connection-pool, batch-job, friday-deploy.

**Eltern (Generation 1)**:
- 22.02.2026, Payment-API Latenz, Batch-Job ohne Pool-Quota. Tags: connection-pool, batch-job, monday-deploy.
- 03.11.2025, Checkout-Timeout, neuer Reporting-Job ohne Quota. Tags: connection-pool, batch-job, friday-deploy.

**Großeltern (Generation 2)**:
- 17.05.2024, Order-DB CPU 100%, neue Migration ohne off-peak Window. Tags: batch-job, no-window.

**Muster**:
1. „Batch-Job ohne Quota teilt Online-Pool“ (3 Vorfälle in 15 Monaten). Mechanismus: keine Code-Review-Checkliste für Batch-Workloads.
2. „Friday-Deploys mit Folgeschäden“ (2 Vorfälle). Mechanismus: kein Deploy-Freeze ab Freitag 14:00.

**Systemische Maßnahmen**:
1. CODEOWNERS-Checkliste für Batch-Jobs (eigener Pool oder dokumentierter Workaround). Owner @ben, bis 28.05.
2. Deploy-Freeze Freitag 14:00 bis Montag 08:00 für Order-Domain. Owner @lisa, RFC bis 30.05.
3. Pool-Saturation-Alert auf 80%, 5-min-Trigger. Owner @anna, bis 10.06.
07

Stolperfallen

Symptome erkennen, gegensteuern

Falle

Lockere Verwandtschaftskriterien

Symptom

Stammbaum enthält 15 Vorfälle aus 2 Jahren, gemeinsame Faktoren sind generisch (alle waren in Produktion).

Was tun

Mindestens zwei überlappende Faktoren als Eltern-Kriterium. Generische Tags wie production oder live nicht zählen. Lieber kleiner, aber spezifischer Baum.

Falle

Muster ohne Mechanismus

Symptom

Muster wird genannt, aber niemand erklärt, warum sich der Faktor reproduziert.

Was tun

Pro Muster zwingend Mechanismus-Beschreibung: welcher Prozess, welcher Anreiz, welche Lücke erzeugt die Wiederholung? Ohne Mechanismus keine Maßnahme.

Falle

Maßnahme auf Vorfall-Ebene

Symptom

Empfehlungen behandeln nur den Zielvorfall, das Pattern bleibt.

Was tun

Maßnahmen müssen für das gesamte Pattern wirken, nicht für eine Instanz. Erfolgskriterium: Pattern darf in nächsten 12 Monaten nicht mehr auftauchen.

Falle

Zu viele Generationen

Symptom

Baum hat 6+ Generationen, niemand kann das Bild noch interpretieren.

Was tun

Maximal 3 Generationen. Ältere Vorgänger als Anhang oder eigene Baumanalyse. Visualisierung schlägt Vollständigkeit.

Falle

Archiv unvollständig

Symptom

Postmortem-Datenbank reicht nur 6 Monate zurück, ältere Vorfälle nicht greifbar.

Was tun

Befund als Limitation dokumentieren. Mit verfügbarer Tiefe arbeiten, aber Empfehlung „Postmortem-Archiv etablieren“ als systemische Maßnahme aufnehmen.

08

Abbruchkriterien

Done-Signale, in unter einer Minute prüfbar

Weniger als zwei vergleichbare Vorgängervorfälle auffindbar, keine Familie identifizierbar.
Zielvorfall ist nachweislich Einzelfall mit einmaligen Bedingungen.
Kein Incident-Archiv oder Postmortem-Pool verfügbar, Stammbaum bliebe Erinnerung.
Systemische Maßnahmen liegen außerhalb des Untersuchungsmandats, Befund wäre folgenlos.
Analyse-Zeit unter 90 min, Phasen 2-4 nicht zusammenhängend durchführbar.
Pattern-Hypothese ist trivial bekannt, Stammbaum wäre Beweislieferung ohne neuen Hebel.

Run Sheet durchgearbeitet?

Zum Steckbrief für Zweck, ähnliche Methoden und Quellen — oder direkt zur nächsten Methode im Katalog.