Run SheetOperationsRoot Cause Analysis

Fishbone Diagram

KomplexitätLow

Zeit30-60 min

Teilnehmende2-8

FormatWorkshop

MaturityCanonical

Vorbedingung

Was vorher fertig sein muss

Vorher abschließenProblemdefinitionnicht im Katalog

Das Problem ist als beobachtbares Symptom mit Datum, Häufigkeit und Auswirkung in einem Satz formuliert.

Ohne: Ohne klares Symptom analysiert die Gruppe vermutete Ursachen unbekannter Wirkungen und produziert Diagramme ohne Bezugspunkt.

Vorher abschließen5 Whys

Bei eng abgegrenzten Symptomen mit klarer Kausalkette wurde geprüft, ob 5 Whys ausreicht und Fishbone den Mehrwert breiterer Kategorisierung bringt.

Ohne: Ohne diese Prüfung wird ein Fishbone für lineare Ursachen genutzt, der Methode-Overhead erzeugt ohne zusätzliche Erkenntnis.

Vorbereitung

Was vor Start vorliegen muss

Materialien

Whiteboard oder Miro-Board mit vorgezeichnetem Fishbone (Kopf rechts, Wirbelsäule horizontal, 4-6 Gräten); Stickies; Stifte; Timer; Link zu Logs, Tickets oder Daten, die Ursachen belegen können.

Personen / Rollen

Ein Facilitator, der Kategorien und Bewertung trennt; zwei bis acht Teilnehmende mit direktem Bezug zum Prozess (Operations, Engineering, Quality, Support); ein Scribe für die Reinzeichnung.

Vorabinfos

Problem-Satz mit Zeit, Häufigkeit, Auswirkung; bekannte vorherige Hypothesen; Zugang zu Daten (Logs, KPIs, Incident-Reports); Liste der Personen, die die letzten 4 Wochen nah am Problem waren.

Zeitbedarf

30-60 min

Setup

Problem in den Kopf des Fishbone schreiben. Kategorien wählen (klassisch 6Ms: Methods, Machines, Materials, Manpower, Measurement, Milieu; alternativ 4Ps für Services). Timer auf erste Sammelphase setzen.

Kernfrage

Die eine Frage, die diese Methode beantwortet

Welche möglichen Ursachen über alle relevanten Kategorien hinweg verdienen eine datenbasierte Tiefenprüfung als nächste Aktion?

Ablauf

Marker: Phase

Schritt	Dauer	Aktion	Hinweis
1Phase 1: Problem-Schärfung	5 min	Problem-Satz lesen, prüfen, ob er ein beobachtbares Symptom mit Zeit und Auswirkung enthält. Wenn nicht, neu formulieren.	„Performance ist schlecht“ ist kein Symptom. „P95-Latenz API /orders >800 ms seit 10.05.“ ist eines. Ohne Symptom kein Fishbone.
2Phase 2: Kategorien wählen	5 min	4-6 Kategorien als Gräten festlegen. Klassische 6Ms für Produktion, 4Ps (People, Process, Policy, Place) für Services, oder eigene Kategorien für den Kontext.	Mehr als 6 Kategorien überfordern. Wenn eine Kategorie immer leer bleibt, war sie für dieses Problem irrelevant und wird gestrichen.
3Phase 3: Ursachensammlung	20-30 min	Pro Kategorie still 5 min sammeln, dann reihum vorstellen. Ursachen als Stickies an die jeweilige Gräte. Pro Hauptursache 2-3 Unter-Ursachen (Why) ergänzen.	Wenn alle Ursachen in einer Kategorie landen, ist die Gruppe einseitig besetzt oder hat ein vorab geformtes Bild. Andere Kategorien explizit befragen.
4Phase 4: Priorisierung	10 min	Ursachen markieren nach (a) Wahrscheinlichkeit, (b) Datenverfügbarkeit zur Prüfung. Top 3-5 Ursachen mit Owner und Untersuchungsmethode versehen.	Top-Auswahl nach Wahrscheinlichkeit, nicht nach Lieblings-Hypothese. Wenn keine Daten verfügbar sind, wird die Ursache zur Untersuchungsaufgabe, nicht zur Maßnahme.
5Phase 5: Followup	5-10 min	Untersuchungs-Backlog erstellen: pro Top-Ursache eine konkrete Prüfaktion (Log-Query, Experiment, Interview) mit Frist. Reinzeichnung als Artefakt ablegen.	Fishbone ohne Untersuchungs-Backlog bleibt eine schöne Skizze. Mindestens drei Prüfaktionen mit Datum, sonst war die Session diagnostisch wertlos.

Artefakt

Was am Ende rauskommt

Form

Reingezeichnetes Fishbone-Diagramm mit Problem-Satz im Kopf, beschrifteten Gräten pro Kategorie, allen gesammelten Ursachen und Unter-Ursachen, Markierung der Top 3-5 und separatem Untersuchungs-Backlog mit Owner, Methode und Frist.

Tool-Alternativen

Miro oder FigJam mit Fishbone-Template
Lucidchart oder draw.io für persistente Diagramme
Whiteboard-Foto plus Markdown-Tabelle mit Kategorien und Ursachen
Notion- oder Confluence-Seite im Incident-Space

Versionierung / Ownership

Pro Untersuchungsfall ein Eintrag mit Datum und Problem-ID. Folgesitzungen nach Datenprüfung als Version 2 anlegen, neue Erkenntnisse ergänzen, widerlegte Ursachen markieren statt löschen.

canvas

Fishbone Diagram Arbeitsvorlage

Kompakte Arbeitsvorlage für Fishbone Diagram mit Kontext, Input, Ergebnisartefakten und nächstem Schritt.

# Fishbone Diagram Canvas

## Kontext

Wofür wird die Methode eingesetzt?

## Kernfrage

Welche Frage soll am Ende beantwortet sein?

## Input

Welche Daten, Beobachtungen oder Materialien liegen vor?

## Arbeitsfläche

- Bereich 1:
- Bereich 2:
- Bereich 3:
- Beziehungen / Muster:

## Ergebnisartefakte
- Fishbone Diagram:
- Cause Categories:
- Investigation Backlog:

## Offene Fragen

- ...

## Nächster Schritt

Owner, Datum, Erfolgssignal.

Beispielausgabe

Konkret gefülltes Szenario

fishbone-diagram-beispiel.md

markdown

## Fishbone — P95-Latenz API /orders > 800 ms seit 10.05.2026

**Problem**: Seit 10.05.2026 P95-Latenz auf /orders durchgehend >800 ms (vorher 220 ms), Auswirkung: 4% Checkout-Abbruch zusätzlich.

**Kategorien (6Ms angepasst)**:
- **Methods**: Query-Plan-Änderung durch ORM-Update; fehlende Indexnutzung.
- **Machines**: DB-Instanz noch auf t3.large statt t3.xlarge.
- **Materials (Daten)**: Orders-Tabelle seit Black Friday auf 14M Zeilen gewachsen.
- **Manpower**: Neuer Developer hat 09.05. Query-Refactor deployt.
- **Measurement**: Slow-Query-Log war 6 Wochen aus.
- **Milieu**: AWS-Region eu-central-1 hatte am 10.05. erhöhte Network-Latenz (laut Status-Page kurzzeitig).

**Top 3 Ursachen (priorisiert)**:
1. Query-Refactor 09.05. (Methods) — Prüfung: Git-Blame + EXPLAIN ANALYZE. Owner: @ben, bis 19.05.
2. Fehlende Index-Nutzung auf orders.customer_id (Methods/Data) — Prüfung: pg_stat_user_indexes. Owner: @anna, bis 19.05.
3. Tabellenwachstum ohne Partitionierung (Data) — Prüfung: Größenanalyse + Partitionierungs-Plan. Owner: @lisa, bis 26.05.

Was tun

Untersuchungs-Backlog ist Pflichtartefakt. Pro Top-Ursache eine konkrete Prüfaktion mit Owner und Datum. Folgetermin in 1-2 Wochen für Ergebnis-Review.

Abbruchkriterien

Done-Signale, in unter einer Minute prüfbar

Problem ist nicht reproduzierbar oder einmalig, Ursachenanalyse hat keinen Hebel.

Symptom ist akut und kritisch, Incident Response und Hotfix gehen vor Strukturanalyse.

Kausalkette ist erwartbar linear, dann ist 5 Whys schneller und ausreichend.

Keine Person mit direktem Prozesszugang anwesend, Ursachen werden Hörensagen.

Keine Möglichkeit, Hypothesen mit Daten zu prüfen, Analyse bleibt nicht falsifizierbar.

Mehr als drei klar getrennte Problemklassen liegen vor, ein Fishbone wird unübersichtlich; pro Klasse eines anlegen.

Run Sheet durchgearbeitet?

Zum Steckbrief für Zweck, ähnliche Methoden und Quellen — oder direkt zur nächsten Methode im Katalog.

Zum Steckbrief Weitere Methoden