Eine Hypothese zu vermuteter Ursache und Wirkung mit zwei messbaren Variablen liegt vor, idealerweise aus einer Fishbone-Analyse oder einer 5-Whys-Kette.
Scatter Diagram
Vorbedingung
Was vorher fertig sein muss
Vorbereitung
Was vor Start vorliegen muss
Tabellenkalkulation oder Statistik-Tool (Excel, Google Sheets, R, Python mit pandas/matplotlib, JMP); Datenset mit gepaarten Werten; Zeitstempel pro Messung; optional Pareto-Tool für Vergleich.
Ein Analyst, der Daten aufbereitet und visualisiert; ein Domain Expert, der Kontext und Anomalien interpretiert; ein Owner der Datenquelle für Datenqualitäts-Rückfragen.
Hypothese als Satz („wir vermuten, dass X Y beeinflusst“); Definition der Variablen mit Einheiten; Messintervall und Erhebungszeitraum; bekannte Störgrößen; Mindest-Datenmenge (30+ Paare).
30-90 min für Erstellung, plus Datenaufbereitung
Daten in zwei Spalten: X (Ursache), Y (Wirkung). Zeitstempel als dritte Spalte. Tool offen. Hypothese sichtbar oben im Sheet.
Kernfrage
Die eine Frage, die diese Methode beantwortet
Zeigen die gepaarten Daten ein Muster, das die vermutete Ursache-Wirkungs-Hypothese stützt, widerlegt oder offen lässt?
Ablauf
Marker: Phase
| Schritt | Dauer | Aktion | Hinweis |
|---|---|---|---|
1Phase 1: Hypothese und Variablen schärfen | 10 min | Hypothese als Wenn-Dann-Satz mit konkreten Variablen und Einheiten formulieren. Erwartete Richtung (positiv, negativ) festhalten. Mindestens 30 Datenpaare als Schwelle definieren. | Wenn Hypothese mehrere Variablen mischt („Schlechtes Wetter macht Mitarbeiter müde“), je Paar eine Variable konkretisieren. Sonst ist das Diagramm nicht interpretierbar. |
2Phase 2: Daten erheben oder aufbereiten | Variable, oft 30-60 min | Datenset extrahieren oder erheben. Auf saubere Paarung achten (gleicher Zeitpunkt, gleicher Kontext). Datenqualität prüfen: Ausreißer, fehlende Werte, Erhebungsbedingungen. | Datenkontext gehört dokumentiert: wer hat wann unter welchen Bedingungen gemessen. Ohne Kontext werden später Ausreißer fehlinterpretiert. |
3Phase 3: Plot erzeugen | 15-20 min | Scatter Plot mit X = Ursache, Y = Wirkung. Achsenbeschriftungen mit Einheit. Punkte ggf. nach Zeit oder Kontext einfärben. Trendlinie optional (mit Vorsicht). | Trendlinie suggeriert oft mehr Aussage als Daten hergeben. Erst Plot ohne Linie zeigen, Linie nur als zweite Schicht, wenn Korrelation stark. |
4Phase 4: Muster beschreiben | 20-30 min | Muster systematisch durchgehen: positiver Trend, negativer Trend, Cluster, Ausreißer, kein Muster, U-Form. Korrelationskoeffizient (Pearson, Spearman) berechnen, aber nicht überinterpretieren. | Korrelation 0.3 ist nicht „leicht“, sondern oft Rauschen. Erst ab 0.7 von robustem Zusammenhang sprechen, und auch dann nur im Kontext der Stichprobengröße. |
5Phase 5: Interpretation und Folgeschritt | 15-20 min | Ergebnis als Hypothese bestätigt, widerlegt oder offen einordnen. Confounders besprechen. Maßnahme oder weitere Analyse ableiten (z. B. kontrolliertes Experiment, Pareto, Regression). | Korrelation ist keine Kausalität. Vor Maßnahme-Ableitung mindestens kontrollierten Test planen oder Stratifizierung prüfen, sonst werden Symptome statt Ursachen behandelt. |
Artefakt
Was am Ende rauskommt
PNG- oder PDF-Export des Plots mit Achsenbeschriftungen, Korrelationskoeffizient, Stichprobengröße und Erhebungszeitraum; plus Markdown-Notiz mit Hypothese, Beobachtung, Confoundern und Folgeschritt.
- Excel oder Google Sheets mit Scatter-Chart
- Python (pandas + matplotlib/seaborn)
- R mit ggplot2
- JMP oder Minitab für Qualitätsanalyse
Datum, Datenquelle und Erhebungszeitraum im Header. Folge-Analysen mit aktuelleren Daten als neuer Plot im selben Repo. Roh-Daten als CSV mit Plot archivieren, nicht nur das Bild.
Scatter Diagram Arbeitsvorlage
Kompakte Arbeitsvorlage für Scatter Diagram mit Kontext, Input, Ergebnisartefakten und nächstem Schritt.
# Scatter Diagram Canvas
## Kontext
Wofür wird die Methode eingesetzt?
## Kernfrage
Welche Frage soll am Ende beantwortet sein?
## Input
Welche Daten, Beobachtungen oder Materialien liegen vor?
## Arbeitsfläche
- Bereich 1:
- Bereich 2:
- Bereich 3:
- Beziehungen / Muster:
## Ergebnisartefakte
- Scatter Plot:
- Korrelationsnotiz:
- Hypothesenliste:
## Offene Fragen
- ...
## Nächster Schritt
Owner, Datum, Erfolgssignal.Beispielausgabe
Konkret gefülltes Szenario
## Scatter Diagram — Korrelation Raumtemperatur und Tippfehlerquote in Service-Center (18.05.2026)
**Hypothese**: Wenn die Raumtemperatur über 25°C steigt, dann steigt die Tippfehlerquote in eingehenden Tickets.
**Daten**: 124 Schichten zwischen 01.03. und 30.04.2026. Quelle: Wetterstation Büro + Ticket-System.
**Variablen**: X = Durchschnittstemperatur pro Schicht (°C). Y = Tippfehler pro 100 Tickets.
**Plot**: Punktwolke zeigt schwach positiven Trend bis 24°C, stark positiv ab 26°C. Pearson r = 0.62 (n=124). Spearman ρ = 0.71.
**Cluster**: Ab 26°C deutlich höhere Streuung. Drei Ausreißer bei 22°C (Krankheitswelle).
**Interpretation**: Hypothese gestützt für Bereich über 26°C. Confounders: Schichtbesetzung, Wochentag, Krankenstand. Korrelation ≠ Kausalität.
**Folgeschritt**: Pilot mit Klimatisierung in zwei Räumen über 4 Wochen, A/B-Vergleich der Tippfehlerquote. Owner @lisa, Start 01.06.Stolperfallen
Symptome erkennen, gegensteuern
Zu wenig Datenpunkte
Plot mit 12 Punkten zeigt scheinbaren Trend, jede Anpassung der Stichprobe ändert das Bild.
Mindestens 30 Paare als Schwelle. Bei weniger keine Korrelations-Aussage. Stattdessen Erhebungszeitraum verlängern oder Quelle erweitern.
Korrelation als Kausalität verkauft
Stakeholder leiten direkt Maßnahmen ab („Temperatur senken senkt Tippfehler“), ohne Confounder zu prüfen.
Vor Maßnahmen-Empfehlung mindestens Confounder-Diskussion und kontrolliertes Experiment. Reports explizit mit „Korrelation, nicht bewiesene Kausalität“ markieren.
Ausreißer ohne Kontext
Drei extreme Punkte werden mitgerechnet, Korrelation kippt, niemand weiß warum diese Punkte abweichen.
Pro Ausreißer Kontext recherchieren (Wetter, Sondereignis, Defekt). Wenn Ursache klärbar, separat ausweisen oder ausschließen. Begründung dokumentieren.
Datenqualität nicht geprüft
Daten enthalten Tippfehler, falsche Einheiten oder Zeitversatz, Plot verzerrt.
Datencheck vor Plot: Min/Max plausibel, Duplikate, fehlende Werte. Bei Auffälligkeiten Datenquelle reviewen mit dem Owner.
Lineare Annahme bei nicht-linearen Daten
Korrelationskoeffizient r ist niedrig, obwohl Plot eine deutliche U-Form zeigt.
Plot visuell vor Pearson r interpretieren. Bei non-linearen Mustern Spearman ρ und Polynomial-Fit, oder Stratifizierung in Bereiche.
Abbruchkriterien
Done-Signale, in unter einer Minute prüfbar
Run Sheet durchgearbeitet?
Zum Steckbrief für Zweck, ähnliche Methoden und Quellen — oder direkt zur nächsten Methode im Katalog.