Run SheetOperationsUrsachenanalyse

Change Analysis

KomplexitätMedium

Zeit45-120 min

Teilnehmende2-6

FormatBoth

MaturityEstablished

Vorbedingung

Was vorher fertig sein muss

Vorher abschließenReferenz-Zustandnicht im Katalog

Ein Baseline- oder Soll-Zustand ist bekannt und reproduzierbar (z. B. erfolgreicher Build, vergleichbarer Vorgang, vergleichbarer Tag).

Ohne: Ohne Baseline gibt es nichts zu vergleichen; Change Analysis hat keine Methode-Substanz.

Vorher abschließenIncident Timeline Analysis

Eine chronologische Aufnahme des fehlerhaften Vorgangs liegt vor, damit Veränderungen zeitlich verortet werden können.

Ohne: Ohne Timeline werden Änderungen nicht dem richtigen Zeitfenster zugeordnet, falsche Hypothesen.

Vorbereitung

Was vor Start vorliegen muss

Materialien

Whiteboard oder Tabelle mit drei Spalten (Soll, Ist, Differenz); Zugang zu Versionssystemen, Konfigurationsständen, Deploy-Logs, Mitarbeiter-Schichtplänen; Vorlage für Differenz-Liste.

Personen / Rollen

Ein Lead-Investigator; 2-5 Personen mit Kenntnis der Veränderungsbereiche (Engineering, Ops, Daten, Lieferant); ein Scribe; bei sicherheitskritischen Systemen ein unabhängiger Reviewer.

Vorabinfos

Was funktionierte zuletzt, was funktioniert jetzt nicht; Zeitraum der Abweichung; Liste der bekannten Veränderungen seit Baseline (Deploys, Configs, Personal, Daten, externe Systeme); Logs und Diffs.

Zeitbedarf

60-180 min, je nach Komplexität

Setup

Tabelle mit Soll-, Ist- und Differenz-Spalten anlegen. Kategorien als Zeilen: Code, Konfiguration, Daten, Infrastruktur, Personal, Lieferant, Umfeld, Prozess. Anweisung: pro Zeile Soll und Ist möglichst konkret, Differenz mit Quelle und Zeitstempel.

Kernfrage

Die eine Frage, die diese Methode beantwortet

Welche Unterschiede zwischen Soll- und Ist-Zustand erklären die beobachtete Abweichung, und welche dieser Differenzen sind ursächlich, beitragend oder zufällig?

Ablauf

Marker: Phase

Schritt	Dauer	Aktion	Hinweis
1Phase 1: Baseline und Ist-Zustand erfassen	20-30 min	Baseline-Zustand (wann funktionierte es zuletzt) und Ist-Zustand pro Kategorie konkret beschreiben. Versions-IDs, Konfigurations-Hashes, Personalbesetzungen, Umfeldbedingungen.	Wenn Baseline nicht konkret rekonstruierbar ist, Change Analysis funktioniert nicht. Lieber Wochenarbeit für saubere Baseline als oberflächliche Vermutungen.
2Phase 2: Differenzen auflisten	30-60 min	Pro Kategorie alle Differenzen zwischen Soll und Ist notieren. Auch scheinbar irrelevante Änderungen erfassen (Library-Update, neue Person im Team, geänderter Lieferanten-Service).	Häufiger Fehler: nur die offensichtlichen Änderungen erfassen. Differenzen wie „neuer Sicherheitspatch in OS“ oder „NTP-Server gewechselt“ tauchen oft erst bei systematischer Liste auf.
3Phase 3: Differenzen bewerten	30-45 min	Pro Differenz: ursächlich plausibel, beitragend, zufällig. Begründung pro Bewertung. Bei mehreren plausiblen Ursachen Reihenfolge der Prüfung festlegen.	Confirmation Bias vermeiden: die offensichtlichste Differenz ist nicht automatisch die Ursache. Pro Differenz prüfen: wann wirkt diese Veränderung, passt das zur Timeline.
4Phase 4: Hypothese testen	30-90 min	Verdächtige Differenz isoliert prüfen: Rollback in Staging, A/B-Vergleich, gezielter Test. Ergebnis dokumentieren.	Testen statt vermuten. Wenn Test nicht möglich, mindestens Plausibilität anhand Timeline und Logs prüfen. Hypothese ohne Test bleibt Kandidat, kein Ergebnis.
5Phase 5: Maßnahmen und Lessons	30-45 min	Korrekturmaßnahme für ursächliche Differenz. Strukturelle Lessons: warum war diese Veränderung möglich ohne Aufmerksamkeit. Change-Management-Verbesserungen.	Häufig zeigt sich: Veränderung war ungeplant oder nicht kommuniziert. Strukturell heisst nicht „mehr Reviews“, sondern bessere Erkennung relevanter Differenzen, z. B. Change Calendar oder Diff Notifications.

Artefakt

Was am Ende rauskommt

Form

Differenz-Tabelle mit Soll, Ist, Differenz, Bewertung (ursächlich, beitragend, zufällig), Testergebnis und Maßnahme pro relevante Differenz. Lessons Learned über Change-Sichtbarkeit als zusätzlicher Abschnitt.

Tool-Alternativen

Confluence-Seite mit Tabelle und Verlinkungen zu Logs
Notion-Datenbank mit Filter nach Kategorie
Markdown im Repo unter docs/investigations/<datum>-<thema>.md
Google Sheet mit Spalten pro Phase, geteilt mit Reviewern

Versionierung / Ownership

Datum, Vorfall-ID, Investigator und Reviewer im Header. Spätere Erkenntnisse als Update-Sektion am Ende. Bei Folge-Vorfällen mit ähnlichem Muster Querverweis auf vorherige Change Analysis.

spreadsheet

Change Analysis Arbeitsvorlage

Kompakte Arbeitsvorlage für Change Analysis mit Kontext, Input, Ergebnisartefakten und nächstem Schritt.

# Change Analysis Arbeitsmatrix

| Element | Beschreibung | Bewertung | Evidenz | Owner | Nächster Schritt |
|---|---|---|---|---|---|
| 1 | | | | | |
| 2 | | | | | |
| 3 | | | | | |

## Ergebnisartefakte
- Change Matrix:
- Ursachenhypothesen:
- Validierungsfragen:
- Maßnahmenliste:

## Entscheidung oder Empfehlung

Welche Konsequenz ergibt sich aus der Matrix?

Beispielausgabe

Konkret gefülltes Szenario

change-analysis-beispiel.md

markdown

## Change Analysis — Build-Pipeline schlägt seit 12.05. fehl, 14.05.2026

**Soll**: Build erfolgreich, 4.2 min Laufzeit, zuletzt am 11.05.2026 17:23 UTC.
**Ist**: Build schlägt seit 12.05.2026 09:14 UTC fehl mit Fehler „TLS handshake timeout“ beim Artefakt-Upload.

### Differenz-Tabelle (Auszug)
| Kategorie | Soll | Ist | Bewertung |
|---|---|---|---|
| Code | Commit-SHA a3f9 | Commit-SHA b7c2 | Zufällig (nur Doku-Änderung) |
| CI-Image | golang:1.22.2 | golang:1.22.3 | Beitragend (Patch hat neue CA-Zertifikate) |
| Artefakt-Registry | registry.alpha.io | registry.alpha.io | Soll = Ist |
| Netzwerk-Egress | Direkt | Über neuen Proxy seit 12.05. 08:00 | Ursächlich plausibel |
| Personal | DevOps-Lead Tobias | Tobias im Urlaub seit 12.05. | Beitragend (kein Eskalationspfad) |

### Test
Proxy-Konfiguration im Build-Container deaktiviert: Build erfolgreich (12.05. 11:40). Hypothese bestätigt.

### Maßnahmen
- Proxy-Konfiguration mit korrektem CA-Bundle erweitert. Owner @anna, bis 14.05. 18:00.
- Change Calendar für Netzwerk-Änderungen mit CI-Team teilen, Pflicht-Benachrichtigung 48 h vorab. Owner @sabine, bis 21.05.
- Zweite Person als Vertretung im DevOps-Team benannt, dokumentiert in RACI. Owner @sabine, bis 24.05.

### Lessons
Netzwerk-Änderungen wurden über separates Team eingeführt ohne Benachrichtigung der Build-Pipeline-Owner. Strukturelle Lücke: Cross-Team-Change-Visibility.

Was tun

Pro Vorfall mindestens eine strukturelle Lessons-Learned-Aktion: Sichtbarkeit, Kommunikation, Reviews. Sonst wiederholt sich Muster.

Abbruchkriterien

Done-Signale, in unter einer Minute prüfbar

Baseline nicht rekonstruierbar, kein Soll-Zustand für Vergleich.

Keine Logs, Versionsstände oder Audit-Trails verfügbar, Differenzen sind Spekulation.

Veränderungen sind so zahlreich (z. B. nach Major-Migration), dass Differenzliste nicht handhabbar ist; Methode überfordert, andere RCA nötig.

Vorfall ist nicht reproduzierbar, isolierter Test der Hypothese nicht möglich.

Keine Personen mit Veränderungs-Kontext verfügbar, Bewertung wird beliebig.

Symptom hat keine Veränderung als Ursache (z. B. seit Anbeginn fehlerhaft), Change Analysis ist falsches Werkzeug; RCA mit anderem Ansatz.

Run Sheet durchgearbeitet?

Zum Steckbrief für Zweck, ähnliche Methoden und Quellen — oder direkt zur nächsten Methode im Katalog.

Zum Steckbrief Weitere Methoden