methodatlas
Playbook

Incident aufarbeiten

Von verstreuten Logs und Erinnerungen zu Timeline, Lernpunkten und konkreten Verbesserungen.

Ergebnis

Ein blameless Postmortem mit Timeline, beitragenden Faktoren, Maßnahmen und Follow-up.

Ideal für

  • SRE- und DevOps-Incidents
  • kritische Produktionsstörungen
  • wiederkehrende operative Probleme

Nicht gut für

  • akute Incident-Steuerung
  • schuldorientierte Eskalationen
Ablauf

Methodenpfad

4 Schritte
  1. 4OperationsUpdated Runbook

    Runbook

    Wiederkehrende Response-Schritte in eine klare operative Anleitung überführen.

Vorlagen

Artefakte für dieses Playbook

Markdown

Incident Timeline

Chronologische Vorlage für Incident-Rekonstruktion mit Quellen und Unsicherheiten.

# Incident Timeline

**Incident:** ...
**Zeitraum:** ...
**Quellen:** Logs, Alerts, Chat, Tickets

| Zeit | Ereignis | Quelle | Sicherheit | Notiz |
|---|---|---|---|---|
| HH:MM | | | hoch/mittel/niedrig | |

## Beobachtete Verzögerungen

- ...

## Offene Lücken

- ...

## Lernpunkte

- ...
Markdown

Blameless Postmortem

Vorlage für Lernen, beitragende Faktoren und Maßnahmen nach einem Incident.

# Blameless Postmortem

## Zusammenfassung

Was ist passiert, welche Wirkung hatte es?

## Impact

- Kundenauswirkung:
- Dauer:
- Betroffene Systeme:

## Timeline

Link oder Auszug der Timeline.

## Beitragende Faktoren

- ...

## Was lief gut?

- ...

## Was verbessern wir?

| Maßnahme | Owner | Datum | Erwartete Wirkung |
|---|---|---|---|

## Follow-up

Review-Termin und Status.
Checklist

Runbook Checklist

Checkliste für operative Runbooks mit Trigger, Diagnose, Aktion, Rollback und Eskalation.

- [ ] Trigger klar beschrieben
- [ ] Voraussetzungen und Zugänge genannt
- [ ] Diagnose-Schritte in Reihenfolge
- [ ] Aktionen mit erwarteter Wirkung
- [ ] Verifikation nach jeder kritischen Aktion
- [ ] Rollback oder Stop-Kriterium
- [ ] Eskalationspfad mit Kontakt
- [ ] Letzter Testlauf dokumentiert
Abschlusskriterien