Run SheetMarketingExperiment Planning

Growth Experiment

KomplexitätMedium

Zeit1-2 Wochen

Teilnehmende1-6

FormatBoth

MaturityEstablished

Vorbedingung

Was vorher fertig sein muss

Vorher abschließenAARRR Engpass

Der Engpass im Wachstumsfunnel ist datenbasiert identifiziert (Acquisition, Activation, Retention, Referral oder Revenue).

Ohne: Ohne identifizierten Engpass landen Experimente an Stellen, die kein Hebel sind, ROI bleibt aus.

Vorher abschließenICE Scoring

Hypothesenbacklog mit Impact, Confidence und Ease bewertet vorliegen, sodass Priorisierung nachvollziehbar ist.

Ohne: Ohne Priorisierung laufen Lieblings-Ideen statt der staerksten Hypothesen, Lernrate sinkt.

Vorbereitung

Was vor Start vorliegen muss

Materialien

Experiment-Card-Vorlage (Hypothese, Zielmetrik, Setup, Dauer, Sample, Owner, Lernziel); Hypothesenbacklog (Notion, Trello oder Linear); Trackingsystem; Slack-Channel fuer Updates.

Personen / Rollen

Ein Growth Owner; Engineer fuer Implementierung (ggf. No-Code-Setup); Datenanalyst fuer Auswertung; Marketing- oder Content-Vertreter fuer Reichweitenexperimente; Reviewer fuer Cards.

Vorabinfos

Engpass-Stufe und Baseline; bisheriger Wissensstand zur Hypothese; verfuegbare Channels; Budget pro Experiment; rechtliche Constraints (GDPR, Werbung).

Zeitbedarf

1-2 Wochen pro Experiment, ggf. parallel bis zu 3

Setup

Card-Format festziehen. Wochen-Cadence fuer Kickoff, Mid-Check und Review. Kanban-Board mit Spalten Backlog, Bereit, Laufend, Auswertung, Erledigt. Definition of Done: dokumentierte Lessons Learned.

Kernfrage

Die eine Frage, die diese Methode beantwortet

Welche kleinste Intervention am Engpass liefert in einer Woche ein interpretierbares Lernergebnis zur Hypothese?

Ablauf

Marker: Phase

Schritt	Dauer	Aktion	Hinweis
1Phase 1: Hypothese und Card	60 min	Hypothese im Format „Wenn wir X tun, dann passiert Y, weil Z“ schreiben. Erfolgsmetrik, Sekundaermetrik, Mindesteffekt, Sample, Dauer, Owner und Lernziel in die Card eintragen.	Wenn die Hypothese sechs Sub-Aenderungen enthaelt, ist sie kein Experiment, sondern ein Projekt. Auf eine Aenderung reduzieren, sonst kein Lernen.
2Phase 2: Bauen oder Faken	1-5 Tage	Minimale Umsetzung waehlen: Feature-Flag, Landingpage-Variante, manueller Wizard-of-Oz, Email-Sequenz. Schnellste Variante, die Lernen erlaubt.	Wenn die Umsetzung mehr als 5 Tage braucht, ist das Experiment zu gross. Spike oder Fake-Door vorschalten, um Hypothese billiger zu testen.
3Phase 3: Laufen lassen	1-3 Wochen	Experiment live nehmen. Taegliches Health-Check (Tracking aktiv, keine Crashes, kein Support-Brand). Keine Mid-Check-Decision zur Erfolgsmetrik vor Sample-Erreichung.	Health-Check ist nicht Auswertung. Wer taeglich die Erfolgsmetrik anschaut, peeked. Strikt trennen: Health = funktioniert es technisch, Auswertung = wirkt es.
4Phase 4: Auswerten	1 Tag	Ergebnisse gegen Erfolgs- und Counter-Metriken pruefen. Decision: Double-Down (skalieren), Iterate (Variante anpassen), Kill (Hypothese verworfen). Lessons Learned dokumentieren.	Auch ein „Kill“ ist wertvoll. Wichtig ist die Aussage: was wissen wir jetzt, was wir vorher nicht wussten. Ohne Lerneintrag ist das Experiment verschwendet.
5Phase 5: Naechste Hypothese	30 min	Lessons in Knowledge Base ablegen. Hypothesenbacklog updaten: bestaetigte Annahmen erhoehen Confidence anderer Hypothesen, verworfene reduzieren. Naechstes Experiment einplanen.	Backlog-Update ist die Bruecke zur Lernrate. Wenn Lessons nicht in spaetere Confidence-Bewertungen einfliessen, lernt die Organisation pro Quartal nichts.

Artefakt

Was am Ende rauskommt

Form

Experiment-Card mit allen Setup-Feldern plus Auswertung, Decision, Lessons Learned und Links zu Implementierung. Aggregierte Quartals-Sicht: laufende und abgeschlossene Experimente, Win-Rate, Lerngewinne pro Engpass-Stufe.

Tool-Alternativen

Notion- oder Confluence-Datenbank mit Card-Template
Trello oder Linear mit Custom-Fields
GrowthHackers Projects oder Mooncamp
Airtable mit Reports fuer Win-Rate und Throughput

Versionierung / Ownership

Pro Experiment ID, Datum und Engpass-Tag. Lessons Learned als persistenter Eintrag in Knowledge Base, nicht in der Card archivieren. Quartals-Recap mit Win-Rate, Hauptlernen und Folgehypothesen.

markdown

Experiment Plan

Kurzer Plan für Hypothese, Testdesign, Erfolgskriterium und Entscheidung.

# Experiment Plan

## Hypothese

Wir glauben, dass ...

## Zielgruppe

Für wen testen wir?

## Testdesign

Was machen Teilnehmende oder Nutzende konkret?

## Erfolgskriterium

Wir werten den Test als positiv, wenn ...

## Risiken und Grenzen

Was kann der Test nicht beweisen?

## Entscheidung danach

Wenn positiv: ...
Wenn negativ: ...

## Owner und Datum

...

Beispielausgabe

Konkret gefülltes Szenario

growth-experiment-beispiel.md

markdown

## Growth Experiment EXP-2026-019 - Onboarding-Email-Sequenz auf Personalisierung

**Engpass**: Activation (Pirate-Stufe), Baseline 6.8%.

**Hypothese**: Wenn die Onboarding-Email-Sequenz die ersten 3 Mails auf den ausgewaehlten Use Case zuschneidet (Tagesbuchung vs. Dauerplatz), dann steigt Activation in 7 Tagen von 6.8% auf 8.5%, weil Nutzer schneller den passenden Workflow finden.

**Setup**: 2 Sequenzen (Use-Case A, Use-Case B) statt einer Generic-Sequenz. Verteilung anhand Onboarding-Antwort. Implementierung in Customer.io.

**Sample**: 1.800 neue Nutzer (900 Generic vs. 900 Use-Case-spezifisch).

**Dauer**: 14 Tage (KW 18-19).

**Ergebnis**
- Activation: Generic 6.9%, Use-Case 9.1%, Delta +2.2pp, p=0.008.
- Open-Rate Mail 1: Generic 41%, Use-Case 53%.
- Counter (Unsubscribe): 1.1% vs. 1.0%, kein Effekt.

**Decision**: Double-Down. Use-Case-Sequenz wird ab 25.05. Standard. Folge-Hypothese: weitere Use-Case-Segmente (Team-Coworking).

**Lessons Learned**: Personalisierung zahlt bei Activation auch ohne Verhaltensdaten ein, sobald der Use Case beim Onboarding erfasst wird. Confidence „Use Case erfasst“ jetzt 8/10.

Was tun

Pro Experiment mindestens eine Lagging-Counter-Metric. Decision-Rule: kein Double-Down bei signifikanter Counter-Verschlechterung, auch wenn Primaer-Metrik positiv ist.

Abbruchkriterien

Done-Signale, in unter einer Minute prüfbar

Baseline-Volumen reicht in 4 Wochen nicht fuer minimale Sample-Groesse.

Engpass ist nicht identifiziert, Experimente sind Schuesse ins Blaue.

Hypothesen werden nicht priorisiert, Backlog wird Wunschliste.

Counter-Metrics existieren nicht oder werden nicht getrackt.

Lessons Learned werden nicht festgehalten, Organisation lernt nicht ueber Experimente hinweg.

Owner pro Experiment nicht namentlich, Verantwortung diffundiert.

Mehr als drei Experimente gleichzeitig in derselben Funnel-Stufe, Interferenz unkontrollierbar.

Run Sheet durchgearbeitet?

Zum Steckbrief für Zweck, ähnliche Methoden und Quellen — oder direkt zur nächsten Methode im Katalog.

Zum Steckbrief Weitere Methoden