Der Engpass im Wachstumsfunnel ist datenbasiert identifiziert (Acquisition, Activation, Retention, Referral oder Revenue).
Growth Experiment
Vorbedingung
Was vorher fertig sein muss
Hypothesenbacklog mit Impact, Confidence und Ease bewertet vorliegen, sodass Priorisierung nachvollziehbar ist.
Vorbereitung
Was vor Start vorliegen muss
Experiment-Card-Vorlage (Hypothese, Zielmetrik, Setup, Dauer, Sample, Owner, Lernziel); Hypothesenbacklog (Notion, Trello oder Linear); Trackingsystem; Slack-Channel fuer Updates.
Ein Growth Owner; Engineer fuer Implementierung (ggf. No-Code-Setup); Datenanalyst fuer Auswertung; Marketing- oder Content-Vertreter fuer Reichweitenexperimente; Reviewer fuer Cards.
Engpass-Stufe und Baseline; bisheriger Wissensstand zur Hypothese; verfuegbare Channels; Budget pro Experiment; rechtliche Constraints (GDPR, Werbung).
1-2 Wochen pro Experiment, ggf. parallel bis zu 3
Card-Format festziehen. Wochen-Cadence fuer Kickoff, Mid-Check und Review. Kanban-Board mit Spalten Backlog, Bereit, Laufend, Auswertung, Erledigt. Definition of Done: dokumentierte Lessons Learned.
Kernfrage
Die eine Frage, die diese Methode beantwortet
Welche kleinste Intervention am Engpass liefert in einer Woche ein interpretierbares Lernergebnis zur Hypothese?
Ablauf
Marker: Phase
| Schritt | Dauer | Aktion | Hinweis |
|---|---|---|---|
1Phase 1: Hypothese und Card | 60 min | Hypothese im Format „Wenn wir X tun, dann passiert Y, weil Z“ schreiben. Erfolgsmetrik, Sekundaermetrik, Mindesteffekt, Sample, Dauer, Owner und Lernziel in die Card eintragen. | Wenn die Hypothese sechs Sub-Aenderungen enthaelt, ist sie kein Experiment, sondern ein Projekt. Auf eine Aenderung reduzieren, sonst kein Lernen. |
2Phase 2: Bauen oder Faken | 1-5 Tage | Minimale Umsetzung waehlen: Feature-Flag, Landingpage-Variante, manueller Wizard-of-Oz, Email-Sequenz. Schnellste Variante, die Lernen erlaubt. | Wenn die Umsetzung mehr als 5 Tage braucht, ist das Experiment zu gross. Spike oder Fake-Door vorschalten, um Hypothese billiger zu testen. |
3Phase 3: Laufen lassen | 1-3 Wochen | Experiment live nehmen. Taegliches Health-Check (Tracking aktiv, keine Crashes, kein Support-Brand). Keine Mid-Check-Decision zur Erfolgsmetrik vor Sample-Erreichung. | Health-Check ist nicht Auswertung. Wer taeglich die Erfolgsmetrik anschaut, peeked. Strikt trennen: Health = funktioniert es technisch, Auswertung = wirkt es. |
4Phase 4: Auswerten | 1 Tag | Ergebnisse gegen Erfolgs- und Counter-Metriken pruefen. Decision: Double-Down (skalieren), Iterate (Variante anpassen), Kill (Hypothese verworfen). Lessons Learned dokumentieren. | Auch ein „Kill“ ist wertvoll. Wichtig ist die Aussage: was wissen wir jetzt, was wir vorher nicht wussten. Ohne Lerneintrag ist das Experiment verschwendet. |
5Phase 5: Naechste Hypothese | 30 min | Lessons in Knowledge Base ablegen. Hypothesenbacklog updaten: bestaetigte Annahmen erhoehen Confidence anderer Hypothesen, verworfene reduzieren. Naechstes Experiment einplanen. | Backlog-Update ist die Bruecke zur Lernrate. Wenn Lessons nicht in spaetere Confidence-Bewertungen einfliessen, lernt die Organisation pro Quartal nichts. |
Artefakt
Was am Ende rauskommt
Experiment-Card mit allen Setup-Feldern plus Auswertung, Decision, Lessons Learned und Links zu Implementierung. Aggregierte Quartals-Sicht: laufende und abgeschlossene Experimente, Win-Rate, Lerngewinne pro Engpass-Stufe.
- Notion- oder Confluence-Datenbank mit Card-Template
- Trello oder Linear mit Custom-Fields
- GrowthHackers Projects oder Mooncamp
- Airtable mit Reports fuer Win-Rate und Throughput
Pro Experiment ID, Datum und Engpass-Tag. Lessons Learned als persistenter Eintrag in Knowledge Base, nicht in der Card archivieren. Quartals-Recap mit Win-Rate, Hauptlernen und Folgehypothesen.
Experiment Plan
Kurzer Plan für Hypothese, Testdesign, Erfolgskriterium und Entscheidung.
# Experiment Plan
## Hypothese
Wir glauben, dass ...
## Zielgruppe
Für wen testen wir?
## Testdesign
Was machen Teilnehmende oder Nutzende konkret?
## Erfolgskriterium
Wir werten den Test als positiv, wenn ...
## Risiken und Grenzen
Was kann der Test nicht beweisen?
## Entscheidung danach
Wenn positiv: ...
Wenn negativ: ...
## Owner und Datum
...Beispielausgabe
Konkret gefülltes Szenario
## Growth Experiment EXP-2026-019 - Onboarding-Email-Sequenz auf Personalisierung
**Engpass**: Activation (Pirate-Stufe), Baseline 6.8%.
**Hypothese**: Wenn die Onboarding-Email-Sequenz die ersten 3 Mails auf den ausgewaehlten Use Case zuschneidet (Tagesbuchung vs. Dauerplatz), dann steigt Activation in 7 Tagen von 6.8% auf 8.5%, weil Nutzer schneller den passenden Workflow finden.
**Setup**: 2 Sequenzen (Use-Case A, Use-Case B) statt einer Generic-Sequenz. Verteilung anhand Onboarding-Antwort. Implementierung in Customer.io.
**Sample**: 1.800 neue Nutzer (900 Generic vs. 900 Use-Case-spezifisch).
**Dauer**: 14 Tage (KW 18-19).
**Ergebnis**
- Activation: Generic 6.9%, Use-Case 9.1%, Delta +2.2pp, p=0.008.
- Open-Rate Mail 1: Generic 41%, Use-Case 53%.
- Counter (Unsubscribe): 1.1% vs. 1.0%, kein Effekt.
**Decision**: Double-Down. Use-Case-Sequenz wird ab 25.05. Standard. Folge-Hypothese: weitere Use-Case-Segmente (Team-Coworking).
**Lessons Learned**: Personalisierung zahlt bei Activation auch ohne Verhaltensdaten ein, sobald der Use Case beim Onboarding erfasst wird. Confidence „Use Case erfasst“ jetzt 8/10.Stolperfallen
Symptome erkennen, gegensteuern
Experiment ist ein Projekt
Setup dauert 6 Wochen, mehrere Variablen aendern sich gleichzeitig.
Auf eine Variable reduzieren. Wenn nicht moeglich, in Sub-Experimente zerlegen. Lieber zwei kleine Tests sequentiell als ein grosser ohne Lernrate.
Lieblings-Idee ohne Hypothesenrang
Experimente kommen aus dem Bauch des Gruenders, ICE-Bewertung wird umgangen.
Backlog mit ICE oder RICE durchsetzen. Top-3 wird gewaehlt, alle anderen warten. Ausnahmen nur mit dokumentierter Begruendung.
Health-Check verwechselt mit Auswertung
Team schaut taeglich auf Erfolgsmetrik, Decision-Druck entsteht vor Sample-Erreichung.
Dashboard splitten: Health (Tracking, Crashes, Sample-Fortschritt) und Auswertung (gesperrt bis Sample-Ende). Disziplin durch Tool-Konfiguration absichern.
Lessons Learned bleiben in der Card
Drei Monate spaeter laeuft ein Experiment, das schon einmal getestet wurde, niemand weiss es.
Knowledge Base separat fuehren, durchsuchbar, mit Tags pro Engpass. Vor jedem Experiment Suche nach vergleichbarer Hypothese verpflichtend.
Counter-Metrik fehlt
Acquisition steigt, Activation oder Retention faellt unbemerkt.
Pro Experiment mindestens eine Lagging-Counter-Metric. Decision-Rule: kein Double-Down bei signifikanter Counter-Verschlechterung, auch wenn Primaer-Metrik positiv ist.
Abbruchkriterien
Done-Signale, in unter einer Minute prüfbar
Run Sheet durchgearbeitet?
Zum Steckbrief für Zweck, ähnliche Methoden und Quellen — oder direkt zur nächsten Methode im Katalog.