Eine Liste von Hypothesen oder Annahmen mit Bezug zur Initiative liegt vor (typisch 5-20 Einträge).
Hypothesis Prioritization Canvas
Vorbedingung
Was vorher fertig sein muss
Vorbereitung
Was vor Start vorliegen muss
Canvas mit drei Achsen (Risiko, Evidenz, Aufwand) oder Quadrant; Hypothesen-Liste als Karten; Bewertungsskala-Definitionen sichtbar; Stifte; Timer; Tool für Voting (Miro, FigJam).
Ein Facilitator, der Skalen wachhält und Konsens moderiert; ein Product Lead als Hypothesen-Owner; 3-6 Teilnehmer aus Discovery, Engineering, Design, Data; ein Scribe für Bewertungen.
Hypothesen-Liste 1-2 Tage vorab verteilt; Skalen-Definitionen (Risiko 1-5, Evidenz 1-5, Aufwand 1-5); bestehende Evidenz aus Analytics, Interviews oder früheren Tests; Test-Tool-Optionen mit groben Aufwandsschätzungen.
60-90 min
Canvas mit drei Achsen oder Quadranten. Skala-Banner an die Wand: Risiko (Konsequenz bei falscher Hypothese), Evidenz (wie gut belegt), Aufwand (Test-Kosten). Hypothesen-Karten bereitlegen.
Kernfrage
Die eine Frage, die diese Methode beantwortet
Welche Hypothesen kombinieren hohes Risiko, niedrige Evidenz und niedrigen Testaufwand, und welche davon werden in den nächsten Iterationen getestet?
Ablauf
Marker: Phase
| Schritt | Dauer | Aktion | Hinweis |
|---|---|---|---|
1Phase 1: Skalen kalibrieren | 10 min | Definitionen pro Skala mit Beispielen durchgehen. Mindestens je ein Beispiel pro Stufe (z. B. „Risiko 5: ohne Bestätigung wäre Geschäftsmodell tot“). Konsens festhalten. | Ohne Skala-Kalibrierung wird Bewertung Bauchgefühl. Wer die Skalen nicht klar machen kann, hat keine Basis für Priorisierung. |
2Phase 2: Hypothesen einzeln bewerten | 30-40 min | Pro Hypothese drei Werte vergeben: Risiko, Evidenz, Aufwand. Voting verdeckt, dann Konsens-Wert. Bei Divergenz Annahmen erfragen, nicht durchsetzen. | Maximal 3 min pro Hypothese. Bei langen Debatten Annahme dokumentieren und Diskussion in Followup parken. Hypothesen-Bewertung ist Triage, nicht Tiefenanalyse. |
3Phase 3: Canvas-Positionierung | 10 min | Hypothesen auf Canvas anordnen. Top-Right-Quadrant: hohes Risiko, niedrige Evidenz, niedriger Aufwand. Diese sind Top-Test-Kandidaten. | Wenn Top-Right leer ist, sind Hypothesen entweder zu allgemein oder Tests zu groß. Re-Formulierung oder Slicing der Tests. |
4Phase 4: Test-Backlog und Owner | 10-20 min | Top-3 Hypothesen für nächste Tests wählen. Pro Hypothese Owner und Start-Datum. Folge-Hypothesen als Backlog dokumentieren. Pipeline-Reihenfolge fixieren. | Maximal drei parallele Tests bei kleinen Teams. Bei Discovery-Teams >5 Personen mehr möglich. Pipeline-Disziplin: nicht alle gleichzeitig starten. |
Artefakt
Was am Ende rauskommt
Priorisierungs-Canvas als Board-Export, plus Hypothesen-Backlog in Markdown oder Tabelle mit Bewertung (R/E/A), Position im Canvas, Owner, Test-Status, geplantes Start-Datum.
- Strategyzer-Vorlage Hypothesis Prioritization
- Miro oder FigJam mit Canvas-Template
- Notion-Datenbank mit Properties Risiko/Evidenz/Aufwand
- Productboard mit Custom-Felder
- Confluence-Seite mit Tabelle und eingebettetem Canvas
Pro Discovery-Sprint Snapshot mit Datum. Hypothesen mit Status (Geplant, Getestet, Bestätigt, Verworfen) pflegen. Bei Status-Änderung Datum und Test-Verweis. Pipeline-Backlog laufend aktualisiert, Vorversion archivieren.
Hypothesis Prioritization Canvas Arbeitsvorlage
Kompakte Arbeitsvorlage für Hypothesis Prioritization Canvas mit Kontext, Input, Ergebnisartefakten und nächstem Schritt.
# Hypothesis Prioritization Canvas Canvas
## Kontext
Wofür wird die Methode eingesetzt?
## Kernfrage
Welche Frage soll am Ende beantwortet sein?
## Input
Welche Daten, Beobachtungen oder Materialien liegen vor?
## Arbeitsfläche
- Bereich 1:
- Bereich 2:
- Bereich 3:
- Beziehungen / Muster:
## Ergebnisartefakte
- Priorisierungs-Canvas:
- Hypothesen-Backlog:
## Offene Fragen
- ...
## Nächster Schritt
Owner, Datum, Erfolgssignal.Beispielausgabe
Konkret gefülltes Szenario
## Hypothesis Prioritization - Beleg-Vorklassifikation, 2026-05-18
**Skalen**
- Risiko: 1=kosmetisch, 3=Iteration verzögert, 5=Geschäftsmodell-tot.
- Evidenz: 1=keine Daten, 3=Anekdote, 5=quantitative Validierung.
- Aufwand: 1=Survey 1 Tag, 3=Landing-Page 1 Woche, 5=Prototyp >2 Wochen.
**Hypothesen-Pipeline (8 bewertet)**
| ID | Hypothese | R | E | A | Position |
|----|-----------|---|---|---|----------|
| H1 | Solo-Steuerberater zahlen >29 EUR/Monat | 5 | 1 | 2 | Top-Right (Test 1) |
| H2 | KI-Trefferquote >80% akzeptabel | 4 | 1 | 3 | Top-Right (Test 2) |
| H3 | LinkedIn-Ads erreichen Zielgruppe | 3 | 2 | 2 | Right (Test 3) |
| H4 | DATEV-Schnittstelle ohne Custom-Adapter | 4 | 3 | 2 | Mid |
| H5 | Belege meist als PDF | 2 | 4 | 1 | Bottom-Left (verworfen, Evidenz reicht) |
| H6 | Steuerberater nutzen Mobile-First | 2 | 1 | 2 | Mid-Left (Backlog) |
| H7 | Empfehlungs-Modus bringt Wachstum | 3 | 1 | 4 | Mid (nach H1-H3) |
| H8 | Compliance-Auflagen für KI-Verarbeitung lösbar | 5 | 2 | 4 | Mid (parallel Klärung) |
**Top-3 für Test-Pipeline**
1. H1 Zahlungsbereitschaft - Landing-Page-Test, Owner: @lisa, Start 20.05.
2. H2 KI-Trefferquote - Concierge-Test mit 10 Nutzern, Owner: @anna, Start 03.06.
3. H3 Distribution - Ads-Kampagne, Owner: @marcus, Start 27.05.Stolperfallen
Symptome erkennen, gegensteuern
Skalen ohne Beispiele
Bewertungen sind inkonsistent, Risiko 4 bei einer Hypothese entspricht Risiko 2 bei anderer.
Vor Bewertung pro Skala-Stufe Beispiele aus Initiativen-Kontext. Skala-Definitionen schriftlich an der Wand. Bei Unklarheit Workshop unterbrechen, Skala schärfen.
Evidenz wird Bauchgefühl
Hohe Evidenz wird ohne Quellenangabe vergeben, Hypothesen werden vorschnell als „belegt“ aussortiert.
Pro Evidenz >3 Quelle benennen (Studie, Interview-Zitate, Analytics-Auszug). Ohne Quelle ist Evidenz 1 oder 2. Hypothesen werden nicht aussortiert, nur durch belegte Evidenz.
Risiko und Aufwand vermischt
Bewertung „hohes Risiko, hoher Aufwand“ wird als „nicht testen“ behandelt, Risiko-Hypothesen werden ignoriert.
Drei Achsen getrennt halten. Hochrisiko-Hypothesen mit hohem Aufwand werden in Subhypothesen zerlegt oder mit kleinerem Test-Design vorpilotiert.
Zu viele parallele Tests
Top-5 alle gleichzeitig gestartet, Team hat keine Kapazität, Tests werden schlecht ausgeführt.
Maximal 3 parallele Tests bei Standard-Discovery-Team. Pipeline strikt sequenziell oder gestaffelt. Lieber wenige saubere Tests als viele halbgare.
Hypothesen-Schwund
Nach Workshop wird Canvas vergessen, Hypothesen verschwinden in Confluence-Seite ohne Followup.
Pipeline-Backlog in zentralem Tool (Productboard, Notion). Test-Status laufend pflegen. Wöchentliche Discovery-Review mit Canvas-Update.
Abbruchkriterien
Done-Signale, in unter einer Minute prüfbar
Run Sheet durchgearbeitet?
Zum Steckbrief für Zweck, ähnliche Methoden und Quellen — oder direkt zur nächsten Methode im Katalog.