methodatlas
Run SheetProduct DiscoveryAssumption Testing

Riskiest Assumption Test

KomplexitätMedium
Zeit1-2 Wochen pro Iteration
Teilnehmende2-6
FormatBoth
MaturityEstablished
01

Vorbedingung

Was vorher fertig sein muss

Vorher abschließenAssumption Mapping

Eine Annahmen-Map mit allen für die Idee kritischen Annahmen, sortiert nach Unsicherheit und Hebel, liegt vor.

Ohne: Ohne Map wird zufällige Annahme getestet, der größte Unsicherheits-Hebel bleibt versteckt.
Vorher abschließenExperiment Canvas

Team kann Experiment mit Hypothese, Metrik und Schwellenwert strukturieren (Canvas-Methodik bekannt oder parallel angewandt).

Ohne: Ohne Experiment-Struktur fehlt das messbare Erfolgskriterium, Test produziert anekdotische Daten.
02

Vorbereitung

Was vor Start vorliegen muss

Materialien

Annahmen-Liste mit Bewertung Unsicherheit/Hebel; Experiment Canvas zur Strukturierung; minimales Test-Setup (Landing-Page-Builder, Prototyp-Tool, Concierge-Skript); Tracking-Tool für Metriken; Budget-Freigabe.

Personen / Rollen

Ein Discovery-Lead (Product Manager oder Founder); ein Designer/Builder für Test-Setup; ein Engineer bei technisch komplexen Tests; ein Data-Analyst für Metrik-Auswertung.

Vorabinfos

Idee oder Initiative mit Wertversprechen; Annahmen-Map mit Top-3-Kandidaten; Zielgruppe und Recruiting-Channel; verfügbare Test-Tools; Budget und Iteration-Zeitrahmen.

Zeitbedarf

1-2 Wochen pro Iteration

Setup

Annahmen-Map als Quadrant (Achse Unsicherheit, Achse Hebel). Top-Right (hohe Unsicherheit, hoher Hebel) markiert als RAT-Kandidat. Experiment Canvas für gewählte Annahme. Test-Tool entsprechend Annahme-Typ wählen (Wert, Nutzung, Technik, Markt).

03

Kernfrage

Die eine Frage, die diese Methode beantwortet

Welche Annahme würde, wenn sie sich als falsch herausstellt, die Initiative am stärksten gefährden, und mit welchem kleinstmöglichen Test können wir das in 1-2 Wochen prüfen?

04

Ablauf

Marker: Phase

SchrittDauerAktionHinweis
1Phase 1: Annahmen sammeln und bewerten
60-90 minAlle für die Idee kritischen Annahmen sammeln (Wert, Nutzung, Machbarkeit, Markt). Pro Annahme Unsicherheit (0-3) und Hebel (0-3) bewerten. In Quadranten einordnen.Wer keine Annahmen findet, ignoriert sie. Häufige Kategorien: Zahlen Kunden dafür, Finden Kunden uns, Können wir es bauen, Ist der Markt groß genug.
2Phase 2: Top-Annahme wählen
15 minAus Top-Right-Quadrant (hohe Unsicherheit, hoher Hebel) eine Annahme als RAT wählen. Begründung dokumentieren. Eindeutiges Auswahl-Statement: „Diese Annahme testen wir jetzt.“Maximal eine Annahme pro Test-Iteration. Wer parallel testet, kann Ursachen nicht trennen. Andere Annahmen warten in der Pipeline.
3Phase 3: Minimalen Test designen
1-3 TageKleinster funktionierender Test (Landing-Page, Fake-Door, Wizard-of-Oz, Concierge, Survey). Schwellenwert vor Bau fixieren. Setup-Zeit unter 3 Tagen ideal, max 1 Woche.Versuchung: zu großes Testdesign. Faustregel: wenn Test mehr als 1 Woche braucht, ist Annahme zu groß oder Design zu fett. Kleiner schneiden.
4Phase 4: Test ausführen
3-7 TageTest live. Daten sammeln. Tägliche Kurzauswertung, finale Auswertung nach Zeitraum. Annahmen-Killer-Signale beachten (frühzeitig stoppen, wenn klar invalidiert).Test nicht früher als geplant beenden, außer Annahme ist klar widerlegt (z. B. 0 Signups bei 1000 Visits). Dann früher Stop und Pivot-Diskussion.
5Phase 5: Pivot, Persevere oder Stop
30-60 minErgebnis gegen Schwellenwert: Erfolg = Persevere (nächste Annahme testen), Mixed = Re-Design, Misserfolg = Pivot (Wertversprechen ändern) oder Stop. Entscheidung dokumentieren.Pivot ist Sieg, nicht Niederlage. Frühe Invalidierung spart Monate. Persevere ohne neue Tests ist gefährlich, weiter Annahmen-Pipeline abarbeiten.
05

Artefakt

Was am Ende rauskommt

Form

Annahmen-Map-Snapshot, gewählte RAT-Annahme mit Begründung, Experiment Canvas, Test-Setup-Dokumentation, Roh-Daten, Auswertung gegen Schwellenwert, Entscheidung mit Datum.

Tool-Alternativen
  • Miro oder FigJam für Annahmen-Map
  • Strategyzer-Test-Card für RAT
  • Notion-Template Experiment + RAT
  • Carrd oder Webflow für Landing-Page-Tests
  • Maze oder UserTesting für Prototyp-Validierung
Versionierung / Ownership

Pro RAT eigene ID und Datum. Annahmen-Map mit Versions-Stand, abgearbeitete Annahmen markieren. Test-Ergebnis archivieren (nicht löschen) auch bei Pivot, da spätere Iterationen Bezug brauchen.

checklist

Assumption Map Checklist

Checkliste für kritische Annahmen nach Risiko und Wissensstand.

- [ ] Annahme als überprüfbare Aussage formuliert
- [ ] Risiko bewertet
- [ ] Wissensstand bewertet
- [ ] Datenquelle oder Testidee ergänzt
- [ ] Riskiest Assumption markiert
- [ ] Erfolgskriterium definiert
- [ ] Owner und Datum gesetzt
markdown

Experiment Plan

Kurzer Plan für Hypothese, Testdesign, Erfolgskriterium und Entscheidung.

# Experiment Plan

## Hypothese

Wir glauben, dass ...

## Zielgruppe

Für wen testen wir?

## Testdesign

Was machen Teilnehmende oder Nutzende konkret?

## Erfolgskriterium

Wir werten den Test als positiv, wenn ...

## Risiken und Grenzen

Was kann der Test nicht beweisen?

## Entscheidung danach

Wenn positiv: ...
Wenn negativ: ...

## Owner und Datum

...
06

Beispielausgabe

Konkret gefülltes Szenario

riskiest-assumption-test-beispiel.md
markdown
## Riskiest Assumption Test - Beleg-Vorklassifikation, Iteration 1, 2026-05-18

**Idee**: SaaS-Tool für Solo-Steuerberater mit KI-gestützter Beleg-Vorklassifikation.

**Annahmen-Map (Top 5)**
1. Solo-Steuerberater zahlen >29 EUR/Monat dafür. (U=3, H=3) <- RAT
2. KI-Vorklassifikation hat >80% Trefferquote. (U=3, H=2)
3. DATEV-Schnittstelle funktioniert ohne Custom-Adapter. (U=2, H=3)
4. Zielgruppe ist über LinkedIn-Ads erreichbar. (U=2, H=2)
5. Belege werden meist als PDF eingereicht. (U=1, H=2)

**Gewählte RAT**: Annahme 1 (Zahlungsbereitschaft). Begründung: höchster Unsicherheits-Hebel, ohne diese Annahme bricht Geschäftsmodell.

**Test**: Landing-Page mit Wertversprechen, Preis 29 EUR/Monat sichtbar, Smoke-Button „Jetzt vormerken“. Trafficquelle: LinkedIn-Ads, Budget 500 EUR, Zielgruppe Steuerberater 1-3 MA.

**Schwellenwert**: >3% Conversion auf Vormerk-Button bei mindestens 500 Besuchern.

**Test-Zeitraum**: 20.05.-27.05.

**Ergebnis**: 612 Besucher, 24 Vormerkungen = 3,9% Conversion. Schwellenwert übertroffen.

**Entscheidung**: Persevere. Nächste RAT: Annahme 2 (KI-Trefferquote) via Concierge-Test mit 10 Vormerken-Nutzern. Owner: @anna. Start: 03.06.
07

Stolperfallen

Symptome erkennen, gegensteuern

Falle

Mehrere Annahmen gleichzeitig testen

Symptom

Test mischt Wertversprechen und Distribution, bei Misserfolg unklar, welche Annahme falsch war.

Was tun

Eine Annahme pro Test. Wer Distribution und Wert mischen will, Test in zwei Phasen aufteilen. Saubere Annahmen-Isolation ist methodischer Kern.

Falle

Falsche RAT-Wahl

Symptom

Test prüft Annahme mit hohem Hebel aber niedriger Unsicherheit (z. B. „funktioniert die Datenbank“).

Was tun

Bewertung Unsicherheit ehrlich: Was wissen wir wirklich, was raten wir. Niedrige Unsicherheit braucht keinen Test. RAT ist immer in Top-Right des Quadranten.

Falle

Schwellenwert wird nachträglich gesetzt

Symptom

Ergebnis kommt, Stakeholder findet Begründung, warum 1% schon Erfolg ist.

Was tun

Schwellenwert vor Test fixieren, schriftlich. Bei Diskussion nach Test: war Schwellenwert falsch gewählt, ja oder nein. Wenn ja, Re-Test mit korrigiertem Schwellenwert, nicht Nachinterpretation.

Falle

Überengineerter Test

Symptom

Statt 2-Tage-Landing-Page wird 6-Wochen-Prototyp gebaut, Iteration-Tempo bricht ein.

Was tun

Test-Aufwand proportional zur Annahme. Faustregel: wenn Setup-Zeit > Test-Laufzeit, ist Setup zu groß. Kleinstes ausreichendes Format wählen.

Falle

Persevere ohne Pipeline

Symptom

Eine Annahme bestätigt, Team springt in vollen Build-Modus, andere Annahmen bleiben unbestätigt.

Was tun

Annahmen-Pipeline abarbeiten. Persevere heißt: nächste RAT, nicht Build-Sprint. Nach 3-5 bestätigten RATs ist MVP-Build vertretbar.

08

Abbruchkriterien

Done-Signale, in unter einer Minute prüfbar

Idee hat keine kritischen Annahmen mehr (alle bestätigt), RAT ist nicht der nächste Schritt.
Top-Annahme ist nicht falsifizierbar (zu vage), Test wäre Spekulation.
Test-Aufwand übersteigt Investitionsbudget der Discovery-Phase.
Zielgruppe für Test nicht erreichbar, Ergebnis wäre nicht aussagekräftig.
Stakeholder will Test nicht ergebnisoffen führen, Entscheidung steht schon fest.
Bereits in Build-Phase, RAT würde nur Nachweis liefern, keine Kurskorrektur ermöglichen.

Run Sheet durchgearbeitet?

Zum Steckbrief für Zweck, ähnliche Methoden und Quellen — oder direkt zur nächsten Methode im Katalog.