Mindestens 10 vergleichbare Ideen oder Experimente sind in einer Liste mit kurzem Hypothesensatz vorhanden.
ICE Scoring
Vorbedingung
Was vorher fertig sein muss
Vorbereitung
Was vor Start vorliegen muss
Tabelle (Idee, Hypothese, I, C, E, Score, Owner, Status); Skalen-Definition als sichtbarer Anker; Beispielwerte für 1, 5 und 10 pro Dimension.
Ein Facilitator (Growth Lead oder PM); 3-6 Bewerter aus Product, Engineering, Marketing oder Data; ein Schiedsrichter bei großer Streubreite.
Aktuelle Wachstumsziele oder Outcome-Kontext; bisherige Experimente mit Ergebnis (für Confidence-Kalibrierung); bekannte Kapazität pro Sprint.
30-60 min
Tabelle teilen, Spalten I, C, E mit Skala 1-10 vorbereiten. Vor Start Anker setzen: Was ist Impact 10 in eurer Welt (z. B. North-Star um 5% bewegen)? Was ist Ease 10 (z. B. < 2 Tage Entwicklung)?
Kernfrage
Die eine Frage, die diese Methode beantwortet
Welche Ideen geben uns die höchste Lernrate pro Aufwand und welche sortieren wir bewusst aus?
Ablauf
Marker: Phase
| Schritt | Dauer | Aktion | Hinweis |
|---|---|---|---|
1Phase 1: Skalen kalibrieren | 10 min | Drei vergangene Experimente als Referenz nehmen: einer mit hohem Impact, einer mit niedrigem, einer mit dazwischen. Werte explizit machen, sodass jeder die Skala gleich versteht. | Wenn keine Referenz-Experimente existieren, an konkreten Zahlen aus dem Backlog ankern. Sonst skalieren alle gegen ihr eigenes Bauchgefühl. |
2Phase 2: Solo-Bewertung | 15-20 min | Jeder Bewerter füllt I, C, E pro Idee allein aus, ohne Diskussion. Keine Mittelwerte ausrechnen, einzelne Punkte sichtbar lassen. | Diskussion in dieser Phase verdirbt die Verteilung. Bewertungen erst nach allen Solos zeigen. |
3Phase 3: Streuung prüfen | 15 min | Pro Idee Streubreite anschauen. Bei Differenz > 3 Punkten in einer Dimension kurz diskutieren, was die Bewerter unterschiedlich sehen. Annahmen explizit machen, keine Mittelwerte erzwingen. | Hohe Streuung ist Information, kein Defekt. Sie zeigt unterschiedliche Annahmen oder Wissensstände. |
4Phase 4: Score und Cut-off | 10-15 min | Score pro Idee berechnen (I * C * E oder Mittel der Bewerter). Cut-off setzen, etwa Top-N nach Score oder oberhalb einer Schwelle. Begründete Ausnahmen erlaubt. | Multiplikation hebt extreme Werte. Falls eine Idee in einer Dimension < 3 hat, lieber ganz raus, statt sie durch hohe andere Werte zu retten. |
Artefakt
Was am Ende rauskommt
Tabelle mit Idee, Hypothese, individuellen Bewertungen, aggregiertem Score, Status (Top, Backlog, Verworfen), Owner und Datum. Plus knappe Notiz zu Skalen-Anker und Streuungsdiskussion.
- Google Sheet mit Formel und Sortierfunktion
- Notion- oder Coda-Datenbank mit Filter
- Productboard oder Reveall für Idea-Management
- Linear-Issue-Liste mit ICE-Properties
Pro Bewertungsrunde Datum und Bewerter im Header. Alte Scores nicht überschreiben, sondern als neue Spalte oder Snapshot anlegen, damit Lernen über Confidence-Kalibrierung sichtbar wird.
ICE Scoring Arbeitsvorlage
Kompakte Arbeitsvorlage für ICE Scoring mit Kontext, Input, Ergebnisartefakten und nächstem Schritt.
# ICE Scoring Arbeitsvorlage
## Ziel
Priorisiert Ideen über Impact, Confidence und Ease.
## Kontext
Wann und wofür nutzen wir diese Methode?
## Input
Welche Daten, Beobachtungen, Entscheidungen oder Materialien liegen vor?
## Durchführung
Kurze Notizen entlang des Run Sheets.
## Ergebnisartefakte
- ICE-Tabelle:
- Top-Ideenliste:
## Annahmen und offene Fragen
- ...
## Entscheidung / Nächster Schritt
Owner, Datum und Erfolgssignal.Beispielausgabe
Konkret gefülltes Szenario
## ICE Scoring — Activation Squad, KW 21/2026
Skalen-Anker: Impact 10 = +5% D7-Retention, Ease 10 = unter 2 Tagen umsetzbar.
| Idee | I | C | E | Score | Status |
|---|---|---|---|---|---|
| Tooltip bei leerem Workspace | 7 | 8 | 9 | 504 | Top |
| Empfehlungs-Email Tag 3 | 8 | 5 | 6 | 240 | Top |
| Re-Engagement Push 30 Tage | 6 | 4 | 7 | 168 | Backlog |
| Verifizierungs-Flow umbauen | 9 | 6 | 2 | 108 | Backlog |
| Persönlichkeits-Quiz Onboarding | 4 | 3 | 5 | 60 | Verworfen |
Streuungs-Notiz: Idee Verifizierungs-Flow von @ben bei Ease 1, von @anna bei 4 (unterschiedliche Annahmen zu Auth-Refactor).Stolperfallen
Symptome erkennen, gegensteuern
Skalen ohne Anker
Bewerter geben Werte zwischen 6 und 9 für alle Ideen, Differenzierung fehlt.
Vor der nächsten Runde drei reale Anker setzen, einer am unteren, einer mittig, einer am oberen Skalenende. Bewerter explizit gegen diese Anker bewerten lassen.
Confidence als Optimismus
Confidence-Werte liegen alle bei 8-10, weil niemand „wenig zuversichtlich“ wirken will.
Confidence an erfolgreichen Vorerfahrungen oder Daten festmachen. Confidence 9 fordert mindestens ein vergleichbares positives Experiment im Bestand.
Mittelwerte ohne Diskussion
Bewerter mitteln Zahlen sofort, divergierende Annahmen verschwinden.
Streuung erst sichtbar machen, dann diskutieren. Differenz > 3 Punkte ist Triggerschwelle für Annahmen-Klärung.
Score als Wahrheit
Team sieht die Top-N als Auftrag, ohne strategischen Kontext zu prüfen.
Top-Liste explizit gegen aktuelle Outcomes oder OKRs gegenchecken. Bewusste Abweichung erlaubt, aber im Protokoll begründen.
Skala-Drift über Zeit
Nach drei Bewertungsrunden bedeuten Impact 8 und Ease 7 etwas anderes als zu Beginn.
Anker-Beispiele alle 4-6 Wochen mit dem Team neu bestätigen oder anpassen. Drift dokumentieren, nicht stillschweigend laufen lassen.
ICE für Strategie missbraucht
Quartals-Strategie oder große Plattform-Investments werden mit ICE priorisiert.
Auf das richtige Werkzeug wechseln: WSJF, CoD oder qualitative Strategie-Methoden. ICE bleibt im Experiment-Backlog.
Abbruchkriterien
Done-Signale, in unter einer Minute prüfbar
Run Sheet durchgearbeitet?
Zum Steckbrief für Zweck, ähnliche Methoden und Quellen — oder direkt zur nächsten Methode im Katalog.