methodatlas
Run SheetUX ResearchInformation Architecture

Tree Testing

KomplexitätMedium
Zeit1-2 Tage
Teilnehmende10-30
FormatAsync
MaturityCanonical
01

Vorbedingung

Was vorher fertig sein muss

Vorher abschließenIA-Hypothese

Eine konkrete IA-Struktur (Hierarchie aus Card Sorting oder bestehender Navigation) liegt vor, die getestet werden soll.

Ohne: Ohne testbare Struktur entfällt der Test-Gegenstand und die Findability-Messung ist nicht reproduzierbar.
Vorher abschließenRealistische Tasksnicht im Katalog

5-10 typische Suchaufgaben aus echten Nutzerszenarien sind formuliert, ohne dass die Aufgabenbeschreibung die Zielkategorie verrät.

Ohne: Wenn der Task-Wortlaut die Zielkategorie nennt, misst der Test Lesefähigkeit statt Findability.
02

Vorbereitung

Was vor Start vorliegen muss

Materialien

Tree-Testing-Tool (Treejack von Optimal Workshop, UserZoom, Maze); Tree-Struktur als JSON oder CSV; Tasks mit Zielpfad markiert; Survey-Setup; Recruiting-Link.

Personen / Rollen

Ein UX-Researcher als Owner; Recruiter für 15-30 Teilnehmer pro Variante; optional Stakeholder zur Task-Validierung; Notizen-Empfänger im Team.

Vorabinfos

IA-Struktur als Tree mit allen Knoten und Endknoten; Task-Liste mit Zielpfaden; Hypothesen (welche Tasks scheitern wahrscheinlich); Demografie der Zielgruppe.

Zeitbedarf

1-2 Tage Setup, 3-7 Tage Datensammlung, 1-2 Tage Auswertung

Setup

Tree im Tool aufbauen (alle Knoten exakt wie geplant). Tasks formulieren: konkrete Suchaufgabe, NICHT Kategorie-Name nennen. Pilot mit 2-3 Personen. Hauptdurchlauf mit 15-30 Teilnehmern (mehr für Varianten-Vergleich).

03

Kernfrage

Die eine Frage, die diese Methode beantwortet

Können die Teilnehmer die richtigen Antworten in der vorgeschlagenen Navigationsstruktur finden, und welche Pfade führen sie auf Irrwege?

04

Ablauf

Marker: Phase

SchrittDauerAktionHinweis
1Phase 1: Tree-Aufbau
2-4 hIA-Struktur ins Tool importieren oder manuell anlegen. Pro Knoten Label exakt wie geplant. Visuelle Hilfen weglassen, nur Text-Hierarchie.Ein falsches Label im Tree verzerrt alle nachfolgenden Tasks. Vor Pilot Tree gegen IA-Dokument prüfen, Knoten für Knoten.
2Phase 2: Task-Formulierung
2-3 hPro Task realistisches Suchszenario formulieren („Sie möchten Ihre Lieferadresse für Ihre Bestellung ändern, wo klicken Sie?“). Zielpfad im Tool markieren (kann mehrere korrekte Pfade haben).Vermeide Wörter aus Kategorien im Task-Text. Wenn Kategorie „Konto & Profil“ heißt, im Task nicht „in Ihrem Konto“ schreiben - sonst verrät der Text die Antwort.
3Phase 3: Pilot
1-2 h2-3 Personen den Test durchlaufen lassen. Auf Verwirrung achten: Tasks unklar, Labels missverständlich, Tree zu tief. Nach Pilot Tasks oder Tree anpassen.Pilot zeigt Format-Fehler frühzeitig. Hauptdurchlauf direkt nach falschem Pilot ist Datenverschwendung.
4Phase 4: Hauptdurchlauf
3-7 Tage Laufzeit15-30 Teilnehmer pro Tree-Variante. Bei A/B-Vergleich (alt vs. neu) mind. 30 pro Gruppe. Anonyme asynchrone Bearbeitung, Tool zeichnet Pfade auf.Unter 10 Teilnehmern ist statistische Aussage dünn. Bei mehreren Varianten exponentiell mehr Teilnehmer nötig.
5Phase 5: Auswertung und Iteration
1-2 TagePro Task: Success Rate (richtige Endknoten), Directness (direkter Pfad ohne Umwege), häufigste Fehlpfade. Tasks mit <60% Success Rate sind kritisch. Label oder Hierarchie anpassen, ggf. neuer Test.Success Rate allein irreführend. Directness niedrig + Success hoch bedeutet trial-and-error. Pfad-Analyse zeigt wo Nutzer scheitern.
05

Artefakt

Was am Ende rauskommt

Form

Tree-Testing-Report mit Tree-Visualisierung, Task-Liste, Success-Rate-Tabelle pro Task, Directness-Werten, Top-3-Fehlpfaden pro Task, Sample-Beschreibung und priorisierten Empfehlungen für IA-Anpassung.

Tool-Alternativen
  • Treejack von Optimal Workshop
  • UserZoom mit Tree Test Modul
  • Maze für strukturelle Tests
  • Lyssna (ehemals UsabilityHub)
  • Custom Setup mit Survey-Tool plus manueller Auswertung
Versionierung / Ownership

Pro Tree-Version eigener Test-Run mit Datum. Vergleich zwischen Versionen explizit dokumentieren (Verbesserung pro Task in Prozentpunkten). Tree-Snapshots als JSON-Export im Repo, sodass IA-Historie nachvollziehbar bleibt.

canvas

Tree Testing Arbeitsvorlage

Kompakte Arbeitsvorlage für Tree Testing mit Kontext, Input, Ergebnisartefakten und nächstem Schritt.

# Tree Testing Canvas

## Kontext

Wofür wird die Methode eingesetzt?

## Kernfrage

Welche Frage soll am Ende beantwortet sein?

## Input

Welche Daten, Beobachtungen oder Materialien liegen vor?

## Arbeitsfläche

- Bereich 1:
- Bereich 2:
- Bereich 3:
- Beziehungen / Muster:

## Ergebnisartefakte
- Findability Metrics:
- Path Analysis:
- Revised IA:

## Offene Fragen

- ...

## Nächster Schritt

Owner, Datum, Erfolgssignal.
06

Beispielausgabe

Konkret gefülltes Szenario

tree-testing-beispiel.md
markdown
## Tree Testing — Hilfe-Center-IA v2 (KW 20/2026, n=24)

**Tree-Variante**: Neue IA mit 6 Top-Level-Kategorien (siehe Card Sorting KW 18)
**Sample**: 24 Bestandsnutzer, asynchron via Treejack, Vergütung 10 EUR

### Task-Ergebnisse
| Task | Success Rate | Directness | Häufigster Fehlpfad |
|---|---|---|---|
| Passwort zurücksetzen | 96% (23/24) | 87% | Konto & Sicherheit → Konto-Einstellungen → ✓ |
| Rechnung herunterladen | 79% (19/24) | 63% | Abrechnung → Rechnungen ✓ (Fehler: 5 gingen erst zu Funktionen) |
| API-Token erstellen | 42% (10/24) | 28% | KRITISCH: 8 gingen zu Konto, 6 zu Funktionen, nur 10 zu Integrationen & API |
| Mitarbeiter einladen | 71% (17/24) | 54% | Konto → Mitarbeiter ✗ (richtig: Erste Schritte) |
| Abo kündigen | 88% (21/24) | 79% | Abrechnung → Kündigung ✓ |

### Erkenntnisse
- API-Token-Task ist Show-Stopper: 58% scheitern, fast keine direkte Pfadnutzung. Label „Integrationen & API“ wird nicht als API-Verwaltung erkannt.
- Mitarbeiter einladen wird im Konto-Bereich gesucht (Mental Model), nicht in Erste Schritte. Umsortierung erwägen.
- Rechnung-Download funktioniert, aber 21% gehen erst zu Funktionen. Label-Klarheit bei „Funktionen“ prüfen.

### Empfehlungen
1. „Integrationen & API“ umbenennen zu „Entwickler & API“ und Top-Level-Sichtbarkeit erhöhen
2. „Mitarbeiter einladen“ aus Erste Schritte zusätzlich in Konto verlinken (Querverweis)
3. Funktionen-Bereich klarer benennen, ggf. splitten
07

Stolperfallen

Symptome erkennen, gegensteuern

Falle

Task-Text verrät Antwort

Symptom

Task enthält Kategorie-Schlüsselwort, Tester finden Pfad zu leicht.

Was tun

Task formulieren ohne Kategorie-Sprache. Statt „Wo finden Sie Ihre Abrechnung?“ besser „Sie möchten die letzte Rechnung herunterladen, wo klicken Sie?“. Pilot prüft Wortwahl.

Falle

Zu wenige Teilnehmer

Symptom

Test mit 5-8 Teilnehmern, Success Rates haben extreme Schwankungen.

Was tun

Mindestens 15 für Pattern-Erkenntnis, 30+ für statistisch belastbare Vergleiche. Bei A/B getrennte Samples nötig.

Falle

Tree zu tief

Symptom

Hierarchie hat 5+ Ebenen, Tester verlieren Orientierung und springen zurück.

Was tun

Tiefe auf max 3-4 Ebenen begrenzen. Wenn mehr nötig, IA-Restrukturierung statt Tree-Test.

Falle

Findability mit Visual verwechselt

Symptom

Stakeholder erwarten Aussage über Design, Tree-Test liefert nur Textstrukturen.

Was tun

Erwartungs-Setting vorab: Tree Test misst IA und Labels, nicht visuelles Design. Für Design-Feedback Usability Test oder First-Click ansetzen.

Falle

Keine Iteration nach Test

Symptom

Test zeigt Probleme, IA wird trotzdem unverändert ausgerollt.

Was tun

Test-Erkenntnisse als gating für IA-Launch. Bei Success-Rate-Schwellwerten unter 60% iterieren und re-testen, nicht launchen.

08

Abbruchkriterien

Done-Signale, in unter einer Minute prüfbar

IA-Struktur ist nicht stabil oder ändert sich während des Tests.
Keine 15+ Teilnehmer aus Zielgruppe rekrutierbar.
Tasks lassen sich ohne Verrat der Kategorie nicht formulieren, IA-Labels sind zu spezifisch.
Tool-Setup misst keine Pfade, sondern nur Endknoten, Directness-Analyse fehlt.
Stakeholder lehnt textbasierten Test ab und will Live-Prototyp testen.
Tree hat weniger als 15 Knoten, manuelle Strukturüberprüfung reicht.

Run Sheet durchgearbeitet?

Zum Steckbrief für Zweck, ähnliche Methoden und Quellen — oder direkt zur nächsten Methode im Katalog.