Run SheetUX ResearchInformation Architecture

Tree Testing

KomplexitätMedium

Zeit1-2 Tage

Teilnehmende10-30

FormatAsync

MaturityCanonical

Vorbedingung

Was vorher fertig sein muss

Vorher abschließenIA-Hypothese

Eine konkrete IA-Struktur (Hierarchie aus Card Sorting oder bestehender Navigation) liegt vor, die getestet werden soll.

Ohne: Ohne testbare Struktur entfällt der Test-Gegenstand und die Findability-Messung ist nicht reproduzierbar.

Vorher abschließenRealistische Tasksnicht im Katalog

5-10 typische Suchaufgaben aus echten Nutzerszenarien sind formuliert, ohne dass die Aufgabenbeschreibung die Zielkategorie verrät.

Ohne: Wenn der Task-Wortlaut die Zielkategorie nennt, misst der Test Lesefähigkeit statt Findability.

Vorbereitung

Was vor Start vorliegen muss

Materialien

Tree-Testing-Tool (Treejack von Optimal Workshop, UserZoom, Maze); Tree-Struktur als JSON oder CSV; Tasks mit Zielpfad markiert; Survey-Setup; Recruiting-Link.

Personen / Rollen

Ein UX-Researcher als Owner; Recruiter für 15-30 Teilnehmer pro Variante; optional Stakeholder zur Task-Validierung; Notizen-Empfänger im Team.

Vorabinfos

IA-Struktur als Tree mit allen Knoten und Endknoten; Task-Liste mit Zielpfaden; Hypothesen (welche Tasks scheitern wahrscheinlich); Demografie der Zielgruppe.

Zeitbedarf

1-2 Tage Setup, 3-7 Tage Datensammlung, 1-2 Tage Auswertung

Setup

Tree im Tool aufbauen (alle Knoten exakt wie geplant). Tasks formulieren: konkrete Suchaufgabe, NICHT Kategorie-Name nennen. Pilot mit 2-3 Personen. Hauptdurchlauf mit 15-30 Teilnehmern (mehr für Varianten-Vergleich).

Kernfrage

Die eine Frage, die diese Methode beantwortet

Können die Teilnehmer die richtigen Antworten in der vorgeschlagenen Navigationsstruktur finden, und welche Pfade führen sie auf Irrwege?

Ablauf

Marker: Phase

Schritt	Dauer	Aktion	Hinweis
1Phase 1: Tree-Aufbau	2-4 h	IA-Struktur ins Tool importieren oder manuell anlegen. Pro Knoten Label exakt wie geplant. Visuelle Hilfen weglassen, nur Text-Hierarchie.	Ein falsches Label im Tree verzerrt alle nachfolgenden Tasks. Vor Pilot Tree gegen IA-Dokument prüfen, Knoten für Knoten.
2Phase 2: Task-Formulierung	2-3 h	Pro Task realistisches Suchszenario formulieren („Sie möchten Ihre Lieferadresse für Ihre Bestellung ändern, wo klicken Sie?“). Zielpfad im Tool markieren (kann mehrere korrekte Pfade haben).	Vermeide Wörter aus Kategorien im Task-Text. Wenn Kategorie „Konto & Profil“ heißt, im Task nicht „in Ihrem Konto“ schreiben - sonst verrät der Text die Antwort.
3Phase 3: Pilot	1-2 h	2-3 Personen den Test durchlaufen lassen. Auf Verwirrung achten: Tasks unklar, Labels missverständlich, Tree zu tief. Nach Pilot Tasks oder Tree anpassen.	Pilot zeigt Format-Fehler frühzeitig. Hauptdurchlauf direkt nach falschem Pilot ist Datenverschwendung.
4Phase 4: Hauptdurchlauf	3-7 Tage Laufzeit	15-30 Teilnehmer pro Tree-Variante. Bei A/B-Vergleich (alt vs. neu) mind. 30 pro Gruppe. Anonyme asynchrone Bearbeitung, Tool zeichnet Pfade auf.	Unter 10 Teilnehmern ist statistische Aussage dünn. Bei mehreren Varianten exponentiell mehr Teilnehmer nötig.
5Phase 5: Auswertung und Iteration	1-2 Tage	Pro Task: Success Rate (richtige Endknoten), Directness (direkter Pfad ohne Umwege), häufigste Fehlpfade. Tasks mit <60% Success Rate sind kritisch. Label oder Hierarchie anpassen, ggf. neuer Test.	Success Rate allein irreführend. Directness niedrig + Success hoch bedeutet trial-and-error. Pfad-Analyse zeigt wo Nutzer scheitern.

Artefakt

Was am Ende rauskommt

Form

Tree-Testing-Report mit Tree-Visualisierung, Task-Liste, Success-Rate-Tabelle pro Task, Directness-Werten, Top-3-Fehlpfaden pro Task, Sample-Beschreibung und priorisierten Empfehlungen für IA-Anpassung.

Tool-Alternativen

Treejack von Optimal Workshop
UserZoom mit Tree Test Modul
Maze für strukturelle Tests
Lyssna (ehemals UsabilityHub)
Custom Setup mit Survey-Tool plus manueller Auswertung

Versionierung / Ownership

Pro Tree-Version eigener Test-Run mit Datum. Vergleich zwischen Versionen explizit dokumentieren (Verbesserung pro Task in Prozentpunkten). Tree-Snapshots als JSON-Export im Repo, sodass IA-Historie nachvollziehbar bleibt.

canvas

Tree Testing Arbeitsvorlage

Kompakte Arbeitsvorlage für Tree Testing mit Kontext, Input, Ergebnisartefakten und nächstem Schritt.

# Tree Testing Canvas

## Kontext

Wofür wird die Methode eingesetzt?

## Kernfrage

Welche Frage soll am Ende beantwortet sein?

## Input

Welche Daten, Beobachtungen oder Materialien liegen vor?

## Arbeitsfläche

- Bereich 1:
- Bereich 2:
- Bereich 3:
- Beziehungen / Muster:

## Ergebnisartefakte
- Findability Metrics:
- Path Analysis:
- Revised IA:

## Offene Fragen

- ...

## Nächster Schritt

Owner, Datum, Erfolgssignal.

Beispielausgabe

Konkret gefülltes Szenario

tree-testing-beispiel.md

markdown

## Tree Testing — Hilfe-Center-IA v2 (KW 20/2026, n=24)

**Tree-Variante**: Neue IA mit 6 Top-Level-Kategorien (siehe Card Sorting KW 18)
**Sample**: 24 Bestandsnutzer, asynchron via Treejack, Vergütung 10 EUR

### Task-Ergebnisse
| Task | Success Rate | Directness | Häufigster Fehlpfad |
|---|---|---|---|
| Passwort zurücksetzen | 96% (23/24) | 87% | Konto & Sicherheit → Konto-Einstellungen → ✓ |
| Rechnung herunterladen | 79% (19/24) | 63% | Abrechnung → Rechnungen ✓ (Fehler: 5 gingen erst zu Funktionen) |
| API-Token erstellen | 42% (10/24) | 28% | KRITISCH: 8 gingen zu Konto, 6 zu Funktionen, nur 10 zu Integrationen & API |
| Mitarbeiter einladen | 71% (17/24) | 54% | Konto → Mitarbeiter ✗ (richtig: Erste Schritte) |
| Abo kündigen | 88% (21/24) | 79% | Abrechnung → Kündigung ✓ |

### Erkenntnisse
- API-Token-Task ist Show-Stopper: 58% scheitern, fast keine direkte Pfadnutzung. Label „Integrationen & API“ wird nicht als API-Verwaltung erkannt.
- Mitarbeiter einladen wird im Konto-Bereich gesucht (Mental Model), nicht in Erste Schritte. Umsortierung erwägen.
- Rechnung-Download funktioniert, aber 21% gehen erst zu Funktionen. Label-Klarheit bei „Funktionen“ prüfen.

### Empfehlungen
1. „Integrationen & API“ umbenennen zu „Entwickler & API“ und Top-Level-Sichtbarkeit erhöhen
2. „Mitarbeiter einladen“ aus Erste Schritte zusätzlich in Konto verlinken (Querverweis)
3. Funktionen-Bereich klarer benennen, ggf. splitten

Was tun

Test-Erkenntnisse als gating für IA-Launch. Bei Success-Rate-Schwellwerten unter 60% iterieren und re-testen, nicht launchen.

Abbruchkriterien

Done-Signale, in unter einer Minute prüfbar

IA-Struktur ist nicht stabil oder ändert sich während des Tests.

Keine 15+ Teilnehmer aus Zielgruppe rekrutierbar.

Tasks lassen sich ohne Verrat der Kategorie nicht formulieren, IA-Labels sind zu spezifisch.

Tool-Setup misst keine Pfade, sondern nur Endknoten, Directness-Analyse fehlt.

Stakeholder lehnt textbasierten Test ab und will Live-Prototyp testen.

Tree hat weniger als 15 Knoten, manuelle Strukturüberprüfung reicht.

Run Sheet durchgearbeitet?

Zum Steckbrief für Zweck, ähnliche Methoden und Quellen — oder direkt zur nächsten Methode im Katalog.

Zum Steckbrief Weitere Methoden