Test per lo ux writing: valutare con le persone testi e microtesti

I metodi per testare con le persone gli elementi verbali di un'interfaccia: call to action, messaggi, testi: da soli, all’interno di prototipi a bassa fedeltà, all’interno di prototipi ad alta fedeltà o dell’ambiente reale.

Lettura: 7 minuti

Indice

Esistono ormai molte guide sullo UX writing, la scrittura di testi e microtesti a misura di persona per le interfacce digitali. Ma come misurare la loro efficacia? Ecco i principali test per valutare la leggibilità e la comprensibilità di un contenuto web (e non solo).

Test di usabilità per le parole

Test standard

Anche i classici test di usabilità con utenti possono essere concepiti per valutare la componente linguistica dell’interfaccia. Per questo tipo di test consiglio il modello di test semplificato messo a punto da Steve Krug: test veloci con pochi utenti alla volta da ripetere in più round. Per eseguirli, creiamo compiti capaci di intercettare le parole che ci interessa testare. Ad esempio: “Vuoi creare una wishlist (lista di prodotti da acquistare) che abbia questa caratteristica: i prodotti, una volta acquistati, devono continuare a comparire nella lista. Come fai?”.

Lista desideri di Amazon business

Compiti tipici che vanno in questa direzione sono:

  1. “Cosa ti aspetti che accada selezionando X?” oppure
  2. “Come fai a salvare un prodotto per poterlo ritrovarlo successivamente?”.

Test con wireframe “mascherati”

Si tratta di un test di usabilità, orientato alle parole, condotto su un wireframe parzialmente “mascherato”, cioè con etichette o immagini rimpiazzati da placeholder (lorem ipsum o rettangoli vuoti). L’obiettivo è testare quanto testi o microtesti, privati della componente grafica o del contesto, siano comprensibili. È una sorta di incrocio fra il test di usabilità e il cloze test (v. avanti).

Ad esempio, nel caso della wishlist descritto sopra potremmo così “mascherare” parzialmente o del tutto i testi descrittivi sotto Lista ordini frequenti o Lista acquisti.

Misurare la leggibilità

Indici di leggibilità: maneggiare con cura

Gli indici di leggibilità non sono veri e propri test ma formule matematiche che misurano la facilità di lettura e il grado di comprensibilità di un testo secondo criteri standard. Per la lingua italiana esiste un indice specifico, l’indice Gulpease. Per l’inglese, il più diffuso è l’indice Flesch. Ormai quasi tutti i principali software di scrittura integrano al loro interno questi indici.

Tuttavia, come tutti gli strumenti automatici di verifica, gli indici di leggibilità vanno presi con le molle. Sono utili per una prima valutazione di massima, andrebbero integrati con test veri e propri per una valutazione più accurata. Un articolo di Caroline Jarrett e Janice Redish, apparso su UX Matters, sintetizza bene i limiti degli indici di leggibilità:

Readability Formulas: 7 Reasons to Avoid Them and What to Do Instead.

Oltre alle scelte lessicali e sintattiche, sulla leggibilità influisce molto l’architettura del testo e alcune scelte di copywriting. Vale a dire, la distribuzione di titoli e sottotitoli, la lunghezza dei paragrafi, l’uso di ancore visive, il posizionamento delle parole; il tutto per favorire più stili di lettura, skimming, scanning, lettura vera e propria.

Velocità di lettura

Il test principale per valutare la leggibilità di un contenuto dal punto di vista tipografico è misurare la velocità con cui un campione di utente riesce a leggerlo (parole al minuto). Il vantaggio di questo metodo, rispetto agli indici di leggibilità, è che coinvolge direttamente le persone, e è quindi un vero e proprio test. Lo svantaggio è che si tratta di un test piuttosto impegnativo da allestire ed eseguire, che richiede competenze statistiche e il coinvolgimento di un numero medio-alto di utenti (proprio perché dobbiamo fare una comparazione statistica).

Un esempio di applicazione di questo metodo per valutare la leggibilità dei vari tipi di font è raccontato da Jackob Nielsen nell’articolo Best Font for Online Reading: No Single Answer.

Cloze test (test della cancellatura)

Il Cloze test è un tipo di test con utenti che serve a valutare la comprensione di un testo. Il nome deriva dall’inglese closure che nella teoria della gestalt indica la capacità del cervello umano di completare una forma (chiudere, appunto) anche se mancano alcune parti. Nel test si mostra ai partecipanti una porzione di testo privata di alcune parole, e si chiede loro di inserire le parole mancanti.

  • nel testo che vogliamo valutare, cancelliamo una parola ogni N, oppure cancelliamo in modo selettivo parole specifiche (un test tipico utilizza N = 6; valori più piccoli di 6 rendono il compito più difficile; valori più elevati di 6 rendono il compito più facile)
  • inseriamo uno spazio vuoto al posto di ogni parola cancellata
  • chiediamo ai partecipanti di leggere il testo modificato e di riempire gli spazi vuoti con le parole mancanti (o loro sinonimi)
  • Il punteggio è dato dalla percentuale di parole indovinate correttamente.

Il 60% o più di risposte corrette è un punteggio buono, indica che il testo è comprensibile per il profilo o i profili utente reclutati per il cloze test.

Cloze Test for Reading Comprehension

Emilio Isgrò alle prese con le sue cancellature (Ccmm21, Wikimedia Commons).

Test dell’evidenziatore

Il test dell’evidenziatore (in inglese, highlighter testing) consiste nel chiedere ai partecipanti di valutare il grado di comprensibilità di un testo evidenziando parole o sintagmi con diversi colori; ad es. rosso per parti del tutto incomprensibili; giallo per parti dubbie e così via.

Questo metodo va usato con cautela perché comporta un’autovalutazione, col rischio di possibili bias cognitivi. L’ideale sarebbe controllare o approfondire i risultati emersi dal test dell’evidenziatore con altri test più mirati (test di usabilità, cloze test, comprensibilità).

Highlighter testing

Misurare la comprensibilità

Test di comprensibilità

Il modo migliore per valutare la comprensibilità di un testo è consiste di due passaggi:

  1. lettura silente, senza limiti di tempo, del testo oggetto di studio (o di più testi se vogliamo fare una comparazione)
  2. domande a scelta multipla, da 10 a 15 ca., rigiardanti il testo letto – con la possibilità di ricorrere al testo stesso in caso di necessità.

Questo tipo di prove sono state validate dal punto di vista psicometrico, dimostrando attendibilità nella misurazione delle prestazioni (Tressoldi & Zamperlin, La valutazione della comprensione del testo).

Un esempio di test di comprensibilità: i test di allenamento INVALSI per il triennio

Tree testing

Il tree testing è un test per valutare l’architettura dell’informazione di un ambiente; serve in particolare a misurare la trovabilità, cioè la capacità delle persone di trovare un’informazione specifica all’interno del sistema. Ai partecipanti viene chiesto di indicare dove si aspettano di trovare una data informazione all’interno di un menu testuale nudo (cioè privo di ogni elemento grafico).

Il tree testing serve dunque a valutare anche la comprensibilità delle etichette di un menu. Se questo è il nostro scopo principale, allora i compiti per il test vanno studiati proprio per misurare la comprensibilità delle etichette, la loro predittività, la comprensibilità delle loro differenze.

Tree testing. Come testare l’alberatura di siti e app

Oltre la leggibilità, l’emozione

Quando le parole riescono a evocare in modo vivido profumi, colori e persino paesaggi, allora avviene il miracolo. Così scrive Carlo Petrini nell’introduzione a Il salto dell’acciuga di Nico Orengo. Ciò vale anche per le parole che abitano le interfacce: la parola è sempre parola, ovunque sia collocata. E funziona nella misura in cui riesce a essere evocativa e precisa.

Come scegliere il test giusto

La scelta del tipo di test è legata all’aspetto del testo che vogliamo misurare:

  • leggibilità 1 (legibility) — è il grado in cui un testo può essere distinto in modo chiaro; è legata essenzialmente alla tipografia
  • leggibilità 2 (readability) — è il grado in cui un testo può essere letto facilmente; è legata al lessico e alla sintassi
  • comprensibilità — è il grado in cui può essere compreso il significato di un testo.

L’inglese distingue fra legibility e readability: legibility è la capacità di vedere, distinguere e riconoscere chiaramente i caratteri e le parole di un testo; la redability è il grado di complessità lessicale e sintattica. In italiano non abbiamo questa distinzione, per cui ho usato leggibilità 1 per legibility e leggibilità 2 per readability.

Cosa misurareCome
Leggibilità 1Test di usabilità con utenti *
Velocità di lettura
Leggibilità 2Indici di leggibilità
Test dell’evidenziatore
Test di usabilità con utenti
ComprensibilitàTest di usabilità con utenti
Cloze test
Test dell’evidenziatore
Tree testing
I diversi tipi di test per il contenuto raggruppati in base all’aspetto che vogliamo misurare.

* I test di usabilità rivelano problemi di leggibilità 1 del testo quando le persone si avvicinano allo schermo per leggere meglio, o dichiarano esplicitamente una difficoltà nella lettura.

Legibility, Readability, and Comprehension: Making Users Read Your Words

Cosa testare

Possiamo testare parole, microtesti e testi estesi a vari livelli:

  • nudi – solo testo, senza altro
  • all’interno di prototipi a bassa fedeltà
  • all’interno di prototipi ad alta fedeltà; o all’interno dell’ambiente reale nel caso di progetti già esistenti.

Per un approfondimento su questi aspetti rimando all’articolo di Colleen Jones, Testing Content Concepts.

Quando testare

Non c’è un momento specifico per testare il contenuto, lo si può fare in qualunque momento del processo di design. Tuttavia vale sempre il principio che prima lo facciamo meglio è. Quindi possiamo cominciare a valutare un contenuto non appena questo è disponibile, anche se non abbiamo ancora un wireframe. Dipende dagli obiettivi, cosa vogliamo misurare, e di conseguenza dal tipo di test che vogliamo eseguire.

Finché hai contenuti da testare, puoi testarli. Hai bisogno di convincere il tuo capo a stabilire un budget per i test dei contenuti? Usa gli indici di leggibilità. Hai contenuti ma niente wireframe o visual design? Fai un cloze test per valutare l’adeguatezza dei contenuti. La comprensione del contenuto è fondamentale per un’attività o un flusso di lavoro? Visualizzalo nel contesto durante i test di usabilità (Angela Colter, Testing Content).