Discount usability _analisi euristica_cognitive walkthrough_

Transcript

Discount usability _analisi euristica_cognitive walkthrough_
DUE METODI DI “DISCOUNT USABILITY”: ANALISI EURISTICA E COGNITIVE
WALKTHROUGH
Introduzione
L’usabilità è un concetto complesso, di natura multidimensionale che viene definito in modi diversi
a seconda dei modelli di riferimento.
Secondo Nielsen (Toffetti, Nodari, Zoldan, 2001), nella definizione data nel 1993, l’usabilità viene
definita come:
1. la facilità di apprendimento del funzionamento del sistema
2. l’efficienza nel suo utilizzo
3. la facilità nel ricordare l’uso del sistema stesso
4. la sicurezza
5. la robustezza agli errori
6. la soddisfazione soggettiva dell’utente
Questa definizione è stata preferita rispetto alle tante altre perché è stata sviluppata nell’intento di
indagare le interfacce dinamiche e complesse implementate sui calcolatori.
Una volta capito cosa si intende con usabilità, il passo successivo è quello di creare, basandosi su
questi principi, le linee guida specifiche che si adattino al contesto d’uso. Un aspetto da tenere
sempre in considerazione quando si effettua uno studio di usabilità è che ciascun sistema possiede
caratteristiche specifiche tali per cui un aspetto dell’usabilità può essere più importante di altri in un
determinato sistema.
Nell’ambito di questa analisi l’utente deve avere in mente le basi per effettuare un’ispezione di
usabilità (Rosson e Carroll, 2002): gli utenti esperti esaminano o lavorano con un sistema avendo
l’obiettivo di individuare i principali problemi di usabilità legati al sistema stesso. Per facilitare
questo lavoro vengono fornite agli utenti delle linee guida da rispettare, ma nell’avvicinarsi a queste
“norme” bisogna sempre ricordare due aspetti principali: in primis le linee guida vengono utilizzate
per guidare la valutazione, non il design; in secondo luogo avendo a disposizione delle linee guida
si ha la tendenza a considerare i problemi strettamente legati ad esse, effettuando così un’analisi
spesso sbagliata o incompleta.
In questo lavoro abbiamo deciso di focalizzare la nostra attenzione su due metodologie di analisi di
usabilità dei sistemi: l’analisi euristica ed il cognitive walkthrough che si propongono come
metodologie economiche e di facile applicazione.
Analisi euristica
L’analisi euristica è un metodo informale di valutazione di usabilità dove ad un gruppo di valutatori
esperti viene presentata una interfaccia e viene chiesto loro di valutarla seguendo delle linee guida
(dette, appunto, “euristiche”). Si tratta di un metodo ispettivo che non richiede la compartecipazione
dell’utente finale né di un grosso numero di valutatori esperti. Infatti, è riconosciuto che ogni
valutatore esperto individua tra il 20% e il 51% dei problemi di usabilità e che sono sufficienti
cinque valutatori per individuare il 75% dei problemi di usabilità presenti in un’interfaccia (Nielsen
e Molich, 1990), sia quelli più severi che quelli di minore entità.
Inoltre, l’analisi euristica è considerata un metodo poco costoso, che permette di risparmiare tempo
e denaro, ottenendo ottimi risultati. Uno studio comparativo fra tecniche di usabilità di Jeffries e al.
(Jeffries, Miller, Wharton e Uyeda, 1991) ha, infatti, individuato nell’analisi euristica il miglior
metodo per la raccolta dei dati relativi all’usabilità di un’interfaccia. Tale tecnica è stata messa a
confronto con il cognitive walkthrough, l’usability testing e le guidelines. I risultati hanno messo in
evidenza come, attraverso l’analisi euristica, si giungesse ad individuare una percentuale di
problemi di usabilità vicina al 100%, cosa che non accadeva utilizzando le altre tecniche.
Inoltre, la tendenza a rilevare problemi di usabilità gravi tramite l’analisi euristica è piuttosto alta:
reclutando sette giudici e chiedendo loro di assegnare al problema un punteggio da 1 a 9 in base alla
sua gravità, Jeffries e al. hanno notato che l’analisi euristica consente di individuare problemi di una
certa gravità, al pari delle guidelines e con più efficacia del cognitive walkthrough.
L’analisi euristica è stata inizialmente destinata alla validazione di software ed è concepita attorno
ad un set di dieci euristiche, ottenute tramite analisi fattoriale da Nielsen e Molich (Nielsen e
Molich, 1989) e riassumibili in:
•
Visibilità dello stato del sistema (feedback)
•
Corrispondenza fra sistema e mondo reale
•
Libertà e controllo del sistema da parte dell’utente
•
Consistenza e standard
•
Prevenzione degli errori
•
Richiamo vs. Riconoscimento
•
Flessibilità ed efficienza nell’utilizzo
•
Design piacevole e minimalista
•
Riconoscimento dell’errore
•
Aiuto e documentazione
Tali euristiche rappresentano un’ampia proporzione di problemi riscontrabili in un’interfaccia e ci
sono forti ragioni per credere che esse abbiano una buona applicabilità pratica. Nel corso di quattro
esperimenti Nielsen e Molich (Nielsen e Molich, 1990) hanno valutato quanto le euristiche siano in
grado di individuare i problemi di usabilità di un’interfaccia e quali vantaggi comporta il loro
utilizzo.
In ciascun esperimento Nielsen e Molich hanno chiesto ad un gruppo di soggetti di valutare il
design di un’interfaccia servendosi delle euristiche sopra citate e di elencarne accuratamente i
problemi di usabilità riscontrati.
Il risultato dello studio ha portato a credere che la valutazione euristica è:
1) economica
2) intuitiva
3) non richiede lunghi tempi di preparazione
4) può essere utilizzata anche nelle prime fasi del processo di sviluppo di un prodotto (gli
autori hanno utilizzato per il loro esperimento anche dei prototipi in formato cartaceo).
La validità dei problemi di usabilità riscontrati nell’interfaccia non è stata misurata in modo
sistematico ma, secondo i due autori, il fatto che molti problemi di usabilità siano già stati
riscontrati con altri metodi riconosciuti e il fatto che i valutatori potessero essere concepiti come
potenziali utenti delle interfacce analizzate è una buona riprova della validità dei risultati.
Un aspetto interessante che ha riguardato gli studi sull’utilizzo delle euristiche è stato comprendere
se esse abbiano maggiore successo con soggetti esperti in usabilità o con novizi. Per valutare questo
aspetto Nielsen e Molich (Nielsen e Molich, 1992) hanno chiesto a tre gruppi di soggetti (novizi,
esperti di usabilità e “doppiamente esperti” di usabilità1) di effettuare la valutazione euristica di un
telefono a toni.
Ogni soggetto valutava l’interfaccia tenendo presente un dialogo telefonico prestampato (dove
erano indicate alcune operazioni da compiere sulla tastiera a toni) e alcune limitazioni tecniche del
sistema già note.
Il risultato della ricerca di Nielsen e Molich ha messo in evidenza che la media dei problemi di
usabilità riscontrata da un utente novizio (29%) era significativamente più bassa rispetto a quella
riscontrata dagli utenti esperti (46%) e da quelli “doppiamente esperti” (61%). Basandosi su questi
risultati essi affermarono che, per condurre una efficace analisi euristica ed individuare il 75% dei
problemi di usabilità di un’interfaccia, sono necessari 2-3 soggetti esperti nell’uso dell’interfaccia
oppure 4-5 soggetti esperti di usabilità generici oppure 10-14 soggetti non esperti di usabilità.
1
La differenza fra soggetti esperti e soggetti “doppiamente esperti” di usabilità sta nel fatto che gli uni sono
esperti di usabilità generici, mentre gli altri sono esperti di usabilità che hanno sviluppato un certo tipo di familiarità con
l’interfaccia oggetto di valutazione o, comunque, con interfacce simili.
In conclusione, Nielsen e Molich evidenziarono la massima efficacia (anche e soprattutto in termini
di costi temporali) dell’analisi euristica reclutando soggetti esperti2.
In aggiunta, una ricerca di Slavkovic e Cross (Stavkovic e Cross, 1999) ha evidenziato che i risultati
della ricerca di Nielsen e Molich sono validi solo per interfacce poco complesse.
Infatti, nel caso di interfacce più complesse (come ad esempio quella di un’agenda elettronica), è
necessario modificare le euristiche ed adattarle all’interfaccia stessa, se no il range di 10-14
valutatori non esperti non basta per identificare il 75% dei problemi di usabilità dell’interfaccia. Vi
è, dunque, il rischio che i soggetti si focalizzino su aree specifiche dell’interfaccia (o su specifiche
funzioni quale, nel caso di un organizer, la rubrica degli indirizzi o la calcolatrice) tralasciando tutte
le altre. Slavkovic e Cross hanno, infatti, notato che i soggetti del loro esperimento tendevano a
concentrare la loro valutazione su aree specifiche dell’interfaccia, arrivando ad identificare una
media del 23% dei problemi di usabilità; percentuale molto esigua rispetto a quella auspicata da
Nielsen e Molich.
Una modalità per la risoluzione di questo problema è stata fornita dalle stesse autrici. Esse hanno
suggerito di compilare una check-list che evidenzi le maggiori aree da indagare e fornirle ai
soggetti, facendo loro percorrere così una sorta di “passaggio obbligato” nel corso del processo di
valutazione.
I risultati delle ricerche sopra citate, quindi, non solo suggeriscono quale tipologia di valutatore è
vantaggiosa per ottenere una buona analisi euristica, ma fornisce una prima indicazione di come
alcune interfacce complesse possono venir esplorate e come è possibile procedere di fronte alla
necessità di una loro valutazione accurata.
Attualmente l’analisi euristica viene spesso effettuata utilizzando le linee guida di Nielsen e Molich,
ed è stata estesa anche alle interfacce web con buon successo (Nielsen, 1999). Spesso viene
effettuata creando delle vere e proprie check-list che consentono al valutatore di analizzare
l’interfaccia nella sua interezza o, comunque, nelle sue componenti più rilevanti.
2
Il recruiting di soggetti “doppiamente esperti” può, al contrario, risultare dispendioso per la difficoltà nel
reclutamento e per i costi che esso comporta.
Cognitive walkthrough
Il cognitive walkthrough (CW) è un metodo spesso utilizzato per migliorare l’usabilità e il design di
un sito attraverso la valutazione dell’interfaccia nei primi stadi del suo processo di sviluppo, inoltre
consente di ottenere un feedback sul progresso del lavoro e sulla facilità/difficoltà di apprendimento
dell’interfaccia in esame (Gamberini, Valentini, 2001). Come l’analisi euristica, il CW è una tecnica
di tipo ispettivo poco costosa, che permette di risparmiare tempo e che non richiede valutatori con
un’alta expertise. Esso si basa prevalentemente sulla teoria del exploratory learning (Lewis, Polson,
1991), sulla teoria degli stadi dell’azione di Norman (Hutchins, Hollan e Norman, 1985).
La teoria dell’exploratory learning lega l’apprendimento all’azione. Nel caso di interfacce
navigabili, l’apprendimento di queste avviene attraverso l’esplorazione attiva dell’interfaccia ed il
feedback fornito da quest’ultima rafforza e consolida le conoscenze apprese durante la sua
esplorazione.
Il modello degli stadi dell’azione di Norman definisce alcuni step cognitivi nell’analisi
dell’interazione umana con l’interfaccia oggetto di interesse e tenta di dare conto sia delle fasi che
delle possibili difficoltà di passaggio da una fase all'altra (distanze) osservate nell'uso di strumenti.
Il modello descrive cinque stati fondamentali (obiettivi, intenzioni, azioni, percezione e
valutazione) e tre distanze cognitive: una semantica, una referenziale e una intereferenziale, le quali
descrivono la relazione tra gli obiettivi percepiti dal soggetto e le modalità con le quali
raggiungerlo. La distanza semantica e quella referenziale sono presenti sia sul lato dell’esecuzione
che su quello della valutazione, mentre la distanza intereferenziale si riferisce al passaggio
dall’esecuzione alla valutazione dell’azione. Più specificamente la distanza semantica, per ciò che
concerne l'azione, riguarda la relazione fra le intenzioni dell'utente ed il significato dei comandi che
è possibile eseguire sull'interfaccia. Sul lato della valutazione, la distanza semantica si riferisce
all'elaborazione che è richiesta all'utente per determinare se le condizioni di soddisfacimento delle
proprie intenzioni sono state realizzate. La distanza referenziale o “di riferimento” intercorre fra il
significato di una espressione e la sua forma fisica, sia sul lato dell'esecuzione che su quello della
valutazione. Infine la distanza intereferenziale, che riguarda la relazione fra le forme di input e
quelle di output presenti nel corso dell'interazione uomo-computer, che è massima quando le due
forme sono completamente distinte
In termini pratici, il cognitive walkthrough si focalizza principalmente:
•
sugli obiettivi che l’utente raggiunge durante l’esecuzione di un compito specifico,
•
sulle conoscenze da egli acquisite durante l’esplorazione e
•
sulle affordance che il sistema offre per favorire il completamento del compito.
Il tutto al fine di registrare quelli che sono gli errori, le discrepanze, gli step problematici verificatisi
nel corso del completamento del compito (Wharton, Bradford, Jeffries, Franzke, 1992).
Il CW è stato studiato appositamente per interfacce destinate ad essere navigate ed esplorate. Di
conseguenza molte applicazioni di questo metodo sono state effettuate su prodotti di questo tipo,
(Lewis, Polson, Wharton e Rieman, 1990; Lewis e Polson 1991). Wharton e colleghi (Wharton,
Bradford, Jeffries, Franzke, 1992) hanno ad esempio analizzato tre complessi sistemi sofware, l’HPVUE System, il REPS System e il BCA System.
Wharton e al. (Rieman, Franzke e Redmiles 1995; Wharton, Bradford, Jeffries e Franzke, 1992)
hanno fornito una serie di raccomandazioni per una efficace applicazione del cognitive
walkthrough. In particolar modo essi hanno analizzato le diverse fasi di questa metodologia
individuando i punti critici di ciascuna fase, la loro suddivisione del processo di walkthrough
prevede tre fasi:
1) Selezione dei task,
2) Doing Cognitive Walkthrough
3) Interpretazione dei risultati.
La selezione dei task deve prevedere compiti semplici e complessi, che possano essere facilmente
suddivisi in sotto-compiti. Inoltre la scelta di compiti che coprono un ampio range di difficoltà
consente agli esperti di fare pratica con la metodologia nei task più semplici prima di affrontare
quelli più complessi. Un compito realistico, ossia che normalmente viene eseguito anche nella
quotidianità permette di individuare elementi e sequenze di step problematici in modo più efficiente
rispetto a compiti astratti. Secondo Wharton e al. (Wharton, Bradford, Jeffries, Franzke, 1992) il
numero di task dovrebbe essere compreso fra i 2 e i 7, a seconda della complessità dell’interfaccia,
del tempo e dei sub-step necessari per portarli a termine. In genere la lista dei task deve prevedere
già una traccia dei sub-task necessari per portarli a completamento.
L’applicazione del walkthrough consiste nel compilare una serie di form mentre si esplorano le
azioni previste dai diversi task. In genere durante l’esecuzione del compito vengono poste delle
domande, oppure viene chiesto al soggetto di “pensare ad alta voce”.
Per quel che riguarda l’interpretazione dei risultati, è necessario mettere in evidenza quelle che sono
le discrepanze fra obiettivi raggiunti dall’utente e le affordance offerte dal sistema, identificando gli
aspetti problematici dell’interfaccia e gli errori commessi nell’esecuzione dei singoli step. Il tutto al
fine di comprendere quanto l’interfaccia oggetto di interesse si appresta ad essere appresa attraverso
la sua esplorazione.
Attualmente, l’integrazione del cognitive walkthrough con dati video sembra uno dei metodi
migliori per registrare quegli elementi dell’interazione che non sono immediatamente ricavabili dal
thinking-aloud. A tal proposito Gabrielli e al. (Gabrielli, Mirabella, Kimani e Catarci, 2005) hanno
applicato il cognitive walktrough su un gruppo di soggetti suddivisi in tre condizioni sperimentali:
1) una condizione dove veniva applicato il CW tradizionale, in setting di laboratorio
2) una condizione dove veniva applicato il CW in situ, ovvero in un ambiente ecologico, vicino
al contesto reale d’uso
3) una condizione dove il CW in situ è stato integrato con dati video
I risultati della ricerca di Gabrielli e al. hanno confermato che l’integrazione del CW con dati video
consente di individuare una percentuale di problemi di usabilità e di aspetti dell’interazione con
l’interfaccia statisticamente superiore rispetto quella rilevata nelle altre due condizioni sperimentali.
Tuttavia Gamberini e Valenti (Gamberini, Valentini, 2001) sottolineano come questa metodologia
non consenta di individuare con precisione tutti i problemi di usabilità di un sito.
Karat, Campbell e Fiegel (Karat, Campbell e Fiegel, 1992), ad esempio in uno studio che
confrontava “empirical usability testing” e “cognitive walkthrough”, hanno messo in luce come il
primo metodo consenta di individuare un numero più ampio di problemi rispetto al CW,
individuando inoltre un numero non irrilevante di problemi piuttosto seri che il CW non rileva.
Dalla ricerca emerge anche come il cognitive walkthrough ottenga risultati migliori quando è svolto
da un team di due persone piuttosto che un solo individuo.
Una nota variante del CW è definita Pluralistic Walkthrough e si presenta come un’applicazione in
cui un gruppo di utenti finali, developers, product designer e professionisti di usabilità, navigano
insieme con l’aiuto di un facilitatore. Durante la navigazione il gruppo valuta step-by-step ogni
elemento dell’interazione. Il vantaggio che deriva da questo metodo sta nella ricchezza di commenti
che si ottengono coinvolgendo persone con diverse esperienze e conoscenze e dalla creatività che
spesso scaturisce dal lavoro collaborativo e che consente di giungere a soluzioni nuove (Bias 1991;
Gamberini, Valentini, 2001). Bias consiglia di far scrivere ad ogni partecipante i passi che
compirebbe per portare a termine il compito e di passare alla discussione di gruppo solo quando
tutti hanno terminato di scrivere. In questo modo è possibile raccogliere contemporaneamente:
le azioni di ciascun partecipante, relativamente ad ogni task analizzato, senza che queste
possano essere influenzati dagli esperti,
dati circa i problemi che gli utenti percepiscono,
informazioni in merito alle opinioni degli esperti di usabilità.
Altra metodologia che si è sviluppata attorno al CW è il Groupware Walkthrough; Pinelle e Gutwin
(Pinelle e Gutwin, 2002) affermano la necessità di prendere in considerazione anche la complessità
del gruppo di lavoro, la metodologia del groupware walkthrough che essi propongono si compone
infatti di due parti:
un task model per identificare e analizzare il real-world collaborative tasks: si prendono in
esame due componenti della collaborazione, il taskwork (azioni che devono essere
compiute) e il teamwork. Si prendono quindi in esame aspetti quali: comunicazione
esplicita, monitoring, coordinazione, planning e assistance.
un walkthrough per valutare il sistema che supporta il compito.
Questo modo di procedere si rivela particolarmente utile per l’analisi di usabilità di software
collaborativi.
Bibliografia
Bias, R.C., (1991) Walkthroughs: Efficient Collaborative Testing. IEEE Software 8, 5, pp. 94–95.
Hutchins, E.L., Hollan, J.D. and Norman, D.A. Direct manipulation interfaces. Human-Computer
Interaction. (1985) 1, 311-338.
Gabrielli, S., Mirabella, V., Kimani, S., e Catarci, T. (2005). Supporting Cognitive Walkthrough
with Video Data: A Mobile Learning Evaluation Study. Proceedings of the International
Conference on Human-Computer Interaction with Mobile Devices and Services (Mobile HCI).
Gamberini, L., Valentini, E. (2001) Web Usability Today: Theories, Approach and Methods. In G.
Riva, C. Galimberti Towards CyberPsychology: Mind, Cognitions and Society in the Internet Age.
Amsterdam, IOS Press.
Jeffries, R., Miller, J.R., Wharton, C., e Uyeda, K.M. User interface evaluation in the real world: a
comparison of four tecniques. Proceedings ACM CHI ’91Conference (New Orleans, Louisiana, 27
April-2May 1991), 119-124.
Karat, C., Campbell, R e Fiegel, T. Comparison of empirical testing and walkthrough methods in
user interface evaluation. Proceedings CHI ’92 Conference. (Monterey, California, May 3-7), 397 404
Lewis, C. e Polson, P.G., Wharton, C., e Rieman, J. Testing a Walkthrough Methodology for
Theory-Based Design of Walk-up-and-Use Interfaces. Proceedings ACM CHI ’90 Conference.
(Seattle, Washington, April 1-5), 235-242.
Lewis, C., e Polson, P.G. Cognitive Walkthrough: a Method for Theory-Based Evaluation of User
Interfaces. Tutorial presented at ACM CHI ’91 (New Orleans, Louisiana, April 27-May 2).
Nielsen, J. (1999) Designing Web Usability: The Practice of Simplicity. New Riders Publishing,
Indianapolis.
Nielsen, J., e Molich, R Teaching user interface design based on usability engineering. Proceedings
ACM SIGCHI Bulletin 21,1 (July, 1989), 45-48.
Nielsen, J., e Molich, R. Heuristic evaluation of user interfaces. Proceedings ACM CHI ’90
Conference (Seattle, Washington, April 1-5), 249-256.
Nielsen, J., e Molich, R. Finding usability problem through heuristic evaluation. Proceedings ACM
CHI ’92 Conference (Monterey, California, May 3-7), 373-380.
Pinelle, D., e Gutwin, C. Groupware Walkthrough: Adding Context to Groupware Usability
Evaluation. Proceedings of the SIGCHI Conference on Human factors in computing systems:
Changing our world, changing ourselves (Minneapolis, Minnesota, USA, April 20-25 2002),
Design Methods 455 – 462.
Rieman, J., Franzke, M., Redmiles, D. Usability Evaluation With Cognitive Walkthrough. Tutorial
presented at ACM CHI ’95 (Denver, Colorado, May 7-11).
Rosson, M. B., Carroll, J. M. (2002) Usability engineering. Scenario-Based Development of
Human-Computer Interaction. San Francisco, Morgan Kaufmann.
Stavkovic, A., e Cross, K. Novice Heuristic evaluation of a complex interfaces. Proceedings ACM
CHI ’99 Student poster (May, 15-20).
Toffetti, A., Nodari, E., Zoldan C. (2001) Analisi ergonomia con esperti di INFO2000. Proceedings
of the sixth ERCIM Workshop on User Interfaces for all (Firenze, October 25-26). 362-363
Wharton, C., Bradford, J., Jeffries, J., e Franzke, M. Applying Cognitive Walkthroughs to more
Complex User Interfaces: Experiences, Issues and Recommendations. Proceedings CHI ’92
Conference (Monterey, California, May 3-7). 381-388.