Discount usability _analisi euristica_cognitive walkthrough_
Transcript
Discount usability _analisi euristica_cognitive walkthrough_
DUE METODI DI “DISCOUNT USABILITY”: ANALISI EURISTICA E COGNITIVE WALKTHROUGH Introduzione L’usabilità è un concetto complesso, di natura multidimensionale che viene definito in modi diversi a seconda dei modelli di riferimento. Secondo Nielsen (Toffetti, Nodari, Zoldan, 2001), nella definizione data nel 1993, l’usabilità viene definita come: 1. la facilità di apprendimento del funzionamento del sistema 2. l’efficienza nel suo utilizzo 3. la facilità nel ricordare l’uso del sistema stesso 4. la sicurezza 5. la robustezza agli errori 6. la soddisfazione soggettiva dell’utente Questa definizione è stata preferita rispetto alle tante altre perché è stata sviluppata nell’intento di indagare le interfacce dinamiche e complesse implementate sui calcolatori. Una volta capito cosa si intende con usabilità, il passo successivo è quello di creare, basandosi su questi principi, le linee guida specifiche che si adattino al contesto d’uso. Un aspetto da tenere sempre in considerazione quando si effettua uno studio di usabilità è che ciascun sistema possiede caratteristiche specifiche tali per cui un aspetto dell’usabilità può essere più importante di altri in un determinato sistema. Nell’ambito di questa analisi l’utente deve avere in mente le basi per effettuare un’ispezione di usabilità (Rosson e Carroll, 2002): gli utenti esperti esaminano o lavorano con un sistema avendo l’obiettivo di individuare i principali problemi di usabilità legati al sistema stesso. Per facilitare questo lavoro vengono fornite agli utenti delle linee guida da rispettare, ma nell’avvicinarsi a queste “norme” bisogna sempre ricordare due aspetti principali: in primis le linee guida vengono utilizzate per guidare la valutazione, non il design; in secondo luogo avendo a disposizione delle linee guida si ha la tendenza a considerare i problemi strettamente legati ad esse, effettuando così un’analisi spesso sbagliata o incompleta. In questo lavoro abbiamo deciso di focalizzare la nostra attenzione su due metodologie di analisi di usabilità dei sistemi: l’analisi euristica ed il cognitive walkthrough che si propongono come metodologie economiche e di facile applicazione. Analisi euristica L’analisi euristica è un metodo informale di valutazione di usabilità dove ad un gruppo di valutatori esperti viene presentata una interfaccia e viene chiesto loro di valutarla seguendo delle linee guida (dette, appunto, “euristiche”). Si tratta di un metodo ispettivo che non richiede la compartecipazione dell’utente finale né di un grosso numero di valutatori esperti. Infatti, è riconosciuto che ogni valutatore esperto individua tra il 20% e il 51% dei problemi di usabilità e che sono sufficienti cinque valutatori per individuare il 75% dei problemi di usabilità presenti in un’interfaccia (Nielsen e Molich, 1990), sia quelli più severi che quelli di minore entità. Inoltre, l’analisi euristica è considerata un metodo poco costoso, che permette di risparmiare tempo e denaro, ottenendo ottimi risultati. Uno studio comparativo fra tecniche di usabilità di Jeffries e al. (Jeffries, Miller, Wharton e Uyeda, 1991) ha, infatti, individuato nell’analisi euristica il miglior metodo per la raccolta dei dati relativi all’usabilità di un’interfaccia. Tale tecnica è stata messa a confronto con il cognitive walkthrough, l’usability testing e le guidelines. I risultati hanno messo in evidenza come, attraverso l’analisi euristica, si giungesse ad individuare una percentuale di problemi di usabilità vicina al 100%, cosa che non accadeva utilizzando le altre tecniche. Inoltre, la tendenza a rilevare problemi di usabilità gravi tramite l’analisi euristica è piuttosto alta: reclutando sette giudici e chiedendo loro di assegnare al problema un punteggio da 1 a 9 in base alla sua gravità, Jeffries e al. hanno notato che l’analisi euristica consente di individuare problemi di una certa gravità, al pari delle guidelines e con più efficacia del cognitive walkthrough. L’analisi euristica è stata inizialmente destinata alla validazione di software ed è concepita attorno ad un set di dieci euristiche, ottenute tramite analisi fattoriale da Nielsen e Molich (Nielsen e Molich, 1989) e riassumibili in: • Visibilità dello stato del sistema (feedback) • Corrispondenza fra sistema e mondo reale • Libertà e controllo del sistema da parte dell’utente • Consistenza e standard • Prevenzione degli errori • Richiamo vs. Riconoscimento • Flessibilità ed efficienza nell’utilizzo • Design piacevole e minimalista • Riconoscimento dell’errore • Aiuto e documentazione Tali euristiche rappresentano un’ampia proporzione di problemi riscontrabili in un’interfaccia e ci sono forti ragioni per credere che esse abbiano una buona applicabilità pratica. Nel corso di quattro esperimenti Nielsen e Molich (Nielsen e Molich, 1990) hanno valutato quanto le euristiche siano in grado di individuare i problemi di usabilità di un’interfaccia e quali vantaggi comporta il loro utilizzo. In ciascun esperimento Nielsen e Molich hanno chiesto ad un gruppo di soggetti di valutare il design di un’interfaccia servendosi delle euristiche sopra citate e di elencarne accuratamente i problemi di usabilità riscontrati. Il risultato dello studio ha portato a credere che la valutazione euristica è: 1) economica 2) intuitiva 3) non richiede lunghi tempi di preparazione 4) può essere utilizzata anche nelle prime fasi del processo di sviluppo di un prodotto (gli autori hanno utilizzato per il loro esperimento anche dei prototipi in formato cartaceo). La validità dei problemi di usabilità riscontrati nell’interfaccia non è stata misurata in modo sistematico ma, secondo i due autori, il fatto che molti problemi di usabilità siano già stati riscontrati con altri metodi riconosciuti e il fatto che i valutatori potessero essere concepiti come potenziali utenti delle interfacce analizzate è una buona riprova della validità dei risultati. Un aspetto interessante che ha riguardato gli studi sull’utilizzo delle euristiche è stato comprendere se esse abbiano maggiore successo con soggetti esperti in usabilità o con novizi. Per valutare questo aspetto Nielsen e Molich (Nielsen e Molich, 1992) hanno chiesto a tre gruppi di soggetti (novizi, esperti di usabilità e “doppiamente esperti” di usabilità1) di effettuare la valutazione euristica di un telefono a toni. Ogni soggetto valutava l’interfaccia tenendo presente un dialogo telefonico prestampato (dove erano indicate alcune operazioni da compiere sulla tastiera a toni) e alcune limitazioni tecniche del sistema già note. Il risultato della ricerca di Nielsen e Molich ha messo in evidenza che la media dei problemi di usabilità riscontrata da un utente novizio (29%) era significativamente più bassa rispetto a quella riscontrata dagli utenti esperti (46%) e da quelli “doppiamente esperti” (61%). Basandosi su questi risultati essi affermarono che, per condurre una efficace analisi euristica ed individuare il 75% dei problemi di usabilità di un’interfaccia, sono necessari 2-3 soggetti esperti nell’uso dell’interfaccia oppure 4-5 soggetti esperti di usabilità generici oppure 10-14 soggetti non esperti di usabilità. 1 La differenza fra soggetti esperti e soggetti “doppiamente esperti” di usabilità sta nel fatto che gli uni sono esperti di usabilità generici, mentre gli altri sono esperti di usabilità che hanno sviluppato un certo tipo di familiarità con l’interfaccia oggetto di valutazione o, comunque, con interfacce simili. In conclusione, Nielsen e Molich evidenziarono la massima efficacia (anche e soprattutto in termini di costi temporali) dell’analisi euristica reclutando soggetti esperti2. In aggiunta, una ricerca di Slavkovic e Cross (Stavkovic e Cross, 1999) ha evidenziato che i risultati della ricerca di Nielsen e Molich sono validi solo per interfacce poco complesse. Infatti, nel caso di interfacce più complesse (come ad esempio quella di un’agenda elettronica), è necessario modificare le euristiche ed adattarle all’interfaccia stessa, se no il range di 10-14 valutatori non esperti non basta per identificare il 75% dei problemi di usabilità dell’interfaccia. Vi è, dunque, il rischio che i soggetti si focalizzino su aree specifiche dell’interfaccia (o su specifiche funzioni quale, nel caso di un organizer, la rubrica degli indirizzi o la calcolatrice) tralasciando tutte le altre. Slavkovic e Cross hanno, infatti, notato che i soggetti del loro esperimento tendevano a concentrare la loro valutazione su aree specifiche dell’interfaccia, arrivando ad identificare una media del 23% dei problemi di usabilità; percentuale molto esigua rispetto a quella auspicata da Nielsen e Molich. Una modalità per la risoluzione di questo problema è stata fornita dalle stesse autrici. Esse hanno suggerito di compilare una check-list che evidenzi le maggiori aree da indagare e fornirle ai soggetti, facendo loro percorrere così una sorta di “passaggio obbligato” nel corso del processo di valutazione. I risultati delle ricerche sopra citate, quindi, non solo suggeriscono quale tipologia di valutatore è vantaggiosa per ottenere una buona analisi euristica, ma fornisce una prima indicazione di come alcune interfacce complesse possono venir esplorate e come è possibile procedere di fronte alla necessità di una loro valutazione accurata. Attualmente l’analisi euristica viene spesso effettuata utilizzando le linee guida di Nielsen e Molich, ed è stata estesa anche alle interfacce web con buon successo (Nielsen, 1999). Spesso viene effettuata creando delle vere e proprie check-list che consentono al valutatore di analizzare l’interfaccia nella sua interezza o, comunque, nelle sue componenti più rilevanti. 2 Il recruiting di soggetti “doppiamente esperti” può, al contrario, risultare dispendioso per la difficoltà nel reclutamento e per i costi che esso comporta. Cognitive walkthrough Il cognitive walkthrough (CW) è un metodo spesso utilizzato per migliorare l’usabilità e il design di un sito attraverso la valutazione dell’interfaccia nei primi stadi del suo processo di sviluppo, inoltre consente di ottenere un feedback sul progresso del lavoro e sulla facilità/difficoltà di apprendimento dell’interfaccia in esame (Gamberini, Valentini, 2001). Come l’analisi euristica, il CW è una tecnica di tipo ispettivo poco costosa, che permette di risparmiare tempo e che non richiede valutatori con un’alta expertise. Esso si basa prevalentemente sulla teoria del exploratory learning (Lewis, Polson, 1991), sulla teoria degli stadi dell’azione di Norman (Hutchins, Hollan e Norman, 1985). La teoria dell’exploratory learning lega l’apprendimento all’azione. Nel caso di interfacce navigabili, l’apprendimento di queste avviene attraverso l’esplorazione attiva dell’interfaccia ed il feedback fornito da quest’ultima rafforza e consolida le conoscenze apprese durante la sua esplorazione. Il modello degli stadi dell’azione di Norman definisce alcuni step cognitivi nell’analisi dell’interazione umana con l’interfaccia oggetto di interesse e tenta di dare conto sia delle fasi che delle possibili difficoltà di passaggio da una fase all'altra (distanze) osservate nell'uso di strumenti. Il modello descrive cinque stati fondamentali (obiettivi, intenzioni, azioni, percezione e valutazione) e tre distanze cognitive: una semantica, una referenziale e una intereferenziale, le quali descrivono la relazione tra gli obiettivi percepiti dal soggetto e le modalità con le quali raggiungerlo. La distanza semantica e quella referenziale sono presenti sia sul lato dell’esecuzione che su quello della valutazione, mentre la distanza intereferenziale si riferisce al passaggio dall’esecuzione alla valutazione dell’azione. Più specificamente la distanza semantica, per ciò che concerne l'azione, riguarda la relazione fra le intenzioni dell'utente ed il significato dei comandi che è possibile eseguire sull'interfaccia. Sul lato della valutazione, la distanza semantica si riferisce all'elaborazione che è richiesta all'utente per determinare se le condizioni di soddisfacimento delle proprie intenzioni sono state realizzate. La distanza referenziale o “di riferimento” intercorre fra il significato di una espressione e la sua forma fisica, sia sul lato dell'esecuzione che su quello della valutazione. Infine la distanza intereferenziale, che riguarda la relazione fra le forme di input e quelle di output presenti nel corso dell'interazione uomo-computer, che è massima quando le due forme sono completamente distinte In termini pratici, il cognitive walkthrough si focalizza principalmente: • sugli obiettivi che l’utente raggiunge durante l’esecuzione di un compito specifico, • sulle conoscenze da egli acquisite durante l’esplorazione e • sulle affordance che il sistema offre per favorire il completamento del compito. Il tutto al fine di registrare quelli che sono gli errori, le discrepanze, gli step problematici verificatisi nel corso del completamento del compito (Wharton, Bradford, Jeffries, Franzke, 1992). Il CW è stato studiato appositamente per interfacce destinate ad essere navigate ed esplorate. Di conseguenza molte applicazioni di questo metodo sono state effettuate su prodotti di questo tipo, (Lewis, Polson, Wharton e Rieman, 1990; Lewis e Polson 1991). Wharton e colleghi (Wharton, Bradford, Jeffries, Franzke, 1992) hanno ad esempio analizzato tre complessi sistemi sofware, l’HPVUE System, il REPS System e il BCA System. Wharton e al. (Rieman, Franzke e Redmiles 1995; Wharton, Bradford, Jeffries e Franzke, 1992) hanno fornito una serie di raccomandazioni per una efficace applicazione del cognitive walkthrough. In particolar modo essi hanno analizzato le diverse fasi di questa metodologia individuando i punti critici di ciascuna fase, la loro suddivisione del processo di walkthrough prevede tre fasi: 1) Selezione dei task, 2) Doing Cognitive Walkthrough 3) Interpretazione dei risultati. La selezione dei task deve prevedere compiti semplici e complessi, che possano essere facilmente suddivisi in sotto-compiti. Inoltre la scelta di compiti che coprono un ampio range di difficoltà consente agli esperti di fare pratica con la metodologia nei task più semplici prima di affrontare quelli più complessi. Un compito realistico, ossia che normalmente viene eseguito anche nella quotidianità permette di individuare elementi e sequenze di step problematici in modo più efficiente rispetto a compiti astratti. Secondo Wharton e al. (Wharton, Bradford, Jeffries, Franzke, 1992) il numero di task dovrebbe essere compreso fra i 2 e i 7, a seconda della complessità dell’interfaccia, del tempo e dei sub-step necessari per portarli a termine. In genere la lista dei task deve prevedere già una traccia dei sub-task necessari per portarli a completamento. L’applicazione del walkthrough consiste nel compilare una serie di form mentre si esplorano le azioni previste dai diversi task. In genere durante l’esecuzione del compito vengono poste delle domande, oppure viene chiesto al soggetto di “pensare ad alta voce”. Per quel che riguarda l’interpretazione dei risultati, è necessario mettere in evidenza quelle che sono le discrepanze fra obiettivi raggiunti dall’utente e le affordance offerte dal sistema, identificando gli aspetti problematici dell’interfaccia e gli errori commessi nell’esecuzione dei singoli step. Il tutto al fine di comprendere quanto l’interfaccia oggetto di interesse si appresta ad essere appresa attraverso la sua esplorazione. Attualmente, l’integrazione del cognitive walkthrough con dati video sembra uno dei metodi migliori per registrare quegli elementi dell’interazione che non sono immediatamente ricavabili dal thinking-aloud. A tal proposito Gabrielli e al. (Gabrielli, Mirabella, Kimani e Catarci, 2005) hanno applicato il cognitive walktrough su un gruppo di soggetti suddivisi in tre condizioni sperimentali: 1) una condizione dove veniva applicato il CW tradizionale, in setting di laboratorio 2) una condizione dove veniva applicato il CW in situ, ovvero in un ambiente ecologico, vicino al contesto reale d’uso 3) una condizione dove il CW in situ è stato integrato con dati video I risultati della ricerca di Gabrielli e al. hanno confermato che l’integrazione del CW con dati video consente di individuare una percentuale di problemi di usabilità e di aspetti dell’interazione con l’interfaccia statisticamente superiore rispetto quella rilevata nelle altre due condizioni sperimentali. Tuttavia Gamberini e Valenti (Gamberini, Valentini, 2001) sottolineano come questa metodologia non consenta di individuare con precisione tutti i problemi di usabilità di un sito. Karat, Campbell e Fiegel (Karat, Campbell e Fiegel, 1992), ad esempio in uno studio che confrontava “empirical usability testing” e “cognitive walkthrough”, hanno messo in luce come il primo metodo consenta di individuare un numero più ampio di problemi rispetto al CW, individuando inoltre un numero non irrilevante di problemi piuttosto seri che il CW non rileva. Dalla ricerca emerge anche come il cognitive walkthrough ottenga risultati migliori quando è svolto da un team di due persone piuttosto che un solo individuo. Una nota variante del CW è definita Pluralistic Walkthrough e si presenta come un’applicazione in cui un gruppo di utenti finali, developers, product designer e professionisti di usabilità, navigano insieme con l’aiuto di un facilitatore. Durante la navigazione il gruppo valuta step-by-step ogni elemento dell’interazione. Il vantaggio che deriva da questo metodo sta nella ricchezza di commenti che si ottengono coinvolgendo persone con diverse esperienze e conoscenze e dalla creatività che spesso scaturisce dal lavoro collaborativo e che consente di giungere a soluzioni nuove (Bias 1991; Gamberini, Valentini, 2001). Bias consiglia di far scrivere ad ogni partecipante i passi che compirebbe per portare a termine il compito e di passare alla discussione di gruppo solo quando tutti hanno terminato di scrivere. In questo modo è possibile raccogliere contemporaneamente: le azioni di ciascun partecipante, relativamente ad ogni task analizzato, senza che queste possano essere influenzati dagli esperti, dati circa i problemi che gli utenti percepiscono, informazioni in merito alle opinioni degli esperti di usabilità. Altra metodologia che si è sviluppata attorno al CW è il Groupware Walkthrough; Pinelle e Gutwin (Pinelle e Gutwin, 2002) affermano la necessità di prendere in considerazione anche la complessità del gruppo di lavoro, la metodologia del groupware walkthrough che essi propongono si compone infatti di due parti: un task model per identificare e analizzare il real-world collaborative tasks: si prendono in esame due componenti della collaborazione, il taskwork (azioni che devono essere compiute) e il teamwork. Si prendono quindi in esame aspetti quali: comunicazione esplicita, monitoring, coordinazione, planning e assistance. un walkthrough per valutare il sistema che supporta il compito. Questo modo di procedere si rivela particolarmente utile per l’analisi di usabilità di software collaborativi. Bibliografia Bias, R.C., (1991) Walkthroughs: Efficient Collaborative Testing. IEEE Software 8, 5, pp. 94–95. Hutchins, E.L., Hollan, J.D. and Norman, D.A. Direct manipulation interfaces. Human-Computer Interaction. (1985) 1, 311-338. Gabrielli, S., Mirabella, V., Kimani, S., e Catarci, T. (2005). Supporting Cognitive Walkthrough with Video Data: A Mobile Learning Evaluation Study. Proceedings of the International Conference on Human-Computer Interaction with Mobile Devices and Services (Mobile HCI). Gamberini, L., Valentini, E. (2001) Web Usability Today: Theories, Approach and Methods. In G. Riva, C. Galimberti Towards CyberPsychology: Mind, Cognitions and Society in the Internet Age. Amsterdam, IOS Press. Jeffries, R., Miller, J.R., Wharton, C., e Uyeda, K.M. User interface evaluation in the real world: a comparison of four tecniques. Proceedings ACM CHI ’91Conference (New Orleans, Louisiana, 27 April-2May 1991), 119-124. Karat, C., Campbell, R e Fiegel, T. Comparison of empirical testing and walkthrough methods in user interface evaluation. Proceedings CHI ’92 Conference. (Monterey, California, May 3-7), 397 404 Lewis, C. e Polson, P.G., Wharton, C., e Rieman, J. Testing a Walkthrough Methodology for Theory-Based Design of Walk-up-and-Use Interfaces. Proceedings ACM CHI ’90 Conference. (Seattle, Washington, April 1-5), 235-242. Lewis, C., e Polson, P.G. Cognitive Walkthrough: a Method for Theory-Based Evaluation of User Interfaces. Tutorial presented at ACM CHI ’91 (New Orleans, Louisiana, April 27-May 2). Nielsen, J. (1999) Designing Web Usability: The Practice of Simplicity. New Riders Publishing, Indianapolis. Nielsen, J., e Molich, R Teaching user interface design based on usability engineering. Proceedings ACM SIGCHI Bulletin 21,1 (July, 1989), 45-48. Nielsen, J., e Molich, R. Heuristic evaluation of user interfaces. Proceedings ACM CHI ’90 Conference (Seattle, Washington, April 1-5), 249-256. Nielsen, J., e Molich, R. Finding usability problem through heuristic evaluation. Proceedings ACM CHI ’92 Conference (Monterey, California, May 3-7), 373-380. Pinelle, D., e Gutwin, C. Groupware Walkthrough: Adding Context to Groupware Usability Evaluation. Proceedings of the SIGCHI Conference on Human factors in computing systems: Changing our world, changing ourselves (Minneapolis, Minnesota, USA, April 20-25 2002), Design Methods 455 – 462. Rieman, J., Franzke, M., Redmiles, D. Usability Evaluation With Cognitive Walkthrough. Tutorial presented at ACM CHI ’95 (Denver, Colorado, May 7-11). Rosson, M. B., Carroll, J. M. (2002) Usability engineering. Scenario-Based Development of Human-Computer Interaction. San Francisco, Morgan Kaufmann. Stavkovic, A., e Cross, K. Novice Heuristic evaluation of a complex interfaces. Proceedings ACM CHI ’99 Student poster (May, 15-20). Toffetti, A., Nodari, E., Zoldan C. (2001) Analisi ergonomia con esperti di INFO2000. Proceedings of the sixth ERCIM Workshop on User Interfaces for all (Firenze, October 25-26). 362-363 Wharton, C., Bradford, J., Jeffries, J., e Franzke, M. Applying Cognitive Walkthroughs to more Complex User Interfaces: Experiences, Issues and Recommendations. Proceedings CHI ’92 Conference (Monterey, California, May 3-7). 381-388.