VALUTAZIONE - Dipartimento di Scienze della Comunicazione

Transcript

VALUTAZIONE - Dipartimento di Scienze della Comunicazione
Valutazione
Università di Siena | Scienze della Comunicazione
TIPOLOGIE DI VALUTAZIONE
In corso d’opera (formative evaluation)
In fase avanzata del processo di sviluppo (summative
evaluation)
Post (beta testing, monitoraggi)
Valutazioni qualitativa e quantitativa
Valutazioni che coinvolgono gli utenti finali.
Valutazioni euristiche condotte da esperti.
VALUTAZIONE | USER TEST
Æ La valutazione basata su scenari è nota come testutente
– Consente di valutare nel dettaglio le performance e le reazioni
dell’utente nei diversi stadi di sviluppo del sistema, attraverso
l’uso dei prototipi
– Fornisce indicazioni sulle modifiche da apportare ai prototipi
nelle successive fasi di design
VALUTAZIONE | L’USO DI SCENARI
Æ progettazione degli scenari: progettare alcuni scenari
per ogni tipologia di attività che s’intende testare
– sulla base delle informazioni raccolte sugli utenti, sui compiti,
sulle attività, sul contesto d’uso
– tenendo conto dei requisiti di usabilità ed esperienza che
s’intende misurare
– e di quali funzionalità del sistema (prototipo) coprire.
Æ valutazione con gli scenari: l’utente esegue gli scenari
d’uso selezionati affiancato da un valutatore esperto
VALUTAZIONE | USER TEST
Æ Come condurre un TEST UTENTE:
1. Definire gli obiettivi del test (generici o specifici)
2. Definire il campione di soggetti che partecipano al test
3. Selezionare gli scenari da testare, rappresentativi dell’attività
4. Decidere i criteri di valutazione (qualitativi o quantitativi).
5. Predisporre l’ambiente di testing e verificare che il prototipo
supporti gli scenari selezionati
6. Eseguire il test, documentandone lo svolgimento (video o audio
registrazione, appunti scritti, log delle interazioni).
7. Analizzare i risultati
VALUTAZIONE | USER TEST
1. Definire gli obiettivi del test:
– Obiettivi generici:
Valutare la facilità d’uso, la soddisfazione e l’utilità percepita
nell’uso del sistema.
– Obiettivi specifici:
Valutare il funzionamento di un menù o di una funzione di
navigazione, verificare la leggibilità di un etichetta, ecc
VALUTAZIONE | USER TEST
Usabilità e qualità
dell’esperienza utente
Jakob Nielsen
VALUTAZIONE | USER TEST
2. Definire il campione dei soggetti:
– Scegliere dei criteri di rappresentatività della popolazione e
delle diverse tipologie di utenti
• Ruolo svolto nell’attività
• Esperienza con il sistema e con l’attività
(esperto/principiante)
• Frequenza d’uso del sistema
• Conoscenza di sistemi simili
– Definire il numero di utenti da coinvolgere nel test
• In base agli obiettivi ed allo stadio di sviluppo del progetto
VALUTAZIONE | USER TEST
3.
Selezionare task e scenari
Æ
Acquistare un biglietto
–
Æ
Acquistare un biglietto con bancomat
–
Æ
“Oggi é Sabato 25 ottobre, sono le 11:50. Lei é alla stazione di Roma, davanti alla
biglietteria automatica e vuole acquistare un biglietto solo andata per Napoli del
treno IC delle 12:10 ”
“Oggi é Sabato 25 ottobre, sono le 11:50. Lei é alla stazione di Roma, davanti alla
biglietteria automatica. Vuole acquistare un biglietto solo andata per Napoli del treno
IC delle 12:10. Non ha contante, ma ha con sé il bancomat. ”
Andata e ritorno…
–
“Oggi é Lunedi 13 ottobre, sono le 9:15. E’ una bella giornata così ha deciso di fare
una sorpresa a sua figlia che abita a Napoli. Vorrebbe essere lì per ora di pranzo,
ma deve tornare a Roma in serata perché ha un appuntamento con una sua amica
per il dopo cena. Quindi va alla biglietteria automatica della stazione Roma Tiburtina
per acquistare con la sua carta argento un biglietto andata e ritorno, sperando che ci
siano buone combinazioni di treni per i suoi programmi
VALUTAZIONE | USER TEST
3. Selezionare task e scenari
Æ I criteri di selezione degli scenari per condurre user test:
– Rappresentatività: compiti che sono rappresentativi per l’attività, che
ne sono alla base. Ad es: se s’intende valutare una biglietteria
automatica non dovranno mancare compiti di scelta del percorso,
dell’orario di partenza, modalità di pagamento,ecc.
– Frequenza: i compiti caratterizzati da un alto tasso di occorrenza
nell’attività, ad es. ricercare informazioni sugli orari, acquisto di più di
un biglietto, acquisto veloce di un biglietto, ecc.
– Criticità: compiti che nell’attività reale sono o potrebbero essere critici,
fonti di errore
– Implementabilità: compiti che possono essere portati avanti attraverso
il sistema (prototipo)
VALUTAZIONE | USER TEST
4. Decidere i criteri di valutazione
Æ Le misure quantitative riguardano la performance osservabile dell’utente mentre
esegue i compiti in interazione con il sistema, ad es:
–
Tempo impiegato per completare con successo il compito
–
Percentuale di completamento di un compito nell’unità di tempo
–
Numero e tipologia di errori commessi durante l’esecuzione del compito
–
Frequenza di una determinata tipologia di errore
Æ Le misure qualitative si basano invece su valutazioni soggettive, sull’opinione degli
utenti circa la bontà dell’interfaccia, ad es:
–
livello di soddisfazione percepita dagli utenti (alla prima impressione o a lungo
termine)
–
difficoltà d’uso del sistema
–
piacevolezza
VALUTAZIONE | USER TEST
5. Predisporre l’ambiente di testing e verificare che il
prototipo sostenga i task e gli scenari selezionati
–
Preparare il materiale di cui l’utente ha bisogno durante
l’esecuzione del test
–
Verificare che le funzioni e gli scenari d’uso che si vogliono testare
siano supportati dal prototipo
–
Fornire spiegazioni all’utente sugli obiettivi del test (si valuta il
sistema e non la performance dell’utente!) e indicazioni sui compiti
che deve svolgere
Test condotto in laboratorio
Possibilità di gestire le
variabili con maggiore
accuratezza.
vs
Test condotto sul campo
Possibilità di avere più dati
rispetto all’uso nel contesto
operativo reale.
VALUTAZIONE | USER TEST
6.
Eseguire il test
Æ
Preparazione del test
–
–
–
–
presentare gli obiettivi della sessione all’utente
lista preliminare degli eventi significativi (griglia)
video registrazione del test (se possibile)
Note e appunti di eventi significativi
Æ
Consegne:
–
Fornire l’obiettivo da portare a termine e l’eventuale materiale di supporto
Æ
Metodi di esecuzione:
–
thinking aloud (pensare ad alta voce)
–
il valutatore é osservatore passivo: interviene solo dietro esplicita richiesta di aiuto da parte
dell’utente o in caso di difficoltà che allungano notevolmente i tempi di esecuzione.
Æ
Post test:
–
Commenti liberi dell’utente
–
Discussione rispetto a punti critici
Æ
Documentare quello che succede e quello che l’utente dice (audio, video, appunti, log, ecc.).
VALUTAZIONE | USER TEST
6. Esecuzione del test: diversi metodi
Æ osservazione semplice sul campo o in laboratorio
– Si osserva l’utente interagire con il sistema
– Nessun intervento dello sperimentatore
– Nessun dato sui processi mentali dell’utente
VALUTAZIONE | USER TEST
6. Esecuzione del test: diversi metodi
Æ osservazione con think aloud
– Si chiede ai soggetti di dire cosa stanno pensando o facendo
•
•
•
cosa credono stia accadendo
cosa stanno cercando di fare
perché hanno fatto quella azione
– Si acquisiscono dati sui processi mentali dell’utente
– Ma è poco confortevole per l’utente
– l’utente esplicita ragionamenti altrimenti impliciti: potrebbe
modificare il suo comportamento
– difficile commentare mentre si è concentrati su un problema
VALUTAZIONE | USER TEST
6. Esecuzione del test: diversi metodi
Æ osservazione con interazione costruttiva
– Due soggetti (un quasi esperto ed un novizio) lavorano insieme
con lo stesso sistema
•
il novizio “ha i comandi”
– Si osserva la normale conversazione
•
rimuove la non naturalezza del think aloud
– il novizio pone molte domande
– il quasi esperto risponde
– fornisce dati sui processi mentali di entrambi
VALUTAZIONE | USER TEST
6. Esecuzione del test: diversi metodi
Æ retrospective testing
–
–
–
–
osservazione del test registrato per chiarire alcuni eventi
su snapshot o video
l’utente commenta e spiega le sue azioni
eccellente come materiale di supporto per le interviste post
sessione
– valida la comprensione dello sperimentatore
– utenti spesso commentano ed offrono suggerimenti
VALUTAZIONE | USER TEST
6. Esecuzione del test: diversi metodi
Æ walkthrough
•
•
•
•
prototipi cartacei
immagini di schermate
schermate statiche
Prototipi semi funzionanti
–
Si chiede all’utente di “muoversi” nel sistema, individuare le parti
funzionali, e cosa farebbe per raggiungere un determinato obiettivo
–
EXPLORATORY LEARNING (Lewis & Polson,1991)
•
•
–
–
–
l’apprendimento è legato all’azione
il feedback fornito dall’interfaccia durante l’interazione rafforza e consolida
le conoscenze apprese durante la sua esplorazione.
TEORIA DEGLI STADI DELL’AZIONE (Hutchins, Holland & Norman,
1985; Norman, 1997).
7 stadi dell’azione
3 distanze: difficoltà di passaggio da una fase all’altra
Il modello
dell’azione| NORMAN
MODELLO
DELL’AZIONE
SCOPO
Esecuzione
Input
Valutazione
Confrontare ciò che è successo con
quello che volevamo succedesse
MONDO
[Hutchins, Hollan e Norman, 1985] Modello dell’azione
MODELLO DELL’AZIONE | NORMAN
Esecuzione
SCOPO
Intenzione
Pianificazione
Esecuzione
MONDO
MODELLO DELL’AZIONE | NORMAN
SCOPO
Golfo dell’esecuzione
E’ la differenza tra le intenzioni e le azioni possibili:
Intenzione
Pianificazione
Esecuzione
MONDO
•In che misura il sistema permette agli utilizzatori di raggiungere i loro scopi senza sforzi aggiuntivi?
•Il sistema chiarisce cosa è possibile ottenere da esso?
•Il sistema comunica adeguatamente il suo funzionamento e le azioni che esso rende possibili?
•Lo spazio di interazione fornisce tutta la conoscenza necessaria per pianificare / eseguire una sequenza di azioni?
MODELLO DELL’AZIONE | NORMAN
Valutazione
SCOPO
Valutazione
Interpretazione
Percezione
MONDO
MODELLO DELL’AZIONE | NORMAN
Golfo della valutazione
SCOPO
E’ la differenza tra lo stato del sistema e la valutazione dell’utilizzatore:
Valutazione
Interpretazione
Percezione
MONDO
•In che misura il sistema comunica il proprio stato?
•Sono chiare ed evidenti le conseguenze di un’azione?
•Lo spazio dell’interazione assume uno stato aderente alle aspettative dell’utilizzatore?
•Quanto è difficile comprendere se si sono verificato errori nel corso dell’interazione?
•E’ facile comprendere le relazioni di causa‐effetto relative all’interazione con il sistema?
MODELLO DELL’AZIONE | NORMAN
Distanza cognitiva
Sforzo cognitivo richiesto per eseguire un’azione e valutarne gli effetti.
La distanza semantica: versante dell’esecuzione
Inviare un allegato in posta elettronica...
Apro Word
Scrivo il documento
Lo salvo nel giusto formato (es. .doc o .rtf)
Apro il sistema di posta (es. outlook)
“Allego” il documento al messaggio
Scelgo il giusto formato di codifica (simple text, html)
Scrivo l’indirizzo
Spedisco il documento
Esecuzione
La distanza semantica: versante della valutazione
Il messaggio sarà arrivato a destinazione? E quando?
La distanza referenziale: versante dell’esecuzione
Voglio copiare il file Pippo.txt nella mia cartellina “doc”...
La distanza referenziale: versante dell’esecuzione
…con un computer con sistema operativo dos (senza interfaccia grafica)...
La distanza referenziale: versante dell’esecuzione
…con un’interfaccia grafica a manipolazione diretta...
La distanza referenziale: versante della valutazione
…con un computer con sistema operativo dos (senza interfaccia grafica)...
La distanza referenziale: versante della valutazione
…con un’interfaccia grafica a manipolazione diretta...
La distanza inter‐referenziale
Il fax
Il citofono
…
Skype
Il modello dell’azione
•Individua i concetti di base dell’interazione dal punto di vista dell’utilizzatore
•Spiega la ciclicità dell’interazione
•Individua i golfi da superare
•Evidenzia le distanze semantica e articolatoria
•Sottolinea l’importanza della forma percepibile dello strumento.
VALUTAZIONE | USER TEST
7. Analizzare i risultati
Protocollo verbale
Video clip
Io non ho la carta
verde […] come
faccio? Come
faccio a pagare
normalmente.
Possibile che non
abbiano la tariffa
normale? Ehm […]
Ah si ecco qua…
Descrizione delle azioni
L’utente non riesce ad
individuare l’icona
corrispondente a tariffa
intera. La confonde con una
delle tante carte. La trova
solo dopo ripetuti tentativi
di modifica del numero nel
campo “Totale passeggeri”.
Indicazioni per il design
Modificare la
rappresentazione
dell’opzione “tariffa intera”.
Differenziarla meglio dalle
altre.