le scale di misurazione - Pubblica amministrazione di qualità

Transcript

le scale di misurazione - Pubblica amministrazione di qualità
RICERCA CONGIUNTA NEL SETTORE DELLA MISURA DELLA
SODDISFAZIONE DEGLI UTENTI DEI SITI E DEI SERVIZI ON LINE DELLE
AMMINISTRAZIONI E PER LA PREDISPOSIZIONE DI UNO STRUMENTO DI
RILEVAZIONE DELLA CUSTOMER SATISFACTION
LE SCALE DI MISURAZIONE
ACCORDO DI COLLABORAZIONE TRA IL CNIPA E IL DIPARTIMENTO DI
SCIENZE AZIENDALI E ECONOMICO-GIURIDICHE DELL’ UNIVERSITÀ DEGLI
STUDI ROMA TRE
Data consegna 23.04.08
La misurazione dei dati e le tecniche di scaling
Premessa
Il presente documento ha una duplice finalità:
•
•
proporre una rassegna organica dei sistemi di misurazione e scaling per offrire un quadro
sintetico – ma esaustivo – dell’argomento, alla luce dei principali contributi offerti dalla
letteratura in materia;
fornire degli elementi di inquadramento concettuale e metodologico per fissare i criteri di
scelta dei metodi di misurazione e scaling maggiormente appropriati per la Customer
Satisfaction.
In questo modo, a elementi di carattere descrittivo, vanno ad accostarsi valutazioni critiche e di
opportunità nell’utilizzo delle scale per rilevare i giudizi di soddisfazione, in accordo con le tendenze
emergenti, sia teoriche, sia di prassi.
1. Il concetto di misurazione
Con il termine di misurazione si intende un insieme di regole attraverso le quali è possibile attribuire
dei numeri alle caratteristiche del fenomeno osservato, tali caratteristiche che vengono sottoposte a
misurazione si definiscono variabili.
Con il termine variabile, quindi, ci si riferisce a qualsiasi carattere che variando di livello indica la
condizione del fenomeno. E’ possibile distinguere variabili quantitative e qualitative in base al tipo di
valori che la caratteristica può assumere. Le variabili quantitative che possono assumere valori in un
insieme discreto di numeri reali, si dicono variabili quantitative discrete (ad esempio: il numero di figli nel
collettivo delle donne, il numero di stanze nel collettivo delle abitazioni, il voto alla maturità nel
collettivo degli studenti). Le variabili quantitative invece che possono assumere qualsiasi valore in un
intervallo di numeri reali sono definite variabili quantitative continue (ad esempio: il peso corporeo, la
statura, la superficie di un’abitazione, la temperatura).
Una variabile è qualitativa se i valori che assume corrispondono a delle etichette o attributi che
consentono di assegnare le unità a diverse categorie, e sono dette discrete.
La natura di una variabile è importante per poter decidere quale strumento è più idoneo per la scelta
della scala di misurazione utile per l’osservazione di un fenomeno.
Lo psicofisico Stanley Smith Stevens definisce la misurazione sostenendo :
“che la misurazione, nel senso più ampio, consiste nell’attribuzione di numeri a oggetti o eventi seguendo determinate
regole. Il fatto che si possano assegnare dei numeri seguendo regole differenti porta a differenti tipi di scala e differenti tipi
di misurazione. Il problema diventa quello di rendere esplicite: a) le varie regole per l’assegnazione dei numeri, b) le
proprietà matematiche (o la struttura del gruppo) delle scale che ne risultano, e c) le operazioni statistiche applicabili alle
misure effettuate su ciascun tipo di scala” (S.S. Stevens, 1946).
Scegliere le regole per l’assegnazione dei numeri vuol dire individuare la scala di misura più adatta,
ovvero uno strumento di misura di variabili che riguardano la struttura e la natura del fenomeno in
analisi.
1.2 Le scale di misurazione
La classificazione dei tipi di scale proposta da Stevens negli anni ’40 è stata adottata nelle scienze
sociali. Stevens ha operato la distinzione fra le categorie basandosi esclusivamente sulle proprietà
logico-formali dei vari tipi di scala.
I quattro livelli di misurazione (o scale di classificazione) secondo Stanley Smith Stevens (1951) sono:
1.
2.
3.
4.
scala nominale
scala ordinale
scala a intervalli equivalenti
scala a rapporti equivalenti.
Le prime due scale rientrano nella categoria delle scale non-metriche, mentre la scala ad intervalli e
quella a rapporti equivalenti rientrano nelle scale metriche che vengono utilizzate non solo quando si
possono ordinare i soggetti in relazione al fatto che posseggano in misura maggiore o minore quella
data caratteristica, ma è possibile esplicitare l’esatta quantità di quella caratteristica.
Le scale non-metriche
•
Scala nominale
La scala nominale è il tipo più semplice di misurazione e consiste nel definire una variabile mediante
una classificazione in categorie (o classi) non ordinabili che saranno il più omogenee possibili. Essa si
basa sulla più semplice proprietà di numerazione, ossia l’identificazione. I numeri in questo tipo di
scala hanno come unico scopo quello di individuare e classificare gli oggetti o gli eventi a cui essi sono
assegnati, per cui non è possibile stabilire un ordine.
Per trasformare una proprietà in variabile, ad ogni modalità che rappresenta lo stato della proprietà, si
attribuisce un valore numerico. Le etichette che si decide di attribuire ad ogni categoria sono del tutto
arbitrarie.
Ad esempio, se si vuole classificare un certo numero di individui a secondo del loro sesso (variabile), si
può stabilire di attribuire agli uomini (modalità che può assumere la variabile) il codice 1 e alle donne
(l’altra modalità che può assumere la variabile) il codice 2 in modo da identificare e classificare gli
individui. L’assegnazione dei codici 1 e 2 è arbitrario (assegnando 2 a uomo e 1 a donna non
cambierebbe la misurazione). E’ possibile solo stabilire se considerando se due unità ricadono nella
stessa modalità (ad esempio entrambi sono uomini) o sono differenti (se ricadono in modalità diverse):
l’unica operazione consentita è stabilire l’uguaglianza o la diversità tra due casi.
Le operazioni statistiche possibili sono il calcolo delle frequenze, i diagrammi a barre, le tabelle di
contingenza e l’analisi delle corrispondenze.
•
Scala ordinale
La scala ordinale è considerata la più semplice scala “quantitativa”, in cui viene introdotto il concetto
di ordine tra le categorie. La scala ordinale infatti non solo consente di classificare la variabile in
categorie, ma permette anche di ordinare le categorie in ordine gerarchico a seconda del valore che
hanno rispetto alla proprietà considerata. In questo caso gli oggetti sono classificati in ordine crescente
o decrescente, in base alla misura più o meno elevata con cui posseggono una determinata
caratteristica o proprietà, definita in anticipo. Ad esempio chi si classifica primo in un concorso, si
suppone possieda certe qualità in misura maggiore di chi occupa il secondo posto, così come questo
ne possiederà in modo più consistente rispetto al terzo e così via.
I numeri che vengono associati alle categorie rappresentano soltanto la relazione d’ordine tra le
modalità (“superiore a”, “più grande di”). L’impossibilità di definire la distanza tra due valori
consecutivi rappresenta il limite maggiore di questa tipologia di scala, infatti essa è possibile applicarla
solo nelle ipotesi in cui è valida la proprietà transitiva (se a è più grande di b, b è più grande di c, allora
a sarà più grande di c).
Le scale metriche
• Scala ad intervalli equivalenti
La scala ad intervalli equivalenti permette non solo di stabilire una graduatoria rispetto al possesso di
una caratteristica, ma anche di individuare l’entità degli intervalli tra un grado e l’altro della scala.
Esempi di scale ad intervalli sono la scala centigrada e quella Fahrenheit.
Tale scala di misurazione riguarda l’assegnazione arbitraria del punto a partire dal quale le misurazioni
vengono effettuare (zero della scala); in questa scala lo zero non identifica l’assenza assoluta della
caratteristica misurata.
La scala permette di effettuare confronti fra le unità statistiche sulla base di differenze tra i valori della
scala (ad esempio la differenza tra una temperatura di 37°C e 38°C è 1°C) ma a causa dell’assenza del
punto zero assoluto i rapporti di valore non assumono significato (100°C non è due volte più caldo di
50°C). Le operazioni statistiche consentite su variabili di tipo quantitativo vanno dall’uso di semplici
operazioni di rappresentazione, a modelli di analisi più complesse.
•
Scala di rapporti equivalenti
La scala a rapporti equivalenti e la scala ad intervalli differiscono solo per il diverso significato che lo
zero possiede nei due tipi di scala: zero relativo (nella scala ad intervalli) e zero assoluto nella scala a
rapporti). Nella scala di rapporti il punto zero corrisponde all’assenza della proprietà oggetto di
misurazione, per cui è possibile calcolare sia la differenza tra i valori della scala sia sui valori stessi della
scala. L’unica arbitrarietà riguarda l’unità di misura che si utilizza, ma qualsiasi unità di misura di scelga
lo zero indicherà l’assenza della proprietà.
Questo tipo di scala viene utilizzata soprattutto nella misurazione di caratteristiche come età, peso e
lunghezza. In particolare qualora la caratteristica oggetto della misurazione sia trasferibile (per esempio
il reddito) si parla di scala metrica, viceversa se la variabile misura una grandezze non mobile, si parlerà
di scala di quantità (per esempio l’età).
1.1.2 Scale di posizione, Scale metriche e Scale di quantità: la proposta di Ricolfi
Ricolfi, con l’obiettivo di ridurre la rappresentazione dei caratteri quantitativi a due solo scale (quella
metrica e quella assoluta) si concentra principalmente sulla fase di analisi dei dati piuttosto che sulla
definizione a monte delle scale e ritiene che la distinzione tra zero assoluto e zero relativo è tutt’altro
che irrilevante. L’autore sostiene che definire uno zero assoluto divide le scale di rapporti in due
sottotipi alle quali corrisponde una serie di operazioni statistiche.
Secondo la classificazione di Ricolfi due sono le condizioni da soddisfare per classificare le scale:
• Condizione di additività: che viene soddisfatta quando la variabile è tale che il valore in un
qualsiasi collettivo o aggregato di unità elementari coincide con la somma dei valori delle unità
componenti.
• Condizione di positività: è soddisfatta quando la variabile è tale che il valore corrispondente
sono quote di una grandezza totale.
Quindi Ricolfi distingue in:
1. Scale di posizione: ovvero scale ad intervalli equivalenti in cui nessuna delle due condizioni è
soddisfatta. Gli stati sulla proprietà sono semplici posizioni in un determinato sistema di
riferimento.
2. Scale metriche: dove il punto zero corrisponde ad assenza di proprietà (zero assoluto); sono
scale di rapporti in cui è soddisfatta la sola condizione di positività.
3. Scale di quantità: nelle quali il punto zero corrisponde ad assenza di proprietà (zero
assoluto); sono scale di rapporti in cui entrambe le condizioni sono soddisfatte: le grandezze
sono trasferibili ed interpretabili come l’ammontare di una data proprietà. Le varie unità si
distinguono sulla base del quantum posseduto della proprietà.
2. La misurazione degli atteggiamenti
L’applicazione più frequente della tecnica delle scale in campo sociale è la misura degli atteggiamenti
considerati come un insieme di tendenze e sentimenti, pregiudizi, idee, timori, apprensioni e
convinzioni di una persona nei confronti di un particolare argomento.
Gli atteggiamenti sono, dunque, parte dei valori sociali, e vengono concepiti come relativi ad un
singolo oggetto. La prima definizione di atteggiamento fu data da Gordon Allport il quale considerava
l’atteggiamento “uno stato mentale o neurologico di prontezza, organizzata attraverso l’esperienza, che
esercita un’influenza direttiva o dinamica sulla risposta.
Gli atteggiamenti, in quanto posizioni mentali che tendono a perdurare, influenzano il comportamento
di ciascun individuo e proprio per questo motivo, il marketing è orientato, attraverso le sue ricerche, a
conoscere il comportamento dei consumatori e, all’occorrenza, influenzarlo.
Il motivo fondamentale per cui si misurano gli atteggiamenti è dovuto al fatto che questi
contribuiscono a determinare i comportamenti; tuttavia il comportamento non è determinato solo
dagli atteggiamenti ma anche da componenti affettive e cognitive (Modello del Comportamento
Programmato, I. Aizen), che però risulta più difficile da osservare e interpretare.
Le tecniche di scaling si adottano quindi per rilevare atteggiamenti (che empiricamente sono definite
come proprietà continue) per le quali non si dispongono di unità di misura; quindi lo scaling è un
concetto più ampio rispetto al concetto di misurazione poiché queste tecniche si fondano
prevalentemente su un’interpretazione unidimensionale dell’atteggiamento che viene immaginato
come un conntinuum. Le tecniche di scaling più comunemente impiegate sono classificate in due
famiglie: scale comparative, in cui si attua una comparazione diretta tra uno stimolo e un altro e scale
non-comparative (o monadiche), in cui ciascuno stimolo è oggetto di scaling indipendentemente da un
altro stimolo analogo; queste ultime scale possono essere continue o categorizzate, a seconda che si
esprima una valutazione, rispettivamente, sulla base di variabili continue o divise in categorie ordinate.
Nella schema di seguito riportato vengono illustrato le diverse tecniche di scaling.
Tecniche
di scaling
Scale
Comparative
Scala di
Confronto
a coppie
Scala
Ordinate
per ranghi
Scala
a Somma
Costante
Scala
di Likert
Scale
Non-Comparative
Scala
Q- Sort
Altre
procedure
Scala del
Differenziale
Semantico
Classificazione
Continua
Scala
di Stapel
Scala
di
Guttman
Classificazione
Categorizzata
Altre
scale
2.1.Scale comparative
Tra le scale comparative le tecniche più diffuse sono:
•
scale di confronto a coppie (paired comparison scales)
•
scale ordinate per ranghi (rank order scales)
•
scale a somma costante (costant-sum scales)
•
scale Q-sort (Q-sorting)
•
Scale di confronto a coppie
Nelle scale di confronto a coppie, i soggetti devono scegliere tra due attributi (o tra due oggetti) alla
volta secondo un proprio criterio.
Questa scala permette di capire quali attributi/oggetti sono più graditi al soggetto, infatti le possibili
comparazioni degli n attributi/oggetti sono pari al totale delle combinazioni con ripetizioni prese due
alla volta; tali scale, pertanto, si usano con un numero limitato di valutazioni.
•
Scale ordinate per ranghi
Con questa scala, invece, vengono sottoposti ai soggetti diversi attributi/oggetti simultaneamente e
viene chiesto loro di confrontarli e ordinarli secondo un proprio criterio per questo motivo viene
spesso utilizzata per misurare le preferenze per le marche anche se considerando l’alto numero di
combinazioni possibili è difficile da implementare.
Quale combinazione preferisce, in ordine decrescente, di marca, gusto
e dimensione per un cono gelato?
Marca A, gusto B, dimensione C
Marca B, gusto A, dimensione C
Marca C, gusto B, dimensione B
• Scale a somma costante
Questo strumento richiede agli intervistati di ripartire un punteggio fisso (solitamente 100) tra due o
più caratteristiche, in base all’importanza ad essa attribuita rispettando un criterio che ne rifletta la
preferenza relativa.
Marca A
Caratteristiche abbigliamento
Marca B
E’ pratico da indossare
20
24
È resistente
10
12
È prodotto in Italia
30
42
Ha un buon rapporto qualità/prezzo
40
32
Totale
100
100
• Scale Q-sort
In questo tipo di scala, ancora più complesse,si chiede ai soggetti di accomunare oggetti simili secondo
un proprio criterio, sostanzialmente l’individuo mette in pile diverse delle cartelle contenenti
affermazioni che sono riferibili a determinati gruppi o categorie (solitamente, per accrescere
l’accuratezza dei risultati, vengono scelte dieci o più categorie) distribuite secondo una curva normale.
Ad esempio, si categorizzano 100 affermazioni riguardanti per esempio l’immagine di una marca.
3
4
7 10 13 16 13 10 7 4
3
——|—-|—|—|—|—|—|—|—|—|—|——
Molto
favorevole
10
9
8
7
6
5
4
3
2
1 0
Decisamente
sfavorevole
I numeri 3, 4, 7,…..7, 4, 3 sono i numeri delle affermazioni posizionate in ogni categoria; i numeri al di
sotto della linea indicano i valori ad esse assegnate. Ad ogni intervistato vengono chieste le tre
affermazioni considerate più favorevoli, a cui verrà assegnato un punteggio pari a dieci (decima
categoria), le altre tre caratteristiche meno favorevoli, classificate nell’ultima categoria e così via.
2.2 Scale non comparative
L’altra famiglia di tecniche di scaling è costituita dalle scale non-comparative, classificabili secondo due
diverse modalità: continue (continuous scaling); e categorizzate (itemized scaling).
Nella scale continue, i soggetti valutano l’oggetto di stimolo (per esempio, un prodotto o una marca)
piazzando un segno nella posizione scelta a seconda della sua valutazione, su una linea che va da un
estremo all’altro della variabile presa in esame.
Nelle scale categorizzate, invece, fornisce al soggetto una serie ordinata di categorie che rappresentano
gli intervalli di scelta; a ciascuna categoria sono associati dei numeri. I soggetti devono scegliere la
categoria che meglio descrive l’oggetto di valutazione.
Le scale categorizzate possono essere di due tipi:
1. Scale a modalità unica (Single item scale). Tale scale utilizzano un solo aspetto dell’ oggetto da
valutare. Quindi invece di un insieme di domande si preferisce utilizzare una singola domanda. Tra le
scale single item vi sono:
Scale Semanticamente autonome;
Scale a Parziale autonomia semantica;
Scale Auto-Ancoranti.
2. Scale a modalità multipla (Multi item scale). Queste tipi di scale mettono insieme un gruppo di
risposte, date per valutare un insieme di aspetti dell’oggetto da valutare.
Tra le forme più diffuse di scale categoriali a modalità multipla vi sono:
•
Scala di Likert;
•
Scala del Differenziale Semantico
•
•
•
Scala di Stapel
Scala di Guttman
Scala di Thurstone
•
Scala semanticamente autonoma
Sono scale dove le domande presentano delle alternative di risposta, che anche se ordinabili, sono
poste in modo che la risposta possa essere data senza considerare le altre categorie di risposta, questo
perché l’autonomia semantica permette all’intervistato di scegliere la risposta per il suo contenuto
senza dover conoscere le alternative di risposta. (Ad esempio la domanda relativa al titolo di studio,
dove per rispondere non bisogna conoscere le altre risposte).
•
Scala a parziale autonomia semantica
Sono scale rappresentate da categoria di risposta ordinate con affermazioni del tipo: “assolutamente
contrario”, “contrario”, “d’accordo”, “assolutamente d’accordo”, in cui il significato delle categorie di
risposte è solo parzialmente autonomo dalle altre. In questo tipo di scale, le risposte non hanno totale
autonomia semantica, può accadere che nell’intervistato scatti un meccanismo di comparazione
quantitativa (Ad esempio alla domanda “Le piace il servizio di mensa dell’azienda XYZ?” l’intervistato
può scegliere tra le seguenti categorie di risposta“Per niente” “Poco” “Abbastanza” “Molto”).
• Scale Auto-Ancoranti
Nelle scale auto-ancoranti l’intervistato deve rispondere alla domanda ponendo la sua risposta tra due
modalità opposte. Un esempio viene illustrato nella tabella sottostante.
“Come giudica il suo livello di soddisfazione nei confronti del servizio di accoglienza
dell’Hotel XYZ?”
Pessima
Ottima
1
2
3
4
5
6
7
• Scala di Likert
Con la scala di Likert i soggetti devono indicare il grado di accordo o disaccordo con ciascuna d’una
serie di affermazioni riguardante l’oggetto della misurazione. Le categorie in genere sono 5 o 7 (che
vanno da “Fortemente d’accordo” a “Fortemente in disaccordo”, con il valore centrale neutro). Il
punteggio totale viene calcolato sommando i punteggi dati a ciascuna risposta. I questionari che
utilizzano la scala di Likert sono in genere facili da completare, sono tipicamente utilizzati per misurare
oggetti intangibili. Nella tabella sottostante vengono proposti degli esempi dell’utilizzo di scale di
Likert.
1- L’ufficio Postale XYZ offre un servizio rapido.
Molto d’accordo D’accordo
Né, né In disaccordo
Molto in disaccordo
Per analizzare i dati ottenuti con l’utilizzo di una scala Likert (come nel caso precedente), si assegna un
numero a ciascuna risposta; ad esempio:
Molto d’accordo
5
D’accordo
Né, né In disaccordo
4
3
2
Molto in disaccordo
1
e si calcolano i risultati: per ciascuna affermazione, si calcola la media tra i soggetti intervistati; e per
ciascun intervistato, si calcola la media delle risposte a tutte le affermazioni. Il risultato totale è dato
dalla media di tutti gli intervistati su tutte le affermazioni.
• Scala del differenziale semantico
E’ una scala tipicamente bipolare, in cui i soggetti valutano l’oggetto della misurazione (per esempio,
un prodotto) su una scala a 5 o 7 gradi (il cui punto centrale è neutro), legata a ciascun estremo a
coppie di aggettivi opposti (come buono/cattivo, di valore/senza valore, forte/ debole, ecc.). La scala
del differenziale semantico (come pure quella di Likert) viene trattata come una scala ad intervallo, per
cui si possono sommare tra loro le valutazioni ed effettuare calcoli statistici (media, varianza, ecc.).
Una descrizione sintetica dell’oggetto sottoposto a valutazione può essere fatta attraverso l’uso
dell’analisi aggregata (dove i punteggi individuali sono sommati per ottenere un punteggio
complessivo) o l’analisi dei profili (è una rappresentazione grafica e si ottiene congiungendo con una
linea tutti i punteggi medi dei rispondenti).
• Scala di Stapel
E’ una scala unipolare nel senso che le frasi descrittive e gli aggettivi sono presentati separatamente. I
valori della scala solitamente vanno da +5 a -5, ed è quindi priva di un punto neutrale. Con tale scala è
possibile misurare sia la dimensione sia l’intensità degli atteggiamenti, quindi più l’aggettivo è adatto
all’oggetto, più il numero si avvicina al numero positivo e viceversa. Viene usata soprattutto grazie alla
sua semplicità nelle interviste telefoniche.Nella tabella successiva viene considerato un sondaggio per
la misurazione del grado di soddisfazione di un ufficio postale, in cui i soggetti valutano ciascun
aspetto esprimendo un voto positivo o negativo:
•
Velocità del servizio
+5 +4 +3 +2
+1
-1
-2
-3
-4
-5
Orario conveniente
+5 +4 +3 +2
+1
-1
-2
-3
-4
-5
Ubicazione comoda
+5 +4 +3 +2
+1
-1
-2
-3
-4
-5
Basso tasso d’interesse
+5 +4 +3 +2 +1
-1
-2
-3
-4
-5
Scala di Guttman
Obiettivo principale della scala di Guttman è di fornire una soluzione al problema
dell’unidimensionalità della scala (punto debole della tecnica di Likert).
In un primo momento si pongono delle domande su ogni aspetto dell’argomento oggetto della
misurazione. Successivamente ad ogni risposta si chiede al soggetto intervistato quanto è convinto
della sua dichiarazione, assegnando un punteggio da 4 a 0 a seconda se le risposte sono favorevoli alla
domanda. In seguito si calcolano i punteggi dell’intervistato , se le affermazioni sono 5, il punteggio
può variare da 20 e 0. I punteggi ottenuti vengono riportati su uno scalogramma, dove vengono
rappresentate le curve che individuano la distribuzione degli atteggiamenti (dette curve di intensità). La
forma della curva indica la distribuzione degli atteggiamenti, ad esempio nel caso di una parabola
questa individua una forte propensione ad atteggiamenti neutrali, al contrario se la curva ha una forma
a “V” ciò indica una presenza di atteggiamenti in opposizione.
• Scala di Thurstone
La scala di Thurstone ha l’obiettivo di misurare un certo atteggiamento attraverso l’utilizzo dei frasi a
cui un gruppo di esperti hanno attribuito un certo punteggio. Per l’atteggiamento da valutare vengono
individuati circa 120 item. Il gruppo di esperti attribuisce un punteggio a questi item a seconda della
loro affinità con l’atteggiamento da misurare e se ne selezionano un numero non inferiore ad 11.
L’atteggiamento viene quindi rappresentato come un segmento scandito da 11 “picchetti” che
dividono il segmento in dieci intervalli uguali. Ogni “picchetto” segnala una determinata posizione
sull’atteggiamento da misurare. Successivamente gli intervistati devono segnalare tutte le affermazioni
che considerando più affini all’atteggiamento da valutare.
3. Considerazioni di opportunità nella scelta delle scale per le indagini di
customer satisfaction
Le scale di valutazione della UNI 11098:2003
La UNI 11098:2003 si intitola,“Linee guida per la rilevazione della soddisfazione del cliente e per la misurazione
degli indicatori del relativo processo”.
Essa fornisce delle linee guida per la rilevazione della soddisfazione del cliente, la misura dei
relativi indicatori di prestazione dell’organizzazione e il relativo processo di audit. Per la
determinazione della soddisfazione del cliente non si può, quindi, fare a meno di informazioni
provenienti da esso. A questo proposito, la UNI 11098 distingue due modalità di raccolta delle
informazioni, una di tipo attivo (interviste e questionari) e l’altra di tipo passivo (informazioni di
ritorno dal cliente), indicando i vantaggi e i limiti per ciascuna modalità.
Le indagini sulla soddisfazione hanno principalmente due finalità. La prima consiste nel fornire
gli elementi per una diagnosi precisa e completa dei fattori che causano insoddisfazione (quando le
aspettative sono inattese), soddisfazione (quando le aspettative sono state raggiunte) e delizia
(momento in qui le aspettative sono state superate). La seconda è data dalla costruzione di indicatori di
prestazione dell’organizzazione, capaci di monitorare l’efficacia delle azioni messe in atto per
migliorare la soddisfazione dei clienti, suggerendo nuovi input per il miglioramento.
Le scale di valutazione indicate dalla ISO 11098:2003 si possono suddividere in:
Metriche e scale assolute
Esse sono associate ad approcci deduttivi e sono di due tipologie; numeriche (utilizzano scale di
valutazione quantitative che presentino o no il valore centrale neutro e che inducano al voto secondo
l’esperienza scolastica (0-10; 1-10; 1-5; 1-7); e semantiche (come ad esempio
completamente/abbastanza/poco/per niente soddisfatto) che comunque per essere trattate
richiedono di essere tradotte in numeri.
Metriche relative
Si prestano a rilevare scarti tra grandezze e consentono di trattare in modo omogeneo la rilevazione
dei tre stati di soddisfazione dei clienti (soddisfazione, insoddisfazione, delizia).
Le domande vengono ricondotte alle aspettative. La scala relativa è più precisa della scala assoluta,
superando le difficoltà che la scala assoluta ha nel trattare del valore centrale.
Metriche miste
Sono miste le metriche che utilizzano metriche assolute e relative. Un caso di utilizzo di metriche
miste è quello in cui le metriche relative sono usate per la misurazione dello stato base di
soddisfazione, mentre l’intensità di insoddisfazione e delizia è rilevata con una metrica assoluta,
semantica e numerica, con una scala 1-3, 1-4, 1-5.
Considerando le caratteristiche delle scale di misurazioni sopra illustrate congiuntamente alla finalità
conoscitiva del questionario nel momento in cui occorre decidere le scale di misurazione da utilizzare
è necessario prendere in considerazione i punti di forza e di debolezza delle varie scale e
l’atteggiamento da valutare.
In generale per progettare una scala occorre prendere in considerazione vari fattori: dal numero degli
item, al tipo di polarità della scala, se unipolare o bipolare alla modalità di risposta.
In particolare le scale multi-item, sono più valide, precise e attendibili rispetto alle single-item in quanto
queste ultime riescono difficilmente, con una sola domanda, a misurare un atteggiamento. Le scale
multi-item, invece, riescono a prendere in considerazioni molteplici aspetti di atteggiamenti anche
complessi, ed a causa di questa caratteristica hanno bisogno di una controllo di validità e di coerenza
interna.
Prendendo in considerazione i vari tipi di scale multi-item, la scala di Likert, quella più utilizzata grazie
alla sua semplicità, permette una codifica immediata, nonchè la possibilità di sommare i risultati
ottenuti. Questo tipo di scala permette l’applicazione di tecniche per la quantificazione dei dati. Uno
dei punti deboli di tale scala è la unidimensionalità degli atteggiamenti ovvero le diverse affermazioni
devono riferirsi allo stesso concetto da analizzare, ossia gli item devono rilevare la stessa proprietà. Un
altro limite di tale scala consiste nell’equidistanza tra le categorie di risposta cioè si presuppone che la
distanza tra “completamente d’accordo” e “D’accordo” sia uguale a quella che c’è tra “Disaccordo” e
“Completamente disaccordo”.
Soprattutto nel caso in cui il questionario risulta essere complesso e lungo la scala di Likert è
ampiamente preferita in quanto si avranno minori difficoltà a porre le domande e a rispondere.
La scala del differenziale semantico è di facile somministrazione e di elevata flessibilità, in quanto
l’intervistato risponde di istinto ma alle volte non è sempre possibile trovare una coppia di aggettivi
che siano in completa opposizione. Questo tipo di scala viene maggiormente utilizzata per lo studio
della personalità ma richiede comunque molto tempo per la codifica. La Scala di Guttman garantisce
l’ordinamento tra i vari elementi della scala e permette di risolvere il problema dell’unidimensionalità,
purtroppo non sempre gli item selezionati sono rilevanti per l’atteggiamento da valutare e il punteggio
finale che si ottiene resta comunque una variabile di tipo ordinale. Inoltre in questo tipo di scala non è
possibile individuare una misura di coerenza interna degli item, infatti non sempre gli item selezionati
sono rilevanti per l’atteggiamento che si vuole rilevare. La scala di Thurstone, invece, può essere
utilizzata soprattutto come metodo di quantificazione di dati di tipo ordinale, il problema deriva dal
fatto che i risultati sono spesso condizionati dalla scelta degli esperti. E dato le numerose fasi
necessarie per arrivare ad il risultato finale, tale scala risulta essere molto costosa.
Per quanto riguarda le modalità di risposta il numero di modalità che la risposta può assumere varia
da 1 a 10. La risposta a 10 modalità (ovvero 1,2,3…..10) ricorda il sistema di valutazione scolastico ma
è una scala di tipo ordinale. La risposta a sette modalità è stata la prima utilizzata nella scala di Likert
ed avendo un maggior numero di modalità rappresenta meglio il continuum di valutazione. Mentre la
risposta a 5 modalità ha mostrato risultati migliori nella scala di Likert, anche se spesso gli intervistati
si posizionano sulla modalità centrale.
La scelta del tipo di scala nonché della modalità di riposta sarà strettamente correlata alla caratteristica
dell’atteggiamento o del comportamento che si vorrà misurare, la scala di Likert è sicuramente una
delle scale più utilizzate per la semplicità di risposta e di codifica immediata e che consente di ottenere
facilmente i risultati finali, oltre che a ordinare facilmente le categorie di risposta lungo un continuum.
Scale di Misurazione
Multi-item
Scala di Likert
Vantaggi
-sono più valide, più precise e più attendibili
delle sigle item
- prendono in considerazione molteplici
aspetti di atteggiamenti complessi
- semplice da applicare
- codifica immediata
- possibilità di sommare i risultati
- è possibile utilizzare tecniche di
quantificazione dei dati
- è preferibile la modalità con cinque risposte
(invece di 7)
Svantaggi
- necessitano si un controllo di
validità e di coerenza interna
- unidimensionalità degli
atteggiamenti oggetto di indagine
- equidistanza delle categorie
Scala del differenziale
semantico
Scala di Guttman
Scala di Thurstone
- facile da somministrare
- flessibile
- risolve il problema dell’unidimensionalità
della scala
- permette un ordinamento tra i vari elementi
della scala
- utilizzata come metodo di quantificazione
di tipo ordinale
- difficoltà di trovare due aggettivi
opposti
- utilizzati per lo studio della
personalità
- richiedono un elevato tempo per
la codifica
- elevati costi di analisi
- non sempre gli item selezionati
sono rilevanti per l’atteggiamento
da valutare
- non è possibile individuare una
misura di coerenza interna
- molto costosa
- risultati condizionati dalla scelta
degli esperti che scelgono gli 11
“picchetti”
Il presente documento è stato elaborato da:
M.F. Renzi
L. Cappelli
G. Mattia
P. Vicard
R. Merli
R. Guglielmetti
F. Musella
S. Salvucci
F. Filosini
Professore ordinario Università degli studi Roma Tre
Professore ordinario Università di Cassino
Professore a contratto presso l’Università degli studi di
Roma Tre
Professore associato all’Università degli studi di Roma Tre
Ricercatore all’ l’Università degli studi di Roma Tre
Dottoranda all’Università Sapienza di Roma
Dottoranda all’Università degli studi di Roma Tre
Dottoressa in Economia
Dottoressa in Economia