le scale di misurazione - Pubblica amministrazione di qualità
Transcript
le scale di misurazione - Pubblica amministrazione di qualità
RICERCA CONGIUNTA NEL SETTORE DELLA MISURA DELLA SODDISFAZIONE DEGLI UTENTI DEI SITI E DEI SERVIZI ON LINE DELLE AMMINISTRAZIONI E PER LA PREDISPOSIZIONE DI UNO STRUMENTO DI RILEVAZIONE DELLA CUSTOMER SATISFACTION LE SCALE DI MISURAZIONE ACCORDO DI COLLABORAZIONE TRA IL CNIPA E IL DIPARTIMENTO DI SCIENZE AZIENDALI E ECONOMICO-GIURIDICHE DELL’ UNIVERSITÀ DEGLI STUDI ROMA TRE Data consegna 23.04.08 La misurazione dei dati e le tecniche di scaling Premessa Il presente documento ha una duplice finalità: • • proporre una rassegna organica dei sistemi di misurazione e scaling per offrire un quadro sintetico – ma esaustivo – dell’argomento, alla luce dei principali contributi offerti dalla letteratura in materia; fornire degli elementi di inquadramento concettuale e metodologico per fissare i criteri di scelta dei metodi di misurazione e scaling maggiormente appropriati per la Customer Satisfaction. In questo modo, a elementi di carattere descrittivo, vanno ad accostarsi valutazioni critiche e di opportunità nell’utilizzo delle scale per rilevare i giudizi di soddisfazione, in accordo con le tendenze emergenti, sia teoriche, sia di prassi. 1. Il concetto di misurazione Con il termine di misurazione si intende un insieme di regole attraverso le quali è possibile attribuire dei numeri alle caratteristiche del fenomeno osservato, tali caratteristiche che vengono sottoposte a misurazione si definiscono variabili. Con il termine variabile, quindi, ci si riferisce a qualsiasi carattere che variando di livello indica la condizione del fenomeno. E’ possibile distinguere variabili quantitative e qualitative in base al tipo di valori che la caratteristica può assumere. Le variabili quantitative che possono assumere valori in un insieme discreto di numeri reali, si dicono variabili quantitative discrete (ad esempio: il numero di figli nel collettivo delle donne, il numero di stanze nel collettivo delle abitazioni, il voto alla maturità nel collettivo degli studenti). Le variabili quantitative invece che possono assumere qualsiasi valore in un intervallo di numeri reali sono definite variabili quantitative continue (ad esempio: il peso corporeo, la statura, la superficie di un’abitazione, la temperatura). Una variabile è qualitativa se i valori che assume corrispondono a delle etichette o attributi che consentono di assegnare le unità a diverse categorie, e sono dette discrete. La natura di una variabile è importante per poter decidere quale strumento è più idoneo per la scelta della scala di misurazione utile per l’osservazione di un fenomeno. Lo psicofisico Stanley Smith Stevens definisce la misurazione sostenendo : “che la misurazione, nel senso più ampio, consiste nell’attribuzione di numeri a oggetti o eventi seguendo determinate regole. Il fatto che si possano assegnare dei numeri seguendo regole differenti porta a differenti tipi di scala e differenti tipi di misurazione. Il problema diventa quello di rendere esplicite: a) le varie regole per l’assegnazione dei numeri, b) le proprietà matematiche (o la struttura del gruppo) delle scale che ne risultano, e c) le operazioni statistiche applicabili alle misure effettuate su ciascun tipo di scala” (S.S. Stevens, 1946). Scegliere le regole per l’assegnazione dei numeri vuol dire individuare la scala di misura più adatta, ovvero uno strumento di misura di variabili che riguardano la struttura e la natura del fenomeno in analisi. 1.2 Le scale di misurazione La classificazione dei tipi di scale proposta da Stevens negli anni ’40 è stata adottata nelle scienze sociali. Stevens ha operato la distinzione fra le categorie basandosi esclusivamente sulle proprietà logico-formali dei vari tipi di scala. I quattro livelli di misurazione (o scale di classificazione) secondo Stanley Smith Stevens (1951) sono: 1. 2. 3. 4. scala nominale scala ordinale scala a intervalli equivalenti scala a rapporti equivalenti. Le prime due scale rientrano nella categoria delle scale non-metriche, mentre la scala ad intervalli e quella a rapporti equivalenti rientrano nelle scale metriche che vengono utilizzate non solo quando si possono ordinare i soggetti in relazione al fatto che posseggano in misura maggiore o minore quella data caratteristica, ma è possibile esplicitare l’esatta quantità di quella caratteristica. Le scale non-metriche • Scala nominale La scala nominale è il tipo più semplice di misurazione e consiste nel definire una variabile mediante una classificazione in categorie (o classi) non ordinabili che saranno il più omogenee possibili. Essa si basa sulla più semplice proprietà di numerazione, ossia l’identificazione. I numeri in questo tipo di scala hanno come unico scopo quello di individuare e classificare gli oggetti o gli eventi a cui essi sono assegnati, per cui non è possibile stabilire un ordine. Per trasformare una proprietà in variabile, ad ogni modalità che rappresenta lo stato della proprietà, si attribuisce un valore numerico. Le etichette che si decide di attribuire ad ogni categoria sono del tutto arbitrarie. Ad esempio, se si vuole classificare un certo numero di individui a secondo del loro sesso (variabile), si può stabilire di attribuire agli uomini (modalità che può assumere la variabile) il codice 1 e alle donne (l’altra modalità che può assumere la variabile) il codice 2 in modo da identificare e classificare gli individui. L’assegnazione dei codici 1 e 2 è arbitrario (assegnando 2 a uomo e 1 a donna non cambierebbe la misurazione). E’ possibile solo stabilire se considerando se due unità ricadono nella stessa modalità (ad esempio entrambi sono uomini) o sono differenti (se ricadono in modalità diverse): l’unica operazione consentita è stabilire l’uguaglianza o la diversità tra due casi. Le operazioni statistiche possibili sono il calcolo delle frequenze, i diagrammi a barre, le tabelle di contingenza e l’analisi delle corrispondenze. • Scala ordinale La scala ordinale è considerata la più semplice scala “quantitativa”, in cui viene introdotto il concetto di ordine tra le categorie. La scala ordinale infatti non solo consente di classificare la variabile in categorie, ma permette anche di ordinare le categorie in ordine gerarchico a seconda del valore che hanno rispetto alla proprietà considerata. In questo caso gli oggetti sono classificati in ordine crescente o decrescente, in base alla misura più o meno elevata con cui posseggono una determinata caratteristica o proprietà, definita in anticipo. Ad esempio chi si classifica primo in un concorso, si suppone possieda certe qualità in misura maggiore di chi occupa il secondo posto, così come questo ne possiederà in modo più consistente rispetto al terzo e così via. I numeri che vengono associati alle categorie rappresentano soltanto la relazione d’ordine tra le modalità (“superiore a”, “più grande di”). L’impossibilità di definire la distanza tra due valori consecutivi rappresenta il limite maggiore di questa tipologia di scala, infatti essa è possibile applicarla solo nelle ipotesi in cui è valida la proprietà transitiva (se a è più grande di b, b è più grande di c, allora a sarà più grande di c). Le scale metriche • Scala ad intervalli equivalenti La scala ad intervalli equivalenti permette non solo di stabilire una graduatoria rispetto al possesso di una caratteristica, ma anche di individuare l’entità degli intervalli tra un grado e l’altro della scala. Esempi di scale ad intervalli sono la scala centigrada e quella Fahrenheit. Tale scala di misurazione riguarda l’assegnazione arbitraria del punto a partire dal quale le misurazioni vengono effettuare (zero della scala); in questa scala lo zero non identifica l’assenza assoluta della caratteristica misurata. La scala permette di effettuare confronti fra le unità statistiche sulla base di differenze tra i valori della scala (ad esempio la differenza tra una temperatura di 37°C e 38°C è 1°C) ma a causa dell’assenza del punto zero assoluto i rapporti di valore non assumono significato (100°C non è due volte più caldo di 50°C). Le operazioni statistiche consentite su variabili di tipo quantitativo vanno dall’uso di semplici operazioni di rappresentazione, a modelli di analisi più complesse. • Scala di rapporti equivalenti La scala a rapporti equivalenti e la scala ad intervalli differiscono solo per il diverso significato che lo zero possiede nei due tipi di scala: zero relativo (nella scala ad intervalli) e zero assoluto nella scala a rapporti). Nella scala di rapporti il punto zero corrisponde all’assenza della proprietà oggetto di misurazione, per cui è possibile calcolare sia la differenza tra i valori della scala sia sui valori stessi della scala. L’unica arbitrarietà riguarda l’unità di misura che si utilizza, ma qualsiasi unità di misura di scelga lo zero indicherà l’assenza della proprietà. Questo tipo di scala viene utilizzata soprattutto nella misurazione di caratteristiche come età, peso e lunghezza. In particolare qualora la caratteristica oggetto della misurazione sia trasferibile (per esempio il reddito) si parla di scala metrica, viceversa se la variabile misura una grandezze non mobile, si parlerà di scala di quantità (per esempio l’età). 1.1.2 Scale di posizione, Scale metriche e Scale di quantità: la proposta di Ricolfi Ricolfi, con l’obiettivo di ridurre la rappresentazione dei caratteri quantitativi a due solo scale (quella metrica e quella assoluta) si concentra principalmente sulla fase di analisi dei dati piuttosto che sulla definizione a monte delle scale e ritiene che la distinzione tra zero assoluto e zero relativo è tutt’altro che irrilevante. L’autore sostiene che definire uno zero assoluto divide le scale di rapporti in due sottotipi alle quali corrisponde una serie di operazioni statistiche. Secondo la classificazione di Ricolfi due sono le condizioni da soddisfare per classificare le scale: • Condizione di additività: che viene soddisfatta quando la variabile è tale che il valore in un qualsiasi collettivo o aggregato di unità elementari coincide con la somma dei valori delle unità componenti. • Condizione di positività: è soddisfatta quando la variabile è tale che il valore corrispondente sono quote di una grandezza totale. Quindi Ricolfi distingue in: 1. Scale di posizione: ovvero scale ad intervalli equivalenti in cui nessuna delle due condizioni è soddisfatta. Gli stati sulla proprietà sono semplici posizioni in un determinato sistema di riferimento. 2. Scale metriche: dove il punto zero corrisponde ad assenza di proprietà (zero assoluto); sono scale di rapporti in cui è soddisfatta la sola condizione di positività. 3. Scale di quantità: nelle quali il punto zero corrisponde ad assenza di proprietà (zero assoluto); sono scale di rapporti in cui entrambe le condizioni sono soddisfatte: le grandezze sono trasferibili ed interpretabili come l’ammontare di una data proprietà. Le varie unità si distinguono sulla base del quantum posseduto della proprietà. 2. La misurazione degli atteggiamenti L’applicazione più frequente della tecnica delle scale in campo sociale è la misura degli atteggiamenti considerati come un insieme di tendenze e sentimenti, pregiudizi, idee, timori, apprensioni e convinzioni di una persona nei confronti di un particolare argomento. Gli atteggiamenti sono, dunque, parte dei valori sociali, e vengono concepiti come relativi ad un singolo oggetto. La prima definizione di atteggiamento fu data da Gordon Allport il quale considerava l’atteggiamento “uno stato mentale o neurologico di prontezza, organizzata attraverso l’esperienza, che esercita un’influenza direttiva o dinamica sulla risposta. Gli atteggiamenti, in quanto posizioni mentali che tendono a perdurare, influenzano il comportamento di ciascun individuo e proprio per questo motivo, il marketing è orientato, attraverso le sue ricerche, a conoscere il comportamento dei consumatori e, all’occorrenza, influenzarlo. Il motivo fondamentale per cui si misurano gli atteggiamenti è dovuto al fatto che questi contribuiscono a determinare i comportamenti; tuttavia il comportamento non è determinato solo dagli atteggiamenti ma anche da componenti affettive e cognitive (Modello del Comportamento Programmato, I. Aizen), che però risulta più difficile da osservare e interpretare. Le tecniche di scaling si adottano quindi per rilevare atteggiamenti (che empiricamente sono definite come proprietà continue) per le quali non si dispongono di unità di misura; quindi lo scaling è un concetto più ampio rispetto al concetto di misurazione poiché queste tecniche si fondano prevalentemente su un’interpretazione unidimensionale dell’atteggiamento che viene immaginato come un conntinuum. Le tecniche di scaling più comunemente impiegate sono classificate in due famiglie: scale comparative, in cui si attua una comparazione diretta tra uno stimolo e un altro e scale non-comparative (o monadiche), in cui ciascuno stimolo è oggetto di scaling indipendentemente da un altro stimolo analogo; queste ultime scale possono essere continue o categorizzate, a seconda che si esprima una valutazione, rispettivamente, sulla base di variabili continue o divise in categorie ordinate. Nella schema di seguito riportato vengono illustrato le diverse tecniche di scaling. Tecniche di scaling Scale Comparative Scala di Confronto a coppie Scala Ordinate per ranghi Scala a Somma Costante Scala di Likert Scale Non-Comparative Scala Q- Sort Altre procedure Scala del Differenziale Semantico Classificazione Continua Scala di Stapel Scala di Guttman Classificazione Categorizzata Altre scale 2.1.Scale comparative Tra le scale comparative le tecniche più diffuse sono: • scale di confronto a coppie (paired comparison scales) • scale ordinate per ranghi (rank order scales) • scale a somma costante (costant-sum scales) • scale Q-sort (Q-sorting) • Scale di confronto a coppie Nelle scale di confronto a coppie, i soggetti devono scegliere tra due attributi (o tra due oggetti) alla volta secondo un proprio criterio. Questa scala permette di capire quali attributi/oggetti sono più graditi al soggetto, infatti le possibili comparazioni degli n attributi/oggetti sono pari al totale delle combinazioni con ripetizioni prese due alla volta; tali scale, pertanto, si usano con un numero limitato di valutazioni. • Scale ordinate per ranghi Con questa scala, invece, vengono sottoposti ai soggetti diversi attributi/oggetti simultaneamente e viene chiesto loro di confrontarli e ordinarli secondo un proprio criterio per questo motivo viene spesso utilizzata per misurare le preferenze per le marche anche se considerando l’alto numero di combinazioni possibili è difficile da implementare. Quale combinazione preferisce, in ordine decrescente, di marca, gusto e dimensione per un cono gelato? Marca A, gusto B, dimensione C Marca B, gusto A, dimensione C Marca C, gusto B, dimensione B • Scale a somma costante Questo strumento richiede agli intervistati di ripartire un punteggio fisso (solitamente 100) tra due o più caratteristiche, in base all’importanza ad essa attribuita rispettando un criterio che ne rifletta la preferenza relativa. Marca A Caratteristiche abbigliamento Marca B E’ pratico da indossare 20 24 È resistente 10 12 È prodotto in Italia 30 42 Ha un buon rapporto qualità/prezzo 40 32 Totale 100 100 • Scale Q-sort In questo tipo di scala, ancora più complesse,si chiede ai soggetti di accomunare oggetti simili secondo un proprio criterio, sostanzialmente l’individuo mette in pile diverse delle cartelle contenenti affermazioni che sono riferibili a determinati gruppi o categorie (solitamente, per accrescere l’accuratezza dei risultati, vengono scelte dieci o più categorie) distribuite secondo una curva normale. Ad esempio, si categorizzano 100 affermazioni riguardanti per esempio l’immagine di una marca. 3 4 7 10 13 16 13 10 7 4 3 ——|—-|—|—|—|—|—|—|—|—|—|—— Molto favorevole 10 9 8 7 6 5 4 3 2 1 0 Decisamente sfavorevole I numeri 3, 4, 7,…..7, 4, 3 sono i numeri delle affermazioni posizionate in ogni categoria; i numeri al di sotto della linea indicano i valori ad esse assegnate. Ad ogni intervistato vengono chieste le tre affermazioni considerate più favorevoli, a cui verrà assegnato un punteggio pari a dieci (decima categoria), le altre tre caratteristiche meno favorevoli, classificate nell’ultima categoria e così via. 2.2 Scale non comparative L’altra famiglia di tecniche di scaling è costituita dalle scale non-comparative, classificabili secondo due diverse modalità: continue (continuous scaling); e categorizzate (itemized scaling). Nella scale continue, i soggetti valutano l’oggetto di stimolo (per esempio, un prodotto o una marca) piazzando un segno nella posizione scelta a seconda della sua valutazione, su una linea che va da un estremo all’altro della variabile presa in esame. Nelle scale categorizzate, invece, fornisce al soggetto una serie ordinata di categorie che rappresentano gli intervalli di scelta; a ciascuna categoria sono associati dei numeri. I soggetti devono scegliere la categoria che meglio descrive l’oggetto di valutazione. Le scale categorizzate possono essere di due tipi: 1. Scale a modalità unica (Single item scale). Tale scale utilizzano un solo aspetto dell’ oggetto da valutare. Quindi invece di un insieme di domande si preferisce utilizzare una singola domanda. Tra le scale single item vi sono: Scale Semanticamente autonome; Scale a Parziale autonomia semantica; Scale Auto-Ancoranti. 2. Scale a modalità multipla (Multi item scale). Queste tipi di scale mettono insieme un gruppo di risposte, date per valutare un insieme di aspetti dell’oggetto da valutare. Tra le forme più diffuse di scale categoriali a modalità multipla vi sono: • Scala di Likert; • Scala del Differenziale Semantico • • • Scala di Stapel Scala di Guttman Scala di Thurstone • Scala semanticamente autonoma Sono scale dove le domande presentano delle alternative di risposta, che anche se ordinabili, sono poste in modo che la risposta possa essere data senza considerare le altre categorie di risposta, questo perché l’autonomia semantica permette all’intervistato di scegliere la risposta per il suo contenuto senza dover conoscere le alternative di risposta. (Ad esempio la domanda relativa al titolo di studio, dove per rispondere non bisogna conoscere le altre risposte). • Scala a parziale autonomia semantica Sono scale rappresentate da categoria di risposta ordinate con affermazioni del tipo: “assolutamente contrario”, “contrario”, “d’accordo”, “assolutamente d’accordo”, in cui il significato delle categorie di risposte è solo parzialmente autonomo dalle altre. In questo tipo di scale, le risposte non hanno totale autonomia semantica, può accadere che nell’intervistato scatti un meccanismo di comparazione quantitativa (Ad esempio alla domanda “Le piace il servizio di mensa dell’azienda XYZ?” l’intervistato può scegliere tra le seguenti categorie di risposta“Per niente” “Poco” “Abbastanza” “Molto”). • Scale Auto-Ancoranti Nelle scale auto-ancoranti l’intervistato deve rispondere alla domanda ponendo la sua risposta tra due modalità opposte. Un esempio viene illustrato nella tabella sottostante. “Come giudica il suo livello di soddisfazione nei confronti del servizio di accoglienza dell’Hotel XYZ?” Pessima Ottima 1 2 3 4 5 6 7 • Scala di Likert Con la scala di Likert i soggetti devono indicare il grado di accordo o disaccordo con ciascuna d’una serie di affermazioni riguardante l’oggetto della misurazione. Le categorie in genere sono 5 o 7 (che vanno da “Fortemente d’accordo” a “Fortemente in disaccordo”, con il valore centrale neutro). Il punteggio totale viene calcolato sommando i punteggi dati a ciascuna risposta. I questionari che utilizzano la scala di Likert sono in genere facili da completare, sono tipicamente utilizzati per misurare oggetti intangibili. Nella tabella sottostante vengono proposti degli esempi dell’utilizzo di scale di Likert. 1- L’ufficio Postale XYZ offre un servizio rapido. Molto d’accordo D’accordo Né, né In disaccordo Molto in disaccordo Per analizzare i dati ottenuti con l’utilizzo di una scala Likert (come nel caso precedente), si assegna un numero a ciascuna risposta; ad esempio: Molto d’accordo 5 D’accordo Né, né In disaccordo 4 3 2 Molto in disaccordo 1 e si calcolano i risultati: per ciascuna affermazione, si calcola la media tra i soggetti intervistati; e per ciascun intervistato, si calcola la media delle risposte a tutte le affermazioni. Il risultato totale è dato dalla media di tutti gli intervistati su tutte le affermazioni. • Scala del differenziale semantico E’ una scala tipicamente bipolare, in cui i soggetti valutano l’oggetto della misurazione (per esempio, un prodotto) su una scala a 5 o 7 gradi (il cui punto centrale è neutro), legata a ciascun estremo a coppie di aggettivi opposti (come buono/cattivo, di valore/senza valore, forte/ debole, ecc.). La scala del differenziale semantico (come pure quella di Likert) viene trattata come una scala ad intervallo, per cui si possono sommare tra loro le valutazioni ed effettuare calcoli statistici (media, varianza, ecc.). Una descrizione sintetica dell’oggetto sottoposto a valutazione può essere fatta attraverso l’uso dell’analisi aggregata (dove i punteggi individuali sono sommati per ottenere un punteggio complessivo) o l’analisi dei profili (è una rappresentazione grafica e si ottiene congiungendo con una linea tutti i punteggi medi dei rispondenti). • Scala di Stapel E’ una scala unipolare nel senso che le frasi descrittive e gli aggettivi sono presentati separatamente. I valori della scala solitamente vanno da +5 a -5, ed è quindi priva di un punto neutrale. Con tale scala è possibile misurare sia la dimensione sia l’intensità degli atteggiamenti, quindi più l’aggettivo è adatto all’oggetto, più il numero si avvicina al numero positivo e viceversa. Viene usata soprattutto grazie alla sua semplicità nelle interviste telefoniche.Nella tabella successiva viene considerato un sondaggio per la misurazione del grado di soddisfazione di un ufficio postale, in cui i soggetti valutano ciascun aspetto esprimendo un voto positivo o negativo: • Velocità del servizio +5 +4 +3 +2 +1 -1 -2 -3 -4 -5 Orario conveniente +5 +4 +3 +2 +1 -1 -2 -3 -4 -5 Ubicazione comoda +5 +4 +3 +2 +1 -1 -2 -3 -4 -5 Basso tasso d’interesse +5 +4 +3 +2 +1 -1 -2 -3 -4 -5 Scala di Guttman Obiettivo principale della scala di Guttman è di fornire una soluzione al problema dell’unidimensionalità della scala (punto debole della tecnica di Likert). In un primo momento si pongono delle domande su ogni aspetto dell’argomento oggetto della misurazione. Successivamente ad ogni risposta si chiede al soggetto intervistato quanto è convinto della sua dichiarazione, assegnando un punteggio da 4 a 0 a seconda se le risposte sono favorevoli alla domanda. In seguito si calcolano i punteggi dell’intervistato , se le affermazioni sono 5, il punteggio può variare da 20 e 0. I punteggi ottenuti vengono riportati su uno scalogramma, dove vengono rappresentate le curve che individuano la distribuzione degli atteggiamenti (dette curve di intensità). La forma della curva indica la distribuzione degli atteggiamenti, ad esempio nel caso di una parabola questa individua una forte propensione ad atteggiamenti neutrali, al contrario se la curva ha una forma a “V” ciò indica una presenza di atteggiamenti in opposizione. • Scala di Thurstone La scala di Thurstone ha l’obiettivo di misurare un certo atteggiamento attraverso l’utilizzo dei frasi a cui un gruppo di esperti hanno attribuito un certo punteggio. Per l’atteggiamento da valutare vengono individuati circa 120 item. Il gruppo di esperti attribuisce un punteggio a questi item a seconda della loro affinità con l’atteggiamento da misurare e se ne selezionano un numero non inferiore ad 11. L’atteggiamento viene quindi rappresentato come un segmento scandito da 11 “picchetti” che dividono il segmento in dieci intervalli uguali. Ogni “picchetto” segnala una determinata posizione sull’atteggiamento da misurare. Successivamente gli intervistati devono segnalare tutte le affermazioni che considerando più affini all’atteggiamento da valutare. 3. Considerazioni di opportunità nella scelta delle scale per le indagini di customer satisfaction Le scale di valutazione della UNI 11098:2003 La UNI 11098:2003 si intitola,“Linee guida per la rilevazione della soddisfazione del cliente e per la misurazione degli indicatori del relativo processo”. Essa fornisce delle linee guida per la rilevazione della soddisfazione del cliente, la misura dei relativi indicatori di prestazione dell’organizzazione e il relativo processo di audit. Per la determinazione della soddisfazione del cliente non si può, quindi, fare a meno di informazioni provenienti da esso. A questo proposito, la UNI 11098 distingue due modalità di raccolta delle informazioni, una di tipo attivo (interviste e questionari) e l’altra di tipo passivo (informazioni di ritorno dal cliente), indicando i vantaggi e i limiti per ciascuna modalità. Le indagini sulla soddisfazione hanno principalmente due finalità. La prima consiste nel fornire gli elementi per una diagnosi precisa e completa dei fattori che causano insoddisfazione (quando le aspettative sono inattese), soddisfazione (quando le aspettative sono state raggiunte) e delizia (momento in qui le aspettative sono state superate). La seconda è data dalla costruzione di indicatori di prestazione dell’organizzazione, capaci di monitorare l’efficacia delle azioni messe in atto per migliorare la soddisfazione dei clienti, suggerendo nuovi input per il miglioramento. Le scale di valutazione indicate dalla ISO 11098:2003 si possono suddividere in: Metriche e scale assolute Esse sono associate ad approcci deduttivi e sono di due tipologie; numeriche (utilizzano scale di valutazione quantitative che presentino o no il valore centrale neutro e che inducano al voto secondo l’esperienza scolastica (0-10; 1-10; 1-5; 1-7); e semantiche (come ad esempio completamente/abbastanza/poco/per niente soddisfatto) che comunque per essere trattate richiedono di essere tradotte in numeri. Metriche relative Si prestano a rilevare scarti tra grandezze e consentono di trattare in modo omogeneo la rilevazione dei tre stati di soddisfazione dei clienti (soddisfazione, insoddisfazione, delizia). Le domande vengono ricondotte alle aspettative. La scala relativa è più precisa della scala assoluta, superando le difficoltà che la scala assoluta ha nel trattare del valore centrale. Metriche miste Sono miste le metriche che utilizzano metriche assolute e relative. Un caso di utilizzo di metriche miste è quello in cui le metriche relative sono usate per la misurazione dello stato base di soddisfazione, mentre l’intensità di insoddisfazione e delizia è rilevata con una metrica assoluta, semantica e numerica, con una scala 1-3, 1-4, 1-5. Considerando le caratteristiche delle scale di misurazioni sopra illustrate congiuntamente alla finalità conoscitiva del questionario nel momento in cui occorre decidere le scale di misurazione da utilizzare è necessario prendere in considerazione i punti di forza e di debolezza delle varie scale e l’atteggiamento da valutare. In generale per progettare una scala occorre prendere in considerazione vari fattori: dal numero degli item, al tipo di polarità della scala, se unipolare o bipolare alla modalità di risposta. In particolare le scale multi-item, sono più valide, precise e attendibili rispetto alle single-item in quanto queste ultime riescono difficilmente, con una sola domanda, a misurare un atteggiamento. Le scale multi-item, invece, riescono a prendere in considerazioni molteplici aspetti di atteggiamenti anche complessi, ed a causa di questa caratteristica hanno bisogno di una controllo di validità e di coerenza interna. Prendendo in considerazione i vari tipi di scale multi-item, la scala di Likert, quella più utilizzata grazie alla sua semplicità, permette una codifica immediata, nonchè la possibilità di sommare i risultati ottenuti. Questo tipo di scala permette l’applicazione di tecniche per la quantificazione dei dati. Uno dei punti deboli di tale scala è la unidimensionalità degli atteggiamenti ovvero le diverse affermazioni devono riferirsi allo stesso concetto da analizzare, ossia gli item devono rilevare la stessa proprietà. Un altro limite di tale scala consiste nell’equidistanza tra le categorie di risposta cioè si presuppone che la distanza tra “completamente d’accordo” e “D’accordo” sia uguale a quella che c’è tra “Disaccordo” e “Completamente disaccordo”. Soprattutto nel caso in cui il questionario risulta essere complesso e lungo la scala di Likert è ampiamente preferita in quanto si avranno minori difficoltà a porre le domande e a rispondere. La scala del differenziale semantico è di facile somministrazione e di elevata flessibilità, in quanto l’intervistato risponde di istinto ma alle volte non è sempre possibile trovare una coppia di aggettivi che siano in completa opposizione. Questo tipo di scala viene maggiormente utilizzata per lo studio della personalità ma richiede comunque molto tempo per la codifica. La Scala di Guttman garantisce l’ordinamento tra i vari elementi della scala e permette di risolvere il problema dell’unidimensionalità, purtroppo non sempre gli item selezionati sono rilevanti per l’atteggiamento da valutare e il punteggio finale che si ottiene resta comunque una variabile di tipo ordinale. Inoltre in questo tipo di scala non è possibile individuare una misura di coerenza interna degli item, infatti non sempre gli item selezionati sono rilevanti per l’atteggiamento che si vuole rilevare. La scala di Thurstone, invece, può essere utilizzata soprattutto come metodo di quantificazione di dati di tipo ordinale, il problema deriva dal fatto che i risultati sono spesso condizionati dalla scelta degli esperti. E dato le numerose fasi necessarie per arrivare ad il risultato finale, tale scala risulta essere molto costosa. Per quanto riguarda le modalità di risposta il numero di modalità che la risposta può assumere varia da 1 a 10. La risposta a 10 modalità (ovvero 1,2,3…..10) ricorda il sistema di valutazione scolastico ma è una scala di tipo ordinale. La risposta a sette modalità è stata la prima utilizzata nella scala di Likert ed avendo un maggior numero di modalità rappresenta meglio il continuum di valutazione. Mentre la risposta a 5 modalità ha mostrato risultati migliori nella scala di Likert, anche se spesso gli intervistati si posizionano sulla modalità centrale. La scelta del tipo di scala nonché della modalità di riposta sarà strettamente correlata alla caratteristica dell’atteggiamento o del comportamento che si vorrà misurare, la scala di Likert è sicuramente una delle scale più utilizzate per la semplicità di risposta e di codifica immediata e che consente di ottenere facilmente i risultati finali, oltre che a ordinare facilmente le categorie di risposta lungo un continuum. Scale di Misurazione Multi-item Scala di Likert Vantaggi -sono più valide, più precise e più attendibili delle sigle item - prendono in considerazione molteplici aspetti di atteggiamenti complessi - semplice da applicare - codifica immediata - possibilità di sommare i risultati - è possibile utilizzare tecniche di quantificazione dei dati - è preferibile la modalità con cinque risposte (invece di 7) Svantaggi - necessitano si un controllo di validità e di coerenza interna - unidimensionalità degli atteggiamenti oggetto di indagine - equidistanza delle categorie Scala del differenziale semantico Scala di Guttman Scala di Thurstone - facile da somministrare - flessibile - risolve il problema dell’unidimensionalità della scala - permette un ordinamento tra i vari elementi della scala - utilizzata come metodo di quantificazione di tipo ordinale - difficoltà di trovare due aggettivi opposti - utilizzati per lo studio della personalità - richiedono un elevato tempo per la codifica - elevati costi di analisi - non sempre gli item selezionati sono rilevanti per l’atteggiamento da valutare - non è possibile individuare una misura di coerenza interna - molto costosa - risultati condizionati dalla scelta degli esperti che scelgono gli 11 “picchetti” Il presente documento è stato elaborato da: M.F. Renzi L. Cappelli G. Mattia P. Vicard R. Merli R. Guglielmetti F. Musella S. Salvucci F. Filosini Professore ordinario Università degli studi Roma Tre Professore ordinario Università di Cassino Professore a contratto presso l’Università degli studi di Roma Tre Professore associato all’Università degli studi di Roma Tre Ricercatore all’ l’Università degli studi di Roma Tre Dottoranda all’Università Sapienza di Roma Dottoranda all’Università degli studi di Roma Tre Dottoressa in Economia Dottoressa in Economia