Un`indagine di customer satisfaction nei servizi di

Transcript

Un`indagine di customer satisfaction nei servizi di
COP DiSalvo_14-01.qxd:_ 29/05/14 11:11 Page 1
DIPARTIMENTO DI DISCIPLINE MATEMATICHE,
FINANZA MATEMATICA ED ECONOMETRIA
WORKING PAPER N. 14/1
Un’indagine di customer satisfaction
nei servizi di factoring
analizzata mediante il modello
ad equazioni strutturali
con variabili latenti
Angelo Di Salvo
PP DiSalvo_14-01.qxd:_ 29/05/14 11:48 Page 1
Università Cattolica del Sacro Cuore
DIPARTIMENTO DI DISCIPLINE MATEMATICHE,
FINANZA MATEMATICA ED ECONOMETRIA
WORKING PAPER N. 14/1
Un’indagine di customer satisfaction
nei servizi di factoring
analizzata mediante il modello
ad equazioni strutturali
con variabili latenti
Angelo Di Salvo
PP DiSalvo_14-01.qxd:_ 29/05/14 11:48 Page 2
Angelo Di Salvo, Dipartimento di Discipline Matematiche, Finanza
Matematica ed Econometria, Università Cattolica di Milano, Largo Gemelli 1,
20123, Milano, Italy, + 39 02 7234 3723.
[email protected]
www.vitaepensiero.it
All rights reserved. Photocopies for personal use of the reader, not exceeding 15% of
each volume, may be made under the payment of a copying fee to the SIAE, in
accordance with the provisions of the law n. 633 of 22 April 1941 (art. 68, par. 4 and
5). Reproductions which are not intended for personal use may be only made with the
written permission of CLEARedi, Centro Licenze e Autorizzazioni per le
Riproduzioni Editoriali, Corso di Porta Romana n. 108, 20122 Milano, e-mail:
[email protected], web site www.clearedi.org.
Le fotocopie per uso personale del lettore possono essere effettuate nei limiti del15%
di ciascun volume dietro pagamento alla SIAE del compenso previsto dall’art. 68,
commi 4 e 5, della legge 22 aprile 1941 n. 633.
Le fotocopie effettuate per finalità di carattere professionale, economico o
commerciale o comunque per uso diverso da quello personale possono essere
effettuate a seguito di specifica autorizzazione rilasciata da CLEARedi, Centro
Licenze e Autorizzazioni per le Riproduzioni Editoriali, Corso di Porta Romana n.
108, 20122 Milano, e-mail: [email protected], web site www.clearedi.org.
© 2014 Angelo Di Salvo
ISBN 978-88-343-2823-1
Indice
1 – Le analisi di customer satisfaction secondo un approccio quantitativo
7
2 – Aspetti essenziali dei SEM (Structural Equation Modeling)
10
3 – Un case study nell’ambito dei servizi di factoring
21
4 – I risultati del case study
29
APPENDICE: L’indice alfa di Cronbach e i suoi sviluppi
1 – Aspetti concettuali
51
2 – Variabili non osservabili e variabili di misura
57
3 – L’alfa di Cronbach
64
4 – Una riformulazione dell’alfa di Cronbach
76
5 – L’alfa di Cronbach nell’ambito dei SEM
79
6 – Il coefficiente rho di Dillon – Goldstein
83
Bibliografia
90
3
4
Abstract
Assuming that the prime aim of customer satisfaction management is to
increase the so called overall satisfaction, econometric causal models
provide an effective framework to duly tackle the issue. Within this
context Structural Equation Modeling (SEM) proves to be an
appropriate analytic setting to handle the problem together with Partial
Least Squares – Path Modeling (PLS – PM) approach. In the paper the
operational counterpart of econometric model building is portrayed via
a customer survey, carried out in 2012 by a factoring company by
means of a questionnaire tailored to possibly use the responses in a
SEM model specification. Statistical inference and goodness of fit
evaluation are performed on the model as well as quantitative analyses
aimed at setting priorities within the actions which should increase the
overall satisfaction. A technical appendix devoted to Cronbach’s alpha
index completes the paper.
A tutorial – like approach to the topics mentioned above has been
generally preferred though at some expense of formal refinements, in
order to address the research outcomes to an audience of possibly non –
academic customer satisfaction operators.
Keywords: path diagram, latent variables, manifest variables, path
coefficients, Customer Satisfaction Index (CSI), measure variables,
reliability index, homogeneity indicators.
5
6
1 – Le analisi di customer satisfaction secondo un approccio
quantitativo
Quando un’azienda decide di occuparsi di customer satisfaction, è
implicito l’obiettivo di migliorare la soddisfazione complessiva (overall
satisfaction) dei clienti. Si tratta anzi di un obiettivo che il più delle
volte un’azienda dichiara esplicitamente; ma anche se così non fosse,
questo obiettivo è logicamente intrinseco all’attività di customer
satisfaction.
Un altro obiettivo implicato nella scelta di “fare customer satisfaction”
è quello di misurare la soddisfazione complessiva dei propri clienti, per
la semplice ragione che non si può accertare se la soddisfazione sia poca
o molta, se non pervenendo a misurarla. A sua volta questo obiettivo
richiede di individuare e misurare le singole cause specifiche di
soddisfazione o, dualmente, di insoddisfazione. L’idea è molto
semplice: se un’azienda riesce a stabilire quali sono le leve sulle quali
può agire per migliorare la soddisfazione complessiva dei propri clienti
(perlopiù rimuovendo la cause di insoddisfazione), è sulla buona strada
per raggiungere questo obiettivo, che abbiamo appena detto essere
quello fondamentale dell’attività di customer satisfaction.
Occorre limitarsi a dire che si è sulla buona strada perché – come si può
bene immaginare – non è tutto così facile; vi sono infatti diversi aspetti
da affrontare. Tra i più importanti e impegnativi vi è quello per esempio
di una analisi costi – benefici: se per un’azienda emergesse che una
7
causa di insoddisfazione è – poniamo – l’inadeguata preparazione del
proprio personale (o di una sua parte), bisognerebbe valutare quanto
costerebbe una riqualificazione dello stesso, così da stabilire in quanto
tempo i benefici economici di un miglioramento della soddisfazione
potranno coprire o, più propriamente, ammortizzare l’investimento per
tale riqualificazione.
Questi argomenti, qui fugacemente accennati, sono ovviamente molto
vasti e complessi. Almeno altrettanto vasto e complesso è poi il tema
della soddisfazione dell’individuo, visto come consumatore, come
cliente o come utente, a seconda del contesto. Si tratta peraltro di un
tema in cui entrano “prepotentemente” sia le scienze psicologiche, sia il
marketing, come dimostra la sterminata letteratura – oscillante tra questi
due campi – accumulatasi da almeno mezzo secolo fino ad oggi.
Va da sè quindi che in questa sede dobbiamo circoscrivere
drasticamente l’ambito e le metodologie di analisi su cui intendiamo
focalizzarci, fissando l’attenzione sui modelli causali econometrico –
statistici, che indagano le relazioni tra più variabili, alcune aventi il
ruolo di causa, altre il ruolo di effetto. Il fatto che queste relazioni siano
formalizzate in opportune equazioni fa sì che tali modelli, una volta
risolti, conducano ad una quantificazione dell’importanza delle cause. Il
responsabile dell’attività di customer satisfaction è così in grado non
soltanto di individuare le specifiche cause di insoddisfazione dei propri
clienti, ma anche di ordinarle per importanza. È ovviamente
un’indicazione preziosissima! Parlando, nel titolo del paragrafo 1, di
approccio quantitativo, intendiamo riferirci al fatto che un’analisi
effettuata mediante un modello ha tra le sue prerogative quella, appunto,
8
di assegnare un peso alle specifiche cause di insoddisfazione. Tra i vari
modelli causali che si potrebbero impiegare, quello che appare più
appropriato nel presente contesto, e del quale ci occuperemo, è noto
come modello ad equazioni strutturali con variabili latenti. La sua
spiccata attitudine allo scopo si fonda sul fatto di riuscire a trattare
anche fenomeni che, per la loro astrattezza e le loro numerose
sfaccettature e sfumature, non sono misurabili direttamente: la
soddisfazione dei clienti ne è un chiaro esempio, date le componenti
psicologiche accennate poco fa.
Il paragrafo 2 è quindi dedicato ad un compendio di questo genere di
modelli, per i quali inoltre esponiamo in estrema sintesi l’approccio di
risoluzione noto con l’acronimo PLS – PM (Partial Least Squares –
Path Modeling).
Nel paragrafo 3 presentiamo il case study, costituito da un’indagine di
customer satisfaction svolta da una società di factoring.
Infine nel paragrafo 4 ci soffermiamo sui risultati ottenuti nella fase di
stima del modello appositamente specificato per il case study,
distinguendo tra i risultati di natura prettamente statistica e quelli di
natura “operativa”.
9
2 – Aspetti essenziali dei SEM (Structural Equation Modeling)
2.1 Descrizione dei modelli
L’acronimo SEM (Structural Equation Modeling o, talvolta, Structural
Equation Models), che abbiamo impiegato nel titolo di questo paragrafo
e impiegheremo pure da qui in avanti, è quello ricorrente in letteratura
per intendere i modelli ad equazioni strutturali con variabili latenti;
espressione certamente un po’ prolissa, seppure più eloquente, come
emergerà tra poco.1
Per spiegare “come sono fatti” i SEM, la modalità che in questo
contesto ci sembra più idonea, in quanto non presuppone nel Lettore
specifiche competenze matematico – statistiche, è quella di ricorrere al
path diagram, che è peraltro un mezzo assai diffuso nella letteratura dei
SEM, giacché fornisce una raffigurazione immediata ed efficace
(sicuramente più di quanto lo sarebbe l’insieme di equazioni) della rete
di relazioni (o catena causale) tra le variabili. Nel seguito viene
proposto il path diagram per un SEM di 4 equazioni, quante sono cioè
le variabili endogene 1, 2, 3, 4 :
1 Recentemente è stato proposto anche l’acronimo SEM – LV, ove LV sta per Latent
Variables (cfr. Kenett R.S., Salini S. pag. 309). Per quanto costituisca una eccezione, in
Pagano A, Vittadini G. pag. 231 si fa uso anche dell’acronimo italiano MES (Modelli a
Equazioni Strutturali).
10
1
x1
y2
x2
y3
y4
y5
1
x3
2
x4
3
y6
2
y7
x5
x6
4
y8
x7
Con riferimento a questo esempio ci soffermiamo ora sugli aspetti che
ci sembrano più salienti per inquadrare i SEM, senza pretesa di
esaustività.
Le lettere dell’alfabeto greco sono per consuetudine impiegate per
indicare le variabili latenti, mentre per le variabili manifeste si
impiegano le lettere dell’alfabeto latino. Oltre a ciò si conviene di
raffigurare in un cerchio le prime, e in un quadrato le seconde. La
distinzione tra variabili latenti (talvolta dette anche costrutti latenti
o semplicemente costrutti) e variabili manifeste (talvolta dette
anche indicatori) è un punto fondamentale dei SEM. Riprendendo
ciò che si è accennato alla fine del paragrafo 1, una variabile latente
ha la funzione di rappresentare analiticamente “qualcosa che esiste
11
realmente”, ma di cui risulta difficile, se non impossibile, disporre
di una osservazione quantitativa diretta. Gli esempi che si
potrebbero fare sono numerosissimi; ci limitiamo a citare la
generosità, l’intraprendenza, l’indifferenza. Si noterà che questi
esempi fanno riferimento ad individui, presi singolarmente o
collettivamente; ma si possono fare esempi riferiti altresì ad
aziende, organismi, istituzioni o persino ad oggetti. Si pensi alla
modernità, alla bellezza, alla lungimiranza, e così via. Sono tutti
“fenomeni” che evidentemente sfuggono ad una quantificazione
diretta. Per poterli comunque trattare in un modello econometrico –
statistico, che ovviamente va alimentato con dati quantitativi, si usa
allora l’espediente di associare ad ogni variabile latente due o più
variabili manifeste2, che fungono da misuratori indiretti: il termine
alternativo, indicatori, appare così molto eloquente.
Le relazioni tra le variabili latenti costituiscono il modello
strutturale; esso viene anche detto modello interno (inner model).
Se si adotta un path diagram come quello qui raffigurato, le
relazioni in parola si collocano nella parte centrale. Le variabili
manifeste, collegate a ciascuna delle variabili latenti, costituiscono
il modello di misurazione, che viene anche detto modello esterno
2
Una variabile latente potrebbe essere collegata anche ad una sola variabile manifesta.
In questo caso tuttavia si intuisce subito che si tratta di una variabile latente fittizia, nel
senso che formalmente ha il ruolo di variabile latente, ma nella sostanza opera come una
variabile osservabile direttamente. Ciò consente ai modelli SEM un’apprezzabile
flessibilità di specificazione.
12
(outer model):3 si noti come qui tutte le variabili manifeste siano
posizionate ai bordi destro e sinistro del path diagram. Appare
evidente come questa dualità, dovuta all’introduzione di variabili
latenti collegate ad almeno altrettante variabili manifeste, sia il
connotato cruciale dei SEM, connotato che è ben evidenziato nella
loro anzidetta denominazione estesa: modelli ad equazioni
strutturali con variabili latenti.
La direzione delle frecce va dalla variabile considerata causa alla
variabile considerata effetto. Questo vale sicuramente nell’ambito
del modello strutturale, mentre la nozione di causalità nell’ambito
del modello di misurazione presenta degli aspetti più complessi e
talora controversi, sui quali non ci soffermeremo. Ciò che si può
dire senza tema di smentita è che quando le frecce vanno dalla
variabile latente ai rispettivi indicatori, il modello di misurazione
segue lo schema riflessivo (nel senso che il costrutto latente si
riflette nei suoi indicatori); in caso contrario si ha lo schema
formativo (nel senso che gli indicatori vanno a costituire o a
formare il costrutto latente).
Abbiamo adottato la convenzione di incolonnare a sinistra tutte le
variabili latenti endogene, indicate con la lettera greca , e a destra
tutte le variabili latenti esogene, indicate con la lettera greca . In
3
Qualche autore preferisce parlare di sottomodello strutturale (o interno) e di
sottomodello di misurazione (o esterno), impiegando il termine modello per riferirsi ai
due sottomodelli congiuntamente presi.
13
letteratura ci sono peraltro raffigurazioni che non seguono questo
schema, e in tal caso il ruolo di variabile endogena o esogena è
deducibile soltanto dalla presenza delle frecce e dalla rispettiva
direzione; perciò la convenzione qui adottata agevola la lettura del
path diagram. Va detto poi che l’utilizzo di queste due lettere
greche e delle lettere latine associate (cioè x associata a , e y
associata a ) è quello ricorrente nell’approccio LISREL (acronimo
di Linear Structural RELationship), che costituisce il metodo di
risoluzione dei SEM proposto per primo. Con altri metodi la
notazione da preferire può risultare diversa (e lo sarà nel nostro
caso, quando descriveremo l’approccio PLS – PM).
Naturalmente da questa raffigurazione non si può evincere la forma
funzionale delle relazioni, ma ciò non è una grave lacuna in quanto
quasi sempre si opera con equazioni lineari, sia per il modello
strutturale, sia per il modello di misurazione.
Entrambi i modelli (o – come si è detto in nota 3 – sottomodelli)
prevedono dei termini erratici, con funzione compensativa per la
completezza delle equazioni. Ancorché i termini erratici vengano
inseriti nel path diagram, qui abbiamo preferito ometterli per non
appesantire troppo la raffigurazione.
Per quanto riguarda le ipotesi dei SEM, una è certamente quella di
relazioni lineari, a cui si è già accennato. Altre ipotesi, in particolare
quelle concernenti i termini erratici, sono di norma collegate ai
14
procedimenti di risoluzione che si intende adottare. Non volendo
addentrarci in argomenti troppo tecnici, rinviamo il Lettore alla
bibliografia.
2.2 Risoluzione del modello secondo l’approccio PLS – PM
Si può dire che fino ad oggi gli approcci (o metodi) affermatisi in
letteratura per la risoluzione dei SEM siano tre: in ordine cronologico, il
primo è noto con l’acronimo LISREL, cui abbiamo brevemente già
accennato; il secondo e il terzo sono noti con gli acronimi
rispettivamente PLS – PM (Partial Least Squares – Path Modeling)4 e
GSCA (Generalized Structured Component Analysis). Il caso di studio
che presenteremo nel prossimo paragrafo è stato risolto col secondo
metodo, sul quale pertanto ci soffermiamo ora.
Anzitutto è bene presentare quali sono i termini incogniti che
l’approccio PLS – PM si propone di stimare. Seppure qui, per
semplicità, non abbiamo specificato formalmente le equazioni, è
naturale che – stabilita la loro forma funzionale, lineare nella fattispecie
– i parametri siano incogniti. Abbiamo quindi parametri (detti path
coefficients) che compaiono nelle equazioni del modello strutturale, ed
altri (detti factor loadings) che compaiono nel modello di misurazione.
Non vi sono ulteriori parametri incogniti da stimare, in quanto
l’approccio in parola non formula ipotesi probabilistiche sui termini di
4
Recentemente è apparso anche l’acronimo PLS – SEM: cfr. Hair et al.
15
errore. Stiamo cioè trattando un modello stocastico – stante la presenza
di termini di errore di natura casuale – nel quale non ci si pronuncia
circa la funzione di distribuzione degli errori,5 ciò che introdurrebbe
almeno un parametro incognito riferito, appunto, a tale funzione.
Nel metodo PLS – PM, a differenza di quanto accade col metodo
LISREL, 6 oltre agli anzidetti parametri sono oggetto di stima anche le
variabili latenti.
A questo punto si tratta di vedere come si effettua la stima dei parametri
e delle variabili latenti. Essendo un argomento squisitamente tecnico, ci
limitiamo in questa sede ai tratti essenziali, che esponiamo in termini
discorsivi.
Il così detto “algoritmo”, messo a punto nell’approccio PLS – PM,
consta di un reiterato alternarsi di due tipi di stima delle variabili latenti:
la stima esterna e la stima interna, così denominate per il fatto di
riferirsi rispettivamente, appunto, al modello esterno e al modello
interno. Si tratta di un processo iterativo che in pratica giunge sempre a
convergenza, per cui si ottengono risultati (ossia valori di stima) che,
pur non potendosi qualificare come “ottimali” – in quanto non
scaturiscono da un dichiarato obiettivo di ottimizzazione matematica –,
5 Nella letteratura si precisa infatti che l’approccio PLS – PM è distribution free. Questo
viene presentato come un punto forte di PLS – PM, in contrapposizione all’approccio
LISREL che postula che i dati campionari provengano da una popolazione distribuita
secondo una multi – normale, il che non è sempre verosimile.
6 Invero anche in LISREL esiste la possibilità di stimare le variabili latenti, ma ciò
costituisce una sorta di escamotage. L’approccio LISREL punta infatti a stimare
soltanto i parametri incogniti.
16
lo sono “di fatto”, poiché il raggiungimento della convergenza implica
che le stime non sono ulteriormente migliorabili.
La stima esterna di una qualsiasi variabile latente si ottiene come
combinazione lineare delle rispettive variabili manifeste. La stima
interna è data pur essa da una combinazione lineare, che però chiama
in causa le variabili latenti collegate a quella oggetto di stima,
conformemente alla specificazione del modello interno: in tal senso la
letteratura introduce l’espressione adjacent variables.
Quanto ai coefficienti di tali combinazioni lineari, per la stima esterna
essi sono dati dai factor loadings, i quali risultano da regressioni lineari
applicate alle equazioni del modello esterno.7 Per la stima interna
invece i coefficienti sono dati dalle correlazioni lineari calcolate tra la
variabile latente oggetto di stima e le variabili latenti a questa
collegate.8
Grazie al reiterato alternarsi tra i due tipi di stima (ad iniziare da quella
esterna), si può asserire che la stima di ogni variabile latente “cerca un
equilibrio” tra le equazioni del modello di misurazione e le equazioni
del modello strutturale.
Tutto questo presuppone però di avviare l’algoritmo: il Lettore avrà
notato che i calcoli sopra descritti sono eseguibili se si dispone in
qualche modo di una prima stima esterna. A tale scopo si fa ricorso ad
7 In verità la denominazione factor loadings, mutuata dall’analisi dei fattori, fa
riferimento alla stima dei parametri effettuata sulle equazioni del modello esterno; nel
momento in cui tali stime vengono usate come pesi della combinazione lineare che
definisce una variabile latente, esse vengono denominate pesi esterni (outer weights). In
Hair et al. si incontra invece la denominazione outer loadings.
8 Qui si fa riferimento allo schema fattoriale. Peraltro gli altri due schemi proposti in
letteratura, quello del centroide e quello strutturale, non differiscono molto da questo.
17
una combinazione lineare delle variabili manifeste con pesi (o
coefficienti) arbitrari.
La convergenza a cui si accennava viene verificata con riferimento ai
pesi della combinazione lineare per la stima esterna: imponendo che lo
scarto (in valore assoluto) tra il peso ottenuto all’ultima iterazione e il
peso ottenuto all’iterazione precedente non superi una soglia prefissata
(sufficientemente piccola), si assume che l’algoritmo abbia raggiunto la
convergenza.9
A questo punto tutte le variabili latenti sono state stimate nel miglior
modo possibile, ai sensi del criterio sopra enunciato, e si può pertanto
passare alla stima dei path coefficients, cioè i parametri delle equazioni
lineari definite nel modello strutturale. A tale stima si perviene
mediante regressioni lineari, tante quante sono le variabili endogene.
A riepilogare quanto sopra esposto può giovare il seguente schema, nel
quale la notazione va così letta:
zij indica la i – esima variabile manifesta associata alla j – esima
variabile latente, j
10
, per la quale sono kj le variabili manifeste
9 Si è parlato di uno scarto che (in valore assoluto) deve risultare sufficientemente
piccolo, intendendo evidentemente lo scarto più grande tra tutti quelli a disposizione,
che saranno in numero pari a quello di tutte le variabili manifeste presenti nel modello.
È semplice verificare peraltro che la condizione di convergenza può essere formulata
indifferentemente in termini di scarto tra stima esterna e stima interna: cfr. Esposito
Vinzi V. et al. pag. 145.
10
La scelta di una lettera greca diversa da e da , che sono quelle impiegate in
precedenza con riferimento a variabili latenti rispettivamente endogene ed esogene, è
giustificata dal fatto che nell’approccio PLS – PM l’algoritmo di risoluzione, fintanto
che non giunge a convergenza, non richiede di distinguere tra variabili endogene ed
esogene; pertanto si preferisce indicare le variabili latenti con un’unica lettera. Per lo
18
disponibili; l’asterisco posto in apice indica che si opera con la
variabile standardizzata; si usa Z (lettera maiuscola anziché
minuscola) per indicare la matrice costituita da almeno due variabili
manifeste;
wij indica il peso utilizzato nella combinazione lineare che definisce
la stima esterna;
(r;I) e (r;E) posti in apice indicano rispettivamente la stima interna e
la stima esterna calcolate alla r – esima iterazione;
Aj indica l’insieme della variabili latenti adiacenti a j ;
Cor{. ;.} e Cov{. ;.} indicano rispettivamente il coefficiente di
correlazione lineare e la covarianza tra le due variabili argomento;
indica il valore soglia per stabilire la raggiunta convergenza
dell’algoritmo.
stesso motivo per le variabili manifeste si è utilizzata unicamente la lettera z in luogo di
x e y.
19
Pesi della stima
esterna iniziale:
w ij(r=0) = arbitrari
kj
¦w
S (jE;0)
(0) *
ij ij
z
i 1
PRIMO PASSO
SECONDO PASSO
Stima esterna
S (jE;r)
Stima interna (con schema fattoriale)
S (jI ;r)
kj
¦wij(r) zij*
¦Cor^S
( E;r1)
j
`
;Si(E;r1) Si(E;r1)
iAj
i 1
per r = 1; 2; 3; ... fino a convergenza.
Il contatore r si incrementa di 1
per r = 1; 2; 3; ... fino a
convergenza
TERZO PASSO
Aggiustamento dei pesi
(rispettivamente con regressione semplice e
multipla)
^
Cov S (jI ;r) ; zij*
wij(r)
w(r)
NO
`
(Z' Z)1 Z'S (I ;r)
^
`
max wij(r) wij(r1) H
per r =2; 3; ...
SI’
• Calcolo della stima esterna
definitiva
• Calcolo dei parametri
di regressione (path coefficients)
per tutte le equazioni
del modello interno
20
3 – Un case study nell’ambito dei servizi di factoring
Nel 2012 una banca italiana di grandi dimensioni e con un’articolata
presenza all’estero, che non ha dato l’autorizzazione ad essere qui
menzionata, ha condotto l’indagine di customer satisfaction che ora
presentiamo.
Come è noto (ed è comunque facile comprendere), le analisi di
customer satisfaction richiedono di raccogliere i giudizi direttamente
dai clienti. Infatti, per quanto un’azienda (segnatamente un’azienda di
servizi) possa disporre di un ben attrezzato sistema informativo di
marketing riguardo ai propri clienti, l’ingrediente fondamentale in
questo campo è dato dalle valutazioni espresse dai clienti in un preciso
momento, per ottenere le quali non si può che ricorrere ad un’apposita
indagine. Ciò comporta di sottoporre un questionario ad un campione di
clienti, che nel caso in esame erano costituiti dai fruitori dei servizi di
factoring erogati da una specifica società, interamente partecipata dalla
capogruppo bancaria. Rammentiamo che il factoring è una forma di
finanziamento, rivolta alle imprese, che in sostanza consente loro di
incassare anticipatamente e con determinate garanzie i crediti
commerciali.
Il questionario in parola è stato gestito con la tecnica CAWI (Computer
Assisted Web Interviewing), ed ha permesso di raccogliere 285
interviste valide e complete. Esso era articolato in due categorie di
domande:
21
domande così dette di profilazione del cliente, miranti cioè a
raccogliere qualche sua connotazione; quando ci si rivolge a degli
individui, solitamente simili domande riguardano l’età, il sesso, il
livello di studi, e così via. In questo caso invece, poiché ci si
rivolgeva a delle imprese, le domande di profilazione si riferivano
ad informazioni come la frequenza con la quale il cliente in un
recente periodo ha interagito con la società di factoring, o come la
conoscenza o meno di un determinato servizio offerto dalla società;
domande con le quali l’intervistato esprimeva il proprio giudizio di
soddisfazione mediante una scala di valori, in questo caso graduati
da 1 a 10.
Ovviamente le domande della seconda categoria (che, conformandoci
alla consuetudine, in seguito denominiamo talvolta item) erano quelle
più numerose, e le relative risposte costituivano l’input del modello,
sulle cui finalità ci siamo soffermati nel paragrafo 1, cioè in estrema
sintesi: misurare la soddisfazione complessiva e individuarne le
determinanti.
Possiamo vedere a questo punto il path diagram limitatamente al
modello strutturale:
22
soddisfazione
capacità
gestore
qualità
servizio
efficienza
portale
fedeltà
convenienza
economica
immagine
della società
Dal path diagram si evince agevolmente che si tratta di un modello
ricorsivo con 5 variabili latenti esogene e 2 variabili latenti endogene,
tra le quali SODDISFAZIONE ha necessariamente il ruolo centrale:
essa va intesa come soddisfazione complessiva (overall satisfaction),
argomento che nei suoi tratti essenziali abbiamo già delineato nel
paragrafo 1.
Passiamo ora a dare una descrizione di tutti gli altri costrutti presenti nel
path diagram.
23
CAPACITÀ GESTORE
Questa variabile latente intende raccogliere il giudizio dei clienti sulla
misura in cui il loro gestore viene percepito come una figura che “sa
fare il suo mestiere”, in ciò includendo non soltanto la competenza ed
esperienza professionale, ma anche la disponibilità, la proattività, ed
altri aspetti che in qualche modo denotano una capacità professionale.
A questo costrutto sono state associate 7 variabili manifeste,
corrispondenti ad altrettante domande (ovvero item) con le quali
l’intervistato esprime il suo grado di accordo con determinate
affermazioni riferite al suo gestore, come per esempio:
fornisce informazioni complete ed esaurienti
comprende le nostre esigenze
sa risolvere problemi e difficoltà
QUALITÀ SERVIZIO
Con questa etichetta si denomina la variabile latente riguardante i
principali aspetti delle prestazioni che la società di factoring eroga ai
suoi clienti. Il giudizio richiesto prescinde dall’operato del gestore,
trattandosi di compiti demandati a varie strutture centrali; tale giudizio
concerne per esempio:
l’adeguatezza del plafond di credito accordato
i tempi di attesa di erogazione degli anticipi
la continua attività di monitoraggio / aggiornamento nella
valutazione dei debitori
In tutto sono state messe a punto 6 variabili manifeste.
24
EFFICIENZA DEL PORTALE “INFOCENTER”
La Società mette a disposizione dei propri clienti una pagina web nella
quale, previa autenticazione ed altre misure di sicurezza, essi possono
caricare le presentazioni di crediti commerciali, come pure interrogare
la propria posizione e gestire buona parte dell’operatività corrente. Era
quindi importante raccogliere il giudizio dei clienti su questo strumento
di lavoro, a loro noto come “portale infocenter”. Sono stati sottoposti a
valutazione diversi aspetti, che hanno originato 7 variabili manifeste, di
cui diamo qualche esempio (anche qui per ogni affermazione
l’intervistato esprime il proprio grado di accordo):
l’accessibilità al sito è facile e veloce
la ricezione della reportistica avviene con la periodicità richiesta
il supporto on line e/o il numero verde è efficace
CONVENIENZA ECONOMICA
Evidentemente non si poteva trascurare l’argomento dei prezzi. La
denominazione di questa variabile latente chiama in causa più
precisamente la convenienza, in quanto si è cercato di ottenere
dall’intervistato un giudizio in termini relativi, che cioè non fosse
circoscritto ad una valutazione pura e semplice del prezzo del servizio
di factoring. Le variabili manifeste a supporto di questo costrutto
puntano quindi ad una valutazione da parte del cliente sui seguenti tre
punti:
trasparenza delle condizioni economiche
tasso applicato alle anticipazioni in linea con il mercato
commissioni in linea con la qualità del prodotto offerto
25
IMMAGINE DELLA SOCIETÀ
Secondo diverse ricerche a cavallo tra marketing e psicologia, la
soddisfazione di un cliente è influenzata significativamente dalla
reputazione dell’azienda. Un’azienda che riesce a trasmettere ai propri
clienti un’immagine positiva di sè stessa, in qualche modo li predispone
a sentirsi soddisfatti e/o a rimanere fedeli all’azienda stessa.11 A causa
dell’elevata astrattezza e complessità di questa variabile latente – così
sfuggente che a volte viene etichettata come immagine, a volte come
reputazione, a volte come marchio –, non è semplice mettere a punto
delle variabili manifeste a suo supporto. Nel caso in esame gli item del
questionario richiamano diversi “versanti”, tutti comunque costituenti
qualcosa di encomiabile per la società di factoring. L’intervistato era
chiamato ad esprimere il proprio grado di accordo o vicinanza sulle
seguenti affermazioni, nelle quali il soggetto è la società di factoring:
È un partner strategico che sostiene la crescita delle aziende
Ha una vocazione internazionale
È conosciuta come azienda leader di mercato
L’appartenenza della Società al Gruppo X rappresenta un valore
aggiunto
È attenta ai principi / valori etici
11 Il Lettore avrà notato che nel path diagram precedente si ipotizza che l’IMMAGINE
sia una causa soltanto della FEDELTÀ, mentre ora, parlando di una predisposizione “a
sentirsi soddisfatti e/o a rimanere fedeli all’azienda”, si asserisce che l’IMMAGINE
avrebbe un effetto su entrambi i costrutti. In verità il modello ECSI, che introdurremo
tra poco, postula un nesso causale dell’IMMAGINE proprio su entrambi; tuttavia nella
ricerca in esame è stata fatta la scelta anzidetta per ragioni che qui sarebbe dispendioso
esporre.
26
FEDELTÀ
È soprattutto per le aziende erogatrici di servizi che si può parlare di
clienti fedeli; non è un caso che il cliente di norma sottoscrive un
contratto con l’azienda, cioè qualcosa di vincolante. Nell’ambito delle
analisi di customer satisfaction la fedeltà viene intesa in senso non tanto
retrospettivo, quanto prospettivo. Nel primo caso la fedeltà sarebbe un
dato oggettivo (di norma presente negli archivi informatici delle
aziende), costituito dalla durata del rapporto tra cliente e azienda. Nel
secondo caso invece la fedeltà diventa un costrutto latente, perché sta
nelle intenzioni della persona, nel suo atteggiamento. Le variabili
manifeste associate al costrutto sono le due seguenti:
Se un competitor Le proponesse un’offerta vantaggiosa a livello
economico, pensa che cambierebbe azienda di factoring?
Ad un’azienda con cui vi sono buoni rapporti o ad un parente /
amico crede che Lei consiglierebbe di rivolgersi a X?
L’intervistato risponde con un punteggio che va da 1 (per certamente
no), a 10 (per certamente sì).
L’ultima variabile latente è SODDISFAZIONE, per la quale ci
limitiamo ora ad esplicitare le variabili manifeste associate:
Come valuta complessivamente la Sua soddisfazione per i
servizi di X ?
In che misura X corrisponde alle Sue aspettative come società
erogatrice di servizi di factoring?
27
Riguardo a queste due ultime variabili latenti, è opportuno osservare
che nell’ambito delle analisi di customer satisfaction svolte con modelli
SEM sono ben noti gli acronimi ACSI (American Customer Satisfaction
Index) e ECSI (European Customer Satisfaction Index): si tratta di due
modelli SEM (peraltro abbastanza simili tra loro) nei quali sia le
variabili latenti, sia la catena causale intercorrente tra le variabili stesse,
sia le variabili manifeste sono state individuate o definite in modo tale
che ne risulti un modello tendenzialmente applicabile a qualsiasi
azienda di servizi. Il vantaggio che ne deriverebbe è quello di rendere
perfettamente confrontabile tra un’azienda e l’altra l’indice di
soddisfazione ricavato dal modello. Tuttavia l’asserita estesa (o persino
universale) applicabilità non sempre trova riscontro nella pratica, sicché
spesso si preferisce mantenere dell’ACSI o dell’ECSI soltanto quella
parte che si reputa adattarsi meglio alla specifica realtà. Ora, i due
costrutti anzidetti (SODDISFAZIONE e FEDELTÀ) sono previsti
nell’ACSI e nell’ECSI, e – come è facile comprendere – sono quelli che
calzano bene anche per una società di factoring, per cui nella
specificazione del modello sono stati mantenuti. Tuttavia, per una serie
di valutazioni che sarebbe dispendioso descrivere in questa sede, le
variabili manifeste associate non corrispondono interamente a quelle
stabilite nei due modelli paradigmatici.
Non solo: per il costrutto FEDELTÀ lo schema formativo è risultato più
“performante” dello schema riflessivo, che è quello previsto sia in
ACSI, sia in ECSI, e che è stato adottato per tutti gli altri costrutti.
Riprenderemo questo punto nel sottoparagrafo 4.1, dedicato alla
descrizione degli indici di bontà del modello.
28
4 – I risultati del case study
Per quanto l’esecuzione dei calcoli richiesti dall’algoritmo prima
descritto non sia sofisticata sotto l’aspetto matematico, la presenza di un
processo iterativo rende praticamente indispensabile il ricorso ad un
software. È stato quindi impiegato il pacchetto statistico XLSTAT,
implementato con l’opzione PLS – PM. Questo ausilio informatico offre
un’ampia scelta sia di opzioni di calcolo, sia di output ottenibili, oltre ad
avere la prerogativa di essere una componente aggiuntiva di Excel, ciò
che garantisce un’estrema facilità d’uso.
Poiché la descrizione del pacchetto statistico esula dai nostri obiettivi,
passiamo a presentare i risultati ottenuti dal modello rivolgendo
l’attenzione in primo luogo agli indici e, più in generale, agli
“strumenti” finalizzati a quantificare la così detta bontà del modello (al
riguardo si parla pure di convalida del modello); in secondo luogo ci
soffermeremo sull’analisi dei valori stimati per i parametri e per le
variabili latenti. Si tratta di risultati di natura molto diversa, che nel
primo caso si rivolgono tipicamente al “responsabile statistico”
dell’indagine, mentre nel secondo caso si rivolgono piuttosto a colui che
si potrebbe dire il committente dell’indagine o comunque ad un
manager della struttura di customer satisfaction. Affronteremo queste
analisi in due distinti sottoparagrafi.
29
4.1 Gli indici di bontà
Come si è visto nel sottoparagrafo 2.2, la risoluzione secondo
l’approccio PLS – PM non attua una ottimizzazione diretta a tutto il
modello simultaneamente, bensì agisce in modo alternato sul modello
strutturale e sul modello di misurazione; da qui discende peraltro il
primo termine (partial) dell’acronimo PLS: le regressioni (quindi il
criterio dei minimi quadrati) sono infatti applicate sulle due singole
parti del modello (ovvero sui due sottomodelli, v. nota 3). Si comprende
pertanto che, se si vuole misurare la bontà del modello, non si può
ricorrere ad un solo indice, ma si devono effettuare diverse “misurazioni
parziali”.
Ciò premesso, iniziamo fissando l’attenzione sugli indici alfa di
Cronbach e rho di Dillon – Goldstein. In appendice ne diamo
un’esposizione approfondita, alla quale rinviamo il Lettore interessato,
limitandoci qui ad un accenno agli aspetti operativi.
Ambedue gli indici forniscono una misura, compresa tra 0 e 1, di ciò
che in letteratura viene denominato omogeneità di un blocco di variabili
manifeste collegate ad una variabile latente secondo lo schema
riflessivo. Come illustriamo al paragrafo 5 dell’appendice, se gli
indicatori di una variabile latente risultano omogenei, si può dire che
quella variabile latente è unidimensionale; omogeneità degli indicatori e
unidimensionalità di un costrutto sono cioè due facce della stessa
medaglia.
30
Atteso quanto sopra, è opportuno verificare che gli indici in parola
forniscano un valore soddisfacente, in pratica pari almeno a 0,7 (ma non
oltre 0,9 secondo Hair J.F. et al. pag. 102). Se così non fosse,
bisognerebbe intervenire sugli stessi. In linea di massima si tratterà di
rinunciare a qualcuno di essi, possibilmente sostituendolo con un altro.
Non si può escludere tra i rimedi quello di passare da uno schema
riflessivo ad uno schema formativo. Ciò può risultare opportuno
specialmente con valori di questi indici molto bassi.
Nella fattispecie l’alfa di Cronbach risulta compreso per tutte le
variabili manifeste tra 0,889 (per il costrutto IMMAGINE DELLA
SOCIETÀ) e 0,963 (per il costrutto SODDISFAZIONE). Risultati
analoghi sono stati registrati per il rho di Dillon – Goldstein. Soltanto
per il costrutto FEDELTÀ l’alfa è risultato molto più basso (0,528), e il
rho moderatamente più basso (0,809). In effetti la domanda:
“Se un competitor Le proponesse un’offerta vantaggiosa a livello
economico, pensa che cambierebbe azienda di factoring?”
(domanda che in letteratura viene etichettata come la domanda di
tolleranza ad un aumento di prezzo) costituisce in un certo senso un
“banco di prova” per il cliente, e in ogni caso si va a toccare un punto
nevralgico. Si può dire che ne sia una conferma il fatto che su questa
domanda il punteggio medio non soltanto si posiziona al livello più
basso di tutti (pari a 5,355 contro un 7,666 medio di tutti i restanti
punteggi medi), ma anche presenta una elevata dispersione (elevata
sempre rispetto agli altri item). Tra l’altro è presumibile che questa
31
domanda faccia scattare nell’intervistato un “meccanismo di difesa”,
ossia: sebbene ciò non sia affatto nelle intenzioni della Società, a volte
un cliente teme che la Società possa approfittare di un elevato punteggio
per attuare un aumento di prezzo.12
Con l’obiettivo di ottenere un risultato complessivamente migliore, si è
presa in considerazione la seguente modifica:
dei due indicatori assegnati al costrutto FEDELTÀ, quello costituito
dall’item etichettato per consuetudine come passaparola13 è stato
spostato al costrutto SODDISFAZIONE, che viene così misurato da
tre indicatori;
pertanto a misurare la FEDELTÀ rimane soltanto l’indicatore che
prima abbiamo sintetizzato come tolleranza ad un aumento di
prezzo; per variabili latenti collegate ad una sola variabile manifesta
non ha più senso calcolare né l’indice alfa, né l’indice rho.
Questa modifica non è stata tuttavia attuata dopo avere constatato che
ambedue gli indici in parola hanno subìto un calo (seppure irrisorio) per
il costrutto SODDISFAZIONE, e soprattutto ne è conseguito un
sensibile peggioramento degli indici di bontà del modello strutturale
(argomento sul quale ci soffermeremo tra poco).14
12 Per di più la Società non potrebbe comportarsi così perché si assume l’obbligo di non
fornire i dati del questionario alle proprie strutture commerciali.
13
Nella letteratura di customer satisfaction con modelli SEM la domanda passaparola è
considerata un indicatore della soddisfazione complessiva.
14 Questo ci offre lo spunto per evidenziare come nell’approccio PLS – PM tutto sia
strettamente connesso, per cui un intervento qualsiasi sulla specificazione può avere
ripercussioni molto estese sulle stime del modello.
32
Riepilogando: gli elevati valori di alfa di Cronbach e di rho di Dillon –
Goldstein hanno dimostrato la validità degli indicatori associati (con
schema riflessivo) alle rispettive variabili latenti, tranne che per
FEDELTÀ, per la quale – dopo avere provato senza buon esito una
ricomposizione delle variabili manifeste – si è adottato lo schema
formativo.
Passiamo ora ad esaminare la bontà del modello di misurazione.
Lo strumento di misura della performance in questo ambito è dato
dall’indice di comunalità, per gli aspetti metodologici del quale
rinviamo alla letteratura. Questo indice, mutuato dall’analisi fattoriale,
varia tra 0 e 1, e fa riferimento ad ogni equazione del modello di
misurazione. Il path diagram del sottoparagrafo 2.1 evidenzia che, nello
schema riflessivo,15 ad ogni variabile latente corrispondono due o più
equazioni del modello esterno; pertanto si hanno altrettanti indici di
comunalità, che vengono sintetizzati in uno solo, risultante dalla loro
media aritmetica semplice. Solitamente poi è interessante un’ulteriore
sintesi, costituita dalla media aritmetica ponderata degli indici di
comunalità precedenti, ove i pesi sono dati dal numero di variabili
manifeste associate ad ogni variabile latente.
15
Occorre precisare che ove il modello di misurazione segua lo schema formativo, gli
strumenti per valutare la bontà sarebbero diversi da quelli che stiamo qui trattando. Al
riguardo Hair et al. pag. 119 avvertono infatti: “Many researchers incorrectly use
reflective measurement model evaluation criteria to assess the quality of formative
measures in PLS – SEM”.
33
Ecco i valori di questo indice per le rispettive variabili latenti (ad
esclusione di FEDELTÀ, per la quale si è adottato lo schema
formativo):
CAPACITÀ GESTORE
0,791
QUALITÀ SERVIZIO
0,654
EFFICIENZA DEL PORTALE “INFOCENTER”
0,723
CONVENIENZA ECONOMICA
0,838
IMMAGINE DELLA SOCIETÀ
0,694
SODDISFAZIONE
0,964
Per esperienza su questo genere di ricerche, possiamo dire che si tratta
di valori assai soddisfacenti, la cui media ponderata – calcolata come
appena spiegato – risulta 0,748. Può giovare avvertire il Lettore che
qualche autore, come per esempio Hair J.F. et al. pag. 103, Huber et al.
pag. 35, introduce a questo riguardo l’indice AVE (Average Variance
Extracted), che è semplicemente un’altra denominazione della
comunalità media di un costrutto. Nella pubblicazione di Hair et al. pag.
103 si afferma che:
an AVE value of 0.50 or higher indicates that, on average, the construct
explains more than half of the variance of its indicators.
Avendo presente il contesto in cui gli autori anzidetti inseriscono questa
affermazione, possiamo dire che essa equivale a ritenere auspicabile un
valore dell’indice AVE pari almeno a 0,5. Pertanto anche teoricamente
il risultato (medio ponderato) di 0,748 appare apprezzabile.
34
Infine si tenga conto che, se le variabili manifeste e la variabile latente
(stimata) vengono standardizzate, i singoli indici di comunalità vengono
a coincidere, per cose note, con i rispettivi factor loadings elevati al
quadrato. Pertanto anziché enunciare che sono desiderabili indici di
comunalità maggiori o uguali a 0,5, si può enunciare che sono
desiderabili factor loadings maggiori o uguali a 0,7 (o per precisione
maggiori o uguali a 0,708).
Per amore di completezza dobbiamo infine aggiungere che la letteratura
non sembra ancora (almeno per quanto ci consta) avere raggiunto una
terminologia in questo ambito sufficientemente chiara e condivisa.
Talvolta accade infatti che l’indice AVE venga presentato come un
indice volto a misurare la convergent validity (cfr. Hair J.F. et al. pag.
100 e pag. 102; cfr. Huber F. et al. pag. 35 16), che è una nozione molto
simile a quella di internal consistency,17 a sua volta valutata mediante
l’alfa di Cronbach.
Appare più chiaramente definito invece il concetto di discriminant
validity, col quale si fa riferimento al fatto che ogni costrutto latente
16
La “durchschnittlich erfasste Varianz” corrisponde all’indice AVE, e viene qualificata
idonea zur Beurteilung der Konvergenzvalidität (= per la valutazione della convergent
validity).
17
Citiamo da Hair J.F. et al. :
pag. 102: “Convergent validity is the extent to which a measure correlates
positively with alternative measures of the same construct”.
pag. 101: “The traditional criterion for internal consistency is Cronbach’s alpha,
which provides an estimate of the reliability based on the intercorrelations of the
observed indicator variables”.
Alla luce del testo che abbiamo sottolineato, che differenza ci sarebbe tra convergent
validity e internal consistency? Su questi argomenti ci soffermiamo più ampiamente
nell’appendice.
35
dovrebbe essere misurato da indicatori – per così dire – “dedicati”.
Questo garantirebbe che i vari costrutti hanno ciascuno una propria
individualità o, in altri termini, che sono effettivamente ben differenziati
non soltanto sotto l’aspetto teorico (così come descritto nel modello
strutturale), bensì anche sotto l’aspetto “pratico”, che si esplicita nel
modello di misurazione. Se, come caso limite, uno stesso blocco di
variabili manifeste fosse a supporto (sempre in uno schema riflessivo)
di due variabili latenti, ciò vorrebbe dire che nel modello strutturale tali
variabili latenti non riescono a svolgere “ruoli” diversi (così come
vorrebbe invece la specificazione del modello strutturale), in quanto non
sono misurate con indicatori appropriati.
Per quantificare la discriminant validity ci si avvale del criterio di
Fornell – Larcker18. Come si spiega in letteratura (cfr. Huber et al. pag.
36 e in particolare Hair et al. pag.105), questo criterio richiede di
confrontare per ciascuna variabile latente (escluse, come si è già
avvertito, quelle cui è associato lo schema formativo) il rispettivo indice
di comunalità medio con il quadrato dei coefficienti di correlazione tra
la stessa variabile latente e tutte le altre. Questo confronto è agevolato
dalla seguente tabella, ove sulla diagonale principale abbiamo (in
grassetto) le comunalità medie (le stesse grandezze viste prima), mentre
negli altri incroci abbiamo le correlazioni anzidette, elevate al quadrato:
18 Un altro criterio, concettualmente non molto differente, è quello che esamina i cross
loadings delle variabili manifeste.
36
CAPACITA’
GESTORE
QUALITA’
SERVIZIO
EFFIC.
PORTALE
CONVEN.
ECONOM
IMMAGINE
SODDISF.
CAPACITA’
GESTORE
0,791
QUALITA’
SERVIZIO
EFFIC.
PORTALE
CONVEN.
ECONOM.
0,471
0,654
0,213
0,205
0,723
0,371
0,443
0,269
0,838
0,354
0,540
0,418
0,602
0,207
0,232
0,538
0,604
IMMAGINE SODDISF.
0,694
0,602
0,964
Per spiegarci meglio circa la lettura di questa tabella, consideriamo ad
esempio la variabile latente QUALITÀ DEL SERVIZIO: per ragioni
sulle quali ora sorvoliamo, si ha discriminanza tra questa variabile e le
restanti cinque, se la comunalità media risulta più grande di tutte le
correlazioni al quadrato tra QUALITÀ DEL SERVIZIO e le restanti
cinque variabili latenti. Con questa stessa logica si effettuano gli altri
confronti, mediante i quali pertanto si può solo stabilire se la
discriminanza c’è o non c’è, senza poterla quantificare esattamente. È
chiaro però che, eseguendo questo confronto, ci si può fare un’idea di
quanto sia netto lo “stacco” tra una comunalità e tutti gli altri valori, il
che fornisce anche un’idea di quanto sia spiccata la discriminanza.
Osservando i valori in tabella, si può dire che la situazione sia
soddisfacente.
Passiamo ora ad esaminare la bontà del modello strutturale.
Per ragioni di sintesi presentiamo il redundancy index tralasciandone gli
aspetti metodologici. Si tratta di un indice basato essenzialmente sulla
37
bontà di una regressione, e pertanto va calcolato per ogni variabile
latente endogena; è noto infatti che ad ognuna di esse corrisponde
un’equazione del modello strutturale, e per ogni equazione si effettua
una regressione al fine di stimare i coefficienti, i quali – come si è detto
a proposito della risoluzione in generale dei modelli PLS – PM –
vengono solitamente denominati path coefficient. Nel caso di studio in
esame abbiamo i due seguenti indici:
FEDELTÀ
0,428
SODDISFAZIONE
0,732
Per valutare questi risultati va tenuto presente che pure il redundancy
index assume valori compresi tra 0 e 1. Ci pare interessante osservare
inoltre che la diversa ripartizione delle variabili manifeste tra i due
costrutti FEDELTÀ e SODDISFAZIONE, che abbiamo descritta poco
sopra, si è rivelata sconsigliabile alla luce dei poco soddisfacenti valori
proprio di questo indice, valori che sono risultati pari a:
FEDELTÀ
0,154
SODDISFAZIONE
0,670
Infine, un indice che viene solitamente presentato nell’ambito
dell’approccio PLS – PM è il GoF, acronimo di Goodness of Fit.
Sebbene, come si è accennato all’inizio di questo sottoparagrafo, non
sia disponibile un indice che misuri complessivamente l’adattamento
del modello ai dati, nulla vieta di cercare una sintesi della bontà del
38
modello esterno e della bontà del modello interno. Risponde appunto a
questa finalità il GoF, che deriva dalla media geometrica tra l’indice di
comunalità (medio ponderato, come sopra spiegato) e il coefficiente di
determinazione (anch’esso medio) riferito alle regressioni calcolate
dopo la convergenza dell’algoritmo. Questo indice può essere calcolato
come indice assoluto o come indice relativo (nel senso di normalizzato,
con campo di variazione tra 0 e 1). Nel nostro caso di studio si sono
ottenuti rispettivamente i valori 0,736 e 0,981.
Dobbiamo però avvertire che Hair J.F. et al. pag. 185 hanno sollevato
una ferma critica circa l’idoneità del GoF a costituire un indice for
validating the PLS model globally. Un giudizio di merito da parte nostra
su tale critica esula dagli obiettivi di questo lavoro.
***
Fin qui ci siamo occupati di indici di bontà in senso stretto, cioè
riconducibili concettualmente ad un opportuno confronto tra i dati
campionari e le stime fornite dal modello. Ora vogliamo ricomprendere
tra gli indici di bontà ciò che più esattamente costituisce una
valutazione della così detta significatività delle stime. Tale valutazione
si rende necessaria per il fatto che le stime risentono della presenza di
termini erratici nella specificazione del modello, donde l’opportunità di
stabilire in che misura la casualità pregiudichi la significatività (ora
nella sua accezione corrente) dei risultati.
In tale ambito un test che abitualmente si effettua è quello della
significatività dei coefficienti di regressione, nella fattispecie i già
menzionati path coefficients. Come è noto, questo test si avvale della
39
distribuzione di probabilità t di Student. Operativamente, per valori di
questa statistica campionaria uguali o superiori (in valore assoluto) a
1,96, i coefficienti di regressione si considerano significativi (ad un
livello di confidenza del 95%).19 I dati campionari a disposizione nella
nostra indagine hanno dato i seguenti valori di t per i parametri dei
regressori nel modello avente SODDISFAZIONE come variabile
dipendente:
CAPACITÀ GESTORE
6,309
QUALITÀ SERVIZIO
7,348
EFFICIENZA DEL PORTALE “INFOCENTER”
0,169
CONVENIENZA ECONOMICA
9,187
Per la regressione avente FEDELTÀ come variabile dipendente si è
ottenuto quanto segue:
SODDISFAZIONE
13,399
IMMAGINE SOCIETÀ
3,992
Dunque, tutti i path coefficients, con l’eccezione di quello riferito a
EFFICIENZA DEL PORTALE, risultano nettamente significativi. Si
può ritenere pure quest’ultimo (pari a 0,169) significativo, purché si
abbassi il livello di confidenza dal 95 al 90% circa.
19 Qui (come pure tra poco) facciamo riferimento in verità ai valori della distribuzione
Normale standardizzata, in quanto è noto che l’andamento di questa funzione viene di
fatto a sovrapporsi all’andamento della t di Student già a partire da una numerosità
campionaria di 30 unità. Rammentiamo che nel nostro caso di studio abbiamo 285 unità.
40
Va tenuto presente che questo test di significatività presuppone che i
termini erratici siano distribuiti secondo una funzione di probabilità
Normale, mentre una prerogativa dell’approccio PLS – PM è quella di
effettuare tutte le stime senza necessità di ipotizzare una specifica
funzione di probabilità per gli errori delle equazioni del modello.
Tuttavia è noto in Statistica che il test all’oggetto in sostanza è
correttamente eseguibile anche quando non si possa assumere la
normalità degli errori, purché le osservazioni campionarie siano
sufficientemente numerose. Nella fattispecie 285 casi costituiscono una
dimensione campionaria adeguata per l’esecuzione del test.
Volendo tuttavia cautelarsi ulteriormente, si è fatto ricorso alla
procedura bootstrap, che costituisce una opzione di calcolo attivabile
nel già menzionato pacchetto statistico XLSTAT. In termini molto
generali, si può affermare che con la procedura bootstrap diviene
possibile applicare i consueti strumenti di inferenza anche qualora la
distribuzione di probabilità della variabile campionaria sia imprecisata.
Nel contesto di un modello SEM risolto secondo il metodo PLS – PM,
l’applicazione dell’anzidetta procedura consiste nell’effettuare un
elevato numero di ricampionamenti, 20 estratti dal campione originario
con reinserimento, al fine di calcolare la stima di tutti i parametri per
ciascuno dei ricampionamenti. L’insieme delle stime così ottenute per
ogni parametro costituisce la rispettiva distribuzione bootstrap, che –
sotto appropriate condizioni – rappresenta una buona approssimazione
della “vera” distribuzione dello stimatore. A questo punto diviene
20
Hair et al pag. 132 suggeriscono un numero di campioni bootstrap dell’ordine di
5.000.
41
ancora possibile avvalersi della funzione t di Student, sia per eseguire lo
stesso test di significatività accennato prima, sia per calcolare
l’intervallo di confidenza per la stima di un parametro. In entrambi i
casi dalla distribuzione bootstrap viene ricavato lo standard error, che
indichiamo con *(w), ove – adottando la notazione diffusa in letteratura
– l’asterisco indica che si è fatto ricorso alla procedura bootstrap,
mentre in pedice si specifica il parametro oggetto di stima (in questo
caso un generico peso esterno, ma si potrebbe fare riferimento anche ad
un parametro del modello strutturale). Per il test di significatività
mediante t di Student si utilizza quindi il rapporto:
t
w
*
V (w
)
;
per calcolare invece un intervallo di confidenza intorno al generico
parametro w, ci si avvale della formula seguente:
w r z1D / 2V (*w )
essendo z1D / 2 il valore della Normale standardizzata21 corrispondente
ad una probabilità di errore pari ad . Come è noto dalla Statistica,
qualora l’intervallo di confidenza includesse il valore zero, ciò
equivarrebbe all’esito di ipotesi nulla accettata nel test di significatività
visto sopra. Dato quindi che i due strumenti di inferenza servono
sostanzialmente al medesimo scopo, ci limitiamo a presentare gli
intervalli di confidenza al 95% con riferimento alla stima dei pesi
esterni. In tale ambito poiché tutte queste stime risultano significative,
ci sembra superfluo esporre i risultati integralmente; a scopo
21
Vale qui ciò che si è già osservato nella nota 19.
42
esemplificativo presentiamo soltanto i risultati riferiti ai 7 pesi esterni
stimati per la variabile latente CAPACITÀ DEL GESTORE:
limite
limite
inferiore
superiore
w
0,07035
0,10011
0,08373
0,07453
0,09766
0,08506
0,05776
0,07875
0,06707
0,07006
0,08798
0,07762
0,07294
0,09612
0,08286
0,05614
0,07736
0,06594
0,07124
0,09223
0,07990
Come si è già accennato, le elaborazioni appena esposte possono
riguardare qualsiasi parametro oggetto di stima. Se rivolgiamo
l’attenzione ai path coefficients, troviamo conferma di quanto emerso in
precedenza, cioè che tutti questi coefficienti risultano significativi, con
l’eccezione di quello associato a EFFICIENZA DEL PORTALE, il cui
intervallo di confidenza al 95% va da – 0,06976 a + 0,08355.
4.2 I risultati operativi
Come si è anticipato all’inizio del paragrafo 4, il responsabile di una
struttura di customer satisfaction rivolgerà la sua attenzione soprattutto
a ciò che conveniamo di denominare risultati operativi dell’indagine:
43
intendiamo principalmente un indice di soddisfazione complessiva e
una quantificazione delle sue cause.
Si comprenderà facilmente come nella letteratura di customer
satisfaction vi sia dovizia di studi intorno agli indici di soddisfazione.
Qui tralasciamo del tutto questo pur stimolante argomento, poiché
l’impiego dei modelli SEM risolti con l’approccio PLS – PM porta con
sè un’unica definizione di indice, peraltro assai semplice e integrata nel
contesto: dato infatti che il costrutto SODDISFAZIONE è oggetto di
stima, per ogni unità statistica campionata si ha un valore stimato (che
tipicamente viene denominato punteggio), sicché la media aritmetica
semplice di tutti questi valori assume il ruolo di indice in via del tutto
naturale.
Rammentando che nel sottoparagrafo 2.2 abbiamo spiegato che si
perviene alla stima esterna di una variabile latente mediante una
combinazione lineare dei rispettivi indicatori, ove i pesi (così detti outer
weights) sono quelli ottenuti alla convergenza dell’algoritmo, si tratta
ora di applicare tale semplice procedimento per la variabile latente
SODDISFAZIONE.
Per ottenere però un risultato che sia esplicativo, anziché una
combinazione lineare conviene adottare una media ponderata degli
indicatori, fermi restando gli anzidetti pesi.22 Ciò che intendiamo dire
apparirà subito chiaro osservando la seguente formula:
22 A volte in letteratura non si chiama in causa la media ponderata, bensì si afferma che i
pesi della combinazione lineare vanno normalizzati. Ad esempio per due soli pesi si
effettua la normalizzazione calcolando w1 / (w1 + w2) e w2 / (w1 + w2); è chiaro che si
perviene così al medesimo risultato che stiamo per ottenere mediante la (1).
44
S SAT ;i
(1)
w1 z1;i w2 z 2;i
w1 w2
Nella (1) abbiamo indicato:
con SAT;i la stima (o punteggio) della variabile latente riferita alla i
– esima unità statistica (cioè all’i – esimo intervistato);
con z1;i e z2;i le variabili manifeste a supporto (rammentiamo che
sono infatti due);
con w1 e w2 i pesi della media ponderata.
Chiaramente se ci si limitasse al computo indicato al numeratore della
(1), si avrebbero grandezze poco eloquenti, in quanto non più espresse
nella scala adottata nel questionario. Una sintesi di questi valori per tutti
gli elementi del campione (ovvero per tutti i rispondenti, 285 nel nostro
case study, ma in generale n ) può essere banalmente la media
aritmetica semplice; si giunge in tal modo al CSI (Customer Satisfaction
Index):
(2)
CSI
1 n
¦ S SAT ;i
ni1
A volte il CSI viene presentato diversamente sotto l’aspetto formale, ma
non sostanziale:
(3)
CSI
w1 z1 w2 z 2
w1 w2
ove la soprallineatura indica che si tratta del valore medio (sugli n
rispondenti) della rispettiva variabile manifesta. Si verifica facilmente
che la (2) e la (3) forniscono il medesimo risultato. Si tenga presente poi
che vale sempre il presupposto che i pesi siano positivi, il che tende a
45
verificarsi più facilmente con lo schema riflessivo che non con quello
formativo.
Si osservi che in questo stesso modo si può calcolare un indice (o
comunque un punteggio medio) per qualsiasi altro costrutto, per
esempio un indice di fedeltà: sarebbe evidentemente un valore
perfettamente confrontabile con quello dell’indice di soddisfazione.
Secondo una prassi piuttosto consolidata tuttavia l’indice di
soddisfazione viene espresso portandolo su una scala da 0 a 100. Ne
discende il vantaggio di poter confrontare gli indici di soddisfazione
riferiti a diverse indagini, a prescindere dalla scala dei giudizi
originaria, quella cioè utilizzata nel questionario. A tale scopo si utilizza
la formula che consente di passare da una scala a un’altra mantenendo
l’equidistanza tra i valori:
N
(4)
Vmin '
G
(U U min )
ove:
U è il valore da trasformare, portandolo cioè dalla scala
originaria ad una nuova scala di valori, in cui assume il valore indicato
con N ;
Umin è il valore minimo23 nella scala originaria e Vmin il minimo
nella nuova scala;
= Vmax – Vmin ; = Umax – Umin .
23 Si intende il valore minimo potenziale, non quello effettivamente riscontrato; così
pure per il valore massimo. Ciò che conta è infatti l’estensione della scala, a prescindere
che poi i valori estremi risultino utilizzati o meno.
46
Ponendo che la scala originaria sia quella da 1 a 10, la (4) diventa:
La
100
(U 1) .
9
N
(5)
trasformazione
ai
sensi
della
(4)
può
essere
applicata
indifferentemente “a monte”, cioè sugli n punteggi (dei quali poi si
calcolerà l’indice come media aritmetica), oppure “a valle”, cioè
direttamente sull’indice (come media aritmetica degli n punteggi). Nel
primo caso si applica dapprima la (5):
100
(S SAT ;i 1)
9
( 0 100 )
S SAT
;i
a cui segue, in base alla (2):
CSI ( 0 100 )
1 n ( 0 100 )
¦ S SAT ;i .
ni1
Nel secondo caso, avendo prima applicato la (2) o la (3), si calcola il
CSI mediante la (5):
CSI ( 0100 )
100
(CSI 1) .
9
Atteso quanto sopra, nell’indagine in esame è risultato
CSI(0 – 100) = 74,5.
***
Veniamo ora alla quantificazione delle cause di soddisfazione. Si
rammenta che i path coefficients, introdotti nel paragrafo 2, sono i
parametri delle equazioni lineari che informano il modello strutturale,
nel quale sono specificate le relazioni causali tra i costrutti latenti.
Questi parametri, una volta stimati, quantificano dunque la forza delle
rispettive relazioni causali. Siccome tutti i costrutti sono misurati nella
47
medesima scala (nella fattispecie da 1 a 10), i path coefficients associati
a variabili latenti che producono il loro effetto su una medesima
variabile latente sono correttamente confrontabili tra loro, e vengono
così ad esprimere l’importanza della rispettiva variabile latente.
Il responsabile della funzione di customer satisfaction rivolgerà quindi
la propria attenzione in particolare ai path coefficients delle variabili che
sono causa del costrutto SODDISFAZIONE. Ecco quindi tali risultati
nel case study in esame:
CAPACITÀ GESTORE
0,268
QUALITÀ SERVIZIO
0,329
EFFICIENZA DEL PORTALE “INFOCENTER”
0,006
CONVENIENZA ECONOMICA
0,392
Dunque la CONVENIENZA ECONOMICA è ciò che ha più
importanza nel determinare la soddisfazione dei clienti, mentre la
minore importanza è attribuita all’EFFICIENZA DEL PORTALE.
Un’analisi più corretta tuttavia si ha osservando l’abbinamento dei path
coefficients coi punteggi medi delle rispettive variabili latenti; abbiamo
già accennato infatti che la (2) o la (3) si possono utilizzare per
calcolare non soltanto il CSI, bensì il punteggio medio di qualsiasi altra
variabile latente. Per mirare ad un miglioramento della soddisfazione
complessiva, bisogna infatti tenere presente sia come sono graduate le
determinanti (potremmo anche parlare di un livello di impatto sulla
soddisfazione), sia come sono graduati i corrispondenti “livelli di
48
giudizio”, costituiti, appunto, dall’anzidetto punteggio medio, che ora
presentiamo:
CAPACITÀ GESTORE
76,70
QUALITÀ SERVIZIO
74,52
EFFICIENZA DEL PORTALE “INFOCENTER”
79,52
CONVENIENZA ECONOMICA
66,60
A questo punto appare efficace dare una rappresentazione grafica dei
dati all’oggetto:
49
La suddivisione del piano cartesiano in quattro quadranti aiuta a
compiere l’analisi. La linea di demarcazione tiene conto del campo di
variazione (cioè valore massimo meno valore minimo). Nel nostro caso:
per i path coefficients: 0,006 + (0,392 – 0,006) / 2 = 0,199
per i punteggi medi dei costrutti: 66,6 + (79,52 – 66,6) / 2 = 73,06
Ci sembra che non occorra soffermarsi sul criterio, del tutto evidente,
che ha portato a graduare le priorità di intervento per conseguire un
miglioramento della soddisfazione complessiva. Peraltro le indicazioni
emerse osservando inizialmente soltanto i path coefficients di
CONVENIENZA ECONOMICA e di EFFICIENZA DEL PORTALE,
appaiono ora rafforzate (ma sarebbe potuto accadere anche il contrario),
visto che proprio a questi costrutti risulta associato il punteggio medio
rispettivamente più basso e più alto. Volendo poi ordinare per priorità
anche i due costrutti situati nello stesso quadrante, si applicherà lo
stesso criterio di prima, per cui agire sulla QUALITÀ DEL SERVIZIO
risulta più importante che agire sulla CAPACITÀ DEL GESTORE.
Infine può essere opportuno ritornare brevemente sull’EFFICIENZA
DEL PORTALE, per osservare che la sua collocazione nel precedente
grafico (ma in particolare la sua importanza estremamente bassa) non
deve indurre a pensare che la Società possa trascurare questo servizio.
Infatti, come emerge in alcune specifiche ricerche di customer
satisfaction, a volte certe componenti di un prodotto complesso (per
esempio un’automobile) o di un articolato servizio (come, appunto, il
factoring) non generano un elevato contributo alla soddisfazione,
semplicemente perché il cliente dà per scontato che esse siano presenti;
50
ma proprio per questo motivo, l’impatto sulla soddisfazione sarebbe
“drammatico”, se il cliente che ha acquistato il prodotto o servizio non
trovasse più quelle componenti.
L’analisi dei risultati operativi potrebbe certamente estendersi ad altri
aspetti; quelli qui sopra descritti ci sembra che già diano comunque
alcuni utili spunti sui quali innestare una proficua attività di customer
satisfaction.
APPENDICE
L’indice alfa di Cronbach e i suoi sviluppi
1 – Aspetti concettuali
Nelle Scienze sociali e in Psicometria l’alfa di Cronbach può essere
considerato un indice (o coefficiente) assai “popolare”, non soltanto
perché esso fu proposto già nel 1951, ma anche perché se non altro una
sua menzione è pressoché immancabile pure nella recentissima
letteratura, e nei pacchetti statistici continua ad essere assai diffuso. Ciò
nonostante manca ancora, almeno per quanto ci consta e con
51
l’eccezione del testo di Bollen (una pietra miliare nell’ambito dei
modelli SEM, tuttavia un po’ datato)24, una presentazione approfondita
e concettualmente ordinata di questo indice, nella quale si spieghi sia
come esso si origina e per quali esigenze, sia come si differenzia
rispetto all’indice rho di Dillon – Goldstein, proposto in seguito e
considerato preferibile al coefficiente alfa. Nella misura in cui si tratti di
una lacuna effettiva e non solo erroneamente presunta, può essere utile
il contributo a colmarla che proponiamo nella presente appendice.
Per spiegare compiutamente che cosa si vuole misurare mediante il
coefficiente alfa di Cronbach, prendiamo le mosse dal concetto di
consistency di una variabile (o internal consistency secondo qualche
autore), termine che possiamo tradurre con coerenza (o stabilità).
Conviene presentare questo concetto mediante due esempi.
ESEMPIO 1
Supponiamo di chiedere ad uno studioso di storia degli antichi Romani
qual è stato secondo lui, tra tutti gli imperatori, il più attento
all’architettura nella città di Roma. Supponiamo inoltre che questa
stessa domanda – in un breve lasso di tempo – venga rivolta allo
studioso da n intervistatori, e che poi si osservino tutte le risposte. Se lo
studioso avesse indicato sempre lo stesso imperatore, diremmo che
questa variabile – costituita dalle n risposte raccolte – ha la massima
coerenza. (Forse dovremmo attribuire questa dote piuttosto allo
24 Con ciò vogliamo alludere soltanto all’inconveniente che il testo, pubblicato nel 1989,
non affronta l’indice rho di Dillon – Goldstein, essendo stato proposto successivamente.
52
studioso, ma – come emergerà tra poco – conviene fare riferimento al
concetto di variabile).
ESEMPIO 2
Supponiamo di chiedere oggi a n individui a che ora sono usciti di casa
stamattina (più opportunamente si potrebbe fare riferimento a
determinate fasce orarie); a questi medesimi individui domani
chiederemo a che ora sono usciti di casa ieri mattina. Dopodiché
confrontiamo le n risposte rilevate nei due momenti: abbiamo ora due
variabili, una che fa riferimento alle risposte di ieri, l’altra alle risposte
di oggi. Con riferimento indifferentemente ad una delle due, possiamo
dire che tale variabile ha la massima coerenza se coincide con l’altra
variabile per tutti gli n individui25.
Dobbiamo prendere atto a questo punto che la letteratura pone l’enfasi
però non tanto sul concetto di consistency, quanto sul concetto di
reliability, termine che nella letteratura italiana viene tradotto con
affidabilità o attendibilità. A sostegno di questa asserzione citiamo i
seguenti autori:
Bollen pag. 206 intitola “Reliability” la sezione dedicata a questi
argomenti, nella quale presenta l’indice alfa di Cronbach;
25 Si osservi che mentre nell’ESEMPIO 1 appariva sensato attribuire la coerenza allo
studioso, ora –poiché abbiamo n individui – dovremmo a rigore attribuire la coerenza
individuo per individuo, risultando coerente soltanto chi ha dato la stessa risposta nei
due momenti, e viceversa. Si può evitare questa complicazione fissando l’attenzione
sugli individui nel loro insieme, e quindi imputando la coerenza ad una variabile,
proprio come era nelle nostre intenzioni.
53
Hayes pag. 51 si sofferma sull’attendibilità senza mai chiamare in
causa la coerenza;26
Brown pag. 337 intitola “Scale reliability estimation” il paragrafo
dedicato a questi argomenti;
Hair et al. pag. 101 intitolano “Internal consistency reliability” il
paragrafo dedicato a questi argomenti;
Esposito Vinzi et al. pag. 50 descrivono il coefficiente alfa di
Cronbach “a classical index in reliability analysis”.
Una giustificazione del fatto che il concetto di reliability assume un
ruolo preminente potrebbe essere che reliability incorpora – per così
dire – consistency; si potrebbe anche dire che si assume implicitamente
che l’affidabilità si fonda sulla coerenza. È fuori dubbio comunque che
per tutti i menzionati autori i due concetti si mischiano e si
confondono.27 Tuttavia gli esempi che si trovano in letteratura per
illustrare il concetto di reliability sono del tutto simili ai due esempi da
noi proposti qui sopra. È chiaro infatti che l’ESEMPIO 1 è una semplice
“variazione sul tema” dell’esempio di Hayes pag. 51: se con un righello
si misura 5 volte la lunghezza di un oggetto, “ci aspettiamo che le 5
26 Per l’esattezza l’autore a pag. 52 fa un breve accenno alla coerenza interna,
presentata come un strumento di verifica dell’attendibilità.
27
Infatti:
Bollen pag. 206 scrive: “Reliability is the consistency of measurement”;
Brown pag. 337 afferma: “Reliability refers to the precision or consistency of
measurement”;
Hair et al. pag. 116 definiscono reliability “the consistency of a measure”; ma non
solo: come si è già visto, “Internal consistency reliability” è il titolo di un
paragrafo!
Esposito Vinzi et al. pag. 50 a proposito dell’indice alfa affermano che esso
“represents (…) a measure of internal consistency”.
54
letture siano leggermente differenti tra loro”.28 Così pure l’ ESEMPIO
2 è perfettamente in sintonia con quanto scrive Bollen pag. 207: “I
could ask an extremely large number of people the same question on
completed years of formal schooling. If I could somehow remove their
memory of the question and their responses, I could ask them the same
question again and record their responses. The reliability is the
consistency of the responses across individuals for the two time
periods”.
Ora, a nostro modesto avviso si tratta di esempi che depongono a
sostegno più propriamente del concetto di coerenza.
Ci troviamo quindi di fronte ad un passaggio un po’ vacillante sul piano
concettuale, perché si vuole illustrare l’affidabilità ma si fanno esempi
di coerenza, così inducendo a ritenerle due concetti distinti; salvo poi
farne una cosa sola, così come si è dettagliato nella nota 27.
Personalmente riteniamo che si possa superare questo passaggio
guardando a coerenza e affidabilità come a due distinte nozioni di pari
“dignità”, ordinandole sul piano logico talché la seconda discenda dalla
prima. In che modo? Qui proponiamo il nostro semplice ragionamento.
Non crediamo che una falsità possa diventare verità per il solo fatto di
ribadirla più volte. Dicendo così, forse abbiamo scomodato un
“principio di morale”, ma accontentandosi di un più spicciolo buon
28 Naturalmente qui è implicita l’aspettativa che vi sia un certo grado di incoerenza;
nell’ESEMPIO 1 è implicita l’aspettativa opposta, cioè che nelle risposte dello studioso
vi sia la massima coerenza.
55
senso, dobbiamo d’altra parte convenire che in generale la coerenza è
qualcosa che rassicura e induce a dare fiducia. Per spiegarci meglio,
torniamo all’ ESEMPIO 1: se l’esperto ha indicato agli n intervistatori
sempre lo stesso imperatore, ciò conferisce credibilità alle sue risposte.
La cosa è ancora più persuasiva nell’ ESEMPIO 2: se uno degli
individui avesse voluto fornire una risposta menzognera nel primo
giorno, c’è almeno qualche probabilità che nel secondo giorno egli non
dia proprio la stessa risposta menzognera, bensì dia la risposta veritiera
oppure una risposta menzognera diversa dalla precedente.29 Ciò che
sosteniamo in sintesi è dunque questo: quando due risposte sono uguali,
è più probabile che siano affidabili che non il contrario. Con tale
“criterio di buon senso” si giustifica, a nostro avviso, il passaggio
consequenziale dalla coerenza all’affidabilità.
C’è ancora un concetto che la letteratura chiama in causa, quello di
validity, che possiamo tradurre banalmente validità od anche (forse più
efficacemente) pertinenza. Per spiegarci torniamo all’ ESEMPIO 1: se
l’esperto avesse sempre indicato il nome di qualcuno che non fu
imperatore, bensì per esempio console o poeta dell’antica Roma, si
avrebbe una risposta non pertinente. Bollen pag. 207 fa un esempio al
riguardo che egli stesso riconosce more extreme: se per ottenere una
misura della loro intelligenza chiedessimo più volte a un gruppo di
individui qual è il loro numero di scarpa, la misura potrebbe pure essere
29 Si potrebbe dire che ci sostiene in queste affermazioni il proverbio secondo il quale
“le bugie hanno le gambe corte”!
56
molto coerente e quindi affidabile, ma assolutamente priva di validità o
pertinenza.
Molto istruttiva al riguardo ci sembra l’illustrazione grafica di Hair et
al. pag. 99, che qui sintetizziamo in termini verbali: la validità (o
pertinenza) di un certo numero di risposte (più in generale, di
osservazioni) si ha anzitutto se queste “colpiscono il bersaglio”. Ma ciò
non basta: occorre altresì che esse siano poco disperse (prendendo il
termine dispersione nella sua accezione statistica); osservazioni con una
elevata dispersione non consentono infatti di distinguere tra l’errore di
natura casuale e l’errore di natura sistematica. Su questo punto
torneremo brevemente nella nota 30.
2 – Variabili non osservabili e variabili di misura
Alla luce di queste premesse concettuali fissiamo ora l’attenzione su
una variabile di misura. La letteratura qualifica una variabile con questo
termine quando, data una variabile , della quale non si conoscono i
punteggi, è possibile individuare una variabile x che, in quanto fornisce
degli idonei (o validi, nell’accezione anzidetta) punteggi di test,
rappresenta una variabile di misura. Appare naturale formalizzare
quanto sopra mediante la semplice relazione seguente:
(1)
x=+
57
ove è l’errore di misurazione, dato banalmente dallo scarto tra il
punteggio vero e il punteggio di test.30 Un classico esempio nel contesto
della Psicologia vede come il punteggio dell’intelligenza di un gruppo
di soggetti, e x come il punteggio ottenuto in un test eseguito su questi
soggetti allo scopo di valutare, appunto, la loro intelligenza. Se
astraiamo da questo linguaggio, tipico delle Scienze sociali, risulta fin
d’ora evidente che nella (1) altro non è che una variabile latente e x
una variabile manifesta. Riprenderemo questo punto al paragrafo 5 per
darne un ulteriore sviluppo.
A questo punto possiamo porci una domanda fondamentale nel nostro
discorso: come si può quantificare l’affidabilità di una variabile di
misura?
In prima battuta consideriamo l’indice x,x, dato dal rapporto tra due
varianze:31
30 Qui è implicito che l’errore sia soltanto quello di natura casuale. Nel testo di Hair et
al. la (1) viene presentata distinguendo tra l’errore casuale e l’errore sistematico, il che
porta a riformularla (a pag. 97) come segue:
x = + r + s
ove il deponente r sta per random e il deponente s per systematic. L’errore casuale
compromette l’affidabilità, mentre l’errore sistematico compromette la validità. Sul
piano concettuale si può certamente condividere questa distinzione, che tuttavia rende
impraticabili gli sviluppi logici e analitici che, conformemente alla consolidata
letteratura, andiamo ad esporre nel seguito di questo paragrafo. Come infatti evidenzia
chiaramente Corbetta pag. 178, non c‘è possibilità di controllo dell’errore sistematico,
per cui il fatto di conferirgli nell’equazione qui sopra una sua “autonomia” non appare
fruttuoso.
31 La scelta di avviare il nostro discorso da questo rapporto è mutuata da Bollen pag.
208, che lo presenta fin dalle prime formule della sezione intitolata Reliability. Di
questo autore abbiamo inoltre mantenuto l’accorgimento di usare il pedice x,x che
diventerà chiaro tra poco, quando cioè nella (9) evidenziamo che x,2 = x,x. Fin d’ora
va comunque rimosso il dubbio (peraltro del tutto lecito) che con la notazione x,x si
intenda il coefficiente di correlazione di x con sè stessa, coefficiente che per definizione
58
U x,x
(2)
Var ^W `
Var ^x`
Per capire la ratio di questo indice, torniamo all’ ESEMPIO 2, nel quale
potrebbe rappresentare la risposta di oggi, e x la risposta di domani, od
anche viceversa. Si è detto nel paragrafo 1 che si ha la massima
coerenza e quindi – come si è visto – la massima affidabilità quando
risulta = x, per cui sono uguali pure le rispettive varianze, e l’indice
assume il valore 1. È chiaro che lo stesso criterio si può applicare nel
contesto delle variabili di misura, ove la massima affidabilità si ha
quando la variabile di misura, x, coincide (eventualmente a meno di una
costante additiva) con la variabile che si desidera misurare, , per cui
risulta x,x = 1.
Si constata subito che la (2) presuppone che valga la relazione (1).
Infatti all’infuori del caso appena visto (assai più teorico che pratico), in
cui le due variabili addirittura coincidono, le due varianze saranno
diverse, producendo quindi un rapporto che può assumere valori
(positivi) sia prossimi a zero, sia infinitamente grandi. Questo invece
non si verifica se si tiene conto che, grazie alla (1), nella (2) possiamo
scrivere:
Var^W `
Var^W `
Var^W `
Var^x` Var^W H ` Var^W ` Var^H ` 2Cov^W ; H `
(3)
Var^W `
Var^W ` Var^H `
U x,x
è pari a 1. Appare quindi preferibile la notazione di Corbetta, che a pag. 173 presenta il
coefficiente di attendibilità indicandolo x.
59
Ora risulta evidente che il rapporto non può superare il valore 1; quando
si riscontra questo valore, ciò comporta – come prima – che x e coincidono o differiscono tutt’al più di una costante additiva. In questi
passaggi ci si è avvalsi dell’ipotesi che sia nulla Cov{; }; nel contesto
della regressione lineare ciò corrisponde alla consueta ipotesi che non vi
sia alcuna correlazione tra la variabile indipendente e la componente
erratica.32
Rimanendo nel contesto della regressione lineare, la (1) può essere
generalizzata come segue:
(1bis)
x = + Con questa generalizzazione la (3) assume il seguente aspetto:
(3bis)
U x, x
D 2Var ^W `
D 2Var ^W ` Var ^H `
il che non modifica la conclusione di prima, che cioè il rapporto in
parola non può superare il valore 1.
Se guardiamo alla (1bis) come ad un’equazione di regressione, non
soltanto si evince che il rapporto in parola può assumere valori
esclusivamente tra 0 e 1, ma si constata anche che l’indice x,x altro
non è che il coefficiente di determinazione. È noto infatti che per la
regressione lineare semplice il coefficiente di correlazione tra la
32 Come è noto, questa ipotesi equivale all’ipotesi di non stocasticità della variabile
esplicativa; si può parlare anche di variabile esplicativa come regressore fisso.
60
variabile dipendente e quella indipendente, elevato al quadrato,
corrisponde appunto al coefficiente di determinazione. Con la notazione
del nostro contesto e le annesse ipotesi possiamo infatti scrivere:
U x ,W
U x2,W
Cov^x;W `
V xV W
;
>Cov^x;W `@2 >Cov^DW H ;W `@2 >DCov^W ;W ` Cov^H ;W `@2
V x 2V W 2
>DVar ^W ` 0@2
V x 2V W 2
V x 2V W 2
D 2Var ^W `
D 2V W2V W2
V x 2V W 2
Var ^x`
V x 2V W 2
U x, x
Avuto presente il significato del coefficiente di determinazione,
possiamo
concludere
che
l’indice
di
affidabilità
che
stiamo
considerando quantifica semplicemente la bontà dell’equazione di
regressione mediante la quale si collega la variabile di misura (variabile
dipendente) con la variabile oggetto di misura (variabile indipendente).
Ritroviamo sostanzialmente queste considerazioni in Corbetta pagg. 172
– 174, ove in particolare l’affermazione “l’attendibilità (…) assume
anche il significato di proporzione di varianza della variabile osservata
spiegata dalla variabile latente” si ferma appena un passo prima della
nostra (che cioè fa coincidere l’indice di affidabilità col coefficiente di
determinazione).
Fin qui tuttavia non abbiamo tenuto conto che la variabile che si vuole
misurare, , non è osservabile; essa fa riferimento a valori (o, come si è
detto, punteggi) che non si conoscono, e proprio per questo si ricorre
infatti ad una variabile di misura.
61
Ciò che la letteratura ha proposto per superare questa impasse è di
ricorrere al test – retest method (cfr. Bollen pag. 209). Si tratta di
rilevare la variabile di misura una prima e poi una seconda volta (col
linguaggio delle Scienze sociali si effettua lo stesso test due volte, al
tempo t e al tempo t+1). Formalmente possiamo quindi scrivere:
(4a)
x t = t + t
(4b)
xt+1 = t+1 + t+1
A questo punto si tratta di sfruttare il fatto che risulta:
(5)
Cor{xt ; xt+1 } = [Cor{xt ; }]2 = [Cor{xt+1 ; }]2.
Ma se sono vere le uguaglianze nella (5), è chiaro che il discorso è
estensibile al caso di due diverse variabili di misura, xi e xj, riferite alla
medesima variabile . D’altra parte già nell’ESEMPIO 2, per il fatto di
rilevare le “risposte di ieri” e le “risposte di oggi”, abbiamo parlato di
due variabili di misura, e ora sottolineiamo che possono benissimo
essere due variabili completamente diverse, purché riferite alla
medesima variabile .33
33 A dire il vero Bollen pag. 212 distingue il caso di una stessa misura ripetuta nel
tempo, che egli denomina – come si è detto – il metodo test – retest, dal caso di due
diverse misure, che egli denomina metodo (o tecnica) alternative forms. A nostro avviso
è una distinzione solo apparente, perché in ambedue i casi le variabili di misura sono
diverse. Che poi la diversità derivi dal fatto che si hanno due distinti momenti di
rilevazione, o derivi invece dal fatto che le variabili hanno ciascuna un suo proprio
“contenuto”, ci pare del tutto trascurabile. Ne è a nostro avviso una riprova il fatto che
con entrambi i metodi si perviene alle uguaglianze affermate nella (5).
62
Atteso quanto sopra, e quindi sostituendo nella (4a) il deponente t con i
e nella (4b) il deponente t+1 con j, la letteratura definisce due variabili
di misura:
a) parallele;
b) tau – equivalenti;
c) congeneriche
a seconda che nelle equazioni (4a) e (4b) rispettivamente si assuma:
a) i = j = 1 e Var { i} = Var { j }
b) i = j = 1 e Var {i } Var {j }
c) i j e Var {i } Var {j }.
Va detto che la (5) – che ora riproponiamo coi deponenti i e j – :
(5bis)
Cor{xi ; xj } = [Cor{xi ; }]2 = [Cor{xj ; }]2
presuppone che si abbiano due misure parallele;34 sotto questa ipotesi,
nonché invocando le tre ipotesi:35
(6)
E{ i} = E{ j} = 0
(7)
Cov { i; } = Cov { j; } = 0
(8)
Cov { i; j} = 0 ,
34
Un punto che merita di essere evidenziato e sul quale ritorneremo nel paragrafo 5 è
che, siccome per variabili di misura parallele e tau – equivalenti il parametro è pari 1,
quindi è il medesimo per xi e per xj, è implicita l’ipotesi che le due variabili siano
ugualmente importanti nel misurare .
35 La (6) e la (7) sono le consuete ipotesi che valgono per le due equazioni nella (4),
ciascuna vista come singola equazione di regressione; la (8) invece fa riferimento alla
coppia di equazioni.
63
possiamo svolgere come segue i passaggi con cui si perviene alla (5bis):
Cor ^xi ; x j `
Cov^W H i ;W H j `
Var^W H i `Var ^W H j `
Cov^W ;W ` Cov^H i ;W ` Cov^W ; H j ` Cov^H i ; H j `
Var^W ` Var ^H i ` 2Cov^H i ;W `Var^W ` Var ^H j ` 2Cov^H j ;W `
Var ^W ` 0 0 0
Var ^W `
Var ^W `
Var ^W ` Var^H i `Var^W ` Var ^H j ` Var ^xi `Var^xi ` Var ^xi `
Nella terza riga si è tenuto conto che, poiché xi e xj sono variabili di
misura parallele, risulta Var { i} = Var { j }, per cui a denominatore il
contenuto delle due parentesi tonde è il medesimo, e si è scelto di
esprimerlo con riferimento a xi, ma si poteva indifferentemente
esprimerlo con riferimento a xj ; in questo modo risulta verificata nella
(5bis) l’uguaglianza del primo membro sia col secondo, sia col terzo.
Inoltre nella (5bis) l’elevamento al quadrato si spiega rammentando che
risulta:
(9)
x,x = x,2
3 – L’alfa di Cronbach
Come si è visto, l’indice di affidabilità risente dell’ipotesi restrittiva che
le variabili di misura siano parallele. Non soltanto: finora il discorso
verteva su appena due variabili di misura, mentre è verosimile averne a
64
disposizione anche più di due. L’alfa di Cronbach rimuove queste
limitazioni procedendo nel seguente modo.
Si supponga di avere a disposizione q variabili di misura per una stessa
variabile . Adottando la (1) come punto di partenza, possiamo quindi
scrivere:
xk = + k
(10)
per k = 1; 2; … ; q ove è q 2.
Consideriamo ora la variabile H così ottenuta:
q
(11)
H=
¦x
k
k 1
Grazie alla (9) l’indice di affidabilità delle q misure, prese
complessivamente, assume il seguente aspetto:
U H ,H
(12)
>Cov^W ; H `@2
Var^W `*Var^H `
UW2, H
Per la (12) si possono svolgere alcuni passaggi, a cominciare dal
numeratore:
>Cov^W ; H `@
2
ª
­ q
½º
«Cov ®W ; ¦ (W H k )¾»
¯ k1
¿¼
¬
ª
­ q ½º
^
`
qVar
W
Cov
®W ; ¦ H k ¾»
«
¯ k 1 ¿¼
¬
2
2
q
ª
­
½º
«Cov ®W ; qW ¦ H k ¾»
k 1
¯
¿¼
¬
q
ª
º
^
`
qVar
W
Cov^W ; H k `»
¦
«
k 1
¬
¼
2
2
>qVar^W ` 0@2
65
Pertanto considerando ora sia il numeratore, sia il denominatore,
abbiamo:
>qVar^W `@2
Var ^W `* Var ^H `
q 2Var ^W `
Var^H `
Quest’ultima espressione tuttavia non permette di effettuare un calcolo,
poiché a numeratore compare , che sappiamo essere una variabile non
osservabile. L’inconveniente viene superato con ulteriori passaggi:
q 2Var^W `
Var^H `
q 2 (q 1)Var^W `
(q 1)Var^H `
q q 2Var^W ` qVar^W `
*
q 1
Var^H `
Date queste due frazioni, ci occupiamo soltanto della seconda, al cui
numeratore sommiamo e sottraiamo la stessa quantità:
(13)
q
q
k 1
k 1
q 2Var ^W ` ¦ Var ^H k ` qVar ^W ` ¦ Var ^H k `
Combinando la (11) con la (10) possiamo scrivere:
q
­q
½
­
½
Var ^H ` Var ®¦ (W H k )¾ Var ®qW ¦ H k ¾
k 1
¯k 1
¿
¯
¿
q
q
q
­
½ 2
2
q Var ^W ` ¦ Var ^H k ` 2Cov ®qW ; ¦ H k ¾ q Var ^W ` ¦ Var ^H k ` 0
k 1
k 1
k 1
¯
¿
Al posto dei primi due termini della (13) inseriamo quindi quest’ultimo
risultato, ottenendo:
66
q
·
§
Var^H ` ¨¨ qVar^W ` ¦Var^H k `¸¸
k 1
¹
©
Ora riprendiamo sia la prima frazione, sia numeratore e denominatore
della seconda:
(14)
q
·
§
Var^H ` ¨¨ qVar^W ` ¦Var^H k `¸¸
q
k 1
¹
©
*
q 1
Var^H `
q
§
·
¨ ¦Var^xk ` ¸
q ¨ k1
¸ D
* 1
¨
q 1
Var^H ` ¸
¨
¸
©
¹
La (14) è quindi la formula del coefficiente alfa di Cronbach, nella sua
“versione calcolabile”. Vedremo nel prossimo paragrafo che esso può
presentarsi pure con un’altra espressione (v. formula 16), ma prima
vogliamo evidenziare che le q variabili di misura possono essere
indifferentemente parallele o tau – equivalenti, ma non congeneriche.
Questa affermazione discende immediatamente dal fatto che:
nella (10) è implicito che il parametro , di cui alla (4a), è uguale (e
pari a 1) per tutte le variabili di osservazione, mentre nella
definizione di variabili congeneriche tale parametro è di norma
diverso da una variabile all’altra;
dalla (12) in poi nessun passaggio ha richiesto né che fosse
Var{i} = Var{j} (come richiesto per misure parallele), né che
fosse Var{i} Var{j} (come richiesto per misure tau – equivalenti),
ove j e j fanno riferimento a due qualsiasi variabili di misura tra le q
considerate; pertanto c’è libertà di scelta tra le due alternative.
67
L’alfa di Cronbach attenua quindi l’ipotesi restrittiva menzionata
all’inizio di questo paragrafo, dato che ammette anche che le variabili
misura siano tau – equivalenti.
Ci soffermiamo ora sulla questione degli estremi dell’intervallo nel
quale sono compresi i valori del coefficiente in parola, questione che in
letteratura non ha ricevuto – per quanto ci consta – una sufficiente
attenzione sotto l’aspetto teorico.
Estremo inferiore dell’intervallo
Osservando la struttura della (14) e tenuto conto che tutti i suoi termini
singolarmente presi (a parte il – 1) sono positivi, si deduce che la (14)
risulta pari a zero quando il rapporto tra k Var{xk} e Var{H} è uguale
a 1, e quindi quando numeratore e denominatore sono uguali; ciò vuol
dire che deve risultare:
q
(15)
¦Var^xk `
k 1
¦Var^xk ` ¦¦ Cov^xk ; x j `
q
q
k 1
q
k 1 j 1
jzk
il che comporta:
¦¦ Cov^x ; x `
q
q
k
j
0
k 1 j 1
j zk
Per cose note, le indicate covarianze sono tutte nulle se le q variabili
sono tra loro tutte incorrelate, il che configura una situazione di variabili
di misura che “vanno ciascuna per conto proprio”, e perciò sono
inaffidabili (si rammenti infatti quanto spiegato al paragrafo 1). Nella
68
(15) appare dunque evidente il ruolo cruciale della sommatoria di
covarianze, con riferimento alla quale è bene evidenziare quanto segue.
Detta sommatoria può risultare pari a zero non soltanto se sono nulli
tutti gli addendi, ma anche se tra essi c’è perfetta compensazione, il
che non configura necessariamente una situazione di inaffidabilità.
Per questo gli autori raccomandano che the xi’s should be scored so
that they are all positively or all negatively related to (Bollen
pag. 215). Alla luce della (5bis) questa raccomandazione può essere
sostituita dalla raccomandazione che sussista una correlazione
sempre positiva (o sempre negativa) tra le variabili di misura.
Per giustificare tale raccomandazione, consideriamo dapprima il
caso che nella (15) le covarianze oggetto di sommatoria siano tutte
negative, per cui il rapporto già menzionato, cioè tra i Var{xi} e
Var{H}, supererebbe il valore 1, facendo diventare negativo l’alfa
di Cronbach. Ciò costituirebbe un inconveniente, non tanto per il
fatto di avere un indice che può assumere valori anche negativi,
quanto perché non si riuscirebbe a determinarne un limite. Questa
situazione sarebbe comunque facilmente superabile ribaltando il
segno di tutte le covarianze; si tratterebbe infatti di un’operazione
del tutto lecita dal punto di vista logico.36
36 Questa affermazione risulta più facilmente comprensibile proprio facendo riferimento
ad un questionario di customer satisfaction, nel quale si chiede di esprimere il proprio
giudizio su un oggetto che tipicamente viene presentato in termini positivi: in generale,
si domanda cioè quanto è “buona” una certa cosa. Se la scala di valutazione fosse da 1 a
10, ove 1 e 10 significano rispettivamente minima e massima soddisfazione (o minimo e
massimo accordo), a punteggi elevati corrisponderebbe ovviamente elevata
soddisfazione. Ma dal punto di vista logico non cambierebbe nulla se – ferma restando
69
Consideriamo ora il caso che nella (15) si abbiano covarianze in
parte positive e in parte negative. Abbiamo già visto che se vi fosse
perfetta compensazione il coefficiente alfa risulterebbe nullo; se
prevalessero le covarianze negative, il coefficiente assumerebbe
valore negativo, mentre se prevalessero le covarianze positive, il
coefficiente, pur assumendo un valore maggiore di 0, risulterebbe,
diciamo così, “alterato”, in quanto “spinto verso il basso” senza che
ciò sia sintomo di una specifica ragione.37
Possiamo concludere che il limite inferiore è 0, a condizione che non vi
siano una o più covarianze negative, ossia a condizione che alle
variabili di misura non corrisponda una matrice di correlazione con
alcuni elementi di segno tra loro opposto.
Estremo superiore dell’intervallo
Osservando di nuovo la struttura della (14), si deduce che quando (in
via teorica) il rapporto tra i Var{xi} e Var{H} è uguale a zero, il
coefficiente alfa diventa uguale a 1, e raggiunge così il valore
massimo.38
l’anzidetta scala – tutte le domande chiedessero di esprimere un giudizio su un oggetto
presentato in termini negativi (cioè si domanda quanto è “cattiva” una certa cosa); chi
prima aveva espresso il punteggio 10, ora esprimerà il punteggio 1, e così via per i
restanti punteggi. Le due alternative sono equivalenti anche sul piano computazionale,
nel senso che l’anzidetta modifica dei punteggi darebbe luogo allo stesso coefficiente di
correlazione lineare, solo ribaltato di segno.
37
Per questo motivo gli autori asseriscono che l’alfa di Cronbach tende a sottostimare
l’affidabilità.
38 A rigore il valore massimo è un po’ più grande di 1, in quanto dipende anche dal
fattore q / (q – 1). Questo fattore è sempre più trascurabile man mano che aumenta il
numero di variabili, mentre ha un impatto significativo quando si hanno poche variabili.
70
Occorre adesso domandarsi sotto quali condizioni ciò può verificarsi. In
prima battuta si potrebbe pensare che il rapporto in parola sia pari a zero
quando lo è il numeratore, ossia quando le variabili di misura si
estrinsecano con valori costanti, talché le rispettive varianze sono nulle.
A ben guardare però, essendo
Var ^H `
­q
½
Var ®¦ x k ¾
¯k 1 ¿
¦ Var ^x ` ¦¦ Cov^x
q
q
q
k
k 1
k
; x j `, si ha che se
k 1 j 1
jzk
tutte le variabili di misura hanno varianze nulle (ma realisticamente
dobbiamo dire: molto piccole), anche tutte le covarianze assumono
valori molto piccoli,39 che per di più potrebbero compensarsi tra loro
almeno parzialmente, per cui l’anzidetto rapporto viene ad assumere un
valore molto piccolo sia a numeratore, sia a denominatore, il che
produce l’effetto opposto a quello che si prospettava in prima battuta:
un valore piccolo sia a numeratore che a denominatore “spinge” infatti
il rapporto verso il valore 1, così determinando un alfa vicino a zero.
Se ne deduce che il rapporto tra i Var{xi} e Var{H} diventa piccolo
non quando risulta vicino a zero il numeratore, bensì quando sono
grandi e tutte positive le covarianze a denominatore. Si riscontra questa
situazione se le variabili di misura sono tutte tra loro correlate
perfettamente. Vogliamo cioè riferirci al fatto che, date due variabili
Per esempio, per q = 4, il fattore in parola è 1,3333, e se il fattore che segue fosse pari a
1, l’indice risulterebbe 1,3333.
39 Infatti, varianze piccole derivano da scarti (quadratici) dalla media piccoli. Questi
scarti piccoli entrano anche nella formula della covarianza, con la differenza che la
formula della covarianza non considera scarti quadratici, bensì il prodotto di scarti
incrociati; ma si tratta di una differenza irrilevante in questo discorso.
71
qualsiasi, X e Y, perfettamente correlate, dalla formula del coefficiente
di correlazione ricaviamo che:
V X ;Y
V XVY
Se tra X e Y la correlazione fosse meno elevata (per esempio pari a 0,9),
avremmo che:
V X ;Y
0,9V X V Y
Dunque, a parità di scarti quadratici medi, ad una situazione di variabili
di misura fortemente correlate (e naturalmente – come ormai sappiamo
bene – tutte dello stesso segno) corrisponde una sommatoria di
covarianze “potenzialmente” elevata, con l’effetto di far assumere al
denominatore del rapporto in parola un valore grande, e dunque di
portare il coefficiente alfa al limite pari a 1.
Tuttavia il requisito di variabili fortemente correlate è una condizione
necessaria ma non sufficiente, perché nella (15) entrano in gioco anche
le varianze, che possono far aumentare o far diminuire il valore del
coefficiente. Vediamo con qualche semplice esempio numerico cosa
può verificarsi.
72
X(1)
X(2)
X(3)
X(4)
55
5,5
31
11
610
61
586
566
98
9,8
74
54
47
4,7
23
3
955
95,5
931
911
4
0,4
– 20
– 40
– 22
– 2,2
– 46
– 66
0
0
– 24
– 44
15
1,5
–9
– 29
440
44
416
396
254
25,4
230
210
608
60,8
584
564
201
20,1
177
157
388
38,8
364
344
259
25,9
235
215
300
30
276
256
72918
729
72918
72918
Queste 4 variabili sono tutte perfettamente correlate tra loro, e l’alfa di
Cronbach risulta pari a 0,916.
Modifichiamo ora X(2) e X(4): rispetto a prima X(2) è divisa per 10,
mentre X(4), che prima risultava da X(1) – 44, ora risulta da X(1)* 17.
Abbiamo quindi i seguenti dati:
73
X(1)
X(2)
X(3)
X(4)
55
0,55
31
935
610
6,1
586
10370
98
0,98
74
1666
47
0,47
23
799
955
9,55
931
16235
4
0,04
– 20
68
– 22
– 0,22
– 46
– 374
0
0
– 24
0
15
0,15
–9
255
440
4,4
416
7480
254
2,54
230
4318
608
6,08
584
10336
201
2,01
177
3417
388
3,88
364
6596
259
2,59
235
4403
300
3
276
5100
72918
7,29
72918
21.073.248
Chiaramente abbiamo ancora variabili perfettamente correlate, ma
cambiano le varianze (indicate nella riga sotto ciascuna tabella) di X(2) e
soprattutto di X(4), sicché l’alfa di Cronbach scende da 0,916 a 0,260.
D’altra parte le varianze possono far aumentare il risultato, per cui l’alfa
può assumere un valore più grande di 0,260 anche con variabili solo
74
moderatamente correlate, come si può constatare in questo esempio, nel
quale sono stati variati i valori di X(2) e X(4) :
X(1)
X(2)
X(3)
X(4)
55
16
31
66
610
12
586
3
98
–5
74
– 25
47
0
23
15
955
150
931
550
4
22
– 20
0
– 22
0
– 46
– 45
0
4
– 24
5
15
2
–9
18
440
160
416
400
254
89
230
220
608
220
584
500
201
65
177
465
388
40
364
690
259
44
235
288
300
– 65
276
87
Ora l’alfa risulta pari a 0,870 nonostante che soltanto tra X(1) e X(3) vi
sia correlazione perfetta, mentre le restanti correlazioni sono comprese
tra 0,647 e 0,700.
Possiamo concludere che il valore massimo che può assumere il
coefficiente alfa di Cronbach è 1, ma non si può dire che un valore
75
elevato sia dovuto sempre e soltanto ad una situazione di variabili di
misura complessivamente affidabili.
4 – Una riformulazione dell’alfa di Cronbach
L’inconveniente dell’alfa di Cronbach evidenziato al paragrafo
precedente avvalendosi dei tre esempi numerici non si presenta se si
passa a standardizzare le variabili. Il modo migliore per rendersene
conto ci sembra quello di fissare l’attenzione su una differente
formulazione di questo coefficiente; anziché come indicato nella (14),
esso può infatti assumere il seguente aspetto:
Cor ^xi ; x j `
¦
q
iz j
*
q 1 q ¦ Cor ^xi ; x j `
D
(16)
iz j
Si può verificare l’equivalenza tra la (14) e la (16) come segue.
Date due qualsiasi variabili, X e Y, e indicando con X* e Y* le stesse
variabili standardizzate, per cose note possiamo scrivere:
^
Cov X * ; Y *
1
n
1
n
76
¦x
i
*
i
¦ (x
i
y i*
i
`
1
n
1
n
¦ (x
i
*
i
P X * )( y i* P Y * )
§ xi P X
¦ ¨¨
i
©
V
X
P X )( y i P Y )
V XV Y
u
yi PY ·
¸
V Y ¸¹
Cor ^X ; Y `
Impiegando questo risultato nella (14), si svolgono i seguenti passaggi:
^ `
q
D
q
*
q 1
q
i 1
i 1 j 1
j zi
^ `
q
^
`
q
^
^ `
q
q
i 1
¦ Var xi* ¦¦ Cov xi* ; x *j
i 1
q
q
*
q 1
q
¦ Var xi* ¦ ¦ Cov xi* ; x *j ¦ Var xi*
q
^
¦¦ Cov xi* ; x *j
i 1 j 1
j zi
q
q
^
`
q ¦¦ Cov xi* ; x *j
i 1 j 1
j zi
i 1 j 1
j zi
`
¦¦ Cor ^x ; x `
q
q
i
`
q
*
q 1
j
i 1 j 1
j zi
q
q
q ¦¦ Cor ^xi ; x j `
i 1 j 1
j zi
Abbiamo così verificato l’equivalenza tra le due formulazioni (14) e
(16) dell’alfa di Cronbach. È bene al riguardo avvertire che nella (16) la
sommatoria semplice
¦
è quella utilizzata da alcuni autori per
iz j
significare ciò che più propriamente andrebbe invece esplicitato con la
doppia sommatoria presente nei precedenti passaggi. Inoltre, ad evitare
un possibile malinteso, si tenga presente che nella (16) le q variabili
appaiono non standardizzate,40 il che però non si pone in contraddizione
con l’affermata necessità che lo siano affinché valga l’equivalenza delle
due formule, ossia: se le variabili non sono standardizzate, il risultato
che si ottiene con la (14) è diverso da quello che si ottiene con la (16); i
due risultati per contro coincidono se nella (14) si considerano le
40 Invero le variabili qui potrebbero anche essere standardizzate; si tenga infatti presente
che in generale il coefficiente di correlazione lineare non varia a seconda che le due
variabili siano “grezze” o invece standardizzate.
77
variabili standardizzate, mentre nella (16) è indifferente avere variabili
standardizzate o no, come si spiega in nota 40.
Anche la (16) assume valori compresi tra 0 e 1, ma – a differenza di
quanto si è visto per la (14) – queste due situazioni estreme derivano
esclusivamente dal fatto che le variabili sono rispettivamente tutte
incorrelate tra loro e tutte perfettamente correlate con segno positivo:
ciò grazie al fatto che le varianze non interferiscono più come illustrato
coi tre esempi numerici, essendo tutte pari a 1. Si constata agevolmente
infatti che il valore minimo viene raggiunto se nella (16) le correlazioni
sono tutte nulle. Per converso, se nella (16) tutte le correlazioni sotto
sommatoria sono pari a 1, si ha:
¦¦ Cor ^x ; x `
q
q
i
j
q2 q
i 1 j 1
j zi
Ciò deriva dal fatto che si tratta di sommare tutti gli elementi (uguali a
1) di una matrice di correlazione di ordine q, tranne ovviamente gli
elementi sulla diagonale principale.
Stante quanto sopra, per la (16) si può scrivere:
q
q(q 1)
*
q 1 q q(q 1)
78
q
q (q 1)
*
1
q 1 q(1 q 1)
5 – L’alfa di Cronbach nell’ambito dei SEM
Si può dire che quanto fin qui svolto fa riferimento alla teoria classica
della misurazione. Se ora vogliamo considerare il contesto dei modelli
SEM, alcune delle asserzioni precedenti richiedono di essere
reinterpretate, almeno in parte.
Anzitutto è chiaro – e vi abbiamo accennato già nel paragrafo 2 – che la
variabile che si vuole misurare, prima indicata con , svolge nei SEM il
ruolo di variabile latente, mentre la variabile di misura, x, assume il
ruolo di variabile manifesta.
Alla luce della (1bis) – o, più correttamente, della (10) – si può
affermare inoltre che l’alfa di Cronbach presuppone il modello di
misurazione conforme allo schema riflessivo. Si tenga presente infatti
che nello schema formativo l’equazione è una sola (anziché almeno
due), la quale assume un diverso aspetto, cioè in generale:
S
O1 z1 O2 z 2 ..... Ok z k H
ove è una variabile latente a cui si associano k variabili manifeste. A
parte ciò, la reinterpretazione che si diceva entra in gioco per il fatto che
nella letteratura dei SEM l’alfa di Cronbach viene presentato come
indice atto a misurare non tanto l’affidabilità (nell’accezione e con le
implicazioni sopra esposte), quanto l’omogeneità di un blocco di
variabili manifeste od anche l’unidimensionalità di una variabile
79
latente. Come un’elevata correlazione tra due o più variabili di misura è
“sintomo” di affidabilità (e viceversa), così un’elevata correlazione tra
due o più variabili manifeste (inserite, come si è detto, in uno schema
riflessivo) è “sintomo” del fatto che esse sono tra loro governate da una
sorta di proporzionalità, in quanto fanno riferimento ad un medesimo
“argomento”. Per dirla in estrema sintesi, il legame tra le variabili viene
interpretato nel primo caso sintomo di coerenza, nel secondo caso
sintomo di proporzionalità.
Per spiegarci al riguardo, consideriamo questo esempio: se si volesse
misurare
l’ingombro
di
vari
lampadari,
si
prenderebbero
in
considerazione le tre solite misure di lunghezza, larghezza e altezza.
Dato però che alcuni lampadari potrebbero presentare una forma
piuttosto irregolare, sarebbe bene pensare ad ulteriori misure, come il
numero di lampadine, la distanza più grande tra una lampadina e l’altra,
la distanza tra il punto più alto e il punto più laterale, e così via. Ciò
premesso, è chiaro che per un lampadario molto ingombrante simili
misure saranno presumibilmente tutte più grandi delle rispettive misure
di un lampadario poco ingombrante, dato che si tratta di oggetti che di
norma rispettano certe proporzioni. Per significare questo, si parla di
variabili manifeste (o indicatori) che costituiscono un blocco omogeneo.
L’omogeneità sarà tanto più elevata, quanto più sono elevate (e tutte
positive)41 le correlazioni tra le variabili manifeste, e viceversa: questo
“meccanismo” è proprio quello che opera nella (16).
41 Si rammenta che il requisito di correlazioni tutte positive è emerso già nel paragrafo
3, ove l’abbiamo giustificato con ragioni algebriche; ora la giustificazione è dettata da
ragioni logiche. Tornando all’esempio di come misurare l’ingombro di un lampadario,
80
In letteratura, oltre che di omogeneità di un blocco, si parla di
unidimensionalità del costrutto. Ciò significa che, per tornare
all’esempio dei lampadari, interessa misurarne soltanto l’ingombro, e
non altro, come per esempio il valore monetario (in questo senso si
parlava poco fa di variabile manifeste riferite ad un medesimo
argomento). Ora, se un costrutto è unidimensionale, è logico attendersi
che in uno schema riflessivo le variabili manifeste costituiscano un
blocco omogeneo. Di nuovo dobbiamo ricorrere ad un esempio per
spiegare questo punto.
Poniamo che si voglia valutare il costrutto descrivibile come il
gradimento dell’accoglienza nella stanza di attesa dello studio di un
professionista; consideriamo due alternative per le variabili manifeste.
Con la prima alternativa si chiede ai soggetti intervistati di esprimere
una valutazione su:
1. quanto è silenzioso e tranquillo l’ambiente
2. quanto è rilassata l’atmosfera
3. quanto ci si può concentrare nella lettura delle riviste messe a
disposizione
Con la seconda alternativa si chiede di esprimere una valutazione su:
1.
quanto è silenzioso e tranquillo l’ambiente
2.
quanto è gradevole la temperatura nella stanza
3.
quanto sono interessanti le riviste messe a disposizione
non avrebbe senso utilizzare una variabile che vada “contro corrente” rispetto alle altre,
assumendo cioè valori piccoli con lampadari ingombranti (e viceversa).
81
Alla luce delle precedenti considerazioni, si può affermare che con la
prima alternativa le variabili manifeste costituiscono un blocco
omogeneo. Non solo: si ha a che fare con un costrutto unidimensionale,
nel senso che fa riferimento ad un solo aspetto dell’accoglienza della
stanza di attesa. Dunque omogeneità delle variabili manifeste e
unidimensionalità della variabile latente sono due facce della stessa
medaglia.
Per contro con la seconda alternativa le variabili manifeste non
costituiscono un blocco omogeneo, dato che per esempio le riviste
potrebbero essere molto interessanti, ma ciò non comporta in alcun
modo che l’ambiente sia silenzioso e tranquillo! La scelta di variabili
manifeste disomogenee comporta che nella seconda alternativa il
costrutto accoglienza non è visto sotto un solo aspetto, bensì è
considerato come un qualcosa composto di varie sfaccettature. In tal
caso appare più idoneo lo schema formativo, e risulta evidente come
l’alfa di Cronbach qui non sia applicabile adeguatamente.
Ma pure quando ricorrono tutti i presupposti descritti in precedenza,
l’indice alfa presenta due limiti nel suo utilizzo nell’ambito dei SEM.
Il primo deriva dal fatto che l’indice scaturisce dall’accorpamento delle
variabili manifeste in una sola variabile, così come descritto dalla (11),
la quale si rifà alla (10), ove è implicito che le q variabili sono tutte
parallele o tau – equivalenti, e pertanto hanno pari importanza nel
misurare il costrutto latente; questo tuttavia assai difficilmente trova
riscontro nel procedimento di stima, ove i factor loadings di norma
assumono valori tra loro diversi.
82
Il secondo limite deriva dal fatto che, secondo Hair et al. pag. 101, l’alfa
“is sensitive to the number of items in the scale”; poiché il contesto di
questa affermazione è quello dei modelli SEM, parlare di “number of
item” equivale a riferirsi al numero di variabili manifeste.
Concludiamo questo paragrafo soffermandoci sul fatto che gli autori
ritengono soddisfacente un valore di alfa superiore a 0,7 ; Hair et al.
pag. 102 aggiungono che valori superiori a 0,9 “are not desirable”, in
quanto devono destare il sospetto che alcuni item nel questionario
contengano in pratica la stessa domanda, soltanto formulata in termini
leggermente diversi. È evidente che sarebbe questo un modo fuorviante
di intendere l’omogeneità di un blocco di variabili manifeste.
6 – Il coefficiente rho di Dillon – Goldstein
Stante i limiti evidenziati al paragrafo 5 circa il coefficiente alfa, la
recente letteratura ha proposto di sostituirlo col coefficiente rho di
Dillon – Goldstein. Vediamo anzitutto come si perviene ad esso.
Sappiamo che il modello esterno secondo lo schema riflessivo consta di
un certo numero di equazioni; in generale, se j è la j – esima variabile
latente, essa si riflette in un certo numero di indicatori, siano q, talché si
può scrivere:
83
x1 = 1 j + 1
x2 = 2 j + 2
…
…. …
…
…. …
xq = q j + q
Consideriamo ora un indicatore che aggrega tutti i q indicatori;
analogamente a quanto si è effettuato con la (11), ora si ha:
q
H
¦x
k 1
¦ O S
q
k
k
k 1
j
Hk
q
q
k 1
k 1
S j ¦ Ok ¦ H k
Nel paragrafo 2 abbiamo ottenuto l’alfa di Cronbach prendendo le
mosse dal rapporto tra due varianze specificato nella (2). Su questa
medesima falsariga consideriamo il seguente rapporto tra due varianze:
U DG
½
­ q
Var ®S j ¦ O k ¾
¯ k1 ¿
Var ^H `
2
·
§ q
¨¨ ¦ O k ¸¸ Var ^S j `
©k 1 ¹
2
q
½
§ q
·
½
­ q
­ q
¨¨ ¦ O k ¸¸ Var ^S j ` Var ®¦ H k ¾ 2Cov ®S j ¦ O k ; ¦ H k ¾
k 1
¿
¯ k1
©k 1 ¹
¯k 1 ¿
Adottando l’ipotesi che in ogni equazione del modello esterno la
variabile latente (ovvero la sua stima) sia perfettamente incorrelata coi
rispettivi termini erratici – così come si è già ipotizzato peraltro con
84
riferimento alla (3) –, si dimostra che la variabile latente è perfettamente
incorrelata pure con la variabile erratica risultante dalla somma delle
singole variabili k.42 Ne consegue che la precedente espressione si
semplifica e ci permette di scrivere:
2
(17)
U DG
·
§ q
¨¨ ¦ Ok ¸¸ Var^S j `
©k 1 ¹
2
q
·
­q ½
§
¨¨ ¦ Ok ¸¸ Var^S j ` Var ®¦ H k ¾
¯k 1 ¿
©k 1 ¹
Se inoltre si adotta l’ipotesi di errori incorrelati – ipotesi già incontrata
prima ed espressa con la (8) –, la (17) diventa:
2
(18)
U DG
§ q
·
¨¨ ¦ Ok ¸¸ Var ^S j `
©k 1 ¹
2
q
q
§
·
¨¨ ¦ Ok ¸¸ Var ^S j ` ¦Var^H k `
k 1
©k 1 ¹
Siamo così pervenuti alla formula del coefficiente rho di Dillon –
Goldstein. Come si è visto, alla sua base c’è lo stesso rapporto di
varianze, indicato con x,x, col quale nel paragrafo 2 si intendeva
quantificare l’affidabilità (o attendibilità) di una variabile di misura. È
chiaro quindi che pure il rho di Dillon – Goldstein è un indice di
42
Basta tenere presente che per tre variabili qualsiasi si ha:
Cov{X + Y; Z } = Cov {X; Z } + Cov {Y; Z }.
Ora, se sono nulle le covarianze a secondo membro, è nulla altresì la covarianza a primo
membro.
85
affidabilità
43
ovvero, con la reinterpretazione descritta al paragrafo 5,
un indice di omogeneità. Ciò che lo differenzia in modo sostanziale
rispetto all’alfa di Cronbach è il fatto che il rho è calcolabile soltanto
previa stima del modello; si tratta quindi di un indice pensato
–
potremmo dire – in un’ottica di PLS – PM, ove infatti le variabili latenti
sono oggetto di stima. Osservando ancora come si è pervenuti alla (18),
e in particolare tenendo presente che la variabile H – che aggrega tutti i
q indicatori – deriva dalla somma dei singoli indicatori ciascuno
rispondente all’equazione xk = k j + k (per k = 1; 2; …; q ), si
constata che il rho non presuppone indicatori paralleli o tau –
equivalenti, ciò che invece costituisce un limite del coefficiente alfa.
La prassi seguita in letteratura è però quella di considerare l’indice in
parola calcolato su variabili standardizzate, ciò che semplifica
ulteriormente la (18):
2
(19)
43
U DG
§ q
·
¨¨ ¦ Ok ¸¸
©k 1 ¹
2
q
§ q
·
¨¨ ¦ Ok ¸¸ ¦Var^H k `
k 1
©k 1 ¹
2
§ q
·
¨¨ ¦ Ok ¸¸
©k 1 ¹
2
q
§ q
·
¨¨ ¦ Ok ¸¸ ¦ 1 O2k
©k 1 ¹ k 1
È significativo il fatto che Huber et al. pag. 35 usino per questo indice soltanto la
denominazione FR, acronimo di Faktor Reliabilität, anche se lo definiscono come
segue: “Die Faktorreliabilität ist ein Ma für die Beurteilung der Eignung eines Faktors
zur Erklärung des zu ihm in Beziehung stehenden Blocks reflektiver Indikatorvariablen”
= “L’affidabilità del fattore è una misura per valutare l’idoneità di un fattore a spiegare
il blocco di indicatori in relazione col fattore stesso secondo schema riflessivo”. Qui
l’affidabilità non si riferisce quindi alle variabili di misura (ossia agli indicatori), bensì
alla variabile fattore (ossia variabile latente).
86
Nell’ultimo passaggio si sfrutta quanto segue, ove l’asterisco in apice
indica standardizzazione:
Var {xk*} = Var {k j* + k }
1 = k2 Var {j*} + Var {k } + 2 Cov{k j* ; k}
Var {k } = 1 – k2
Ci domandiamo ora quali sono i valori estremi dell’indice in parola.
Una semplice ispezione della (19) permette subito di dedurre che se tutti
i parametri k assumono valore zero, anche DG è pari a zero, e questo
costituisce il valore minimo. L’ispezione della (19) non offre invece
alcun facile appiglio per stabilire il valore massimo. Tuttavia, se si tiene
presente che nella (19) le variabili sono standardizzate, e che le stime
dei k (così detti factor loadings) sono calcolate mediante regressione
semplice, vale quanto segue:
Ok
^
Cov S *j ; x k*
^ `
Var xk*
`
^
Cor S *j ; x k*
`
1
È noto inoltre che in una regressione semplice il coefficiente di
correlazione tra la variabile dipendente e quella indipendente, elevato al
quadrato, coincide col coefficiente di determinazione; pertanto si
conclude che è k2 = R2. Possiamo dunque affermare che quando i
factor loadings sono tutti nulli (come abbiamo visto che si verifica
qualora la (19) assuma valore nullo), le regressioni eseguite
nell’algoritmo di stima sono pessime regressioni, visto che sono pari a
zero tutti i coefficienti di determinazione. Ci domandiamo allora che
valore assumerebbe la (19) nella situazione opposta, ossia quando per
87
tutte le anzidette regressioni i rispettivi coefficienti di determinazione
risultassero pari a 1, il valore massimo. Denotando sempre con q il
numero di indicatori, cui corrispondono altrettante regressioni, nella
(19) si ha:
U DG
q2
1
q2 0
Abbiamo così stabilito che il rho di Dillon – Goldstein può variare tra 0
e 1.
Un’ultima considerazione che ci sembra interessante svolgere fa
riferimento all’indice di comunalità, che abbiamo presentato nel
paragrafo 4 di questo paper come un indice di bontà del modello di
misurazione. Sempre nel presupposto di variabili standardizzate, tale
indice assume il seguente aspetto (per quanto se ne possano trovare
anche altri, equivalenti a questo):
q
(20)
Com
¦O
2
k
k 1
q
q
¦ O ¦ (1 O
2
k
k 1
2
k
)
k 1
Si tratta di una formula non molto differente, almeno di primo acchito,
da quella del rho come appare nella (19). Il confronto tra le due formule
appare più istruttivo con riferimento a queste due formule:
q
(19bis)
88
U DG
q2 q
P
2
1
q2 q
q
P
2
¦ O2k k
q
(20bis)
Com
¦O
2
k
k 1
q
Nella (19bis) abbiamo indicato con P il doppio prodotto incrociato
risultante dallo sviluppo del polinomio al quadrato (1 + 2 + …. + q)2,
e con
q2 q
il numero di tali doppi prodotti incrociati. Pertanto i due
2
indici differiscono solo per il fatto che a numeratore e a denominatore
del rho di Dillon – Goldstein viene aggiunta una stessa quantità. Si
verifica empiricamente che con questa aggiunta l’indice rho risulta più
elevato dell’indice di comunalità; l’incremento tuttavia è sempre più
modesto man mano che già l’indice di comunalità risulta elevato.
Ci sembra di poter concludere che, sebbene il rho venga presentato
come una preferibile alternativa all’alfa di Cronbach (ed effettivamente
tali due indici scaturiscono – come si è visto – dallo stesso “punto di
avvio”), il fatto che esso venga calcolato mediante la stima dei
parametri presenti nel modello di misurazione (cioè i k ), rende il rho
un indice, a nostro avviso, idoneo più a valutare la bontà del modello di
misurazione (in alternativa all’indice di comunalità), che non a valutare
l’omogeneità di un blocco di variabili manifeste (in alternativa all’alfa
di Cronbach).
89
Bibliografia
Bagozzi R. P. (ed.) (1994): Advanced Methods of Marketing Research
– BLACKWELL PUBLISHERS.
Bollen K. A. (1989): Structural Equations with Latent Variables –
WILEY.
Brown T. A. (2006): Confirmatory Factor Analysis for Applied
Research – THE GUILFORD PRESS.
Corbetta P. (1992): Metodi di analisi multivariata per le scienze
sociali. I modelli di equazioni strutturali – IL MULINO.
Cronbach, L.J. (1951): Coefficient alpha and the internal structure of
tests – in Psychometrika, 16, 297 – 334.
Esposito Vinzi V., Chin W. W., Henseler J., Wang H. (eds.) (2010):
Handbook of Partial Least Squares. Concepts, Methods and
Applications – SPRINGER.
Hair J. F., Hult G. Tomas M., Ringle C. M., Sarstedt M. (2014): A
Primer on Partial Least Squares Structural Equation Modeling (PLS –
SEM) – SAGE.
90
Hayes B. E. (2008): Measuring Customer Satisfaction and Loyalty –
ASQ QUALITY PRESS.
Huber F., Herrmann A., Meyer F., Vogel J., Vollhardt K. (2007):
Kausalmodellierung
mit
Partial
Least
Squares.
Eine
anwendungsorientierte Einführung – GABLER.
Kaplan, D (2000): Structural Equation Modeling – SAGE.
Kenett R. S., Salini S. (eds.) (2012): Modern Analysis of Customer
Surveys: with Applications using R – WILEY.
Nunnally J. C. (1967): Psychometric Theory – McGRAW – HILL.
Pagano A., Vittadini G. (a cura di) (2004): Qualità e valutazione delle
strutture sanitarie. Manuale di analisi e misurazione della performance –
ETAS.
91
Dipartimento di Discipline matematiche,
Finanza matematica ed Econometria
Working Papers
2012
12.1. CARSTEN KRABBE NIELSEN & GERD WEINRICH,
Bank Regulation when both Deposit Rate Control and
Capital Requirements are Socially Costly, maggio 2012.
12.2. FAUSTO MIGNANEGO & ALESSANDRO SBUELZ,
Analytical cyclical price-dividend ratios, luglio 2012.
12.3. FEDERICA BARZI, FLAVIA CORTELEZZI, GIOVANNI
MARSEGUERRA & MARIA GRAZIA ZOIA, Cooperative
innovation. Evidence from Italian firms, novembre 2012.
2013
13.1 CLEMENTE
GIAN
PAOLO
&
CORNARO
ALESSANDRA, Lower Bounds for Kirchhoff Index: a
Numerical Procedure, gennaio 2013.
13.2 WEDLIN ATTILIO, Processi stocastici “Jump-Diffusion”:
aspetti probabilistici, gennaio 2013.
13.3 VALERIO POTÌ & MARIA GRAZIA ZOIA, Tailoring the
logistic distribution to fit the empirical distribution of
financial asset returns, febbraio 2013.
92
13.4 LAURA
BARBIERI,
FLAVIA
CORTELEZZI,
GIOVANNI MARSEGUERRA & MARIA GRAZIA
ZOIA, Technological status of the Italian companies,
giugno 2013.
13.5 LUCA BAGNATO, LUCIO DE CAPITANI, ANGELO
MAZZA & ANTONIO PUNZO, SDD: An R package for
Serial Dependence Diagrams, giugno 2013.
13.6 FLAVIA CORTELEZZI, GIOVANNI MARSEGUERRA,
MASSIMILIANO RIGON & MARIA GRAZIA ZOIA, Is
collaboration with Universities really beneficial for firms?
Evidence form Italy, giugno 2013.
13.7 NICOLÒ PECORA & ALESSANDRO SPELTA,
Macroeconomic stability and heterogeneous expectations,
luglio 2013.
13.8 MICHELE LONGO & ALESSANDRA MAININI,
Portfolio Optimization Under Partial Information and
CARA preferences, luglio 2013.
13.9 MICHELE LONGO & ALESSANDRA MAININI,
Portfolio Comparison with Complete and Partial
Observation for a HARA Investor, luglio 2013.
13.10 LUCA BAGNATO, VALERIO POTÌ & MARIA GRAZIA
ZOIA, Beyond the Gaussian law: the role of orthogonal
polynomials, hyperbolic secant and logistic distributions in
fitting with empirical evidence of financial asset returns,
ottobre 2013.
93
2014
14.1 DI SALVO ANGELO, Un’indagine di customer
satisfaction nei servizi di factoring analizzata mediante il
modello ad equazioni strutturali con variabili latenti,
maggio 2014.
94
95
Finito di stampare da
Gi&Gi srl - Triuggio (MB)
Giugno 2014
96
COP DiSalvo_14-01.qxd:_ 29/05/14 11:11 Page 1
DIPARTIMENTO DI DISCIPLINE MATEMATICHE,
FINANZA MATEMATICA ED ECONOMETRIA
WORKING PAPER N. 14/1
Un’indagine di customer satisfaction
nei servizi di factoring
analizzata mediante il modello
ad equazioni strutturali
con variabili latenti
Angelo Di Salvo