Nota Metodologica sulla Costruzione degli Indicatori Sintetici di

Transcript

Nota Metodologica sulla Costruzione degli Indicatori Sintetici di
Nota Metodologica sulla Costruzione degli Indicatori Sintetici di Qualità della Vita
Simone Landini (Ires Piemonte)
Il problema che ci si è posto nell'impiego del così detto "metodo Stiglitz" (Stiglitz et alt. (2009)) è
stato quello di quali dimensioni essenziali rilevare per misurare, secondo un metodo riconosciuto e
condiviso, la qualità della vita nella nostra regione in modo da poter operare dei confronti con altre regioni
d'Italia ed, eventualmente, non solo. Costruite le diverse dimensioni della nozione condivisa di qualità della
vota s'è provvisto ad identificare, per ciascuna, una batteria di indicatori.
Il modello concettuale adottato ha portato ad identificare 8 dimensioni ciascuna delle quali è stata
alimentata con un diverso numero di indicatori producendo un insieme di 64 variabili. Se queste sono le
dimensioni della qualità della vita, secondo una scelta ovviamente non inconfutabile, il successivo problema
è quello di sintetizzare questa massa di informazioni in 8 indicatori sintetici. Il problema è dunque quello di
aggregare, entro ogni dimensione, il volume di indicatori in un unico indicatore che proponga una misura
sintetica di quella specifica dimensione della qualità della vita.
Le metodologie di riduzione dei dati (indicatori) in indici omogenei sono differenti e spesso
motivate dal fatto che due o più indicatori in una batteria sono fra loro fortemente correlati. Interpretando
questa correlazione come chiaro indice di ridondanza si è propensi ad eliminare alcuni indicatori
conservandone altri. Metodologicamente, questa pratica non è consigliabile, almeno non in generale. In
assenza di una consolidata teoria per cui si sia in grado di trovare conseguenze coerenti con il dato
empirico, la rimozione di un indicatore sulla base della sua correlazione con gli altri è del tutto arbitraria,
almeno nel contesto in cui ci poniamo nel nostro caso.
Anzitutto, non possiamo stabilire, se non in modo arbitrario, il livello d'intensità della correlazione al di
sopra (sotto) del quale essa sia da ritenersi forte (debole), tenuto poi conto che la correlazione non ha solo
un'intensità ma anche una direzione. In secondo luogo, non sapendo quale sia il tipo di relazione funzionale
(se esiste) che lega due indicatori tra loro e che, eventualmente, li congiunge nella "spiegazione" della
covariazione con un terzo, potremmo rimuovere un indicatore ritenuto ridondante sulla base della
correlazione (lineare) quando, però, la sua relazione funzionale con gli altri è di altro tipo. In terzo luogo,
poiché nel campo delle discipline sociali non è univoca la determinazione di un indicatore per la
misurazione di un concetto quale astrazione di un fatto o di un fenomeno, o anche solo di un suo parziale
aspetto, il disporre di due indicatori differenti, e dalle diverse definizioni operative che mantengono alta la
loro correlazione semantica col fenomeno che intendono descrivere, può essere utile proprio per
comprendere i diversi aspetti di un unico concetto. Infine, il problema non è di carattere meramente
statistico ma, più spesso, è di valenza sociologica o economica, a seconda del campo d'indagine. Cioè, se gli
studiosi hanno selezionato un insieme di indicatori sulla base della letteratura e/o delle loro convinzioni
suffragate da qualche conferma empirica, il fatto di escludere uno o più di questi indicatori è come togliere
qualcosa ad uno strumento esplicativo salvo poi lamentare la sua scarsa capacità di descrivere quanto di
proponeva di spiegare.
In sostanza, se l'obiettivo della costruzione di un insieme di indicatori è quello di descrivere le diverse
direttrici concettuali di un fenomeno e, salvo evidenti casi di sovrapposizione deterministica, la sintesi non
deve procedere per eliminazione ma deve avvenire meditante procedure aggregative che conducano ad
una riduzione della complessità informativa senza compromettere la variabilità ma tenendone conto.
La tecnica che più tipicamente si è propensi ad applicare nella riduzione della complessità
informativa in un insieme di indicatori è quella delle Componenti Principali. Questa tecnica si basa sulla
matrice delle correlazioni per generare indici privi di unità di misura e fra loro ortogonali che integrano
tutto il contenuto informativo della base dati di partenza. Con opportuni criteri è poi possibile scegliere un
numero ristretto di componenti ritenuto sufficiente per la spiegazione di buona parte della variabilità nei
dati. Il vantaggio è indubbio, abbiamo uno strumento di sintesi automatico e controllabile, ma con alcuni
svantaggi. Non sono infatti rari i casi di frustrazione quando le componenti estratte si correlano con le
variabili di partenza in modo "apparentemente" astruso da non consentire una loro chiara interpretazione.
Inoltre, al termine del procedimento d'estrazione è molto frequente trovare che un'elevatissima
percentuale della variabilità nei dati è spiegabile con una sola componente. Nel nostro contesto di sintesi di
variabili in un unico indicatore questa tecnica potrebbe sembrare adeguata: se operiamo l'estrazione delle
componenti entro ogni gruppo relativo ad una precisa dimensione della qualità della vita, la sintesi estrema
è proprio quanto desideriamo, pur tuttavia potrebbe rimanere il problema interpretativo della componente
estratta per questo gruppo. Infatti, se essa è capace di spiegare la maggior parte della variabilità nel gruppo
di indicatori ciò avviene perché, per la maggior parte, gli indicatori sono fortemente correlati con essa. Di
conseguenza, molte variabili eterogenee si correlano con un unico "fattore" e spesso l'interpretazione di
questa componente non è così chiara da poterla attribuire alla dimensione in questione. Ma ammettiamo
pure di voler comunque utilizzare questa componente come l'indicatore di sintesi della dimensione in
questione, ed impieghiamola per stilare una graduatoria delle unità d'osservazione, ch'è poi l'obiettivo
ultimo per cui vogliamo i nostri 8 indicatori di sintesi. Ripetiamo questo procedimento per tutte le altre
dimensioni. Al termine, nel nostro caso, avremmo 8 indicatori di sintesi estrema corrispondenti ciascuno
alla prima componente principale estratta dagli 8 diversi insiemi di indicatori. L'unico vantaggio effettivo di
questo metodo è la sua semplicità ma non coglie un aspetto importante del procedimento di sintesi che
vogliamo ottenere. Tutti gli indicatori di un insieme, quando vengono sottoposti all'estrazione delle
componenti principali, vengono trattati allo stesso modo, tutti con la medesima importanza: questa è
un'assunzione molto forte, giustificabile solo quando gli indicatori coinvolti sono effettivamente quelli
necessari, e non altri, per una corretta misurazione. Cosa capita in questi casi se il potere esplicativo della
prima componente è praticamente identico a quello della seconda? Dovremmo considerare due
componenti, ma non è possibile data la nostra necessità d'avere un solo indicatore. La scelta della prima
componente sarebbe dunque affidata a pochi punti percentuali di varianza spiegata. In definitiva, benché
tecnicamente corretto e semplice, da un punto di vista teorico il risultato ottenuto potrebbe non essere
quello più appropriato per cogliere i differenziali tra le diverse unità d'osservazione per costruire una
graduatoria.
Oltre alle Componenti Principali esistono altre tecniche impiegabili, il parente più prossimo è d'altra
parte l'Analisi Fattoriale, ma comporta i medesimi problemi più altri specifici del metodo. Un immediato
sostituto di queste tecniche di riduzione è la composizione di indicatori (opportunamente standardizzati e
spesso nornalizzati) mediante un sistema di ponderazione, che il più delle volte è arbitrario e spesso è solo
un espediente; nel rapporto sul "metodo Stiglitz" (Stiglitz et alt. (2009)) si suggerisce una ponderazione
molto spartana, ma d'altra parte quel documento ha solo la funzione di linea guida senza pretesa
d'esaustività. In letteratura, però, si possono trovare vari metodi di costruzione degli indici di sintesi, tutti
hanno i loro vantaggi ed i loro svantaggi. In ogni caso, la difficoltà principale di tutti è quella di combinare
indicatori diversi nel tentativo di unificarli sulla base d'una loro ipotetica correlazione con il fenomeno che
intendono misurare. Non esiste in vero il metodo migliore per compiere questa operazione, infatti tutto è
dipendente dall'obiettivo finale e metodi anche simili possono condurre a risultati diversi, per una rassegna
è possibile consultare Aiello e Attanasio (2004) oppure Nardo et alt. (2005). Nel nostro caso abbiamo
preferito seguire il metodo proposto da Mazziotta M. e Pareto (2007): nel descrivere brevemente questo
metodo diverrà chiaro il motivo della nostra scelta.
Il metodo impiegato è detto MPCV, metodo delle penalità per il coefficiente di variazione, e si
dimostra essere particolarmente adeguato per costruire misure sintetiche di un certo aspetto quando si
considera che (a) gli indicatori scelti siano solo parzialmente sostituibili per trattare un determinato
fenomeno, quindi si pone estrema fiducia sugli studi preliminari o sulle conclusioni rinvenibili in letteratura
per il problema in esame, e (b) non si vuol penalizzare quelle unità d'osservazione che assumono valori
estremi o prossimi allo zero per alcuni indicatori. In breve, questo metodo opera una standardizzazione dei
dati per avere valori numerici puri, cioè privi di unità di misura. Successivamente, per ciascuna unità
d'osservazione, valuta "orizzontalmente" il valore medio di tutti gli indicatori standardizzati, come prima
approssimazione di sintesi, lo scarto quadratico medio dei valori assunti dagli indicatori per l'unità
d'osservazione in questione, poi si valuta il coefficiente di variazione rapportando lo "scarto quadratico
medio orizzontale" al "valor medio orizzontale": questo coefficiente misura quindi quella che dagli autori è
detta "variabilità orizzontale". Infine, per ciascuna unità, il calcolo dell'indice MPCV avviene operando il
prodotto del "valor medio orizzontale" dei valori degli indicatori standardizzati per il complemento ad uno
del quadrato del "coefficiente di variazione orizzontale": quel che risulta è dunque un indice che, per ogni
unità, vede il "valor medio orizzontale" degli indicatori standardizzati corretto da un fattore che varia in
proporzione diretta del "coefficiente di variazione orizzontale". Dunque, maggiore è la media orizzontale e
minore è lo scarto quadratico medio orizzontale, maggiore sarà il valore dell'indice. Ciò consente di
penalizzare il punteggio delle unità che, a parità di media aritmetica, hanno maggiore squilibrio tra i valori
degli indicatori. […] non risente della pesenza di valori anomali (outliers) ed è facilmente interpretabile e
comparabile nel tempo. (Mazziotta C. et alt. (2008)).
Riferimenti Bibliografici
AIELLO F., ATTANASIO M., (2004), How to transform a batch of simple indicators to make up a unique one?,
Società Italiana di Statistica, Atti della XLII Riunione Scientifica, CLEUP, Padova.
MAZZIOTTA M. E PARETO A., (2007), Un indicatore sintetico di dotazione infrastrutturale: il metodo delle
penalità per coefficiente di variazione. In: AISRe, Lo sviluppo regionale nell'Unione Europea ‐ Obiettivi,
strategie, politiche. Atti della XXVIII Conferenza Italiana di Scienze Regionali, Bolzano.
MAZZIOTTA C., MAZZIOTTA M., PARETO A. E VIDOLI F., (2008), La costruzione di un indicatore sintetico di
dotazione infrastrutturale: metodi ed applicazioni a confronto. In: AISRe, Coniscienza, sviluppo umano e
territorio. Atti della XXIX Conferenza Italiana di Scienze Regionali, Bari.
NARDO M., SAISANA M., SALTELLI A., HOFFMAN A. E GIOVANNINI E., (2005), “Handbook on constructing composite
indicators: methodology and user guide”, OECD Statistics Working Papers JT00188147, Paris.
STIGLITZ J., SEN A., FITOUSSI JP., (2009) "Report of the commission on the measurement of economic
performance end social progress", CMEPSP.