Nota Metodologica sulla Costruzione degli Indicatori Sintetici di
Transcript
Nota Metodologica sulla Costruzione degli Indicatori Sintetici di
Nota Metodologica sulla Costruzione degli Indicatori Sintetici di Qualità della Vita Simone Landini (Ires Piemonte) Il problema che ci si è posto nell'impiego del così detto "metodo Stiglitz" (Stiglitz et alt. (2009)) è stato quello di quali dimensioni essenziali rilevare per misurare, secondo un metodo riconosciuto e condiviso, la qualità della vita nella nostra regione in modo da poter operare dei confronti con altre regioni d'Italia ed, eventualmente, non solo. Costruite le diverse dimensioni della nozione condivisa di qualità della vota s'è provvisto ad identificare, per ciascuna, una batteria di indicatori. Il modello concettuale adottato ha portato ad identificare 8 dimensioni ciascuna delle quali è stata alimentata con un diverso numero di indicatori producendo un insieme di 64 variabili. Se queste sono le dimensioni della qualità della vita, secondo una scelta ovviamente non inconfutabile, il successivo problema è quello di sintetizzare questa massa di informazioni in 8 indicatori sintetici. Il problema è dunque quello di aggregare, entro ogni dimensione, il volume di indicatori in un unico indicatore che proponga una misura sintetica di quella specifica dimensione della qualità della vita. Le metodologie di riduzione dei dati (indicatori) in indici omogenei sono differenti e spesso motivate dal fatto che due o più indicatori in una batteria sono fra loro fortemente correlati. Interpretando questa correlazione come chiaro indice di ridondanza si è propensi ad eliminare alcuni indicatori conservandone altri. Metodologicamente, questa pratica non è consigliabile, almeno non in generale. In assenza di una consolidata teoria per cui si sia in grado di trovare conseguenze coerenti con il dato empirico, la rimozione di un indicatore sulla base della sua correlazione con gli altri è del tutto arbitraria, almeno nel contesto in cui ci poniamo nel nostro caso. Anzitutto, non possiamo stabilire, se non in modo arbitrario, il livello d'intensità della correlazione al di sopra (sotto) del quale essa sia da ritenersi forte (debole), tenuto poi conto che la correlazione non ha solo un'intensità ma anche una direzione. In secondo luogo, non sapendo quale sia il tipo di relazione funzionale (se esiste) che lega due indicatori tra loro e che, eventualmente, li congiunge nella "spiegazione" della covariazione con un terzo, potremmo rimuovere un indicatore ritenuto ridondante sulla base della correlazione (lineare) quando, però, la sua relazione funzionale con gli altri è di altro tipo. In terzo luogo, poiché nel campo delle discipline sociali non è univoca la determinazione di un indicatore per la misurazione di un concetto quale astrazione di un fatto o di un fenomeno, o anche solo di un suo parziale aspetto, il disporre di due indicatori differenti, e dalle diverse definizioni operative che mantengono alta la loro correlazione semantica col fenomeno che intendono descrivere, può essere utile proprio per comprendere i diversi aspetti di un unico concetto. Infine, il problema non è di carattere meramente statistico ma, più spesso, è di valenza sociologica o economica, a seconda del campo d'indagine. Cioè, se gli studiosi hanno selezionato un insieme di indicatori sulla base della letteratura e/o delle loro convinzioni suffragate da qualche conferma empirica, il fatto di escludere uno o più di questi indicatori è come togliere qualcosa ad uno strumento esplicativo salvo poi lamentare la sua scarsa capacità di descrivere quanto di proponeva di spiegare. In sostanza, se l'obiettivo della costruzione di un insieme di indicatori è quello di descrivere le diverse direttrici concettuali di un fenomeno e, salvo evidenti casi di sovrapposizione deterministica, la sintesi non deve procedere per eliminazione ma deve avvenire meditante procedure aggregative che conducano ad una riduzione della complessità informativa senza compromettere la variabilità ma tenendone conto. La tecnica che più tipicamente si è propensi ad applicare nella riduzione della complessità informativa in un insieme di indicatori è quella delle Componenti Principali. Questa tecnica si basa sulla matrice delle correlazioni per generare indici privi di unità di misura e fra loro ortogonali che integrano tutto il contenuto informativo della base dati di partenza. Con opportuni criteri è poi possibile scegliere un numero ristretto di componenti ritenuto sufficiente per la spiegazione di buona parte della variabilità nei dati. Il vantaggio è indubbio, abbiamo uno strumento di sintesi automatico e controllabile, ma con alcuni svantaggi. Non sono infatti rari i casi di frustrazione quando le componenti estratte si correlano con le variabili di partenza in modo "apparentemente" astruso da non consentire una loro chiara interpretazione. Inoltre, al termine del procedimento d'estrazione è molto frequente trovare che un'elevatissima percentuale della variabilità nei dati è spiegabile con una sola componente. Nel nostro contesto di sintesi di variabili in un unico indicatore questa tecnica potrebbe sembrare adeguata: se operiamo l'estrazione delle componenti entro ogni gruppo relativo ad una precisa dimensione della qualità della vita, la sintesi estrema è proprio quanto desideriamo, pur tuttavia potrebbe rimanere il problema interpretativo della componente estratta per questo gruppo. Infatti, se essa è capace di spiegare la maggior parte della variabilità nel gruppo di indicatori ciò avviene perché, per la maggior parte, gli indicatori sono fortemente correlati con essa. Di conseguenza, molte variabili eterogenee si correlano con un unico "fattore" e spesso l'interpretazione di questa componente non è così chiara da poterla attribuire alla dimensione in questione. Ma ammettiamo pure di voler comunque utilizzare questa componente come l'indicatore di sintesi della dimensione in questione, ed impieghiamola per stilare una graduatoria delle unità d'osservazione, ch'è poi l'obiettivo ultimo per cui vogliamo i nostri 8 indicatori di sintesi. Ripetiamo questo procedimento per tutte le altre dimensioni. Al termine, nel nostro caso, avremmo 8 indicatori di sintesi estrema corrispondenti ciascuno alla prima componente principale estratta dagli 8 diversi insiemi di indicatori. L'unico vantaggio effettivo di questo metodo è la sua semplicità ma non coglie un aspetto importante del procedimento di sintesi che vogliamo ottenere. Tutti gli indicatori di un insieme, quando vengono sottoposti all'estrazione delle componenti principali, vengono trattati allo stesso modo, tutti con la medesima importanza: questa è un'assunzione molto forte, giustificabile solo quando gli indicatori coinvolti sono effettivamente quelli necessari, e non altri, per una corretta misurazione. Cosa capita in questi casi se il potere esplicativo della prima componente è praticamente identico a quello della seconda? Dovremmo considerare due componenti, ma non è possibile data la nostra necessità d'avere un solo indicatore. La scelta della prima componente sarebbe dunque affidata a pochi punti percentuali di varianza spiegata. In definitiva, benché tecnicamente corretto e semplice, da un punto di vista teorico il risultato ottenuto potrebbe non essere quello più appropriato per cogliere i differenziali tra le diverse unità d'osservazione per costruire una graduatoria. Oltre alle Componenti Principali esistono altre tecniche impiegabili, il parente più prossimo è d'altra parte l'Analisi Fattoriale, ma comporta i medesimi problemi più altri specifici del metodo. Un immediato sostituto di queste tecniche di riduzione è la composizione di indicatori (opportunamente standardizzati e spesso nornalizzati) mediante un sistema di ponderazione, che il più delle volte è arbitrario e spesso è solo un espediente; nel rapporto sul "metodo Stiglitz" (Stiglitz et alt. (2009)) si suggerisce una ponderazione molto spartana, ma d'altra parte quel documento ha solo la funzione di linea guida senza pretesa d'esaustività. In letteratura, però, si possono trovare vari metodi di costruzione degli indici di sintesi, tutti hanno i loro vantaggi ed i loro svantaggi. In ogni caso, la difficoltà principale di tutti è quella di combinare indicatori diversi nel tentativo di unificarli sulla base d'una loro ipotetica correlazione con il fenomeno che intendono misurare. Non esiste in vero il metodo migliore per compiere questa operazione, infatti tutto è dipendente dall'obiettivo finale e metodi anche simili possono condurre a risultati diversi, per una rassegna è possibile consultare Aiello e Attanasio (2004) oppure Nardo et alt. (2005). Nel nostro caso abbiamo preferito seguire il metodo proposto da Mazziotta M. e Pareto (2007): nel descrivere brevemente questo metodo diverrà chiaro il motivo della nostra scelta. Il metodo impiegato è detto MPCV, metodo delle penalità per il coefficiente di variazione, e si dimostra essere particolarmente adeguato per costruire misure sintetiche di un certo aspetto quando si considera che (a) gli indicatori scelti siano solo parzialmente sostituibili per trattare un determinato fenomeno, quindi si pone estrema fiducia sugli studi preliminari o sulle conclusioni rinvenibili in letteratura per il problema in esame, e (b) non si vuol penalizzare quelle unità d'osservazione che assumono valori estremi o prossimi allo zero per alcuni indicatori. In breve, questo metodo opera una standardizzazione dei dati per avere valori numerici puri, cioè privi di unità di misura. Successivamente, per ciascuna unità d'osservazione, valuta "orizzontalmente" il valore medio di tutti gli indicatori standardizzati, come prima approssimazione di sintesi, lo scarto quadratico medio dei valori assunti dagli indicatori per l'unità d'osservazione in questione, poi si valuta il coefficiente di variazione rapportando lo "scarto quadratico medio orizzontale" al "valor medio orizzontale": questo coefficiente misura quindi quella che dagli autori è detta "variabilità orizzontale". Infine, per ciascuna unità, il calcolo dell'indice MPCV avviene operando il prodotto del "valor medio orizzontale" dei valori degli indicatori standardizzati per il complemento ad uno del quadrato del "coefficiente di variazione orizzontale": quel che risulta è dunque un indice che, per ogni unità, vede il "valor medio orizzontale" degli indicatori standardizzati corretto da un fattore che varia in proporzione diretta del "coefficiente di variazione orizzontale". Dunque, maggiore è la media orizzontale e minore è lo scarto quadratico medio orizzontale, maggiore sarà il valore dell'indice. Ciò consente di penalizzare il punteggio delle unità che, a parità di media aritmetica, hanno maggiore squilibrio tra i valori degli indicatori. […] non risente della pesenza di valori anomali (outliers) ed è facilmente interpretabile e comparabile nel tempo. (Mazziotta C. et alt. (2008)). Riferimenti Bibliografici AIELLO F., ATTANASIO M., (2004), How to transform a batch of simple indicators to make up a unique one?, Società Italiana di Statistica, Atti della XLII Riunione Scientifica, CLEUP, Padova. MAZZIOTTA M. E PARETO A., (2007), Un indicatore sintetico di dotazione infrastrutturale: il metodo delle penalità per coefficiente di variazione. In: AISRe, Lo sviluppo regionale nell'Unione Europea ‐ Obiettivi, strategie, politiche. Atti della XXVIII Conferenza Italiana di Scienze Regionali, Bolzano. MAZZIOTTA C., MAZZIOTTA M., PARETO A. E VIDOLI F., (2008), La costruzione di un indicatore sintetico di dotazione infrastrutturale: metodi ed applicazioni a confronto. In: AISRe, Coniscienza, sviluppo umano e territorio. Atti della XXIX Conferenza Italiana di Scienze Regionali, Bari. NARDO M., SAISANA M., SALTELLI A., HOFFMAN A. E GIOVANNINI E., (2005), “Handbook on constructing composite indicators: methodology and user guide”, OECD Statistics Working Papers JT00188147, Paris. STIGLITZ J., SEN A., FITOUSSI JP., (2009) "Report of the commission on the measurement of economic performance end social progress", CMEPSP.