Indicatori, validità, costruzione di indici
Transcript
Indicatori, validità, costruzione di indici
Indicatori, validità, costruzione di indici1 8.1. PERCHÉ INDICATORI? Nel capitolo 6 ho dato per scontato che stabilire una definizione operativa2 ponga soltanto problemi pratici: trovare la tabella del censimento con i dati desiderati, calcolare percentuali, formulare il testo di una domanda e i testi delle risposte prestabilite che si offriranno alla scelta dell’intervistato, etc. Ma non sempre ci sono solo problemi pratici. Talvolta la natura della proprietà in esame non permette assolutamente di immaginare una definizione operativa diretta3 altre volte la si può immaginare, ma il buon senso, la conoscenza della situazione, l’esperienza di ricerca, ci inducono a pensare che quella definizione operativa sarebbe inadatta a registrare fedelmente gli stati sulla proprietà in questione. Immaginiamo ad esempio che la nostra unità di analisi sia lo Stato, il nostro ambito sia l’Europa e la proprietà che ci interessa sia il livello di libertà politica di cui godono i cittadini di ciascuno Stato. Una definizione operativa diretta sarebbe qualcosa come: 1. trovare la signora Germania, la signora Polonia, la signora Russia, etc. e chiedere qual è il livello di libertà politica dei loro cittadini; 2. invitare queste signore a rispondere scegliendo uno dei seguenti livelli: nessuna libertà/poca/insufficiente/sufficiente/molta/moltissima. Ma una cosa del genere è chiaramente impossibile, perché la signora Germania, la signora Polonia, la signora Russia, etc. non esistono. Si potrebbe pensare di sottoporre la domanda al presidente di ciascuno Stato; ma la sua risposta non sarebbe affidabile, perché anche il peggior dittatore dichiarerebbe che i suoi cittadini godono di una piena libertà politica. Si registrerebbe l’immagine che i presidenti vogliono dare del livello di libertà politica dei loro paesi, che è tutt’altra cosa del livello in se stesso. Un’idea apparentemente migliore sarebbe porre la domanda a campioni di cittadini di quei paesi chiedendo le loro opinioni. Ma questa soluzione pone problemi ancora più grandi, che si possono sintetizzare con la domanda: “L’opinione di chi?”. Ad essa inevitabilmente seguirebbero altre, come: Si considera un campione di tutti i cittadini adulti, o solo di quelli che hanno una qualche idea di ciò che si intende per ‘libertà politica’? E come giudicare quali cittadini sono veramente competenti? Si considera un campione di tutti i cittadini adulti, o solo di quelli che non hanno paura di manifestare a un perfetto sconosciuto la loro opinione su un problema tanto delicato? E come individuare chi sta dicendo ciò che pensa veramente? Inoltre, considerando che le opinioni variano da soggetto a soggetto, quale opinione si assumerà come stato sulla proprietà ‘livello di libertà politica’ di ciascun Stato 1 Questo capitolo è una traduzione, rivista e integrata dall’autore, del capitolo «Indicadores, validez, construcciòn de indices’ nel volume «Metodologia de las ciencias sociales”, Buenos Aires, Ariel, 2007. 2 Cioè fissare l’insieme di atti, regole e convenzioni che permettono di trasformare una pro¬prietà di alcuni oggetti di un certo tipo in una variabile nella matrice dei dati. 3 Cioè, strettamente associata alla proprietà in questione e da essa direttamente suggerita, senza alcun margine per ragionevoli perplessità. 1 studiato? Si potrebbe assumere l’opinione modale (cioè quella condivisa dal maggior numero di soggetti) o l’opinione mediana, se si propone agli intervistati una specie di scala ordinale come quella menzionata sopra4. Infine, anche ammettendo di poter estrarre in ciascuno Stato solo campioni di cittadini competenti e sinceri nel manifestare i loro giudizi, quello che si registrerà sarà solo l’opinione modale (o mediana) di questi cittadini sul grado di libertà politica del rispettivo Stato. Non si può negare che questa opinione abbia qualche relazione con il livello di libertà politica in sé; ma non si può neppure affermare che siano la stessa cosa. Si cerca il livello di libertà politica, ma si ottiene — nel migliore dei casi — l’opinione di cittadini abbastanza competenti e forse sinceri. Come tutte le opinioni, questa può essere errata (nel caso, troppo benevola o troppo critica verso il proprio paese). Immaginiamo ora che il nostro ambito sia l’Italia, la nostra unità di analisi sia il maschio adulto, e la proprietà che interessa sia il grado di autoritarismo. In questo caso, la strada per una definizione operativa diretta appare semplice. Senza sforzo, si possono immaginare domande come: “Qual è il suo grado di autoritarismo?” e risposte come: inesistente/basso/medio/alto. Però talvolta le soluzioni semplici portano fuori strada; e questo sarebbe proprio un esempio. In effetti, non si registrerebbe il grado di autoritarismo, ma la propensione di ciascun maschio adulto a dichiararsi autoritario — una propensione rara in tutti gli individui, e probabilmente ancor più rara tra gli individui autoritari. Si potrebbero fare altri esempi; ma quelli fatti bastano a stabilire alcuni criteri generali: 1. Non si può immaginare una definizione operativa diretta ogni volta che: a) l’unità di analisi è qualcosa che non si può interrogare (un ente, un aggregato territoriale, etc.) e b) gli stati sulla proprietà indagata non si possono rilevare mediante osservazione diretta o estrarre da documenti ufficiali (come si può fare per la superficie, il tipo di sistema elettorale, il numero di abitanti, il numero di voti per un partito, etc.). 2. Una definizione operativa diretta si può immaginare, ma non è affidabile (abbiamo cioè motivo di pensare che produrrà molti dati infedeli) ogni volta che l’unità di analisi è un essere umano e che la proprietà indagata: a) ha risposte socialmente desiderabili (quasi tutti diranno di essere onesti e generosi e negheranno di essere autoritari, ossessivi, noiosi, sleali, etc.); b) è un concetto familiare allo scienziato ma non all’uomo comune (non è il caso di chiedere all’uomo della strada qual è il suo grado di anomia, di particolarismo, di introversione); c’è qualcosa che la morale dominante nella comunità dell’intervistato considera riprovevole (abitudini sessuali devianti, evasione fiscale, etc.). Il fatto che non si possa dare una definizione operativa diretta non comporta la rinuncia a raccogliere informazioni su quella proprietà. Per farlo, bisogna trovare una o più proprietà che: a) ammettano accettabili definizioni operative dirette; b) abbiano una stretta relazione semantica con la proprietà che interessa. Queste proprietà si chiamano indicatori della proprietà X, e la relazione che si stabilisce tra queste e la proprietà X si chiama “rapporto di indicazione Su questo tornerò subito4. 4 Si dirà che l’opinione modale e l’opinione mediana tendono a coincidere. Ma ciò è vero solo se la distribuzione delle risposte ha una forma campanulare e simmetrica. 2 Voglio prima sottolineare che il ricorso a indicatori non è specifico delle scienze sociali. Si usano indicatori anche nella vita quotidiana, ogni volta che qualche elemento visibile viene considerato un indizio, un segnale di qualcosa che non è palese ma è interessante. La frase “il ragazzo è arrossito; questo è un chiaro indicatore della sua colpa” mostra non solo che il concetto è familiare, ma anche che il termine esiste nel linguaggio ordinario. E in vari linguaggi tecnici il termine si usa per designare strumenti che rivelano lo stato di un processo (indicatori di livello, di pressione, etc.). Nelle scienze sociali il concetto — non il termine — di indicatore appare verso la metà dell’Ottocento negli scritti di alcuni positivisti di lingua francese [Villermé 1840; Quételet 1869]. Alla fine del secolo Durkheim parla di “indici esteriori” che simbolizzano fatti interiori e fenomeni morali [1893; 1896]. Il positivista italiano Niceforo, emigrato a Parigi, dedica un’opera agli “indici numerici della civiltà e deI progresso” [1921], usando il termine con lo stesso significato che si attribuisce ora all’espressione ‘indicatori sociali’. Il primo a usare il termine ‘indicatore’ nel senso che gli si dà nell’approccio standard alle scienze sociali è il sociologo americano Stuart Dodd [1942]. Ma è stato il metodologo Paul Lazarsfeld a codificare quest’uso, distinguendo tra indicatori e indici (combinazioni di indicatori)5. Si possono individuare tre somiglianze tra il concetto ordinario di indicatore e il concetto che si usa nell’approccio standard alle scienze sociali: a) in entrambi i casi l’indicatore è qualcosa di manifesto (o registrabile) che dà informazioni su qualcosa che non è manifesto (o direttamente registrabile); b) in entrambi i casi il fenomeno manifesto/la proprietà registrabile può interessare in sé o come segnale di qualcosa che non è manifesto, o registrabile. L’aggressività verbale può interessare in sé o come indicatore di complessi di inferiorità; il tasso di divorzi può interessare in sé o come indicatore di secolarizzazione; la percentuale di voti a un partito di opposizione può interessare in sé o come indicatore di insoddisfazione per la politica del governo in carica; c) in entrambi i casi il fenomeno manifesto/la proprietà registrabile può essere considerata — da osservatori differenti e persino dallo stesso — indicatore di due o più fenomeni/proprietà. Il fatto di arrossire può essere considerato un indicatore di senso di colpa o di timidezza. Il tasso di divorzi può essere considerato un indicatore di secolarizzazione o di disgregazione dell’istituzione familiare. 5 Molti autori [Merton 1948; Lazarsfeld e Barton 1951; Galtung 1967; Przeworski e Teune 1970; McKennell 1973; Nowak 1976; Carmines e Zeller 1979] scrivono che gli indicatori sono necessari quando il concetto è generale e/o ha grande importanza teorica. Però, come osservò Blalock, “alcune variabili teoricamente importanti possono essere facilmente operativizzate: l’età, il sesso, la razza, la confessione religiosa” [1961a/1972, 163]. A questo breve elenco si possono aggiungere la nazionalità, il luogo di residenza, il titolo di studio, lo stato civile, la condizione occupazionale, il tipo di occupazione; inoltre — con unità territoriali — la superficie, la popolazione, la forma di regime politico, etc. Gli autori citati all’inizio di questa nota hanno commesso un errore logico: dall’osservazione incontestabile che gli indicatori sono concetti più specifici dei concetti che indicano (il motivo di questo si vedrà al par. 8.3) hanno tratto la conclusione che tutti i concetti generali neces¬sitano di indicatori. Però questo è chiaramente un non sequitur, cioè una deduzione fallace perché la conseguenza non deriva necessariamente dalle premesse. 3 8.2. LA NATURA DEGLI INDICATORI NELLE SCIENZE SOCIALI Le differenze tra gli indicatori che usiamo nella vita quotidiana e quelli che usiamo nell’approccio standard alla ricerca sociale possono essere tutte ricondotte al fatto che in quest’ultima l’indicatore deve la sua esistenza alla necessità di registrare proprietà che non è possibile definire operativamente in forma diretta. Si ricordi che la definizione operativa è lo strumento che ci permette di trasformare una proprietà del mondo reale in una variabile che occupa un vettore-colonna della matrice dei dati (vedi sopra, par. 6.2). Di conseguenza, la natura di un indicatore nelle scienze sociali è strettamente vincolata a quella dei vettori-colonna della matrice. Da ciò consegue che nell’approccio standard alle scienze sociali: a) si possono concepire come indicatori solo concetti che si riferiscono a proprietà; b) queste proprietà devono presentare stati in tutti gli esemplari6 dell’unità di analisi in quella ricerca, cioè in tutti i casi che occupano le righe di quella matrice. Un esempio farà capire meglio cosa si intende. A titolo di esercizio, gli studenti di un corso di metodologia proponevano alcuni indicatori di status sociale. L’unità era l’individuo adulto, l’ambito era l’Italia contemporanea. Fra gli indicatori fu proposto il tipo di stazione di sci preferita da un individuo. Ma non si poteva accettarlo come indicatore di status sociale perché la maggior parte degli italiani adulti non sa sciare, o non ha i mezzi per frequentare regolarmente stazioni sciistiche. Si possono quindi scegliere come indicatori (di un altro concetto) solo concetti che si riferiscono a proprietà, suggeriscono una definizione operativa diretta e rispondono al requisito (b) sopra illustrato. Queste condizioni sono necessarie ma non sufficienti: la condizione essenziale è che il ricercatore7 percepisca una stretta relazione semantica tra l’indicatore e il concetto indicato. Sulla natura di questa relazione semantica (rapporto di indicazione) si trovano in letteratura le opinioni più varie. Molti autori8 parlano di relazione causale, di solito senza stabilire se il concetto indicato è la causa o l’effetto dell’indicatore. Come vedremo in seguito, in certi casi i concetti scelti come indicatori si possono ragionevolmente considerare cause del concetto di cui sarebbero indicatori, in altri casi si possono considerare effetti; in altri ancora gli indicatori scelti non si possono considerare né cause né effetti del concetto indicato. Anche nei casi in cui si può immaginare che questa relazione causale esista, stabilire la sua direzione non è sempre ovvio come può sembrare. Alcuni esempi: il tasso di contaminazione dell’aria o il tasso di criminalità sono alcune cause della percezione della qualità della vita in un comune, e spesso si scelgono come indicatori di questo concetto. Al contrario, il favore a un governo militare può considerarsi un effetto di un più generale atteggiamento autoritario del soggetto, e spesso si sceglie come indicatore di autoritarismo. Vediamo un caso meno ovvio. In una ricerca sui comuni dell’Italia centrale scoprii un’altissima correlazione negativa tra il reddito pro-capite nel comune e la proporzione di case di proprietà della famiglia che le abitava. Il segno negativo mi parve contrario ad ogni ragionevole aspettativa (quanto più ricca è una famiglia, tanto più dovrebbe essere in grado di comprare la casa in cui abita). Ma la relazione 6 Agli indici e alle procedure usate per costruirli si dedicherà la parte finale di questo capitolo. Almeno in linea di principio, e tranne poche eccezioni marginali. 8 Per esempio Stevens [1951]; Blalock [1961b]; Sullivan [1974]; Smelser [1976]. 7 4 negativa era tanto nitida che mi indusse a riflettere. Così compresi che non era accidentale, ma era l’effetto di una vera catena causale: 1) nei comuni di montagna, o comunque isolati, le opportunità di lavoro sono limitate; 2) per questo motivo, i redditi medi sono bassi dei giovani tendono a spostarsi nei comuni urbani e centrali. 4) Questa migrazione interna riduce la domanda di alloggi nei comuni isolati e poveri e la accresce nei comuni ricchi e centrali; 5) per questo, i prezzi degli alloggi tendono ad abbassarsi nei primi e ad aumentare nei secondi. 6) Di conseguenza, molti abitanti poveri dei comuni isolati hanno abbastanza denaro per comprare la casa in cui vivono, mentre gli abitanti più ricchi dei comuni centrali/urbani non possono farlo. Dopo avere ricostruito questa catena causale, il ricercatore può essere più fiducioso nello scegliere il tasso di case che sono di proprietà di chi le abita sul totale delle case come indicatore di sottosviluppo economico. Peraltro, a volte non si riesce a individuare la relazione che unisce una proprietà facile da operativizzare con un’altra non direttamente operativizzabile, e si sceglie la prima come indicatore della seconda basandosi su una semplice associazione statistica. Il concetto di associazione statistica sarà approfondito nel cap. 9; adesso è sufficiente un esempio, tratto da un diffusissimo test psicologico, il Minnesota Multiphasic Inventory. Questo test, ideato alla fine da Hathaway e McKinley [1939], ha varie versioni, tutte composte da un mezzo migliaio (!) di affermazioni con risposta seccamente dicotomica (sì/no) sugli argomenti più svariati. Alcune delle affermazioni alle quali i soggetti devono reagire sono troppo generiche per suggerire un sì o un no secco (“non mi preoccupo per quello che mi succede”; “il mio modo di agire si presta ad esser frainteso dagli altri”; “qualcuno ha cercato di influenzare la mia mente”); altre sono curvilinee (ad es. “soffro raramente di dolori dietro il collo”9); altre ancora sembrano bizzarre (“di solito ho le mani e i piedi abbastanza caldi”; “qualche volta la sommità della mia testa è molto sensibile”; “a volte sento strani odori”; “ho l’abitudine di contare oggetti di nessuna importanza, come le lampadine delle insegne luminose”). La frase più bizzarra compare in una versione con sole 480 affermazioni, che io stesso ho compilato come neo-laureato in cerca di lavoro. Il testo è: “Sento prurito alle dita quando apro la maniglia di una porta”. E possibile che Hathaway e McKinley, o altri psicologi, abbiano scoperto relazioni di causa-effetto tra sensazioni tanto specifiche e strane e alcune importanti proprietà psichiche. Malgrado tutto, l’impressione è che in qualche ricerca gli psicologi abbiano osservato che la maggior parte dei soggetti autoritari (o anomici, o paranoici) percepivano sensazioni di prurito nell’aprire maniglie (o altre sensazioni strane), mentre i soggetti non autoritari (o non anomici, o non paranoici) non le percepivano. Basandosi su questa associazione statistica — che ovviamente può essere accidentale, dipendere dalla popolazione studiata, etc. — hanno deciso di scegliere questa sensazione come uno degli indicatori di autoritarismo (o di anomia, o di inclinazioni paranoiche, o di chissà cosa)10. Naturalmente questi sono casi-limite, che si possono giustificare solo se si ha bisogno 9 Un soggetto può rispondere ‘no’ sia che non soffra mai di questi dolori, sia che ne soffra spesso. Sul concetto di curvilinearità vedi sopra, par. 7.5. 10 Trent’anni dopo, mostrando una capacità autocritica assai rara fra i fautori dell’approccio standard, Hathaway e McKinley si sono chiesti (sin dal titolo dell’articolo) “Dove abbiamo sbagliato?” e hanno concluso: “Non si possono applicare nello studio della personalità gli stessi strumenti matematici che sono serviti a risolvere problemi in altri campi della scienza” [1972, 44]. 5 di indicatori di un concetto X e non si trovano concetti la cui associazione empirica11 col concetto X si possa giustificare semanticamente. Come si diceva, le convinzioni sulla natura del rapporto di indicazione sono varie. Lazarsfeld [1958; 1966] e altri che lo seguono12 parlano di relazione probabilistica. Ma questo è un errore categoriale13, perché una relazione probabilistica può intercorrere solo tra un evento (o classe di eventi) e un altro evento (o classe di eventi). Altri14 parlano di inferenza: anche questo è un errore categoriale, perché l’inferenza è un possibile vincolo tra asserti, non tra concetti. Guttman [1950] e altri15 parlano di “campionamento di un universo di contenuto”. Ma questo è un ennesimo errore categoriale, perché il campionamento presuppone che la popolazione (e quindi il campione) sia formata da individui (o altri oggetti fisici) ben delimitati, non da entità vaghe e non delimitabili come i concetti. Meno grave appare l’errore di coloro che parlano di una relazione logica o analitica16. Infatti una relazione logica può instaurarsi tra concetti (ad es. la relazione tra il genere e le sue specie ha natura logica); ma la relazione tra un concetto e i suoi indicatori non ha la stessa natura della relazione genere-specie, che è necessaria (tutti i gatti sono felini, ma ci sono felini che non sono gatti: vedi sopra, par. 3.1). Ogni ricercatore, o gruppo di ricercatori, stabilisce la relazione secondo la sua conoscenza della popolazione studiata e della letteratura sull’argomento, le sue esperienze di ricerca precedenti, e in definitiva secondo le sue preferenze. Altri ricercatori — o lo stesso ricercatore in un’occasione successiva – possono scegliere altri indicatori per lo stesso concetto, e spesso lo fanno. Tutto ciò non significa che la scelta sia arbitraria. Ovviamente il ricercatore ha il massimo interesse a scegliere indicatori che siano validi17, cioè che permettano di rilevare fedelmente almeno alcuni aspetti dell’intensione del concetto indicato. Per questo non effettuerà la scelta senza conoscere la popolazione oggetto della ricerca, e la letteratura sul problema che interessa18. Non c’è alcun obbligo di ripetere le scelte di quelli che hanno studiato prima lo stesso problema, tanto meno se si studia lo stesso fenomeno in un altro ambito; è facile capire che “lo stesso fenomeno” può avere significati radicalmente differenti in ambiti differenti19. Un esempio classico è il tasso di partecipazione elettorale, che può essere considerato un indicatore di forza della vita 11 Nel senso di associazione statistica fra le variabili che li operativizzano. Ad es. Verba [1969]; Nowak [1976]. 13 Per errore categoriale si intende l’attribuzione a una qualsiasi entità di una proprietà che non può competerle: questo pensiero è solubile; questo tavolo è intelligente. Fu Gilbert Ryle [1938] a definire per primo questo genere di errori. 14 Ad es. Galtung [1967]; McKennell [1973]; Singer [1982]. 15 Ad es. Cronbach e Meehl [1955]. 16 Ad es. Nowak [1976]; Sullivan e Feldman [1979]. 17 Alla validità degli indicatori sarà dedicato il par. 8.4. 18 Questo non significa che debba scegliere i suoi indicatori in funzione della sua teoria, come molti sostengono. Sostenere che la teoria che si sta controllando empiricamente debba dettare, o ispirare, la scelta degli indicatori che servono per controllarla presenta — oltre che un diffuso odore di circolarità — l’ovvio rischio che si scelgano indicatori che offrono la maggiore probabilità di corroborare la teoria che si controlla. 19 Questa possibilità non sfuggì a molti autori di comparazioni internazionali [Teune 1968; Verba 1969; Frey 1970; Mokrzycki 1983], che sottolinearono che indicatori dello stesso concetto devono essere “equivalenti”, non uguali. Ciononostante, questa raccomandazione non è sempre ascoltata, e “molte istituzioni che collaborano con gli americani nelle ricerche comparate si lamentano del fatto che i questionari che vengono loro inviati dagli Stati Uniti sono spesso accompagnati dall’ordine che la traduzione sia assolutamente letterale” [Brislin, Lonner e Thomdike 1973, 39]. 12 6 democratica nei paesi in cui si tengono elezioni libere, mentre era un indicatore della capacità di mobilitazione del partito unico nei paesi dell’Est europeo; e potrebbe persino essere considerato un indicatore di osservanza delle norme nei paesi dove votare è un dovere legale, come in Argentina o anche in Italia fino a poco tempo fa. Altra caratteristica che può cambiare radicalmente il significato di un fenomeno è il livello dell’unità d’analisi quando questa è aggregata a livello territoriale. Un esempio lo offre il diverso significato della percentuale di anziani nella popolazione. Se l’unità d’analisi è il comune, questo è un indicatore di marginalità e di stagnazione economica, perché — come si diceva prima — i giovani tendono a trasferirsi in luoghi dove trovano più opportunità di lavoro. Se l’unità d’analisi è la provincia, i comuni periferici e quelli centrali della stessa provincia si fondono in uno stesso caso, e pertanto la percentuale di anziani cesserà di essere collegata alla differenza tra comuni centrali e periferici. A livello di provincia, la percentuale di anziani può essere un indicatore di qualità del clima e più in generale della vita, giacché i pensionati tendono a trasferirsi — se possono — nelle province migliori sotto questi punti di vista20. A parte queste considerazioni, se un ricercatore si allontana dalle scelte di indicatori fatte da coloro che hanno studiato lo stesso fenomeno nello stesso ambito e con una unità d’analisi dello stesso livello, si dovrebbe sentire in dovere di giustificare il suo rifiuto degli indicatori tradizionalmente scelti per il concetto che sta studiando, e quindi la sua scelta di indicatori differenti [lo sottolinea Cartocci 1984]. 8.3. ASPETTI INDICANTI E ASPETTI ESTRANEI: LA DUPLICE PLURALITÀ DELLE RELAZIONI TRA CONCETTI E INDICATORI Alla fine del paragrafo 8.1 si è osservato che una proprietà direttamente registrabile con una definizione operativa può essere considerata — da osservatori diversi e persino dallo stesso — un indicatore di due o più proprietà. Alcuni21 guardano a questo fenomeno con disapprovazione, come un segnale dell’insufficiente maturità delle scienze sociali; altri, basandosi su una rassegna di ricerche pubblicate, si limitano a documentarlo22. Vediamone insieme le cause. Quando due o più persone conversano tra loro, esse danno per scontato che ogni termine abbia lo stesso significato per tutti. Come hanno mostrato gli etnometodologi [Garfinkel 1964; 1967], questa convenzione è necessaria perché se ogni interlocutore chiedesse il significato di ciascun termine si aprirebbe una regressione all’infinito e la vita sociale si bloccherebbe. Però se si hanno fini non pratici ma conoscitivi, e si chiede agli interlocutori di definire un qualunque termine, quasi sempre si trova che le definizioni sono sensibilmente differenti — il che significa che lo stesso termine designa concetti diversi per ogni soggetto. Ad esempio, nell’ascoltare il termine ‘autoritarismo’ alcuni possono pensare esclusivamente o soprattutto a fenomeni politici, altri preferibilmente all’atteggiamento dei maschi nei confronti delle loro spose, altri preferibilmente all’atteggiamento dei dirigenti di un’impresa verso i dipendenti. E approfondendo ulteriormente si trova che per alcuni l’autoritarismo 20 Non a caso le percentuali di residenti anziani sono altissime in Florida e alte, ad es., in provincia di Imperia. 21 Ad es. Zetterberg [1954], che lamentava l’estrema varietà degli indicatori scelti nelle ricerche sui gruppi. 22 Ad es. lo psicologo McNemar [1946]. 7 politico significa soprattutto il favore verso un governo militare, per altri il desiderio che ci sia un solo partito, o solo due, per altri l’opinione che tutte le decisioni politiche siano di pertinenza del governo centrale a discapito delle autonomie locali, etc. Non si vuole dire che ogni soggetto dà un significato solo e diverso dagli altri ad ogni termine; al contrario, che ogni soggetto può dare molti significati (alcuni centrali, altri marginali) e che la distribuzione degli aspetti centrali, marginali e assenti varia da soggetto a soggetto. Come abbiamo visto (par. 3.1), l’insieme di questi aspetti si chiama intensione di un concetto; tutta la discussione precedente si può sintetizzare dicendo che ciascun termine designa — o può designare — concetti con intensioni differenti per ciascun soggetto che lo pronuncia o lo sente. Chiarito questo, non dovrebbe stupire il fatto che un concetto A, direttamente operativizzabile, sia scelto da differenti autori (e anche dallo stesso autore in situazioni differenti) come indicatore di due o più differenti concetti non operativizzabili. Ciò consegue dal fatto che l’intensione del concetto A varia da soggetto a soggetto, e varia nel tempo anche per lo stesso soggetto. Prendiamo come esempio il tasso di aborti registrati in ciascuna provincia di una nazione di tradizione cattolica. Di solito questo si considera un indicatore di secolarizzazione, cioè di autonomia rispetto ai precetti della Chiesa. Ma un ricercatore che studi la natura dei costumi sessuali diffusi nella popolazione femminile di varie province potrebbe considerare questo tasso un indicatore del livello di liberalizzazione dei costumi, giacché l’aborto di solito è la conseguenza di una gravidanza indesiderata perché dovuta a una relazione prematrimoniale. E in una nazione — come l’Italia — che riconosce ai medici che operano negli ospedali pubblici il diritto all’obiezione di coscienza nel praticare aborti, un ricercatore potrebbe scegliere il tasso di aborti registrati come un indicatore della propensione all’obiezione di coscienza della classe medica di ciascuna provincia. Infatti, di fronte a un rifiuto (o probabile rifiuto) di praticare un aborto, le donne possono ricorrere a cliniche clandestine o spostarsi in altre province in cui la classe medica non oppone l’obiezione di coscienza23. Ogni ricercatore può considerare centrale un aspetto diverso dell’intensione del concetto di tasso di aborti, e grazie a questo aspetto — che potremmo chiamare aspetto indicante — sceglie il tasso di aborti registrati come indicatore di diversi concetti. Quanto agli altri aspetti, che non gli servono per stabilire il rapporto di indicazione — e che pertanto possiamo chiamare aspetti estranei – o li ignora, o li considera non importanti, o si rende conto della loro presenza e importanza ma ha bisogno di quell’indicatore e spera che gli aspetti estranei non alterino troppo il rapporto di indicazione che vuole stabilire. Ma anche se il ricercatore trascura gli aspetti estranei dell’indicatore che sceglie, questi aspetti permangono e contribuiscono a influenzare, ad esempio, il modo in cui una certa domanda sarà interpretata dagli intervistati. Per questo motivo, il primo criterio da seguire nella scelta degli indicatori è ridurre la prevedibile incidenza di aspetti estranei. E in ogni caso, un ricercatore dovrebbe tenerli in gran conto nell’interpretare i suoi dati. A questa pluralità “verso l’alto” nei rapporti di indicazione (nel senso che un concetto che suggerisce direttamente una definizione operativa può essere ragionevolmente scelto come indicatore di vari altri concetti) corrisponde una pluralità “verso il basso”, 23 Se ricorrono a cliniche clandestine l’aborto non viene registrato e non risulta nelle statisti¬che ufficiali; se si spostano viene registrato in una provincia diversa. 8 nel senso che per ogni concetto che interessa, ma che non suggerisce direttamente una definizione operativa, è opportuno scegliere più di un indicatore. Vediamone il perché partendo da un esempio. All’inizio del capitolo si è detto che la libertà politica non si può definire operativamente in modo diretto (anche nel senso più specifico di “livello di libertà politica di cui godono i cittadini di vari Stati”). Per permettere di registrare le situazioni empiriche bisogna scendere verso concetti più specifici, che sono aspetti dell’intensione del concetto di libertà politica. I politologi convengono su almeno tre aspetti di questa intensione: libertà di opinione, libertà di associazione, libertà di stampa. Ognuno di questi aspetti — come altri24, sulla cui appartenenza all’intensione del concetto di libertà politica non c’è accordo unanime — indica varie direzioni in cui possiamo cercare un indicatore, cioè un concetto che si possa definire operativamente in maniera diretta e che sia semanticamente collegato alla libertà politica. Ad esempio, il concetto di libertà di opinione suggerisce il totale dei giorni di carcere subiti per crimini di opinione durante un determinato anno, diviso per il numero di adulti nella popolazione di ogni Stato25. La definizione operativa indicherà dove rintracciare la documentazione necessaria, come fare i controlli consultando agenzie internazionali, etc. Il concetto di libertà di associazione suggerisce, ad esempio, il numero di associazioni che sono state sciolte — ola cui costituzione è stata proibita — per motivi politici (diviso per il numero di associazioni ammesse o non ostacolate) durante un certo periodo. Il concetto di libertà di stampa suggerisce, ad esempio, il totale di copie di quotidiani e periodici sequestrati per motivi politici in un dato anno diviso per il totale delle copie circolanti nello stesso anno. Il concetto di libertà di andare all’estero suggerisce, ad esempio, il numero di passaporti richiesti e non concessi diviso per il totale di passaporti richiesti durante un certo anno. La definizione operativa degli ultimi tre indicatori sarà analoga a quella precedente (giorni di carcere), cambiando ovviamente le fonti di informazione e il modo di controllarle. Come si vede, per operare una qualunque registrazione di informazioni empiriche semanticamente rilevanti per il concetto di libertà politica bisogna fare ricorso a concetti molto più specifici e circostanziati, che indichino direttamente dove e come cercare queste informazioni. Per questo si è parlato di un passaggio “verso il basso” dal concetto ai suoi indicatori, e di un passaggio “verso l’alto” da ogni indicatore scelto al relativo concetto. E dato che gli aspetti dell’intensione di un concetto generale possono essere numerosi, per non ridurre troppo la generalità di questo concetto, e in fin dei conti sostituirlo con un altro concetto, è necessario cercare indicatori per molti aspetti; l’ideale sarebbe trovare indicatori per ogni aspetto rilevante della sua intensione26. 24 Ad es. la libertà religiosa, o la libertà di andare all’estero senza restrizioni di natura politica. Se non si dividesse per il numero di adulti, gli Stati più popolati avrebbero un ovvio svantaggio. L’operazione che consiste nel collocare ogni fenomeno nelle sue esatte dimensioni è detta ‘normalizzazione’ e sarà illustrata in dettaglio nel par. 8.5. 26 Questo è solo un ideale, perché gli aspetti rilevanti dell’intensione di un concetto non sono facilmente elencabili (vedi sopra, par. 3.1), e inoltre qualunque tentativo di stabilirli sarà inevitabilmente controverso. Nel par. 8.5 chiarirò altre difficoltà che si trovano nello scegliere indicatori per ogni aspetto rilevante dell’intensione di un concetto. D’altro canto, se si tralasciano molti aspetti importanti dell’intensione di un concetto, si dovrebbe cambiare la sua denominazione. Ma è assai raro che lo si 25 9 Questo si intende quando si parla di “pluralità verso il basso” del rapporto di indicazione. Rapidamente, la duplice pluralità si può così sintetizzare: • ogni concetto che non suggerisce direttamente una definizione operativa richiede una pluralità di indicatori27 • ogni concetto che può essere direttamente operativizzato può essere scelto come indicatore di una pluralità di altri concetti. Una particolare combinazione di pluralità verso l’alto e verso il basso si trova spesso nell’analisi secondaria. Con questa espressione si indica il fatto che molti ricercatori, per approfondire un problema conoscitivo che li interessa, invece di raccogliere direttamente i dati analizzano quelli già rilevati da altri ricercatori e conservati in appositi archivi28. Naturalmente, ogni volta che si analizzano i dati di una ricerca altrui, siamo limitati alle proprietà che interessarono l’autore o gli autori originari di quella ricerca. Pertanto, può succedere che alcune proprietà interessanti non si trovino nella matrice29. Prima di rinunciare a considerarle nei loro modelli30, molti ricercatori esaminano attentamente tutta la matrice della ricerca originaria per vedere se trovano variabili il cui concetto corrispondente possa essere considerato un indicatore dell’una o dell’altra fra le variabili che li interessano. In questo modo, dati raccolti per avere informazioni su una proprietà C, interessante in sé e come indicatore di una proprietà A non direttamente operativizzabile, sono sfruttati per avere informazioni su una proprietà B, anch’essa non direttamente operativizzabile. Anche questa operazione, come tutti i rapporti di indicazione che un ricercatore stabilisce, è sottoposta al giudizio della comunità scientifica circa la sua validità — un concetto che esaminerò subito. 8.4. LA VALIDITÀ COME GIUDIZIO SULLA VICINANZA SEMANTICA TRA UN CONCETTO E IL SUO INDICATORE La validità è una proprietà del concetto I in quanto possibile indicatore del concetto C in un determinato ambito spazio-temporale e con una determinata unità d’analisi. Il grado in cui il concetto I possiede questa proprietà non si può misurare31, né indagare in qualsiasi modo “oggettivo”. Sulla validità si può solo esprimere una valutazione in base a criteri semantici: un compito che spetta al singolo ricercatore, al gruppo di ricercatori, alla comunità dei ricercatori nella disciplina pertinente. La valutazione terrà conto delle conoscenze sul problema e sulla popolazione studiata, faccia: di solito si usano termini molto generali anche se gli indicatori sono molto specifici: lo lamentano McNemar [1946], Coombs [1953], Cook e Selltiz [1964], Lutynski [1978]. Una conseguenza della tendenza a non farlo la segnalano Cronbach e Meehl: “Se il ricercatore A, per un concetto che chiama ‘aggressività’, sceglie indicatori associati ad aperti attacchi agli altri e il ricercatore B, per un altro concetto che anch’egli chiama ‘aggressività’, sceglie indicatori associati con l’ostilità repressa”, gli stessi risultati che corroborano la teoria del ricercatore A falsificano la teoria del ricercatore B, e viceversa [1955, 291]. 27 La necessità di scegliere più di un indicatore per ogni concetto è stata sottolineata anche da Lazarsfeld: “Ogni indicatore ha un carattere specifico e non può essere esaustivo del significato di un altro concetto” [1958, 107]. 28 Gli archivi di dati si sono diffusi negli ultimi decenni in sociologia e in scienza politica, seguendo l’esempio degli archivi in cui sin dalla fine dell’Ottocento, in epoca evoluzionista, venivano conservati i resoconti degli etnologi e altre informazioni etnografiche. 29 Su questo e altri problemi dell’analisi secondaria si veda Hyman [1972]. 30 Il modello è lo strumento base dell’analisi dei dati nell’approccio standard. Si veda oltre, par. 92. 31 Contrariamente a quello che sostengono i metodologi di ispirazione comportamentista, che hanno proposto vari procedimenti per “misurare” la validità (si veda oltre in questo stesso paragrafo). 10 dei risultati di ricerche precedenti, della letteratura scientifica su quel soggetto. Una volta registrati i dati, il giudizio deve tenere conto anche della forza e della forma della relazione (non solo dei coefficienti di associazione32) di quella variabile con altre. In effetti, i metodologi di ispirazione comportamentista tendono a screditare un giudizio basato su criteri meramente semantici (chiamato content validation, vailidazione di contenuto, o — sarcasticamente – face validation,validazione a vista odi facciata). Essi giudicano poco scientifica anche una forma di controllo della validità chè ùsavano gli psicologi della prima metà del Novecento: la validazione “per gruppi conosciuti” (known groups).Per vedere se un determinato test era un indicatore valido, ad esempio, di anomia, lo si applicava ad una popolazione conosciuta (abitualmente, agli alunni di una classe di psicologia). Il test era giudicato valido se il gruppo di alunni che il professore giudicava “anomici” otteneva nel test un punteggio medio significativamente più alto del resto della classe [Thurstone e Chave 1929; Frey 1970]. Tutte le altre forme di controllo della validità si basano su coefficienti di associazione fra il vettore con i dati sull’indicatore in questione e altri vettori della matrice. Si è visto nel paragrafo 6.5 che anche l’attendibilità dei dati viene controllata — dalla maggior parte dei ricercatori, di ispirazione comportamentista e no — attraverso la correlazione di due o più vettori. Questa analogia ha sollevato un ‘inopportuna confusione tra il concetto di attendibilità (la corrispondenza tra situazioni reali e i dati nella matrice) e il concetto di validità (il grado di corrispondenza semantica tra due concetti): alcuni usano tranquillamente un termine al posto dell’altro mescolando due problemi metodologici profondamente diversi33. Altri giungono a calcolare relazioni matematiche tra i coefficienti corrispondenti ed elaborano tecniche per “affrontare simultaneamente questioni di attendibilità e di validità” [Siegel e Hodge 1968]34. Si può commentare che, in fondo, essi sono i più coerenti nel trarre conclusioni da un approccio che riduce tutti i problemi scientifici a relazioni matematiche tra vettori35. Riduzione che ha una giustificazione ufficiale — la scienza deve essere “oggettiva” (vedi sopra, cap. 4), e non c’è niente di più “oggettivo” della matematica — e una nascosta: il desiderio di sottrarsi a compiti minuziosi e noiosi come controllare il funzionamento degli strumenti sul campo, sporcandosi le mani con situazioni sempre più complesse dei modelli matematici36, e di evitarsi il compito intellettualmente impegnativo di riflettere sulle relazioni semantiche che hanno due concetti nella mente degli individui studiati in un dato ambito spazio-temporale. Esaminiamo ora le più diffuse tecniche per controllare la validità. Nella validazione “concomitante” o “simultanea” (concurrent validation) si calcolano coefficienti di associazione con altri supposti indicatori37 dello stesso concetto [Carmines e Zeller 32 Sui coefficienti di associazione vedi oltre, pan. 9.5. Più avanti in questo paragrafo si vedrà un caso in cui la forma della relazione era molto più rilevante del meno livello dei coefficienti. 33 Si veda ad es. Gulliksen [1936]; Parry e Crossly [1950]; Schuman [1966]; Davies [1977]; Carmines e Zeller [1979]. 34 Si veda anche Cronbach [1949]; Bohrnstedt [1970]; Allen [1974]. Per Lord e Novick [1968] la relazione tra validità e attendibilità è semplicissima: la prima è la radice quadrata della seconda. Se lo dicono loro... 35 Vedi le osservazioni sulla fallacia assertoria al par. 3.6. 36 Sull’infinita, e continuamente cangiante, complessità della realtà ha tenacemente insistito Max Weber [1904; 1906; 1913]. Sulla sua alta lezione dovrebbero meditare i cultori dei modelli matematici ipersemplificati. 37 Come osservano Frey [1970] e Turner [1979], questo apre il problema di chi ha validato questi supposti indicatori. In altre parole, la “validazione concomitante”, come tutte le altre forme di validazione mediante associazione fra variabili nella matrice, non fa altro che rinviare di un passo — nonostante la 11 1979], nella ragionevole aspettativa che due o più indicatori dello stesso concetto siano positivamente associati tra loro. Però persino una forte associazione positiva non dimostra nulla di conclusivo38, perché nulla impedisce che l’associazione segnali il fatto che sono tutti indicatori di un altro concetto. Inoltre, se l’indicatore in questione è associato con alcuni e non con altri supposti indicatori dello stesso concetto, non possiamo stabilire quale dei due gruppi è formato da indicatori validi del concetto che ci interessa. Più convincente è la validazione predittiva: si controlla se considerando i punteggi su un indicatore siamo in grado di prevedere correttamente i risultati di una prova successiva [Scott 1968; Carmines e Zeller 1979]. Ad esempio, il vettore che raccoglie i dati di un test sull’attitudine a guidare un elicottero, o a dirigere un’orchestra, oppure a ballare ritmi afro-cubani, si associa con il vettore che raccoglie i risultati della prova finale di un corso per guidare elicotteri, o per dirigere orchestre, o per ballare quei ritmi. Se l’associazione è alta il test si giudica valido come indicatore delle attitudini corrispondenti, e può essere adottato dai direttori dei relativi corsi per selezionare preventivamente i candidati. Naturalmente questa forma di validazione può essere adottata solo in situazioni come quelle descritte, cioè quando il concetto da indicare può avere una definizione operativa diretta sotto forma di risultati della prova finale di un corso, o simili. Il più interessante di questi controlli mediante analisi dei dati di una matrice è la cosiddetta validazione per costrutto (construct validation), nella quale il supposto indicatore non si associa con indicatori dello stesso concetto, ma con variabili che — secondo le aspettative teoriche o il senso comune — dovrebbero avere una relazione empirica forte (positiva o negativa) col concetto da indicare [Cronbach e Meehl 1955]. L’indicatore si giudica valido se le relazioni sono simili a quelle che si aspettavano, appunto, sulla base del senso comune e/o delle teorie accettate. Un esempio chiarirà ciò che si intende per validazione per costrutto. Analizzando i dati di una ricerca del 1971 su 7.000 giovani italiani, condussi un’analisi fattoriale di un’ampia batteria di scale Likert. La prima dimensione estratta non era facile da interpretare, e la chiamai “perbenismo” in quanto discriminava tra i giovani che approvavano frasi che ricordavano le raccomandazioni materne (frequentare buone compagnie, ascoltare i consigli degli esperti, tenersi sempre nel mezzo, confidare nelle persone sagge, etc.) e i giovani che rifiutavano quelle frasi. La grande ampiezza del campione mi permise di calcolare il punteggio medio di ciascuna coorte39 di un anno sull’indice40 che rappresentava questo fattore, dividendo inoltre ragazzi e ragazze. I punteggi medi sono presentati nella figura 8.1. La linea orizzontale rappresenta il punteggio O (nell’analisi fattoriale, zero è il punteggio medio dell’intero campione). Se la colonna di una coorte è sopra la linea orizzontale, il punteggio medio nell’indice di quella coorte è più alto del punteggio medio del campione; se la colonna è sotto questa linea, il punteggio medio della coorte è inferiore alla media del campione. Le pretesa oggettività della procedura — il ricorso alla tanto disprezzata “validazione per contenuto”: la variabile X è considerata un indicatore valido del concetto C perché è strettamente associata con la variabile Y; ma chi ha validato la variabile Y come indicatore di C? 38 Riciclando una celebre formula di Winch e Campbell [1969], si può dire che una forte associazione positiva fra variabili è evidence, not proof (indizio empirico, non prova) del fatto che siano entrambe indicatori del concetto che ci interessa. 39 Nelle scienze sociali si chiama “coorte” un gruppo di individui che hanno la stessa età. 40 Non solo gli indicatori, ma anche gli indici — che sono combinazioni di indicatori, e dei quali parlerò tra breve — sono sottoposti a un giudizio di validità. 12 colonne hanno altezza proporzionale alla differenza tra la media generale e la media di quella coorte. La validazione per costrutto che emerge nitidamente dalla figura 8.1 sta nel f~fr6 che l’andamento delle colonne è quello che ci si aspetterebbe se l’indice registrasse il livello di accettazione delle raccomandazioni della mamma manifestato da ciascuna coorte di giovani. Si sa infatti che le ragazze si distaccano presto dall’influenza materna, mentre i ragazzi tardano a rendersi indipendenti. Il grafico mostra che questo squilibrio si riduce rapidamente, e a 16 anni i ragazzi hanno raggiunto lo stesso livello di (non) accettazione delle ragazze. In seguito, i livelli di accettazione continuano ad abbassarsi; ma quello dei ragazzi si abbassa più rapidamente. La regressione multipla41 dell’indice sulle altre variabili mostrò che ciò dipende dalla maggiore esposizione che i ragazzi italiani avevano in quegli anni a influenze esterne alla famiglia, come la scuola (che significa professori, letture e — più che altro — compagni da imitare)42. Il livello di accettazione dei ragazzi raggiunge il suo minimo a 18 anni, e dopo continua a essere molto inferiore alla media generale. Al contrario, il punteggio delle ragazze, dopo essersi fermato sotto la media a 18-20 anni, sale di nuovo raggiungendo rapidamente la media del campione, e a 25 anni raggiunge un livello pari a quello che aveva a 14 anni. Questo andamento si spiega facilmente se si pensa al fatto che le ragazze italiane del 1971 tendevano a sposarsi molto più presto di quelle di oggi, e pertanto dai 20 anni in poi cominciavano a porsi di fronte alle frasi che ho ricordato (frequentare buone compagnie, ascoltare i consigli degli esperti, tenersi sempre nel mezzo, confidare nelle persone sagge, etc.) non tanto come figlie ma come madri o future madri. 41 La regressione multipla è uno sviluppo della regressione (di cui parlerò nel par. 9.5.4), e permette di valutare l’influenza relativa di diverse variabili considerate indipendenti su una considerata dipendente [vedi Di Franco 1997]. Tutte le tecniche di regressione e correlazione si applicano solo a variabili cardinali o quasi-cardinali. 42 Fino agli anni ‘70 in Italia le famiglie ritiravano dalla scuola molte ragazze dopo la licenza media, e nei centri piccoli o marginali molte non potevano uscire di casa fino a 18-20 anni se non erano accompagnate da genitori o fratelli maggiori. 13 È il caso di sottolineare il fatto che ho potuto ottenere questa convincente vaidazione per costrutto solo analizzando in dettaglio e separatamente il punteggio di ciascuna coorte, e confrontando gli andamenti delle coorti femminili e di quelle maschili. Non avrei raggiunto lo stesso risultato correlando l’indice in questione, globalmente considerato, con qualunque altra variabile globalmente considerata — come prescrivono di fare le tecniche standard per controllare la validità. Ne consegue che il giudizio sulla validità di un indicatore o di un indice, anche quando sia basato sull’analisi delle sue relazioni con altre variabili di una matrice di dati, spesso deve andare molto più in profondità di quanto possono fare semplici coefficienti globali di associazione. 8.5. ALCUNI ESEMPI DI SCELTA DI INDICATORI Alcuni esempi aiuteranno a comprendere meglio la natura degli indicatori e potranno servire come guida per la scelta di nuovi. Comincerò con il concetto di status socio-economico, che non suggerisce un’accettabile definizione operativa diretta: non si può domandare direttamente all’uomo della strada quale sia il suo status socio-economico perché molti non capirebbero l’espressione, e altri le darebbero un significato molto diverso da quello che le si dà in sociologia. Come si diceva sopra, in teoria si dovrebbero cercare indicatori per ogni aspetto rilevante dell’intensione del concetto di status socio-economico. D’altra parte, questa prescrizione si scontra con ovvii limiti per il fatto che non è sempre facile trovare concetti che suggeriscano definizioni operative dirette — gli unici idonei ad essere scelti come indicatori. Inoltre, più alto è il numero degli indicatori, più difficile è la costruzione dell’indice che li sintetizza — come vedremo nel paragrafo successivo. Per questi motivi, gli indicatori di status che qui suggerisco non vanno considerati un elenco esaustivo, ma un ventaglio di possibilità entro il quale il lettore interessato potrebbe scegliere secondo le sue inclinazioni. Aspetti relativi all’istruzione: • titolo di studio del soggetto; • titolo di studio del padre del soggetto; • titolo di studio della madre del soggetto43. Aspetti relativi all’occupazione: • occupazione principale del soggetto che lavora (e ultima occupazione del soggetto senza lavoro o pensionato); • occupazione principale del capo della famiglia di provenienza. Aspetti economici: • reddito annuale medio del soggetto negli ultimi cinque anni; • reddito annuale medio della famiglia del soggetto negli ultimi cinque anni diviso il numero di individui conviventi; • tipo di abitazione principale in cui vive la famiglia. Beni durevoli posseduti dalla famiglia: 43 Il titolo del padre e della madre si possono combinare in una sola variabile, come vedremo nel paragrafo successivo. 14 • numero di automobili possedute dalla famiglia diviso il numero di adulti conviventi; • numero di apparecchi televisivi posseduti dalla famiglia diviso il numero di individui conviventi; • prezzo dell’automobile più costosa posseduta dalla famiglia. Abitudini nel tempo libero: • spesa mensile media (nell’ultimo anno) della famiglia al ristorante diviso il numero di individui conviventi; • spesa annuale (media negli ultimi 3 anni) per vacanze dei membri della famiglia diviso il numero di individui conviventi. Il lettore avrà notato che spesso l’indicatore include la divisione per il numero di individui o di adulti conviventi nella famiglia del soggetto. Solo così l’indicatore riceve il suo pieno significato: si intende in effetti che il possesso di tre automobili o di tre televisori cambia di significato se il possessore è solo o se è parte di una famiglia di otto componenti. Il numero dei componenti tende naturalmente a influenzare i livelli di molti indicatori quantitativi, ma non ha alcuna relazione con il concetto di status: è un aspetto estraneo al rapporto di indicazione, e dividendo per il numero di componenti si neutralizza la sua influenza. L’operazione di dividere una cifra per una base rilevante al fine di neutralizzare aspetti di un fenomeno che non interessano si chiama normalizzazione si applica solitamente non solo per la creazione degli indicatori, ma anche nell’analisi dei dati44. Passo ora a un concetto operativizzato in molte ricerche che hanno la provincia come unità d’analisi: il livello di dinamismo economico-demografico. Per gli aspetti economici in generale si potrebbero scegliere indicatori come: • la variazione45 del reddito pro-capite; • la variazione nei depositi bancari pro-capite; • la variazione nella spesa in opere pubbliche. Per gli aspetti relativi alle imprese si potrebbero scegliere: • il saldo demografico delle imprese (totale delle nuove imprese meno il totale delle imprese chiuse o fallite) diviso il totale delle imprese esistenti nell’intervallo di tempo considerato; • la variazione dell’importo annuale degli investimenti pro-capite; • la variazione del consumo annuale pro-capite di kwh per uso industriale; • la variazione nella proporzione di suolo occupato da stabilimenti industriali e commerciali. Per gli aspetti relativi all’occupazione si potrebbero scegliere: • la variazione nel tasso di occupati sulla popolazione in età lavorativa; • la variazione nella quota di occupati provenienti da altre regioni o altri Stati. Per gli aspetti demografici si potrebbero scegliere: • il saldo demografico naturale (totale delle nascite meno totale dei decessi nell’intervallo di tempo considerato) diviso il numero dei residenti nella provincia all’inizio dell’intervallo; 44 Vedi Marradi [1997b]; Di Franco [1997; 2001]. Tutte le variazioni si intendono da un anno X a un anno Y, entrambi stabiliti dal ricerca¬tore secondo i suoi interessi. 45 15 • il saldo demografico per trasferimenti (da altre regioni o Stati meno i trasferimenti in altre regioni o Stati) diviso il numero dei residenti nella provincia all’inizio dell’intervallo. Considerando che lo sviluppo economico è favorito dalla diffusione dell’istruzione, si potrebbe aggiungere la variazione nella quota dei residenti laureati. Consideriamo infine un concetto che si può trovare nelle ricerche con unità sia individuali sia territoriali: il livello raggiunto in fatto di parità fra i generi. Quando l’unità è territoriale (una provincia, uno Stato) un ventaglio di indicatori potrebbe includere: • il rapporto tra il tasso di occupazione femminile e il tasso di occupazione maschile; • il totale delle donne che ricoprono cariche politiche diviso il totale degli uomini che ricoprono quelle cariche; • il totale delle autiste di autobus diviso per il totale degli autisti di autobus; • il totale di bambini minori di 3 anni diviso per il totale di donne di 23-30 anni46 • [solo se l’unità è un comune urbano] la spesa totale (nell’ultimo anno) in cibo già pronto diviso per la spesa totale (nello stesso periodo) in alimenti non preparati nei supermercati del comune. Quando l’unità è individuale il concetto appropriato è il grado di favore verso l’emancipazione delle donne dai vincoli tradizionali. Un ventaglio di indicatori potrebbe includere: • l’atteggiamento verso l’attribuzione di cariche politiche alle donne; • l’atteggiamento verso l’attribuzione di cariche religiose alle donne; • l’atteggiamento verso le donne imprenditnici; • l’àtteggiamento verso l’aborto; • il giudizio sull’opportunità di aumentare le tasse comunali per costruire asili nido e case di riposo; • il giudizio sull’opportunità che le donne lavorino fuori casa di notte; • il giudizio sull’opportunità che in tempo di crisi i capifamiglia maschi abbiano priorità nelle assunzioni. 8.6. LA COSTRUZIONE DI INDICI TIPOLOGICI CON VARIABILI CATEGORIALI E ORDINALI Si è detto varie volte che l’intensione di un concetto di proprietà ha vari aspetti, e che — se non è possibile definire operativamente quel concetto in forma diretta — occorre trovare indicatori per gli aspetti più importanti; altrimenti si finisce per raccogliere informazioni su un concetto molto diverso da quello che abbiamo in mente. Naturalmente, le informazioni raccolte devono essere poi sintetizzate per ricostruire in qualche modo l’unità del concetto che interessa. L’operazione con la quale si realizza questa sintesi si chiama costruzione di un i n d i e e. Come si è anticipato, è il passo più difficile dell’intera ricerca sociale che segue un approccio standard. Il criterio di costruzione degli indici si può stabilire in astratto, nel momento in cui si disegna la ricerca; ma prende corpo quando i dati sugli indicatori sono stati raccolti e 46 Questo è un indicatore inverso, nel senso che più alto è il numero dei minori di 5 anni, minore è il distacco delle donne dal tradizionale ruolo di madre. 16 codificati nella matrice. Il procedimento che si segue è totalmente diverso a seconda che si trattino le variabili come cardinali o meno47, al punto che è opportuno presentarlo in paragrafi differenti. Se non consideriamo cardinali le variabili che formeranno l’indice, si attribuisce autonomia semantica alle loro categorie. Ne consegue che lo strumento per realizzare la sintesi è la tabella di contingenza48, nella quale le categorie di una variabile sono riportate nelle righe e le categorie dell’altra sono riportate nelle colonne, e in ogni cella c’è un tipo, cioè la combinazione di una categoria della variabile nelle righe con la categoria della variabile nelle colonne (vedi sopra, pan. 3.2). Di conseguenza questi indici sono detti tipologici. Comincio con un esempio semplice, in cui le due variabili considerate sono ordinali (il che ci aiuterà ad attuare la sintesi) e hanno poche categorie (il che ridurrà la complessità del problema). Immaginiamo che la proprietà che ci interessa sia il capitale culturale [nel senso di Bourdieu 1979; 1994] che ha ricevuto ogni individuo durante la sua formazione, e che due degli indicatori scelti siano – un po’ semplicisticamente — il titolo di studio del padre e il titolo di studio della madre, ognuno rilevato con quattro categorie: elementare/medio/medio-superiore/superiore49. La tabella 8.1 presenta i sedici tipi risultanti dalla combinazione di ciascun titolo del padre con ciascun titolo della madre. Questi tipi potrebbero essere le sedici modalità della nuova variabile. Il problema è che questa variabile dovrà essere combinata con altri indicatori di capitale culturale, e che pertanto ci sarà bisogno di una sequenza di tabelle. Sedici categorie sulle righe o sulle colonne di una tabella sono decisamente troppe50 per questo motivo è opportuno ridurre il numero dei tipi nella tipologia. Se i contributi del padre e della madre al capitale culturale di un individuo si considerano equivalenti, un modo ovvio per ridurre questa tipologia è stato esposto proprio nella 47 Ci sono anche casi misti, nei quali alcune variabili sono cardinali o quasi-cardinali e altre no. Un esempio si presenterà nel paragrafo successivo. 48 Sulla tabella di contingenza vedi più estesamente il pan. 9.5.1. Naturalmente ci sono indici formati da più di due variabili categoriali. Ma anche in questi casi, poiché una tabella a tre variabili non è facile da concepire né da rappresentare, m pratica si procede con una successione di tabelle a due variabili, costruendo indici parziali (se ne vedrà un esempio più avanti). 49 Si usano categorie generali, senza fare riferimento all’ordinamento didattico di un paese particolare. L’adeguamento di queste categorie generali alla stratificazione dei titoli in ogni paese è un tipico problema di definizione operativa. 50 Sedici righe o sedici colonne in una tabella sono troppe perché, combinandosi con le categorie di un’altra variabile, producono un numero eccessivo di celle (il numero delle celle di una tabella è infatti il prodotto del numero delle righe per il numero delle colonne). In generale, sulla riduzione delle tipologie vedi il par. 3.2. 17 tabella 8.1: • il codice 1 sulla nuova variabile si attribuisce a tutti quelli che hanno entrambi i genitori con il titolo elementare • il codice 2 si attribuisce a tutti quelli che hanno almeno un genitore con il titolo medio; • il codice 3 si attribuisce a tutti quelli che hanno almeno un genitore con il titolo medio-superiore; • il codice 4 si attribuisce a tutti quelli che hanno almeno un genitore con il titolo superiore; • il codice 3 si attribuisce a tutti quelli che hanno entrambi i genitori con il titolo superiore. Si ottiene così una nuova variabile ordinale, che sintetizza i due indicatori. Si possono naturalmente concepire altre forme per realizzare questa sintesi, ad esempio attribuendo un peso maggiore al titolo del padre (codici nella tab. 8.2, parte sinistra) o a quello della madre (codici nella tab. 8.2, parte destra). Prima di mostrare come si combina una variabile così costruita con un altro indicatore, proseguendo nella costruzione dell’indice di capitale culturale, è opportuno sottolineare il fatto che la relazione tra il titolo del padre e quello della madre si può considerare anche un indicatore del livello di tensione o conflitto potenziale nella famiglia di provenienza del soggetto, a sua volta una possibile causa (non un indicatore) del suo livello di (in)sicurezza. L’ipotesi è che quanto maggiore è il dislivello culturale tra i genitori, tanto maggiore sarà probabilmente la tensione o il conflitto potenziale tra i due. In questo caso, i codici da assegnare ai tipi nelle celle potrebbero essere (tab. 8.3): • 0 nella diagonale, in cui il titolo è identico per entrambi i genitori (basso rischio di conflitto); • 1 nelle celle intorno alla diagonale, in cui c’è solo un grado di differenza tra il titolo dell’uno e dell’altro genitore (rischio medio-basso di conflitto); • 2 nelle celle in cui ci sono due gradi di differenza nel titolo (rischio medio-alto di conflitto); • 3 nelle celle all’estrema destra in alto e all’estrema sinistra in basso nella tabella, in cui la differenza tra i titoli è la massima possibile (alto rischio di conflitto). 18 Vediamo ora come si può procedere nella costruzione dell’indice usando la variabile formata dai titoli dei genitori combinata con un altro indicatore del capitale culturale, ad esempio il tipo di letture preferite dal soggetto durante la sua adolescenza e la sua giovinezza. Immaginiamo che le diverse risposte a queste domande siano raggruppate in quattro livelli: In questo caso la riduzione della tipologia è un compito delicato e impegnativo, anche perché le categorie in entrambe le variabili includono situazioni piuttosto differenti, che ogni ricercatore (e ogni lettore) può interpretare a suo modo. In generale, i criteri che guidano la scelta dei tipi da aggregare (e in conseguenza le categorie della variabile risultante, che può essere l’indice finale o uno stadio intermedio nella sua costruzione) sono gli stessi che guidano la riduzione del numero delle classi in una classificazione (vedi sopra, par. 7.1): il primo criterio è la massima vicinanza semantica tra i tipi che si aggregano (che implica la massima distanza semantica tra le categorie risultanti). Naturalmente, il punto di riferimento per valutare vicinanza e distanza semantica sarà il concetto generale che si vuole operativizzare — in questo caso il capitale culturale. Il criterio che si è già definito ausiliare è l’opportunità di evitare eccessivi squilibri tra le frequenze delle categorie risultanti, per non pregiudicare la successiva fase di analisi dei dati. Come sempre, occorre bilanciare il criterio semantico con quello numerico. È ovvio che questo bilanciamento si può operare meglio quando teniamo sott’occhio la tabella, cioè quando i dati sono già stati registrati. Per questo motivo si consiglia di progettare gli indici in generale e in astratto prima di raccogliere i dati, ma di aspettare che i dati siano registrati prima di entrare nei dettagli della loro costruzione. Sfortunatamente, al 19 momento non ho a disposizione dati sul tema, e quindi non posso applicare questa massima nell’esempio di riduzione che segue (tab. 8.3). Tuttavia, la proposta tiene conto di una considerazione derivante da esperienze di ricerca: molti intervistati, per dare la migliore immagine di sé nel rispondere a una domanda sulla lettura preferita, tendono a indicare il genere di lettura che percepiscono come culturalmente più apprezzato tra quelli che vengono loro in mente al momento. I tipi che emergono dalla riduzione sono quindi i seguenti: capitale culturale coerentemente basso (codice 1) capitale culturale discendente (codice 2) soggetti i cui genitori non arrivano al titolo mediosuperiore, e che preferiscono leggere fumetti, cronaca rosa, nera, sportiva o mondana, romanzi di avventure e di viaggi soggetti che non hanno indicato saggi o classici rispondendo alla domanda, ma hanno entrambi i genitori col titolo superiore soggetti che non hanno indicato classici o romanzi di buon livello rispondendo alla domanda, ma hanno uno dei genitori con istruzione superiore capitale culturale coerentemente medio (codice 3) soggetti che preferiscono leggere fumetti, cronaca rosa, nera, sportiva o mondana, ma hanno uno dei genitori con titolo medio-superiore soggetti che non hanno indicato saggi o classici rispondendo alla domanda, ma hanno uno dei genitori con istruzione superiore soggetti che preferiscono leggere fantascienza, romanzi gialli, di avventura e di viaggio, best sellers o romanzi di buon livello, e hanno uno dei genitori con titolo medio-superiore soggetti che preferiscono leggere romanzi di buon livello, best sellers e fantascienza, e hanno uno dei genitori con istruzione media 20 capitale culturale ascendente (codice 4) capitale culturale coerentemente alto (codice 5) soggetti che indicano saggi e classici come lettura preferita, ma non hanno nemmeno un genitore con istruzione superiore soggetti che indicano saggi,classici,racconti di buon livello, bestsellers,fantascienza, ma hanno entrambi i genitori con la sola istruzione elementare soggetti che indicano saggi o classici come lettura preferita e hanno uno o entrambi i genitori con istruzione superiore Fino a questo punto si sono combinati solo tre indicatori e già l’esempio può dare un’idea della quantità e complessità dei problemi semantici e delle conseguenti decisioni che sono implicate nella costruzione di un indice con indicatori le cui definizioni operative producono variabili categoniali o ordinali. Ogni volta che si vogliono combinare uno o più indicatori, la complessità semantica aumenta in modo quasi esponenziale, le decisioni necessarie per ridurre la tipologia sono sempre più problematiche e il controllo intellettuale sull’intera operazione e sui suoi risultati diminuisce. Per questo motivo, ogni volta che si possono immaginare definizioni operative che creano variabili cardinali o quasi-cardinali, i ricercatori esperti lo preferiscono. Ma questo non legittima affatto la pratica di trattare come cardinali variabili che non sono neppure ordinali — come spesso si vede fare51. 8.7. LA COSTRUZIONE DI INDICI SOMMATORI CON VARIABILI CARDINALI E QUASI-CARDINALI Per due motivi costruire indici con variabili cardinali o quasi-cardinali è più semplice che costruirli con variabili categoriali o ordinali. Il primo è ovvio, e consiste nella possibilità di compiere con piena legittimità52 operazioni matematiche sui codici numerici che rappresentano gli stati in queste variabili. Il secondo motivo — la ridotta o nulla autonomia semantica delle categorie (vedi sopra, pan. 7.3) — non è tanto ovvio, e per questo non viene frequentemente menzionato nei testi di metodologia. Tuttavia non ha minore importanza, perché è quello che permette di passare da un trattamento con tabelle, dove il fuoco dell’attenzione deve concentrarsi su ogni cella, a un trattamento con diagrammi, dove l’attenzione può concentrarsi sull’andamento globale della relazione. Come vedremo nel capitolo 9, questa considerazione vale non solo per la costruzione degli indici, ma anche per l’analisi delle relazioni tra le variabili. Dal punto di vista tecnico, i procedimenti sono gli stessi; quello che cambia radicalmente èl’obiettivo del trattamento. In un caso, stiamo costruendo variabili di maggiore generalità e portata teorica; nell’altro, le variabili sono state costruite, e stiamo esplorando un segmento della fitta rete di relazioni tra loro. 51 Un esempio clamoroso è stato riportato in una nota del par. 7.1. A rigore, la legittimità è piena solo in caso di variabili cardinali. Come sottolineavo nel par. 7.5, le variabili quasi-cardinali presentano differenze non trascurabili con le variabili cardinali; per questo trattarle come cardinali non sarebbe pienamente legittimo, e lo si fa per approfittare dei grandi vantaggi impliciti in questo tipo di trattamento. Con variabili ordinali, la distorsione può essere tanto grande che molti non considerano legittimo trattarle con tecniche cardinali. Con variabili categoriali questo trattamento è un vero nonsenso, giacché i codici numerici delle categorie sono completamente arbitrari. 52 21 Peraltro, le operazioni matematiche necessarie per costruire indici sono molto più semplici di quelle che si usano nell’analisi statistica vera e propria. A volte sono semplici somme di punteggi: il punteggio di ciascun caso (individuo, aggregato territoriale o altro) sull’indice è uguale alla somma dei suoi punteggi sugli indicatori. Naturalmente questo livello di semplicità si può raggiungere solo se sono soddisfatte quattro condizioni: una fattuale, una numerica e due semantiche. 1. La condizione fattuale è che non manchino dati su uno o più indicatori: se ne mancano, il punteggio finale di ciascun caso nell’indice deve essere la media e non la somma dei suoi punteggi validi. Se si sommasse, i punteggi finali di tutti i casi che hanno dati mancanti sarebbero indebitamente minori di quello che dovrebbero essere (qualunque cosa ciò significhi a livello della proprietà: un soggetto potrebbe risultare meno intelligente, o meno autoritario, o meno conservatore, o meno progressista di quanto sia in realtà). Naturalmente, spetta al ricercatore decidere quanti dati mancanti si possono accettare: se l’indice è formato da cinque indicatori e per il soggetto X mancano informazioni su tre di essi, sarebbe opportuno non assegnargli alcun punteggio sull’indice. 2. La condizione numerica è che tutte le variabili che si sommano abbiano la stessa estensione di scala, o almeno un’estensione simile. Questa condizione vale per gli indici formati sia con variabili metriche (risultato di una misurazione), sia con variabili cardinali naturali (risultato di un conteggio), sia con variabili quasicardinali (risultato di alcune tecniche di scaling). Vediamo un esempio per ogni tipo. Immaginiamo che la federazione di atletica di una nazione povera abbia fondi per mandare alle Olimpiadi solo un lanciatore. Per scegliere quale sarà si decide di sommare per ogni candidato i risultati che ottiene nei quattro tipi di lancio (disco, giavellotto, martello e peso) e mandare quello che ottiene la somma più alta. Però in questo modo si danneggiano i lanciatori di peso, il cui margine sui non specialisti può aggirarsi intorno ai cinque metri, mentre i lanciatori delle altre specialità possono avere margini di trenta metri e più rispetto ai non specialisti. La soluzione corretta sarebbe standardizzare i punteggi, o almeno normalizzare53 ogni risultato dividendolo per il record nazionale o per il record mondiale nella rispettiva specialità. Immaginiamo ora che si voglia costruire un indice di possesso di beni mobili durevoli, e per ogni soggetto si sommino il numero di automobili, il numero di televisori, di frigoriferi, etc., fino al numero di apparecchi radio e di cellulari. È chiaro che un cellulare non ha lo stesso valore di un’automobile: prima di sommare questi beni si dovrebbe ponderare ciascuno per il suo costo specifico, o almeno per il costo medio di quel tipo di bene. Per ultimo, immaginiamo di costruire un indice di progressismo. Poiché il progressismo è un concetto complesso e non si può rilevare direttamente, occorre trovare indicatori e operativizzarli attraverso le tecniche illustrate nel paragrafo 7.3. Supponiamo di usare i punteggi assegnati da ogni soggetto a leaders o simboli progressisti con il “termometro”, la sua auto-collocazione sulla scala destra-sinistra e le risposte scelte reagendo a frasi di orientamento progressista in una batteria di scale Likert. Per costruire l’indice non si potranno sommare direttamente questi punteggi54, dato che i punteggi sui termometri vanno da 0 a 100, sulla scala destra-sinistra vanno da O a 10, e sulle scale Likert vanno da 0 (o 1) a 4 (o 3): prima di sommare si 53 La standardizzazione (vedi sopra, par. 7.3. è una delle tante forme di normalizzazione. Ma c’è chi lo ha fatto — ad es. il politologo americano Smith [1969] — senza rendersi conto che in questo modo stava considerando ogni termometro 20 volte più importante di ciascuna scala Likert. 54 22 dovranno quindi standardizzare i punteggi, o almeno normalizzarli dividendo ciascuno per il massimo punteggio previsto dalla scala relativa. 3a. Alcuni esempi ora presentati servono anche per illustrare la prima condizione semantica. Immaginiamo che la federazione di atletica voglia inviare alle Olimpiadi anche un decatleta. È risaputo che le prove del decatlon includono tre lanci, tre salti e quattro corse. In questo caso, non ci si può limitare a normalizzare i punteggi prima di sommarli. Questo perché nei salti e nei lanci più alta è la cifra, maggiore è il merito; per le corse, vale ovviamente il contrario. Perciò, si deve invertire la direzione dei punteggi relativi alle corse — e questo è esattamente ciò che fa la federazione mondiale di atletica nella sua tabella dei punteggi per il decatlon. Lo stesso problema semantico si presenta con l’indice di progressismo: solo dopo avere invertito la direzione dei punteggi si possono includere nell’indice anche i punteggi di favore assegnati col termometro a leaders e simboli conservatori, e le risposte alle frasi conservatrici in una batteria di scale Likert. 3b. La seconda condizione semantica della quale si parlava è più complessa. Finora si sono presentate operazioni (standardizzazione, normalizzazione, inversione della direzione semantica) che avevano l’obiettivo di rendere effettivamente equivalenti gli indicatori prima di combinarli in un indice, nell’eventualità che il ricercatore li consideri tutti ugualmente validi55 Ma può succedere che un ricercatore consideri alcuni indicatori più validi di altri, per motivi legati alla sua diretta conoscenza del problema e/o dell’ambito esaminato, alle sue esperienze precedenti, alla letteratura sul tema. Se ha buoni motivi per credere questo, deve tenerne conto nella formazione dell’indice, senza timore di non essere “oggettivo”. Oltre al fatto che una scelta di indicatori non può in alcun modo essere “oggettiva”, si deve aggiungere che considerare ugualmente validi tutti gli indicatori è un assunto indimostrabile esattamente come supporre il contrario. Per ponderare il contributo di ogni indicatore alla somma che stabilisce per ciascun caso il punteggio sull’indice, il ricercatore ha due vie. Può farsi guidare dalle sue valutazioni semantiche, moltiplicando i punteggi degli indicatori che considera più validi per un coefficiente maggiore di 1 (può essere 1,2 o 1,3 o altro simile) e gli indicatori che considera meno validi per un coefficiente minore di 1 (può essere 0,7 o 0,8 o altro simile). Oppure può sfruttare le possibilità che gli offre la matrice dei dati, sottoponendo l’insieme delle variabili che operativizzano i possibili indicatori del concetto che interessa a un’analisi delle componenti principali56. Questa tecnica ha tre funzioni, alle quali corrispondono tre fasi nel procedimento: 1. scegliere nel paniere iniziale dei possibili indicatori quelli che risultano avere una stretta relazione empirica con gli altri, e che quindi si può supporre abbiano un apprezzabile rapporto semantico con il concetto che interessa; 2. stimare la forza di questo rapporto semantico (cioè la validità) tra il concetto e ciascuno degli indicatori scelti; 3. basandosi su questa stima, stabilire un coefficiente per ponderare i punteggi di ciascun indicatore tenendo conto delle possibili sovrapposizioni semantiche, cioè del fatto che due o più indicatori possono rappresentare aspetti molto vicini dell’intensione del concetto. 55 Sul concetto di validità vedi sopra, par. 8.4. L’analisi in componenti principali è preferibile alla più antica e più diffusa analisi fattoriale perché non impone manipolazioni arbitrarie della matrice dei dati prima di sottoporla al trattamento con l’algebra matriciale [vedi Di Franco e Marradi 2003]. Una rassegna di altre classiche tecniche per ponderare gli indicatori basandosi sulle loro relazioni con altre variabili della matrice sta in Edgerton e Kolbe [1936]. 56 23 In questo caso, l’indice finale non è altro che la somma dei punteggi di ogni individuo sugli indicatori scelti nella fase 1; ma prima di sommarli, i punteggi sono moltiplicati per il corrispondente coefficiente calcolato nella fase 3. Si tratta quindi di un particolare indice sommatorio, in cui la somma è ponderata. 24