Indicatori, validità, costruzione di indici

Transcript

Indicatori, validità, costruzione di indici
Indicatori, validità, costruzione di indici1
8.1.
PERCHÉ INDICATORI?
Nel capitolo 6 ho dato per scontato che stabilire una definizione operativa2 ponga
soltanto problemi pratici: trovare la tabella del censimento con i dati desiderati,
calcolare percentuali, formulare il testo di una domanda e i testi delle risposte
prestabilite che si offriranno alla scelta dell’intervistato, etc.
Ma non sempre ci sono solo problemi pratici. Talvolta la natura della proprietà in esame
non permette assolutamente di immaginare una definizione operativa diretta3 altre volte
la si può immaginare, ma il buon senso, la conoscenza della situazione, l’esperienza di
ricerca, ci inducono a pensare che quella definizione operativa sarebbe inadatta a
registrare fedelmente gli stati sulla proprietà in questione.
Immaginiamo ad esempio che la nostra unità di analisi sia lo Stato, il nostro ambito sia
l’Europa e la proprietà che ci interessa sia il livello di libertà politica di cui godono i
cittadini di ciascuno Stato. Una definizione operativa diretta sarebbe qualcosa come:
1. trovare la signora Germania, la signora Polonia, la signora Russia, etc. e chiedere
qual è il livello di libertà politica dei loro cittadini;
2. invitare queste signore a rispondere scegliendo uno dei seguenti livelli: nessuna
libertà/poca/insufficiente/sufficiente/molta/moltissima.
Ma una cosa del genere è chiaramente impossibile, perché la signora Germania, la
signora Polonia, la signora Russia, etc. non esistono. Si potrebbe pensare di sottoporre
la domanda al presidente di ciascuno Stato; ma la sua risposta non sarebbe affidabile,
perché anche il peggior dittatore dichiarerebbe che i suoi cittadini godono di una piena
libertà politica. Si registrerebbe l’immagine che i presidenti vogliono dare del livello di
libertà politica dei loro paesi, che è tutt’altra cosa del livello in se stesso.
Un’idea apparentemente migliore sarebbe porre la domanda a campioni di cittadini di
quei paesi chiedendo le loro opinioni. Ma questa soluzione pone problemi ancora più
grandi, che si possono sintetizzare con la domanda:
“L’opinione di chi?”.
Ad essa inevitabilmente seguirebbero altre, come:
Si considera un campione di tutti i cittadini adulti, o solo di quelli che hanno una
qualche idea di ciò che si intende per ‘libertà politica’? E come giudicare quali
cittadini sono veramente competenti?
Si considera un campione di tutti i cittadini adulti, o solo di quelli che non hanno
paura di manifestare a un perfetto sconosciuto la loro opinione su un problema tanto
delicato? E come individuare chi sta dicendo ciò che pensa veramente? Inoltre,
considerando che le opinioni variano da soggetto a soggetto, quale opinione si
assumerà come stato sulla proprietà ‘livello di libertà politica’ di ciascun Stato
1
Questo capitolo è una traduzione, rivista e integrata dall’autore, del capitolo «Indicadores, validez,
construcciòn de indices’ nel volume «Metodologia de las ciencias sociales”, Buenos Aires, Ariel, 2007.
2
Cioè fissare l’insieme di atti, regole e convenzioni che permettono di trasformare una pro¬prietà di
alcuni oggetti di un certo tipo in una variabile nella matrice dei dati.
3
Cioè, strettamente associata alla proprietà in questione e da essa direttamente suggerita, senza alcun
margine per ragionevoli perplessità.
1
studiato? Si potrebbe assumere l’opinione modale (cioè quella condivisa dal maggior
numero di soggetti) o l’opinione mediana, se si propone agli intervistati una specie di
scala ordinale come quella menzionata sopra4.
Infine, anche ammettendo di poter estrarre in ciascuno Stato solo campioni di cittadini
competenti e sinceri nel manifestare i loro giudizi, quello che si registrerà sarà solo
l’opinione modale (o mediana) di questi cittadini sul grado di libertà politica del
rispettivo Stato. Non si può negare che questa opinione abbia qualche relazione con il
livello di libertà politica in sé; ma non si può neppure affermare che siano la stessa
cosa. Si cerca il livello di libertà politica, ma si ottiene — nel migliore dei casi —
l’opinione di cittadini abbastanza competenti e forse sinceri. Come tutte le opinioni,
questa può essere errata (nel caso, troppo benevola o troppo critica verso il proprio
paese).
Immaginiamo ora che il nostro ambito sia l’Italia, la nostra unità di analisi sia il maschio
adulto, e la proprietà che interessa sia il grado di autoritarismo. In questo caso, la strada
per una definizione operativa diretta appare semplice. Senza sforzo, si possono
immaginare domande come: “Qual è il suo grado di autoritarismo?” e risposte come:
inesistente/basso/medio/alto. Però talvolta le soluzioni semplici portano fuori strada; e
questo sarebbe proprio un esempio. In effetti, non si registrerebbe il grado di
autoritarismo, ma la propensione di ciascun maschio adulto a dichiararsi autoritario —
una propensione rara in tutti gli individui, e probabilmente ancor più rara tra gli
individui autoritari.
Si potrebbero fare altri esempi; ma quelli fatti bastano a stabilire alcuni criteri generali:
1. Non si può immaginare una definizione operativa diretta ogni volta che:
a) l’unità di analisi è qualcosa che non si può interrogare (un ente, un aggregato
territoriale, etc.) e
b) gli stati sulla proprietà indagata non si possono rilevare mediante osservazione diretta
o estrarre da documenti ufficiali (come si può fare per la superficie, il tipo di sistema
elettorale, il numero di abitanti, il numero di voti per un partito, etc.).
2. Una definizione operativa diretta si può immaginare, ma non è affidabile (abbiamo
cioè motivo di pensare che produrrà molti dati infedeli) ogni volta che l’unità di analisi
è un essere umano e che la proprietà indagata:
a)
ha risposte socialmente desiderabili (quasi tutti diranno di essere onesti e
generosi e negheranno di essere autoritari, ossessivi, noiosi, sleali, etc.);
b)
è un concetto familiare allo scienziato ma non all’uomo comune (non è il caso di
chiedere all’uomo della strada qual è il suo grado di anomia, di particolarismo,
di introversione);
c’è qualcosa che la morale dominante nella comunità dell’intervistato considera
riprovevole (abitudini sessuali devianti, evasione fiscale, etc.).
Il fatto che non si possa dare una definizione operativa diretta non comporta la rinuncia
a raccogliere informazioni su quella proprietà. Per farlo, bisogna trovare una o più
proprietà che:
a)
ammettano accettabili definizioni operative dirette;
b)
abbiano una stretta relazione semantica con la proprietà che interessa.
Queste proprietà si chiamano indicatori della proprietà X, e la relazione che si
stabilisce tra queste e la proprietà X si chiama “rapporto di indicazione Su questo
tornerò subito4.
4
Si dirà che l’opinione modale e l’opinione mediana tendono a coincidere. Ma ciò è vero solo se la
distribuzione delle risposte ha una forma campanulare e simmetrica.
2
Voglio prima sottolineare che il ricorso a indicatori non è specifico delle scienze sociali.
Si usano indicatori anche nella vita quotidiana, ogni volta che qualche elemento visibile
viene considerato un indizio, un segnale di qualcosa che non è palese ma è interessante.
La frase “il ragazzo è arrossito; questo è un chiaro indicatore della sua colpa” mostra
non solo che il concetto è familiare, ma anche che il termine esiste nel linguaggio
ordinario. E in vari linguaggi tecnici il termine si usa per designare strumenti che
rivelano lo stato di un processo (indicatori di livello, di pressione, etc.).
Nelle scienze sociali il concetto — non il termine — di indicatore appare verso la
metà dell’Ottocento negli scritti di alcuni positivisti di lingua francese [Villermé
1840; Quételet 1869]. Alla fine del secolo Durkheim parla di “indici esteriori” che
simbolizzano fatti interiori e fenomeni morali [1893; 1896]. Il positivista italiano
Niceforo, emigrato a Parigi, dedica un’opera agli “indici numerici della civiltà e deI
progresso” [1921], usando il termine con lo stesso significato che si attribuisce ora
all’espressione ‘indicatori sociali’.
Il primo a usare il termine ‘indicatore’ nel senso che gli si dà nell’approccio standard
alle scienze sociali è il sociologo americano Stuart Dodd [1942]. Ma è stato il
metodologo Paul Lazarsfeld a codificare quest’uso, distinguendo tra indicatori e indici
(combinazioni di indicatori)5.
Si possono individuare tre somiglianze tra il concetto ordinario di indicatore e il
concetto che si usa nell’approccio standard alle scienze sociali:
a) in entrambi i casi l’indicatore è qualcosa di manifesto (o registrabile) che dà
informazioni su qualcosa che non è manifesto (o direttamente registrabile);
b) in entrambi i casi il fenomeno manifesto/la proprietà registrabile può interessare in
sé o come segnale di qualcosa che non è manifesto, o registrabile. L’aggressività
verbale può interessare in sé o come indicatore di complessi di inferiorità; il tasso
di divorzi può interessare in sé o come indicatore di secolarizzazione; la
percentuale di voti a un partito di opposizione può interessare in sé o come
indicatore di insoddisfazione per la politica del governo in carica;
c) in entrambi i casi il fenomeno manifesto/la proprietà registrabile può essere
considerata — da osservatori differenti e persino dallo stesso — indicatore di due
o più fenomeni/proprietà. Il fatto di arrossire può essere considerato un indicatore
di senso di colpa o di timidezza. Il tasso di divorzi può essere considerato un
indicatore di secolarizzazione o di disgregazione dell’istituzione familiare.
5
Molti autori [Merton 1948; Lazarsfeld e Barton 1951; Galtung 1967; Przeworski e Teune 1970;
McKennell 1973; Nowak 1976; Carmines e Zeller 1979] scrivono che gli indicatori sono necessari
quando il concetto è generale e/o ha grande importanza teorica. Però, come osservò Blalock, “alcune
variabili teoricamente importanti possono essere facilmente operativizzate:
l’età, il sesso, la razza, la confessione religiosa” [1961a/1972, 163]. A questo breve elenco si possono
aggiungere la nazionalità, il luogo di residenza, il titolo di studio, lo stato civile, la condizione
occupazionale, il tipo di occupazione; inoltre — con unità territoriali — la superficie, la popolazione, la
forma di regime politico, etc.
Gli autori citati all’inizio di questa nota hanno commesso un errore logico: dall’osservazione
incontestabile che gli indicatori sono concetti più specifici dei concetti che indicano (il motivo di questo
si vedrà al par. 8.3) hanno tratto la conclusione che tutti i concetti generali neces¬sitano di indicatori.
Però questo è chiaramente un non sequitur, cioè una deduzione fallace perché la conseguenza non deriva
necessariamente dalle premesse.
3
8.2.
LA NATURA DEGLI INDICATORI NELLE SCIENZE SOCIALI
Le differenze tra gli indicatori che usiamo nella vita quotidiana e quelli che usiamo
nell’approccio standard alla ricerca sociale possono essere tutte ricondotte al fatto che in
quest’ultima l’indicatore deve la sua esistenza alla necessità di registrare proprietà che
non è possibile definire operativamente in forma diretta. Si ricordi che la definizione
operativa è lo strumento che ci permette di trasformare una proprietà del mondo reale in
una variabile che occupa un vettore-colonna della matrice dei dati (vedi sopra, par. 6.2).
Di conseguenza, la natura di un indicatore nelle scienze sociali è strettamente vincolata
a quella dei vettori-colonna della matrice. Da ciò consegue che nell’approccio standard
alle scienze sociali:
a) si possono concepire come indicatori solo concetti che si riferiscono a proprietà;
b) queste proprietà devono presentare stati in tutti gli esemplari6 dell’unità di analisi in
quella ricerca, cioè in tutti i casi che occupano le righe di quella matrice.
Un esempio farà capire meglio cosa si intende. A titolo di esercizio, gli studenti di un
corso di metodologia proponevano alcuni indicatori di status sociale. L’unità era
l’individuo adulto, l’ambito era l’Italia contemporanea. Fra gli indicatori fu proposto
il tipo di stazione di sci preferita da un individuo. Ma non si poteva accettarlo come
indicatore di status sociale perché la maggior parte degli italiani adulti non sa sciare, o
non ha i mezzi per frequentare regolarmente stazioni sciistiche.
Si possono quindi scegliere come indicatori (di un altro concetto) solo concetti che si
riferiscono a proprietà, suggeriscono una definizione operativa diretta e rispondono al
requisito (b) sopra illustrato. Queste condizioni sono necessarie ma non sufficienti: la
condizione essenziale è che il ricercatore7 percepisca una stretta relazione semantica tra
l’indicatore e il concetto indicato.
Sulla natura di questa relazione semantica (rapporto di indicazione) si trovano in
letteratura le opinioni più varie.
Molti autori8 parlano di relazione causale, di solito senza stabilire se il concetto
indicato è la causa o l’effetto dell’indicatore. Come vedremo in seguito, in certi casi i
concetti scelti come indicatori si possono ragionevolmente considerare cause del
concetto di cui sarebbero indicatori, in altri casi si possono considerare effetti; in altri
ancora gli indicatori scelti non si possono considerare né cause né effetti del concetto
indicato. Anche nei casi in cui si può immaginare che questa relazione causale esista,
stabilire la sua direzione non è sempre ovvio come può sembrare.
Alcuni esempi: il tasso di contaminazione dell’aria o il tasso di criminalità sono
alcune cause della percezione della qualità della vita in un comune, e spesso si
scelgono come indicatori di questo concetto. Al contrario, il favore a un governo
militare può considerarsi un effetto di un più generale atteggiamento autoritario del
soggetto, e spesso si sceglie come indicatore di autoritarismo.
Vediamo un caso meno ovvio. In una ricerca sui comuni dell’Italia centrale scoprii
un’altissima correlazione negativa tra il reddito pro-capite nel comune e la
proporzione di case di proprietà della famiglia che le abitava. Il segno negativo mi
parve contrario ad ogni ragionevole aspettativa (quanto più ricca è una famiglia, tanto
più dovrebbe essere in grado di comprare la casa in cui abita). Ma la relazione
6
Agli indici e alle procedure usate per costruirli si dedicherà la parte finale di questo capitolo.
Almeno in linea di principio, e tranne poche eccezioni marginali.
8
Per esempio Stevens [1951]; Blalock [1961b]; Sullivan [1974]; Smelser [1976].
7
4
negativa era tanto nitida che mi indusse a riflettere. Così compresi che non era
accidentale, ma era l’effetto di una vera catena causale:
1) nei comuni di montagna, o comunque isolati, le opportunità di lavoro sono limitate;
2) per questo motivo, i redditi medi sono bassi dei giovani tendono a spostarsi nei
comuni urbani e centrali. 4) Questa migrazione interna riduce la domanda di alloggi
nei comuni isolati e poveri e la accresce nei comuni ricchi e centrali; 5) per questo, i
prezzi degli alloggi tendono ad abbassarsi nei primi e ad aumentare nei secondi. 6) Di
conseguenza, molti abitanti poveri dei comuni isolati hanno abbastanza denaro per
comprare la casa in cui vivono, mentre gli abitanti più ricchi dei comuni
centrali/urbani non possono farlo. Dopo avere ricostruito questa catena causale, il
ricercatore può essere più fiducioso nello scegliere il tasso di case che sono di
proprietà di chi le abita sul totale delle case come indicatore di sottosviluppo
economico.
Peraltro, a volte non si riesce a individuare la relazione che unisce una proprietà facile
da operativizzare con un’altra non direttamente operativizzabile, e si sceglie la prima
come indicatore della seconda basandosi su una semplice associazione statistica.
Il concetto di associazione statistica sarà approfondito nel cap. 9; adesso è sufficiente
un esempio, tratto da un diffusissimo test psicologico, il Minnesota Multiphasic
Inventory. Questo test, ideato alla fine da Hathaway e McKinley [1939], ha varie
versioni, tutte composte da un mezzo migliaio (!) di affermazioni con risposta
seccamente dicotomica (sì/no) sugli argomenti più svariati. Alcune delle affermazioni
alle quali i soggetti devono reagire sono troppo generiche per suggerire un sì o un no
secco (“non mi preoccupo per quello che mi succede”; “il mio modo di agire si presta
ad esser frainteso dagli altri”; “qualcuno ha cercato di influenzare la mia mente”);
altre sono curvilinee (ad es. “soffro raramente di dolori dietro il collo”9); altre ancora
sembrano bizzarre (“di solito ho le mani e i piedi abbastanza caldi”; “qualche volta la
sommità della mia testa è molto sensibile”; “a volte sento strani odori”; “ho
l’abitudine di contare oggetti di nessuna importanza, come le lampadine delle insegne
luminose”).
La frase più bizzarra compare in una versione con sole 480 affermazioni, che io stesso
ho compilato come neo-laureato in cerca di lavoro. Il testo è: “Sento prurito alle dita
quando apro la maniglia di una porta”. E possibile che Hathaway e McKinley, o altri
psicologi, abbiano scoperto relazioni di causa-effetto tra sensazioni tanto specifiche e
strane e alcune importanti proprietà psichiche. Malgrado tutto, l’impressione è che in
qualche ricerca gli psicologi abbiano osservato che la maggior parte dei soggetti
autoritari (o anomici, o paranoici) percepivano sensazioni di prurito nell’aprire
maniglie (o altre sensazioni strane), mentre i soggetti non autoritari (o non anomici, o
non paranoici) non le percepivano. Basandosi su questa associazione statistica — che
ovviamente può essere accidentale, dipendere dalla popolazione studiata, etc. —
hanno deciso di scegliere questa sensazione come uno degli indicatori di autoritarismo
(o di anomia, o di inclinazioni paranoiche, o di chissà cosa)10.
Naturalmente questi sono casi-limite, che si possono giustificare solo se si ha bisogno
9
Un soggetto può rispondere ‘no’ sia che non soffra mai di questi dolori, sia che ne soffra spesso. Sul
concetto di curvilinearità vedi sopra, par. 7.5.
10
Trent’anni dopo, mostrando una capacità autocritica assai rara fra i fautori dell’approccio standard,
Hathaway e McKinley si sono chiesti (sin dal titolo dell’articolo) “Dove abbiamo sbagliato?” e hanno
concluso: “Non si possono applicare nello studio della personalità gli stessi strumenti matematici che
sono serviti a risolvere problemi in altri campi della scienza” [1972, 44].
5
di indicatori di un concetto X e non si trovano concetti la cui associazione empirica11
col concetto X si possa giustificare semanticamente.
Come si diceva, le convinzioni sulla natura del rapporto di indicazione sono varie.
Lazarsfeld [1958; 1966] e altri che lo seguono12 parlano di relazione probabilistica.
Ma questo è un errore categoriale13, perché una relazione probabilistica può
intercorrere solo tra un evento (o classe di eventi) e un altro evento (o classe di
eventi).
Altri14 parlano di inferenza: anche questo è un errore categoriale, perché l’inferenza è
un possibile vincolo tra asserti, non tra concetti.
Guttman [1950] e altri15 parlano di “campionamento di un universo di contenuto”. Ma
questo è un ennesimo errore categoriale, perché il campionamento presuppone che la
popolazione (e quindi il campione) sia formata da individui (o altri oggetti fisici) ben
delimitati, non da entità vaghe e non delimitabili come i concetti.
Meno grave appare l’errore di coloro che parlano di una relazione logica o analitica16.
Infatti una relazione logica può instaurarsi tra concetti (ad es. la relazione tra il genere
e le sue specie ha natura logica); ma la relazione tra un concetto e i suoi indicatori non
ha la stessa natura della relazione genere-specie, che è necessaria (tutti i gatti sono
felini, ma ci sono felini che non sono gatti: vedi sopra, par. 3.1). Ogni ricercatore, o
gruppo di ricercatori, stabilisce la relazione secondo la sua conoscenza della
popolazione studiata e della letteratura sull’argomento, le sue esperienze di ricerca
precedenti, e in definitiva secondo le sue preferenze. Altri ricercatori — o lo stesso
ricercatore in un’occasione successiva – possono scegliere altri indicatori per lo stesso
concetto, e spesso lo fanno.
Tutto ciò non significa che la scelta sia arbitraria. Ovviamente il ricercatore ha il
massimo interesse a scegliere indicatori che siano validi17, cioè che permettano di
rilevare fedelmente almeno alcuni aspetti dell’intensione del concetto indicato. Per
questo non effettuerà la scelta senza conoscere la popolazione oggetto della ricerca, e la
letteratura sul problema che interessa18. Non c’è alcun obbligo di ripetere le scelte di
quelli che hanno studiato prima lo stesso problema, tanto meno se si studia lo stesso
fenomeno in un altro ambito; è facile capire che “lo stesso fenomeno” può avere
significati radicalmente differenti in ambiti differenti19. Un esempio classico è il tasso di
partecipazione elettorale, che può essere considerato un indicatore di forza della vita
11
Nel senso di associazione statistica fra le variabili che li operativizzano.
Ad es. Verba [1969]; Nowak [1976].
13
Per errore categoriale si intende l’attribuzione a una qualsiasi entità di una proprietà che non può
competerle: questo pensiero è solubile; questo tavolo è intelligente. Fu Gilbert Ryle [1938] a definire per
primo questo genere di errori.
14
Ad es. Galtung [1967]; McKennell [1973]; Singer [1982].
15
Ad es. Cronbach e Meehl [1955].
16
Ad es. Nowak [1976]; Sullivan e Feldman [1979].
17
Alla validità degli indicatori sarà dedicato il par. 8.4.
18
Questo non significa che debba scegliere i suoi indicatori in funzione della sua teoria, come molti
sostengono. Sostenere che la teoria che si sta controllando empiricamente debba dettare, o ispirare, la
scelta degli indicatori che servono per controllarla presenta — oltre che un diffuso odore di circolarità —
l’ovvio rischio che si scelgano indicatori che offrono la maggiore probabilità di corroborare la teoria che
si controlla.
19
Questa possibilità non sfuggì a molti autori di comparazioni internazionali [Teune 1968; Verba 1969;
Frey 1970; Mokrzycki 1983], che sottolinearono che indicatori dello stesso concetto devono essere
“equivalenti”, non uguali. Ciononostante, questa raccomandazione non è sempre ascoltata, e “molte
istituzioni che collaborano con gli americani nelle ricerche comparate si lamentano del fatto che i
questionari che vengono loro inviati dagli Stati Uniti sono spesso accompagnati dall’ordine che la
traduzione sia assolutamente letterale” [Brislin, Lonner e Thomdike 1973, 39].
12
6
democratica nei paesi in cui si tengono elezioni libere, mentre era un indicatore della
capacità di mobilitazione del partito unico nei paesi dell’Est europeo; e potrebbe persino
essere considerato un indicatore di osservanza delle norme nei paesi dove votare è un
dovere legale, come in Argentina o anche in Italia fino a poco tempo fa.
Altra caratteristica che può cambiare radicalmente il significato di un fenomeno è il
livello dell’unità d’analisi quando questa è aggregata a livello territoriale. Un esempio
lo offre il diverso significato della percentuale di anziani nella popolazione. Se l’unità
d’analisi è il comune, questo è un indicatore di marginalità e di stagnazione economica,
perché — come si diceva prima — i giovani tendono a trasferirsi in luoghi dove trovano
più opportunità di lavoro. Se l’unità d’analisi è la provincia, i comuni periferici e quelli
centrali della stessa provincia si fondono in uno stesso caso, e pertanto la percentuale di
anziani cesserà di essere collegata alla differenza tra comuni centrali e periferici. A
livello di provincia, la percentuale di anziani può essere un indicatore di qualità del
clima e più in generale della vita, giacché i pensionati tendono a trasferirsi — se
possono — nelle province migliori sotto questi punti di vista20.
A parte queste considerazioni, se un ricercatore si allontana dalle scelte di indicatori
fatte da coloro che hanno studiato lo stesso fenomeno nello stesso ambito e con una
unità d’analisi dello stesso livello, si dovrebbe sentire in dovere di giustificare il suo
rifiuto degli indicatori tradizionalmente scelti per il concetto che sta studiando, e quindi
la sua scelta di indicatori differenti [lo sottolinea Cartocci 1984].
8.3. ASPETTI INDICANTI E ASPETTI ESTRANEI: LA DUPLICE
PLURALITÀ DELLE RELAZIONI TRA CONCETTI E INDICATORI
Alla fine del paragrafo 8.1 si è osservato che una proprietà direttamente registrabile con
una definizione operativa può essere considerata — da osservatori diversi e persino
dallo stesso — un indicatore di due o più proprietà. Alcuni21 guardano a questo
fenomeno con disapprovazione, come un segnale dell’insufficiente maturità delle
scienze sociali; altri, basandosi su una rassegna di ricerche pubblicate, si limitano a
documentarlo22. Vediamone insieme le cause.
Quando due o più persone conversano tra loro, esse danno per scontato che ogni
termine abbia lo stesso significato per tutti. Come hanno mostrato gli etnometodologi
[Garfinkel 1964; 1967], questa convenzione è necessaria perché se ogni interlocutore
chiedesse il significato di ciascun termine si aprirebbe una regressione all’infinito e la
vita sociale si bloccherebbe. Però se si hanno fini non pratici ma conoscitivi, e si
chiede agli interlocutori di definire un qualunque termine, quasi sempre si trova che le
definizioni sono sensibilmente differenti — il che significa che lo stesso termine
designa concetti diversi per ogni soggetto. Ad esempio, nell’ascoltare il termine
‘autoritarismo’ alcuni possono pensare esclusivamente o soprattutto a fenomeni
politici, altri preferibilmente all’atteggiamento dei maschi nei confronti delle loro
spose, altri preferibilmente all’atteggiamento dei dirigenti di un’impresa verso i
dipendenti. E approfondendo ulteriormente si trova che per alcuni l’autoritarismo
20
Non a caso le percentuali di residenti anziani sono altissime in Florida e alte, ad es., in provincia di
Imperia.
21
Ad es. Zetterberg [1954], che lamentava l’estrema varietà degli indicatori scelti nelle ricerche sui
gruppi.
22
Ad es. lo psicologo McNemar [1946].
7
politico significa soprattutto il favore verso un governo militare, per altri il desiderio
che ci sia un solo partito, o solo due, per altri l’opinione che tutte le decisioni politiche
siano di pertinenza del governo centrale a discapito delle autonomie locali, etc.
Non si vuole dire che ogni soggetto dà un significato solo e diverso dagli altri ad ogni
termine; al contrario, che ogni soggetto può dare molti significati (alcuni centrali, altri
marginali) e che la distribuzione degli aspetti centrali, marginali e assenti varia da
soggetto a soggetto. Come abbiamo visto (par. 3.1), l’insieme di questi aspetti si
chiama intensione di un concetto; tutta la discussione precedente si può sintetizzare
dicendo che ciascun termine designa — o può designare — concetti con intensioni
differenti per ciascun soggetto che lo pronuncia o lo sente.
Chiarito questo, non dovrebbe stupire il fatto che un concetto A, direttamente
operativizzabile, sia scelto da differenti autori (e anche dallo stesso autore in situazioni
differenti) come indicatore di due o più differenti concetti non operativizzabili. Ciò
consegue dal fatto che l’intensione del concetto A varia da soggetto a soggetto, e varia
nel tempo anche per lo stesso soggetto.
Prendiamo come esempio il tasso di aborti registrati in ciascuna provincia di una
nazione di tradizione cattolica. Di solito questo si considera un indicatore di
secolarizzazione, cioè di autonomia rispetto ai precetti della Chiesa. Ma un ricercatore
che studi la natura dei costumi sessuali diffusi nella popolazione femminile di varie
province potrebbe considerare questo tasso un indicatore del livello di liberalizzazione
dei costumi, giacché l’aborto di solito è la conseguenza di una gravidanza indesiderata
perché dovuta a una relazione prematrimoniale. E in una nazione — come l’Italia —
che riconosce ai medici che operano negli ospedali pubblici il diritto all’obiezione di
coscienza nel praticare aborti, un ricercatore potrebbe scegliere il tasso di aborti
registrati come un indicatore della propensione all’obiezione di coscienza della classe
medica di ciascuna provincia. Infatti, di fronte a un rifiuto (o probabile rifiuto) di
praticare un aborto, le donne possono ricorrere a cliniche clandestine o spostarsi in
altre province in cui la classe medica non oppone l’obiezione di coscienza23.
Ogni ricercatore può considerare centrale un aspetto diverso dell’intensione del concetto
di tasso di aborti, e grazie a questo aspetto — che potremmo chiamare aspetto
indicante — sceglie il tasso di aborti registrati come indicatore di diversi concetti.
Quanto agli altri aspetti, che non gli servono per stabilire il rapporto di indicazione — e
che pertanto possiamo chiamare aspetti estranei – o li ignora, o li considera non
importanti, o si rende conto della loro presenza e importanza ma ha bisogno di
quell’indicatore e spera che gli aspetti estranei non alterino troppo il rapporto di
indicazione che vuole stabilire. Ma anche se il ricercatore trascura gli aspetti estranei
dell’indicatore che sceglie, questi aspetti permangono e contribuiscono a influenzare, ad
esempio, il modo in cui una certa domanda sarà interpretata dagli intervistati. Per questo
motivo, il primo criterio da seguire nella scelta degli indicatori è ridurre la prevedibile
incidenza di aspetti estranei. E in ogni caso, un ricercatore dovrebbe tenerli in gran
conto nell’interpretare i suoi dati.
A questa pluralità “verso l’alto” nei rapporti di indicazione (nel senso che un concetto
che suggerisce direttamente una definizione operativa può essere ragionevolmente
scelto come indicatore di vari altri concetti) corrisponde una pluralità “verso il basso”,
23
Se ricorrono a cliniche clandestine l’aborto non viene registrato e non risulta nelle statisti¬che ufficiali;
se si spostano viene registrato in una provincia diversa.
8
nel senso che per ogni concetto che interessa, ma che non suggerisce direttamente una
definizione operativa, è opportuno scegliere più di un indicatore.
Vediamone il perché partendo da un esempio. All’inizio del capitolo si è detto che la
libertà politica non si può definire operativamente in modo diretto (anche nel senso
più specifico di “livello di libertà politica di cui godono i cittadini di vari Stati”). Per
permettere di registrare le situazioni empiriche bisogna scendere verso concetti più
specifici, che sono aspetti dell’intensione del concetto di libertà politica.
I politologi convengono su almeno tre aspetti di questa intensione: libertà di opinione,
libertà di associazione, libertà di stampa. Ognuno di questi aspetti — come altri24,
sulla cui appartenenza all’intensione del concetto di libertà politica non c’è accordo
unanime — indica varie direzioni in cui possiamo cercare un indicatore, cioè un
concetto che si possa definire operativamente in maniera diretta e che sia
semanticamente collegato alla libertà politica.
Ad esempio, il concetto di libertà di opinione suggerisce il totale dei giorni di carcere
subiti per crimini di opinione durante un determinato anno, diviso per il numero di
adulti nella popolazione di ogni Stato25. La definizione operativa indicherà dove
rintracciare la documentazione necessaria, come fare i controlli consultando agenzie
internazionali, etc.
Il concetto di libertà di associazione suggerisce, ad esempio, il numero di associazioni
che sono state sciolte — ola cui costituzione è stata proibita — per motivi politici
(diviso per il numero di associazioni ammesse o non ostacolate) durante un certo
periodo.
Il concetto di libertà di stampa suggerisce, ad esempio, il totale di copie di quotidiani
e periodici sequestrati per motivi politici in un dato anno diviso per il totale delle
copie circolanti nello stesso anno.
Il concetto di libertà di andare all’estero suggerisce, ad esempio, il numero di
passaporti richiesti e non concessi diviso per il totale di passaporti richiesti durante un
certo anno.
La definizione operativa degli ultimi tre indicatori sarà analoga a quella precedente
(giorni di carcere), cambiando ovviamente le fonti di informazione e il modo di
controllarle.
Come si vede, per operare una qualunque registrazione di informazioni empiriche
semanticamente rilevanti per il concetto di libertà politica bisogna fare ricorso a concetti
molto più specifici e circostanziati, che indichino direttamente dove e come cercare
queste informazioni. Per questo si è parlato di un passaggio “verso il basso” dal
concetto ai suoi indicatori, e di un passaggio “verso l’alto” da ogni indicatore scelto al
relativo concetto. E dato che gli aspetti dell’intensione di un concetto generale possono
essere numerosi, per non ridurre troppo la generalità di questo concetto, e in fin dei
conti sostituirlo con un altro concetto, è necessario cercare indicatori per molti aspetti;
l’ideale sarebbe trovare indicatori per ogni aspetto rilevante della sua intensione26.
24
Ad es. la libertà religiosa, o la libertà di andare all’estero senza restrizioni di natura politica.
Se non si dividesse per il numero di adulti, gli Stati più popolati avrebbero un ovvio svantaggio.
L’operazione che consiste nel collocare ogni fenomeno nelle sue esatte dimensioni è detta
‘normalizzazione’ e sarà illustrata in dettaglio nel par. 8.5.
26
Questo è solo un ideale, perché gli aspetti rilevanti dell’intensione di un concetto non sono facilmente
elencabili (vedi sopra, par. 3.1), e inoltre qualunque tentativo di stabilirli sarà inevitabilmente
controverso. Nel par. 8.5 chiarirò altre difficoltà che si trovano nello scegliere indicatori per ogni aspetto
rilevante dell’intensione di un concetto. D’altro canto, se si tralasciano molti aspetti importanti
dell’intensione di un concetto, si dovrebbe cambiare la sua denominazione. Ma è assai raro che lo si
25
9
Questo si intende quando si parla di “pluralità verso il basso” del rapporto di
indicazione. Rapidamente, la duplice pluralità si può così sintetizzare:
• ogni concetto che non suggerisce direttamente una definizione operativa richiede
una pluralità di indicatori27
• ogni concetto che può essere direttamente operativizzato può essere scelto come
indicatore di una pluralità di altri concetti.
Una particolare combinazione di pluralità verso l’alto e verso il basso si trova spesso
nell’analisi secondaria. Con questa espressione si indica il fatto che molti ricercatori,
per approfondire un problema conoscitivo che li interessa, invece di raccogliere
direttamente i dati analizzano quelli già rilevati da altri ricercatori e conservati in
appositi archivi28. Naturalmente, ogni volta che si analizzano i dati di una ricerca altrui,
siamo limitati alle proprietà che interessarono l’autore o gli autori originari di quella
ricerca. Pertanto, può succedere che alcune proprietà interessanti non si trovino nella
matrice29. Prima di rinunciare a considerarle nei loro modelli30, molti ricercatori
esaminano attentamente tutta la matrice della ricerca originaria per vedere se trovano
variabili il cui concetto corrispondente possa essere considerato un indicatore dell’una o
dell’altra fra le variabili che li interessano. In questo modo, dati raccolti per avere
informazioni su una proprietà C, interessante in sé e come indicatore di una proprietà A
non direttamente operativizzabile, sono sfruttati per avere informazioni su una proprietà
B, anch’essa non direttamente operativizzabile.
Anche questa operazione, come tutti i rapporti di indicazione che un ricercatore
stabilisce, è sottoposta al giudizio della comunità scientifica circa la sua validità — un
concetto che esaminerò subito.
8.4. LA VALIDITÀ COME GIUDIZIO SULLA VICINANZA
SEMANTICA TRA UN CONCETTO E IL SUO INDICATORE
La validità è una proprietà del concetto I in quanto possibile indicatore del concetto C
in un determinato ambito spazio-temporale e con una determinata unità d’analisi. Il
grado in cui il concetto I possiede questa proprietà non si può misurare31, né indagare in
qualsiasi modo “oggettivo”. Sulla validità si può solo esprimere una valutazione in base
a criteri semantici: un compito che spetta al singolo ricercatore, al gruppo di ricercatori,
alla comunità dei ricercatori nella disciplina pertinente.
La valutazione terrà conto delle conoscenze sul problema e sulla popolazione studiata,
faccia: di solito si usano termini molto generali anche se gli indicatori sono molto specifici: lo lamentano
McNemar [1946], Coombs [1953], Cook e Selltiz [1964], Lutynski [1978]. Una conseguenza della
tendenza a non farlo la segnalano Cronbach e Meehl: “Se il ricercatore A, per un concetto che chiama
‘aggressività’, sceglie indicatori associati ad aperti attacchi agli altri e il ricercatore B, per un altro
concetto che anch’egli chiama ‘aggressività’, sceglie indicatori associati con l’ostilità repressa”, gli stessi
risultati che corroborano la teoria del ricercatore A falsificano la teoria del ricercatore B, e viceversa
[1955, 291].
27
La necessità di scegliere più di un indicatore per ogni concetto è stata sottolineata anche da Lazarsfeld:
“Ogni indicatore ha un carattere specifico e non può essere esaustivo del significato di un altro concetto”
[1958, 107].
28
Gli archivi di dati si sono diffusi negli ultimi decenni in sociologia e in scienza politica, seguendo
l’esempio degli archivi in cui sin dalla fine dell’Ottocento, in epoca evoluzionista, venivano conservati i
resoconti degli etnologi e altre informazioni etnografiche.
29
Su questo e altri problemi dell’analisi secondaria si veda Hyman [1972].
30
Il modello è lo strumento base dell’analisi dei dati nell’approccio standard. Si veda oltre, par. 92.
31
Contrariamente a quello che sostengono i metodologi di ispirazione comportamentista, che hanno
proposto vari procedimenti per “misurare” la validità (si veda oltre in questo stesso paragrafo).
10
dei risultati di ricerche precedenti, della letteratura scientifica su quel soggetto. Una
volta registrati i dati, il giudizio deve tenere conto anche della forza e della forma della
relazione (non solo dei coefficienti di associazione32) di quella variabile con altre.
In effetti, i metodologi di ispirazione comportamentista tendono a screditare un giudizio
basato su criteri meramente semantici (chiamato content validation, vailidazione di
contenuto, o — sarcasticamente – face validation,validazione a vista odi facciata). Essi
giudicano poco scientifica anche una forma di controllo della validità chè ùsavano gli
psicologi della prima metà del Novecento:
la validazione “per gruppi conosciuti” (known groups).Per vedere se un determinato test
era un indicatore valido, ad esempio, di anomia, lo si applicava ad una popolazione
conosciuta (abitualmente, agli alunni di una classe di psicologia). Il test era giudicato
valido se il gruppo di alunni che il professore giudicava “anomici” otteneva nel test un
punteggio medio significativamente più alto del resto della classe [Thurstone e Chave
1929; Frey 1970].
Tutte le altre forme di controllo della validità si basano su coefficienti di associazione
fra il vettore con i dati sull’indicatore in questione e altri vettori della matrice. Si è visto
nel paragrafo 6.5 che anche l’attendibilità dei dati viene controllata — dalla maggior
parte dei ricercatori, di ispirazione comportamentista e no — attraverso la correlazione
di due o più vettori. Questa analogia ha sollevato un ‘inopportuna confusione tra il
concetto di attendibilità (la corrispondenza tra situazioni reali e i dati nella matrice) e il
concetto di validità (il grado di corrispondenza semantica tra due concetti): alcuni usano
tranquillamente un termine al posto dell’altro mescolando due problemi metodologici
profondamente diversi33. Altri giungono a calcolare relazioni matematiche tra i
coefficienti corrispondenti ed elaborano tecniche per “affrontare simultaneamente
questioni di attendibilità e di validità” [Siegel e Hodge 1968]34.
Si può commentare che, in fondo, essi sono i più coerenti nel trarre conclusioni da un
approccio che riduce tutti i problemi scientifici a relazioni matematiche tra vettori35.
Riduzione che ha una giustificazione ufficiale — la scienza deve essere “oggettiva”
(vedi sopra, cap. 4), e non c’è niente di più “oggettivo” della matematica — e una
nascosta: il desiderio di sottrarsi a compiti minuziosi e noiosi come controllare il
funzionamento degli strumenti sul campo, sporcandosi le mani con situazioni sempre
più complesse dei modelli matematici36, e di evitarsi il compito intellettualmente
impegnativo di riflettere sulle relazioni semantiche che hanno due concetti nella mente
degli individui studiati in un dato ambito spazio-temporale.
Esaminiamo ora le più diffuse tecniche per controllare la validità. Nella validazione
“concomitante” o “simultanea” (concurrent validation) si calcolano coefficienti di
associazione con altri supposti indicatori37 dello stesso concetto [Carmines e Zeller
32
Sui coefficienti di associazione vedi oltre, pan. 9.5. Più avanti in questo paragrafo si vedrà un caso in
cui la forma della relazione era molto più rilevante del meno livello dei coefficienti.
33
Si veda ad es. Gulliksen [1936]; Parry e Crossly [1950]; Schuman [1966]; Davies [1977]; Carmines e
Zeller [1979].
34
Si veda anche Cronbach [1949]; Bohrnstedt [1970]; Allen [1974]. Per Lord e Novick [1968] la
relazione tra validità e attendibilità è semplicissima: la prima è la radice quadrata della seconda. Se lo
dicono loro...
35
Vedi le osservazioni sulla fallacia assertoria al par. 3.6.
36
Sull’infinita, e continuamente cangiante, complessità della realtà ha tenacemente insistito Max Weber
[1904; 1906; 1913]. Sulla sua alta lezione dovrebbero meditare i cultori dei modelli matematici ipersemplificati.
37
Come osservano Frey [1970] e Turner [1979], questo apre il problema di chi ha validato questi supposti
indicatori. In altre parole, la “validazione concomitante”, come tutte le altre forme di validazione
mediante associazione fra variabili nella matrice, non fa altro che rinviare di un passo — nonostante la
11
1979], nella ragionevole aspettativa che due o più indicatori dello stesso concetto siano
positivamente associati tra loro. Però persino una forte associazione positiva non
dimostra nulla di conclusivo38, perché nulla impedisce che l’associazione segnali il fatto
che sono tutti indicatori di un altro concetto. Inoltre, se l’indicatore in questione è
associato con alcuni e non con altri supposti indicatori dello stesso concetto, non
possiamo stabilire quale dei due gruppi è formato da indicatori validi del concetto che ci
interessa.
Più convincente è la validazione predittiva: si controlla se considerando i punteggi su un
indicatore siamo in grado di prevedere correttamente i risultati di una prova successiva
[Scott 1968; Carmines e Zeller 1979]. Ad esempio, il vettore che raccoglie i dati di un
test sull’attitudine a guidare un elicottero, o a dirigere un’orchestra, oppure a ballare
ritmi afro-cubani, si associa con il vettore che raccoglie i risultati della prova finale di
un corso per guidare elicotteri, o per dirigere orchestre, o per ballare quei ritmi. Se
l’associazione è alta il test si giudica valido come indicatore delle attitudini
corrispondenti, e può essere adottato dai direttori dei relativi corsi per selezionare
preventivamente i candidati. Naturalmente questa forma di validazione può essere
adottata solo in situazioni come quelle descritte, cioè quando il concetto da indicare può
avere una definizione operativa diretta sotto forma di risultati della prova finale di un
corso, o simili.
Il più interessante di questi controlli mediante analisi dei dati di una matrice è la
cosiddetta validazione per costrutto (construct validation), nella quale il supposto
indicatore non si associa con indicatori dello stesso concetto, ma con variabili che —
secondo le aspettative teoriche o il senso comune — dovrebbero avere una relazione
empirica forte (positiva o negativa) col concetto da indicare [Cronbach e Meehl 1955].
L’indicatore si giudica valido se le relazioni sono simili a quelle che si aspettavano,
appunto, sulla base del senso comune e/o delle teorie accettate.
Un esempio chiarirà ciò che si intende per validazione per costrutto. Analizzando i
dati di una ricerca del 1971 su 7.000 giovani italiani, condussi un’analisi fattoriale di
un’ampia batteria di scale Likert. La prima dimensione estratta non era facile da
interpretare, e la chiamai “perbenismo” in quanto discriminava tra i giovani che
approvavano frasi che ricordavano le raccomandazioni materne (frequentare buone
compagnie, ascoltare i consigli degli esperti, tenersi sempre nel mezzo, confidare nelle
persone sagge, etc.) e i giovani che rifiutavano quelle frasi. La grande ampiezza del
campione mi permise di calcolare il punteggio medio di ciascuna coorte39 di un anno
sull’indice40 che rappresentava questo fattore, dividendo inoltre ragazzi e ragazze. I
punteggi medi sono presentati nella figura 8.1. La linea orizzontale rappresenta il
punteggio O (nell’analisi fattoriale, zero è il punteggio medio dell’intero campione).
Se la colonna di una coorte è sopra la linea orizzontale, il punteggio medio nell’indice
di quella coorte è più alto del punteggio medio del campione; se la colonna è sotto
questa linea, il punteggio medio della coorte è inferiore alla media del campione. Le
pretesa oggettività della procedura — il ricorso alla tanto disprezzata “validazione per contenuto”: la
variabile X è considerata un indicatore valido del concetto C perché è strettamente associata con la
variabile Y; ma chi ha validato la variabile Y come indicatore di C?
38
Riciclando una celebre formula di Winch e Campbell [1969], si può dire che una forte associazione
positiva fra variabili è evidence, not proof (indizio empirico, non prova) del fatto che siano entrambe
indicatori del concetto che ci interessa.
39
Nelle scienze sociali si chiama “coorte” un gruppo di individui che hanno la stessa età.
40
Non solo gli indicatori, ma anche gli indici — che sono combinazioni di indicatori, e dei quali parlerò
tra breve — sono sottoposti a un giudizio di validità.
12
colonne hanno altezza proporzionale alla differenza tra la media generale e la media di
quella coorte. La validazione per costrutto che emerge nitidamente dalla figura 8.1 sta
nel f~fr6 che l’andamento delle colonne è quello che ci si aspetterebbe se l’indice
registrasse il livello di accettazione delle raccomandazioni della mamma manifestato
da ciascuna coorte di giovani. Si sa infatti che le ragazze si distaccano presto
dall’influenza materna, mentre i ragazzi tardano a rendersi indipendenti. Il grafico
mostra che questo squilibrio si riduce rapidamente, e a 16 anni i ragazzi hanno
raggiunto lo stesso livello di (non) accettazione delle ragazze. In seguito, i livelli di
accettazione continuano ad abbassarsi; ma quello dei ragazzi si abbassa più
rapidamente. La regressione multipla41 dell’indice sulle altre variabili mostrò che ciò
dipende dalla maggiore esposizione che i ragazzi italiani avevano in quegli anni a
influenze esterne alla famiglia, come la scuola (che significa professori, letture e —
più che altro — compagni da imitare)42.
Il livello di accettazione dei ragazzi raggiunge il suo minimo a 18 anni, e dopo
continua a essere molto inferiore alla media generale. Al contrario, il punteggio delle
ragazze, dopo essersi fermato sotto la media a 18-20 anni, sale di nuovo raggiungendo
rapidamente la media del campione, e a 25 anni raggiunge un livello pari a quello che
aveva a 14 anni. Questo andamento si spiega facilmente se si pensa al fatto che le
ragazze italiane del 1971 tendevano a sposarsi molto più presto di quelle di oggi, e
pertanto dai 20 anni in poi cominciavano a porsi di fronte alle frasi che ho ricordato
(frequentare buone compagnie, ascoltare i consigli degli esperti, tenersi sempre nel
mezzo, confidare nelle persone sagge, etc.) non tanto come figlie ma come madri o
future madri.
41
La regressione multipla è uno sviluppo della regressione (di cui parlerò nel par. 9.5.4), e permette di
valutare l’influenza relativa di diverse variabili considerate indipendenti su una considerata dipendente
[vedi Di Franco 1997]. Tutte le tecniche di regressione e correlazione si applicano solo a variabili
cardinali o quasi-cardinali.
42
Fino agli anni ‘70 in Italia le famiglie ritiravano dalla scuola molte ragazze dopo la licenza media, e nei
centri piccoli o marginali molte non potevano uscire di casa fino a 18-20 anni se non erano accompagnate
da genitori o fratelli maggiori.
13
È il caso di sottolineare il fatto che ho potuto ottenere questa convincente vaidazione per
costrutto solo analizzando in dettaglio e separatamente il punteggio di ciascuna coorte, e
confrontando gli andamenti delle coorti femminili e di quelle maschili. Non avrei
raggiunto lo stesso risultato correlando l’indice in questione, globalmente considerato,
con qualunque altra variabile globalmente considerata — come prescrivono di fare le
tecniche standard per controllare la validità. Ne consegue che il giudizio sulla validità di
un indicatore o di un indice, anche quando sia basato sull’analisi delle sue relazioni con
altre variabili di una matrice di dati, spesso deve andare molto più in profondità di
quanto possono fare semplici coefficienti globali di associazione.
8.5. ALCUNI ESEMPI DI SCELTA DI INDICATORI
Alcuni esempi aiuteranno a comprendere meglio la natura degli indicatori e potranno
servire come guida per la scelta di nuovi.
Comincerò con il concetto di status socio-economico, che non suggerisce un’accettabile
definizione operativa diretta: non si può domandare direttamente all’uomo della strada
quale sia il suo status socio-economico perché molti non capirebbero l’espressione, e
altri le darebbero un significato molto diverso da quello che le si dà in sociologia.
Come si diceva sopra, in teoria si dovrebbero cercare indicatori per ogni aspetto
rilevante dell’intensione del concetto di status socio-economico. D’altra parte, questa
prescrizione si scontra con ovvii limiti per il fatto che non è sempre facile trovare
concetti che suggeriscano definizioni operative dirette — gli unici idonei ad essere scelti
come indicatori. Inoltre, più alto è il numero degli indicatori, più difficile è la
costruzione dell’indice che li sintetizza — come vedremo nel paragrafo successivo.
Per questi motivi, gli indicatori di status che qui suggerisco non vanno considerati un
elenco esaustivo, ma un ventaglio di possibilità entro il quale il lettore interessato
potrebbe scegliere secondo le sue inclinazioni.
Aspetti relativi all’istruzione:
• titolo di studio del soggetto;
• titolo di studio del padre del soggetto;
• titolo di studio della madre del soggetto43.
Aspetti relativi all’occupazione:
• occupazione principale del soggetto che lavora (e ultima occupazione del
soggetto senza lavoro o pensionato);
• occupazione principale del capo della famiglia di provenienza.
Aspetti economici:
• reddito annuale medio del soggetto negli ultimi cinque anni;
• reddito annuale medio della famiglia del soggetto negli ultimi cinque anni diviso il
numero di individui conviventi;
• tipo di abitazione principale in cui vive la famiglia.
Beni durevoli posseduti dalla famiglia:
43
Il titolo del padre e della madre si possono combinare in una sola variabile, come vedremo nel
paragrafo successivo.
14
• numero di automobili possedute dalla famiglia diviso il numero di adulti conviventi;
• numero di apparecchi televisivi posseduti dalla famiglia diviso il numero di individui
conviventi;
• prezzo dell’automobile più costosa posseduta dalla famiglia.
Abitudini nel tempo libero:
• spesa mensile media (nell’ultimo anno) della famiglia al ristorante diviso il numero di
individui conviventi;
• spesa annuale (media negli ultimi 3 anni) per vacanze dei membri della famiglia diviso
il numero di individui conviventi.
Il lettore avrà notato che spesso l’indicatore include la divisione per il numero di
individui o di adulti conviventi nella famiglia del soggetto. Solo così l’indicatore riceve
il suo pieno significato: si intende in effetti che il possesso di tre automobili o di tre
televisori cambia di significato se il possessore è solo o se è parte di una famiglia di otto
componenti. Il numero dei componenti tende naturalmente a influenzare i livelli di molti
indicatori quantitativi, ma non ha alcuna relazione con il concetto di status: è un aspetto
estraneo al rapporto di indicazione, e dividendo per il numero di componenti si
neutralizza la sua influenza.
L’operazione di dividere una cifra per una base rilevante al fine di neutralizzare aspetti
di un fenomeno che non interessano si chiama normalizzazione si applica solitamente
non solo per la creazione degli indicatori, ma anche nell’analisi dei dati44.
Passo ora a un concetto operativizzato in molte ricerche che hanno la provincia come
unità d’analisi: il livello di dinamismo economico-demografico.
Per gli aspetti economici in generale si potrebbero scegliere indicatori come:
• la variazione45 del reddito pro-capite;
• la variazione nei depositi bancari pro-capite;
• la variazione nella spesa in opere pubbliche.
Per gli aspetti relativi alle imprese si potrebbero scegliere:
• il saldo demografico delle imprese (totale delle nuove imprese meno il totale delle
imprese chiuse o fallite) diviso il totale delle imprese esistenti nell’intervallo di tempo
considerato;
• la variazione dell’importo annuale degli investimenti pro-capite;
• la variazione del consumo annuale pro-capite di kwh per uso industriale;
• la variazione nella proporzione di suolo occupato da stabilimenti industriali
e commerciali.
Per gli aspetti relativi all’occupazione si potrebbero scegliere:
• la variazione nel tasso di occupati sulla popolazione in età lavorativa;
• la variazione nella quota di occupati provenienti da altre regioni o altri Stati.
Per gli aspetti demografici si potrebbero scegliere:
• il saldo demografico naturale (totale delle nascite meno totale dei decessi
nell’intervallo di tempo considerato) diviso il numero dei residenti nella provincia
all’inizio dell’intervallo;
44
Vedi Marradi [1997b]; Di Franco [1997; 2001].
Tutte le variazioni si intendono da un anno X a un anno Y, entrambi stabiliti dal ricerca¬tore secondo i
suoi interessi.
45
15
• il saldo demografico per trasferimenti (da altre regioni o Stati meno i trasferimenti in
altre regioni o Stati) diviso il numero dei residenti nella provincia all’inizio
dell’intervallo.
Considerando che lo sviluppo economico è favorito dalla diffusione dell’istruzione, si
potrebbe aggiungere la variazione nella quota dei residenti laureati.
Consideriamo infine un concetto che si può trovare nelle ricerche con unità sia
individuali sia territoriali: il livello raggiunto in fatto di parità fra i generi.
Quando l’unità è territoriale (una provincia, uno Stato) un ventaglio di indicatori
potrebbe includere:
• il rapporto tra il tasso di occupazione femminile e il tasso di occupazione maschile;
• il totale delle donne che ricoprono cariche politiche diviso il totale degli uomini che
ricoprono quelle cariche;
• il totale delle autiste di autobus diviso per il totale degli autisti di autobus;
• il totale di bambini minori di 3 anni diviso per il totale di donne di 23-30 anni46
• [solo se l’unità è un comune urbano] la spesa totale (nell’ultimo anno) in cibo già
pronto diviso per la spesa totale (nello stesso periodo) in alimenti non preparati nei
supermercati del comune.
Quando l’unità è individuale il concetto appropriato è il grado di favore verso
l’emancipazione delle donne dai vincoli tradizionali. Un ventaglio di indicatori potrebbe
includere:
• l’atteggiamento verso l’attribuzione di cariche politiche alle donne;
• l’atteggiamento verso l’attribuzione di cariche religiose alle donne;
• l’atteggiamento verso le donne imprenditnici;
• l’àtteggiamento verso l’aborto;
• il giudizio sull’opportunità di aumentare le tasse comunali per costruire asili nido e
case di riposo;
• il giudizio sull’opportunità che le donne lavorino fuori casa di notte;
• il giudizio sull’opportunità che in tempo di crisi i capifamiglia maschi abbiano priorità
nelle assunzioni.
8.6. LA COSTRUZIONE DI INDICI TIPOLOGICI CON VARIABILI
CATEGORIALI E ORDINALI
Si è detto varie volte che l’intensione di un concetto di proprietà ha vari aspetti, e che —
se non è possibile definire operativamente quel concetto in forma diretta — occorre
trovare indicatori per gli aspetti più importanti; altrimenti si finisce per raccogliere
informazioni su un concetto molto diverso da quello che abbiamo in mente.
Naturalmente, le informazioni raccolte devono essere poi sintetizzate per ricostruire in
qualche modo l’unità del concetto che interessa.
L’operazione con la quale si realizza questa sintesi si chiama costruzione di un i n d i e
e. Come si è anticipato, è il passo più difficile dell’intera ricerca sociale che segue un
approccio standard.
Il criterio di costruzione degli indici si può stabilire in astratto, nel momento in cui si
disegna la ricerca; ma prende corpo quando i dati sugli indicatori sono stati raccolti e
46
Questo è un indicatore inverso, nel senso che più alto è il numero dei minori di 5 anni, minore è il
distacco delle donne dal tradizionale ruolo di madre.
16
codificati nella matrice. Il procedimento che si segue è totalmente diverso a seconda che
si trattino le variabili come cardinali o meno47, al punto che è opportuno presentarlo in
paragrafi differenti.
Se non consideriamo cardinali le variabili che formeranno l’indice, si attribuisce
autonomia semantica alle loro categorie. Ne consegue che lo strumento per realizzare la
sintesi è la tabella di contingenza48, nella quale le categorie di una variabile sono
riportate nelle righe e le categorie dell’altra sono riportate nelle colonne, e in ogni cella
c’è un tipo, cioè la combinazione di una categoria della variabile nelle righe con la
categoria della variabile nelle colonne (vedi sopra, pan. 3.2). Di conseguenza questi
indici sono detti tipologici.
Comincio con un esempio semplice, in cui le due variabili considerate sono ordinali
(il che ci aiuterà ad attuare la sintesi) e hanno poche categorie (il che ridurrà la
complessità del problema). Immaginiamo che la proprietà che ci interessa sia il
capitale culturale [nel senso di Bourdieu 1979; 1994] che ha ricevuto ogni individuo
durante la sua formazione, e che due degli indicatori scelti siano – un po’
semplicisticamente — il titolo di studio del padre e il titolo di studio della madre,
ognuno rilevato con quattro categorie: elementare/medio/medio-superiore/superiore49.
La tabella 8.1 presenta i sedici tipi risultanti dalla combinazione di ciascun titolo del
padre con ciascun titolo della madre. Questi tipi potrebbero essere le sedici modalità
della nuova variabile. Il problema è che questa variabile dovrà essere combinata con
altri indicatori di capitale culturale, e che pertanto ci sarà bisogno di una sequenza di
tabelle. Sedici categorie sulle righe o sulle colonne di una tabella sono decisamente
troppe50 per questo motivo è opportuno ridurre il numero dei tipi nella tipologia. Se i
contributi del padre e della madre al capitale culturale di un individuo si considerano
equivalenti, un modo ovvio per ridurre questa tipologia è stato esposto proprio nella
47
Ci sono anche casi misti, nei quali alcune variabili sono cardinali o quasi-cardinali e altre no. Un
esempio si presenterà nel paragrafo successivo.
48
Sulla tabella di contingenza vedi più estesamente il pan. 9.5.1. Naturalmente ci sono indici formati da
più di due variabili categoriali. Ma anche in questi casi, poiché una tabella a tre variabili non è facile da
concepire né da rappresentare, m pratica si procede con una successione di tabelle a due variabili,
costruendo indici parziali (se ne vedrà un esempio più avanti).
49
Si usano categorie generali, senza fare riferimento all’ordinamento didattico di un paese particolare.
L’adeguamento di queste categorie generali alla stratificazione dei titoli in ogni paese è un tipico
problema di definizione operativa.
50
Sedici righe o sedici colonne in una tabella sono troppe perché, combinandosi con le categorie di
un’altra variabile, producono un numero eccessivo di celle (il numero delle celle di una tabella è infatti il
prodotto del numero delle righe per il numero delle colonne). In generale, sulla riduzione delle tipologie
vedi il par. 3.2.
17
tabella 8.1:
• il codice 1 sulla nuova variabile si attribuisce a tutti quelli che hanno entrambi i
genitori con il titolo elementare
• il codice 2 si attribuisce a tutti quelli che hanno almeno un genitore con il titolo
medio;
• il codice 3 si attribuisce a tutti quelli che hanno almeno un genitore con il titolo
medio-superiore;
• il codice 4 si attribuisce a tutti quelli che hanno almeno un genitore con il titolo
superiore;
• il codice 3 si attribuisce a tutti quelli che hanno entrambi i genitori con il titolo
superiore.
Si ottiene così una nuova variabile ordinale, che sintetizza i due indicatori. Si possono
naturalmente concepire altre forme per realizzare questa sintesi, ad esempio attribuendo
un peso maggiore al titolo del padre (codici nella tab. 8.2, parte sinistra) o a quello della
madre (codici nella tab. 8.2, parte destra).
Prima di mostrare come si combina una variabile così costruita con un altro indicatore,
proseguendo nella costruzione dell’indice di capitale culturale, è opportuno sottolineare
il fatto che la relazione tra il titolo del padre e quello della madre si può considerare
anche un indicatore del livello di tensione o conflitto potenziale nella famiglia di
provenienza del soggetto, a sua volta una possibile causa (non un indicatore) del suo
livello di (in)sicurezza. L’ipotesi è che quanto maggiore è il dislivello culturale tra i
genitori, tanto maggiore sarà probabilmente la tensione o il conflitto potenziale tra i due.
In questo caso, i codici da assegnare ai tipi nelle celle potrebbero essere (tab. 8.3):
• 0 nella diagonale, in cui il titolo è identico per entrambi i genitori (basso rischio
di conflitto);
• 1 nelle celle intorno alla diagonale, in cui c’è solo un grado di differenza tra il
titolo dell’uno e dell’altro genitore (rischio medio-basso di conflitto);
• 2 nelle celle in cui ci sono due gradi di differenza nel titolo (rischio medio-alto
di conflitto);
• 3 nelle celle all’estrema destra in alto e all’estrema sinistra in basso nella tabella,
in cui la differenza tra i titoli è la massima possibile (alto rischio di conflitto).
18
Vediamo ora come si può procedere nella costruzione dell’indice usando la variabile
formata dai titoli dei genitori combinata con un altro indicatore del capitale culturale, ad
esempio il tipo di letture preferite dal soggetto durante
la sua adolescenza e la sua giovinezza. Immaginiamo che le diverse risposte a queste
domande siano raggruppate in quattro livelli:
In questo caso la riduzione della tipologia è un compito delicato e impegnativo, anche
perché le categorie in entrambe le variabili includono situazioni piuttosto differenti, che
ogni ricercatore (e ogni lettore) può interpretare a suo modo. In generale, i criteri che
guidano la scelta dei tipi da aggregare (e in conseguenza le categorie della variabile
risultante, che può essere l’indice finale o uno stadio intermedio nella sua costruzione)
sono gli stessi che guidano la riduzione del numero delle classi in una classificazione
(vedi sopra, par. 7.1): il primo criterio è la massima vicinanza semantica tra i tipi che si
aggregano (che implica la massima distanza semantica tra le categorie risultanti).
Naturalmente, il punto di riferimento per valutare vicinanza e distanza semantica sarà il
concetto generale che si vuole operativizzare — in questo caso il capitale culturale. Il
criterio che si è già definito ausiliare è l’opportunità di evitare eccessivi squilibri tra le
frequenze delle categorie risultanti, per non pregiudicare la successiva fase di analisi dei
dati.
Come sempre, occorre bilanciare il criterio semantico con quello numerico. È ovvio che
questo bilanciamento si può operare meglio quando teniamo sott’occhio la tabella, cioè
quando i dati sono già stati registrati. Per questo motivo si consiglia di progettare gli
indici in generale e in astratto prima di raccogliere i dati, ma di aspettare che i dati siano
registrati prima di entrare nei dettagli della loro costruzione. Sfortunatamente, al
19
momento non ho a disposizione dati sul tema, e quindi non posso applicare questa
massima nell’esempio di riduzione che segue (tab. 8.3). Tuttavia, la proposta tiene conto
di una considerazione derivante da esperienze di ricerca: molti intervistati, per dare la
migliore immagine di sé nel rispondere a una domanda sulla lettura preferita, tendono a
indicare il genere di lettura che percepiscono come culturalmente più apprezzato tra
quelli che vengono loro in mente al momento.
I tipi che emergono dalla riduzione sono quindi i seguenti:
capitale culturale
coerentemente basso (codice 1)
capitale culturale discendente
(codice 2)
soggetti i cui genitori non arrivano al titolo mediosuperiore, e che preferiscono leggere fumetti, cronaca
rosa, nera, sportiva o mondana, romanzi di avventure
e di viaggi
soggetti che non hanno indicato saggi o classici
rispondendo alla domanda, ma hanno entrambi i
genitori col titolo superiore
soggetti che non hanno indicato classici o romanzi di
buon livello rispondendo alla domanda, ma hanno
uno dei genitori con istruzione superiore
capitale culturale
coerentemente medio
(codice 3)
soggetti che preferiscono leggere fumetti, cronaca
rosa, nera, sportiva o mondana, ma hanno uno dei
genitori con titolo medio-superiore
soggetti che non hanno indicato saggi o classici
rispondendo alla domanda, ma hanno uno dei
genitori con istruzione superiore
soggetti che preferiscono leggere fantascienza,
romanzi gialli, di avventura e di viaggio, best sellers
o romanzi di buon livello, e hanno uno dei genitori
con titolo medio-superiore
soggetti che preferiscono leggere romanzi di buon
livello, best sellers e fantascienza, e hanno uno dei
genitori con istruzione media
20
capitale culturale ascendente
(codice 4)
capitale culturale
coerentemente alto
(codice 5)
soggetti che indicano saggi e classici come lettura
preferita, ma non hanno nemmeno un genitore con
istruzione superiore
soggetti che indicano saggi,classici,racconti di buon
livello, bestsellers,fantascienza, ma hanno entrambi i
genitori con la sola istruzione elementare
soggetti che indicano saggi o classici come lettura
preferita e hanno uno o entrambi i genitori con
istruzione superiore
Fino a questo punto si sono combinati solo tre indicatori e già l’esempio può dare
un’idea della quantità e complessità dei problemi semantici e delle conseguenti
decisioni che sono implicate nella costruzione di un indice con indicatori le cui
definizioni operative producono variabili categoniali o ordinali. Ogni volta che si
vogliono combinare uno o più indicatori, la complessità semantica aumenta in modo
quasi esponenziale, le decisioni necessarie per ridurre la tipologia sono sempre più
problematiche e il controllo intellettuale sull’intera operazione e sui suoi risultati
diminuisce.
Per questo motivo, ogni volta che si possono immaginare definizioni operative che
creano variabili cardinali o quasi-cardinali, i ricercatori esperti lo preferiscono. Ma
questo non legittima affatto la pratica di trattare come cardinali variabili che non sono
neppure ordinali — come spesso si vede fare51.
8.7. LA COSTRUZIONE DI INDICI SOMMATORI CON VARIABILI
CARDINALI E QUASI-CARDINALI
Per due motivi costruire indici con variabili cardinali o quasi-cardinali è più semplice
che costruirli con variabili categoriali o ordinali. Il primo è ovvio, e consiste nella
possibilità di compiere con piena legittimità52 operazioni matematiche sui codici
numerici che rappresentano gli stati in queste variabili. Il secondo motivo — la ridotta o
nulla autonomia semantica delle categorie (vedi sopra, pan. 7.3) — non è tanto ovvio, e
per questo non viene frequentemente menzionato nei testi di metodologia. Tuttavia non
ha minore importanza, perché è quello che permette di passare da un trattamento con
tabelle, dove il fuoco dell’attenzione deve concentrarsi su ogni cella, a un trattamento
con diagrammi, dove l’attenzione può concentrarsi sull’andamento globale della
relazione.
Come vedremo nel capitolo 9, questa considerazione vale non solo per la costruzione
degli indici, ma anche per l’analisi delle relazioni tra le variabili. Dal punto di vista
tecnico, i procedimenti sono gli stessi; quello che cambia radicalmente èl’obiettivo del
trattamento. In un caso, stiamo costruendo variabili di maggiore generalità e portata
teorica; nell’altro, le variabili sono state costruite, e stiamo esplorando un segmento
della fitta rete di relazioni tra loro.
51
Un esempio clamoroso è stato riportato in una nota del par. 7.1.
A rigore, la legittimità è piena solo in caso di variabili cardinali. Come sottolineavo nel par. 7.5, le
variabili quasi-cardinali presentano differenze non trascurabili con le variabili cardinali; per questo
trattarle come cardinali non sarebbe pienamente legittimo, e lo si fa per approfittare dei grandi vantaggi
impliciti in questo tipo di trattamento. Con variabili ordinali, la distorsione può essere tanto grande che
molti non considerano legittimo trattarle con tecniche cardinali. Con variabili categoriali questo
trattamento è un vero nonsenso, giacché i codici numerici delle categorie sono completamente arbitrari.
52
21
Peraltro, le operazioni matematiche necessarie per costruire indici sono molto più
semplici di quelle che si usano nell’analisi statistica vera e propria. A volte sono
semplici somme di punteggi: il punteggio di ciascun caso (individuo, aggregato
territoriale o altro) sull’indice è uguale alla somma dei suoi punteggi sugli indicatori.
Naturalmente questo livello di semplicità si può raggiungere solo se sono soddisfatte
quattro condizioni: una fattuale, una numerica e due semantiche.
1. La condizione fattuale è che non manchino dati su uno o più indicatori: se ne
mancano, il punteggio finale di ciascun caso nell’indice deve essere la media e
non la somma dei suoi punteggi validi. Se si sommasse, i punteggi finali di tutti i
casi che hanno dati mancanti sarebbero indebitamente minori di quello che
dovrebbero essere (qualunque cosa ciò significhi a livello della proprietà: un
soggetto potrebbe risultare meno intelligente, o meno autoritario, o meno
conservatore, o meno progressista di quanto sia in realtà). Naturalmente, spetta
al ricercatore decidere quanti dati mancanti si possono accettare: se l’indice è
formato da cinque indicatori e per il soggetto X mancano informazioni su tre di
essi, sarebbe opportuno non assegnargli alcun punteggio sull’indice.
2. La condizione numerica è che tutte le variabili che si sommano abbiano la stessa
estensione di scala, o almeno un’estensione simile. Questa condizione vale per
gli indici formati sia con variabili metriche (risultato di una misurazione), sia
con variabili cardinali naturali (risultato di un conteggio), sia con variabili quasicardinali (risultato di alcune tecniche di scaling).
Vediamo un esempio per ogni tipo. Immaginiamo che la federazione di atletica di una
nazione povera abbia fondi per mandare alle Olimpiadi solo un lanciatore. Per
scegliere quale sarà si decide di sommare per ogni candidato i risultati che ottiene nei
quattro tipi di lancio (disco, giavellotto, martello e peso) e mandare quello che ottiene
la somma più alta. Però in questo modo si danneggiano i lanciatori di peso, il cui
margine sui non specialisti può aggirarsi intorno ai cinque metri, mentre i lanciatori
delle altre specialità possono avere margini di trenta metri e più rispetto ai non
specialisti. La soluzione corretta sarebbe standardizzare i punteggi, o almeno
normalizzare53 ogni risultato dividendolo per il record nazionale o per il record
mondiale nella rispettiva specialità.
Immaginiamo ora che si voglia costruire un indice di possesso di beni mobili
durevoli, e per ogni soggetto si sommino il numero di automobili, il numero di
televisori, di frigoriferi, etc., fino al numero di apparecchi radio e di cellulari. È chiaro
che un cellulare non ha lo stesso valore di un’automobile: prima di sommare questi
beni si dovrebbe ponderare ciascuno per il suo costo specifico, o almeno per il costo
medio di quel tipo di bene.
Per ultimo, immaginiamo di costruire un indice di progressismo. Poiché il progressismo è un concetto complesso e non si può rilevare direttamente, occorre trovare
indicatori e operativizzarli attraverso le tecniche illustrate nel paragrafo 7.3.
Supponiamo di usare i punteggi assegnati da ogni soggetto a leaders o simboli
progressisti con il “termometro”, la sua auto-collocazione sulla scala destra-sinistra e
le risposte scelte reagendo a frasi di orientamento progressista in una batteria di scale
Likert. Per costruire l’indice non si potranno sommare direttamente questi punteggi54,
dato che i punteggi sui termometri vanno da 0 a 100, sulla scala destra-sinistra vanno
da O a 10, e sulle scale Likert vanno da 0 (o 1) a 4 (o 3): prima di sommare si
53
La standardizzazione (vedi sopra, par. 7.3. è una delle tante forme di normalizzazione.
Ma c’è chi lo ha fatto — ad es. il politologo americano Smith [1969] — senza rendersi conto che in
questo modo stava considerando ogni termometro 20 volte più importante di ciascuna scala Likert.
54
22
dovranno quindi standardizzare i punteggi, o almeno normalizzarli dividendo
ciascuno per il massimo punteggio previsto dalla scala relativa.
3a. Alcuni esempi ora presentati servono anche per illustrare la prima condizione
semantica. Immaginiamo che la federazione di atletica voglia inviare alle Olimpiadi
anche un decatleta. È risaputo che le prove del decatlon includono tre lanci, tre salti e
quattro corse. In questo caso, non ci si può limitare a normalizzare i punteggi prima di
sommarli. Questo perché nei salti e nei lanci più alta è la cifra, maggiore è il merito; per
le corse, vale ovviamente il contrario. Perciò, si deve invertire la direzione dei punteggi
relativi alle corse — e questo è esattamente ciò che fa la federazione mondiale di
atletica nella sua tabella dei punteggi per il decatlon.
Lo stesso problema semantico si presenta con l’indice di progressismo: solo dopo avere
invertito la direzione dei punteggi si possono includere nell’indice anche i punteggi di
favore assegnati col termometro a leaders e simboli conservatori, e le risposte alle frasi
conservatrici in una batteria di scale Likert.
3b. La seconda condizione semantica della quale si parlava è più complessa. Finora si
sono presentate operazioni (standardizzazione, normalizzazione, inversione della
direzione semantica) che avevano l’obiettivo di rendere effettivamente equivalenti gli
indicatori prima di combinarli in un indice, nell’eventualità che il ricercatore li consideri
tutti ugualmente validi55 Ma può succedere che un ricercatore consideri alcuni indicatori
più validi di altri, per motivi legati alla sua diretta conoscenza del problema e/o
dell’ambito esaminato, alle sue esperienze precedenti, alla letteratura sul tema. Se ha
buoni motivi per credere questo, deve tenerne conto nella formazione dell’indice, senza
timore di non essere “oggettivo”. Oltre al fatto che una scelta di indicatori non può in
alcun modo essere “oggettiva”, si deve aggiungere che considerare ugualmente validi
tutti gli indicatori è un assunto indimostrabile esattamente come supporre il contrario.
Per ponderare il contributo di ogni indicatore alla somma che stabilisce per ciascun caso
il punteggio sull’indice, il ricercatore ha due vie. Può farsi guidare dalle sue valutazioni
semantiche, moltiplicando i punteggi degli indicatori che considera più validi per un
coefficiente maggiore di 1 (può essere 1,2 o 1,3 o altro simile) e gli indicatori che
considera meno validi per un coefficiente minore di 1 (può essere 0,7 o 0,8 o altro
simile). Oppure può sfruttare le possibilità che gli offre la matrice dei dati, sottoponendo
l’insieme delle variabili che operativizzano i possibili indicatori del concetto che
interessa a un’analisi delle componenti principali56. Questa tecnica ha tre funzioni, alle
quali corrispondono tre fasi nel procedimento:
1. scegliere nel paniere iniziale dei possibili indicatori quelli che risultano avere una
stretta relazione empirica con gli altri, e che quindi si può supporre abbiano un
apprezzabile rapporto semantico con il concetto che interessa;
2. stimare la forza di questo rapporto semantico (cioè la validità) tra il concetto e
ciascuno degli indicatori scelti;
3. basandosi su questa stima, stabilire un coefficiente per ponderare i punteggi di
ciascun indicatore tenendo conto delle possibili sovrapposizioni semantiche, cioè del
fatto che due o più indicatori possono rappresentare aspetti molto vicini
dell’intensione del concetto.
55
Sul concetto di validità vedi sopra, par. 8.4.
L’analisi in componenti principali è preferibile alla più antica e più diffusa analisi fattoriale perché non
impone manipolazioni arbitrarie della matrice dei dati prima di sottoporla al trattamento con l’algebra
matriciale [vedi Di Franco e Marradi 2003]. Una rassegna di altre classiche tecniche per ponderare gli
indicatori basandosi sulle loro relazioni con altre variabili della matrice sta in Edgerton e Kolbe [1936].
56
23
In questo caso, l’indice finale non è altro che la somma dei punteggi di ogni
individuo sugli indicatori scelti nella fase 1; ma prima di sommarli, i punteggi sono
moltiplicati per il corrispondente coefficiente calcolato nella fase 3. Si tratta quindi
di un particolare indice sommatorio, in cui la somma è ponderata.
24