udf: metodologia e statistica - Laboratorio di ricerca sociale

Transcript

udf: metodologia e statistica - Laboratorio di ricerca sociale
Corso di Laurea triennale in SCIENZE SOCIALI
(Classe 36)
UDF: METODOLOGIA E STATISTICA
Metodologia e tecnica della ricerca sociale
Prof. Massimo Ampola
SEMINARIO
Dott. Marco Chiuppesi
24 aprile 2007
La ricerca sociale (3)
6. Tecniche delle scale
Scale di Bogardus
Scale Likert
Tecniche delle scale
Una “scala” è un insieme di elementi che si considerano indicatori di un concetto generale1.
Abbiamo già visto, nella seconda lezione del seminario, cosa sia un indicatore. La tecnica delle
scale è impiegata soprattutto per la rilevazione degli atteggiamenti, anche se in effetti i suoi
impieghi non sono necessariamente limitati a questo campo.
Semplificando una questione complessa, possiamo considerare gli atteggiamenti come stati mentali,
quindi “interni”, dei singoli soggetti. Chiaramente, questi stati sono inaccessibili all’osservatore; per
venire a conoscenza dell’altrui atteggiamento è necessario adoperare un qualche stratagemma.
L’osservazione dei comportamenti può essere uno strumento per conoscere determinati
atteggiamenti che si suppongono connessi con i comportamenti stessi. In questo senso, si considera
il comportamento come un indicatore dell’atteggiamento.
Una via più diretta di conoscere l’atteggiamento di una certa persona può essere domandarne
l’opinione su qualche tematica, supponendo un rapporto di indicazione tra l’opinione espressa e
l’atteggiamento più generale.
Ad esempio, la frequenza di partecipazione alle funzioni religiose viene comunemente considerata
indicatore di una dimensione della religiosità2. Potremmo quindi osservare, per una data persona, se
partecipa (o meno) e con che frequenza alle funzioni religiose, e ricavarne indicazioni sul suo grado
di ritualità religiosa; oppure, visto che è quanto meno arduo protrarre un’osservazione abbastanza a
lungo per ricavare effettivamente delle indicazioni attendibili in tal senso, potremmo direttamente
domandare alla persona in questione: “Partecipi alle funzioni religiose? Con che frequenza?”
Alcuni elementi preliminari sugli elementi che compongono le scale: solitamente si tratta di
domande a cui il soggetto deve rispondere, o affermazioni rispetto alle quali deve esprimere un
giudizio. È chiara l’impostazione del tipo stimolo-risposta. È importante considerare la possibile
natura delle risposte disponibili: sono possibili domande con risposte ad autonomia semantica,
quando cioè le possibili risposte sono intelligibili anche indipendentemente le une dalle altre. Ad
esempio, alla domanda “per quale partito ha votato alle ultime elezioni?”, ciascuna delle possibili
riposte (i nomi dei vari partiti, voto nullo, non risponde) ha un chiaro senso autonomamente dalle
altre.
Sono possibili domande con risposte a parziale autonomia semantica quando invece ciascuna delle
possibili risposte è comprensibile solo nel contesto dell’intera gamma delle risposte disponibili. È
questo il caso delle domande del tipo “Dica se è d’accordo o meno con la seguente affermazione: lo
stato non fa abbastanza per combattere la criminalità organizzata.” Con risposte possibili:
completamente d’accordo, d’accordo, non so, in disaccordo, completamente in disaccordo. In
questo caso parliamo di parziale autonomia semantica perché la singola risposta (ad esempio
“d’accordo”), anche se dotata di senso, può essere collocata con difficoltà se non si ha visione
dell’intera serie delle risposte disponibili.
Infine si parla di scale auto-ancoranti laddove al soggetto vengono forniti solo gli estremi di un
campo continuo nel contesto del quale gli è chiesto di posizionare la sua risposta. Ad esempio, se
alla domanda precedente fosse stato chiesto al soggetto di posizionare il suo assenso su un
termometro graduato da 0 a 100, con 0 il massimo dissenso e 100 il massimo assenso.
Dei tre tipi di risposta che abbiamo visto, solo quelle fornite alle scale auto-ancoranti sono
considerabili quasi-cardinali (concetto che avete incontrato nella terza lezione del seminario), e
quindi soggette a tecniche statistiche anche complesse. Le risposte alle domande con autonomia
semantica completa o parziale sono rispettivamente considerabili variabili nominali ed ordinali,
essendo assenti informazioni sulla distanza tra categorie, con le conseguenti limitazioni sul tipo di
operazioni effettuabili sui dati ottenuti con strumenti di questo tipo.
1
2
P. Corbetta, Metodologia e tecnica della ricerca sociale, Bologna, Il Mulino, 1999, p. 237.
P. Corbetta, Metodologia e tecnica della ricerca sociale, cit., pp. 114, 237.
2
Vediamo ora alcuni tipi di scale comunemente utilizzati nel contesto della ricerca sociale.
Scala di Bogardus
Detta anche scala di distanza sociale, si tratta di una tecnica sviluppata dal sociologo statunitense
Emory S. Bogardus per misurare la distanza espressa dai soggetti rispetto a determinate categorie di
persone. Introdotta in un articolo del 19253, venne in seguito utilizzata nella sua opera del 1928
sugli atteggiamenti degli statunitensi in merito alle questioni razziali4. Questo tipo di strumento
rientra nella più ampia categoria delle scale cumulative, anche se è stato elaborato prima della
formalizzazione – più generale – degli scalogrammi di Guttman5, che affronteremo in seguito.
La scala di Bogardus, nella sua forma originale, consiste in una serie di sette elementi rappresentati
da domande con le quali l’intervistato deve dichiararsi in accordo o in disaccordo. Le domande sono
ordinate in una sequenza secondo uno schema del tipo6:
In merito ad una persona del gruppo X, dica con quali delle seguenti affermazioni si trova
d’accordo:
-
Accetterei di sposarla
La accetterei come amico regolare
La accetterei come collega di lavoro
La accetterei come vicino di casa
La accetterei come conoscente
Accetterei che vivesse al di fuori del mio vicinato
Accetterei che vivesse al di fuori del mio paese
L’intervistato deve marcare con un segno le affermazioni con le quali concorda, in una tabella sulla
quale i gruppi sociali X (neri, asiatici, etc.) sono presentati in colonne successive, e le affermazioni
sono elencate nelle righe.
Come abbiamo detto questa scala è cumulativa, nel senso che una persona che risponde
positivamente ad una data domanda ha tipicamente risposto positivamente anche alle successive (o
alle precedenti, secondo l’ordine di presentazione). Attribuendo un punteggio di 1 a ciascuna
risposta positiva, è così possibile partendo dal punteggio cumulato sapere a quali domande
l’intervistato ha risposto positivamente: ad esempio, un punteggio di 4 corrisponde a quello di una
persona disposta ad accettare membri del gruppo X come visitatori nel suo paese, come cittadini,
colleghi o vicini, ma non come amici o coniugi di un parente. Vedremo ancora questa caratteristica
parlando delle scale di Guttman.
La somma dei punteggi di un rispondente corrisponde al suo “quoziente”, che varia da 1 (massima
distanza sociale) a 7 (minima distanza sociale).
La scala di Bogardus intende quindi misurare un atteggiamento di distanza (o vicinanza) sociale
attraverso la registrazione dell’espressione di un’opinione. Chiaramente, e questo è un punto da
tenere presente rispetto a tutte le tecniche di rilevamento dell’opinione, è sempre presente il rischio
che il rispondente tenti di dare un’immagine di sé adeguata a canoni di rispettabilità sociale,
laddove pensi che la sua opinione possa metterlo in cattiva luce agli occhi del rilevatore, dando
delle risposte che pensa vengano considerate “accettabili” anziché rispondere sinceramente. Questo
rischio, detto di acquiescence set, (tendenza all’acquiescenza) è particolarmente forte nel caso di
3
E. S. Bogardus, Measuring Social Distances, in “Journal of Applied Sociology” n.9, 1925, pp. 299-308.
E. S. Bogardus, Immigration and Race Attitudes, Boston, D.C. Heath,1928.
5
Vedi P. Corbetta, Metodologia e tecnica della ricerca sociale, cit., p. 256.
6
Mia traduzione libera della formulazione in E.S. Bogardus, A Forty Year Racial Distance Study, Los Angeles,
University of Southern California, 1967.
4
3
strumenti il cui obiettivo è così scopertamente diretto e orientato a opinioni su temi socialmente
delicati, come per l’appunto la scala di Bogardus nei suoi tipici utilizzi.
Per contro, la semplicità di predisposizione e utilizzo di questo tipo di scala la rende ancora oggi
ampiamente utilizzata nelle ricerche sociali aventi ad oggetto il pregiudizio. Naturalmente, la scala
di Bogardus è stata volta per volta modificata dai vari ricercatori che l’hanno impiegata (lo stesso
Bogardus ne utilizzò diverse versioni): il tenore delle domande viene modificato per renderle
comprensibili o adeguate al campione di riferimento e all’oggetto della ricerca, la somministrazione
può essere effettuata in interviste orali anziché con un questionario scritto…
Breve digressione storica: nell’elaborare questo strumento Bogardus lavorò assieme a Robert Park,
che era stato a sua volta allievo di Georg Simmel. Simmel intendeva la distanza sociale in un senso
tanto spaziale quanto metaforico; in questo senso la scala di Bogardus è stata interpretata come una
applicazione di concetti simmeliani mediata dal funzionalismo della scuola di Chicago7.
Un esempio recente di utilizzo: nella ricerca Identità politica e immagine dell’immigrazione
straniera8, Maria Letizia Zanier ha indagato l’atteggiamento di elettori e militanti bolognesi di
Alleanza Nazionale e dei Democratici di Sinistra nei confronti degli immigrati. In questa ricerca gli
elementi usati per misurare il punteggio di distanza sociale sono stati introdotti in forma
disaggregata, ossia mescolati in un ordine sparso ad altre domande nell’ambito di un questionario
più generale. Dato che nel contesto del questionario, se questo è sufficientemente vario, il tema
specifico della scala di Bogardus viene in parte occultato, questo può essere un buon sistema per
limitare il rischio di acquiescence set.
Scala di Likert
Rensis Likert introdusse questo strumento nel 19329, denominandolo Method of summated ratings
(metodo dei punteggi sommati).
Una scala Likert si compone tipicamente di una serie di affermazioni rispetto alle quali l’intervistato
deve dichiararsi in accordo o in disaccordo, potendo scegliere una posizione tra una serie di
alternative scalari. Nella prima formulazione di Likert le alternative tra cui scegliere erano sette10:
1.
2.
3.
4.
5.
6.
7.
molto d’accordo
d’accordo
parzialmente d’accordo
incerto
parzialmente contrario
contrario
fortemente contrario
Nella maggior parte degli utilizzi attuali della scala di Likert si impiegano però cinque alternative:
1.
2.
3.
4.
molto d’accordo
d’accordo
indifferente
contrario
7
Vedi a proposito P. J. Ethington, The Intellectual Construction of “Social Distance”: Toward a Recovery of Georg
Simmel’s Social Geometry, in “Cybergeo”, n. 30, 1997.
8
M. L. Zanier, Identità politica e immagine dell’immigrazione straniera: una ricerca tra gli elettori e i militanti di An e
Ds a Bologna, in “Quaderni del Dipartimento di Sociologia e Ricerca Sociale”, Trento, 2002.
9
R. Likert, A Technique for the Measurement of Attitudes, in “Archives of Psychology”, n. 140, 1932.
10
P. Corbetta, Metodologia e tecnica della ricerca sociale, cit., p. 247.
4
5. molto contrario
In alcuni casi si impiegano quattro risposte, non utilizzando quella centrale. Ovviamente non è
indifferente che si diano al rispondente un numero pari o dispari di alternative: con un numero pari
di risposte l’assenza di un elemento centrale forza una polarizzazione delle risposte.
Assunzione implicita nell’impiego di domande con un numero pari di risposte è che non si dia
luogo ad una distorsione sistematica, in quanto si suppone che gli indecisi vengano a distribuirsi
casualmente tra le due risposte “più centrali” rimaste11.
A ciascuna risposta possibile viene attribuito un punteggio: ad esempio, considerando la scala a
cinque risposte, 1 punto per molto d’accordo, 2 per d’accordo, e così via fino a 5 per molto
contrario. Talvolta i punteggi si fanno partire da 0 anziché da 1.
Noto nuovamente che i punteggi numerici di un singolo elemento di una scala Likert corrispondono
in realtà ad una scala ordinale di misurazione e non ad una cardinale, trattandosi di risposte a
parziale autonomia semantica, e quindi applicare ad essi alcune operazioni matematiche è
formalmente scorretto.
Immaginiamo un soggetto cui venga presentata una batteria di tre affermazioni, con cinque risposte
possibili,e che si dichiari molto contrario rispetto a tutte quante le affermazioni: avrà totalizzato un
punteggio di 15. Un soggetto che risultasse invece indifferente a due affermazioni e contrario a una,
avrà 10 punti. Un soggetto che fosse molto contrario ad una affermazione, indifferente alla seconda
e d’accordo con la terza avrà anch’esso 10 punti. Questo sistema di attribuzione dello score
caratterizza la scala Likert come additiva: il punteggio finale è la somma dei punteggi dei singoli
elementi. Quindi è impossibilità risalire alle risposte di un individuo partendo dal suo punteggio
(mancata riproducibilità della scala), e un dato punteggio può essere generato da risposte tra loro
differenti.
Considerando il punteggio cumulato dei diversi elementi che costituiscono una scala Likert, non
siamo più necessariamente in presenza di un livello ordinale di misurazione: data l’assunzione
implicita dell’esistenza di una variabile latente, possiamo considerarci in presenza di un livello
quasi-cardinale di misurazione, e questo amplia la gamma di strumenti statistici a nostra
disposizione per l’analisi dei dati risultanti.
Corbetta identifica quattro fasi nella costruzione di una scala Likert12, rivediamole rapidamente per
poi soffermarci su ciascuna di esse, evidenziandone le problematiche connesse (riferendoci anche
ad altri testi e trattazioni):
-
formulazione delle domande
somministrazione delle domande
selezione delle domande e determinazione del grado di coerenza interna della scala (item
analysis, analisi degli elementi)
controllo di validità e unidimensionalità della scala.
Nella fase di formulazione delle domande il ricercatore (o il gruppo di ricercatori!), che avrà
preliminarmente stabilito il concetto, l’atteggiamento oggetto di indagine, ne identifica le
dimensioni rilevanti e sulla base di queste redige materialmente le domande che andranno a
comporre il questionario.
Ad esempio Richard H. Hall13 ha operativizzato il concetto di burocrazia sulla base di una disamina
critica della letteratura sociologica in materia, a partire da Weber, giungendo a identificare un certo
11
L. Perrone, Metodi quantitativi della ricerca sociale, Milano, Feltrinelli, 1977, p. 382.
P. Corbetta, Metodologia e tecnica della ricerca sociale, cit., ivi.
13
R. H. Hall, The Concept of Bureaucracy: an Empirical Assessment, in “The American Journal of Sociology”, vol. 69,
n.1, 1963, pp. 32-40.
12
5
numero di dimensioni del concetto (che Hall, conformemente a Weber, intendeva in senso
idealtipico): gerarchia d’autorità, divisione del lavoro, sistemi formalizzati di regole, competenza
tecnica…
Per ciascuna delle dimensioni identificate il sociologo ha predisposto una serie di affermazioni;
così, un elemento della scala relativo alla dimensione dei sistemi formalizzati di regole è
l’affermazione
“il tempo dedicato alle pause caffé è regolato rigorosamente”.
Un elemento della medesima scala relativo alla dimensione della competenza tecnica è
l’affermazione
“Gli impiegati vengono periodicamente valutati per vedere quanto bene stanno lavorando”.
Le scale usate in questa ricerca vennero sottoposte a personale impiegato in una serie di aziende
statunitensi, con lo scopo di misurare la burocratizzazione di queste imprese (potremmo osservare
che si stava misurando la percezione della loro burocratizzazione da parte dei dipendenti, che al
limite può essere cosa diversa).
È in questa fase che bisogna predisporre i necessari accorgimenti volti ad evitare i cosiddetti
response set, ossia la tendenza di alcuni rispondenti a fornire delle risposte che corrispondono a
schemi indipendenti dal contenuto delle domande.
Un espediente per individuare questo fenomeno è invertire la polarità di alcune domande, o
suddividere le affermazioni in modo che metà presentino una polarità e metà quella opposta. Per
polarità di una affermazione si intende il suo rapporto semantico con l’opinione oggetto di studio:
ad esempio, se si sta indagando in merito all’eutanasia, un elemento di una ipotetica scala potrebbe
essere l’affermazione:
-
È crudele prolungare le intense sofferenze di qualcuno che soffre per una malattia mortale e
desidera morire.
Un’altra affermazione della medesima scala, con la polarità invertita, potrebbe essere invece:
-
Secondo me, chiunque aiuti a morire una persona sofferente per una malattia terminale è un
assassino14.
Le due affermazioni hanno polarità invertita: ci si aspetta che chi si dichiari in accordo con la prima
sia tendenzialmente in disaccordo con la seconda, e viceversa. Una risposta identica (ad es. “molto
d’accordo”) ad entrambe potrebbe derivare da un response set, e il protocollo della ricerca potrebbe
prevedere l’esclusione per inaffidabilità dei questionari che presentassero diffusamente questo tipo
di situazione.
Marradi fornisce altre utili indicazioni per ridurre, attraverso una accorta formulazione delle
domande, altri possibili problemi delle scale Likert; suggerimenti in effetti applicabili anche ad altri
metodi di indagine dell’opinione15:
-
-
Usare frasi dalla struttura semplice, con affermazioni riferite ad un singolo soggetto,
evitando il più possibile periodi subordinati: in caso di doppie affermazioni, o in presenza di
affermazioni riferite a due soggetti, si metterà in difficoltà il rispondente che nutre
atteggiamenti diversificati, e comunque non se ne registrerà in modo corretto l’opinione.
Usare frasi dal significato semplice, usando il più possibile un linguaggio comune, privo di
ambiguità lessicali. Marradi ha sottolineato un problema particolarmente forte nelle frasi che
14
Affermazioni usate nella Euthanasia Attitude Scale, in H.D. Holloway, B. Hayslip e altri, Measuring attitudes
towards euthanasia, in Omega, 30(1), 1995, pp. 53-65.
15
Una analisi del fenomeno in A. Marradi, Costruire il dato 3: le scale Likert, Milano, Franco Angeli, 2002, pp.15-52.
6
esprimono una affermazione negativa nei confronti del proprio oggetto: diversi rispondenti,
reagendo all’oggetto verso cui nutrono un sentimento negativo, si dichiarano in disaccordo
con la frase anche se in realtà la loro opinione è di accordo. Consideriamo ad esempio la
frase seguente, che esprime una opinione negativa nei confronti dei politici:
“I politici sono interessati solo al voto degli elettori, non ai loro bisogni”16.
Interpretando correttamente la frase, dovrebbe dichiararsi “abbastanza d’accordo” e
“pienamente d’accordo” (secondo le etichette usate nella ricerca da cui sono tratte) chi
ritenga essere i politici degli opportunisti sfruttatori. Dovrebbe dichiararsi invece “piuttosto
in disaccordo” o “del tutto in disaccordo” chi, non concordando con la frase, pensi che i
politici abbiano in qualche misura a cuore i bisogni degli elettori. Invece, si è dato il caso di
rispondenti che si siano dichiarati in disaccordo con la frase, commentando poi il proprio
disaccordo nei confronti dei politici opportunisti, in base al quale avrebbero dovuto però
dichiararsi in accordo con la frase! In sintesi, si tratta di una reattività all’oggetto della frase
e non al suo significato. Per minimizzare questo fenomeno il suggerimento di Marradi è di
impiegare il più possibile affermazioni che abbiano un chiaro riferimento positivo al proprio
oggetto, in modo che anche chi risponda animato da una reattività all’oggetto fornisca la
stessa risposta che avrebbe fornito reagendo al significato della frase.
In linea di massima sono da evitare anche formulazioni del tipo “alcuni dicono che”, “molti
pensano che”, le quali pure talvolta si trovano negli esempi17 di elementi delle scale Likert
portati nei manuali: ad esempio, esponendo la necessità di invertire la polarità degli stimoli,
Bruschi presenta le seguenti due affermazioni collegate ad una ipotetica misurazione
dell’anticlericalismo:
“Alcuni dicono che la chiesa non dovrebbe possedere alcun bene terreno”.
“Secondo alcuni, i cittadini dovrebbero seguire i suggerimenti dei sacerdoti rispetto ai loro
comportamenti politici”.
Considerando le due frasi esposte, un rispondente potrebbe legittimamente trovarsi in
confusione: mettiamo che egli pensa sia giusto e sacrosanto che la chiesa possieda beni
terreni. Sarebbe così portato a indicarsi, correttamente dal punto di vista di chi ha preparato
l’affermazione, “molto in disaccordo”. Tuttavia la frase, letta in modo completo, sostiene
che “alcuni dicono che…”: e anche se il rispondente crede che la chiesa debba avere beni
materiali, può considerare vero che ci sia qualcuno che sostiene l’assunto contrario, e
dichiararsi così in accordo con la frase: è d’accordo sul fatto che ci sia qualcuno che sostiene
che la chiesa non dovrebbe possedere beni terreni. Se le due affermazioni fossero state
formulate rispettivamente come:
“la chiesa non dovrebbe possedere alcun bene terreno”
E
“i cittadini dovrebbero seguire i suggerimenti dei sacerdoti rispetto ai loro comportamenti
politici”
Si sarebbe eliminata anche questa possibilità di fraintendimento sul senso della risposta da
dare.
-
Evitare frasi che possano comportare una forte connotazione emotiva per gli
intervistati, in quanto potrebbero causare disattenzione o inattendibilità nelle risposte
successive.
Usare livelli di approfondimento calibrati sugli interessi del gruppo specifico che si sta
indagando, per evitare il doppio rischio di apparire male informati su temi vicini ai
rispondenti o metterli in difficoltà su temi lontani dai loro interessi.
16
Tratta da un questionario somministrato nel 1983-1985 da S. Cacciola a personale in cassintegrazione della
Montedison di Siracusa, e discusso in Marradi, Costruire il dato 3: le scale Likert, cit.
17
In A. Bruschi, Metodologia della ricerca sociale, Roma, Laterza, 2005, p. 77.
7
Le ultime due raccomandazioni di Marradi sono riferibili in particolare a ricerche orientate su
gruppi sociali specifici, vista la loro difficoltà di applicazione a campioni casuali di popolazioni
stratificate e complesse.
Un altro fenomeno che può essere indotto o rafforzato da particolari formulazioni delle
affermazioni in una scala Likert è quello della cosiddetta curvilinearità.
Un presupposto implicito nell’utilizzo della scala Likert è che rispetto a ciascun elemento della
scala, rispetto quindi a ciascuna affermazione sottoposta agli intervistati, i soggetti in accordo con
l’atteggiamento studiato si collocheranno ad un estremo della scala, mentre i soggetti in disaccordo
si collocheranno all’altro estremo. Dunque dovremmo avere che chi è in accordo con
l’atteggiamento si dichiarerà “molto d’accordo” e chi è in disaccordo “fortemente in disaccordo” (o
viceversa, a seconda della polarità dell’affermazione).
Invece c’è il rischio che utilizzando come elementi delle affermazioni che si collochino in una
posizione intermedia rispetto all’ideale continuum di opinioni possibili sull’argomento oggetto di
indagine, si possa fare convergere sull’approvazione o sulla disapprovazione di una singola
affermazione persone che hanno un atteggiamento diametralmente opposto sull’argomento.
In questo caso parliamo di curvilinearità perché il continuum delle posizioni anziché essere
rappresentabile come un segmento che va da chi ha una posizione a chi ha l’opposta, si piega su se
stesso come una U sdraiata congiungendo idealmente persone con atteggiamenti opposti che danno
la medesima risposta.
Esempio tradizionale18 di affermazione usata in una scala Likert e che può indurre curvilinearità
nelle risposte:
“Il voto è il solo modo in cui la gente come me può avere qualche influenza sulle decisioni
politiche”.
Ad una affermazione così formulata, una persona disillusa dal sistema politico, convinta
dell’inutilità della propria partecipazione alle consultazioni elettorali, e quindi con una attitudine
negativa in merito al proprio “senso di efficacia politica” si dichiarerà presumibilmente “fortemente
in disaccordo”: neanche col voto ritiene di poter avere qualche influenza.
Ma anche una persona fortemente attiva ed impegnata in ambito politico, che prende parte a
manifestazioni, organizza fiaccolate, partecipa a banchetti per la raccolta di firme per portare avanti
leggi di iniziativa popolare etc. etc. – e quindi, con una attitudine positiva in merito al proprio
“senso di efficacia politica”, si dichiarerà presumibilmente in forte disaccordo: per questa persona ci
sono molti altri modi oltre al voto per influenzare le decisioni politiche!
Con una accorta formulazione delle affermazioni si può anche limitare il rischio di curvilinearità, in
questo caso il suggerimento è quello di utilizzare affermazioni di tipo “estremo” che discriminino
chiaramente i rispondenti rispetto alla loro collocazione sul supposto continuum di posizioni.
La fase di somministrazione delle domande è quella in cui queste vengono materialmente poste al
campione di intervistati, e le loro risposte registrate. Ovviamente – come per qualsiasi questionario la somministrazione può avvenire nelle maniere più disparate: intervista diretta, telefonica, postale,
compilazione su sito web, via posta elettronica…
Corbetta osserva a proposito di questa fase che la somministrazione delle domande di una scala
Likert “richiede un elevato livello di istruzione degli intervistati”, il che si ricollega alle
osservazioni di Marradi appena viste. Certo sarebbe bene rendersi conto prima di giungere a questo
punto (e il pre-test aiuta!) se stiamo usando uno strumento inadeguato al campione, ma è sensato
ritenere che il problema possa anche emergere successivamente. A questo punto, c’è un altro rischio
da evidenziare: se a somministrare il questionario è un ricercatore sensibile alle problematiche
18
Impiegata nella scala sul “senso di efficacia politica”, la curvilinearità è stata rilevata da R. J. Mokken in A theory and
procedure of scale analysis. The Hague, Mouton, 1971; citato in Marradi, Costruire il dato 3: le scale Likert, cit. e in
Marradi, Concetti e metodo per la ricerca sociale, Firenze, La Giuntina, 1984, p.62.
8
metodologiche e attento alla scientificità del procedimento, i segni di una incomprensione da parte
dei rispondenti nei confronti del meccanismo della batteria di domande risulteranno evidenti, e ne
verranno tratte le necessarie conseguenze. Una somministrazione che assuma i connotati di un
procedimento di routine, da portare avanti meccanicamente, come è il caso possa venire considerato
ad esempio da rilevatori non specificatamente formati e non realmente interessati alla scientificità
del procedimento, può portare - nel caso questi abbiano di fronte soggetti disorientati dallo specifico
strumento di indagine – a insidiosi response set indotti dalle precisazioni o spiegazioni, anche non
sollecitate, del rilevatore.
Inoltre, la somministrazione di un questionario può essere vissuta come un momento dalla valenza
istituzionale, o commerciale (a seconda del contesto e del contenuto) e condurre a un disinteresse da
parte di alcuni rispondenti o gruppi di rispondenti. Nella fase di somministrazione delle domande ci
si può rendere conto anche dell’insorgere di questo tipo di fenomeno.
La fase di analisi delle domande segue la rilevazione sul campione. Questo è il momento in cui,
raccolte le risposte, bisogna valutare sulla base di un qualche criterio se le domande che sono state
utilizzate sono effettivamente tutte collegate tra di loro ed al concetto di partenza.
Se la scala è stata composta correttamente, dobbiamo assumere che un soggetto che abbia riportato
un elevato punteggio debba tendenzialmente avere punteggi elevati su tutti i singoli elementi della
scala. Questo perché il punteggio totale si suppone collegato al concetto latente che stiamo
indagando, e gli elementi della scala si suppongono collegati alle diverse dimensioni di questo
concetto. Se viene riscontrato che un elemento della scala presenta sistematicamente punteggi bassi
per soggetti che hanno punteggi globali elevati, è segno che quel singolo elemento va eliminato in
quanto presumibilmente mal formulato e comunque non correlato al concetto di partenza.
Questo tipo di verifica, cioè quella della correlazione elemento-scala, si può effettuare calcolando
per ogni rispondente il coefficiente di correlazione tra il punteggio da lui ottenuto su un certo
elemento e il punteggio derivante da somma o media degli elementi restanti della scala.
Il coefficiente di correlazione r si calcola con
∑ ( X i − X )(Yi − Y )
r=
∑ ( X i − X ) 2 ∑ (Yi − Y ) 2
Un altro requisito della scala da tenere presente è la sua coerenza interna complessiva, ossia la
presenza di una fonte comune di varianza tra i vari elementi della scala.
Viene solitamente calcolata attraverso l’alfa di Cronbach19:
nr
α=
1 + r (n − 1)
Con n che indica il numero di elementi della scala e r che indica la correlazione media degli
elementi. Come evidente dalla formula, α aumenta sia all’aumentare di n sia all’aumentare di r .
Se eliminiamo un elemento che sulla base del controllo di correlazione elemento-scala non ci
appare legato a tutti gli altri, da una parte abbiamo aumentato la correlazione media tra gli elementi,
tendenzialmente aumentando l’ α . Ma d’altra parte eliminando un elemento abbiamo diminuito n,
tendenzialmente diminuendo l’ α . Nel decidere se eliminare o meno un elemento dalla scala
bisogna valutare se si ottiene un effetto complessivamente positivo o negativo rispetto all α della
scala medesima.
Terminata la fase di analisi delle domande, si passa alla fase di controllo di validità e
unidimensionalità della scala.
19
P. Corbetta, Metodologia e tecnica della ricerca sociale, cit., p. 247.
9
Per validità si intende la capacità della scala di misurare proprio il concetto che noi intendiamo
misurare, e non qualcos’altro. Ci sono pareri contrari alla effettiva possibilità di misurare la validità:
Marradi sostiene che “non è possibile misurare la ‘parte indicante’, cioè l’estensione della
corrispondenza semantica tra due concetti. […] Ciò che è possibile misurare è il grado di
corrispondenza tra due registrazioni, che può essere, a seconda dei casi, un indizio più o meno
convincente – ma non certo una misura – di attendibilità e/o validità”20.
La cosiddetta validità di contenuto, l’effettiva copertura del concetto di partenza da parte delle
dimensioni identificate, essendo accertabile esclusivamente per via logica dovrebbe essere stata
affrontata dal ricercatore in via preliminare in fase di formulazione delle domande.
Invece la validità per criterio (criterion-related validation) comporta il confronto tra l’indicatore
operativizzato nella scala con altri indicatori. Nel caso di validità predittiva l’indicatore viene
correlato con eventi successivi che si suppongono connessi all’indicatore stesso; per esempio, il test
di gradimento di un determinato prodotto può essere correlato con l’effettiva penetrazione sul
mercato del prodotto stesso ottenendo così una misura della validità predittiva del test stesso.
Nel caso di validità concomitante, o concorrente, l’indicatore viene correlato con un altro indicatore
(già ritenuto valido per altra via) simultaneamente rilevato.
La validità per gruppi noti si ottiene somministrando il test a soggetti dei quali si conosce già la
posizione rispetto al concetto generale.
Attraverso metodi di questo tipo si può ottenere una indicazione della validità di una scala; la
somministrazione in pre-test e l’utilizzo, con modalità confrontabili, in diverse ricerche possono
aumentare la nostra fiducia nella validità dello strumento.
L’unidimensionalità della scala è una indicazione del fatto che i vari elementi siano correlati ad
una sola variabile latente, e non ad esempio a due variabili tra loro correlate (quest’ultimo caso non
sarebbe rilevabile con le verifiche di correlazione elemento-scala e di coerenza interna complessiva
dello strumento). Per avere una indicazione dell’effettiva unidimensionalità della scala si ricorre in
genere all’analisi fattoriale21, tecnica statistica che applicata alle scale consente di identificare la
correlazione tra i vari elementi e uno o più “fattori” ideali.
Queste quattro fasi possono condurre alla conclusione del test o fare parte di una fase di pre-test alla
quale seguirà un nuovo iter di somministrazione – analisi – controllo.
20
A. Marradi, Concetti e metodo per la ricerca sociale, cit., p. 37.
P. Corbetta, Metodologia e tecnica della ricerca sociale, cit., p. 253; A. Marradi, Concetti e metodo per la ricerca
sociale, cit., p. 73.
21
10