Questionario e dintorni

Transcript

Questionario e dintorni
Claudio Bezzi - Mauro Palumbo
Questionario e dintorni
Indice
PREMESSA
1 FARE RICERCA SOCIALE
1.1 STRATEGIE E TIPI DI RICERCA
1.2 QUESTIONARIO E STRATEGIE DI RICERCA
1.3 IL DISEGNO DELLA RICERCA
1.4 LE FASI DELLA RICERCA
1.4.1 L’impostazione della ricerca
1.4.2 La rilevazione dei dati
1.4.3 L’elaborazione dei dati
1.4.4 I risultati della ricerca
1.5 LA RICERCA PRIMA DELLA RICERCA
1.5.1 La ricerca di sfondo e lo studio pilota
1.5.2 Il pre-test
1.5.3 Lo studio di fattibilità
1.6 IL MANAGEMENT DELLA RICERCA
1.6.1 Il concetto di management della ricerca
1.6.2 Definizione degli obiettivi e verifica delle risorse
1.6.3 Gestione della ricerca
1.6.4 Promozione del lavoro
1.7 PROBLEMI COMUNI A TUTTI I TIPI DI INCHIESTA
1.7.1 Problemi etici
1.7.2 L’‘effetto ricercatore’
1.7.3 La profezia che si autoadempie
2 CONCETTI, VARIABILI, MISURAZIONE
2.1 CONCETTI E DEFINIZIONI OPERATIVE
2.2 DAI CONCETTI ALLE VARIABILI: L’OPERATIVIZZAZIONE
2.3 LA MISURAZIONE
2.4 INDICATORI E INDICI
3 IL CAMPIONAMENTO
3.1 UNIVERSO E CAMPIONE
3.2 LA RAPPRESENTATIVITÀ
3.3 ELEMENTI DI TEORIA DEL CAMPIONAMENTO
3.4 TIPI DI CAMPIONAMENTO
1
4 COSTRUIRE UN QUESTIONARIO
4.1 IL QUESTIONARIO COME CONTENITORE DI ‘OGGETTI’
4.2 LE DOMANDE: CONCETTI GENERALI
4.3 LE SCALE ED I TERMOMETRI
4.4 GLI STIMOLI NON DIRETTIVI
4.5 CRITERI PER DECIDERE L’INSERIMENTO DI ITEM
4.5.1 La rilevanza
4.5.2 La previsione dell’elaborazione
4.5.3 La previa concettualizzazione
4.6 L’EDITING DEL QUESTIONARIO
4.6.1 Problemi grafici
4.6.2 La presentazione ed il frontespizio
4.6.3 Le istruzioni per l’intervistato
4.6.4 Le istruzioni per l’intervistatore
4.6.5 Lessico e problemi espressivi
5 COSTRUZIONE ED USO DELLE DOMANDE
5.1 LE DOMANDE SECONDO IL GRADO DI DIRETTIVITÀ
5.1.1 Le domande chiuse
5.1.2 Le domande aperte
5.2 LE DOMANDE SECONDO LA LORO FUNZIONE
5.2.1 Le domande introduttive
5.2.2 Le domande filtro e le domande condizionate
5.2.3 Le domande sonda ed i probe
5.2.4 Le domande ad imbuto
5.2.5 Le domande di controllo
5.2.6 Le domande di verifica
5.2.7 Le domande rivolte agli intervistatori
5.3 L’ORDINE DELLE DOMANDE
5.4 PARTICOLARI MODALITÀ DI RISPOSTA
5.4.1 Uso di ‘Altro’
5.4.2 Uso di ‘Non so’
5.4.3 Uso di gadget
5.5 PRINCIPALI DIFETTI DELLE DOMANDE
5.5.1 Fedeltà, validità ed attendibilità
5.5.2 Le domande false o viziate
5.5.3 L’approccio alle questioni delicate
5.5.4 Effetto proxy
5.5.5 ‘Desiderabilità sociale’ nelle risposte
5.5.6 Le doppie domande
5.5.7 Domande astratte o di grande generalità
5.5.8 Domande relative al passato
5.5.9 L’errore dell’esperto
6
GESTIRE LA RILEVAZIONE DEI DATI
6.1 IL RUOLO DEGLI INTERVISTATORI
2
6.1.1 Scelta, formazione e motivazione degli intervistatori
6.1.2 Distorsioni provocate dagli intervistatori
6.2 LA GESTIONE DELL’INTERVISTA
6.2.1 Il rifiuto all’intervista
6.2.2 La lettera di presentazione ed il ‘passi’
6.2.3 Il contatto iniziale
6.2.4 La gestione del colloquio
6.3 LA REGISTRAZIONE DEI DATI
6.3.1 La trascrizione delle risposte
6.3.2 Uso del registratore
6.3.3 La presenza del testimone
6.4 IL CONTROLLO DEL LAVORO DEGLI INTERVISTATORI
6.5 IL QUESTIONARIO AUTOAMMINISTRATO
6.5.1 Concetti generali
6.5.2 Il questionario postale
6.5.3 Casi in cui è utile usare un questionario autoamministrato
7 PREPARARE I DATI
7.1 LA CODIFICA
7.1.1 Principi generali
7.1.2 Libro codice
7.1.3 La pulizia dei dati
7.2 LA CODIFICA A POSTERIORI
7.3 STIMOLI NON CODIFICABILI ENTRO IL QUESTIONARIO
8 L’ELABORAZIONE E L’ANALISI DEI DATI
8.1 INTRODUZIONE
8.2 L’ANALISI MONOVARIATA
8.3 L’ANALISI BIVARIATA E MULTIVARIATA
BIBLIOGRAFIA DEI TESTI CITATI
3
PREMESSA
Questo volume nasce da una duplice esperienza: da un lato quella
didattica realizzata principalmente (ma non esclusivamente) in
ambito universitario; dall’altro quella professionale che ci ha fatto
incontrare numerosissime situazioni di ricerca realizzate non sempre in modo ottimale e non solo da ‘addetti ai lavori’. In entrambi i
casi, sia pure con modalità e motivazioni diverse, la richiesta di
fondo posta dai nostri interlocutori è stata: ‘capire per fare’; lo studente, certamente più orientato ad una comprensione generale che
inquadri la ricerca sociale nell’alveo delle discipline di pertinenza,
è in generale comunque desideroso di impadronirsi di strumenti
che gli consentano di tracciare una rotta di sicurezza nel labirinto
della ricerca sociale; il professionista, ancor più, solitamente incerto di fronte ai numerosi problemi che una ricerca, semmai creduta
inizialmente ‘semplice’, comporta, ha spesso bisogno di un orientamento step by step che lo aiuti a risolvere problemi piccoli e
grandi. La necessità di coniugare un orizzonte teorico ed epistemologico chiaro e rigoroso con un impianto espositivo volto al ‘fare
come’ sono alla base di questo libro.
Nelle nostre intenzioni un libro da leggere, per costruirsi le mappe
cognitive generali della ricerca sociale ed in particolare di quella
che utilizza come strumento principale il questionario; e un libro
da consultare, da tenere sul tavolo mentre si realizza la ricerca, una
sorta di vademecum, di linee-guida per la realizzazione, passo dopo passo, di una ricerca sociale col questionario.
Nella stesura di questo volume ci siamo basati largamente
sull’esperienza scientifica, didattica e professionale maturata in
situazioni diverse e già in parte illustrata in altri lavori; in particolare, il cap. 2 riprende in parte quanto già scritto in Palumbo 1991;
il §. 1.6 quanto già esposto in Bezzi 1992; il §. 6.2 ripercorre Bezzi
- Tirabassi 1990. L’occasione di questo testo ci ha permesso di inserire quelle riflessioni in un contesto più ampio e articolato.
Gli autori si sono confrontati a lungo prima e durante la redazione
del volume, che costituisce quindi il frutto di un lavoro comune; in
ogni caso le varie parti vanno così attribuite:
Claudio Bezzi ha scritto i §§. 1.5, 1.6, 1.7 ed i capp. 4, 5, 6, 7.
Mauro Palumbo ha scritto i §§. 1.1, 1.2, 1.3, 1.4 ed i capp. 2, 3, 8
Claudio Bezzi - Mauro Palumbo
4
1 FARE
RICERCA SOCIALE
1.1 STRATEGIE E TIPI DI RICERCA
La ricerca sociale è un processo scientifico attraverso il quale si
interroga la realtà al fine di ottenere una conferma o una smentita
alle proprie ipotesi iniziali. Ciò che la caratterizza è dunque il metodo scientifico, ossia l’adozione di un procedimento caratterizzato
dalla ripetibilità, controllabilità e pubblicità del processo di ricerca
(cfr. Statera 1984; Cipolla 1988). Si tratta di un’impostazione che
si può far risalire, quantomeno, agli scritti metodologici di Weber
e che viene fatta propria dalla manualistica più autorevole.
Va peraltro aggiunto che il giudizio sulla correttezza del metodo e
della sua applicazione riposa, in ultima istanza, sull’utilizzo di tecniche, strumenti e procedure considerati appropriati dalla comunità
scientifica di appartenenza, caratterizzata in ogni fase storica di
sviluppo di una disciplina da un particolare ‘stile di pensiero’ (vedi
Fleck 1983) o da una particolare concezione di ‘scienza normale’
(Kuhn 1978).
Non è invece determinante il tipo di interrogativi che muovono la
ricerca, che possono essere di natura sia teorica che pratica. Come
ha osservato Dahrendorf (1985, 21), teoria e azione condividono la
stessa esperienza comune: “noi viviamo in un mondo di incertezza.
Non siamo in grado di dire esattamente se quello che sappiamo è
vero, né se quello che vogliamo è giusto”.
La tipologia di ricerca forse più nota distingue tra ricerche descrittive e ricerce esplicative, riconducibili l’una al ‘contesto della scoperta’, l’altra al ‘contesto della giustificazione’: secondo questa
tipologia, nel contesto della scoperta il ricercatore, osservando la
realtà sociale, ossia chiedendosi “che cosa sta accadendo?” (Bailey
1985, 53), induce delle ipotesi di tipo causale a favore delle quali
si propone di ottenere prove empiriche attraverso ricerche esplicative (ossia muovendosi nel cosiddetto contesto della giustificazione - cfr. Phillips 1972, 110 e segg.). In altra sede (Palumbo 1991) è
stata ampiamente criticata questa impostazione neo positivistica,
secondo la quale la realtà esiste a prescindere dalle categorie osservative del ricercatore e dagli strumenti di costruzione del dato
utilizzati. Inoltre l’approccio causale, già messo in discussione in
sede epistemologica, si rivela difficilmente utilizzabile nelle scienze sociali. Da ultimo, nella pratica della ricerca è assai difficile individuare ricerche descrittive che non siano mosse già da qualche
ipotesi generale, quantomeno relativa a criteri di rilevanza secondo
5
i quali ci si concentra su determinate proprietà in luogo di altre;
corrispondentemente, molte ricerche esplicative sono corredate da
parti descrittive indispensabili per definire correttamente la portata
delle spiegazioni avanzate.
Ai nostri fini preme comunque rilevare che questa tipologia continua a mantenere la ricerca sociale all’interno del processo di costruzione-validazione delle ipotesi, prescindendo dall’impiego pratico della ricerca stessa. Di contro, è esperienza corrente che uno
scopo pratico caratterizza buona parte delle ricerche condotte dai
sociologi (non a caso, molto spesso, su commessa).
Per questa ragione è forse più opportuna l’ulteriore distinzione tra
ricerche descrittive e valutative, che applicano quelle conoscenze
cui le ricerche esplicative hanno accordato un conforto empirico, a
differenza delle ricerche teoriche o sperimentali, che mirano a valutare “il contributo di un numero di fattori alla causazione del fenomeno” (Hyman 1967, 128). È del resto proprio su questo terreno, dell’effettiva utilizzabilità delle teorie sociologiche a scopi descrittivo-interpretativi o progettuali-valutativi, che viene da molti
lamentata la carenza di covering laws che permettano alle scienze
sociali di raggiungere le capacità previsive proprie di altre discipline (cfr. Amendola 1989).
Tutto questo proprio in una fase in cui la ricerca valutativa sta acquisendo un’importanza crescente, in relazione anche all’interesse
sempre più accentuato sulla valutazione dell’efficienza ed efficacia
dell’azione pubblica, al mutamento nelle tecniche di programmazione e pianificazione, al progresso delle discipline che di queste si
occupano, alla diffusione di analisi di valutazione d’impatto ambientale o sociale (cfr. Bertin 1989; Siza 1994; Bezzi - Scettri
1994; Bertin 1995). Queste ricerche si differenziano non solo dalle
esplicative, ma anche dalle descrittive, in quanto presuppongono
l’incorporazione nel disegno della ricerca degli obiettivi del decisore. In questo senso, pur rimanendo tributaria della ricerca di base
per quel che concerne le ipotesi causali relative ai fenomeni studiati, la ricerca valutativa si configura come
una forma specifica della ricerca applicata, il cui scopo principale
non è tanto la scoperta di nuove conoscenze, quanto piuttosto una verifica dell’applicazione di conoscenze (Boileau 1987, 1.770, corsivo
nel testo)
Una distinzione di carattere più propriamente metodologico, frequentemente proposta, corre tra le ricerche quantitative e le ricerche qualitative; si tratta di una distinzione che secondo taluni dif-
6
ferenzia addirittura due metodi (Boudon 1970, 33) o due diversi
modi di fare sociologia, riconducibili l’uno all’approccio nomotetico, l’altro a quello idiografico (Schwartz - Jacobs 1987). Si tratta
di una questione assai dibattuta, anche perché risente, come ha osservato Bryman, della
tendenza a trattare questioni tecniche e questioni filosofico - metodologiche alla stessa stregua, e occasionalmente a confonderle
(1984, 75)
stabilendo un improprio e fuorviante nesso sinallagmatico fra l’impiego di una determinata tecnica e l’adozione della posizione epistemologica cui tale tecnica fa riferimento.
Già nel 1963 Vittorio Capecchi aveva acutamente osservato, in riferimento all’opposizione fra ‘quantitativo e qualitativo’, che
quello che sostanzialmente si sta confondendo è il livello di quantificazione della variabile con il livello di quantificazione del tipo di
analisi relativo (1963, 173, corsivo nel testo)
Infatti, anche una tecnica qualitativa come l’osservazione può dare
origine a dati trattabili matematicamente, mentre qualunque variabile quantitativa può essere analizzata in termini qualitativi. Secondo Capecchi, quindi, l’unica distinzione rilevante corre fra tipi
di analisi, la cui scelta può essere agevolata o meno dal tipo di
tecniche di rilevazione utilizzate e dal tipo di variabili costruite.
Una precisazione su questo punto è possibile a partire dalla tipologia proposta da Alberto Marradi in diverse occasioni (le citazioni
si riferiscono al Convegno del 2/3 dicembre 1993 a Parma su
“Qualità e Quantità”).
Occorre in primo luogo distinguere, secondo Marradi, tra due famiglie di strategie di ricerca: quelle basate sull’esperimento e quelle non sperimentali. Le prime, come avverte ogni manuale di metodologia, sono ben poco diffuse nelle scienze sociali, dove occupano una posizione sostanzialmente marginale, per una ragione
fondamentale: presupposto dell’esperimento è quello di poter deliberatamente manipolare le variabili indipendenti in modo da misurare l’effetto di tali manipolazioni sulle variabili dipendenti. Al di
là delle ulteriori difficoltà connesse all’uso di modelli causali in
sociologia, è chiaro che motivi pratici o etici impediscono di variare in modo controllato caratteristiche quali l’origine familiare, il
sesso, l’età, il tipo di occupazione, e molte altre variabili indipen-
7
denti relative alle relazioni sociali fondamentali in cui un individuo
è inserito.
Ciò premesso, le caratteristiche distintive delle strategie sperimentali illustrate da Marradi evidenziano ulteriormente lo scarso rilievo che queste possono avere in sociologia. Con l’esperimento ci si
prefigge infatti di “controllare asserti impersonali attorno alle relazioni causali fra proprietà” (Marradi 1993). A tal fine occorre formulare alcuni assunti di base:
• sul versante delle proprietà, che si possa distinguere tra una
proprietà sperimentale o dipendente;
• una o poche indipendenti (quelle che si faranno variare
nell’esperimento per valutarne l’impatto sulla dipendente);
• infinite altre irrilevanti o, se rilevanti, controllabili perché mantenute costanti durante l’esperimento stesso.
Inoltre, perché siano trasferibili i risultati dell’esperimento, occorre
anche ipotizzare che le differenze tra oggetti dello stesso tipo siano
irrilevanti; un problema, peraltro, che non riguarda solo l’estendibilità dei risultati sperimentali, ma qualunque estensione all’universo di un’indagine campionaria (si vedano su questo punto le
critiche di Marradi 1988b al concetto di rappresentatività del campione). Che tali assunti non possano quasi mai sussistere in ambito
sociale è abbastanza ovvio.
Più importante ai nostri fini la distinzione tracciata da Marradi
all’interno delle strategie non sperimentali fra matriciali e non matriciali. Nelle prime, “che permettono di formulare e controllare
asserti impersonali attorno alle relazioni di associazione fra proprietà”, ci si prefigge l’obiettivo di rilevare dati (relativi agli stati
su più proprietà di un certo numero di casi) che verranno inseriti in
una matrice dei dati, utilizzata per l’analisi dei dati stessi. Gli assunti ritenuti necessari da Marradi sono, in fase di raccolta, la
completezza (la matrice deve presentare stati su tutte le proprietà
che la costituiscono; non possono esistere caselle vuote); in fase di
analisi, che ogni caso sia scindibile perfettamente nei suoi stati sulle proprietà e che ogni stato sia indipendente dagli altri stati del
suo detentore.
È bene spendere a questo punto qualche parola sulla matrice dei
dati, sulla quale ci imbatteremo spesso. In buona sostanza, la matrice dei dati (detta anche matrice ‘CxV’, ovvero ‘casi per variabili’) è costituita da una sequenza di colonne ciascuna delle quali è
dedicata ad una variabile e da una serie di righe quanti sono i casi
rilevati. La prima riga contiene i ‘nomi’ delle variabili, la prima
colonna i numeri progressivi (o i ‘nomi’) dei casi, come
nell’esempio che segue.
8
TAV. 1 - ESEMPIO DI MATRICE DEI DATI
Variabile 1
Variabile 2
...
Variabile k
Caso 1
*
Caso 2
**
...
Caso n
* Modalità o valore del caso 1 sulla variabile 1. Ad es., caso 1 = Palumbo;
variabile 1 = sesso; modalità o valore = maschio.
** Modalità assunta dal caso 2 sulla variabile 2. Ad es., caso 2 = Bezzi;
variabile 2 = età; modalità o valore = 43 anni.
Sulla base degli assunti esposti da Marradi, è possibile considerare
ogni singolo caso una sorta di ‘portatore sano di variabili’, e concentrare l’attenzione sulle relazioni tra variabili senza interessarsi
dei profili dei casi. In altre parole, di una matrice tipo, che porta in
colonna le variabili e in riga i casi, si dà una lettura ‘per colonne’,
con analisi mono o multi variate (si guarda cioè a come è distribuita una proprietà fra i diversi casi o a come sono distribuite tra questi più proprietà). Lo scopo della matrice dei dati è, di norma, quello di consentire una lettura di questo tipo. Di contro, una lettura
‘orizzontale’ (singoli casi secondo le k variabili) fornirebbe una
serie di ‘profili’ individuali, concentrando l’attenzione sui singoli
casi, di cui le variabili costituirebbero dei descrittori. Si veda oltre
al §. 7.2, su questo punto, la concezione del questionario come
‘protocollo’.
Secondo la tipologia proposta da Marradi, la quasi totalità delle
strategie di ricerca sociale si differenziano per il fatto che si prefiggano o meno di costruire una matrice dei dati.
Le strategie cosiddette ‘qualitative’ sarebbero fondamentalmente
caratterizzate dal non prefiggersi la costruzione di tale matrice.
Va da sé che, secondo i canoni accettati dalla comunità scientifica,
la strategia sperimentale permetterebbe la verifica (ferme restando
le critiche dell’epistemologia moderna alla possibilità di parlare di
‘verifica’ anche nell’ambito delle scienze della natura), l’approccio
matriciale consentirebbe di accertare l’esistenza di relazioni di tipo
probabilistico tra variabili, misurando l’intensità di tali relazioni,
mentre l’approccio non matriciale consentirebbe solo di indurre
interpretazioni della realtà sociale senza poterne pretendere una
conferma empirica secondo i canoni oggi accettati.
Una posizione analoga è stata recentemente espressa da Ricolfi
(1995), che aggiunge, al requisito della presenza o assenza di una
9
matrice di dati, che costituisce il fundamentum divisionis tra ricerche qualitative e quantitative utilizzato anche da Marradi, due ulteriori aspetti:
- l’ispezionalibilità della base empirica (ossia “la presenza di definizioni operative dei ‘modi’ della matrice dei dati” nella ricerca
quantitativa e la loro assenza nella qualitativa);
- l’impiego della statistica o dell’analisi dei dati nella ricerca quantitativa, l’utilizzo di procedure meno formalizzate nella qualitativa.
Si noti che quest’ultimo carattere è legato all’aspetto considerato
prioritario da Capecchi, in quanto l’impiego della statistica è più
agevole ed esteso se le variabili rilevate hanno carattere quantitativo.
Di contro, l’aspetto relativo all’ispezionabilità della base di dati è
il più originale, in quanto evidenzia il nesso esistente tra ripetibilità
della ricerca e standardizzazione degli strumenti e delle procedure.
In altre parole, è molto più facile parlare di controllabilità e pubblicità di un percorso di ricerca quando questo si svolge, ad esempio, sottoponendo un questionario con domande chiuse a un campione costruito secondo regole precise che non quando la ricerca
consista in osservazioni non strutturate di situazioni o fenomeni
unici. In quest’ultimo caso, anche se il ricercatore si sforza di illustrare in dettaglio il procedimento seguito, è assai difficile che
questo possa essere ripetuto negli stessi termini da un altro ricercatore; quindi che gli stessi ‘dati’ possano essere rilevati da altri per
valutarne la qualità o l’adeguatezza.
Considerando congiuntamente i tre caratteri, Ricolfi mette in luce
il fatto che le differenze tra i due tipi di ricerca sono riconducibili
ad opzioni divergenti in alcune fasi cruciali del disegno della ricerca (nel suo lessico, la costruzione della base empirica,
l’organizzazione dei dati, l’analisi dei dati), ovviamente correlate
tra loro. Si aggiunge per completezza, anche se non rilevante per
questo testo, che Ricolfi cita un terzo tipo di ricerca, quella fondata
sull’uso di modelli logici o computazionali, non riconducibile ai
due sopra detti.
Rispetto ad entrambe le tipologie, va subito detto che il questionario costituisce lo strumento principe con il quale si svolge la ricerca secondo la strategia matriciale.
Ma è bene aggiungere che non esiste una corrispondenza biunivoca fra strategie di ricerca, tecniche e strumenti di rilevazione dei
dati, anche se alcune connessioni sono più robuste di altre. Ad esempio, poiché il questionario è sempre usato nella survey, si ritiene erroneamente che sia uno strumento associato unicamente alla
strategia matriciale, mentre viene usato anche nell’esperimento
10
(per misurare le variazioni negli atteggiamenti ed orientamenti a
seguito dell’esposizione allo stimolo) e in strategie non matriciali
(per esempio, per costruire profili individuali necessari per condurre interviste in profondità).
In secondo luogo, le tecniche di analisi quantitative non sono necessariamente connesse all’impiego di strumenti standardizzati
(come il questionario) di rilevazione dei dati. Basti pensare alle
analisi del contenuto consentite oggi da sofisticati package statistici; si potrebbe anzi affermare che tecniche come l’analyse des
données (cfr. Amaturo 1989) tendono a superare, almeno sul piano
dell’analisi dei dati, la dicotomia quantità/qualità.
Altre due importanti differenze corrono tra le tecniche di ricerca.
Una riguarda la distinzione tra tecniche o strumenti intrusivi e non
intrusivi. I primi danno luogo ad una modificazione (più o meno
intenzionale) dell’oggetto della ricerca; è il caso delle tecniche
dell’osservazione partecipante, dell’esperimento, di quelle adottate
dagli interazionisti simbolici e dagli etnometodologi, ma anche degli strumenti dell’intervista e del questionario. Quindi di tecniche o
strumenti riferibili all’intera gamma delle strategie di ricerca (sperimentale, matriciale, non matriciale). È possibile eventualmente al
loro interno distinguere tra casi in cui l’aspetto intrusivo viene associato ad una ‘perturbazione dell’oggetto’ che va il più possibile
contenuta e controllata (è il caso del cosiddetto ‘effetto rilevatore’
tipico dell’intervista con questionario) e casi in cui l’intrusività
non viene demonizzata, anzi considerata costitutiva della ricerca
stessa (come accade nell’etnometodologia o nell’esperimento). Di
contro, tecniche o strumenti non intrusivi, quali l’osservazione non
partecipante (ad esempio, utilizzando una videocamera) o l’uso di
documenti e dati secondari, possono a loro volta essere impiegati
in strategie matriciali o non matriciali (non in quelle sperimentali,
in cui l’intrusività assume carattere costitutivo).
Naturalmente, il problema dell’intrusività si collega con l’orientamento epistemologico del ricercatore. Chi, come noi, ritiene che
non esistano ‘dati’, ma solo osservazioni, intende l’osservazione
come un processo costitutivo del dato, cui concorrono sia il ricercatore che il soggetto osservato, in una relazione di coproduzione
(cfr. anche Cipolla 1988), che richiede la massima consapevolezza
delle condizioni in cui si svolge la rilevazione (cfr. Marradi 1988a;
Sormano 1988). Chi invece, nell’ambito di un’impostazione oggettivistica, ritiene che il dato esista a prescindere dallo strumento di
osservazione, mirerà a minimizzare l’effetto ricercatore piuttosto
che a includerlo nel processo osservativo.
11
Da ultimo, ma è forse l’aspetto più importante, si possono graduare le tecniche e gli strumenti di ricerca in base al grado in cui tengono conto della doppia ermeneutica, ossia della necessità di includere nella descrizione dei fenomeni sociali l’interpretazione
fornita dagli attori analizzati. Prendendo ad esempio due casi limite, nell’osservazione non partecipante o nelle analisi secondarie
condotte su dati statistici non si tiene conto dell’interpretazione
fornita dagli attori, mentre al contrario nelle tecniche riconducibili
all’approccio etnometodologico questa assume un rilievo centrale.
Va anzi detto che molto spesso la differenza fra ‘quantitativo’ e
‘qualitativo’ viene centrata su questo aspetto, sicché si propongono
le seguenti corrispondenze: ‘quantitativo = standardizzato (matriciale) = nomotetico = oggettivo’ e ‘qualitativo = non standardizzato (non matriciale) = idiografico’. In realtà queste equazioni non si
presentano mai in modo così rigido e schematico, allo stesso modo
in cui le tecniche non rinviano in modo obbligato agli strumenti e
viceversa. È tuttavia consistente il problema posto da Ricolfi
(1995), secondo il quale l’ispezionabilità della base empirica (ossia
la controllabilità di una fase cruciale del disegno della ricerca,
quello della rilevazione dei dati) è maggiore quanto più standardizzati sono gli strumenti di rilevazione.
Tornando alla doppia ermeneutica, sembra importante sottolineare
due aspetti. Il primo concerne l’estensione che viene assegnata ad
essa. Di norma, infatti, tutti i sociologi o quasi aderiscono al principio weberiano secondo il quale l’azione sociale va spiegata tenendo conto (anche) delle ragioni soggettive dell’azione, quindi
dei quadri di riferimento normativi, valoriali, emozionali e cognitivi degli attori. Di fatto, tuttavia, questo principio viene applicato
con estensioni molto diverse (cfr. Cesareo 1993). Ad un estremo
abbiamo autori che, privilegiando le strutture rispetto agli attori,
considerano il soggetto mosso da fattori strutturali, desumibili da
variabili posizionali o di ruolo (professione, reddito, appartenenze
organizzative, posizione familiare, ecc.). In altri casi, in cui almeno in apparenza ci si prefigge di rilevare gli aspetti ‘soggettivi’
dell’azione, tuttavia, il rispetto per i quadri di riferimento
dell’attore sociale si limita al controllo della reale comprensibilità
delle domande di un questionario, non all’interpretazione dei fenomeni. Non si cerca, cioè, la conferma delle relazioni tra variabili, ipotizzate dal ricercatore, presso il singolo soggetto, ma si valuta solo la corretta percezione delle domande; in questi casi il circolo ermeneutico non si chiude, perché l’intento ermeneutico è limitato al solo percorso di costruzione del dato, mentre
l’interpretazione delle azioni sociali avviene attraverso elaborazio-
12
ni più o meno sofisticate dei dati il cui esito non ritorna ai soggetti
‘oggetto della ricerca’ (o se lo fa, viene fatto cadere dall’alto del
parere degli esperti) (cfr. Giddens 1990). Un caso assai frequente è
costituito dalle elaborazioni mediante analisi fattoriale, in cui i fattori sono definiti spesso attraverso ‘stiramenti concettuali’ non
sempre agevoli e convincenti. Su questo punto Colombis sottolinea
l’esistenza di una vis compulsiva di tipo tecnico che porta lo studioso a dare un nome, e quindi un significato, ad ogni fattore estratto; ma i concetti ‘prodotti’ dalla tecnica e ‘interpretati’ dal ricercatore finiscono per uscire dalla dimensione di senso degli intervistati, ai quali non sono riproponibili per la loro validazione
(cfr. Colombis 1991).
C’è tuttavia un ultimo aspetto importante da considerare: l’uso del
questionario non si limita a presupporre la disponibilità e la sincerità del respondent. Presuppone anche la totale corrispondenza tra
coscienza pratica e coscienza simbolica (o discorsiva) dei soggetti
(cfr. Bourdieu 1983; Giddens 1990; ma già Bernstein 1973). Ci si
riferisce al fatto, messo in luce da diversi autori, secondo il quale
non sempre il soggetto è in grado di rappresentare adeguatamente
in termini discorsivi quanto è in grado di padroneggiare nel suo
comportamento quotidiano. In parole povere, di norma, gli attori
sociali (eccezion fatta, forse, per gli intellettuali) sanno fare più
cose (competenza pratica) di quante ne sappiano descrivere verbalmente (competenza simbolica, linguistica o discorsiva). L’uso
del questionario comporta quindi sia il problema della corrispondenza degli schemi concettuali dell’intervistato e del ricercatore,
sia quello dell’esistenza stessa di tali schemi nella testa
dell’intervistato prima di essere sottoposto al questionario (cfr. Palumbo 1992).
1.2 QUESTIONARIO E STRATEGIE DI RICERCA
In questa lunga premessa si è cercato di evidenziare la necessità di
distinguere tra:
• strategie di ricerca (o ‘tipi’ di ricerca), che comprendono
l’insieme delle procedure di costruzione, organizzazione e analisi dei dati adottate dal ricercatore;
• tecniche di ricerca, che all’interno di una strategia di ricerca
consistono nell’impiego di uno o più strumenti specifici secondo modalità definite in modo più o meno rigoroso dalla comunità scientifica;
13
• strumenti di rilevazione dei dati (meglio sarebbe dire di costruzione degli stessi), che all’interno di una tecnica consentono di
collegare i referenti teorici ai referenti empirici.
I tre termini sono talvolta impiegati in modo non univoco e con
qualche sovrapposizione, peraltro non priva di giustificazioni: si
parla ad esempio della tecnica dell’intervista e dello strumento
questionario, mentre sono entrambi strumenti di costruzione del
dato, ma in effetti con il termine ‘tecnica’ si fa riferimento non solo alla scheda d’intervista o al procedimento attraverso il quale interagiscono intervistatore e intervistato, ma anche ad aspetti più
generali relativi all’opportunità e ai limiti di questa modalità
d’indagine, alle pratiche sottese all’intervista, alla sua rilevanza ai
fini dell’interpretazione ed analisi dei dati, ecc.
D’altro canto, un’articolazione più precisa dei tre termini, che così
come sono stati presentati sono organizzati secondo una scala (discendente) di astrazione, evidenzierebbe che le tecniche di ricerca
comprendono sia gli strumenti di rilevazione che le modalità di
elaborazione e analisi dei dati, mentre la strategia di ricerca ha più
strette connessioni con livelli epistemologici e gnoseologici più
ampi.
Ai fini del nostro lavoro è tuttavia più opportuno tentare una collocazione del questionario (inteso come strumento e non come tecnica) all’interno delle diverse tipologie fin qui proposte.
Iniziando dalla tripartizione più generale, mutuata da Marradi, si
può proporre lo schema alla Tav. 2.
TAV. 2 - QUESTIONARIO E STRATEGIE DI RICERCA
Strategie
Sperimentale
Uso del questionario
Misurazione della
variabile dipendente ‘prima’ e ‘dopo’
la somministrazione dello stimolo
Importanza del questionario
Utilizzato quasi sempre quando la
variabile dipendente è costituita da
atteggiamenti, orientamenti, valori.
Può
essere
sostituito
dall’osservazione, soprattutto se la
variabile dipendente è costituita da
comportamenti piuttosto che da
atteggiamenti
14
Matriciale
Misura le variabili
delle quali si intendono analizzare
le distribuzioni o le
associazioni
Non
matriciale
Rileva
atteggiamenti e orientamenti o comportamenti che saranno comunque analizzati con altri
strumenti
Strumento fondamentale, può essere accompagnato, più raramente
sostituito, dall’intervista. Non costituisce peraltro strumento esclusivo. Può essere ad esempio utilizzata una griglia di rilevazione
nell’osservazione strutturata non
partecipante, quando oggetto esclusivo o quasi della ricerca sono
i comportamenti.
Inoltre, non viene utilizzato nelle
ricerche su dati secondari e nelle
ricerche ‘ecologiche’
Impiegato raramente, anche perché di solito considerato troppo
legato alla strategia matriciale, ha
importanza secondaria rispetto ad
altre modalità di rilevazione, quali
l’intervista in profondità o l’osservazione partecipante. Per sua natura è poco idoneo a raccogliere informazioni sugli aspetti di norma
ritenuti più rilevanti nelle strategie
non matriciali
Rispetto invece all’intrusività e alla doppia ermeneutica, si può affermare che il posizionamento del questionario può essere diverso,
in ragione dell’approccio seguito dal ricercatore. Si è suggerito in
altra sede (Palumbo 1992, 33-5) la possibilità di distinguere tra un
approccio meccanicista, caratterizzato da una concezione oggettivistica del processo di rilevazione del dato, che considera cruciale
lo strumento rispetto alle operazioni effettive di rilevazione (cfr. ad
es. Phillips 1972); un approccio critico, assai più sensibile alle influenze reciproche tra intervistatore ed intervistato ed al modo in
cui quest’ultimo percepisce le domande e formula le risposte (cfr.
ad es. Pitrone 1986); un approccio interattivo, che considera
l’intervistatore come un attore e pone al centro dell’attenzione il
‘fenomeno intervista’ (cfr. Sormano 1988).
In questo volume interessa soprattutto evidenziare, estremizzandole, le differenze che corrono tra un approccio ‘meccanicista’ od
‘oggettivista’, da un lato, e uno critico o ‘costruttivista’ dall’altro.
Sinteticamente, i due orientamenti possono essere rappresentati
secondo i due ‘tipi ideali’ riprodotti nella Tav. 3.
TAV. 3 - COMPARAZIONE FRA APPROCCIO MECCANICISTA/OGGETTIVISTA
15
E CRITICO-COSTRUTTIVISTA
Finalità
Ruolo
intervistato
Ruolo
intervistatore
Ruolo
strumento
Ruolo
interazione
Distorsioni
Approccio
meccanicista/oggettivista
Il questionario rileva i dati;
gli stati sulle proprietà esistono prima e indipendentemente dall’attività di rilevazione
‘Passivamente attivo’; riferisce su atteggiamenti, valori,
orientamenti, comportamenti, proprietà che già possiede, di cui ha consapevolezza
(coscienza pratica e simbolica coincidono) e concettualizza il mondo secondo gli
schemi proposti dal ricercatore (riprodotti nel questionario)
Rigido; deve registrare stati
su proprietà predefiniti dal
ricercatore. Viene addestrato
a un ruolo il più neutro possibile
Prevalgono le domande
chiuse. Il piano di chiusura è
definito a tavolino. Importante la funzione del pre test
Minimo; non deve disturbare
il processo di rilevazione.
Come osservano Goode e
Hatt (1969, 258), “un buon
rapporto non sostituisce le
buone domande”
Va controllato l’effetto rilevatore. Il questionario è lo
specchio dell’intervistato, il
rilevatore non deve offuscarlo
16
Approccio criticocostruttivista
Il questionario costruisce gli
stati attraverso l’interazione
dell’intervistatore, mediata
dallo strumento, con l’intervistato
Attivo; costruisce assieme al
ricercatore i ‘dati’. I suoi
interessi, punti di vista, modi
di vedere il problema su cui
verte il questionario possono
differire ampiamente da
quelli dell’intervistatore. Di
ciò occorre tener conto nella
conduzione dell’intervista
Flessibile; deve rappresentare gli schemi concettuali
dell’intervistato nel modo
più fedele possibile. Viene
addestrato a un ruolo attivo
Prevalgono le domande semichiuse o aperte. Il piano di
chiusura è successivo a interviste in profondità e pre
test
Massimo; va controllato il
comportamento non verbale
e lo stesso processo di costruzione del dato, per assicurare la massima fedeltà
alla rilevazione
Va controllato soprattutto
l’impatto della rigidità dello
strumento di rilevazione per
minimizzare il rischio di registrare in modo errato le
risposte, o di registrare risposte inesistenti
Controlli
di
attendibilità
Attraverso pre test e test
successivi, sui dati già rilevati. Importante la ‘pulizia’
dei dati, effettuata in fase di
registrazione, spesso in forma automatica. La lettura
orizzontale della matrice dei
dati avviene solo per controlli di coerenza. Importanza dell’attendibilità intesa
come proprietà dello strumento
Doppia
Problema inesistente, in
ermeneuti- quanto risolto a monte. Il
ca
ricercatore dà per scontato
che gli schemi sottesi al questionario siano propri anche
dell’intervistato. Eventuali
aperture: modalità di risposta ‘altro’ e ‘non so’. Domande sonda o di controllo
Analisi dei Secondo le ipotesi formulate
dati
ex ante. Lettura solo ‘verticale’ della matrice dei dati
(salvo che per controlli di
coerenza)
Interpretazione
dei dati
Pre test e interviste di accompagnamento o successive alla compilazione del
questionario. Controllo di
corrispondenza tra le risposte e gli stati effettivi
dell’intervistato sulle proprietà condotte in sede di
rilevazione. Importanza della
‘fedeltà’ del dato
Problema cruciale; valutata
sia in fase di preparazione
del questionario che nel pre
test e nella fase di somministrazione. Attenzione alle
modalità ‘altro’ e alle ragioni dei ‘Non so’
Secondo le ipotesi formulate
ex ante o emerse nel corso
dell’intervista. Lettura anche
‘orizzontale’ della matrice
dei dati. Profili dei casi e
non solo delle distribuzioni
delle variabili o associazioni
tra le stesse
Compito esclusivo del ricer- Compito preminente del ricatore, attraverso elabora- cercatore, che tiene conto
zioni statistiche. L’inter- anche del parere degli interpretazione viene ‘imposta’ ai vistatori. Gli esiti dell’insoggetti intervistati
terpretazione vanno riproposti agli intervistati per una
valutazione di corrispondenza (e per motivare casi di
corrispondenza
parziale).
L’interpretazione
viene
‘proposta’ ai soggetti intervistati
È evidente dall’impostazione di questo testo che gli autori aderiscono all’approccio critico-costruttivista (per approfondimenti cfr.
Marradi 1985 e 1988a; Marradi - Gasperoni 1992). Questo approccio presuppone un’attenzione costante alla fedeltà del dato costrui-
17
to nel corso dell’intervista con questionario che dipende da una
pluralità di fattori: il disegno del questionario e la sua preventiva
validazione attraverso interviste e pre-test, l’addestramento dei rilevatori, il controllo dell’intero ciclo metodologico della ricerca (i
dati possono essere distorti anche in sede di codifica, elaborazione
e analisi, non solo in sede di rilevazione).
Alcune precisazioni sono infine opportune. Innanzitutto, è chiaro
che, se ogni soggetto possiede un proprio mondo interiore, un questionario non può limitarsi a registrarlo (per questo esistono altre
tecniche di ricerca e altri strumenti di rilevazione). È quindi inevitabile quel grado di forzatura che discende dall’esigenza di trovare
un ‘minimo comune denominatore’ ad atteggiamenti, orientamenti,
comportamenti tutti diversi tra loro (di fatto e nei resoconti che ne
forniscono gli attori sociali). Solo così si possono rilevare dati tra
loro comparabili ed utilizzabili nella ricerca. La saggezza del ricercatore sta quindi nel minimizzare le forzature che sono inevitabilmente prodotte da qualunque relazione simbolica intersoggettiva,
ossia di rispettare al massimo (e di riprodurla nell’intervista) la posizione dell’intervistato, pur ottenendo risposte utili per la ricerca.
In secondo luogo, il tipo e il grado delle forzature che si possono
considerare accettabili varia in relazione alle proprietà registrate e
agli scopi della ricerca. Per quanto attiene a questi ultimi, nelle ricerche valutative o in quelle che analizzano fenomeni complessi è
spesso necessario conoscere gli orientamenti o le disponibilità
all’azione dei soggetti magari assai lontani dal vedere le cose secondo il punto di vista del ricercatore (o dell’ente committente). Si
pensi alla difficoltà di rilevare la reale disponibilità di un anziano
ad un ricovero in alloggio protetto, il grado di utilizzo di un bene o
servizio pubblico da parte di un utente potenziale, l’adesione di un
residente a un progetto di pedonalizzazione del centro urbano. In
questi casi, pur con mille cautele (uso di tecniche e strumenti differenziati, inserimento di domande aperte e di domande sonda), comunque, alla fine qualcuno dovrà rispondere alle nostre domande.
1.3 IL DISEGNO DELLA RICERCA
Si è visto in precedenza che esiste un’ampia gamma di tipi, strategie tecniche e strumenti di ricerca: la scelta compiuta dal ricercatore all’interno di questa ‘cassetta degli attrezzi’ dipende da una pluralità di elementi, quali l’obiettivo della ricerca (ad es., cognitivo o
valutativo), il suo oggetto (piccoli gruppi, ampie popolazioni,
ecc.), gli strumenti applicabili, il tipo di elaborazioni ed analisi che
18
intende condurre sui dati. Naturalmente giocano un ruolo importante le preferenze del ricercatore, che lo inducono spesso a scegliere i percorsi metodologici che gli sono più congeniali; ad esempio, una ricerca con questionario su un campione rappresentativo piuttosto che un’analisi di dati secondari già disponibili, o una
serie di interviste a interlocutori privilegiati.
Quali che siano le scelte operate (non di rado condizionate anche,
più banalmente, dai fondi e dal tempo disponibili e dai vincoli posti dal committente), queste saranno di norma caratterizzate da una
coerenza complessiva tra i diversi aspetti della ricerca. Ad esempio
è poco coerente somministrare mille questionari senza prevedere
una successiva elaborazione ed analisi dei dati con il calcolatore,
ovvero effettuare dieci interviste e sottoporre i risultati ottenuti a
sofisticate elaborazioni statistiche. Del pari, è altrettanto improbabile che ci si avvalga di un questionario per intervistare degli infanti o dell’esperimento in laboratorio per studiare le relazioni fra
status professionale e coscienza di classe.
La coerenza metodologica deve riguardare anche l’intero ciclo di
realizzazione della ricerca. Quasi tutti i manuali evidenziano infatti
che la ricerca, pur costituendo un processo unitario, può essere articolata in fasi, ciascuna delle quali è caratterizzata da alcuni adempimenti essenziali per poter passare alla fase successiva. Sotto
questo aspetto la ricerca sociale, quale che sia la sua natura (qualitativa o quantitativa, descrittiva o valutativa, ecc.), segue alcune
‘tappe’ obbligate, che saranno più dettagliatamente illustrate nel
prossimo paragrafo.
In termini generali, si può considerare una ricerca come un processo che inizia con l’individuazione di un problema (poco importa se
teorico o pratico) e prosegue precisandone i contorni e gli aspetti
essenziali fino al punto di definire adeguatamente il perché e il cosa studiare; a questo punto è possibile stabilire il ‘come’, ossia con
quali strumenti rilevare i dati e il ‘dove’ rilevarli (ad esempio, su di
un campione o sull’intera popolazione oggetto della ricerca). Terminate tutte le operazioni preliminari avviene la cosiddetta ‘discesa sul campo’, ossia la rilevazione dei dati, che debbono successivamente essere organizzati in modo da renderne possibile
l’elaborazione e l’analisi. Analizzandoli si può valutare se le ‘risposte’ che la realtà ‘catturata’ dagli strumenti di rilevazione ha
dato alle nostre domande sono adeguate o meno, e decidere il da
farsi (in termini di analisi o di scelte operative).
Senza pretesa alcuna di proporre uno schema migliore dei molti
rinvenibili nella manualistica (cfr. ad es. Guala 1991; Guidicini
1993) proponiamo una sequenza di fasi e sotto-fasi in cui si artico-
19
la una ricerca, evidenziando che questa sequenza è a nostro avviso
adeguata sia ad una prospettiva descrittiva che ad una valutativa
(per un’illustrazione di maggior dettaglio, cfr. Palumbo 1991, dal
quale sono sintetizzate, con adattamenti, le note che seguono).
Prima di illustrare uno schema standard di disegno della ricerca,
due precisazioni doverose.
In primo luogo, molti autori (in particolare, Hyman 1967; Bailey
1985) sottolineano la circolarità del processo di ricerca; infatti, se
da un lato è evidente che ogni fase influenza in modo anche irreversibile le successive (non potrò mai, ad esempio, elaborare dati
che non ho rilevato), d’altro lato è possibile, e spesso accade, che i
risultati di una fase possano indurre a modificare la precedente. Ad
esempio, l’impossibilità di raggiungere con questionario i membri
di un campione potrebbe far ripiegare su altri strumenti rivedendo
così la fase precedente, ovvero in sede di analisi dei dati possono
emergere nuove ipotesi non considerate al momento
dell’impostazione della ricerca.
Ciò conduce ad una seconda notazione, relativa all’immagine della
ricerca come processo lineare che si sviluppa attraverso tappe ben
delineate, dall’iniziale definizione del problema al commento finale dei risultati raggiunti, costituisce un modello astratto da cui la
concreta attività di ricerca quasi sempre si discosta. Alcune fasi
infatti si sovrappongono almeno in parte, altre si svolgono in parallelo, altre ancora generano dei ripensamenti o delle revisioni delle
ipotesi iniziali che provocano retroazioni e inducono più d’un percorso circolare all’interno della sequenza descritta all’inizio. Inoltre, molto spesso il ciclo metodologico della ricerca viene ricostruito a posteriori, secondo un modello rigidamente sequenziale,
e descritto come se fosse stato progettato fin dall’inizio in questo
modo (cfr. Fleck 1983).
Come ha rilevato Phillips
la linea d’indagine effettivamente seguita dal ricercatore molto
spesso si discosta dalle sue idee circa il modo in cui la ricerca dovrebbe essere condotta ed egli può essere consapevole di tali deviazioni
solamente in misura limitata (1972, 112)
In altre parole, la costruzione di una ricerca è un processo molto
più artigianale che standardizzato; è nel corso della sua realizzazione che si precisano le ipotesi, si colgono le relazioni, si modificano gli strumenti, si decidono le strategie di analisi dei dati. Solo
alla fine si sa quel che è realmente accaduto, poiché l’intero percorso è costellato d’imprevisti e di scelte compiute spesso
20
nell’urgenza dei tempi e nella ristrettezza dei fondi. È così che
l’indisponibilità di una lista di campionamento fa passare da un
campione casuale ad uno sistematico, che la mancata risposta ad
una domanda del questionario la fa omettere dalle interviste successive, eccetera.
Quando si stende il rapporto di ricerca non ci si prefigge tuttavia di
narrare l’avventura della ricerca così come si è sviluppata, ma di
‘ricostruirla’ in termini di percorso coerente, secondo il quale, dati
un obiettivo e un oggetto della ricerca, ne è conseguita la scelta di
una specifica strategia, la costruzione di un certo strumento di rilevazione, ecc.
1.4 LE FASI DELLA RICERCA
Si è soliti distinguere quattro fasi principali, a loro volta ulteriormente articolate al loro interno, che consistono in:
1. impostazione della ricerca;
2. raccolta dei dati;
3. codifica ed elaborazione dei dati;
4. analisi e interpretazione dei risultati.
In questa sede tracciamo un primo sommario quadro dei contenuti
delle fasi e sotto-fasi in cui si articola la ricerca. A conclusione del
capitolo proponiamo un approfondimento delle fasi preliminari,
mentre nei successivi ci si soffermerà più specificamente su quelle
di maggior importanza nella ricerca con questionario.
In sintesi, i contenuti principali di queste fasi sono i seguenti.
1.4.1 L’impostazione della ricerca
Si tratta di una fase in cui operano tre attori principali: il ricercatore, l’eventuale committente, i soggetti che costituiscono l’‘oggetto’
della ricerca. Il rapporto fra questi protagonisti concerne almeno
tre aspetti fondamentali della ricerca: gli scopi, le ipotesi di base,
le aspettative in ordine all’utilizzo dei risultati (cfr. Pellicciari e
Tinti 1983): aspetti tutti che svolgono un ruolo cruciale in ogni fase della ricerca.
Senza demonizzare o minimizzare il condizionamento derivante
dal rapporto con il committente, si può concordare con Hyman nel
sottolineare l’opportunità che il ricercatore sappia comunque sottrarsi al condizionamento sul piano più strettamente tecnicoprofessionale e scientifico. Uno dei condizionamenti più evidenti
riguarda la preminenza, usualmente assegnata dal committente,
21
degli impieghi pratici della ricerca, cui fa riscontro il prevalente
interesse per problemi teorici più generali proprio del ricercatore.
Nell’impostazione della ricerca si includono di solito le seguenti
attività:
1.4.1.1 La definizione dell’oggetto di studio
In questa fase si tratta di concentrarsi sulla chiarificazione del problema, sulla selezione di ipotesi, teorie e concetti rilevanti,
sull’individuazione degli ambiti cruciali che saranno fatti oggetto
di indagine, nonché dell’ambito spaziale o temporale abbracciato
dalla ricerca.
Comprende le seguenti operazioni:
a) raccolta del materiale bibliografico disponibile;
b) raccolta di dati statistici o di altro materiale documentale;
c) raccolta di ricerche già effettuate su temi analoghi;
d) lettura critica del materiale raccolto;
e) effettuazione di una ricerca di sfondo o di un’indagine pilota;
f) sviluppo ed approfondimento teorico di ipotesi, teorie, concetti
rilevanti.
In breve, si tratta di riportare l’oggetto della ricerca alle riflessioni
e ricerche già sviluppate in ambito sociologico, dando vita fin
dall’inizio a quel continuo scambio fra teoria e fatti di cui si nutre
la scienza. Come nota Wright Mills
per quanto riguarda le idee, è raro che da una ricerca veramente
particolareggiata se ne traggano più di quante se ne mettono (1962,
75)
I dati statistici e l’ulteriore materiale documentale costituiscono le
informazioni essenziali per una prima descrizione dell’oggetto della ricerca e la sua collocazione in un contesto spazio-temporale di
riferimento.
Molte ricerche sociologiche si sono avvalse di una o più fonti documentali pre esistenti, senza procedere ad un’ulteriore rilevazione
diretta. Vengono definite ricerche su dati secondari, in quanto
fondate su informazioni raccolte da altri studiosi o desunte da pubblicazioni statistiche o da dati rilevati nel corso di attività amministrative, com’è il caso del noto studio di Durkheim sul suicidio.
Naturalmente, il fatto che vengano impiegati dati rilevati da altri,
magari di carattere ufficiale, come accade per la fonte Istat, non
esime da una riflessione critica sulle modalità di raccolta ed elabo-
22
razione dei dati, essenziali per una corretta valutazione della loro
affidabilità (cfr. Zajczyk 1991).
Il materiale raccolto deve inoltre essere adeguatamente selezionato
perché possa essere utilizzato nella fase preliminare della ricerca;
la capacità che un ricercatore dimostra di recepire in modo critico i
contributi bibliografici e la documentazione raccolta si rivela determinante per la bontà della ricerca che ha in animo di intraprendere.
1.4.1.2 La formulazione delle ipotesi
Costituisce il punto d’arrivo di quella vera e propria ‘ricerca nella
ricerca’ che è rappresentata dalla sua fase iniziale.
Come osservato (Palumbo 1991), le ipotesi debbono possedere le
seguenti caratteristiche:
a) essere abbastanza esplicite da consentire la successiva costruzione degli strumenti di rilevazione empirica;
b) essere sufficientemente ‘aperte’ da consentire un eventuale ripensamento nel corso della ricerca (in altri termini: debbono
prevedere la rilevazione di dati collaterali all’ipotesi principale
che consentano di cogliere relazioni non identificate fin
dall’inizio come centrali per la ricerca);
c) essere strutturate in modo da permettere un’agevole analisi ed
interpretazione dei dati.
Poiché una ricerca si propone fondamentalmente l’obiettivo di individuare relazioni fra variabili, o di trarne conferma attraverso la
rilevazione di dati, la formulazione iniziale delle ipotesi deve anche darsi carico dell’effettiva controllabilità, attraverso tecniche
specifiche di ricerca, delle relazioni inizialmente postulate o ricercate. Si può anzi affermare che tanto più complesse sono le ipotesi
iniziali, tanto più chiare debbono essere le loro implicazioni sul
piano empirico.
A questo proposito Guidicini (1993, 58) ritiene opportuno distinguere tra ipotesi generali ed ipotesi operative, sottolineando come
dalle prime si debba poter agevolmente passare alle seconde,
all’interno di un quadro di riferimento unitario.
1.4.1.3 L’organizzazione amministrativa della ricerca
Non sempre trattata autonomamente, è tuttavia strategica per la
buona conduzione della ricerca.
Quanto più complessa risulta la fase di rilevazione dei dati sul
campo, tanto maggiori devono essere l’attenzione e le risorse da
23
dedicare alla sua organizzazione e realizzazione. In questa fase occorre:
a) pianificare l’uso delle risorse finanziarie disponibili;
b) individuare i collaboratori e definire i ruoli interni al gruppo di
ricerca;
c) individuare ed iniziare ad addestrare i rilevatori
d) predisporre gli strumenti per la rilevazione sul campo
e) redigere un piano operativo della ricerca.
1.4.2 La rilevazione dei dati
La rilevazione dei dati assume carattere ben diverso a seconda che
il ricercatore utilizzi dati pre-esistenti alla ricerca (ad es., le statistiche Istat, i risultati di indagini precedenti), ovvero dati costruiti
attraverso l’impiego di specifiche tecniche (ad es., le risposte ad un
questionario). Tenendo conto tuttavia del fatto che i dati secondari
(cioè pre-esistenti) sono stati in qualche modo costruiti da un altro
ricercatore-rilevatore, si può affermare che il processo di costruzione del dato prevede comunque i seguenti passi:
1 la predisposizione degli strumenti e la loro sperimentazione sul
campo;
2 l’individuazione delle fonti ed il campionamento;
3 la raccolta vera e propria (l’impatto cioè degli strumenti
d’indagine con l’oggetto della ricerca);
4 la codifica e registrazione dei dati (cfr. anche Guidicini 1993),
che taluni indicano come fase autonoma, precedente quella
dell’elaborazione dei dati stessi.
1.4.2.1 La predisposizione degli strumenti e la loro
sperimentazione sul campo
L’oggetto della ricerca, il tipo di ipotesi formulate, l’esperienza del
ricercatore portano a definire e predisporre gli strumenti di rilevazione.
Quale che sia lo strumento scelto per la (o imposto dalla) ricerca,
esso va comunque predisposto con estrema cura, e se possibile sottoposto a sperimentazione prima di essere impiegato su larga scala.
In questa fase della ricerca è particolarmente utile la collaborazione attiva dei rilevatori. Un questionario sperimentato con successo
dal ricercatore può risultare comunque ostico all’intervistatore,
mentre per converso le difficoltà di somministrazione incontrate da
quest’ultimo possono indurre il ricercatore a semplificare il questionario stesso.
24
Inoltre, la fiducia nello strumento di rilevazione influenza molto
anche l’atteggiamento dei rilevatori. Se ritengono non adeguato un
questionario, questi possono provocare mancate risposte alle domande reputate mal formulate o incongrue o suggerire risposte
semplificate o banali (cfr. Boccuzzi 1985).
1.4.2.2 L’individuazione delle fonti ed il campionamento
Gli strumenti di rilevazione hanno ben poco significato fino a
quando non sono applicati alla popolazione oggetto della ricerca.
La disponibilità di una buona lista di campionamento, la realizzazione di un campione adeguato, sono altrettanto importanti della
costruzione di un questionario. Non ci soffermiamo oltre su questa
fase perché ad essa viene dedicato uno specifico capitolo.
Basti qui ricordare che non sempre è necessario o opportuno procedere ad un campionamento. Ricerche assai note, come quella di
Durkheim sul suicidio, hanno utilizzato dati secondari relativi
all’intera popolazione; e d’altro canto si è già detto che una descrizione dell’ambito di riferimento della ricerca rappresenta comunque un’opportuna integrazione dell’analisi campionaria. Una pur
sommaria conoscenza della popolazione è del resto necessaria per
procedere alla scelta del campione e alla generalizzazione dei risultati ottenuti.
1.4.2.3 La raccolta dei dati
L’applicazione alla popolazione (o al campione) degli strumenti e
delle tecniche di rilevazione definiti nella fase precedente rappresenta il momento cruciale di ogni ricerca.
Questa operazione deve essere attentamente controllata dal capo
équipe, soprattutto quando viene eseguita da soggetti diversi dal
ricercatore, quali i rilevatori. Si può aggiungere che le cautele necessarie sono diverse a seconda del tipo di strumento usato. Periodiche riunioni di controllo con i rilevatori sono comunque opportune, anche al fine di tenere sotto controllo il funzionamento degli
strumenti stessi e la loro eventuale reattività sugli intervistati. È in
questa fase, ad esempio, che si possono individuare eventuali difformità nei criteri di rilevazione dei singoli operatori, nonché effetti di disturbo sulla fedeltà della rilevazione, quali la presenza di
response sets.
Un buon controllo in itinere può alleggerire la fase 4, di codifica
dei dati, quanto meno nei casi in cui siano necessarie operazioni
25
successive alla rilevazione vera e propria, quali la trascrizione di
interviste, la codifica di domande aperte e così via.
1.4.2.4 La codifica e la registrazione dei dati
Anche in questo caso si tratta di un’operazione apparentemente
banale, che però va eseguita con estrema attenzione.
Si possono presentare due tipi di registrazione. La prima, eventuale, riguarda la trascrizione su moduli appositi dei dati rilevati in
vario modo (appunti stesi nel corso dell’intervista, osservazioni
registrate su di un taccuino, etc.). Per ‘moduli’ intendiamo supporti, di norma cartacei, che forniscono al materiale raccolto la struttura necessaria per essere successivamente analizzato. È ad esempio impossibile (o comunque faticosissimo) ragionare su verbali di
intervista che non siano stati riorganizzati per punti, o più banalmente analizzare dati che non siano stati trascritti in tabelle in modo chiaro.
Non sempre, inoltre, questa prima forma di codifica è ingrato
compito del rilevatore o di altri collaboratori alla ricerca. Nel caso
ad esempio delle domande ‘aperte’ di un questionario (domande a
risposta non predefinita) spetta infatti in primo luogo al ricercatore
decidere, dopo aver preso in esame l’insieme delle risposte ottenute, in quali e quante categorie debbano essere collocate, e quali criteri debbano presiedere a tale collocazione.
Il secondo tipo di registrazione concerne l’inserimento su di un
calcolatore dei dati rilevati, e riguarda soprattutto, ma non esclusivamente, il caso del questionario o di quei dati amministrativi che,
rilevati in una prima fase su di un supporto cartaceo, debbano poi
essere riportati su supporto magnetico.
Questa fase è una delle meno gratificanti, tanto che talvolta viene
affidata a terzi, estranei alla ricerca; proprio per questo è una delle
più frequenti fonti di errore. Vengono messi a punto, a questo scopo, controlli automatici a vario grado di complessità. Nei casi più
semplici si predispongono controlli logici capaci di selezionare gli
errori più evidenti (ad esempio, i casi di maschi definitisi nubili, di
giovanissimi registrati come coniugati o vedovi, di dirigenti indicati come analfabeti e così via). Nei casi più complessi (quando ad
esempio si vogliono individuare errori in domande su atteggiamenti e valori) si effettuano riscontri rispetto a domande ‘di controllo’,
selezionando i casi di manifesta incongruenza.
26
1.4.3 L’elaborazione dei dati
Si è detto che l’elaborazione dei dati segue lo schema di riferimento tracciato in sede di definizione delle ipotesi.
Nel caso di una ricerca descrittiva, l’elaborazione consisterà principalmente in una restituzione dei dati in forma grafica o tabulare,
tale da evidenziare la distribuzione delle diverse caratteristiche del
campione (o dell’universo) in ragione delle varie proprietà analizzate.
Nel caso di una ricerca esplicativa, i dati verranno organizzati in
modo da consentire il controllo delle ipotesi.
Di fatto tuttavia le cose non sono così semplici. Nelle ricerche descrittive si tende comunque a mettere in rilievo alcune relazioni
significative tra variabili, o elaborando tabelle a doppia entrata,
oppure ricorrendo a procedimenti statistici più sofisticati.
D’altro canto, già nel ritenere un tema meritevole di indagine, e nel
definire le dimensioni secondo le quali questo va analizzato, vengono implicitamente o esplicitamente adottate ipotesi interpretative o esplicative. Nello stesso tempo, le relazioni tra variabili emerse nel corso di una ricerca descrittiva potranno giustificare, come
si è detto, l’avvio di una ricerca esplicativa.
Ampiamente giustificato appare dunque il richiamo operato da
Guidicini al corretto e bilanciato rispetto, nell’elaborazione dei dati, di due principi. Da un lato, il ‘principio di proprietà’, in forza
del quale le elaborazioni operate debbono risultare adeguate alle
esigenze connesse alle ipotesi di ricerca. D’altro lato, il ‘principio
di elasticità’, in base al quale le tecniche di elaborazione possono
svolgere un ruolo attivo nel processo di ricerca, suggerendo modifiche e miglioramenti alle ipotesi iniziali (Guidicini 1993).
Si tratta del resto di un’ovvia applicazione di quel carattere di ‘circolarità’ del processo di ricerca che è stato messo in evidenza fin
dall’inizio.
1.4.4 I risultati della ricerca
Pone fine al processo di ricerca la valutazione dei suoi risultati rispetto alle ipotesi inizialmente formulate. Va da sé che i risultati
saranno diversi a seconda che ci si prefigga di descrivere una realtà, controllare empiricamente delle ipotesi, ovvero fornire delle
valutazioni su una politica pubblica attivata.
Inoltre, una spiegazione sociologica adeguata deve essere fondata
non solo sulle uniformità statistiche registrate, ma anche al livello
27
degli atteggiamenti e comportamenti dotati di senso messi in atto
dai singoli individui.
Come osserva Morin
la statistica è stata in grado solo di sovrapporre un macro-ordine
(al livello delle popolazioni) e un micro-disordine (al livello degli individui), ma senza stabilire mai la minima connessione logica fra queste due scale (1985b, 95)
A ciò si aggiunge che la generalizzazione di relazioni rilevanti o di
nessi causali ‘forti’ non può essere estesa oltre i limiti circoscritti
di tempo e di luogo in cui restano invariati i caratteri fondamentali
di un sistema sociale.
Un poco diversa la posizione di chi svolge un’indagine empirica
nella prospettiva di un successivo intervento progettuale o della
valutazione di uno realizzato. In questo caso si tratterà, ex ante, di
cogliere le relazioni forti tra le diverse variabili, individuando i
nodi della struttura sulla quale si intende intervenire; ex post, di
valutare se gli esiti e gli impatti della politica sono stati coerenti
con le previsioni formulate ex ante.
In linea generale, una buona ricerca sarà tale non solo perché condotta in modo adeguato nelle tre fasi precedenti, ma anche perché
carica di implicazioni sul piano della teoria o su quello pratico.
Talvolta, poi, i due piani non sono così lontani: quando gli operatori si allontanano da modelli interpretativi della realtà corretti sul
piano teorico difficilmente compiono realizzazioni efficaci; del
pari, quando i modelli teorici non consentono di rendere ragione
dei comportamenti quotidiani di individui concreti, il loro fascino
eventuale sarà di natura estetica piuttosto che scientifica.
1.5 LA RICERCA PRIMA DELLA RICERCA
Prima di passare alle fasi centrali della ricerca con questionario,
riteniamo opportuno sviluppare con maggiore dettaglio alcuni aspetti importanti della fase preliminare alla discesa sul campo. Si
tratta comunque di aspetti da considerare con la stessa attenzione e
lo stesso rigore della ricerca vera e propria, dal momento che ne
influenzeranno in misura determinante modalità, contenuti ed esiti.
Tutte le attività preliminari sono poi particolarmente importanti nel
caso di ricerca su commessa, comune nella pratica professionale.
In questi casi la definizione preliminare del disegno della ricerca
sarà tra l’altro ben più vincolante per il ricercatore che nel caso di
28
una ricerca autofinanziata: a maggior ragione si dovrà quindi prestare attenzione a quanto viene progettato e quindi concordato in
questa fase.
1.5.1 La ricerca di sfondo e lo studio pilota
Se non ci sono chiare ipotesi di fondo e la ricerca nasce sulla scorta di sollecitazioni esterne al ricercatore ed a lui sconosciute; se la
letteratura in argomento è scarsa e poco esauriente; se occorre impostare un programma di lavoro dettagliato da sottoporre al committente anche ai fini del computo del budget; se insomma il lavoro inizia senza che il ricercatore abbia le idee chiare, è opportuno
eseguire degli studi preliminari che consentano la messa a fuoco
delle problematiche.
In generale si distingue fra ricerca di sfondo e studio pilota.
La ricerca di sfondo è la raccolta di informazioni preliminari utili
al ricercatore per conoscere l’argomento posto al centro della ricerca, allo scopo di delimitarlo e concentrarvisi nel prosieguo del
lavorosolitamente, come già detto, si tratta di individuare e consultare altri lavori precedentemente fatti sullo stesso tema; individuare dati statistici che contribuiscano alla descrizione; intervistare
eventualmente testimoni qualificati per approfondire aspetti specifici (compreso lo stesso committente), utilizzando ovviamente tecniche non direttive, o addirittura approcci ermeneutici (Montesperelli 1993); ecc.
Lo studio pilota ha una valenza superiore, ed ha lo scopo preminente di garantire il ricercatore circa la rilevanza delle sue ipotesi
di lavoro; lo studio pilota è generalmente fatto tramite interviste
non strutturate, con una “guida d’intervista che servirà al ricercatore per scendere sul terreno con una direttiva non troppo rigida”
(Goode - Hatt 1969, 230). Questo procedimento è utile per limitare
“uno dei difetti principali del questionario, che è in genere costruito sulla base del giudizio personale del o dei ricercatori circa la rilevanza dei temi da trattare” (Pitrone 1986, 43-44).
Benché importantissime, queste fasi preliminari sono spesso evitate in ricerche incalzate dall’urgenza operativa e dalla ristrettezza
del finanziamento. Occorre rimarcare invece l’indispensabilità della ricerca di sfondo, quanto meno nei suoi aspetti ridotti di raccolta
di materiale bibliografico e statistico, di ricerche sull’argomento,
ecc. A questo proposito Palumbo insiste a ragione:
per quanto particolare e circoscritto possa essere un tema di ricerca, questo è stato certamente analizzato da altri secondo una pluralità
29
di prospettive, il cui recepimento critico è ovviamente essenziale per
una meditata definizione dell’oggetto di ricerca.
È questa la fase in cui occorre mettere la sordina alle pur legittime
pretese di originalità, che mal si coniugherebbero con l’ignoranza delle riflessioni precedenti; solo dal confronto fra le intuizioni e le conoscenze iniziali del ricercatore e le acquisizioni maturate da altri studiosi è possibile pervenire ad una corretta impostazione del problema
(1991, 67)
1.5.2 Il pre-test
Diverso il pre-test; questo è realizzato col questionario nella sua
versione ritenuta definitiva eseguendo un certo numero di interviste reali ed ha lo scopo di validare le definizioni operative e, in generale, valutare l’attendibilità dello strumento.
È estremamente importante realizzare un pre-test, sempre ed in
modo accurato, sperimentando nel contempo gli intervistatori. È
veramente incredibile il numero di incongruenze ed errori che si riscontra nel questionario una volta che, col pre-test, gli si dà in sostanza voce, passando dal silenzio tutto interno alle logiche del ricercatore alla complessità dell’interazione con l’intervistato.
In generale si scelgono, per il pre-test, degli intervistati non facenti
parte del campione estratto; queste interviste non sono poi utilizzate se il questionario viene modificato.
L’esecuzione di un buon pre-test può avvenire facendo seguire,
alla somministrazione del questionario, una breve intervista registrata sul questionario stesso, dove l’intervistato, sollecitato
dall’intervistatore, dovrà spiegare, item per item, perché ha dato
determinate risposte, come ha inteso determinati stimoli, e così via; in questo modo spesso si riscontrano non poche cause di distorsione degli stimoli, anche di quelli apparentemente più semplici ed
ovvi come le domande a risposta dicotomica (Razzi 1992).
1.5.3 Lo studio di fattibilità
Lo studio di fattibilità consente al ricercatore di informare compiutamente e preventivamente il committente circa le risorse da impiegare per realizzare la ricerca nei termini concordati.
Per i suoi risvolti gestionali e di mediazione con le necessità del
committente è una fase del lavoro che riguarda il management della ricerca, ma il tipo e la qualità delle implicazioni operative la collocano nelle fasi iniziali del processo; spesso anzi lo studio di fattibilità è la traduzione in termini gestionali di quel disegno della ri-
30
cerca che inizia a prendere forma con la ricerca di sfondo e
l’eventuale studio pilota.
Alcuni autori ne sottolineano la valenza di “correttezza e di deontologia professionale” (Carbonaro - Ceccatelli Gurrieri - Venturi
1992, 139), in quanto si tratta di amministrare con competenza risorse del committente (che sono spesso, in ultima analisi, risorse
pubbliche) ottimizzando i risultati.
Lo studio (o progetto) di fattibilità deve stabilire le necessità della
ricerca in merito a:
• risorse di tempo: quanto durerà la ricerca, e possibilmente
quanto dureranno le varie fasi, al termine delle quali è sempre
buona norma redigere rapporti intermedi, o almeno brevi stati
di avanzamento;
• risorse umane: quante persone saranno coinvolte nei vari ruoli
previsti nella ricerca, con quali mansioni e per quanto tempo,
dai consulenti ai rilevatori ai consollisti;
• risorse economiche: che sono in relazione alle precedenti ma
che devono prevedere anche le spese per libri, cancelleria e materiale di consumo, stampa dei questionari, uso macchina per
l’elaborazione, trasferimenti ed altri costi dovuti alla logistica,
ecc.
La consegna di uno studio di fattibilità al committente impegna il
ricercatore (è spesso sulla base di questo che viene stabilito il finanziamento), ed è quindi opportuno dedicarvi molta attenzione.
Se la ricerca è limitata e su argomenti noti al ricercatore lo studio
di fattibilità sarà di veloce esecuzione, dettagliato e attendibile; in
caso contrario il ricercatore deve puntare molto sullo studio pilota
per poter definire il campo e dettagliare costi e tempi. In questo
caso occorre che chiarisca prima al committente la funzione di
questi studi preliminari facendosi garantire la copertura finanziaria.
1.6 IL MANAGEMENT DELLA RICERCA
1.6.1 Il concetto di management della ricerca
Management è un termine inglese utilizzato in economia e nelle
discipline rivolte all’organizzazione per indicare un insieme di
concetti, non ben traducibili in altre lingue, comunque riferiti alla
direzione, amministrazione, controllo, conduzione, gestione di attività economiche, commerciali, politiche, amministrative, ovvero,
31
in senso lato, riferite a progetti (e quindi con un orientamento allo
scopo).
In quest’accezione più ampia sembra proficuo l’utilizzo del concetto di management applicato alla ricerca. In particolare, per il
ricercatore, diventano ineludibili problemi gestionali che si possono ascrivere a questo concetto.
Phillips dedica alcune pagine ai “problemi amministrativi dell’inchiesta” (Phillips 1972, 200-203) con particolare riguardo alla gestione di una ricerca di ampie dimensioni ed al rapporto con gli
intervistatori; Palumbo, in un capitolo sull’‘organizzazione amministrativa della ricerca’, sviluppa in particolare il tema delle diverse figure professionali e competenze implicate in un processo di
ricerca, e la gestione del gruppo degli intervistatori (Palumbo
1991, 75-77); Pellicciari e Tinti accennano al ruolo politico del
committente e all’interconnessione fra scopi del committente e disegno della ricerca (Pellicciari - Tinti 1983, 34-37); Guala si sofferma sul rapporto coi committenti e sulle possibili economie di
scala (Guala 1986, 41-42), e propone un modello di pianificazione
della ricerca (Ivi, 91-101); Guala è comunque uno dei pochi autori
che sottolineano con vigore l’importanza di questi aspetti affermando che
il fatto organizzativo, lungi dall’essere inquadrato come problema
‘tecnico’, assume una rilevanza metodologica generale: così come le
varie fasi di ricerca sono tra loro interrelate, nello stesso modo l’organizzazione della ricerca incide direttamente sulla gestione complessiva del lavoro e sul futuro ‘prodotto’, e quindi su obiettivi, oggetto,
valutazione delle tecniche opportune, fasi, verifiche in progress, ecc.
Non si dovrebbe parlare in ogni caso solo di ‘fatti organizzativi’, o
di ‘problemi amministrativi; il concetto proposto di management è
infatti più ampio.
Management deriva da un verbo inglese che, liberamente tradotto,
significa ‘organizzarsi per raggiungere lo scopo’; nel caso della
ricerca occorre organizzarsi almeno su tre ordini di problemi, ciascuno relativo a sottoinsiemi anche piuttosto articolati, proponibili
in quest’ordine:
a) Definizione degli obiettivi e verifica delle risorse
1) Aspetti preliminari e definizione della ricerca
2) Aggiustamenti in itinere e controllo sulla ricerca
3) Rapporti finali, decisionalità, valutazione
b) Gestione della ricerca
1) Budget
32
2) Gruppo di lavoro ristretto (direzione)
3) Gruppo di lavoro allargato (consulenti, intervistatori,...)
4) Intervistati / utenti / soggetti
c) Promozione del lavoro
1) In itinere
2) A conclusione
Questo schema dà un’idea almeno approssimativa di cosa si intenda con management; notare che non compare, con una voce specifica, la metodologia della ricerca: essa è parte considerevole delle
problematiche del gruppo a), è ineludibilmente intrecciata a quelle
del gruppo b) ed ha riflessi significativi sul gruppo c), ma non è
strettamente un problema di management.
Vediamo rapidamente il significato di ciascun blocco problematico.
1.6.2 Definizione degli obiettivi e verifica delle risorse
È il primo problema in ordine cronologico, ed è in fondo il primo
per importanza; è un problema giocato molto nel rapporto col
committente, nella complessa fase che va dalla manifestazione di
un desiderio di fare ricerca, alla definizione precisa del tema, al
suo disegno. Rapporto col committente significa riflessione sulla
rilevanza, definizione degli scopi, implicazioni sulle policy, ecc.
Nel caso di un committente esterno al gruppo di ricerca c’è in generale una confusa definizione di questi problemi; c’è spesso la
percezione di un indistinto bisogno conoscitivo, ma è raro ci sia di
più. Il committente spesso ignora le condizioni connesse al reperimento delle fonti, alla difficoltà ed assieme all’importanza di una
buona concettualizzazione, alle implicazioni dell’utilizzo di diverse tecniche di indagine, ecc., ed ignora, quel che più conta, la definizione di tutto ciò in tempi e costi. Quasi sempre tale bisogno conoscitivo è poi legato ad ipotesi d’intervento (o meglio: il committente ha spesso in mente un orizzonte di questo tipo), ma intervenire vuol dire cambiare, e questo è un processo delicato che
rinvia ad uno specifico altro ambito problematico.
L’intervento del ricercatore è qui fondamentale: il confronto col
committente deve essere giostrato tenendo presenti scopi (solitamente non chiariti una volta per tutte ma aggiustati e precisati in
itinere) e gestione complessiva da implementare. Il committente
potrà disporre delle risorse economiche necessarie per realizzare
ciò che sta chiedendo? Ha tempo per aspettarne la realizzazione? È
veramente ciò che gli serve? Si rende conto che per realizzare tali
33
obiettivi cognitivi si dovranno coinvolgere persone, ruoli, istituzioni, e che ciò produrrà effetti secondari precisi? Il ricercatore deve aiutare il committente a definire l’oggetto della richiesta chiarendone gli scopi, e tenendo ben presente l’ineludibilità dell’integrazione fra questi e le questioni amministrative (personale, budget), logistiche (situazione concreta del ‘campo’, tempi), istituzionali (eventuali vincoli normativi, diversi ruoli in gioco). Da osservare che, benché resi più complessi alla presenza di un committente esterno, questi problemi sono generali di ogni ricerca. La decisione finale è una decisione tecnica che spetta al ricercatore, ma
sarà una decisione piegata all’imposizione delle necessità e dei
vincoli. La ricerca proposta ed effettivamente realizzata non sarà
quindi mai la migliore possibile in assoluto (ammesso che si possa
ragionare in questi termini) ma la migliore mediazione fra obiettivi
cognitivi e vincoli determinati dalle risorse (risorse economiche, di
tempo, istituzionali, ecc.) e dalle condizioni ambientali. La gestione di questa complessa fase in cui il ricercatore determina questa
mediazione è uno degli aspetti fondamentali di quello che si è definito ‘management della ricerca’. Non va taciuta, come componente di questa mediazione, la resistenza che il ricercatore deve
operare, ahinoi piuttosto spesso, sul tentativo del committente di
indirizzare il lavoro, di censurarne parti (Bezzi e altri 1989, 60); è
ovvio che la risposta del ricercatore non può essere semplicemente
una soluzione che “non infici oltre misura la correttezza scientifica
della ricerca” (Di Cara 1992, 29), bensì una soluzione che garantisca completamente tale correttezza.
Qui metodologia e management devono continuamente fare i conti
l’una con l’altro: entrambi convivono procedendo assieme ed assieme condizionandosi. Alcuni esempi banali: l’utilizzo di tecniche
matriciali dipende largamente dal budget; il campione infatti può
essere più o meno esteso a seconda delle possibilità economiche,
ma c’è ovviamente una comprimibilità limitata oltre la quale non
si può andare; l’utilizzo di tecniche sofisticate obbliga all’ingaggio
di intervistatori altamente qualificati, non sempre disponibili, da
addestrare con tirocinii a volte troppo lunghi; se il problema del
committente impone un ritorno veloce dei risultati occorrerà giocoforza ripiegare su un disegno molto semplice, semmai con un
questionario telefonico; e così via. E che dire poi delle ricerche che
si sviluppano in un ambiente incerto, dove le risorse non sono una
variabile sicura?
1.6.3 Gestione della ricerca
34
Gran parte delle questioni da trattare in questo paragrafo sono
strettamente legate al disegno della ricerca e lo determinano con
forza.
Il ricercatore, a questo punto, ha analizzato le problematiche del
committente, ed alla luce delle risorse, tempi, ecc., ha deciso un
determinato approccio, ha disegnato una ricerca. Ora i problemi
sono diversi: gestire il finanziamento, coordinare il gruppo di lavoro, risolvere i mille problemi che nascono durante il lavoro, ma
anche proseguire nel rapporto col committente. Quest’ultimo punto non deve essere trascurato. Può capitare che un committente,
dopo la discussione preliminare per definire gli obiettivi della ricerca, si disinteressi completamente di ciò che sta facendo il ricercatore; questo può creare non pochi problemi. È opportuno che il
ricercatore solleciti il committente a seguire le varie fasi del lavoro
organizzando periodiche riunioni del gruppo incaricato, redigendo
rapporti in progress, e così via. Naturalmente è altrettanto pericoloso il committente invadente che pretende di entrare nel merito di
scelte tecniche, ed è ovvio che in questo caso il ricercatore deve
opporre un netto rifiuto.
Non si può entrare nel merito dei diversi altri problemi di questa
fase, salvo menzionarli velocemente; nei casi di una direzione di
gruppo, che preveda varie figure professionali coordinate dal ricercatore, solo l’esperienza, in generale, ed una buona dose di umiltà,
riusciranno a rendere fruttuosa la reciproca collaborazione.
L’importante è che i ruoli siano ben definiti e si instauri un clima
di ascolto reciproco. I rapporti con gli intervistatori sono di più facile gestione (per via della relazione asimmetrica) ma di importanza cruciale per la buona riuscita del lavoro, mentre non bisogna
mai dimenticare che in ogni ricerca si instaura sempre un rapporto
anche con gli intervistati, che oltre che rispondenti sono persone,
soggetti con una propria coscienza e sensibilità di cui occorre avere il massimo rispetto; oltre ai problemi etici c’è comunque anche
qui un problema di management, nel senso che occorre a volte
prevedere una linea telefonica per le verifiche che l’intervistato
può voler fare, oppure prevedere lettere di presentazione, o altro.
1.6.4 Promozione del lavoro
Problemi finali che hanno comunque una rilevanza e un costo.
Qualunque sia lo scopo originario del lavoro, il ricercatore non lo
termina concludendo il rapporto di ricerca. La promozione del lavoro, concordata col committente in relazione agli obiettivi inizia-
35
li, è parte integrante dei problemi di management della ricerca, ed
è quindi responsabilità del sociologo ricercatore.
In questo ambito problematico va sottolineata, in particolare, la
necessità di assicurarsi che il committente abbia compreso ciò che
si è fatto, il ritorno dei risultati alla comunità scientifica ed ai soggetti messi al centro della ricerca, il controllo di qualità e la verifica degli effetti (specie nella ricerca valutativa), la valutazione della
rispondenza del prodotto agli scopi.
Ma la promozione della ricerca non è solo un problema del doporicerca. Il responsabile deve essere consapevole del suo ruolo
promozionale, a sostegno del lavoro e del gruppo, mentre la ricerca è in corso; il committente manterrà l’interesse iniziale per tutta
la durata di un lavoro che dura mesi, o anni? Gli effetti non voluti
della ricerca, o gli imprevisti, hanno ripercussioni negative per il
committente, o per i fruitori? Ciò che il ricercatore sta scoprendo e
giudica importante, è da segnalare al committente (ed in che modo) anche se non inizialmente previsto? Insomma il ricercatore deve essere il promoter della sua ricerca, e controllare tutti gli aspetti
‘politici’ ed amministrativi che investono il suo prodotto.
1.7 PROBLEMI COMUNI A TUTTI I TIPI DI INCHIESTA
1.7.1 Problemi etici
È doveroso iniziare con delle avvertenze sul piano dell’etica del
ricercatore.
L’etica non è un problema tecnico. Non ci può essere un manuale
di etica della ricerca. I richiami etici sono opinabili, frutto di esperienze e valori personali, ed anche i codici deontologici sono, solitamente, molto generali nelle indicazioni.
In questo testo possiamo comunque segnalare l’esistenza di un
problema di etica; dipenderà poi dalle varie sensibilità rispondervi.
Probabilmente vi sono problemi in qualche modo definibili ‘etici’
rispetto a tre fronti: i soggetti coinvolti nell’inchiesta; i committenti; la comunità scientifica.
Le responsabilità nei confronti dei soggetti coinvolti sono enormi.
A loro sottraiamo tempo e disponibilità, ma soprattutto brandelli di
valori, opinioni, personalità (vedi anche quanto scrive Montesperelli 1990, 12-13). Una volta che una persona ha deciso di accettare un’intervista, si trova a subire un rapporto oggettivamente sbilanciato (l’intervistatore fa le domande, l’intervistato risponde), e
quindi penalizzante. Anche se le domande non sono imbarazzanti
36
sono pur sempre intrusive, e raccolte da persone non note per scopi
mai ben compresi.
Occorre avere quindi un grande rispetto per gli intervistati, e i rilevatori devono essere addestrati a ben spiegare scopi e ragioni
dell’indagine con garbo e cortesia.
In qualche modo il ricercatore deve sentirsi in dovere di compensare il disagio che crea con un ritorno verso gli stessi soggetti che
ha intervistato (p. es. curando una diffusione dei risultati), o più in
generale verso la comunità che li ha espressi. Questo può essere un
forte orientamento per giudicare, p. es., della rilevanza di una ricerca anche se il ricercatore deve essere attento a mantenere un
equilibrio fra tensione positiva verso i soggetti indagati, partecipazione ai loro problemi, ecc., e ‘distacco scientifico’ necessario per
contenere le distorsioni dovute a ideologismi.
Su questi temi si può citare una delle poche autrici che ha sollevato il problema relativamente all’intervista strutturata, Maria Pitrone:
l’intervista strutturata pone, ancora più delle altre forme, problemi
di natura etica: sottrarre tempo all’intervistato, costringendolo ad accettare le restrittive ‘regole linguistiche’ poste da un questionario, per
di più per estrargli ‘opinioni’ su temi e problemi che egli può non conoscere, e che - soprattutto - non suscitano necessariamente il suo interesse, è una forma di violenza che produce, fra l’altro, effetti non desiderati sulla sincerità e accuratezza delle sue risposte (1986, 37)
Sulla ‘violenza’ di questo strumento scrive Edgar Morin:
Oggi sarebbe forse necessario uno studio sul questionario, considerato come strumento di repressione e di potere all’interno della società dei sociologi(1985a)
Può stupire questa enfasi sull’oppressività di uno strumento di indagine, ma ci si riferisce qui all’oppressività del far dire, per stabilire poi che in quel detto finisce tutta la realtà; così, per Roland
Barthes, il linguaggio: “come performance di ogni linguaggio, la
lingua non è né reazionaria né progressista; essa è semplicemente
fascista; il fascismo, infatti, non è impedire di dire, ma obbligare a
dire” (Barthes 1981, 9).
A ciò si aggiunga il fatto che, molto spesso, la ricerca è uno strumento per dare voce ai ‘senza voce’, ai soggetti passivi delle scelte
pubbliche o delle teorizzazioni degli intellettuali. Oltre alla violenza insita potenzialmente in ogni operazione conoscitiva che, come
il questionario strutturato, ‘mette in bocca’ le risposte
37
all’intervistato, va quindi considerata la violenza ancor più grave
di chi registra in modo distorto le posizioni di soggetti che, terminata l’intervista, non avranno più alcun modo di controllarne
l’attendibilità.
Ma anche il committente ha dei diritti, e piuttosto che un’etica del
ricercatore qui si deve segnalare un’etica del professionista, che sa
farsi carico dei problemi del committente, li sa interpretare, sa realizzare un prodotto idoneo e sa gestirlo nei termini di tempo e spesa prefissati. A mezza via fra soggetti sociali intervistati e committente c’è poi il grandissimo problema dell’utilizzo del lavoro da
parte del finanziatore della ricerca, utilizzo che potrebbe a volte
danneggiare la categoria rispetto alla quale si è realizzata la ricerca
(Hyman 1967, 95-110). Si sono già viste precedentemente alcune
implicazioni di questo problema; qui si può ancora ricordare che
oltre ai grossolani e facilmente visibili meccanismi coi quali i
committenti - raramente, per la verità - cercano di intervenire, ve
ne sono di più sottili e meno appariscenti che pongono il ricercatore di fronte a scelte e responsabilità, e questo accade in particolare
nelle ricerche, spesso frequentate dai sociologi, relative alle politiche sociali, laddove i committenti, che controllano effettivamente
il finanziamento, sono politici locali legati ai soggetti posti al centro della ricerca come dell’intervento:
è evidente infatti che la necessità di considerevoli mezzi finanziari
che una ricerca sociale comporta, e il suo inserimento nei programmi
di istituzioni e organizzazioni pubbliche o private, tende a legare, e
talvolta a subordinare, l’impegno scientifico e professionale del ricercatore a finalità politiche o ideologiche o economiche non sempre corrispondenti a quelle che egli si pone nel realizzare la ricerca o ancor
più alle aspettative dei soggetti sociali che ne divengono l’oggetto. Vi
è quindi un oggettivo e variabile aspetto di ambiguità nel rapporto fra
operatore e committente della ricerca sociale (Carbonaro - Ceccatelli
Gurrieri - Venturi 1992, 123)
Infine la comunità scientifica. La ricerca è un momento strategico
della disciplina scientifica di riferimento, ed anche il sociologo ha
dei doveri rispetto alla tradizione scientifica sociologica, i suoi paradigmi, la problematizzazione delle sue tecniche (Armillei - Bezzi
1992). Il ricercatore inesperto, non aggiornato, che propone ricerche abborracciate, oltre alle conseguenze pratiche delle sua incompetenza vìola, in qualche modo, un’etica della ricerca, tradisce la
collettività dei ricercatori, ed infine produce anche danni concreti
inquinando il campo con perdite di tempo e pazienza da parte di
38
interlocutori che si mostreranno meno disponibili la prossima volta.
1.7.2 L’‘effetto ricercatore’
Certi sociologi, cercando di adattare la sociologia alla presunta
maggiore ‘scientificità’ delle scienze sperimentali, non sospettavano che proprio da queste ritornassero boomerang che avrebbero incrinato i concetti di sperimentalità, standard, e così via.
Per esempio, dalla fisica dei quanti arriva il principio di indeterminazione di Heisenberg, e dall’economia (scienza sociale con diffuse pretese di ‘oggettività’) il cosiddetto ‘effetto Hawthorne’.
Il principio di indeterminazione di Heisenberg
mostra che ogni osservazione di un fenomeno è collegata a una inevitabile perturbazione di esso e che non è possibile misurare contemporaneamente tutte le diverse dimensioni di uno stesso fenomeno:
non posso ad esempio cogliere al tempo stesse la posizione e la velocità di una particella di energia, perché se ne voglio cogliere la posizione debbo investire la particella di raggi che la mettano in evidenza, ma
così facendo ne modifico la velocità e la traiettoria. [...] comunque si
voglia interpretare il valore filosofico del principio di Heisenberg, esso resta una delle dimostrazioni più importanti del carattere riduttivo e
selettivo dei nostri procedimenti di conoscenza (Crespi 1985, 73)
Ciò accade anche nell’osservazione del comportamento umano,
qualunque siano le attenzioni poste dal ricercatore (Phillips 1972,
147; Palumbo 1991, 78-80), e quindi, in qualche modo, il rapporto
fra osservatore (ricercatore, intervistatore) e realtà osservata (intervistato, nel nostro caso) è un rapporto dinamico, che produce
delle reciproche trasformazioni. Nell’atto di intervistare si modifica anche l’intervistato.
L’effetto Hawthorne prende nome dalla sede della Western Electric Company dove Elton Mayo, dal 1927, compì i suoi celebri esperimenti per determinare le influenze ambientali sulla produttività.
In precedenti esperimenti si notò che in tutti i gruppi di studio, indipendentemente dal tipo di illuminazione fornito, la produttività
aumentava; evidentemente l’essere oggetto di esperimento faceva
scattare meccanismi di maggiore responsabilizzazione, interesse,
ecc., azzerando così l’effetto dello stimolo. In seguito Mayo ed altri ricercatori, sulla base di esperimenti più attenti, arrivarono ad
identificare gli elementi sociologici del lavoro che potevano fornire indicazioni all’impresa in merito alla produttività (Madge 1972,
39
221-283) ma ‘effetto Hawthorne’ è rimasto ad indicare l’effetto
perturbante che il ricercatore determina su soggetti consapevoli di
essere osservati; è facile pensare che, in maniera analoga, tale effetto si riproduca anche nel rapporto di intervista.
L’effetto ricercatore (o effetto rilevatore) non è evitabile e neppure
stimabile, e bisogna avere una consapevolezza di massima della
sua presenza e dei suoi effetti; p. es.
chiedendo ad un intervistato di indicare la propria posizione politica barrando una casella all’interno di un segmento ‘destra-sinistra’
diviso in dieci caselle, probabilmente lo si può indurre ad effettuare
un’operazione del genere per la prima volta in vita sua, e non è possibile quindi controllare se e quanto risulti distorta l’informazione (Palumbo 1991, 79)
1.7.3 La profezia che si autoadempie
R. K. Merton sottolinea un altro caso di interferenza sull’oggetto
di ricerca, nel quale la formulazione di ipotesi contribuisce alla loro realizzazione: lo chiama ‘teorema di Thomas’ o della ‘profezia
che si autoadempie’; vale a dire che, messe al centro del disegno di
una ricerca determinate proposte forti, orientate in genere da pregiudizi, la realizzazione del lavoro e la divulgazione dei risultati
contribuiscono a realizzarne l’inveramento (Merton 1966, 577).
Un esempio della profezia che si autoadempie ce lo fornisce Guala:
l’esempio classico è quello dell’inferiorità dei negri rispetto ai
bianchi: se assumiamo come valida tale ipotesi, e se ne deduciamo le
conseguenze necessarie, dobbiamo giungere ad affermare che è inutile
incrementare gli investimenti a favore delle popolazioni di colore, è
preferibile razionalizzare i ghetti piuttosto che favorire l’integrazione,
è preferibile indirizzare le minoranze etniche verso attività lavorative
subordinate, ecc.; in tal modo la popolazione di colore diventerà/resterà effettivamente ‘inferiore’ alla popolazione bianca, salvo eccezioni (1991, 37-38)
Un altro esempio potrebbe essere dato dalle forzate pianificazioni
socialista e liberale, influenzate dal mito del progresso, che hanno
forzosamente sradicato, p. es., comunità rurali considerate arcaiche
e ‘naturalmente’ destinate ad estinguersi (Ceri e altri 1994, 14-15).
40
2 CONCETTI,
VARIABILI
,
MISURAZIONE
2.1 CONCETTI E DEFINIZIONI OPERATIVE
Quale che sia la strategia adottata, il primo problema che si pone al
ricercatore è quello di identificare le proprietà dell’oggetto della
ricerca rilevanti, al fine di fornirne una descrizione, ovvero di individuare delle relazioni tra di esse. Come osserva Lazarsfeld
(1969, I, 43) “anche la scelta delle proprietà strategiche costituisce
un problema essenziale”.
Molti manuali (ad es., Guidicini 1993; Guala 1991) sottolineano
infatti la difficoltà di passare dalle prime formulazioni del tema
della ricerca a proposizioni sempre più precise, che consentano di
ottenere un conforto empirico alle proprie ipotesi o, più semplicemente, una descrizione convincente della realtà sociale affrontata.
Sappiamo inoltre che, quantomeno nella strategia sperimentale e in
quella matriciale, la ricerca deve consentire la rilevazione di variabili, attraverso le quali poter attingere ad una conoscenza più approfondita di quella iniziale.
Il percorso che conduce alla costruzione delle variabili passa necessariamente per la definizione dei concetti. Secondo taluni autori, anzi, le variabili altro non sono che la definizione operativa dei
concetti, o per lo meno il mezzo per poterli misurare (ad es., Marradi 1987a). Prima di parlare di variabili è bene quindi chiarire cosa siano i concetti. Essi costituiscono un modo di rappresentare la
realtà, ovvero di raffigurare una classe di oggetti o fenomeni.
In verità costituiscono un modo di ‘costruirla’, dal momento che
non si può pensare ad alcuna ‘realtà’ senza utilizzare delle categorie mentali che la definiscano: il motivo per cui la ‘realtà’, inclusa
quella sociale, ci appare preesistente è ben evidenziato dagli studiosi della sociologia della conoscenza (cfr. ad es. Berger - Luckmann 1969).
Le definizioni di concetto proposte dai sociologi e dai metodologi
sono varie; ad esempio Goode e Hatt (1969, 67) li definiscono come “costrutti logici tratti da impressioni sensoriali, da percezioni, o
anche da esperienze abbastanza complesse”, premurandosi di aggiungere che essi hanno un senso soltanto entro un dato quadro di
riferimento, un dato sistema teorico.
In termini analoghi si esprime anche Marradi (1987a, 9), secondo
il quale “il concetto è un ‘ritaglio’ operato in un flusso di esperien-
41
ze infinito in estensione e in profondità, e infinitamente mutevole”.
Rinviando a quest’ultimo autore per una documentata trattazione
dell’argomento, preme in questa sede sottolineare alcuni punti.
In primo luogo, i concetti rappresentano un’astrazione della realtà
che consente di indicare e di attribuire un nome a un gruppo di oggetti o fenomeni. È evidente che esiste un nesso assai stretto fra il
linguaggio e il concetto, dal momento che il linguaggio stesso rappresenta una forma espressiva che consente di riferirsi a oggetti o
fenomeni anche in loro assenza (cfr. Marradi 1994).
I concetti rappresentano una forma di classificazione della realtà,
realizzata attraverso un’astrazione dal ‘qui’ e ‘adesso’, che consente di raggruppare fatti od oggetti prescindendo dalla loro individualità e unicità sostanziale. La produzione di concetti costituisce
un pre-requisito indispensabile per lo sviluppo del pensiero astratto
e del linguaggio, in quanto affranca per l’appunto l’uomo dalla limitazione espressiva al ‘qui’ e ‘adesso’, fornendogli la capacità di
simbolizzare-rappresentare il mondo.
Ancora una volta emerge tuttavia la differenza esistente fra scienze
della natura e scienze umane. Nelle prime, infatti, non si ha una
retroazione tra il soggetto che definisce un concetto e l’oggetto
dello stesso. Il fisico che definisce e usa il concetto di massa o di
inerzia, e che lo applica ad uno o più corpi inanimati, si trova in
una situazione diversa da un sociologo che si avvale di concetti
come classe, gruppo, organizzazione. Mentre nel primo caso lo
studioso costruisce o utilizza categorie mentali sulla base di percezioni sensoriali da lui strutturate in modo autonomo (sia pure secondo i canoni considerati legittimi da una comunità scientifica),
nel secondo egli organizza in schemi cognitivi scientifici una realtà
sociale che è già in qualche misura elaborata dagli ‘oggetti’ della
sua ricerca. La classe sociale, il gruppo, l’organizzazione, sono
concetti usati dal sociologo solo grazie al fatto che molti uomini
agiscono in termini di classe, gruppo, organizzazione e definiscono
se stessi e gli altri in rapporto a questi concetti.
Naturalmente possono esistere, al limite, tante definizioni e tanti
concetti di classe, gruppo, organizzazione, quanti sono gli uomini
che hanno raggiunto l’età della ragione. Di norma, peraltro, solo
una minoranza è in grado di definire in modo compiuto cosa intenda con questi concetti, e un numero ancora minore è in grado di
‘imporre’ agli altri la propria definizione, mentre una quota ben
più consistente di individui si comporta secondo logiche di classe,
di gruppo, di organizzazione.
Lo scienziato sociale si trova dunque dinanzi ad un duplice problema interpretativo, che non riguarda chi si occupa di scienze fi-
42
siche. Innanzi tutto, deve fare i conti con un mondo sociale in cui
(quasi) tutti i soggetti posseggono una ‘competenza pratica’, che
orienta l’agire quotidiano degli individui, ma solo alcuni posseggono una (adeguata) ‘competenza simbolica’ ossia la padronanza
delle operazioni di costruzione di categorie astratte e di comunicazione di queste attraverso il linguaggio.
Rileva anzi Giddens, a questo proposito, che uno degli scopi principali della sociologia è
l’elaborazione di strumenti concettuali per l’analisi di ciò che gli
attori sanno sul perché agiscono come agiscono, soprattutto quando
non sanno (discorsivamente) di saperlo o quando attori situati in un
contesto diverso mancano di tale consapevolezza (1990, XVII)
In secondo luogo, occorre considerare che le difficoltà nel lavoro
del sociologo non derivano solo dalla difforme capacità degli attori
sociali di tradurre la propria competenza pratica in forma simbolica, ma anche dal fatto che quest’ultima non viene espressa necessariamente in termini univoci e non ambigui.
D’altro canto, proprio le difformità riscontrabili sia a livello della
competenza pratica, sia della sua espressione simbolica, rendono
ragione del fatto che in sociologia esistano molti concetti diversi di
classe, gruppo, organizzazione, al contrario di quanto accade nelle
scienze naturali.
Ma queste difformità fanno anche sì che la trasposizione della
‘competenza pratica’, in schemi di classificazione scientifici non
sia un’operazione né automatica né neutrale. Da un lato, infatti,
esistono differenti livelli di capacità di esprimere con il linguaggio
i termini in cui tale ‘competenza pratica’ orienta le proprie scelte;
ed è intuitivo, oltreché facilmente dimostrabile sul piano della ricerca empirica, che tali capacità sono proporzionali al livello di
istruzione dei soggetti, e variano in ragione della loro posizione
sociale. D’altro lato, la scienza sociale ha a che fare spesso con interessi contrastanti, che vengono perseguiti anche attraverso la lotta per l’ufficializzazione di determinate forme e di specifici criteri
di definizione e classificazione. Poiché infatti le rappresentazioni
sociali della realtà orientano l’agire quotidiano, la loro definizione
non costituisce un problema tecnico, ma un fatto politico. Fenomeno questo tanto più evidente, come osserva Bourdieu
quando il termine precede la cosa, e quando l’usurpazione
dell’identità nominale fa precipitare la costituzione dell’identità reale
(1983, 474)
43
Come osserva sempre Bourdieu
i soggetti sociali classificati dal sociologo sono, non solo produttori di attività classificabili, ma anche di attività di classificazione, che
vengono a loro volta anch’esse classificate (Ivi, 456)
Tutto questo conferisce particolari responsabilità allo scienziato
sociale, che non è solo ‘nel mondo’, ma anche ‘del mondo’, ossia è
anch’esso parte in causa e non semplice osservatore esterno. Ogniqualvolta la sua pretesa neutralità lo induce a ritenere di classificare delle attività, egli di fatto, ne sia consapevole o meno, finisce
per schierarsi a favore di una forma di classificazione specifica, a
discapito di altre (potenzialmente presenti nella ‘coscienza pratica’), e fornisce a quella adottata il crisma della scientificità.
Come osserva Fleck
un’asserzione, una volta resa pubblica, appartiene in ogni caso alle
forze sociali, che formano concetti e creano modi di pensare; essa stabilisce, insieme a tutte le altre asserzioni, ciò che ‘non si può pensare
diversamente’. (...) Essa diventa una realtà in sé evidente, che in seguito condiziona dal canto suo nuovi atti di conoscenza ... (1983, 96)
Sotto questo profilo la posizione dello scienziato sociale è assai
più difficile di quella dello studioso delle scienze della natura. A
differenza di quest’ultimo, infatti, sia che legittimi la visione del
mondo espressa dagli attori sociali studiati, fornendo ad essa una
sorta di crisma di ufficialità, sia che sviluppi una critica verso le
credenze degli agenti (fondata sulla conoscenza di effetti non previsti o di condizioni non conosciute delle azioni sociali), finirà
comunque per modificare il loro comportamento, perché le conoscenze degli agenti sulle condizioni dell’azione sono causalmente
rilevanti per essa (cfr. Giddens 1990, 334 e sgg.).
Questo aspetto è molto importante nelle ricerche condotte con
l’uso del questionario, dal momento che questo presuppone una
coincidenza tra schemi concettuali dell’intervistato e
dell’intervistatore della quale occorre invece assicurarsi caso per
caso (cfr. Palumbo 1992; Razzi 1992).
Quanto siamo venuti fin qui affermando consente di sottolineare
alcune implicazioni rilevanti sul piano della ricerca:
• i concetti sono comunque riferiti ad una comunità spaziotemporalmente delimitata, al di là dell’evidente possibilità di
44
operare equiparazioni fra concetti simili usati da comunità diverse (ma chi decide quanto siano davvero simili?);
• i concetti non possono essere considerati ‘astrazioni universali’, e sono quindi almeno in parte il frutto di una negoziazione
intersoggettiva che rappresenta uno degli aspetti del continuo
processo di riproduzione sociale; in altre parole, sono continuamente ridefiniti dagli attori sociali, anche se questi tendono
a comportarsi come se il loro significato fosse scontato e ben
definito (o definibile) una volta per tutte;
• i concetti usati dallo scienziato sono in larga misura mutuati
dalla cultura di cui egli è partecipe; sono insomma patrimonio,
almeno in parte, sia dell’uomo della strada sia della comunità
scientifica. Una considerazione particolarmente rilevante per le
scienze sociali, che occupandosi di un mondo pre-interpretato
dagli oggetti del loro studio vi trovano anche modelli più o
meno consolidati di strutturazione delle percezioni in concetti.
Come osserva Marradi (1987a), i concetti possono essere ordinati
secondo una scala di astrazione: se il concetto rappresenta comunque un’astrazione dal ‘qui e adesso’, questa è graduabile in
una pluralità di livelli, che consentono l’inclusione di quantità crescenti di fenomeni in un concetto.
Il passaggio da ‘tavolo in metallo rosso’ a ‘tavolo rosso’ a ‘tavolo’
fa aumentare il numero dei referenti concreti del concetto (i tavoli
rossi comprendono anche i tavoli in legno; i tavoli comprendono
anche i tavoli verdi, gialli, neri, ecc.) e quindi la sua astrazione o
distanza dal ‘qui e adesso’.
Naturalmente la scala di astrazione è potenzialmente infinita. Non
solo infatti dai ‘tavoli’ si può passare ai ‘manufatti’ e così via;
vanno considerati anche i ‘salti di livello’ concettuali (cfr. Marradi
1987a). Ad esempio, la partecipazione elettorale comprende una
quantità di azioni (recarsi al seggio, prendere le schede, esprimere
una preferenza, etc.), a loro volta scomponibili in altre innumerevoli azioni elementari (per recarsi al seggio occorre svegliarsi, vestirsi, camminare, ecc.) che ‘hanno un senso’ in quanto riconducibili al concetto di partecipazione elettorale. Tuttavia tali azioni sono concettualizzabili anche ad altri livelli: uno, più astratto, può
essere quello di ‘assolvimento di doveri civici’, che comprende
anche altri comportamenti oltre a quello elettorale; un altro, meno
astratto, può essere ricondotto al concetto di ‘normali comportamenti quotidiani’ (svegliarsi e vestirsi, ad esempio). Ma nessuna
delle azioni elementari citate (ad esempio, camminare, che peraltro
è a sua volta scomponibile in azioni ancor più elementari) implica
45
un riferimento necessario alla partecipazione elettorale: si cammina anche per andare a lavorare o a fare la spesa.
Inoltre, come osserva Statera (1990), benché i concetti usati in sociologia si pongano talvolta come ‘costrutti di secondo livello’ rispetto a quelli di senso comune, è bene che non risultino incompatibili con questi ultimi.
Naturalmente, il fatto che molti autori definiscano diversamente lo
stesso concetto, o meglio usino lo stesso termine per indicare concetti (almeno in parte) diversi, rappresenta uno dei molti ostacoli
alla cumulatività della conoscenza sociologica (cfr. Goode - Hatt
1969, 70-77; Marradi 1987b)
La pluralità di definizioni riconosciute come legittime dalla sociologia per gli stessi termini rinvia sovente ad una sottostante pluralità di concetti: come rileva Marradi (1994, 144, corsivo nel testo),
“il concetto non ha, ma è - visto dal termine - un significato”. Pertanto, nella fase preliminare di una ricerca sociale è spesso necessario procedere ad una precisazione attenta dei termini/concetti che
verranno impiegati, al punto che talvolta si parla di vera e propria
‘riconcettualizzazione’: un’operazione che può anche apparire superflua al profano, ma che spesso è essenziale per una corretta comunicazione a livello scientifico.
Resta da sottolineare che il concetto è un elemento del discorso
scientifico che non è né vero né falso, a differenza delle proposizioni costruite con il suo concorso. La selezione dei concetti da
impiegare nella ricerca sociale risponde pertanto a criteri di utilità
e/o di appropriatezza, non di verità.
È quindi in questi termini che va condotta la chiarificazione concettuale nella fase di impostazione della ricerca. Essa è richiesta in
tutti i casi in cui è legittimo ritenere che non sussista un consenso
unanime attorno alla definizione di un concetto. La chiarificazione
concettuale avverrà in modi diversi a seconda che ci si trovi in uno
dei tre casi seguenti.
Il primo è costituito dalla creazione di un concetto ‘ad hoc’ da parte del ricercatore: basti citare il concetto di anomia, proposto per la
prima volta da Durkheim ne La divisione del lavoro sociale
(1893). In questo caso lo studioso deve ovviamente enunciare nel
modo più chiaro possibile quali fenomeni, o categorie di fenomeni,
sono referenti del concetto proposto (la cosiddetta estensione del
concetto), nonché quali aspetti di tali fenomeni sono rilevanti per il
concetto stesso (l’intensione del concetto).
Il secondo riguarda le ricerche che impiegano concetti di uso comune, ma dai confini non definiti. Ad esempio, quando si parla di
46
giovani occorre chiarire a quale fascia d’età si fa riferimento, e
possibilmente spiegare le ragioni di questa scelta.
Il terzo caso, infine, concerne le ricerche che operano dei rinvii a
concetti definiti in modo diverso nella letteratura sociologica, come classe, ceto, etc. In questa circostanza è necessario esplicitare a
quale filone interpretativo si intenda richiamarsi, e precisare quali
conseguenze operative vengono tratte da tale richiamo. In altre parole, non è sufficiente affermare che si userà il termine/concetto di
classe nella sua accezione marxiana, ma occorrerà aggiungere quali aspetti e fenomeni saranno per conseguenza posti sotto osservazione.
2.2 DAI CONCETTI ALLE VARIABILI: L’OPERATIVIZZAZIONE
La variabile costituisce, come si è anticipato, la versione ‘misurabile’ del concetto, necessaria per passare da una formulazione generale di un’ipotesi ad una controllabile empiricamente. Sia il concetto che l’ipotesi di cui fa parte scendono così dalla scala di astrazione, fino a giungere alla misurabilità.
L’ipotesi operativa sarà infatti costituita da una proposizione che
contiene una o più variabili. Queste ultime potranno a loro volta
essere ulteriormente specificate, come si è detto, in modo che
giungano a riferirsi a proprietà rilevabili degli oggetti (e stati rilevabili di una proprietà) la cui distribuzione possa essere colta da
una variabile. Si parla in questo caso di operativizzazione di una
variabile (o di ‘variabile operativa’). Una buona definizione è proposta da Nagel (1968, 101), secondo il quale con ‘definizioni operative’ si intendono “i modi secondo cui sono in relazione le nozioni teoriche e le procedure osservative”, mentre Blalock jr.
(1969, 23) afferma che una definizione operativa “è una definizione che indica esattamente i procedimenti usati per la misurazione”.
La scelta delle variabili è determinata dal concetto che si intende
rilevare, e a loro volta gli strumenti di rilevazione sono determinati
dalle variabili. In effetti da più parti è stata messa in discussione
l’univocità dei vincoli che costituiscono i diversi passaggi (ad es.,
Marradi 1987a). Inoltre, Statera (1990) ha osservato che sarebbe
erroneo far derivare le definizioni operative da un percorso quasi
automatico di discesa lungo una scala di astrazione. A suo giudizio, l’operativizzazione dei concetti e le scelte degli indicatori sono operazioni mediate e guidate dalla teoria. Pertanto la sequenza
teoria - proposizioni (che fanno uso di) - concetti - operativizza-
47
zioni - indicatori è tale solo in senso logico, essendo in realtà caratterizzate da retroazioni e interrelazioni consistenti.
È d’altro canto intuitivo che il passaggio da un’ipotesi generale ad
una operativa, necessariamente più specifica in ordine alle circostanze spazio-temporali che delimitano l’ambito di controllabilità
dell’ipotesi stessa, comporta una conseguente limitazione dei fatti
che possono essere prodotti a sostegno dell’ipotesi generale.
Il problema, che si pone ad ogni passaggio di livello nella scala di
astrazione, è particolarmente avvertito nella fase di definizione operativa delle variabili. È stato infatti sottolineato come, tutto
sommato, una variabile sia costituita esclusivamente dalle operazioni specifiche condotte per misurare i fenomeni cui si riferisce, e
non possa quindi essere impiegata in proposizioni che, attribuendole un significato più ampio, finirebbero per coinvolgere l’intero
costrutto teorico.
Questa posizione (iper-operazionismo), proposta per la prima volta
nel 1927dal fisico Bridgeman, appare da rigettare nella sua versione estrema, in quanto finisce per invalidare ogni forma di inferenza; essa invita tuttavia alla massima prudenza nel passare dai concetti alle definizioni operative delle variabili (cfr. Marradi 1987a).
Queste ultime sono peraltro condizionate dall’effettiva possibilità
di rilevazione dei dati, e dal grado di affinamento degli strumenti
di rilevazione.
Nell’ambito della ricerca sociale le variabili di maggior interesse
non sono quasi mai traducibili immediatamente in operazioni di
rilevazione diretta dei dati. La coscienza di classe, la partecipazione politica, il tipo e livello di socializzazione, non possono essere
rilevati allo stesso modo dell’età, del sesso, della statura.
Si usano quindi spesso degli indicatori, ossia variabili più specifiche in cui è possibile scomporre una più generale e che sono traducibili in procedure di misurazione.
Talvolta una variabile è riducibile ad un solo indicatore, sia pure al
prezzo di una minore estensione del concetto che si intende misurare: è il caso, ad esempio, del titolo di studio assunto come indicatore del livello d’istruzione di un soggetto. In questo caso, indicatore e definizione operativa coincidono.
Più frequentemente, tuttavia, gli indicatori sono più d’uno, in
quanto rappresentano, come osserva Lazarsfeld, gli aspetti osservabili delle diverse dimensioni o componenti dei concetti. Secondo
questo autore
poiché la relazione tra ogni indicatore e il concetto fondamentale è
definita in termini di probabilità e non di certezza, è indispensabile
48
utilizzare per quanto possibile un gran numero di indicatori (1969, 4445)
Gli indicatori sarebbero quindi selezionati, secondo Lazarsfeld,
con una procedura analoga alla costruzione del ‘tipo ideale’ di
Weber. Secondo altri (ad es., Cartocci 1984; Marradi 1985), invece, il rapporto di indicazione è di tipo semantico piuttosto che probabilistico, ha natura stipulativa e dipende dal contesto.
Le differenze tra le due concezioni non sono trascurabili, in quanto
incidono, ad esempio, sul controllo di validità (per un approfondimento, cfr. Cardano - Miceli 1991).
Va comunque ricordato che sono proponibili, di norma, molteplici
indicatori di una variabile e che, d’altro lato, un singolo indicatore
può essere utilizzato per misurare variabili diverse. Al limite, come
nota Marradi
a seconda del livello dell’unità di analisi, un concetto specifico
può essere fondatamente considerato indicatore di due concetti generali di contenuto semantico assai diverso e magari opposto (1987a, 35)
Il rapporto fra indicatore e concetto va quindi affrontato innanzi
tutto sul piano teorico, prima ancora che su quello operativo.
Un indicatore viene così definito valido quando il suo rapporto
con un concetto è caratterizzato da un’ampia sovrapposizione
(l’area di intersezione nella Tav. 4), che ovviamente non può essere oggetto di rilevazione empirica, ma solo dell’apprezzamento
teorico, comunque arbitrario, della comunità scientifica. Nella figura si nota ad esempio che l’indicatore n. 2 si sovrappone solo al
concetto A, mentre il n. 3 è condiviso dai concetti A e B. Mediante
l’indicatore n. 2 si misura dunque una parte del concetto A (insieme ad altri aspetti non rilevanti, indicati dallo spazio bianco); mediante il numero 3 si misura sia parte del concetto A che parte del
B (oltre agli aspetti non rilevanti simbolizzati dallo spazio bianco).
TAV. 4 - CONCETTI ED INDICATORI.
49
È bene precisare che diversi autori, pur riconoscendo che la validità di un indicatore va valutata innanzi tutto sul piano teorico (si
parla anche, in questi casi, di ‘convalida a vista’, ‘per contenuto’ o
‘logica’ - cfr. Bailey 1985, 85), ritengono se ne possa ricercare anche una prova empirica. Ci si riferisce in primo luogo alla ‘convalida mediante criterio’, che “implica il ricorso ad una misura diversa e accettata del concetto dato” (Phillips 1972, 281), valutando se
esistono relazioni significative tra la misurazione operata secondo
l’indicatore utilizzato e quella effettuata in base alla variabilecriterio. Si cita poi la ‘convalida per costruzione’, che consiste invece nel porre in relazione gli indicatori scelti con altre variabili,
che in base a precedenti ricerche sappiamo essere correlate con il
concetto che intendiamo misurare (cfr. Phillips 1972, 282-285;
Bailey 1985, 86-89).
Non sfuggirà comunque al lettore che in entrambi i casi viene
chiamato in causa il principio di intercambiabilità degli indici (Lazarsfeld 1969, I), secondo il quale anche indicatori poco correlati
tra di loro possono presentare elevate correlazioni con una terza
variabile. In altre parole, non c’è un legame necessario tra la validità mediante criterio e quella per costruzione (contra Bailey 1985,
88, che invece presenta i vari tipi di controllo della validità come
cumulativi, a partire dalla convalida a vista per finire con la convalida per costruzione). In aggiunta, come avverte correttamente
Phillips (1972), in tutti i casi si è di fronte ad una regressione
all’infinito: chi può infatti garantire la validità degli indicatori adottati come criterio o delle relazioni utilizzate nella convalida per
costruzione? Come si vede, in ultima analisi la risposta può essere
fornita solo sul piano teorico e non su quello empirico (cfr. per una
posizione più problematica Marradi 1994).
Un indicatore si definisce attendibile e affidabile quando l’esito
delle operazioni predisposte in sede di operativizzazione è positivo, ossia coglie effettivamente gli stati delle proprietà che il ricercatore si era prefisso di rilevare (cfr. Marradi 1987a; 1990).
Come nel caso della validità, anche sull’attendibilità esistono posizioni diverse. Da un lato abbiamo infatti autori che ritengono
l’attendibilità come una proprietà dello strumento; in particolare,
Phillips sottolinea che
uno strumento di misura è attendibile se, applicato allo stesso fenomeno, produce sempre gli stessi risultati (1972, 285)
50
Dall’altro lato altri, come Marradi, considerano l’attendibilità una
caratteristica del processo di misurazione; la sua valutazione in
questo caso mette in relazione l’esito della misurazione con lo stato effettivo del soggetto sulla proprietà che si intende misurare.
Proprio per rimarcare questa posizione Marradi propone di sostituire il termine attendibilità con quello di fedeltà, in quanto la pluralità dei significati assegnati ad attendibilità suggerisce l’utilizzo di
un termine più appropriato e meno ‘inflazionato’.
Avendo presente questa esigenza, vari autori concordano sulla necessità di produrre misurazioni con strumenti diversi per misurare
l’attendibilità correttamente (ad es., Bailey 1985). L’invito è condivisibile, ma occorre chiedersi quanto gli strumenti debbano essere diversi: l’attendibilità delle risposte ad un item del questionario
può essere valutata in riferimento ad un’altra, oppure ponendo la
stessa domanda in sede di intervista in profondità, avvalendosi di
test proiettivi, mediante tecniche osservative? A nostro avviso,
maggiore è la differenza tra gli strumenti utilizzati per valutare
l’attendibilità del primo, maggiore è la fiducia che possiamo assegnare a tale valutazione (per un caso empirico, cfr. Razzi 1992).
In riferimento specifico al questionario è già stato osservato che
il problema dell’attendibilità coinvolge quindi:
- l’osservatore (e include il problema della coerenza intersoggettiva e infrasoggettiva: quanto cioè lo stesso osservatore classifica nello
stesso modo stati uguali di soggetti diversi, e quanto diversi osservatori classificano nello stesso modo gli stessi stati dello stesso soggetto);
- il soggetto osservato (ed il problema della sua coerenza nel tempo, affermata da Goode e Hatt, messa in dubbio da molti altri);
- l’interazione tra i due, che può modificare gli schemi cognitivi
di entrambi, ed influire quindi sull’esito della rilevazione.
Le tre dimensioni sopra citate vanno considerate congiuntamente,
perché ‘nella ricerca empirica i processi di rilevazione e i processi di
formazione dei concetti interagiscono, che lo si voglia o no’ (Palumbo
1991, 126-127)
In breve, mentre la validità concerne le relazioni che corrono tra
un indicatore e la variabile indicata, l’attendibilità si riferisce alla
capacità dell’indicatore utilizzato di misurare realmente ciò che si
prefigge. Concerne quindi le relazioni tra lo strumento di misura e
la realtà misurata. Considerando congiuntamente i due aspetti, si
può affermare che la costruzione degli indicatori è una delle fasi
della ricerca in cui viene maggiormente messa alla prova la capacità di mediare tra le definizioni considerate ‘legittime’ dalla comunità scientifica e quelle proprie degli intervistati. È ovvio infatti
51
che nessuna indagine empirica sulla coscienza di classe potrà essere condotta senza tradurre in operazioni di ricerca (nel nostro caso,
in domande del questionario) questo concetto, a partire da una delle molte definizioni proposte dalla teoria sociologica (qui si pone il
problema della validità); le domande dovranno tuttavia risultare
anche comprensibili per gli intervistati e produrre risposte coerenti
con i loro orientamenti, atteggiamenti e comportamenti in argomento (in questo consiste il problema dell’attendibilità).
2.3 LA MISURAZIONE
Possiamo definire in prima istanza la misurazione come il processo di attribuzione alle proprietà degli oggetti o dei fenomeni osservati di valori corrispondenti a diversi stati di una variabile (o di un
indicatore). Questi stati, nell’impostazione costruttivista che adottiamo, non possono essere considerati preesistenti alla rilevazione,
che va quindi intesa come “un meccanismo che contribuisce a creare gli stati [degli oggetti su una certa proprietà] che registra”
(Marradi 1987a, 42).
Questo procedimento viene messo in atto quale che sia la proprietà
da rilevare, anche se non necessariamente in modo consapevole ed
esplicito. Quando infatti ci si trova in presenza di concetti definiti
in modo apparentemente inequivoco a livello di senso comune, è
facile che il ricercatore abbia la sensazione di rilevare ‘dati’ preesistenti, piuttosto che di effettuare vere e proprie operazioni complesse di misurazione. Cosa di più semplice e intuitivo da misurare, ad esempio, dell’età? Eppure, anche in questo caso, prima viene
definito il concetto di età, poi si costruisce la variabile corrispondente, quindi si determina come misurarla. Si procede a questo
punto alla ‘lettura’ di un aspetto fra i tanti degli individui oggetto
di indagine: il tempo trascorso dalla nascita secondo l’unità di misura stabilita, e infine si registra il risultato di tale lettura entro la
classificazione precostituita.
Marradi (1981; 1987a) osserva tuttavia che non è corretto utilizzare il concetto di misurazione per ogni operazione di rilevazione dei
dati. Infatti, la rilevazione può assumere tre modalità principali:
• l’enumerazione di oggetti (quanti alunni sono iscritti in una
classe)
• l’attribuzione di casi a categorie predefinite di una proprietà
(maschio/femmina)
52
• l’applicazione di un’unità di misura a proprietà distribuite secondo un continuum (ad es., la statura misurata con il metro lineare).
Solo nel terzo caso, in cui esiste un’unità di misura, sarebbe lecito
parlare di misurazione: nel primo solo di conteggio, nel secondo di
classificazione, o meglio di attribuzione dei casi a categorie.
Marradi aggiunge inoltre che ogni operazione di rilevazione è preceduta e seguita da un’operazione di classificazione. Preceduta, in
quanto occorre prima dividere in categorie l’estensione del concetto, essendo possibile solo successivamente registrare lo stato sulla
proprietà (già organizzata in categorie). Seguita, in quanto lo stato
o valore registrato o misurato va assegnato alla categoria predefinita.
Nell’esempio sopra accennato, per misurare l’età, operativizzata in
modo apparentemente ‘naturale’ in termini di ‘anni compiuti’, occorre organizzare in categorie (p.es., anni compiuti) la proprietà,
indi rilevare la differenza in anni tra la data di nascita dei singoli
soggetti e la data della rilevazione e riportare infine il risultato
dell’operazione su di una tabella. In apparenza, è stato appena descritto in modo tortuoso ed impreciso un semplice processo di
‘raccolta di dati’ (già esistenti), l’operativizzazione e la misurazione non hanno ‘creato’ nulla, hanno semplicemente ‘registrato’ una
serie di dati oggettivi. Invece non è così.
Innanzi tutto, l’uso dell’età biologica per operativizzare il concetto
di età rinvia ad un’operazione concettuale precedente (dal punto di
vista logico) a quella di misurazione (si potrebbe infatti considerare rilevante il tempo trascorso da un evento dato: per es., l’ingresso
nella pubertà; oppure l’età mentale). In secondo luogo, si assumono come unità di misura gli anni terrestri convenzionali (anche
questa è una scelta). In terzo luogo, si fa coincidere l’età ‘soggettiva’ con il trascorrere del tempo sulla terra, decidendo di considerare trascurabili gli effetti della relatività e di assumere quindi come
valido per tutti il tempo terrestre. Infine, si decide di non tener
conto dei giorni trascorsi dall’ultimo compleanno di ogni soggetto.
I dati così ottenuti vengono poi riattribuiti a categorie predefinite
(di solito, classi di età), andando a comporre la cosiddetta ‘matrice
dei dati’.
La misurazione, da semplice registrazione di un ‘dato oggettivo’ si
è cioè tradotta nell’operativizzazione di un concetto, nella sua
classificazione (divisione in classi sulla base degli obiettivi della
ricerca), nella definizione di un’unità di misura (gli anni compiuti),
nella ‘lettura’ in questa chiave delle età dei diversi soggetti (è que-
53
sta la misurazione in senso stretto), nell’attribuzione dei singoli
valori a classi pre-determinate.
La successione delle fasi è ovviamente più evidente nei casi in cui
la proprietà misurata non trovi corrispondenza puntuale in una
proprietà misurata in modo intersoggettivamente condiviso come
l’età. Qualora infatti intendessimo misurare il prestigio connesso
alle diverse occupazioni sarebbe ben più facilmente riconoscibile il
processo di costruzione dei dati attraverso la loro misurazione di
quanto non accada per l’età (cfr. de Lillo - Schizzerotto 1985).
Dal modo in cui viene operativizzato il concetto dipende fra l’altro
la scelta della unità di misura. In taluni casi questa è suggerita,
quasi imposta, dal tipo di proprietà che viene studiata: l’età si misura in termini di tempo trascorso dalla nascita, la statura con la
scala metrica, e così via. Ma basta pensare a concetti in apparenza
facilmente operativizzabili, come il livello di istruzione o il reddito, per rendersi conto che la scelta delle unità di misura dipende in
gran parte dagli obiettivi della ricerca. L’istruzione potrà infatti
essere misurata in termini di anni di studio compiuti (ma conteggeremo o no gli anni scolastici conclusi con una bocciatura?), di titolo di studio conseguito (ma ignoreremo in tal caso i curricula non
completati?), di livello di conoscenze acquisite (quantità di domande cui un intervistato è in grado di rispondere) a seconda che
intendiamo valutare la permanenza nel sistema scolastico, l’esito
di tale permanenza, la preparazione di un candidato all’esame. In
determinati casi sarà sufficiente distinguere fra alfabeti e analfabeti; in altri occorrerà specificare il tipo di diploma di laurea conseguito e, al limite, la sede universitaria di studio (come in effetti accade negli Stati Uniti o in Gran Bretagna).
Più precisamente, non sempre il modo corrente di rilevare una variabile può essere assunto come opportuno o peggio ‘scontato’
Tornando ai rapporti misurazione-classificazione, occorre aggiungere che quest’ultima deve possedere tre requisiti (da Marradi
1987a, 45; si veda anche più avanti al §. 4.2):
• esaustività (tutti i casi osservati debbono essere riconducibili
alla classificazione impiegata);
• esclusività reciproca (nessun caso può appartenere a due classi
diverse);
• unicità del criterio (l’attribuzione alle diverse categorie deve
avvenire in base a un solo criterio).
L’esperienza di ricerca insegna che l’adeguatezza di una classificazione è valutabile in base al numero di casi-limite che può presentare ed alla difficoltà di attribuirli all’una o all’altra classe. Ad
esempio una classificazione binaria ‘lavoratori manua-
54
li’/’lavoratori non manuali’, adottata in molti studi di mobilità sociale (cfr. Bendix - Lipset 1975), oltre a presentare evidenti difficoltà di soluzione di casi-limite, quali quella degli artigiani e dei
capi operai, risulta superata dalla diffusione delle nuove tecnologie, che rendono scarsamente discriminante tale fundamentum divisionis fra classe inferiore e classe media; una classificazione in
base al reddito da lavoro può ingenerare problemi perché non considera il reddito differito della liquidazione di fine rapporto, che
non spetta al lavoratore autonomo, e così via.
In termini generali, la rilevazione di una variabile dà luogo ad una
doppia successione di classi e di casi appartenenti ad esse che costituisce la variabile in senso statistico, come nell’esempio sotto
riportato:
{ x x ... x ... x
1
variabile x
2
i
n
n1 n2 ... ni ... nn
Dove x1, x2... xi... xn rappresentano le modalità che può assumere la
variabile (o le classi in cui viene suddivisa) e n1, n2... ni... nn il numero di casi che grazie alla rilevazione è stato possibile assegnare
alle modalità o classi 1, 2... i... n della variabile. Richiamando i tre
tipi di rilevazione descritti da Marradi (1987a), si può osservare
che, nel caso dell’enumerazione, le classi o modalità corrispondono agli oggetti da contare (pere, mele, banane in un cesto); nella
classificazione corrispondono a modalità predefinite dal ricercatore (gli stati che può assumere una proprietà); nella misurazione in
senso stretto le classi costituiscono degli accorpamenti delle misurazioni effettuate (nel caso di una proprietà continua, come il reddito, le classi ‘fino a 1 milione di lire’, ‘da 1 a 2 milioni di lire’,
comprendono tutti i casi rilevati con valore inferiore a 1 milione,
compreso fra 1 e 2, e così via).
Nella ricerca sociale si incontrano spesso rilevazioni del secondo
tipo, ottenute creando prima una serie di classi e attribuendo poi a
queste i casi osservati. Il modo in cui vengono costruite le classi è
importante perché influenza il tipo di elaborazioni statistiche cui
può essere sottoposta la variabile.
Si è soliti distinguere fra quattro modi diversi di costruire le classi,
che corrispondono a quattro tipi di scale di misurazione propoststi
da Stevens nel 1946 (trad. it. 1991):
• nominali (relazioni di = o ≠)
• ordinali ( relazioni di = o ≠; > o <)
• di intervalli (operatori = o ≠; > o <; + o -)
• di rapporti o cardinali (operatori = o ≠; > o <; + o -; x o ÷).
55
Come si può agevolmente notare, l’ordinamento tipologico proposto presenta la caratteristica della cumulatività: gli operatori applicabili alla scala successiva includono cioè anche quelli della precedente (potremmo dire che le scale sono strutturate secondo una
scala ordinale).
Ad esempio, la variabile sesso è di norma articolata nelle due classi ‘maschio’ e ‘femmina’: al di là della semplice assegnazione di
nomi alle proprietà degli oggetti e della descrizione di una relazione di uguaglianza o diversità non è possibile andare. Nel caso invece di una classificazione ordinata (ad esempio: “non amo la lettura/mi piace abbastanza leggere/la lettura è la mia attività preferita”) è possibile utilizzare, oltre alla relazione di uguaglianza o diversità, una gradazione sulla base del criterio di classificazione
(nell’esempio proposto, il gradimento per la lettura).
Esistono poi classificazioni espresse (o esprimibili) in valori numerici: la statura, il reddito e l’età, p. es., sono misurabili in classi.
In questi casi, oltre alle relazioni = o ≠, > o <, è possibile impiegare gli operatori + o -, ÷ o x. Più precisamente, alle scale in cui lo
‘zero’ teorico non coincide con quello della scala metrica adottata
(come accade per la misurazione delle temperature con scale che
non partano dallo zero assoluto) saranno applicabili solo gli operatori di somma e sottrazione (scale a intervalli); a quelle in cui lo
zero della scala di misurazione corrisponde al punto zero della distribuzione (reddito, età), si potranno applicare anche gli operatori
di moltiplicazione e divisione (scale di rapporti).
Non è cioè corretto affermare che una temperatura di 40° centigradi è doppia di una di 20°, perché lo zero della scala delle temperature in gradi centigradi non corrisponde allo zero assoluto, bensì
alla temperatura di scioglimento del ghiaccio. È invece corretto
affermare che un soggetto con reddito pari a 50 milioni l’anno ha
un reddito doppio di chi guadagna 25 milioni l’anno (anche se, in
verità, il significato sociologico del reddito andrebbe riferito alla
sua percezione sociale, ed è da dimostrare che questa si strutturi
secondo le stesse modalità della grandezza economica cui si riferisce). In entrambi i casi, è possibile attribuire un valore numerico
all’intervallo compreso tra due valori della scala (nell’esempio, la
differenza fra le due temperature è di 20°). La distinzione fra scale
a intervalli e scale di rapporti, tuttavia, non è universalmente accettata. Blalock jr., ad esempio, afferma che
la distanza tra scala a intervalli e scala di rapporti è puramente teorica, in quanto è molto difficile trovare una scala a intervalli che non
sia anche una scala di rapporti (1969, 32-33)
56
Da cosa dipende l’adozione di una scala? Innanzi tutto dal concetto-variabile in esame; in via subordinata, dall’unità di misura adottata. Si è detto ad esempio che la variabile ‘gradimento per la lettura’ può essere portata a una scala di rapporti se misurata in termini
di numero di libri o di pagine lette in una unità di tempo mentre è
misurata su una scala ordinale se si chiede una valutazione del
grado di amore per la lettura (ma in tal caso da una rilevazione di
atteggiamento, l’amore per la lettura, si passa ad una di comportamento, il numero di libri letti, che rinvia ad un concetto un poco
diverso: un soggetto può infatti non amare la lettura ma essere un
correttore di bozze e quindi dover leggere molti libri).
Senza procedere oltre con gli esempi, basti dire che, in forza del
criterio di cumulatività, ogni variabile espressa in una scala di ordine X può essere anche espressa nelle scale di ordine inferiore.
Per converso, le esigenze di elaborazione quantitativa dei dati rendono opportuno portare la classificazione al più elevato ordine
possibile (è quindi migliore, nel caso della lettura, sopra riportato,
la scala di rapporti rispetto a quella ordinale, a condizione che non
‘peggiori’ il rapporto di indicazione che lega il numero dei libri
letti, l’indicatore adottato, al gradimento per la lettura, il concetto
da rilevare).
Non è tuttavia lecito estendere impropriamente ad una variabile le
proprietà operazionali relative ad una scala di ordine superiore a
quella in cui è espressa la variabile stessa. Purtroppo gli esempi
contrari si sprecano, in sociologia, favoriti dalla codifica numerica
delle risposte a domande ‘qualitative’ (cioè espresse su scale ordinali o nominali), che invitano ad estendere le proprietà dei numeri
a nomi e aggettivi. È intuitivo che può avere un senso parlare di
‘statura media’ o di ‘reddito medio’, non certo di ‘sesso medio’ o
di ‘atteggiamento medio’ (la ‘media’ fra 10 casi di “non sono
d’accordo sulla politica statale attuale” e 10 casi di “sono totalmente d’accordo” non è evidentemente zero, ma eventualmente
una rissa!). Eppure, codificando con -1 il disaccordo e con +1 il
totale accordo, un’ingenua analisi ‘quantitativa’ fornirebbe per
l’appunto questo risultato.
Il successo ottenuto tra gli studiosi di scienze sociali della tipologia di scale di misurazione proposta da Stevens ha messo in ombra
diverse questioni degne di nota. Infatti, non tutti i metodologi concordano sull’utilità e validità di questa tipologia. Marradi giunge
ad affermare, a conclusione di una circostanziata analisi, che
57
le ‘scale ordinali’ in senso stretto non vengono praticamente mai
utilizzate nelle scienze sociali; le ‘scale cardinali’ scavalcano la fondamentale distinzione fra proprietà discrete e proprietà continue,
quindi fra misurazione e conteggio; peggio, le ‘scale a intervalli’ non
sono logicamente distinguibili dalle cardinali e le ‘scale nominali’ sono una contraddizione in termini (1987a, 47-48)
Egli aggiunge inoltre che
le differenze fra scale cardinali, a intervalli e ordinali si riducono
in fondo a un grado decrescente di sicurezza con cui conosciamo
l’effettiva ampiezza dei segmenti su un continuum (Ivi, 54)
Le argomentate posizioni di Marradi l’hanno portato a distinguere
fra tre tipi di scale, riconducibili alle tre diverse modalità di rilevazione sopra citate:
a) assolute, ottenute mediante conteggio
b) categoriali, ottenute assegnando gli stati sulle categorie (ordinate o meno) di una proprietà
c) metriche, ottenute dividendo la proprietà da rilevare per
un’unità di misura.
Solo nel caso sub c si potrebbe propriamente parlare di misurazione.
Come osservano Cardano e Miceli (1991), peraltro, Marradi si
preoccupa soprattutto delle concrete operazioni di costruzione del
dato: per questa ragione sottolinea la differenza tra conteggio,
classificazione e misurazione, mentre ritiene irrilevante, al pari di
Blalock jr., la differenza tra scale a intervalli e di rapporti. Le sue
osservazioni
incidono
comunque
anche
sulla
liceità
dell’operazione di assegnazione di etichette numeriche alle categorie, ordinate o meno, da cui discendono poi le ricorrenti forzature
cui si ricorre per applicare impropriamente a variabili categoriali
tecniche statistiche consentite solo per le variabili metriche.
Fin qui si potrebbe pensare che il confine principale passi tra le
scale non metriche e quelle metriche. Tuttavia Ricolfi, in un saggio
del 1985 (ripubblicato, come quello di Marradi, in Cardano - Miceli 1991), particolarmente attento ai problemi dell’analisi dei dati,
propone un diverso modo di superare la dicotomia tra scale a intervalli e di rapporti, nell’ambito della rappresentazione di caratteri
quantitativi.
Ricolfi distingue tra:
a) scale di quantità, ossia scale di rapporti (secondo la tipologia di
Stevens) che concernono grandezze trasferibili o redistribuibili
58
b) scale metriche, ovvero scale di rapporti che rappresentano
grandezze non trasferibili
c) scale di posizione, al cui interno gli stati sulla proprietà sono
interpretabili come posizioni in un sistema di riferimento convenzionale (privo dello zero assoluto).
Le caratteristiche cui Ricolfi assegna rilevanza sono dunque sia
l’esistenza di uno zero assoluto (inteso in senso ‘debole’, ossia
come condizione di assenza di una proprietà, non in senso ‘forte’,
come esistenza di un punto di origine della scala utilizzata), sia la
trasferibilità della proprietà misurata. Attribuisce invece minore
importanza alla distinzione operata da Marradi tra misurazione e
conteggio, osservando che le scale assolute (ottenute per conteggio)
sono per ora assai lontane dal possedere uno statuto metodologico
realmente autonomo, e proprio per questo tendono continuamente a
‘confluire’ nei livelli di scala immediatamente adiacenti (1985, 22223)
Dal punto di vista dell’analisi dei dati, la tripartizione di Ricolfi è
assai efficace e merita di essere attentamente considerata, soprattutto in una fase come l’attuale, in cui la diffusa disponibilità di
software statistici sofisticati non si accompagna ad un’altrettanto
diffusa conoscenza delle condizioni di applicabilità delle diverse
statistiche.
Osserva dunque Ricolfi (1985, 217)
La funzione dei tre livelli di scala è, più semplicemente, di escludere certi tipi di statistiche, il cui significato è incompatibile con la natura delle variabili su cui dovrebbero essere computate.
Se ordiniamo i livelli di scala dal più ‘permissivo’ al più vincolante otteniamo uno schema di questo tipo:
scale di quantità
= tutte le statistiche
scale metriche
= tutte le statistiche tranne gli indici
di concentrazione e gli indici di eterogeneità
scale di posizione
= solo le statistiche che non richiedono la positività della scala (media
e momenti centrali)
2.4 INDICATORI E INDICI
59
Il termine ‘indicatore’ viene usato oggi in una pluralità di accezioni, almeno in parte divergenti tra loro.
Una prima, di carattere più generale, assume un taglio prevalentemente descrittivo, in quanto un set di indicatori viene utilizzato per
fornire una rappresentazione sintetica di fenomeni complessi. Un
esempio per tutti è costituito dagli indicatori della qualità della vita, sui quali si è sviluppato da diversi anni un ampio dibattito anche in Italia (per una rassegna si veda l’Appendice di Martinotti
1988; Vergati 1989; Lanzetti 1990; Zajczyk 1991). Esso può essere ricondotto al cosiddetto ‘movimento degli indicatori sociali’,
iniziato negli Stati Uniti alla metà degli anni sessanta (cfr. Bauer
1967), al cui interno l’indicatore presenta il significato più specifico di rilevazione di uno o più fenomeni capaci di consentire una
valutazione concisa di una realtà sociale o di un suo aspetto particolare.
Nella sua accezione più ampia, l’indicatore sociale consta di
un’elaborazione di dati elementari che “apporti sul tema in questione un autonomo, potente, connettivo e controllabile incremento
conoscitivo” (Cipolla 1988, 362, corsivo nel testo).
Produce informazioni ulteriori rispetto ai dati dai quali viene ricavato (come il tasso di natalità a fronte del numero dei nati in
un’unità di tempo e del numero medio dei residenti nel periodo),
ma è anche un’elaborazione
che intrinsecamente rinvia a qualche cosa altro da sé, che è parte
indicante di una parte più o meno convenzionalmente indicata, e che
è, per statuto, oltre se stessa, verso un concetto noto e ignoto, dentro
un processo consolidato o emergente (Ivi, 363)
Ma, come osserva sempre Cipolla, ciò che differenzia gli indicatori
sociali da quelli elaborati all’interno di un questionario è soprattutto il loro rapporto con la teoria, in quanto
nascono e possono essere costruiti per riferimento ad una teoria
come ‘conoscenza tacita’, come insieme di osservazioni comunque
dipendenti da riflessioni coordinate in cornici o reti conoscitive (Ivi,
365)
In questa prospettiva l’indicatore non è riconducibile ad una o più
domande su di un questionario, bensì ad uno o più aspetti di un
concetto in ordine ai quali esistono o sono reperibili delle informazioni. Molto spesso ci si avvale infatti di dati già disponibili, quasi
sempre aggregati ad un qualche livello territoriale, che vengono
60
sottoposti ad elaborazioni statistiche elementari (rapporti, quozienti, percentualizzazioni, differenze assolute o percentuali; per una
rassegna vedi Curatolo 1979 e Guala 1991).
Non di rado l’indicatore assume, oltre che un carattere descrittivo,
anche una valenza normativa, in quanto inserito in un modello di
analisi sociale di tipo valoriale: gli indicatori dello stato di salute
della popolazione presuppongono ad esempio che il benessere fisico costituisca un valore positivo, e la sua assenza uno negativo.
Negli anni più recenti assistiamo anzi alla proliferazione dell’uso
di indicatori in queste due accezioni, per due importanti ordini di
ragioni. La prima è costituita dalla crescente accessibilità di dati,
anche su supporto informatico, relativi ai più diversi aspetti della
vita sociale, che rendono agevole una loro rielaborazione in vista
degli interessi dello studioso. La seconda dalla crescente attenzione della pubblica amministrazione ai risultati della propria attività,
che lega la costruzione di indicatori sociali alla definizione di programmi di intervento, di cui spesso costituiscono o un prerequisito
conoscitivo o una stima di risultato.
Benché le modalità di costruzione degli indicatori sociali siano in
larga misura analoghe a quelle degli indicatori utilizzati nella ricerca sociale, esse sono vincolate non tanto ad obiettivi conoscitivi
di carattere teorico, quanto a specifici obiettivi operativi. Non verranno quindi trattati oltre in questa sede, se non per rimarcare il
fatto che molto spesso, in questo genere di applicazioni, si inverte
la relazione tra indicatore e concetto: mentre infatti nella ricerca
sociale ci si impegna nella costruzione di indicatori solo dopo aver
definito il concetto, nelle analisi (descrittive o valutative) condotte
sulla base di dati secondari si parte dai dati disponibili domandandosi a quali dei concetti rilevanti per la ricerca questi siano riconducibili. Questo procedimento non è ovviamente scevro da rischi,
come accade in molte indagini sulla qualità della vita urbana condotte sulla base dei dati disponibili piuttosto che dei dati pertinenti
alla definizione iniziale del concetto (cfr. ad es. Dall’Osso 1987;
per una critica cfr. Bezzi 1988).
In ambito più strettamente metodologico, l’indicatore rappresenta
una modalità di rilevazione di un concetto non misurabile in via
diretta. Uno o più indicatori rientrano pertanto all’interno del percorso da teoria a realtà attraverso le tappe: 1) definizione dei concetti; 2) scelta (eventuale) di indicatori; 3) costruzione degli strumenti che consentono di rilevare gli indicatori; 4) rilevazione; 5)
aggregazione degli (eventuali) indicatori in un indice. Nel caso del
questionario, gli indicatori sono quindi specifiche domande, o
61
gruppi di domande, che nel loro insieme si riferiscono ad un unico
concetto.
In linea generale, se un concetto è articolato in un gruppo di indicatori, ciascuno di questi può essere considerato come una subvariabile, può quindi essere elaborato ed analizzato autonomamente nelle sue relazioni con le altre variabili rilevate e, se del caso,
con gli stessi altri indicatori. Accade spesso, tuttavia, che si reputi
necessario ricomporre la variabile iniziale in un indice, che sintetizzi gli indicatori utilizzati. Ciò può avvenire sia per ragioni descrittive (ad es., costruire un indice che sintetizzi le diverse dimensioni della coscienza di classe, della posizione sociale, del livello
di socializzazione, ecc.), sia per ragioni interpretative, ovvero per
poter analizzare le relazioni tra la variabile di partenza e le altre
variabili rilevanti.
La ricomposizione in un indice può avvenire in vario modo, ed è
condizionata sia dal tipo di rapporto che si è inizialmente ipotizzato sussistere tra gli indicatori, sia dal modo in cui gli indicatori sono stati misurati.
Per quel che concerne il tipo di rapporto esistente fra i diversi indicatori, il principale problema concerne il fatto che le diverse domande (i diversi indicatori) non hanno necessariamente lo stesso
‘peso’, ossia non sono necessariamente indicative nella stessa misura della variabile iniziale: la costruzione dell’indice per semplice
somma sarebbe corretta nel solo caso (indimostrabile) in cui i diversi indicatori cogliessero parti diverse (non sovrapposte) e della
stessa ampiezza del fenomeno studiato (vedi Tav. 4 al §. 2.2). In
caso contrario, è compito del ricercatore assegnare (a priori) dei
‘pesi’ diversi ad ogni indicatore, che rappresentano l’intensità del
rapporto di indicazione di ciascuno di questi con il concetto indicato. Non si tratta di un’operazione semplice, anche perché:
1) le diverse domande possono cogliere, oltre alla dimensione relativa alla variabile ‘indicata’, anche elementi propri di altre variabili, non necessariamente disposte secondo lo stesso continuum: ad
esempio, assumere come indicatori della qualità della vita sia il
consumo di beni ‘materiali’ (auto, abitazione, ecc.) sia quello di
beni ‘immateriali’ (sport, teatro, viaggi) può nascondere due orientamenti contrastanti, rivolti a generi di consumo fortemente diversificati, correlati in un caso alla disponibilità di denaro, nell’altro
alla disponibilità di tempo;
2) il numero di indicatori riferiti alle diverse dimensioni di una variabile possono provocare, una volta sommati, una sovrastima di
talune dimensioni a scapito di altre (ad esempio, nella valutazione
dello status sociale, è possibile utilizzare un numero elevato di i-
62
tem relativi al possesso di beni tutti legati alla dimensione del reddito);
3) le combinazioni individuali di risposte possono configurare esperienze molto diverse, mettendo pesantemente in discussione,
nel caso ad esempio della qualità della vita, l’assunto secondo il
quale questa è proporzionale alla quantità assoluta di beni posseduti/consumati o di opportunità godute e non, ad esempio, alla loro
quantità relativa (rispetto a gruppi di riferimento) o alle modalità
di fruizione. Il problema è riconducibile a quello citato sub 1
quando il concetto che si intende misurare mediante gli indicatori
sia multidimensionale e non necessariamente ogni dimensione sia
legata alle altre secondo una relazione lineare.
Per quel che concerne invece il modo in cui sono misurati i singoli
indicatori, basti ricordare che ogni operazione di somma è comunque scorretta quando gli indicatori (o alcuni di questi) siano misurati secondo una scala nominale o ordinale. Poiché tuttavia è bene
talvolta fare di necessità virtù, alcune variabili nominali possono
essere tradotte in variabili dicotomiche caratterizzate dalle due
modalità ‘presenza’ o ‘assenza’ di una proprietà; assegnando valore ‘1’ alla presenza e ‘0’ all’assenza, è possibile procedere ad una
somma (aritmetica o ponderata, ma in casi particolari possono essere opportune e legittime operazioni diverse) dei diversi indicatori. Anche in questo caso, è ovvio che questa operazione può essere
effettuata in modo legittimo quando le modalità di risposta la consentono, ossia quando le categorie in cui si articola la variabile sono suscettibili essere dicotomizzate senza snaturarla: quando invece si assumono i due valori polari di una distribuzione continua
che soggiace alla variabile nominale, forzando le risposte in una
delle due, allora si ha un massimo di distorsione (cfr. Marradi
1987a, 60).
Nel caso invece di variabili ordinali, tipicamente quelle misurate
secondo scale Likert, non è infrequente l’assegnazione di valori
numerici alle diverse modalità di risposta. In questi casi va comunque considerato che :
1) gli intervalli ‘reali’ fra due valori adiacenti nelle risposte ad una
stessa domanda non sono noti, e quindi non sono ipotizzabili come
uguali (come accade invece ponendo ad esempio 5 = molto favorevole; 4 = favorevole). Questa situazione è anzi un’eccezione: è
pertanto più corretto, come osserva Marradi (1987a, 62), che il ricercatore si avvalga delle sue conoscenze sostanziali di un fenomeno per assegnare valori, comunque arbitrari, alle diverse modalità;
63
2) gli intervalli ‘reali’ possono comunque variare da un indicatore
all’altro, come ampiamente dimostrato da un’ampia letteratura in
materia (cfr. ad es. Marradi 1988a e Marradi - Gasperoni 1992).
Per le ragioni sopra dette, può essere opportuno, quando già si è
deciso di assegnare valori numerici alle modalità di una variabile
ordinale, sostituire ove possibile le abusate Likert con scale diverse, alcune delle quali sono presentate in questo volume, che coinvolgano l’intervistato nell’operazione di assegnazione di valori
numerici. In altri termini, è probabilmente fonte di minori distorsioni, comunque meno arbitraria, la richiesta all’intervistato di assegnare un punteggio da uno a cento alla propria valutazione di
qualche fenomeno che la richiesta di collocarsi in categorie più
ampie e generiche alle quali sarà il ricercatore ad assegnare successivamente un valore preciso.
Quando poi ci si prefigge di sommare una pluralità di risposte per
costruire un indice, si dovrà porre attenzione al fatto che queste
debbono comunque essere espresse secondo scale realmente sommabili. Non ha evidentemente alcun senso, come osserva anche
Marradi (1987a), sommare dicotomie espresse con i valori ‘0’ e
‘1’, Likert con punteggi da 1 a 5 e altre scale con punteggi ancora
diversi. Se questa fosse la situazione di partenza (ma avrebbe dovuto essere valutata in anticipo in sede di costruzione dello strumento), si renderebbe necessario un ulteriore passaggio che omogeneizzi le diverse scale su cui sono misurati gli indicatori. Anche
questo passaggio comporta ovviamente delle scelte, ma
l’arbitrarietà relativa di un procedimento è infinitamente migliore
dell’assurdità di una somma di indicatori misurati nei modi più vari.
In linea generale, un buon metodo per la costruzione di un indice
come somma di più indicatori è quello di riportare ognuno di questi alla scala più ampia, peraltro controllando che tale operazione
non porti alla sovrastima di uno a svantaggio dell’atro. Ad esempio, in linea di principio è possibile moltiplicare per 20 i valori di
una Likert, assegnando valore 100 al punteggio 5, per sommarlo
con un altro indicatore misurato su di un termometro che va da zero a 100 e per lo stesso motivo assegnare 100 alla modalità ‘presenza di una caratteristica’ e zero alla modalità ‘assenza’. Tuttavia
in questo modo si corre il rischio, del quale è necessario essere
consapevoli, di accentuare il peso degli indicatori misurati su scale
di estensione ridotta, che riproducono differenze più grossolane,
penalizzando gli indicatori misurati su scale di maggior estensione,
che consentono distinzioni più fini tra posizioni diverse.
64
Da ultimo, poiché non sempre i rispondenti utilizzano l’intera estensione delle scale proposte, c’è da chiedersi se la somma debba
riguardare i punteggi assoluti o quelli relativi. In altre parole, se
due indicatori misurati su di un termometro (vedi oltre) che va da
zero a 100 presentano risposte comprese in un caso fra i valori 0 e
100, nell’altro fra 30 e 70, c’è da chiedersi se mantenere nella
somma questi punteggi (che attribuirebbero maggior peso
all’indicatore misurato sull’intera estensione della scala), ovvero
tentare un’ulteriore omogeneizzazione. In questo secondo caso si
può procedere alla standardizzazione dei valori, ossia alla trasformazione dei punteggi reali in nuovi punteggi, espressi in termini di
distanza ponderata dalla media di ogni singola distribuzione (il valore standardizzato del valore di una variabile è dato dalla differenza tra questo e la media della distribuzione, fratto lo scarto quadratico medio della stessa). La standardizzazione produce una diversa distribuzione delle risposte, che vengono considerate per il
loro punteggio relativo all’insieme delle altre, e non per il loro
punteggio assoluto. Se ad esempio alcune domande portano a risposte molto prossime tra di loro, altre a risposte distribuite in modo più differenziato, la standardizzazione fa perdere questa differenza, che il ricercatore può invece decidere di mantenere.
Non sempre, peraltro, gli indici sono costruiti secondo procedure
additive. In questa sede ne citiamo altre tre.
La prima, ricordata da Marradi (1987a, 69-70), consiste nella costruzione di tipologie, ottenute aggregando categorie diverse dei
vari indicatori o delle loro combinazioni per costruire un numero
di modalità dell’indice più ridotto di quello che deriverebbe dalla
loro semplice combinazione. Considerando ad esempio la professione (articolata in otto posizioni ordinate), il titolo di studio (per
cinque posizioni ordinate), la proprietà dell’abitazione (dicotomica), il reddito (per sei posizioni misurate su scala di rapporti) si
potrebbe costruire un indice di posizione di classe su tre sole modalità (alta, media, bassa) attraverso accorpamenti del tipo seguente:
- classe alta: professione = imprenditore, dirigente o libero professionista; titolo di studio = diploma o laurea; proprietà
dell’abitazione = ininfluente; reddito = una delle due ultime classi;
- classe media: professione = come sopra in assenza delle altre caratteristiche; professione = autonoma o impiegatizia in presenza di
titolo di studio non inferiore alla licenza media e reddito non inferiore alla terza classe; professione = ininfluente se abitazione in
proprietà, reddito uguale o superiore alla quarta classe, titolo di
studio uguale o superiore al diploma;
65
- classe bassa: tutte le altre combinazioni.
In questo ipotetico caso, da un numero di combinazioni pari a 480
(il prodotto tra il numero di modalità di ogni indicatore) si è passati a tre sole, procedendo a quella che Boudon (1970) chiama la riduzione dello spazio degli attributi, specificando che questa può
avvenire sia in via teorica (come nell’esempio), sia in via pratica,
ossia osservando che di fatto un certo numero di combinazioni potenzialmente rilevabili (ad es., imprenditore analfabeta, operaio
con reddito della classe più elevata) non vengono registrate nella
rilevazione condotta.
Una seconda modalità di costruzione di un indice è quella realizzata attraverso la scala di Guttman, che in buona sostanza si propone
di organizzare una serie di indicatori secondo una sequenza obbligata, che produce direttamente un indice. Già Bogardus (1933) si
era prefisso di ordinare lungo un continuum non già risposte prefissate del tipo di quelle proposte da Likert, ma affermazioni dotate
di autonomia semantica, capaci di riprodurre in modo più efficace
gli atteggiamenti degli intervistati, in particolare quelli disposti
lungo il continuum massima prossimità-massima lontananza.
Ad una domanda-stimolo seguono risposte ordinate in modo tale
che la scelta di una di queste comporti il rifiuto delle successive.
Un esempio (citato in Goode - Hatt 1969, 377) è costituito dalle
diverse affermazioni elaborate da Bogardus nel 1928 per misurare
la distanza sociale rispetto a quattro minoranze etniche negli Usa inglesi, svedesi, polacchi, coreani - cui era possibile rispondere
manifestando accordo o disaccordo:
a) accetterei in stretta parentela per matrimonio;
b) accetterei nel mio club come amico personale;
c) accetterei volentieri nella mia strada come vicino;
d) accetterei nel mio lavoro come compagno;
e) accetterei nel mio paese come cittadino;
f) accetterei nel mio paese solo come visitatore;
g) escluderei dal mio paese.
Se la scala delle risposte è ben ordinata, si suppone che chi non è
d’accordo, ad esempio, con la posizione c non possa accettare la
posizione b, e chi rifiuta la posizione e, respinga anche la c, e così
via.
Guttman (1944) si propone pochi anni dopo di assicurare la scalabilità dell’ordinamento proposto, traducendo ogni possibile risposta in domande a risposta dicotomica (Sì/No), in modo da valutare
se le distribuzioni dei ‘Si’ e dei ‘No’ confermano o meno
l’ordinamento effettuato. Ciò consente la costruzione di un indicatore di validità della scala (detto coefficiente di riproducibilità),
66
che mette a raffronto il numero di risposte incongruenti (p. es. , sì
alla c e alla a, ma non alla b) rispetto al totale delle risposte date.
La tecnica di Guttman, definita anche ‘scalogramma’, consente di
superare l’assunto della pluridimensionalità dell’atteggiamento
studiato, limitandosi a considerare scalabile un’area quando questa
presenti una disposizione ordinata della distribuzione di un insieme di elementi che la compongono. L’imprecisione delle scale
pluridimensionali (quali ad esempio indici costruiti sommando una
pluralità di Likert) verrebbe cioè superata al prezzo di limitare ad
una sola dimensione la misurazione dell’atteggiamento da studiare.
A differenza degli indici costruiti per somma, inoltre, nella scala di
Guttman è implicita la ponderazione delle risposte, in quanto
l’accordo con la sola affermazione più debole ha sempre valore
inferiore all’accordo con un’affermazione più forte (in quanto implica l’accordo con le precedenti).
La scalabilità di un item è peraltro un’ipotesi che secondo lo stesso
Guttman (1981) va sottoposta a controllo, non già un assunto infalsificabile. Inoltre, come ha osservato Roskam
ogni modello di scala è un modello di comportamento, ossia è la
rappresentazione della teoria che noi possediamo sul comportamento
oggetto di studio (1989, 243)
Un terzo modo di costruire degli indici è affidato all’utilizzo del
computer nella successiva fase di elaborazione dei dati.
Si tratta dell’analisi fattoriale, che consente di misurare quanto ogni indicatore è correlato con gli altri e ad un numero più ridotto di
fattori soggiacenti. Questa tecnica consente sia di attribuire ad ogni
indicatore un peso corrispondente al grado di correlazione con i
vari fattori, sia di scartare eventuali indicatori che presentino bassa
correlazione su tutti i fattori (per un approfondimento, cfr. Marradi
1987a, 73-78; Bailey 1985, 399-407). Senza entrare in ulteriori
dettagli è bene comunque in questa sede rilevare che, come ha efficacemente osservato Colombis (1991), procedure mediate dal
computer comportano comunque scelte più o meno arbitrarie del
ricercatore, sicché gli indici che ne derivano sembrano possedere
un’oggettività superiore a quelli elaborati con i metodi precedenti
mentre potrebbero semplicemente essere dotati di una minore controllabilità nelle procedure di costruzione.
67
3 IL
CAMPIONAMENTO
3.1 UNIVERSO E CAMPIONE
Molti strumenti di rilevazione, in particolare il questionario, non
possono essere applicati all’intero universo oggetto di ricerca, per
ragioni di costo, di opportunità, di accessibilità effettiva di tutti i
soggetti che ne fanno parte. Eccezion fatta per le indagini di carattere censuario, si procede di norma a sottoporre il questionario ad
una porzione più ridotta dell’universo, denominata campione.
In generale, si definisce popolazione l’insieme dei soggetti sui
quali viene svolta la ricerca; campione il sottoinsieme della popolazione cui vengono applicati gli strumenti d’indagine; campionamento il procedimento attraverso il quale vengono selezionati dalla
popolazione di riferimento i soggetti che faranno parte del campione.
Si noti tuttavia che con il termine ‘popolazione’ non ci si riferisce
necessariamente a un insieme di persone fisiche: la popolazione
può essere costituita da famiglie, abitazioni, classi scolastiche, ricoveri ospedalieri, ecc.; in altre parole, da individui, gruppi, oggetti o eventi.
Naturalmente, prima di poter procedere al campionamento occorre
aver definito con precisione l’oggetto della ricerca e, di conseguenza, la popolazione di riferimento. Essa deve essere definita
anche in termini spazio-temporali, e non solo in rapporto ai temi e
problemi chiamati in causa. Ogni ricerca riguarda cioè un complesso di ‘casi’ che occorre identificare con una certa precisione,
che costituiscono il cosiddetto ‘universo’ oggetto della ricerca.
Nel caso di un’indagine sulle condizioni abitative occorrerà perciò
definire se il livello territoriale di riferimento è l’Europa, l’Italia,
una regione o un singolo comune o quartiere (oltrechè, naturalmente, cosa debba intendersi per ‘abitazione’); nel caso di una ricerca su ‘giovani e politica’ occorrerà non solo stabilire a quale
scala condurre la ricerca (locale, regionale, nazionale, internazionale), ma anche chi siano ‘i giovani’.
Si pone cioè il problema dei confini dell’oggetto della ricerca, che
assume implicazioni sia pratiche che teoriche rilevanti.
Sul piano teorico, c’è da chiedersi infatti quanto i limiti spaziotemporali della ricerca consentano un’interpretazione estensiva dei
suoi risultati. Una ricerca su ‘giovani e politica’ a Genova sarà significativa anche per la Liguria, per l’Italia, per l’Europa? E anche
68
per i genovesi che erano ‘giovani’ l’anno scorso, dieci anni fa, o
che lo saranno l’anno prossimo?
Benché l’utilizzo del questionario sia infatti spesso riconducibile
all’approccio del cosiddetto ‘individualismo metodologico’ (cfr.
Boudon 1970; Cesareo 1993), per cui solo alle variabili rilevate a
livello individuale viene attribuito valore esplicativo, non possiamo dimenticare che ogni atteggiamento e comportamento del singolo reca con sè una certa influenza del contesto spazio-temporale
in cui esso opera. Il giovane genovese di oggi vive situazioni e
ambienti diversi sia dal coetaneo genovese di ieri che da quello
milanese di oggi. Una buona ricerca dovrà quindi valutare il grado
in cui le variabili di contesto influenzino i dati rilevati a livello individuale (cfr. Boudon 1970, 45-49).
Naturalmente esistono ricercatori propensi ad attribuire al contesto
un’influenza predominante, ed altri che preferiscono sottolineare
l’effetto delle caratteristiche individuali. A ben vedere si tratta tuttavia di un falso problema, dal momento che, come si è detto, gli
atteggiamenti ed orientamenti ‘individuali’ sono sempre in qualche
misura attribuibili all’influenza esercitata dal contesto socioeconomico, territoriale e culturale di appartenenza, mentre d’altro
lato non esistono ‘contesti’ che non siano percepiti attraverso azioni riferibili a singoli individui.
Il problema dell’individuazione delle unità d’analisi rinvia perciò
al più generale problema dell’interpretazione sociologica, al fatto
che in ultima istanza “non si può comprendere la vita dei singoli se
non si comprende quella della società, e viceversa” (Wright Mills
1962, 13). Ogni ricercatore dovrà quindi compiere le scelte che
riterrà più opportune, giustificandole adeguatamente, sulla base
degli obiettivi della ricerca, sforzandosi il più possibile di evitare
che la scelta operata lo induca a ritenerla l’unica capace di fornire
una spiegazione del fenomeno che sta investigando.
Ma il problema dei confini è rilevante anche sul piano pratico, della concreta realizzazione della ricerca, in quanto richiede
un’esaustiva definizione dei criteri di assegnazione dei singoli elementi all’universo oggetto di ricerca.
Certamente il problema è banale quando tali elementi sono facilmente riconducibili al territorio delimitato dalla ricerca: le condizioni abitative di un comune sono ovviamente quelle riscontrabili
negli alloggi fisicamente localizzati nel comune stesso (anche se la
loro valutazione da parte degli abitanti sarà influenzata dalle condizioni abitative esistenti nei comuni vicini). In questo caso l’unico
aspetto da definire riguarda il limite temporale di riferimento: ad
esempio, oggetto della ricerca sono “tutte le abitazioni completate
69
(abitate, o in possesso della licenza di abitabilità) alla data di inizio
della rilevazione”. Il problema è meno banale quando l’oggetto
della ricerca è costituito da elementi mobili, come gli esseri umani.
Ad esempio, una ricerca sugli esiti occupazionali dei laureati liguri
potrà prendere in esame:
a) i residenti in Liguria che hanno conseguito la laurea presso
l’Università di Genova;
b) i laureati dell’Università di Genova a prescindere dal loro luogo di residenza;
c) i residenti in Liguria che hanno conseguito una laurea presso
qualunque Università.
Occorrerà inoltre definire, per un’esatta individuazione
dell’universo oggetto di ricerca:
1) il periodo in cui la laurea è stata conseguita;
2) se anche i titoli equipollenti conseguiti all’estero vadano presi
in considerazione (nel caso sub c);
3) se il criterio della residenza vada riferito al momento
dell’iscrizione all’Università, a quello del conseguimento della
laurea o a quello della successiva occupazione, ovvero a due o
tutti questi momenti congiuntamente;
4) se sia più opportuno o corretto usare il criterio della residenza,
quello del domicilio o quello del comune di nascita;
5) se debbano essere esclusi dall’universo di ricerca i soggetti già
occupati al momento dell’iscrizione all’Università o del conseguimento della laurea.
È agevole constatare dall’esempio citato che da ogni opzione selezionata derivano universi di riferimento diversi, con conseguenze
ovvie sia sul piano della rilevazione dei dati che su quello della
successiva analisi e riflessione teorica. È infatti evidente che la soluzione c fornirà indicazioni più complete, ma potrà mettere in
ombra gli esiti occupazionali dell’Università di Genova, anche
perché i numerosi liguri che hanno frequentato atenei di altre regioni potranno cercare lavoro al di fuori della Liguria; d’altro canto la soluzione b e, in parte, la soluzione a, oltre a sovrastimare i
residenti a Genova (che presumibilmente sono meno propensi ad
iscriversi ad altre Università), fornisce anche informazioni
sull’efficacia dell’Università di Genova come canale di accesso ad
un’occupazione, non solo sulla spendibilità della laurea sul mercato del lavoro. La variabile di contesto (Università di Genova) influenza in diversi modi la variabile individuale ‘laurea’: ad esempio, nel caso in cui il titolo di studio conseguito presso l’Ateneo
genovese sia sotto o sopravvalutato dai datori di lavoro rispetto a
quello di un’altra Università.
70
Naturalmente la facilità di reperimento degli individui cui sottoporre uno strumento di ricerca (nel caso ipotizzato, un questionario) può influenzare la definizione dell’universo oggetto della ricerca. È ad esempio più facile identificare i laureati presso
l’Università di Genova che i residenti in Liguria laureati presso
qualunque altra Università: in quest’ultimo caso occorrerebbe mettersi in contatto con tutte le Università del mondo, oppure disporre
di anagrafi comunali perfettamente aggiornate. Tuttavia, universi
anche di poco diversi l’uno dall’altro forniscono risposte a problemi di ricerca diversi.
A questo riguardo l’Istat (1989a, 13-14) distingue tra ‘popolazione
oggetto di indagine’ e ‘popolazione di base’ (quella individuata
attraverso le liste o gli archivi disponibii), sottolineando che non
sempre le due coincidono. Nell’esempio riportato, i soggetti sub b
o sub a possono essere considerati la popolazione di base rispetto a
quella oggtto dell’indagine, che più opportunamente dovrebbe essere quella sub c.
3.2 LA RAPPRESENTATIVITÀ
Si è detto che il campionamento costituisce una strategia alternativa a quella di sottoporre a rilevazione diretta tutti i membri
dell’universo oggetto di ricerca, e consiste nell’estrarre da questo
una porzione sufficientemente piccola da poterla analizzare e sufficientemente grande da poter estendere i risultati all’intero universo.
Perché tale estensione sia possibile, il campione deve possedere la
caratteristica della rappresentatività, ossia la capacità di riprodurre
su piccola scala l’universo di riferimento. Tale caratteristica dipende da diversi elementi. Il primo, e più ovvio, è costituito dalla
numerosità del campione; al crescere di questa cresce anche la
rappresentatività. Il secondo elemento concerne invece
l’eterogeneità dell’universo oggetto d’indagine. Intuitivamente,
l’universo degli studenti delle scuole medie superiori è meno eterogeneo, rispetto all’età, dell’insieme dei residenti in un comune.
A pari numerosità del campione, quello di studenti sarà quindi
maggiormente rappresentativo di quello di residenti rispetto a tale
caratteristica.
Il terzo e forse più importante elemento è costituito dalla procedura di selezione dei membri del campione, ovvero dalle cosiddette
procedure di campionamento.
71
I primi due elementi non sono infatti sufficienti a definire la bontà
di un campione, se si vuole che questo costituisca ‘una riproduzione su piccola scala dell’universo’. Prendendola alla lettera, riprodurre in 1.000 unità i residenti a Genova richiederebbe un campione composto, ad esempio, dal 54% di donne e dal 46% di uomini,
dal 39% di occupati e dal 61% di non occupati, dal 20% di giovani
e dal 30% di anziani, e così via. Poiché la nostra riproduzione deve
essere fedele, occorrerebbe però anche una quota di individui felici
pari a quella dell’universo; altrettanto per quel che concerne i
comportamenti elettorali, le abitudini alimentari, gli atteggiamenti
verso la famiglia, la propensione al matrimonio, ecc.
Qui nascono due tipi di difficoltà. La prima, e più evidente, riguarda il fatto che, mentre alcune caratteristiche sono note a livello di
universo (ad es. la distribuzione per età, sesso, stato civile, comportamento elettorale), altre non sono rilevabili che attraverso
un’indagine diretta (la felicità di un individuo, le sue abitudini alimentari, gli atteggiamenti verso la famiglia). Talune ricerche descrittive, anzi, si propongono proprio di ottenere da un campione
risposte capaci di gettare luce sulla distribuzione al livello
dell’intero universo di caratteristiche fino a quel momento non conosciute. Inoltre, alcune proprietà la cui distribuzione nell’universo
è nota, sono riferibili ai singoli individui prima di procedere
all’indagine diretta: per es., il sesso e l’età. Altre non lo sono, come è il caso del comportamento elettorale individuale, dal momento che il voto è segreto.
Ma una seconda difficoltà si aggiunge alla prima. Supponiamo che
si vogliano analizzare le variabili che concorrono a determinare il
livello di reddito di un individuo. È evidente che questo può dipendere non solo dall’influenza di molti elementi singolarmente
presi, ma anche dal modo in cui questi si combinano. Procedendo
nell’esempio, un campione composto da 540 donne tutte giovani e
da 460 uomini tutti non giovani potrebbe ‘riprodurre’ esattamente
l’universo dei genovesi per sesso e per età, ma non rispetto alla
distribuzione congiunta dei due caratteri, che è invece quella che
interessa.
Poiché inoltre non è possibile definire a priori quali combinazioni
di caratteri influiscono maggiormente sul fenomeno studiato (anzi,
ciò costituisce spesso l’oggetto dello studio), si possono adottare
due strategie di semplificazione della realtà.
La prima consiste nel considerare a priori come rilevanti alcune
caratteristiche (e le loro combinazioni) a scapito di altre, e di assicurare che nel campione queste siano riprodotte in modo omogeneo rispetto all’universo. Nell’esempio sopra riportato, si tratte-
72
rebbe di selezionare una quota di donne giovani occupate proporzionale a quella dell’universo (e così per i maschi giovani, per gli
anziani, ecc.): è la strategia adottata nel campionamento per quote.
La seconda nel rinunciare a privilegiare alcune proprietà a priori,
costruendo un campione al cui interno la distribuzione di ogni caratteristica rispetto all’universo nel campione sia uguale, a prescindere dal fatto che tutte le caratteristiche siano rilevanti rispetto
al fenomeno studiato. Poiché peraltro è impossibile pretendere
un’assoluta corrispondenza fra le due distribuzioni (del campione e
dell’universo) rispetto a tutte le caratteristiche considerate, è sufficiente poter definire in anticipo il livello di confidenza delle stime
campionarie, ossia il margine di scostamento che ci si può attendere tra un certo parametro di ogni variabile (ad es., la media) del
campione e quello dell’universo.
In linea più generale, esistono due tipi di procedure con cui selezionare dagli N casi che compongono l’universo il più piccolo
numero n di casi che entra a far parte del campione. Il primo tipo è
costituito dal campionamento non probabilistico, che consiste
nell’impiegare criteri più o meno ragionevoli per scegliere i soggetti ai quali applicare gli strumenti d’indagine; il secondo tipo dal
campionamento probabilistico o casuale, che affida la scelta del
campione a procedure statisticamente corrette.
I vantaggi della prima alternativa sono evidenti: posso intervistare
solo le persone disponibili a rispondere, oppure quelle meglio preparate, o le prime che incontro per strada, o vicini, parenti e conoscenti. Gli svantaggi sono tuttavia ancor più grandi: con una simile
procedura è praticamente impossibile definire in che misura i risultati ottenuti siano riferibili all’universo oggetto della ricerca. In
altre parole, è impossibile capire quanto il campione riproduca
davvero, in piccolo, le caratteristiche dell’universo. Di contro, il
campionamento casuale consente di estendere i risultati ottenuti
all’intero universo conoscendo a priori il margine di errore insito
in questa operazione e la probabilità che questo errore si verifichi.
Due precisazioni, prima di procedere negli aspetti più tecnici.
Innanzi tutto, il campionamento casuale si effettua non scegliendo
‘a casaccio’ gli elementi del campione, ma utilizzando procedure,
quali l’estrazione a sorte da una lista, che assicurino ad ogni elemento dell’universo di avere la stessa probabilità, nota a priori, di
entrare a far parte del campione. Tale probabilità è pari, per il primo estratto, a n/N; ci si riferisce al primo estratto in quanto, estraendo un campione casuale di 1.000 unità da una popolazione di un
milione, si ha una probabilità di estrazione pari a 1/1.000 solo nei
suoi riguardi. Il secondo estratto avrà infatti probabilità pari a
73
999/999.999, il terzo a 998/999.998 e così via. Anche se si reimmettesse ogni nominativo estratto nell’urna, si manterrebbe costante il divisore ma non il dividendo. Di norma il campionamento casuale avviene senza reimmissione, in modo da non intervistare due
volte lo stesso soggetto. La casualità assicura inoltre che ogni
combinazione possibile di caratteri rilevanti per l’indagine abbia
una possibilità di essere selezionata corrispondente alla sua incidenza nell’universo (adattato da Blalock jr. 1969, 182).
D’altro lato, il campionamento non probabilistico non costituisce
necessariamente un campionamento ‘di comodo’: in molti casi,
come si dirà, oltre ad essere necessitato dalla natura dell’universo,
può essere effettuato adottando ogni ragionevole cautela per assicurare che riproduca il più fedelmente possibile l’universo.
La seconda riflessione preliminare concerne il fatto che il campionamento nasce nelle scienze demografiche e statistiche in risposta
all’esigenza di conoscere il valore di un parametro relativo ad un
universo non noto.
Infatti le formule impiegate nelle procedure di campionamento mirano a rispondere, sostanzialmente, ad interrogativi del tipo: “con
quale grado di affidabilità posso considerare che il valore campionario trovato corrisponda a quello proprio dell’universo?”; oppure
“entro quali limiti il valore campionario corrisponde a quello
dell’universo?”. In termini concreti, il campionamento nasce per
sapere in che misura un parametro specifico (ad es., un tasso di acidità, la statura media di una popolazione), rilevato nel campione
sia proprio anche dell’universo. Pertanto, quando si utilizza un
campione per stimare gli atteggiamenti o i comportamenti di una
popolazione, si confida nel fatto che il valore (ignoto) del parametro che si vuole stimare sia compreso all’interno di un intervallo
(di ampiezza predefinita e legata alla numerosità del campione) al
cui centro sta il valore (noto) del campione.
Questa procedura è praticabile per qualunque tipo di variabile perché, anche nel caso di variabili misurate su scale nominali o ordinali, si può prendere in considerazione la distribuzione di frequenza delle modalità che possono assumere, ed attribuire a questa le
stime campionarie. Se ad esempio un campione di n casi dà come
valore medio di acidità di una sorgente 6,5 ph, dirò che nel P% dei
casi il valore medio reale (dell’universo) è compreso fra +E 6,5 ph;
se E = 10%, è compreso fra (6,5-0,65 ph) e (6,5+0,65) ph, ossia fra
5,85 e 7,15 ph. Se invece il valore trovato è che il 70% degli italiani è contrario alla pena di morte (dato di frequenza riferito ad un
atteggiamento, quindi ad una variabile nominale - il caso in questione - o, al più, ordinale), dirò che nel P% dei casi, se E=10%,
74
l’atteggiamento degli italiani rispetto all’introduzione della pena di
morte è contrario per una percentuale compresa fra il 60 e l’80%
dei casi.
3.3 ELEMENTI DI TEORIA DEL CAMPIONAMENTO
Quali sono le premesse teoriche su cui si fonda il campionamento?
In sintesi, le seguenti:
• è dimostrato che, estraendo infiniti campioni da un universo, i
parametri di ogni singola rilevazione campionaria (media, scarto quadratico medio) relativi ad una variabile si distribuiscono
secondo una curva normale (si tratta di una curva che presenta
diverse caratteristiche tali da renderla perfettamente descrivibile con formule semplici. È detta anche di Gauss o ‘a campana’
- per la sua forma -, o ‘normale’), anche se tale variabile non
presenta una distribuzione normale (cfr. Blalock jr 1969, 228233);
• essendo note le caratteristiche strutturali della curva normale, è
possibile conoscere il grado di probabilità che ogni scostamento dalla media presenta, in quanto l’area sottesa alla porzione
della curva compresa tra la media e una ordinata posta ad una
distanza data, misurata in termini di scarto quadratico medio, è
costante (adattato da Blalock jr. 1969, 139);
• gli elementi fondamentali di ogni procedura di campionamento
sono costituiti dalla numerosità del campione (n), dalla probabilità (P) che il valore reale del parametro corrisponda a quello
(stimato) del campione, nell’ambito del margine di errore che
siamo disposti ad accettare (E) tra la stima di tale parametro ottenuta nel campione ed il valore dello stesso parametro relativo
all’universo. Grazie alle proprietà sopra citate è possibile, fissati due elementi su tre, conoscere il terzo.
In altre parole, la statistica consente, volendo stimare il valore di
un parametro ‘x’ (media, scarto quadratico medio) di una variabile,
di conoscere, attraverso il campionamento, dati n e P, entro quale
fascia di valori [x +E (x)] esso è compreso.
Alcuni presupposti della teoria del campionamento vanno chiariti.
In primo luogo, ‘E’: è intuitivo che la percentuale di maschi rispetto al totale ottenuta da un campione potrà non corrispondere esattamente a quella (ignota) dell’universo. Il punto è che non ci si attende, da un campione, un valore esatto (cioè precisamente corrispondente a quello dell’universo), ma un valore abbastanza vicino
a quello ‘vero’ da soddisfare le nostre esigenze conoscitive. ‘E’
75
costituisce l’errore atteso, ossia lo scostamento dal valore ottenuto
nel campione (nell’esempio, la percentuale di maschi) del valore
‘vero’ dell’universo. Se ad esempio E corrisponde al 5% e la percentuale di maschi registrata nel campione al 46%, il valore ‘vero’
sarà compreso fra il 41% ed il 51%. Questo vale solo per i campioni casuali, o per quelli selezionati con modalità che li rendono
assimilabili a quelli casuali. La statistica dice tuttavia che solo per
una certa quota di campioni quanto sopra affermato è vero. Questa
quota (‘P’, espressa in percentuale sul totale dei campioni estratti)
può essere predefinita dal ricercatore e dipende a sua volta da E e
da n. Naturalmente, non si procede mai realmente ad estrarre più
campioni di un universo, ma si applica a quello selezionato la probabilità P che questo sia valido (cioè che realmente il valore ‘vero’
del parametro stimato sia compreso all’interno di un intervallo +E
del valore campionario ottenuto).
Grazie alle formule campionarie potremo dire allora, dati n e P,
che x = x +E (x). Oppure, stabiliti E e P, che n è il numero di casi
da cui deve essere composto il campione. O ancora, che dati E ed
n, P sarà il grado di probabilità con cui realmente il valore x relativo all’universo cade all’interno dell’intervallo x+E (x). Si noti che
l’errore campionario E è sempre riferito al parametro stimato: un
errore del 10% è ad esempio pari a 5 cm. se il parametro del campione assume valore 50 cm.; è pari a 500.000 lire se x è pari a 5
milioni.
Sia P che E possono essere predeterminati dal ricercatore. Di norma, ‘P’ viene scelto fra il 95 e il 99%, ‘E’ tra il 5 e l’1%. È intuitivo i due parametri sono legati da un rapporto di proporzionalità
con la numerosità del campione: più ampio è il numero dei casi da
cui è composto il campione, più ridotto è E e più ampio P. Anche
P ed E sono legati tuttavia da un rapporto inverso: a pari numerosità del campione, infatti, P cresce al decrescere di E. In altre parole, per ogni campione di n casi sarà importante rispondere alla domanda: “preferisco avere un valore stimato molto prossimo a quello reale (cioè un E piccolo), pur sapendo che in questo caso aumenta il rischio che il mio valore non rappresenti quello
dell’universo (cioè un P più basso) e quindi un maggior rischio che
il mio valore ne cada all’esterno, oppure preferisco un valore stimato ampio ma una probabilità più elevata che corrisponda a quello reale?”
La risposta dipende ovviamente dall’obiettivo della ricerca.
La ‘formula magica’ del campionamento è la seguente:
n = t*s2/E2
76
dove t, che rappresenta la distanza dal punto 0 dell’asse x di una
distribuzione normale, dipende da P (ad esempio, per P=95%,
t=1,96; per P=99%, t=2,576)
s2 rappresenta la varianza della distribuzione campionaria
E2 rappresenta il quadrato dell’errore atteso (espresso in percentuale di una grandezza, quindi nella stessa unità di misura di s).
Alcune precisazioni di fondamentale importanza:
1) In luogo della varianza può essere usato un altro parametro della
variabile. Tuttavia si usa di solito s2 perché questa costituisce una
misura sintetica della dispersione attorno alla media di una variabile (quindi della sua eterogeneità). Se oggetto della stima campionaria non è la distribuzione di una variabile metrica, non è possibile ovviamente calcolare s2. In tal caso si pone, in luogo di s2, p*q,
ove p=(1-q). In altre parole, si considera la variabile qualitativa (su
scala nominale o ordinale) come composta da due modalità, mutuamente esclusive (va da sé che se la distribuzione presenta più di
due modalità la si ‘dicotomizza’ in due fondamentali), e si utilizza
il loro prodotto. Quando la distribuzione della variabile di campionamento è ignota, poiché il prodotto p*q è massimo quando
p=q=0,5 (provare per credere), di solito si usa il valore 0,25
(=0,5*0,5). Nel caso di s2, invece, si usa il valore ottenuto dal
campione.
2) Si noterà che nella formula sopra riportata non si fa riferimento
alla numerosità dell’universo. Contrariamente a quanto suggerirebbe il senso comune, il rapporto tra la numerosità del campione e
quella dell’universo non è molto rilevante. Il fattore di correzione
per il quale moltiplicare t*s2/E2 è infatti pari, per i campionamenti
senza reimmissione, alla radice quadrata di (N-n)/(N-1), dove N è
la numerosità dell’universo e n quella del campione. È agevole notare che, per un campione di un migliaio di casi, il valore del fattore di correzione è molto prossimo a uno per universi composti da
più di 20.000 unità. Al di sopra di questa soglia di numerosità
dell’universo l’incidenza del campione su quest’ultimo è dunque
trascurabile.
3) Un’aporia della teoria del campionamento è costituita dal fatto
che per procedere alla stima dei parametri dai quali dipende la numerosità del campione occorre determinare a priori una variabile
rispetto alla quale calcolare la rappresentatività del campione medesimo. Questa variabile dovrebbe essere costituita da quella ritenuta più importante per l’indagine in oggetto. Non si può tuttavia
ignorare il fatto che la scelta di una variabile a minor dispersione
77
(quindi con un s2 più basso) può portare a campioni di numerosità
inferiore a quelli richiesti da una variabile distribuita in modo più
eterogeneo. È anche per questa ragione che, nel caso di ricerche su
variabili qualitative, si preferisce utilizzare p=q=0,5: se infatti gli
anziani sono pari al 30% del totale (p*q=0,21), i disoccupati al
10% (p*q=0,09), i maschi al 50% (p*q=0,25), un campione la cui
rappresentatività sia calcolata rispetto alla disoccupazione non sarebbe rappresentativo rispetto al sesso, mentre un campione con
p=q=0,5 sarà rappresentativo per qualsiasi variabile dicotomica (o
resa tale).
La praticità del calcolo della numerosità campionaria per variabili
dicotomiche è indubbia: non richiede infatti la conoscenza a priori
della distribuzione della caratteristica nell’universo, qualora si utilizzino valori di p e q tali da massimizzare la numerosità del campione (p=q=0,5). Per questa ragione si usa questa strada anche
quando sarebbe più corretto riferirsi ad una variabile non dicotomica, della quale sia possibile stimare la varianza. Un’ampia quantità di tabelle che indicano la numerosità campionaria per vari valori di P ed E e per diverse ampiezze della popolazione di riferimento per variabili dicotomiche sono contenute in Santarelli
(1982).
4) Le formule del campionamento consentono di definire la rappresentatività di un campione rispetto alla distribuzione complessiva di una variabile nell’universo. Quindi è un grave errore estendere tale rappresentatività a relazioni che si riferiscono ad un sola
porzione del campione, magari molto piccola. In tal caso, infatti,
l’estendibilità all’universo di tali relazioni è caratterizzata da valori
diversi di E e di P, riferiti alla numerosità più ridotta del sub campione su cui si opera. Se ad esempio un campione di 1.000 casi,
rappresentativo a livello nazionale, evidenzia che il partito ‘x’ riscuote il 20% delle preferenze (ossia una percentuale ‘vera’ compresa fra 20%-E e 20%+E), non è corretto estendere
all’affermazione che “le casalinghe con tre figli votano questo partito nel 30% dei casi” lo stesso errore atteso: in tal caso, infatti, occorre stimare la rappresentatività del sub campione delle casalinghe con tre figli (magari pari a 20 unità) rispetto all’universo delle
casalinghe con tre figli.
Di norma, la numerosità del campione viene calcolata sulla base
dei sottogruppi signficativi della popolazione rispetto ai quali si
intende sviluppare un’analisi autonoma. Dal punto di vista pratico,
non si ritiene generalmente corretto svolgere analisi specifiche su
sub campioni inferiori alle 100 unità (Hoinville - Jowell 1991, 9192); se l’intera indagine verte sulle caratteristiche di sub campioni,
78
ciascuno di questi dovrebbe raggiungere almeno le 400 unità (numerosità che consente di avere, per variabili dicotomiche, P=95%
ed E=5%).
3.4 TIPI DI CAMPIONAMENTO
È bene a questo punto descrivere sinteticamente i tipi di campionamento più diffusi. Tra quelli cosiddetti probabilistici, ovvero che
consentono l’inferenza statistica dei risultati all’universo
(all’interno dei margini di attendibilità e con le avvertenze sopra
detti), si possono ricordare i seguenti.
Il campionamento casuale semplice. È quello casuale per eccellenza. Esso presuppone tuttavia l’esistenza e l’accessibilità di una lista aggiornata dei membri dell’universo: come osserva Bailey
(1985, 105), “un campione non può essere più accurato della lista
di campionamento da cui è tratto”.
Nei casi, non infrequenti, in cui non esiste una lista di membri
dell’universo, viene utilizzato il campionamento sistematico, ottenuto selezionando un caso ogni k, fino a raggiungere la numerosità
desiderata. Il valore k=n/N viene detto ‘passo di campionamento’.
Per evitare distorsioni non prevedibili, si è soliti estrarre a sorte un
numero compreso tra 1 e k e iniziare da questo il campionamento
sistematico.
Esempio: come campionare i visitatori di un museo, dal momento
che è noto il totale medio giornaliero dal numero dei biglietti venduti, ma non l’identità dei singoli visitatori (non esiste una ‘lista’).
Se il campione da selezionare ha una numerosità totale di 1.000
unità e i visitatori giornalieri sono 50.000, il ‘passo di campionamento’ è di 50. Estratto a sorte un numero compreso tra uno e 50,
ad esempio 37, intervisterò il 37° visitatore, poi l’87° (=37+50),
seguito dal 137° e così via.
Si noti che il procedimento è utilizzabile anche quando il numero
complessivo di unità dell’universo è conosciuto solo in modo approssimato. Occorre tuttavia prestare molta attenzione ai rischi di
distorsione: se i visitatori del museo dell’esempio precedente sono
compresi tra le 40.000 e le 60.000 unità ed il passo di campionamento è stato prudenzialmente definito in 40 (1.000/40.000), si potrebbero esaurire le interviste prima della fine delle visite, escludendo dal campione persone che, per ragioni di lavoro, possono
recarsi al museo solo verso la fine dell’orario di chiusura. Per evitare la distorsione che deriverebbe dall’escludere dalla rilevazione
questa quota di popolazione, è possibile o mantenere il passo di
79
campionamento intervistando un numero maggiore di soggetti
(1.250 invece che 1.000 se i visitatori sono 50.000 ed il passo di
campionamento scelto era 40), ovvero ‘allungare’ il passo di campionamento nel corso della rilevazione una volta corretta la stima
dell’universo.
Come si vede dall’esempio, ogni scostamento dalla procedura di
selezione casuale può generare distorsioni, che debbono quindi essere attentamente controllate. Di contro, il sano buon senso che
costituisce la qualità primaria del ricercatore può suggerire le correzioni più opportune senza per questo rinunciare all’indagine.
Un’esaustiva trattazione delle modalità pratiche di effettuazione di
un campionamento casuale o sistematico nelle più diverse situazioni di ricerca è contenuta in Hoinville e Jowell (1991).
Il campionamento stratificato. Viene utilizzato quando è nota la
distribuzione nell’universo di alcune variabili rilevanti per
l’oggetto dell’indagine. Non si deve dimenticare infatti che la numerosità del campione è legata alla variabilità (eterogeneità)
dell’universo, rappresentata da s2 nelle formule del campionamento. Se quindi tale universo viene scomposto in sub universi maggiormente omogenei, è possibile avere una serie parziale di s2 propri di ogni sub universo la cui somma è inferiore al valore dello
stesso parametro relativo all’intera distribuzione. Ciò consente una
minore numerosità di n restando fissi gli altri parametri, ovvero un
E più ridotto o un P più elevato a parità di n.
Esempio: se con l’indagine si intende analizzare la diffusione di
alcuni beni di consumo durevole, che si sa essere correlati al reddito, disponendo della lista dei contribuenti è possibile estrarre un
campione casuale per ogni fascia di reddito significativa in luogo
di un campione casuale dell’intera distribuzione. Naturalmente
l’efficacia di questo metodo è legata, innanzi tutto, al fatto che i
diversi sub universi siano davvero caratterizzati da una variabilità
interna inferiore a quella complessiva; in secondo luogo, al fatto
che davvero la variabile di stratificazione sia legata a quella oggetto d’indagine (Istat 1989a giunge addirittura ad affermare che il
legame tra la variabile di stratificazione e quella investigata deve
essere di tipo deterministico: si tratta ovviamente di un’ipotesi estrema, dal momento che in tal caso sarebbe inutile rilevare la variabile dipendente, essendo nota la distribuzione di quella indipendente). Se questi due requisiti non sono congiuntamente presenti, è
bene evitare il campionamento stratificato, correndo magari il rischio di scoprire, con la ricerca, che la variabile usata per la stratificazione non è affatto legata a quella investigata.
80
Il campionamento stratificato può essere proporzionale o non proporzionale. Il primo si ha quando l’incidenza dei diversi strati sul
totale del campione è pari a quella registrata nell’universo; il secondo quando è diversa. Le ragioni per realizzare un campionamento non proporzionale sono facilmente comprensibili: accade
spesso, infatti, che in una ricerca si intenda valutare come si distribuisca il fenomeno osservato tra due componenti della popolazione che assumono peso diverso. Ad esempio, nell’ambito di una ricerca sul comportamento elettorale degli italiani si intende valutare
specificamente come votino i giovani. Poiché questi possono costituire solo il 20% dell’universo, in un campione di 1.000 casi sarebbero pari a sole 200 unità; molto poche per garantire accettabili
valori di P ed E rispetto a questo sub universo. È possibile in questo caso assegnare un peso pari al 50% del totale al sub campione,
ottenendo così una numerosità più accettabile: nell’esempio, 500
unità. È ovvio tuttavia che in questo modo i risultati del campione
possono essere estesi all’universo solo a seguito di un’operazione
di ponderazione che ‘deflazioni’ il valore medio del campione dalla sovra rappresentazione di una sua componente. Se ad esempio
risulta che i giovani accordano la loro preferenza al partito ‘x’ per
il 50% e i non giovani per il 20%, la media dell’universo non sarà
ovviamente
uguale
a
(50+20)/2=35%,
bensì
a
50*0,2+20*0,8=10+16=26% (+/- E).
La ponderazione dei singoli valori è molto faticosa e di conseguenza l’uso di un campionamento stratificato non proporzionale
dipende dal grado in cui si intende fare costante riferimento ai vari
subcampioni nell’analisi dei dati.
Occorre aggiungere che nel campione stratificato non proporzionale andrebbe messa in conto un’ulteriore perdita di validità derivante dalla ponderazione (Hoinville - Jowell 1991, 95), mentre in linea più generale ogni allontanamento del disegno del campione
dalla procedura casuale dovrebbe essere incorporato nei risultati
finali moltiplicando E per un coefficiente (superiore a uno, che può
raggiungere anche il valore di 2,5) detto ‘effetto disegno del campione’ (Ibid., 101).
Un caso particolare di campionamento stratificato proporzionale è
costituito dal piano fattoriale di campionamento, che si usa quando si intendono ricercare delle relazioni tra variabili distribuite in
modo molto eterogeneo nella popolazione. Supponiamo ad esempio di voler analizzare i legami tra età, appartenenza religiosa,
condizione di separato o divorziato e voto. È evidente che la variabile ‘appartenenza religiosa’ sarà in Italia fortemente sbilanciata a
81
favore dei cattolici, mentre separati e divorziati hanno
un’incidenza modesta sul totale degli elettori. In luogo di un complicato schema di campionamento stratificato non proporzionale
possiamo porre la condizione che ogni modalità delle diverse variabili presenti la stessa frequenza (il caso più semplice è quello di
variabili dicotomiche) anche all’interno dei singoli incroci: in questo modo le relazioni tra variabili ottenute non saranno influenzate
dalla numerosità relativa dei diversi strati e dalle relazioni spurie
che di norma esistono tra variabili (per un approfondimento cfr.
Chiari - Corbetta 1973).
Il campionamento a grappolo o multistadio. È il più ‘sospetto’ tra i
campioni probabilistici a causa dell’elevato rischio di distorsione
che presenta. Esso si basa su di un principio di economicità della
rilevazione spesso decisivo per la sua stessa effettuazione. Prevede
il campionamento ‘a catena’ di unità di aggregazione dei membri
dell’universo fino a selezionarne alcune che costituiranno oggetto
della rilevazione.
Esempio: come costruire un campione rappresentativo di 1.000
studenti in una regione. Le procedure del campionamento casuale
semplice suggerirebbero l’estrazione da una lista regionale di studenti. Questa è purtroppo inesistente, ed i costi della sua costruzione proibitivi. È possibile allora effettuare una stratificazione
delle scuole esistenti per tipo, poi un’estrazione casuale di scuole
all’interno di ogni tipo, poi ancora un’estrazione casuale di classi
all’interno delle scuole selezionate, ed infine intervistare gli alunni
delle classi così estratte. È evidente nell’esempio che, anche se i
membri dell’universo sono gli studenti, l’estrazione casuale riguarda, nella prima fase, le scuole e nella seconda le classi; gli
studenti non sono mai oggetto di campionamento. Quindi si deve
supporre che la rappresentatività delle scuole e delle classi stia per
quella degli studenti. Il che non è detto. Le variabili di contesto
possono infatti creare distorsioni notevoli. Supponiamo ad esempio che tra le scuole selezionate prevalgano quelle a indirizzo tecnico e che tale caratteristica influenzi le risposte al questionario:
un campione casuale semplice di studenti avrebbe evitato la distorsione generata dall’aver campionato le scuole.
Prima che si diffondesse la tecnica delle interviste telefoniche il
campionamento multistadio era molto usato nelle ricerche su aree
territoriali molto vaste (ad es., campione nazionale di residenti).
Due sono al riguardo le procedure possibili. La prima consiste nella costruzione di una tipologia di unità di campionamento (ad es., i
comuni) che incorpori una parte della variabilità totale; ad esempio, distinguendo tra comuni urbani e rurali, del centro, del nord e
82
del sud, tra piccoli, medi e grandi comuni, dovrebbe essere possibile tenere sotto controllo alcuni effetti di contesto sulle variabili
individuali. La seconda procedura, che può essere applicata direttamente o in aggiunta alla prima, consiste nell’assegnare ad ogni
unità di campionamento una probabilità di estrazione proporzionale alla distribuzione delle unità di rilevazione: nel caso di un campione di residenti, assegnando ai comuni una probabilità pari al
loro numero di residenti rispetto al totale della popolazione (cfr.
Hoinville - Jowell 1991, 98-100).
Anche in questo caso, peraltro, alcune cautele di buon senso possono evitare le distorsioni più gravi (ad esempio, stratificare correttamente le scuole per tipo e localizzazione; ponderare la scelta
delle scuole sulla base del numero degli studenti; non selezionare
troppe classi all’interno della stessa scuola; effettuare l’indagine in
giorni in cui le assenze non generino distorsioni sistematiche, come accadrebbe se il questionario venisse somministrato nella settimana in cui gli studenti delle famiglie più abbienti fossero in vacanza).
Nell’ambito dei campioni probabilistici due ultime notazioni vanno segnalate. La prima riguarda il fatto che l’errore di campionamento non è, ovviamente, l’unico tipo di errore che può affliggere
una survey: esiste anche un errore di misurazione che può aggiungersi al primo. Inoltre, ed è un aspetto mai abbastanza sottolineato,
i margini di affidabilità entro i quali è possibile estendere i risultati
del campione all’universo vengono di solito calcolati a priori, nel
momento in cui si procede al disegno campionario. È esperienza
comune, tuttavia, che quasi mai i soggetti selezionati corrispondono a quelli realmente intervistati, per una pluralità di ragioni, ben
note a chiunque faccia ricerca sul campo: irreperibilità o indisponibilità all’intervista dei soggetti; questionari incompleti o mal
compilati; ecc. Le interviste mancate, inoltre, non sono quasi mai
distribuite in modo casuale, poiché riguardano fasce particolari
della popolazione: chi non ha una residenza o un telefono, chi
cambia spesso residenza, le persone in età più avanzata o con minor livello d’istruzione, minoranze etniche o religiose, individui o
gruppi devianti, ecc. È pertanto necessario, innanzi tutto, costruire
delle liste di campionamento che consentano la sostituzione delle
interviste mancate con soggetti analoghi (si veda più avanti al §.
6.2.1); in secondo luogo, valutare l’attendibilità del campione rispetto all’universo non solo ex ante, ma soprattutto ex post.
I campioni non probabilistici sono quelli i cui risultati non possono essere estesi all’universo con margini noti e predefiniti di affidabilità. L’assenza di questa fondamentale caratteristica non ne
83
inficia peraltro l’utilità. In primo luogo perché dati non completamente affidabili sono sempre meglio dell’assenza totale di dati. In
secondo luogo perché le scienze sociali assegnano valore anche a
conoscenze non trasferibili in modo automatico a popolazioni più
ampie di quelle sondate con un questionario.
Esistono molti casi in cui un campione sicuramente non rappresentativo è comunque utile: basti pensare al test di un questionario operato volutamente sulla fascia a minor livello d’istruzione
dell’universo oggetto d’indagine. Ciò non consente tuttavia di considerare i campioni non probabilistici come succedanei di quelli
probabilistici, come accade nelle ricerche che tendono comunque a
presentare i risultati di questi campioni come estendibili all’intero
universo. Fermo restando che tale estensione con parametri
d’incertezza noti è possibile solo con i campioni probabilistici, si
può dire che anche un campione non probabilistico può essere accettabile, qualora siano controllabili i principali fattori di distorsione.
Campionamento per quote. Obbedisce alla stessa logica di quello
stratificato e si realizza assegnando al rilevatore l’onere di intervistare numeri predeterminati di soggetti che presentino le caratteristiche predefinite. Conoscendo, ad esempio, la distribuzione per
sesso, età e titolo di studio dei disoccupati, è possibile realizzare
un disegno di campionamento in cui ogni casella del disegno (ad
esempio, donne laureate con meno di trent’anni) abbia lo stesso
peso sul totale nel campione e nell’universo. Va da sé che in questo caso, essendo demandato al ricercatore il compito di selezionare i soggetti da intervistare (che nel campionamento proporzionale
vengono invece selezionati con procedura casuale, ad esempio
mediante sorteggio), non sussistono i requisiti del campionamento
casuale. Peraltro questa modalità di campionamento ha un qualche
valore nei casi in cui le variabili di stratificazione risultino fortemente correlate con quelle oggetto dell’indagine. Il presupposto su
cui si basa questa tecnica è infatti che le caratteristiche di stratificazione siano molto più rilevanti di tutte le altre nel determinare i
fenomeni oggetto della ricerca. Inutile dire che, purtroppo, questo
presupposto è, nelle scienze sociali, quasi sempre irrealistico. Inoltre, decisivo è il ruolo dell’intervistatore, che deve essere dotato
del buon senso e della sensibilità di effettuare una selezione di
soggetti che non presenti il rischio di una distorsione sistematica.
Altri tipi di campioni non probabilistici sono usualmente citati dai
manuali: ad esempio quello ‘a casaccio’, ottenuto intervistando
‘chi capita’: è ovvio che si tratta del più lontano dai requisiti della
casualità in senso statistico, quindi del meno affidabile. Va ricor-
84
dato invece il campionamento ‘a valanga’, ottenuto intervistando
una prima persona ‘a casaccio’ e chiedendo poi a questa di indicare altri soggetti da intervistare. Utilizzato in casi molto specifici
(ad esempio, quando si tratta di entrare in un universo molto chiuso, perché lontano dalla cultura del ricercatore, e sul quale non si
dispone di informazioni iniziali) può dare risultati non disprezzabili.
Un tipo particolare di campione non probabilistico, che a nostro
avviso non può essere assimilato agli altri, è costituito dal cosiddetto ‘campione di esperti’ (così Guala 1991, 253) o ‘campione
sociologico’ (Mongardini 1984). In questo caso vengono selezionati individui particolarmente competenti in ordine al problema
oggetto della ricerca, intervistando i quali ci si prefigge di ottenere
informazioni significative quanto quelle desumibili da un campione più ampio di soggetti. Utilizzato sia nel metodo ‘Delphi’ che
nell’individuazione dei cosiddetti ‘testimoni qualificati’ (Del Zotto
1988), si differenzia dagli altri perché in questo caso si selezionano
individui che parlano ‘al posto di’ molti altri e non ne costituiscono quindi un campione in senso statistico. In altri termini, siamo
davanti ad una strategia di ricerca diversa dalla survey. D’altro lato
è appena il caso di accennare al fatto che non solo nell’indagine
con questionario si pone il problema di selezionare alcuni soggetti
da analizzare da un universo più ampio. È evidente che tale problema non necessariamente va risolto adottando la strategia del
campionamento, in quanto altri criteri di selezione potranno rispondere alle esigenze della ricerca.
Questo tipo di campione è spesso utilizzato anche nell’individuazione dei soggetti da intervistare nelle fasi preparatorie del
questionario (cfr. Hoinville - Jowell 1991, 37).
85
4 COSTRUIRE
UN QUESTIONARIO
4.1 IL QUESTIONARIO COME CONTENITORE DI ‘OGGETTI’
L’etimologia di ‘Questionario’ rinvia a latino quærere, che significa ‘cercare’ e, per estensione, domandare. Ma il questionario non è
solo un insieme di domande; benché sia questo il tipo di questionario più diffuso, è meglio pensare ad esso come ad un contenitore di
‘oggetti’ (o item, per utilizzare la diffusa locuzione inglese).
In questo modo si sgombera il campo da numerose idee sbagliate,
e si guadagna in flessibilità. Il questionario, secondo questa concezione, si riduce a mero supporto fisico, contenitore di ‘oggetti’ di
carattere anche molto diverso (ma tutti idonei a sollecitare informazioni); l’attenzione si sposta quindi su questi oggetti, obbligandoci ad una riflessione più approfondita sulla loro ragione e sul
loro uso, anche alla luce di quanto già detto a proposito dei concetti.
Le operazioni relative al questionario inteso meramente come supporto saranno trattate più avanti; nei prossimi paragrafi ci si addentrerà invece nella complessa questione della definizione dei vari
item, ad iniziare dalle domande che restano, certamente, quello più
immediato e logico.
4.2 LE DOMANDE: CONCETTI GENERALI
A prescindere dai problemi relativi alla comunicazione sociale
come ce li raccontano semiologi e sociologi, possiamo semplificare molto il meccanismo dell’interazione personale sostenendo che
una normale conversazione fra due persone, mediamente rappresentative e senza particolari problemi, si svolge in modo simmetrico e con alternanza reciproca degli interventi. La persona A, p.es.,
saluta la persona B che risponde con cortesia, e questo basta per
adempiere ai doveri di ‘riconoscimento’ reciproco che precedono
l’interazione; poi A interpella B su una questione; B risponde e
pone un’altra questione, e così via. In un’interazione di questo genere, come ne produciamo centinaia nel corso di una giornata, assolviamo compiti diversi, parte strumentali e parte simbolici.
Nell’intervista, specialmente quella realizzata tramite questionario,
le cose stanno in modo diverso. Innanzitutto il rapporto è assai sbilanciato (uno fa le domande e l’altro risponde), ma poi (ed è ciò
86
che importa sottolineare ora) l’interazione subisce una fortissima
mediazione dovuta al fatto che viene realizzata solo in quanto
componente essenziale della ricerca. L’intervistatore non si sarebbe mai sognato di andare a casa dell’intervistato per porgli quegli
argomenti; e l’intervistato, probabilmente, non avrebbe mai immaginato di perdere tempo, quel giorno, per rispondere proprio a
quelle domande. Qualunque ricerca quindi interviene perturbando
il campo, ed ogni intervista, in particolare, simula una conversazione ma è un’altra cosa; se poi l’intervista è ingabbiata nella rigida struttura di un questionario, e se infine il questionario non presenta ‘semplicemente’ solo delle domande ma anche scale, storielle, ecc., allora della normale interazione fra individui resta ben poco.
Si incomincia a capire perché i questionari siano tanto diffusi anche fra non specialisti e così spesso rovinosamente sbagliati. Il
questionario, col suo uso della lingua corrente, con la sua apparente forma dialogica, sembra la copia di un normale colloquio, di
un’interazione verbale realizzata come le mille quotidiane che sperimentiamo. In realtà il questionario è uno strumento con delle regole, che sollecita l’interlocutore in modo solo grossolanamente
simile ad uno scambio comunicativo normale. È importante rendersi conto di questo quando si realizza e somministra un questionario, perché diversamente si può incorrere in grossolani errori,
tipici nei ricercatori improvvisati (Bezzi e altri 1989).
Limitatamente al particolare ‘oggetto’ del questionario definito
‘domanda’, è opportuno introdurre la sua illustrazione con alcuni
concetti generali.
La cosiddetta domanda mira a verificare (al pari di altri oggetti), lo
stato di un caso su una data proprietà, al fine di una sua registrazione. Cosa vuol dire ciò?
I ‘casi’ sono gli oggetti di cui si occupa una ricerca, ovvero i singoli individui intervistati tramite un questionario (in altri contesti
di ricerca il caso potrebbe essere l’unità familiare, oppure un’unità
geografica, un’istituzione, ecc.); le ‘proprietà’ sono concetti riferibili ai casi, loro attributi che possono assumere aspetti diversi, variabili (in generale distinguiamo come ‘proprietà’ gli attributi reali
di oggetti reali, e come ‘variabili’ la registrazione degli stati di una
proprietà in una matrice dati attraverso una definizione operativa vedi Marradi 1981, 617; Marradi 1993, 10; vedi anche Agnoli
1992, 142; diversi autori confondono i due termini all’interno di
una scarsa chiarezza concettuale fra casi e loro proprietà - p. es.
Phillips 1972, 89 e Pellicciari - Tinti 1983, 50 -; è importante invece una precisione anche terminologica degli operatori concettuali
87
che usiamo. Occorre anche distinguere bene fra concetti e variabili, poiché vi è un nesso preciso fra loro; per questo vedi Lazarsfeld
1967, 188); ogni diverso aspetto che può assumere una data proprietà si dice ‘stato’. Per esempio, tutti gli individui hanno la proprietà sesso; tale proprietà può assumere due stati: maschio o
femmina (dal punto di vista della statistica casi, proprietà e stati
vengono chiamati, rispettivamente, ‘unità statistiche’ o ‘unità di
rilevazione’, ‘caratteri’ e ‘modalità’ - Leti 1983, 73-74) che si rivela essere, quindi, una variabile. Quando realizziamo la nostra intervista chiediamo, p.es., quale sia lo stato rispetto alla proprietà
sesso, e registriamo ‘maschio’ se appartiene anagraficamente alla
categoria dei maschi o ‘femmina’ nell’altro caso.
Ogni proprietà deve avere almeno due stati (come nel caso maschio/femmina); se ne ha meno di due (“Lei è un essere umano?”;
possibile unica risposta: SI) la proprietà non è ‘variabile’ e, di regola, non interessa la sua registrazione e non viene inserita nel
questionario.
Alle domande devono seguire delle risposte, e nei questionari si
distinguono usualmente le domande che prevedono già una lista di
risposte entro le quali ridurre il pensiero dell’intervistato (domande
chiuse), da quelle che non presentano tale lista preventiva e che
accoglieranno per esteso il suo pensiero (ovvero ciò che ne verrà
registrato: domande aperte). In questo capitolo si tratterà ampiamente della differenza fra domande chiuse ed aperte, ma prima occorre puntualizzare alcuni principi generali indispensabili per approntare a priori una lista di risposte in una domanda chiusa, ovvero per ‘chiudere’ successivamente una aperta.
Se la proprietà da accertare è ‘discreta’, ovvero ha in natura un
numero di stati diversi, irriducibili e in numero finito, oppure ancora se non si tratta di registrare stati su una proprietà ma di enumerare oggetti od eventi (p.es. numero di stanze di un’abitazione,
numero di infrazioni commesse da un automobilista, ecc.) la composizione delle risposte è in generale piuttosto semplice: o si riportano tutti i possibili stati perché tutti noti (come nel caso maschio/femmina), o se ne riportano i più usuali aggiungendo una
categoria ‘altro’, o se ne aggregano alcuni perché giudicati simili,
ecc.; il problema diviene più spinoso nel caso di proprietà continue. Qui i problemi di riduzione delle infinite possibili risposte (i
possibili infiniti stati) sono diversi, come vedremo più avanti (sui
concetti di ‘continuo’ e ‘discreto’ vedi Leti 1983, 85-87).
Occorre ancora fare alcuni accenni al problema della classificazione; le categorie di risposta che si pongono sotto ogni domanda
chiusa non sono altro che il prodotto di operazioni di classificazio-
88
ne; se alcune sono semplici da immaginare, come nel caso Maschio/Femmina, a volte il ricercatore deve fare veramente uno
sforzo di creatività e di grande attenzione per ordinare un numero
gestibile di risposte che soddisfino i requisiti generali di ogni classificazione: l’esaustività, la mutua esclusività ed l’unicità del criterio (fundamentum divisionis).
Va posta particolare attenzione alla grande importanza di questi tre
requisiti delle classificazioni, che sono anche quindi requisiti di
ogni lista di risposte alle domande del questionario.
Con esaustività si intende che l’elenco deve comprendere tutte le
possibili esperienze e situazioni ascrivibili a qualunque caso. Nessun intervistato deve trovare, insomma, che la risposta che vuole
dare per descrivere la propria situazione (il suo stato sulla proprietà) non è prevista nell’elenco. Questa condizione si può realizzare
solo conoscendo con certezza tutti i possibili stati sulla proprietà;
in caso ciò non sia possibile, e se si tratta di una domanda chiusa
(dove cioè la classificazione viene impostata prima di realizzare le
interviste), si utilizzano escamotage quali l’utilizzo di una classe
‘altra risposta’, che vedremo meglio più avanti.
Con mutua esclusività si intende una condizione altrettanto importante della precedente ma spesso più sfuggente, relativa alla necessità, per le varie classi (o categorie di risposta, nel caso del questionario) di non essere in alcun caso sovrapposte sul piano logicosemantico; se così fosse, se cioè alcune categorie si confondessero,
almeno in parte, fra loro, l’intervistato non saprebbe esattamente
come collocarsi, e ancor peggio il ricercatore non saprebbe discernere, dalla registrazione comunque fatta della risposta, il suo reale
stato sulla proprietà. Un esempio di cattiva classificazione sotto
questo profilo può essere questo, relativo alle professioni:
Quale attività lavorativa svolge?
[1] Addetto all’agricoltura
[2] Operaio
[3] Impiegato
[4] Segretaria/o
[5] Dirigente
[6] Commerciante
[7] ...
A prescindere da altre considerazioni su questa lista, si vede bene
come la categoria ‘impiegato’ sia almeno in parte coestensiva delle
due seguenti. Tutti i segretari sono anche impiegati; molti dirigenti
lo sono. Un impiegato che svolge l’attività di segretario non sa-
89
prebbe quale casella barrare, fra quella più generale (impiegato) e
quella più specifica (segretario).
Se questo esempio è piuttosto banale, il rischio della sovrapposizione di classi di risposta è sempre dietro l’angolo, e molto frequente in questionari improvvisati o realizzati da non specialisti.
Infine, l’unicità del fundamentum divisionis: una classificazione
non può contenere stati relativi ad una proprietà e stati di un’altra
proprietà (eppure accade); per esempio non va bene questa classificazione del genere umano:
1) Europei
2) Asiatici
3) Africani
4) Parigini
5) Buoni d’animo
A prescindere da altre considerazioni, ‘Parigini’, nella scala di generalità, sta ad un livello assai più basso delle prime tre categorie
(in questo caso la scala di generalità è, p. es.: Terrestri / Europei /
Francesi / Parigini / Del quartiere di ... / Monsieur Dupont); questo
può essere accettabile nella costruzione della nostra tipologia solo
con un chiaro riferimento all’oggetto della ricerca, alle definizioni
operative, e così via. ‘Buoni d’animo’ appartiene invece alla proprietà ‘qualità etica’ e non ‘zona geografica di residenza’, ed è assolutamente sbagliata come categoria in questa tipologia; si affaccia qui infatti la possibilità di essere, contemporaneamente, Europei e Buoni d’animo avendo mescolato nella stessa classificazione
proprietà di genere diverso. Questo problema non si pone invece
con le categorie Europei e Parigini, poiché qui è inteso ‘tutti gli
europei ad eccezione dei parigini’ e ‘i soli parigini’.
Un esempio autentico di orrore classificatorio (citato in Bezzi e
altri 1989), che comprende diversi degli errori ora accennati è il
seguente, frutto di una codifica a posteriori della condizione ‘occupazione professionale’:
1) Libere professioni (Architetto, Archeologo, Artista, Ingegnere,
Magistrato, Notaio, Marketing, Public-relations, Psicologo, Ragioniere, Ricercatore)
2) Libero professionista
3) Impiegato
4) Non so
5) Altro (Stilista, Segretaria, Pubblicità, Polizia, Programmatore,
Militare, Imprenditore, Impegno sociale)
6) Insegnante
90
7) Management
8) Giornalista
9) Lavoro realizzante
10) Medico
11) Esperto in lingue straniere
12) Commercialista
13) Adeguato agli studi
14) Istruttore sportivo
15) Artigiano
16) Commerciante
Ciascuno si diverta da sé a riscontrarne i difetti.
Il problema della classificazione è presente in qualunque tipo di
item contenuto in un questionario, in quanto il prodotto così realizzato deve essere ridotto entro una matrice di dati; sia le domande
chiuse (con risposte già codificare) sia quelle aperte (con risposte
da codificare in seguito) come pure le scale ed ogni altro item sono
quindi interessate ai problemi della classificazione. Resta da chiarire meglio come e perché decidere a favore di un tipo o dell’altro
di domande; in parte si è risposto sopra, molto di più verrà chiarito
in seguito. Come orientamento generale preliminare sembra utile
riportare un elenco di ‘fattori circostanziali’ che Kahn e Cannel,
riprendendo da Lazarsfeld, suggeriscono come orientativi per una
scelta in merito:
1) Gli obiettivi dell’intervista (o della parte dell’intervista in questione).
2) Il grado di conoscenza, o il livello di informazione, dell’intervistato sull’argomento in questione.
3) La misura in cui l’argomento è stato meditato a fondo da parte
dell’intervistato, in modo che le sue idee e opinioni in proposito siano
ben strutturate.
4) La facilità con cui il materiale in questione può essere comunicato dall’intervistato, o la misura in cui egli è motivato a comunicare
su questo argomento.
5) La misura in cui l’intervistatore, ancora prima di iniziare
l’intervista, conosce la posizione dell’intervistato per quanto riguarda
questi fattori (il suo livello di informazione, la struttura degli atteggiamenti, la motivazione, e la capacità di comunicare) (1968, 176)
A questo elenco problematico, centrato sull’intervistato, ne va aggiunto uno analogo centrato sul ricercatore (il grado di conoscenza
del ricercatore sull’argomento in questione, ecc.).
91
4.3 LE SCALE ED I TERMOMETRI
Probabilmente gli oggetti più diffusi nei questionari, subito dopo le
domande, sono le scale, nome generico di una famiglia di strumenti piuttosto articolata al suo interno.
Le tecniche di costruzione delle scale, ed ancor più le implicazioni
teoriche e metodologiche ad esse collegate sono tali e tante da rendere necessario il rinvio a testi specifici, peraltro non sempre concordi nella stessa classificazione dei diversi tipi di scale (si veda
comunque quanto già scritto al §. 2.3).
In generale gli autori concordano nel ritenere le scale uno strumento per trattare proprietà qualitative in modo quantitativo, ovvero
per misurarle. Questa propensione alla ‘misurazione’ ha prodotto
una grande diffusione di questi strumenti spesso a scapito di una
riflessione sui concetti implicati (quali, appunto, quello di misurazione) e sul conseguente prodotto proposto, come nel caso della
cosiddetta scala nominale (Marradi 1980).
Si eviterà qui di ripercorrere, anche sommariamente, le riflessioni
sul concetto di misurazione (Marradi 1980; Leti 1983, 83-85; Cannavò 1989, 40-44; Marradi 1991), su quello di continuum (Goode Hatt 1969, 362-364); sui problemi relativi alla suddivisione dello
spazio concettuale rappresentato dal continuum di intervalli discreti connotati da opportuni referenti linguistici (Frudà 1989); e così
via. Queste discussioni, pur estremamente importanti, esulerebbero
dai più limitati obiettivi di questo testo e richiederebbero un’ampia
ed autonoma trattazione.
Poiché però spesso le scale fanno parte dei questionari, si proporranno ugualmente alcuni accenni in particolare alla più diffusa, la
scala Likert, che assume grande importanza come specie particolare di item chiuso (Russo - Vasta 1988, 12).
Le Likert fanno parte della cosiddetta famiglia delle ‘scale ordinali’, che consentono cioè di ordinare gerarchicamente degli oggetti
(opinioni, atteggiamenti). Le posizioni lungo la scala (generalmente cinque) hanno solo una connotazione ordinale, ed assolutamente
mai cardinale; ovvero 1 è meno di 2, 2 è meno di 3, ma 4 non è il
‘doppio’ di 2, e la ‘differenza’ fra 2 e 3 non è detto sia identica a
quella fra 3 e 4 (Phillips 1972, 306).
Usualmente la Likert si presenta come un’affermazione (più spesso una batteria di affermazioni, quali indicatori dello stesso concetto) rispetto alla quale l’intervistato deve dichiarare il grado di accordo scegliendo fra cinque risposte di questo genere:
Molto contrario
92
Abbastanza contrario
Dipende; in parte contrario ed in parte d’accordo
Abbastanza d’accordo
Molto d’accordo
alle quali si dovrà aggiungere, almeno a livello di codifica, ‘Non
risponde’. La scelta delle espressioni lessicali utilizzate nella scala
è molto importante, e oggetto di molte discussioni; come afferma
Frudà:
Prescindendo dal tipo di tecniche, uno dei problemi iniziali è il
controllo linguistico del processo di comunicazione-percezione [...].
Se sono chiari gli estremi [del continuum] (anche se relativizzati ad
una percezione soggettiva o convenzionalizzata sul momento), non
sono per nulla chiari i gradi intermedi ed è molto ampia la fascia di
possibili collocazioni anche in termini di linguaggio e percezione comune (1989, 9-11)
Questo problema nasce spesso in questionari che intendono risolvere questioni complesse relative a giudizi, valutazioni, percezioni,
o altro, con la proposta di scale estemporanee che utilizzano termini linguisticamente ambigui come ‘discreto’, ‘sufficiente’, ‘modesto’, ecc.
Benché le Likert, con le sue cinque espressioni considerate generalmente chiare, non soffra di rilevanti distorsioni di questo tipo,
può essere utile anche per loro proporre un doppio ancoraggio,
semantico e grafico, per rendere evidente all’intervistato che il
grado di accordo sulla frase è da intendersi come relativo a spazi
semantici identici; una buona soluzione è quindi fornire
all’interlocutore un cartoncino con una raffigurazione della scala
che si ‘appoggia’ ad un regolo graduato (per una discussione vedi
Amisano - Rinaldi 1988; anche Razzi 1992) di questo tipo:
Molto
contrario
Abbastanza
contrario
Dipende
Abbastanza
d’accordo
Molto
d’accordo
Benché non indispensabile è comunque assai opportuno pensare
alla Likert come ad una batteria di scale, ovvero una pluralità di
indicatori dello stesso concetto che assumono la forma di frasi (o
di storielle), e questo perché, diversamente da altri indicatori, più
immediati, una frase è una rappresentazione linguisticamente
complessa di un concetto, costruita ad hoc e di cui il ricercatore si
aspetta un livello di indicazione che resta, però, indefinito.
93
Il problema vero, nelle Likert, è appunto la costruzione di queste
frasi-indicatore. Posto che, ovviamente, occorre collocarsi saldamente entro il processo di concettualizzazione, ed orientarsi con
buona sicurezza entro confini teorici noti, in letteratura si indicano
diversi modi per definire la validità delle scale. Si può far ricorso
ad una ‘giuria’ di esperti, ai cosiddetti ‘gruppi noti’ (persone notoriamente orientate in modo antitetico rispetto all’oggetto), o a ‘criteri indipendenti’ (elementi oggettivi esterni alle scale) (Goode Hatt 1969, 367-370); oppure si possono applicare test successivamente alla somministrazione, per scartare quelle frasi che hanno
raccolto consenso sia da chi si colloca complessivamente, nella
batteria, in modo accentuato in un versante del continuum sia da
chi si colloca nell’altro versante, frasi cioè che non discriminano
(item analysis). In ogni caso vanno evitate frasi strutturalmente
complesse con più di un oggetto (double barelled), o con frasi
doppie o con un doppio livello dichiarativo (“Alcune persone pensano che...”); occorre evitare frasi molto polarizzate sugli estremi
del continuum per non suscitare reazioni emotive, ma anche frasi
poco impegnative che alimentino problemi di ‘curvilinearità’ (che
producono la stessa risposta in soggetti di orientamento diverso);
occorre curare il lessico, ed in caso di ricerche mirate le frasi devono derivare da una buona cognizione degli argomenti trattati per
evitare che intervistati troppo competenti polemizzino
sull’eccessiva genericità od inesattezza delle proposte; occorre infine prevenire i possibili response set (acritica e sistematica risposta a tutti gli item di una batteria con la stessa scelta) invertendo
frequentemente la polarizzazione delle frasi (questo non impedisce
il response set, ma permette di evidenziarlo per consentire
all’intervistatore e/o al ricercatore di intervenire o di cassare successivamente questi questionari) (per un’ampia e documentata analisi vedi Cacciola - Marradi 1988).
In conclusione le Likert sono strumenti giustamente diffusi perché
consentono di ottenere velocemente informazioni sintetiche su argomenti complessi, ma va posta molta cura nella loro definizione,
somministrazione e verifica. Il ricercatore che intende utilizzarle
deve essere anche consapevole della fondatezza di alcune critiche
che ne limitano la portata euristica (numerose riflessioni e studi
sperimentali sull’affidabilità delle Likert e sulle principali distorsioni che producono in Marradi 1988a; Marradi - Gasperoni 1992),
e comunque è bene utilizzarle entro questionari contenenti più oggetti diversi, come contributo fra gli altri alla definizione (indicazione) di un concetto.
94
Come accennato all’inizio di questo paragrafo ci sono in realtà
molte altre tecniche di scaling, in generale più macchinose delle
Likert, spesso più criticabili, a volte utilizzabili solo in particolari
contesti di ricerca, come la sociometria (Schützenberger 1975), il
differenziale semantico (Bailey 1985, 405-406), ecc. Non se ne
parlerà qui, salvo accennare ad un tipo particolare di scala chiamato ‘termometro dei sentimenti’, approssimativa traduzione di feeling thermometer.
Il termometro, nella sua versione classica, si presenta, con supporto di gadget, come un vero termometro per la misurazione della
temperatura, con graduazione da 0 a 100 gradi ed intervalli di 5°.
Questo termometro è disegnato su un pannello, e a destra e a sinistra della ‘colonnina di mercurio’ vi sono righe, corrispondenti
alla graduazione. dove l’intervistato collocherà dei cartoncini, ciascuno dei quali reca impresso il nome di un oggetto. L’indicazione
operativa è di collocare verso le temperature ‘fredde’ gli oggetti
poco desiderabili, o socialmente distanti, o rispetto ai quali chi risponde è in disaccordo (secondo gli obiettivi della ricerca), e verso
le temperature ‘calde’ quelli desiderabili, vicini, ecc. Un esempio
di termometro tratto da una ricerca sui servizi pubblici urbani
(Bezzi - Raschi - Tirabassi 1990) è il seguente:
Veniamo ora a tutti quei servizi e strutture la cui presenza viene ritenuta utile o indispensabile nella zona in cui si abita.
61) Qui ci sono dei cartellini, in ciascuno dei quali vi è scritto un
‘servizio’ [MOSTRARE I GADGET] e questa è una figura che rappresenta un termometro graduato da 0 a 100 gradi. Si può servire di
questo termometro per darci un’idea delle sue preferenze riguardo ai
servizi riportati sui cartoncini. Collochi i servizi che ritiene indispensabili o giudica più importanti per rendere funzionale la zona in cui si
abita ad un alto grado. Collochi, invece, quelli che ritiene meno importanti in basso
SERVIZIO
GRADI
1) Asili nido
_____________________
2) Autobus
_____________________
3) Banche
_____________________
4) Bar, ristoranti
_____________________
5) Biblioteche
_____________________
6) Chiese
_____________________
7) Circoli associativi _____________________
8) Edicole
_____________________
9) Farmacie
_____________________
10) Illuminazione
_____________________
95
11) Negozi
_____________________
12) Nettezza urbana _____________________
13) Parchi
_____________________
14) Scuole materne
_____________________
15) Scuole elementari _____________________
16) Strutture sanitarie _____________________
17) Strutture sportive _____________________
18) Termin. amministr. _____________________
19) Ufficio postale
_____________________
Un vantaggio del termometro sulla scala Likert è che consente di
mettere in relazione oggetti diversi; le batterie Likert propongono
indicatori dello stesso concetto, ed anche pensando di utilizzare
più batterie non potremmo trarre indicazioni di carattere ordinale
fra i vari concetti e loro indicatori. Il termometro invece fa proprio
questo, consentendoci di rilevare, per ogni intervistato, non tanto il
‘punteggio’ che assegna ad ogni oggetto, ma la gerarchia dei ranghi interni.
Un problema tipico dei termometri consiste nella (eventuale) sistematica collocazione degli oggetti, da parte degli intervistati, nelle zone calde o nelle zone fredde del termometro; ciò apparirebbe
come sistematica sopravvalutazione o sottovalutazione del complesso degli oggetti del termometro, con una conseguente perdita
di informazione. In questi casi occorre ‘deflazionare’ il termometro sottraendo, ad ogni punteggio espresso per ogni singolo oggetto da ogni intervistato, il valore medio ottenuto ad ogni termometro. Se non si volesse intervenire con un deflazionamento si può
costruire il termometro in modo leggermente diverso e con istruzioni particolari.
Un metodo suggeribile è quello di costruire il termometro con n
intervalli, dove n = numero di oggetti da collocare; l’indicazione
per l’intervistato, in questo caso, è di collocare ogni oggetto in un
diverso intervallo del termometro, in modo che ogni ‘grado’ sia
affiancato da un solo gadget, e che tutti i gradi siano occupati. In
questo modo chi risponde è obbligato ad una riflessione gerarchica
(che è lo scopo dei termometri) e non occorre intervenire con un
deflazionamento.
4.4 GLI STIMOLI NON DIRETTIVI
Qui ci si allontana veramente molto da ciò che viene tradizionalmente inteso come idoneo per un questionario, e se ne dà pertanto solo un breve accenno.
96
Allo scopo di consentire il massimo di apertura al mondo vitale,
per ottenere più informazioni creando un ambiente distensivo per
l’intervistato, per contribuire all’attivazione di meccanismi proiettivi che lo inducano ad una maggiore spontaneità, si possono utilizzare tecniche prese in prestito da altri tipi di approccio alla ricerca: per esempio vignette e storielle.
L’uso di vignette deve moltissimo a tecniche proiettive utilizzate
dagli psicologi. Per i sociologi la vignetta ha più che altro lo scopo
di sollecitare su una questione affettiva, relazionale, comunque
fortemente simbolica, difficilmente esprimibile in lingua, meno
che mai come ‘domanda’. Lo scopo della vignetta è far riflettere
l’interlocutore e consentirgli un’ampia ed articolata espressione del
suo pensiero, e richiede quindi sempre un registratore (una discussione ed esempi in Russo - Vasta 1988).
Le storielle hanno scopi ed utilizzi simili, ma sono forse più fruibili all’interno di un questionario (riducendone di molto la loro portata sono infatti codificabili come le risposte a domande aperte).
Le storielle vengono redatte sulla base di materiali ‘vivi’: cronache
giornalistiche, fatti sperimentati, ecc. per creare un contesto verosimile e prossimo all’esperienza dei soggetti intervistati (le storielle
vanno ritarate per ogni ricerca), dove si muovono personaggi che
creano una situazione sulla quale l’interlocutore dovrà esprimersi.
In generale i ricercatori che lavorano con queste tecniche riferiscono le storielle a specifiche dimensioni concettuali (ovvero ogni
storiella è indicatore di qualche concetto specifico). Per illustrare
questa tecnica vediamo uno stralcio dell’archivio di storielle, tenuto in continuo aggiornamento da Alberto Marradi, utilizzato entro
una ricerca sulla partecipazione politica (Armillei - Bezzi - Tirabassi 1991); nell’esempio, la prima riga propone la dimensione
principale in cui si colloca la storiella, quelle successive le sottodimensioni; segue un’indicazione schematica della versione, autore ed eventuali precedenti ricerche in cui la storiella è stata utilizzata; dopo la storiella i probe (indicati con P - si veda più avanti il
§. 5.2.3); conclude, con la sigla OP, la “classe di oggetti politici ai
quali si riferisce l’atteggiamento indagato”, frutto di un’elaborazione degli autori della ricerca (Armillei - Bezzi - Tirabassi 1991,
74 e sgg.):
AUTOL (autoritarismo / tolleranza)
a) culto della gerarchia / adesione critica all’autorità
b) paternalismo / emancipazionismo
1. Irres 1990
97
Ai giardini pubblici un vigile sgrida un bambino che calpesta
un’aiuola e butta cartacce. Si avvicina la madre e il vigile le chiede se
il bambino fa così anche a casa, oppure se a casa è stato abituato a tenere pulito. Secondo lei perché il vigile fa questa domanda?
P1: La madre risponde al vigile di farsi gli affari suoi. Secondo lei
fa bene a fare così, oppure dovrebbe accettare l’appunto del vigile?
P2 [se l’intervistato dice che fa bene] Così lei pensa che una persona estranea alla famiglia non abbia il diritto di intervenire o di criticare l’educazione dei figli?
OP legittimità del regime
[...]
4. AUTOL [stesse dimensioni e sottodimensioni]
C. Bezzi + A. Marradi
Siamo in un ristorante del centro, all’ora di punta. Entra un ambulante africano per vendere ciondoli. Accorre il padrone dicendo: “Te
l’ho già detto che non puoi entrare a disturbare”. Da un tavolo un signore dice: “Questo è razzismo! Se non era africano lei non si permetteva questo tono”. Il padrone replica: “Che c’entrano gli africani? Qui
sto perdendo i clienti che vogliono stare in pace quando mangiano”.
Lei a chi darebbe ragione?
[SE L’INTERVISTATO DÀ RAGIONE AL PROPRIETARIO]
Sì, ma il fatto che lui usi quel tono non mostra che la vera ragione è il
razzismo?
[SE L’INTERVISTATO DÀ RAGIONE AL CLIENTE] Ma se
per paura di apparire razzisti permettiamo agli immigrati di fare quello
che non permetteremmo di fare ad altri, non finiremo in un razzismo
alla rovescia?
OP identità della comunità, criteri di ammissione
4.5 CRITERI PER DECIDERE L’INSERIMENTO DI ITEM
4.5.1 La rilevanza
La rilevanza è un criterio guida per tutta la ricerca, e quindi anche
di ogni sua parte. Ma se la rilevanza della ricerca perde le sue ragioni in aspetti meta-metodologici, la rilevanza dei singoli item
affonda le radici nella necessità di assolvere a doveri di validità ed
attendibilità. La rilevanza rispetto al problema della validità rinvia
a quanto scritto più oltre, mentre la rilevanza dello stimolo rispetto
al problema dell’attendibilità pone il problema di una conoscenza
non astratta del campo di indagine, ovvero l’attenzione agli intervistati, alla loro esperienza di vita che poniamo al centro della ricerca.
98
La domanda [deve] innanzitutto suonare rilevante, saliente agli intervistati, che sono spesso assai diversi per formazione, esperienze di
vita, carattere e cultura. [...] L’intervistato dovrebbe quindi essere motivato non solo dalla consapevolezza che il progetto di studio cui sta
offrendo la sua collaborazione ha un qualche valore scientifico ma anche dalla connessione fra i temi trattati e il suo ‘mondo vitale’.
Se le domande sono totalmente estranee agli interessi e/o esperienze dell’intervistato, si abusa della sua compiacenza, e si verrà di
solito ripagati con numerose risposte date senza alcuna convinzione, e
magari in modo totalmente accidentale (Pitrone 1986, 42-43; vedi anche Kahn - Cannel 1968, 161-163)
Come fare per conseguire tali obiettivi? Pitrone suggerisce lo studio pilota, che acquisterà via via più importanza per la strutturazione del questionario; l’impossibilità di tale studio preliminare comporterà l’utilizzo di un maggior numero di stimoli non direttivi e,
in particolare, di domande aperte, che come già detto consentono
di motivare maggiormente l’intervistato e di far emergere, almeno
in parte, il suo mondo vitale.
Il ricercatore deve comunque saper valutare i costi e le difficoltà
insite nei due procedimenti: lo studio preliminare comporta costi
monetari e tempi di esecuzione sensibili, non sempre compatibili
con le esigenze dell’ambiente in cui la ricerca viene proposta (problemi della committenza, necessità di risposte rapide ad un problema insorgente, ecc.); l’utilizzo di stimoli non direttivi pone problemi di gestione tecnica non sempre agevolmente superabili.
4.5.2 La previsione dell’elaborazione
Un criterio eminentemente tecnico per decidere l’inserimento di
item è la previsione dell’elaborazione.
Può accadere che un ricercatore giudichi interessante un item, in sé
sicuramente idoneo, valido ed attendibile, che poi non saprà utilizzare pienamente in fase di elaborazione e di interpretazione. Questo può accadere in particolare con alcuni stimoli non direttivi di
cui non si ha molta esperienza e di cui si è data illustrazione sopra,
ma anche con item più noti ma complessi.
Ideare una storiella e poi trattarla come una normale domanda aperta, solo un po’ più ingombrante, è spesso uno spreco di energie,
e può causare effetti distorcenti di non poco conto; ideare un termometro e non saperlo deflazionare idem. Insomma, per ogni stimolo che il ricercatore inserisce deve già esserci, almeno in nuce,
una chiara capacità di elaborazione.
99
In realtà ci sono poi altri problemi minori, presenti anche in relazione ad oggetti molto semplici come le domande chiuse. Un esempio classico è la codifica e l’immissione in matrice di domande
che prevedono risposte multiple.
Deve quindi valere, specie per i ricercatori meno esperti, una sorta
di regola aurea: non inserire mai in un questionario item di cui non
si ha piena consapevolezza dei relativi problemi di codifica, inserimento in matrice, elaborazione ed interpretazione.
Il problema qui segnalato non è comunque semplicemente una
questione di opportunità; il concetto di fondo di questo paragrafo è
relativo all’organicità di tutto il processo di ricerca, da intendere in
modo sistemico (Bruschi 1991, 43-46), per cui ogni parte del lavoro è logicamente e concretamente connesso agli altri: la definizione degli strumenti è legata alla precedente concettualizzazione
come alla successiva elaborazione.
4.5.3 La previa concettualizzazione
Questo è il criterio principe per decidere cosa inserire in un questionario.
In generale c’è un tipico campanello di allarme che deve far rendere conto i ricercatori che si stanno allontanando di molto da questo
criterio, ed è quando un membro del gruppo di ricerca che sta redigendo il questionario esclama “Mettiamo anche questa domanda!”,
proponendone una a suo avviso importante.
Motivi estemporanei di scelta per l’inserimento di item fanno solitamente capo a criteri (spesso impliciti e poco consapevoli) esterni
alla ricerca, perché interni ai ricercatori. Un’idea che sembra brillante, una curiosità da soddisfare, fanno riferimento al bagaglio
culturale del ricercatore e non alle necessità della ricerca. La ricerca ha sue logiche, come si è cercato in diverse parti di argomentare, e si deve perseguire una coerenza generale nel progetto;
se una ricerca ha degli obiettivi concreti ed una sua rilevanza specifica, il lavoro dei ricercatori inizia non con la redazione del questionario ma con la scelta dei concetti da porre al centro del lavoro,
con la conseguente selezione degli indicatori, con la finale decisione delle indicazioni operative. Una domanda, quindi, viene selezionata perché indicatrice di un concetto (è quindi valida), e posta in quel modo perché così si ritiene possa meglio rilevare ciò
che deve (è quindi attendibile).
Se la ricerca inizia dalla testa (dalla concettualizzazione) i margini
per l’inserimento di domande inutili si riduce drasticamente; per
ogni domanda i ricercatori sapranno motivare quale concetto è in-
100
dicato, ed ogni concetto trae origine da motivazioni generali precedentemente concordate. A questo punto chi esclama “Mettiamo
anche questa domanda!” deve saper spiegare perché, ovvero quale
concetto verrebbe così meglio indicato;
l’inclusione di ogni elemento deve essere giustificata sulla base
del fatto che il ricercatore può logicamente aspettarsi che la risposta
sarà significativa per il suo problema centrale (Goode - Hatt 1969,
215)
e tale ‘significatività’, abbiamo visto, è collegabile al problema del
rapporto fra indicatori e concetti.
4.6 L’EDITING DEL QUESTIONARIO
4.6.1 Problemi grafici
La prima fondamentale questione è generale: il questionario deve
essere pulito, graficamente ben impostato, agevole da compilare e
gradevole da vedere. Questo non è un problema trascurabile; è assolutamente fondamentale in caso di questionari autoamministrati,
e comunque molto importante in tutti gli altri casi.
I questionari devono essere ben inchiostrati, con margini ampi e
uno spazio fra le domande sufficiente a far percepire dove finisce
una ed inizia l’altra; i caratteri usati devono essere grandi, almeno
tanto da essere leggibili per persone anziane e con problemi alla
vista; le liste di risposte devono essere composte in modo da ridurre la possibilità di confondersi, usando p. es. tratteggi che, separando gruppi di risposte, siano anche da guida per il compilatore
per allineare la sua risposta nella giusta casella, come in questo esempio:
Domanda su un argomento:
risposta a
[1]
risposta b
[2]
-------------------------------------------------risposta c
[3]
risposta d
[4]
risposta e
[5]
-------------------------------------------------risposta f
[6]
risposta g
[7]
101
L’elenco delle risposte alle domande chiuse deve comunque sempre entrare per intero nella stessa pagina.
In caso di domande aperte non lesinare lo spazio per la risposta,
mettendo più righe sufficientemente separate l’una dall’altra (c’è
anche chi usa una grafìa larga).
Utilizzare accorgimenti grafici per evidenziare ed identificare le
spiegazioni, le domande, le risposte, le questioni che riguardano
l’intervistatore, ecc.
Se si utilizzano gadget avere cura di confezionarli in modo maneggevole, non deteriorabile e gradevoli di aspetto.
4.6.2 La presentazione ed il frontespizio
Se il questionario è autoamministrato il frontespizio assume una
grande rilevanza perché dovrà contenere tutte le spiegazioni del
caso, l’eventuale simbolo che identifica il committente, le istruzioni per l’intervistato. Se il questionario è somministrato con l’ausilio di un intervistatore si avrà comunque cura di non lasciare senza
alcuna intestazione lo strumento (l’intervistato potrebbe chiedere
di vedere di cosa si tratta), e si provvederà comunque di tutte le
istruzioni necessarie, se non altro come guida e promemoria per
l’intervistatore.
In entrambi i casi il linguaggio dovrà essere il più semplice possibile, con frasi brevi, poche subordinate, nessun termine tecnico, o
colto, e dovrà sempre prevedere:
l’indicazione del committente
l’indicazione dell’Ente che svolge la ricerca se diverso dal committente
gli scopi generali del lavoro
la garanzia di anonimato
una breve motivazione dell’intervistato (utilità di avere proprio le
sue risposte)
le istruzioni generali per la compilazione.
Quest’ultimo punto è necessario solo in caso di questionari autoamministrati, e a livello di presentazione può essere ancora piuttosto generale. Si intende dire che, nel caso di problemi di compilazione diversificati, non è il caso di introdurli tutti assieme creando confusione (vedi il prossimo paragrafo).
4.6.3 Le istruzioni per l’intervistato
Inutili in questionari somministrati con l’ausilio di intervistatori ed
indispensabili in questionari autoamministrati. Fa sempre parte
102
dell’errore dell’esperto ritenere che la compilazione di un questionario, anche se semplice, sia operazione ovvia, immediata, aproblematica. Anche nel caso elementare (elementare per il ricercatore) di domande precodificate ad unica scelta, in cui basta apporre
un segno nella casella della risposta, è assolutamente indispensabile scrivere chiaramente e senza giri di parole come si risponde; in
generale, e specie se la regola è unica (se, p. es., tutte le domande
sono chiuse ad unica scelta) questa regola va posta nella parte iniziale del questionario, subito dopo la presentazione, e possibilmente con caratteri vistosi. Se alcune domande prevedono regole diverse (p. es. ce n’è qualcuna gerarchizzata, se c’è una Likert, ecc.)
è sbagliato dare all’inizio tutte le diverse regole (l’intervistato si
confonderebbe), ed è meglio dare una sorta di ‘metaregola’ del tipo: “Dare una sola risposta per ogni domanda barrando la casella
corrispondente al vostro pensiero, salvo nei casi ove diversamente
indicato”; sarà poi cura del ricercatore corredare le domande con
diverse regole di opportune (e vistose) indicazioni.
Deve essere chiaro comunque che la barriera linguistica, presente
già in tutti i questionari autoamministrati, si aggrava per questa
necessità di dare spiegazioni sul come utilizzare lo strumento; ragione di più per realizzare queste ricerche solo con le dovute cautele e solo tramite questionari veramente semplici.
4.6.4 Le istruzioni per l’intervistatore
È da supporre che gli intervistatori abbiano partecipato almeno ad
un addestramento iniziale, sufficiente a dar loro piena cognizione
del funzionamento dello strumento, ma è comunque opportuno
porre, in punti problematici del questionario, suggerimenti ed avvertenze.
Il discorso generale ed introduttivo da fare all’intervistato sarà
quindi riassunto nella parte iniziale del questionario; le istruzioni
per i vari stimoli, se complessi e diversificati, ricordati a ridosso di
ognuno; la necessità di intervenire con sollecitazioni sarà ricordata
dalla presenza di probe, che gli intervistati dovranno sapere comunque di non dover leggere in modo pedante e piatto, ma utilizzare in modo creativo, secondo le necessità dell’intervista e sapendone anche improvvisare di nuovi.
4.6.5 Lessico e problemi espressivi
È un punto molto importante; oltre alla totale assenza di errori
grammaticali e lessicali, fossero anche solo errori di stampa (chi ha
103
intervistato maestre/i elementari con un questionario contenente
errori di questo genere sa cosa si intende), il ricercatore deve porre
il massimo di attenzione al tipo di comunicazione che viene instaurato attraverso questo medium, specie se si tratta di un questionario
autoamministrato non mediabile in alcun modo dalla presenza
dell’intervistatore.
Le frasi devono essere semplici, brevi e assolutamente prive di riferimenti colti o gergali: non si può scrivere, in un questionario,
che l’intervista sarà facile e verterà sul tema del ‘conflitto sociale’.
‘Conflitto sociale’ (è solo un esempio) è un termine sociologico
complicato, non usato abitualmente dalla maggioranza delle persone, come ‘etnia’, ‘differenza’, ‘complessità’, ed altri mille termini che rischiano di confondere l’interlocutore per un tipico errore dell’esperto. Qui è di fondamentale aiuto il pre-test, o quanto
meno una prima simulazione generale dello strumento con soggetti
di diversa estrazione socioculturale, anche perché può capitare di
scoprire che anche espressioni appartenenti ad un lessico familiare
possono diventare equivoche, come sottolinea in questo esempio
Dautriat (1970, 46-47):
Il suo appartamento comprende: una cucina, un tinello, ecc... La
domanda è posta male. È necessario stabilire che cosa si intende per
ciascuna stanza. Ha una cucina (vale a dire: dove si fanno cuocere le
vivande, dove eventualmente si mangia, ma dove non si dorme)?
Si.
No.
N.R.
Ha una sala da pranzo (vale a dire: dove si mangia, dove eventualmente si dorme, ma dove non si fa la cucina)?
Ovviamente, attenzione a non commettere l’errore opposto appesantendo ogni domanda con esagerate precisazioni lessicali del tipo:
Lei si serve regolarmente dell’automobile per recarsi al lavoro? per automobile intendo: auto a 3 ruote, auto a 4 ruote di proprietà; per
“regolarmente” intendo 4 giorni su 5; per posto di lavoro intendo quello dove lei si reca più di frequente per svolgervi il suo lavoro (Hoinville - Jowell 1991, 67)
Il controllo della comprensione delle domande, realizzata p.es. con
successive interviste registrate, mostra frequentemente le numerose distorsioni causate da un fraintendimento terminologicoconcettuale da parte dell’intervistato (Razzi 1992); tale fraintendi-
104
mento pare giustifichi ancor di più l’intervento diretto
dell’intervistatore nel modo più volte segnalato di porgere la domanda ed attendere la risposta (non leggere l’elenco disponibile,
possibile causa di distorsioni), che poi l’intervistatore stesso collocherà nella categoria più idonea.
Kahn e Cannel, nell’esprimere analoghi problemi sul livello comunicativo dell’intervista e sulla comprensibilità delle domande,
raccomandano comunque cautela anche riguardo l’ipersemplificazione lessicale, che potrebbe demotivare l’interlocutore rimarcando ancor più la distanza sociale fra lui e chi lo interroga, ovvero
potrebbe urtare la suscettibilità di tutti coloro rispetto ai quali tale
ipersemplificazione risulta eccessiva; giustamente questi autori
sottolineano che
è importante tener presente che, in tutti i casi, l’obiettivo è il livello lessicale dell’intervistato, non la semplificazione di per se stessa
(Kahn - Cannel 1968, 151)
105
5 COSTRUZIONE
ED USO DELLE
DOMANDE
5.1 LE DOMANDE SECONDO IL GRADO DI DIRETTIVITÀ
5.1.1 Le domande chiuse
5.1.1.1 Sesso
L’archetipo delle domande chiuse è, probabilmente, quella relativa
al sesso: proprietà universale con due soli stati mutuamente esclusivi:
Sesso dell’intervistato:
[1] Maschio
[2] Femmina
Notare, per inciso, che suona ridicola la registrazione di questa
proprietà in forma di vera domanda, specie se si utilizzano intervistatori: “Lei di che sesso è?”. Ecco perché sopra si è parlato di ‘cosiddette’ domande.
5.1.1.2 Professione
Vediamo ora un’altra tipica posta in quasi tutti i questionari, quella
relativa alla professione: precodificare la professione è sempre un
problema: o si resta su un livello di generalità molto alto (Operaio,
Impiegato, Commerciante, ...), o si rischia di avere una enorme
quantità di categorie di risposta.
Basti pensare che l’Istat classifica le attività economiche in un
ponderoso volume di oltre 330 pagine (Istat 1991a) e le professioni
in un altro volume di oltre 200 pagine (Istat 1991b) che raccolgono
migliaia di distinte professioni, da citopatologo a conduttore di apparecchi per la produzione di clorocalce, da cammeista fino a modellatore di statue di cartapesta. Al ricercatore, salvo casi specifici,
non interessa questo livello di dettaglio, ma spesso non può stare
nemmeno troppo sulle generali. Avere un’unica classe ‘impiegati’,
p.es., per raccogliere sia i livelli esecutivi (usciere, dattilografo) sia
quelli dirigenziali, sia quelli pubblici che privati, può essere, in
certi casi, una forzatura eccessiva.
106
Ecco allora che la ‘chiusura’ dell’item, ovvero la preventiva codifica, o in altre parole l’allestimento delle classi di risposta alla domanda, appare non già come atto ‘naturale’, ovvia risulta di un facile esame della realtà (come per Maschio e Femmina), ma come
riduzione di una realtà eccessivamente variegata e frammentata in
un numero minore di classi ad un più alto livello di generalità, scegliendo tale livello in relazione agli obiettivi della ricerca, unico
riferimento del ricercatore per orientarsi nella tante scelte di questo
genere che deve compiere.
La domanda sulla professione, allora, può risolversi in molteplici
modi, in relazione alla previa concettualizzazione del lavoro. Può
essere frutto di un’estrema riduzione, volta a cogliere per larghissime linee più il comparto occupazionale che il dettaglio del ruolo,
in questo modo:
A) Professione svolta:
[1] Nulla (disoccupato, ecc.)
[2] Addetto all’agricoltura
[3] Addetto all’industria, costruzioni e trasporti
[4] Impiegato
[5] Commerciante
[6] Artigiano
[7] Altro (specificare: __________________ )
oppure essere molto analitica, in particolare per alcune categorie
professionali, in questo modo:
B) Professione svolta:
[1] Nulla (disoccupato, ecc.)
[2] Bracciante, salariato agricolo
[3] Mezzadro (o altre forme di contratto)
[4] Coltivatore diretto
[5] Manovale
[6] Operaio qualificato, muratore
[7] Operaio specializzato, capo reparto
[8] Quadro intermedio, perito, tecnico (...)
[9] ...
[n] Altro (specificare: __________________ )
Da osservare, in questo caso, che un’eccessiva analiticità appesantirà ogni tabella dei risultati con questa variabile, con grossi problemi di interpretazione (per una discussione, con quattro esempi
di classificazione dell’occupazione, in Marradi 1993, 30-35 e sgg.)
Una proposta di soluzione può essere (come di frequente) una sintesi dei due casi, ovvero abbastanza generica nelle situazioni occu-
107
pazionali prevedibilmente poco usuali, e più analitica in quelle che
interessano la ricerca, come, p.es., in questo caso:
C) Professione svolta:
[1] Nulla (disoccupato, ecc.)
[2] Addetto all’agricoltura
[3] Addetto all’industria, costruzioni o trasporti
[4] Impiegato: ruoli esecutivi
[5] Impiegato: carriera dirigenziale
[6] Insegnante
[7] Commerciante
[8] Artigiano
[9] ...
[n] Altro (specificare: __________________ )
In quest’ultimo caso la classificazione è identica ad A), ma viene
specificata meglio la classe ‘impiegato’ anche con l’aggiunta di
‘insegnante’ (nell’ipotesi tale professione fosse al centro della ricerca per un qualche motivo).
Va osservato come, in tutte e tre le chiusure dell’item, si è comunque aggiunta la categoria ‘Altro’ con richiesta di specificare; ‘Altro’ è una categoria di risposta piuttosto particolare che ha due utilizzi, spesso sovrapposti: in un caso serve se si è incerti circa
l’effettiva chiusura, se cioè il ricercatore ha dubbi sulla sua capacità ad assolvere il primo criterio delle classificazioni (esaustività);
oppure serve (come sopra in A, dove l’alta generalità delle classi
esclude la possibilità di tralasciare una qualche professione) per
consentire all’intervistato, laddove equivocasse od avesse dubbi, di
collocarsi. Questo caso è frequente: non bisogna mai imputare
all’intervistato flessibilità, capacità di astrazione, voglia di riflettere sul questionario, ecc., e nel caso anche di una domanda come la
A vari intervistati, anziché cercare di collocarsi, potrebbero non
rispondere non trovando la possibilità di inserirsi in ‘Altro’; in
questi casi diviene fondamentale aggiungere l’invito a specificare,
poiché il ricercatore potrà realizzare una codifica a posteriori di
queste risposte, il più delle volte ricollocandole nelle categorie già
definite, in altri casi aggiungendo classi di risposte (una discussione più approfondita al §. 5.4.1).
Come si può vedere, anche un caso apparentemente semplice come
la collocazione professionale presenta non pochi problemi; un modo per risolverne parte è quello di utilizzare più domande che aggrediscano il tema da più punti di vista, ciascuno più semplice da
gestire per il ricercatore e da capire per l’intervistato. Per esempio,
nel nostro caso, si può incominciare a chiedere:
108
A) Collocazione professionale:
[1] Occupato
[2] Non occupato
oppure:
B) Collocazione professionale:
[1] Occupato a tempo indeterminato
[2] Occupato a tempo determinato
[3] Occupato stagionale
[4] Occupato ‘irregolare’ (senza contratto, senza permesso
di soggiorno se immigrato, ecc.)
[5] In cerca di prima occupazione
[6] Disoccupato
[7] Pensionato
[8] Casalinga
[9] Studente
Questa domanda diviene una sorta di ‘domanda filtro’ alla quale
far seguire:
Se occupato, in quale settore?
[1] Agricoltura
[2] Industria
[3] Servizi
Ora si può procedere a domande più specifiche sul ruolo; p. es.:
Può precisare il tipo di mansioni che svolge?
[1] Esecutive
[2] Di concetto
[3] Quasi direttive (quadro, funzionario)
[4] Direttive
[5] Imprenditore, professionista
A questo punto non si sa che lavoro fa l’intervistato, ma può anche
darsi che la cosa non interessi; molto spesso si chiede la professione per poi analizzarla dal punto di vista, semplificato, del comparto produttivo e del suo livello, semmai per costruire degli indici
economici e socio-culturali (in abbinamento ad altre domande sul
reddito, la scolarità, ecc.); se così fosse, non è necessario chiedere
in dettaglio quale mestiere l’interlocutore faccia. Ci basta sapere
che è Occupato / nei Servizi / con mansioni di Concetto; oppure
Occupato / nell’Industria / con mansioni Esecutive; o altro.
109
Un terzo modo, ancora più lontano dal dettaglio e dalla possibilità
di identificazione professionale, ma sociologicamente assai utile
per qualificare lo status professionale (utilizzabile più in fase di
codifica, ma da tener presente nella formulazione della domanda) è
la creazione di una scala di status, p. es. (Statera 1984, 36-37):
[1] Occupazioni di alto livello (dirigenti, imprenditori, funzionari
direttivi, liberi professionisti)
[2] Occupazioni di medio livello (impiegati non direttivi, insegnanti, commercianti, operai specializzati)
[3] Occupazioni di basso livello (esecutivi, subalterni)
oppure di valutazione sociale (vedi l’importante, anche se ormai
un po’ datato, lavoro di de Lillo - Schizzerotto 1985, che classifica
93 gruppi di professioni in base ad una ricerca empirica sulla percezione e valutazione della stratificazione sociale), o altro.
È importante non rimanere prigionieri di stereotipie; il questionario non è una conversazione; in una garbata conversazione di
presentazione con uno sconosciuto si può chiedere “Di cosa si occupa?” o “Che mestiere fa?”, per sentirsi rispondere “Sono un sociologo collaboratore all’Usl xy”, oppure “Sono ballerino di fila
alla Scala”; in un questionario può essere utile avere questa informazione di dettaglio oppure no. Più la risposta che si ottiene è
prossima, come forma, al tipo di informazione che si inserirà nella
matrice dati, più risparmiamo tempo e fatica. Se l’informazione
finale necessaria è semplicemente il livello occupazionale, è inutile
chiedere altre cose. Naturalmente, bisogna avere le idee chiare sin
dall’inizio.
5.1.1.3 Età
L’età è una proprietà continua; in un qualunque momento un soggetto potrebbe dire, p. es., di avere 43 anni, ma sarebbe impreciso;
un’imprecisione convenzionale e accettata (anzi, richiesta), ma
imprecisione resterebbe. In quel dato momento, infatti, quella persona potrebbe avere, poniamo, 43 anni, 6 mesi, 29 giorni, 11 ore,
53 minuti e 5 secondi, ma solo perché non sappiamo usare unità di
misura più piccole, come il nanosecondo, ed anche usando queste
ne potremmo supporre di più piccole. Insomma: l’età è una proprietà continua, come l’altezza e il peso, e solo convenzionalmente
viene fissata in elementi più semplici, trasformando la misura
dell’età in modo grossolano e con grandi arrotondamenti in una
specie di proprietà discreta. Ci accontentiamo di avere 43 anni o
110
44 anni, non preoccupandoci delle più piccole unità di misura del
tempo di cui pure disponiamo (mesi, giorni, ecc.), né (a maggior
ragione), di quelle che non saremmo comunque in grado di considerare. In questo modo trattiamo una proprietà continua come il
tempo come se fosse discreta. Questo è l’unico modo per creare
una classificazione e, nel caso di un questionario, una lista di risposte: accontentarsi di creare classi di età (dette in alcuni casi anche coorti) molto approssimative ma sufficientemente utili per il
lavoro di analisi.
Ci sono fondamentalmente due modi per avere questa informazione:
A) Mi può dire la sua data di nascita? ____________
o, più semplicemente:
B) Mi può dire in che anno è nata/o? _____________
In questo primo modo la domanda si configura come aperta (salvo
rari casi, e solo relativamente all’esempio B, si potrebbe chiudere
preventivamente), ed il ricercatore dovrà poi compiere il lavoro di
chiusura ad interviste effettuate. È evidente che l’utilità di questa
operazione è remota. Se l’indagine si protrae nel tempo, ed i nostri
intervistati possono ‘invecchiare’ man mano che si fanno le interviste, è opportuno chiedere l’anno di nascita, e probabilmente ci
saranno altri casi che giustificano una forma come questa; ma se la
domanda verrà comunque ridotta, in matrice, in ampie classi di età,
è indiscutibilmente meglio precodificare tali classi. Anche qui servono idee chiare sin dall’inizio.
Come fare le classi di età (che rappresentano il secondo e più veloce modo per registrare l’età)? Probabilmente non c’è un modo preferibile, e la scelta dipende dagli obiettivi della ricerca.
Un’indicazione di massima è di tralasciare le classi di età impossibili, come per esempio quelle fino a 20 anni circa in un’indagine
su laureati. Poi può essere utile accorpare più classi di età in frange
dove si è sicuri di accogliere pochissimi casi; p.es. in una ricerca
su laureati in sociologia si può preparare un lista di questo genere:
Mi può dire quanti anni ha?
[1] Fino a 25
[2] 26 ÷ 35
[3] 36 ÷ 45
[4] 46 ÷ 55
111
[5] Oltre 55
La prima classe d’età raccoglie sostanzialmente i giovani neolaureati; non è possibile stabilire con precisione un anno di partenza
prima del quale nessuno è laureato e dopo il quale tutti possono
essere laureati, in virtù di diverse questioni:
1) i diversi percorsi formativi previsti dall’attuale ordinamento
scolastico italiano; si può accedere alla Facoltà di Magistero
(che comprendeva, fino al recente riordino, diversi corsi di
Laurea in Sociologia) con un percorso di studi di soli 4 anni di
medie superiori (scuole magistrali);
2) diversi studenti personalizzano il loro percorso di studi, anticipando di un anno l’accesso al sistema formativo (la cosiddetta
‘primina’) o compiendo corsi abbreviati;
3) ripetenze e fuori-corso ritardano l’uscita ‘normale’ dal sistema
formativo;
4) studenti che hanno fatto scuole all’estero potrebbero avere
compiuto percorsi diversi anche dal punto di vista della durata.
In altri casi ovviamente non si darebbero questi problemi ma altri,
ed è sempre il caso di riflettere sulla particolare popolazione su cui
si indaga anche per stabilire questioni apparentemente semplici
come le classi di età.
Tornando al nostro esempio segnaliamo anche l’ultima classe, che
può parere amplissima. In realtà si sa che i laureati in sociologia
oltre cinquantacinquenni sono pochissimi; si tratta di persone che
hanno tardivamente deciso di iscriversi a questo corso di studi che,
in Italia, è piuttosto recente. È quindi inutile accumulare classi
d’età che raccoglieranno poi pochissime frequenze diventando un
peso.
Le classi di età centrali sono proposte con una ampiezza di dieci
anni. In questo caso non ci sono particolari motivi: le classi d’età
sono spesso di 5 o 10 anni, più raramente di 15 o 20, specie nelle
frange estreme, per ovviare appunto alle basse frequenze.
Tenere comunque presente, per eventuali fini comparativi, le classi
di età utilizzate in altre ricerche, ovvero quelle usualmente utilizzate da importanti centri di raccolta dati come l’Istat.
Va segnalato infine un errore usuale nelle domande sull’età, sul
reddito, su tutte quelle proprietà che hanno a che fare con cifre,
relativo al secondo criterio della classificazione; osserviamo questo esempio:
Mi può dire quanti anni ha?
[1] Fino a 25
112
[2] 25 - 35
[3] 35 - 45
[4] 45 - 55
[5] Oltre 55
Questa è una classificazione sbagliata, perché gli indicatori estremi (25, 35, ...) sono ripetuti in più classi; p. es., chi ha esattamente
35 anni non saprebbe se indicare la classe [2] o la [3].
Sebbene non relativi all’età, vediamo due esempi analoghi ed autentici (da “Hotel domani”, n. 4, 1993, 5; si tratta di un questionario sulla professione di direttore d’albergo):
14) Di media, quanti anni lavora nello stesso albergo?
[ ] un anno
[ ] meno di 2 anni
[ ] da 2 a 3 anni
[ ] da 3 a 5 anni
[ ] più di 5 anni
...
16) Il suo albergo è aperto
[ ] meno di 6 mesi l’anno
[ ] da 6 a 8 mesi l’anno
[ ] da 8 a 10 mesi l’anno
[ ] è sempre aperto
Altre importanti osservazioni sulla classificazione dell’età sono
state fatte al §. 2.3 al quale rinviamo.
5.1.1.4 Titolo di studio
Il titolo di studio consente di esemplificare altre questioni.
In generale valgono alcune delle cose già dette a proposito della
domanda sulla professione relativamente al grado di generalità della lista di risposte; possiamo avere una lista così:
A) Qual è il suo titolo di studio?
[1] Licenza media o meno
[2] Diploma di maturità (anche di 3 anni)
[3] Laurea (anche diploma universitario)
oppure così:
B) Qual è il suo titolo di studio?
[1] Nessuno
[2] Licenza elementare
113
[3] Licenza media
[4] Diploma maturità professionale (3 anni)
[5] Diploma maturità (5 anni)
[6] Diploma universitario (3 anni)
[7] Laurea
[8] Dottorato o specializzazione post laurea
Anche qui la differenza fra i due formati va stimata in relazione
agli obiettivi della ricerca, al tipo di popolazione soggetta
all’indagine, ecc.
Occorre notare che la domanda è relativa al titolo di studio, e non
al livello formativo; in sostanza, lo studente che frequenta il quinto
anno di scuole superiori e prossimo all’esame di maturità dovrà
rispondere che possiede, come titolo, la sola licenza media. Se
l’interesse della ricerca è centrato sui livelli culturali e formativi
degli intervistati, può convenire formulare la domanda (e le risposte), così:
Qual è il suo livello di scolarità?
[1] Nessuno; analfabeta; non ricorda
[2] Alcuni anni di scuola elementare
[3] Licenza elementare
[4] Alcuni anni di scuola media inferiore
[5] Licenza media
[6] ...
[m] Laurea
[n] ...
oppure si può chiedere il titolo di studio, semmai nella forma B
vista sopra, e chiedere anche:
In tutto, quanti anni di scuola ha frequentato, escludendo la scuola
materna ed i corsi di formazione ed aggiornamento?
[1] Fino a 5 anni
[2] 6 ÷ 10 anni
[3] 11 ÷ 15 anni
[4] ...
(considerare, in questo caso, che si comprenderebbero anche gli
anni di scuola ripetuti).
C’è comunque un ulteriore modo per chiedere informazioni circa il
percorso scolastico, interessante se la ricerca ha, fra i suoi obiettivi, di verificare differenze di opinioni e atteggiamenti della popolazione in relazione a diversità cognitive.
114
Alcune ricerche hanno messo in rilievo una differenza sensibile fra
soggetti che hanno compiuto studi tecnici, e soggetti che hanno
compiuti studi umanistici (p. es. Bezzi 1982). Volendo verificare
questa ipotesi (se interessante dal punto di vista della ricerca), alla
forma B della richiesta di titolo di studio vista sopra si può specificare meglio, per le classi 5 e 6:
[4] ...
[5] Diploma di indirizzo tecnico-scientifico (Licei scientifici, Ist.
tecnici, commerciali, per geometri, alberghieri)
[6] Diploma di indirizzo classico-umanistico (Licei classici, linguistici, magistrali, Ist. artistici)
[7] Laurea di indirizzo tecnico-scientifici (compresa Medicina,
Veterinaria, ecc.)
[8] Laurea di indirizzo classico-umanistico
[9] ...
Rinviamo anche a quanto già scritto ai §§. 2.3 e 3.1 per alcune
problematiche relative al titolo di studio.
5.1.1.5 Residenza
Un altra variabile che influenza sensibilmente l’atteggiamento, e
che vale spesso la pena chiedere, è relativa alla residenza, intendendo con ciò la collocazione degli intervistati rispetto ad un ipotetico continuum Città !" Campagna o Centro !" Periferia.
Questa dimensione può avere connotazioni diverse; se la ricerca si
svolge in ambiente tipicamente metropolitano varrà la pena chiedere l’appartenenza a quartieri marginali e deprivati oppure a zone
residenziali di media borghesia, ecc.; se la ricerca riguarda aree
miste ma non connotate da grandi metropoli (pensiamo a regioni
italiane come l’Umbria o le Marche) si può chiedere:
Lei in che zona risiede?
[1] Città capoluogo
[2] Città non capoluogo
[3] Piccolo centro rurale
[4] Campagna
Ovviamente occorre avere ben chiaro cosa si intende, p. es., con
‘Piccolo centro rurale’, ed in caso di questionario autoamministrato è indispensabile stabilire dei parametri rigidi, p.es. in termini
di numero di abitanti; come già detto sopra l’articolazione può essere più analitica ed ampia.
115
Poiché la residenza, intesa come dimensione socio-culturale, è
davvero una variabile interessante nell’interpretazione dei dati, anziché tradurla come semplice proprietà fisica dell’ambiente in cui
si vive (ampiezza del centro inteso come numero di abitanti, p.
es.), può essere interpretata in modo più esteso riclassificando
l’intera area su cui grava l’universo secondo vari indicatori sociali,
economici, culturali e strutturali idonei a creare un indice.
Questa operazione va eseguita prima del campionamento, in modo
da realizzare un campione stratificato che tenga presente anche
questa ripartizione territoriale che diverrà, ovviamente, un elemento di grande portata esplicativa.
L’esempio che segue è tratto da una ricerca relativa agli atteggiamenti sulle letture della popolazione adulta della provincia di Terni
(Del Cornò - Bezzi 1985); ai fini del campionamento si decise di
suddividere il territorio provinciale in zone omogenee, per calcolare poi un campione [...] su quella base. La suddivisione è venuta distribuendo i comuni in tre “Zone” omogenee secondo una serie di variabili socio-economiche: saldo demografico, negativo o positivo almeno nell’ultimo decennio; tasso di ruralità, inferiore o superiore al
20% della popolazione attiva; presenza di flussi turistici di una certa
consistenza; presenza o assenza di scuole almeno al livello di medie
inferiori; vicinanza a grandi vie di comunicazione; ecc. Abbiamo così
ottenuto una Zona A, ove le variabili sopra descritte sono rappresentate nella combinazione migliore [...]. Una Zona B, intermedia, dove le
condizioni generali, pur prossime a quelle definibili di “marginalità”,
sono ancora sufficientemente buone [...]. Infine una Zona C [...]. (Del
Cornò - Bezzi 1985, 44-45)
Oltre che per il campionamento, questa suddivisione in Zone è stata utilizzata, nella ricerca citata, per cercare correlazioni specifiche
con le tematiche poste al centro del lavoro. Questo è un buon procedimento, ma occorre cautela nell’individuazione degli indicatori
utilizzati per la costruzione dell’indice che discriminerà i vari comuni (o comunque le aree geografiche). La scelta di tali indicatori
non può essere arbitraria, e un lavoro rigoroso (con risultati interessanti) può essere anche piuttosto complesso (chi vuole confrontarsi con un approccio rigoroso su questo tema veda Nicolini
1984).
5.1.1.6 Gli inventari, i repertori, le liste esaustive
Naturalmente il questionario potrà avere diverse altre domande relative alle più comuni proprietà dei nostri soggetti: si pensi al luo-
116
go di nascita, all’etnia (in caso di ricerche su popolazioni multietniche), ecc. Le principali comunque, che grosso modo sono presenti in quasi tutte le ricerche, sono le cinque ricordate sopra. Passiamo quindi a domande volte a registrare proprietà che certi manuali definiscono variabili dipendenti (quelle viste sopra sarebbero
variabili indipendenti, perché non sono, come queste di cui stiamo
per parlare, influenzate o condizionate da situazioni particolari
dell’intervistato).
Una delle domande più semplici che si possono trovare è quella
relativa all’inventario su una data questione; l’inventario è una lista di oggetti appartenenti ad uno stesso insieme, di cui occorre
verificare la presenza o l’assenza: oggetti posseduti, comportamenti o preferenze. Vediamone due esempi; il primo riguarda una possibile ricerca sui consumi culturali che potrebbe prevedere una domanda di questo genere:
Fra quelli qui elencati, quali strumenti possiede?
[1] Televisione con televideo
[2] Videoregistratore
[3] Stereo per nastri, LP o CD
[4] Computer
[5] Console per videogiochi
[6] Lettore per laser disc
Una domanda di questo genere mira, con tutta evidenza, a verificare la presenza della gadgeteria elettronica, intesa come elemento
di consumo culturale, nel campione di intervistati; si notino tre cose:
1) l’inventario consente quasi sempre più risposte, creando problemi di registrazione e trattamento dati che vedremo nel prossimo sotto paragrafo;
2) in un inventario spesso manca la categoria ‘Altro’, in quanto
interessa verificare la presenza o l’assenza di determinati oggetti ben precisi;
3) l’inventario deve sempre essere completo dal punto di vista
della ricerca; nell’esempio sopra riportato mancano molti oggetti che potrebbero benissimo appartenere a questo insieme
(radio, proiettore diapositive, ecc.) ma si può ipotizzare che in
questo caso il ricercatore sia interessato alle nuove tecnologie;
l’inventario pertanto è parziale dal punto di vista dell’insieme
(delle decine di prodotti che avrebbero potuto a buon diritto far
parte di questo insieme) e completo solo dal punto di vista della ricerca.
117
Un caso leggermente diverso, rispetto alle considerazioni fatte sopra ai punti 2 e 3 è questo, relativo ad una ricerca sulle modalità di
trasporto urbano:
A) Abitualmente con quale mezzo, prevalentemente, raggiunge il
posto di lavoro?
[1] Nessuno, vado a piedi
[2] Bicicletta
[3] Ciclomotore, moto
[4] Automobile personale
[5] Automobile di altri
[6] Autobus, tram
[7] Metropolitana
[8] Treno
[9] Altro (specificare: __________________ )
Anche questo insieme è solo parzialmente completo, ma il ricercatore può supporre che le categorie residuali (che verranno accolte
da ‘Altro’) siano veramente esigue; ciò non di meno qui è necessario inserire ‘Altro’ per consentire all’eventuale intervistato
che viaggia in motocarrozzella o pattini a rotelle di rispondere. Il
problema si può risolvere anche formulando la domanda in questo
diverso modo:
B) Abitualmente quali di questi mezzi utilizza per raggiungere il
posto di lavoro?
[1] Nessuno, vado a piedi
[2] Bicicletta
[3] ecc. come sopra
...
[9] Altro
Nel caso A, l’intervistato deve probabilmente dare una sola risposta, indicando una prevalenza di comportamento; questa costrizione impone al ricercatore di formulare la categoria 9 come visto,
con la richiesta di specificare per poter codificare a posteriori le
risposte residuali; in questo caso il ricercatore vuole fare
un’indagine attenta e minuziosa di tutti i possibili mezzi di trasporto utilizzati.
Nel caso B il ricercatore, con un’idea sufficientemente chiara dei
comportamenti relativi al trasporto urbano, è meno interessato al
dettaglio, e potrebbe addirittura prevedere la possibilità di risposte
multiple.
118
Abbastanza simili come logica sono le domande in forma di tabella, che in particolari casi (come nelle ricerche di mercato) possono
essere molto comode e veloci da realizzare; p. es:
Lei in generale dove fa spesa?
Prodotto
super
market
Pane
Pasta
Gastronomia
Salumi e formaggi
[...]
dettagliante
mercato
rionale
altro
5.1.1.7 Le domande a risposta multipla
E a proposito delle domande a risposta multipla, che abbiamo già
incontrato più volte, occorrerà spendere alcune parole. Ci sono casi, come gli inventari, in cui pare inevitabile lasciare
all’intervistato la possibilità di dare più risposte; in altri casi si ritiene che la vastità e l’articolazione dell’esperienza umana sia tale
da non consentire la costrizione entro un’unica categoria di risposta.
Potrebbero essere ragioni valide, ma le risposte multiple creano
qualche problema gestionale di cui essere avvertiti, ed a volte non
sono efficaci come si vorrebbe.
Nel secondo caso citato delle risposte multiple utilizzate per favorire una maggiore espressione dell’intervistato, vi è una sopravvalutazione delle possibilità del questionario. Secondo una filosofia
più volte proposta in questo testo occorre insistere nella collocazione del questionario in una dimensione che tiene conto sia della
reale capacità esplicativa di questo strumento sia dei problemi gestionali che comporta. Innanzitutto, in questo caso, la risposta multipla si presenta ‘diversa’ all’interlocutore, e gli comporta un diverso sforzo di concentrazione; se sono prevedibili risposte multiple la lista delle risposte non potrà essere breve (non si possono
consentire tre risposte su una lista di quattro o cinque!), e quindi il
livello di generalità sarà piuttosto basso, cosa che contrasta probabilmente con le altre parti del questionario; le diverse risposte, poi,
avranno lo stesso valore (tranne nel caso di risposte gerarchizzate
che vedremo dopo), e questa è una forzatura che deprime l’informazione, anziché accrescerla. Infine la risposta multipla crea problemi di codifica ed elaborazione dati, perché a questi fini occorrerà trattare ogni risposta come un item a se stante codificato
119
Si/No, con un conseguente appesantimento della matrice ed una
più confusa analisi del dati; per capire quest’ultimo problema,
piuttosto importante, si propone un esempio astratto:
n) Domanda (Sono consentite più risposte):
[1] risposta a
[2] risposta b
[3] risposta c
[4] risposta d
✕
[5] risposta e
[6] risposta f
✕
[7] risposta g
✕
[8] risposta h
[9] risposta i
In questo esempio l’intervistato ha indicato tre risposte (4, 6 e 7); a
livello di codifica la domanda n sarà trattata in questo modo:
n1) Indicata = 1
n2) Indicata = 1
n3) Indicata = 1
...
n9) Indicata = 1
Non indicata = 0
Non indicata = 0
Non indicata = 0
Non indicata = 0
Nella matrice dati, per questa sola domanda, verranno utilizzati
quindi 9 campi (nove colonne nella matrice); nel nostro caso, il
record relativo all’intervistato esemplificato vedrà un codice ‘1’
(risposta indicata) nei campi 4, 6 e 7, ed un codice ‘0’ negli altri.
Una tabella realizzata su questi dati potrà quindi essere relativa solo ad uno dei 9 campi (nove possibilità di risposta), avere come
stati Risposta indicata / Risposta non indicata, ed essere affollatissima di mancate risposte (ovvero di casi che hanno scelto altre risposte). In questo modo si perde fra l’altro qualunque relazione fra
le risposte diversificate ottenute.
Insomma, quello che si è voluto segnalare è che spesso le risposte
multiple fanno perdere di spessore e significato i dati rilevati.
Diverso il caso degli inventari, dove un utilizzo quale quello appena visto è logico ed opportuno, in quanto lo scopo è appunto verificare la presenza o l’assenza di ogni oggetto della lista.
Per ovviare agli inconvenienti ora illustrati ci sono diversi modi.
Si può utilizzare una tecnica che recupera la pluralità delle risposte
in quanto insieme, utilizzabile su liste di risposte piuttosto ampie e
costruite alla luce di questa particolare elaborazione; questa tecnica prevede una riclassificazione a posteriori, simile a quella realiz-
120
zata con le domande aperte, cercando un nesso fra le varie risposte
date, su un più alto livello di generalità, e probabilmente su un piano concettuale leggermente diverso da quello proprio di ciascuna
risposta dell’insieme; verrebbero cioè utilizzate le varie risposte
multiple come indicatori diversi di un concetto delineato ex post.
Per chiarire con un esempio riprendiamo quello proposto alla fine
di 7.2 (“La codifica a posteriori”) a proposito dei giochi praticati in
una ricerca sul tempo libero degli adulti; si potrebbe realizzare una
domanda di questo tipo:
Quali giochi pratica abitualmente, o più di frequente, da solo o in
compagnia? (anche più risposte)
[1] Solitari con le carte
[2] Giochi di carte non d’azzardo (quali? ____________)
[3] Giochi di carte d’azzardo (quali? _______________)
[4] Giochi da scacchiera (Scacchi, Dama, Backgammon,
Go, e simili: quali? _______________________________________)
[5] Giochi di società strutturati (Monopoli, Taboo, Trivial
pursuit ecc.; quali?________________________________________)
[x] Biliardo
...
[n] Altro (specificare: ____________________________)
Questo item potrebbe essere accompagnato da altri, p. es., sulle
‘situazioni’ di gioco (con amici / da solo; generalmente nei periodi
di festa / abitualmente; a casa / in altri ritrovi). A questo punto il
ricercatore si trova con una mole enorme di informazioni di cui
potrebbe evitare la conseguente dispersività del dettaglio: i vari
giochi indicati, nelle varie situazioni, semmai anche alla luce di
altre domande ancora, possono trasformarsi in indicatori di una più
generale dimensione ludica, o come tratto particolare di una dimensione relazionale, o altro, ed essere, tutti assieme, codificati in
questo modo:
1 - Attività ludica intensa, praticata su più piani, come veicolo per
stabilire rapporti sociali
2 - Attività ludica intensa concentrata su poche attività, o in contesti limitati, come affermazione di appartenenza ad un ambiente sociale, culturale, relazionale specifico
3 - Attività ludica frequente, ma originata dai particolari contesti
relazionali frequentati, e da questi dipendente
4 - Attività ludica saltuaria legata a particolari eventi (festività) ed
in genere limitata alla cerchia familiare
5 - Attività ludica specializzata e realizzata ad alto livello anche
agonistico; luogo di identità ed affermazione personale
121
Ecc.
Chi ritenesse necessario utilizzare domande a risposte multiple
senza incorrere nei problemi visti ora relativi alla codifica può sperimentare invece una soluzione basata sull’utilizzo del codice binario.
Questo sistema consente di registrare una pluralità di risposte con
un unico codice di una o più cifre, e di poter ugualmente risalire a
ciascun elemento originario di quel caso. La non completa soddisfazione per questo sistema, oltre alla necessità di imparare il codice binario, è dovuta al limitato numero di risposte così registrabili
(per una corretta comprensione di quanto si sta per illustrare è opportuno conoscere le procedure di codifica illustrate al §. 7.1 “La
codifica”).
In breve, per utilizzare questo sistema, occorre codificare ogni risposta non, come per tutti gli altri casi, con una numerazione per
uno (1, 2, 3, ... n), bensì con il valore decimale corrispondente alla
sequenza a base binaria: 20 (=1), 21 (=2), 22 (=4), 23 (=8), 24
(=16), ecc. La registrazione sulla matrice, unica per tutto il gruppo
di risposte, corrisponderà alla somma dei valori decimali di ogni
risposta attiva.
Esempio di domanda, con risposte e relativo valore di codice:
Può dirmi quali elettrodomestici possiede?
[ 1] Frigorifero
[ 2] Lavatrice
[ 4] Lavapiatti
[ 8] Forno tradizionale
[16] Forno a microonde
[32] Aspirapolvere
[64] Lucidatrice o battitappeto
[128] Altro
Una codifica ‘11’ in matrice significa Frigorifero (codice 1), Lavatrice (cod. 2) e Forno tradizionale (cod. 8); non è possibile altra
combinazione che non sia 1 + 2 + 8 per ottenere infatti il valore 11
con la nostra codifica; una codifica ‘59’ in matrice significa solo,
per lo stesso principio combinatorio, Frigorifero (1), Lavatrice (2),
Forno tradizionale (8), Forno a microonde (16) ed Aspirapolvere
(32).
È evidente che la progressione geometrica dei codici porta rapidamente a valori di tre cifre, poi di quattro, con un appesantimento
della ‘macchina’, ed una certa difficoltà a memorizzare le combinazioni.
122
Comunque, per quest’ultimo problema, si riporta uno schema con
indicate le cifre di base utilizzate come codice e - più piccole - le
cifre che vengono da esse create per somma.
Ai fini di quanto qui spiegato la tabella va usata in questo modo: si
cercano tutte le celle che riportano il numero dato; le cifre di base
(quelle grandi) di queste celle individuano i diversi oggetti con
quel codice (per la codifica col codice binario vedi anche Martinotti 1967, 590-591).
TAV. 5 - CIFRE DECIMALI CORRISPONDENTI ALLE PRIME BINARIE,
E VALORI CHE POSSONO COMPORRE PER SOMMA
1
3, 5, 7, 9,
13, 15, 17, 19, 21,
25, 27, 29, 31, 33,
37, 39, 41, 43, 45,
49, 51, 53, 55, 57,
61, 63, ...
11,
23,
35,
47,
59,
8 9, 10, 11, 12,
13, 14, 15, 24,
27, 28, 29, 30,
41, 42, 43, 44,
47, 56, 57, 58,
61, 62, 63, ... ...
25,
31,
45,
59,
26,
40,
46,
60,
2
3, 6, 7,
14, 15, 18, 19,
26, 27, 30, 31,
38, 39, 42. 43,
50, 51, 54, 55,
62, 63, ...
10,
22,
34,
46,
58,
11,
23,
35,
47,
59,
17, 18,
20, 21, 22, 23, 24,
26, 27, 28, 29, 30,
48, 49, 50, 51, 52,
54, 55, 56, 57, 58,
60. 61, 62, 63, ...
19,
25,
31,
53,
59,
16
4
5, 6, 7,
14, 15, 20, 21,
28, 29, 30, 31,
38, 39, 44, 45,
52, 53, 54, 55,
62, 63, ...
12,
22,
36,
46,
60,
13,
23,
37,
47,
61,
33, 34,
36, 37, 38, 39, 40,
42, 43, 44, 45, 46,
48, 49, 50, 51, 52,
54, 55, 56, 57, 58,
60, 61, 62, 63, ...
35,
41,
47,
53,
59,
32
C’è infine un altro modo per impostare domande a risposta multipla risolvendo tutti i problemi visti sopra. Si tratta di domande a
risposte multiple gerarchizzate, in cui si chiede all’intervistato di
ordinare le risposte in questo modo:
Cosa preferisce fra le cose qui indicate? (Tre risposte in ordine di
preferenza):
[1] risposta a
[2] risposta b
[3] risposta c
...
[n] risposta n
Nelle indicazioni per l’intervistato deve essere ben precisato come
indicare tali preferenze: se finora ha semplicemente barrato la risposta prescelta, ora dovrà forse indicare un ‘1’, ‘2’ e ‘3’ a fianco
della prima scelta, della seconda e della terza, e questo può non
risultare sempre chiaro a chi risponde; si possono introdurre ov-
123
viamente soluzioni che facilitano la comprensione, come la riproposizione della stessa lista per tre volte chiedendo, la prima volta,
quale sia la risposta preferita; la seconda, quale sia, a parte la precedente, la seconda preferita; e così via. Ovviamente qui la presenza di un intervistatore risolve tutti i problemi, poiché basterà che
mostri un cartoncino con la lista delle risposte e guidi poi
l’intervistato verso le tre scelte.
La possibilità di avere una gerarchia, ovvero una relazione specifica fra le risposte indicate, cambia notevolmente i problemi fin qui
visti ed impone naturalmente altre soluzioni anche tecniche. In
questo caso una codifica ex post d’insieme farebbe perdere informazioni (quelle dovute alla gerarchia), e può essere ugualmente
utilizzata solo se comunque si preservano, anche a livello di codifica e tabulazione, almeno le prime scelte.
Comunque, per quanto riguarda la codifica, diversamente da quanto visto sopra qui il codice punta l’attenzione sull’ordine delle
scelte, ovvero:
Indica come prima scelta:
risposta a 1
risposta b 2
risposta c 3
...
risposta n n
Indica come seconda scelta:
risposta a 1
risposta b 2
risposta c 3
...
risposta n n
Indica come terza scelta:
...
In realtà è facile osservare che nella maggior parte dei casi in cui si
utilizza questo tipo di domande si riscontra un uso, in fase di tabulazione e analisi dei dati, quasi sempre solo della prima scelta, anche perché non ci sono criteri logici per stabilire il reale significato
della seconda (quale ‘distanza’ semantica abbia il secondo concetto dal primo, p.es.), e meno ancora la terza.
Le domande gerarchizzate, a ben vedere, con la loro caratteristica
di ordinalità, costituiscono delle specie di scale, che negli esempi
ora visti si ‘sbilanciano’ verso il solo polo positivo (poiché si chiede di indicare le scelte preferite) con una conseguente difficoltà
124
interpretativa. In alcuni casi però la richiesta di gerarchizzazione è
completa, nel senso che si chiede di ordinare tutti gli elementi della lista, come in questo esempio tratto da una ricerca sull’informazione relativa alle tossicodipendenze:
Secondo lei quali di queste sostanze creano più dipendenza? Quali
meno? (segnalare l’ordine coi numeri da 1 - massimo di dipendenza a 5 - minimo di dipendenza-)
marijuana
______________
cocaina
______________
eroina
______________
alcool (vino, liquori) ______________
nicotina (sigarette)
______________
Quest’uso dell’espediente gerarchico non ha i difetti visti sopra, ed
è certamente utile in determinati contesti di ricerca, anche se occorre essere consapevoli di altri tipi di problemi (in questo caso, p.
es., si chiede di ordinare con valori di uguale ‘peso’ - 1, 2, 3... oggetti che sono sicuramente di peso assai diverso).
5.1.1.8 Numero di risposte da prevedere
Il ‘giusto’ numero di risposte da prevedere in una domanda chiusa
è problema correlato all’impostazione di una buona classificazione
che, ricordiamo, deve rispettare i tre requisiti fondamentali: esaustività, mutua esclusività ed unicità del fundamentum divisionis.
Ma una buona classificazione, rispettosa di questi requisiti, non è
necessariamente una buona lista di risposte, in quanto a numerosità
delle classi previste, perché se il livello di generalità adottato è
piuttosto basso il numero di classi potrebbe essere, ancorché corretto, molto alto.
Il problema della ‘chiusura’ degli item si pone comunque diversamente a seconda del tipo di proprietà che si vuole registrare; in relazione a quelle che in letteratura si chiamano in genere variabili
indipendenti, che cioè il ricercatore ritiene non soggette a variazione in conseguenza ai temi posti al centro della ricerca, valgono
le osservazioni già fatte, nei vari casi, precedentemente; per quanto
riguarda invece le variabili dipendenti, che in generale rappresentano l’oggetto specifico del lavoro (opinioni, atteggiamenti, ecc.),
una classificazione buona anche dal punto di vista della numerosità
delle classi che si vanno costruendo deve essere avvertita
dell’impatto che avrà la lista di risposte.
In particolare occorre fare attenzione al fatto che
125
più numerose sono le categorie, più sottili quindi le distinzioni fra
esse, più difficile diventa per l’intervistato distinguerle e valutare ciascuna in relazione alle altre, giungendo a individuare la risposta più
vicina al suo pensiero (Pitrone 1986, 63)
per questo in genere vari autori suggeriscono di non mettere più di
sei-sette risposte a queste domande (altri autori limitano a quattrocinque).
Anche alla luce di queste considerazioni, il problema va però opportunamente affrontato in maniera leggermente diversa.
In caso di questionario autoamministrato è vero quanto segnalato
da Pitrone, anche se viene a mancare l’eventuale problema della
memorizzazione di liste lette; l’intervistato può leggere e rileggere
la lista di risposte a suo comodo, ma sappiamo che spesso non
vuole perdere tempo. Insomma, sei-sette categorie al massimo è un
giusto compromesso.
Ma in caso di questionari somministrati da intervistatori i problemi
sono diversi; in generale la letteratura che tratta questo argomento,
nell’indicare la necessità di un breve listato ha in mente un’interazione fra intervistatore ed intervistato già altre volte qui criticato,
di origine behaviouristica, che presuppone un intervistatore che
legge le domande ed anche le risposte: da qui problemi di concentrazione per chi ascolta, di ricordarsi tutte le risposte proposte, di
discriminare fra categorie piuttosto simili. Ma come si è già rilevato altrove questa non sembra essere una buona modalità di intervista.
Salvo ricerche specifiche (o domande specifiche) in cui il ricercatore motivatamente ritenga preferibile questo approccio, in generale è da raccomandare la diversa modalità per la quale chi intervista legge le domande, l’intervistato risponde come desidera (eventualmente dopo ulteriori interazioni fra loro, richieste, probe, ecc.),
ed infine l’intervistatore registra la risposta decidendo quale, fra le
categorie, presenti, è la più idonea. Procedendo in questo modo il
vincolo delle poche categorie di risposta è assai meno importante,
in quanto trasferito in parte sull’intervistatore il quale però, si dovrebbe supporre, ha più strumenti per discriminare fra categorie
simili, è meno soggetto a problemi di deconcentrazione, ecc. (tutto
questo nel caso di intervistatori bravi e motivati, ovviamente). Se
utile quindi, anzi se necessario, il ricercatore può prendersi qualche
libertà in più, in quanto a numero di risposte.
Malgrado quanto appena dichiarato, ci sono comunque ragioni favorevoli (ma per altri motivi) al ristretto numero di categorie di
126
risposta nelle domande chiuse. I motivi attengono lo strumento e le
sue finalità. Il questionario non può essere lo strumento adatto a
cogliere le sfumature, i sottili distinguo nelle opinioni, e le domande chiuse meno che mai possono gettare profondi sguardi nel
mondo vitale dell’interlocutore. Le domande chiuse dei questionari
possono discriminare fra categorie semplici, ed anzi questo lo fanno piuttosto bene. Il questionario è un veloce mezzo per sapere
quanti sono i favorevoli ed i contrari, quanti quelli che pensano A
rispetto a quelli che pensano B o C, e per descriverli sommariamente sulla base delle principali proprietà che contraddistinguono un essere umano (sesso, età, ...). Le domande chiuse non
possono fare quasi niente di più, e con piena consapevolezza di ciò
occorre essere conseguenti.
Le liste brevi di risposte contribuiscono ad evitare distorsioni causate dall’intervistatore (che, nell’impostazione qui suggerita, gioca
un ruolo assai importante di interprete dell’espressività
dell’intervistato) e, specialmente, evitano complicazioni in fase di
elaborazione e di successiva interpretazione dei dati.
Occorre avere ben presente questo aspetto, che non deve guidare
solo e tanto la formulazione della domanda quanto la decisione
sulla chiusura. Costruire una matrice delle risposte relativa
all’incrocio fra una professione, p. es., codificata in otto categorie
ed una risposta ad altra domanda codificata con dieci possibilità di
risposta significa ottenere 8 x 10 = 80 celle, in cui disperdere le
nostre frequenze. Nella stragrande maggioranza dei casi ciò significherà avere almeno una metà di tali celle prive di frequenze o
con frequenze ridottissime, assolutamente prive di significato; ed
un’altra metà (che sono sempre 40 celle) che pur avendo un numero significativo di frequenze resta comunque concettualmente non
dominabile, per problemi percettivi e cognitivi connaturati a noi
tutti.
Occorre compiere ogni sforzo di sintesi, a livello di formulazione
delle liste di risposta, per concentrare quanto più possibile il numero finale di celle nelle tabelle, e questo vuol dire stare su livelli
piuttosto alti della scala di generalità. In caso contrario potremo
analizzare i dati solo con strumenti matematici ed informatici, ma
ci precluderemo la possibilità di leggere le tabelle e coglierne un
senso. Non a caso infatti, tabelle di questa portata vengono ridotte
successivamente dal ricercatore, accorpando ex post categorie simili (e questo sia per le variabili dipendenti che per le indipendenti), per eliminare quelle che raccolgono poche frequenze ma,
soprattutto, per poter vedere andamenti significativi dal raffronto
delle percentuali di cella con quelle marginali (Marradi 1993).
127
Evidentemente, ben vengano le matrici molto ampie, da ridurre
dopo, sulla base di una riflessione scaturita dall’analisi dei dati, in
tutti quei casi in cui il ricercatore ritenga di non conoscere sufficientemente bene il tema indagato.
5.1.2 Le domande aperte
Gli item non strutturati nascono da esigenze diverse. Vale a dire
che non è solo la diversità dell’oggetto da indagare ad imporre
questa scelta, ma il diverso atteggiamento che il ricercatore assume
di fronte di tali oggetti a creare le premesse per comporre gli item
aperti; un atteggiamento di carattere ‘progettuale’, costruzioni di
cui si impostano solo le fondamenta (Agnoli 1992, 148).
L’archetipo degli item aperti è probabilmente simile a questo:
Cosa ne pensa di [...]?__________________________________
____________________________________________________
L’accezione ‘cosa ne pensa di’ sta a significare una richiesta di riflessione non strutturata o pre-figurata su un dato tema, mentre le
linee continue significano un determinato spazio per trascrivere, a
cura di svolge l’intervista, una risposta ampia ma non eccessiva.
Per quanto riguarda la prima parte (‘Cosa ne pensa di’) è logico
che il quesito può essere radicalmente diverso, a seconda
dell’oggetto di indagine; la seconda parte (le righe) induce invece
ad altre riflessioni circa la ‘fedeltà’ dei trascritti a cura
dell’intervistatore, la logica, l’uniformità e l’arbitrarietà delle necessarie sintesi, la doppia interpretazione del testo dell’intervistato
da parte di chi ha registrato le risposte, e del testo così redatto da
parte del ricercatore, e così via. In parte tali riflessioni sono note;
di seguito si riprenderanno alcuni aspetti.
Una prima considerazione si deve fare è relativa all’utilità di queste domande rispetto a quelle precodificate (chiuse). Vediamo in
sintesi i pro ed i contro delle due forme (Pitrone 1986, 61-62; Phillips 1972, 203-204):
TAV. 6 - RAFFRONTO FRA DOMANDE CHIUSE E APERTE
Domande chiuse
- massimo di comparabilità nelle
risposte;
- facile somministrazione anche per
personale poco esperto;
Domande aperte
- maggiore significatività delle risposte;
- non si ‘pilotano’ le risposte tramite la proposizione di liste già pron-
128
- si evitano risposte irrilevanti;
- facile codifica (minori possibilità
di errore);
- minori tempi (e quindi costi) di
compilazione, codifica, inserimento
in matrice;
- migliore comprensione della domanda da parte dell’intervi-stato,
tramite l’analisi delle risposte.
te;
- evitano le stereotipie ed accolgono
gli interventi originali;
- assomiglia più ad una comune
conversazione contribuendo alla
collaborazione dell’intervistato;
- problemi di codifica, specialmente
se l’intervistatore è diverso dal ricercatore, e se ci sono più intervistatori.
Indipendentemente da altre questioni comunque importanti, la diversità di fondo fra le due forme è così sintetizzabile: le domande
chiuse impediscono la dispersività delle risposte su più dimensioni
difficilmente riportabili nell’alveo delle ipotesi della ricerca ma
possono creare stereotipie; quelle aperte forniscono una mole
maggiore di informazioni sia in estensione (più cose) sia in intensione (di maggior spessore e significato) ma sono di difficile gestione.
Circa il primo punto (pluridimensionalità delle risposte) vediamo
un esempio riportato da Phillips:
uno studente potrebbe rispondere alla domanda circa i motivi per i
quali ha scelto la carriera del medico, facendo riferimento ai propri fini, un altro facendo riferimento alle sue aspettative circa le caratteristiche positive di questa professione; un altro ancora, insistendo
sulle caratteristiche negative di altre professioni e un altro ancora, infine, facendo riferimento alle persone che lo hanno spinto a seguire
una certa carriera. Sebbene questa varietà di risposte sia molto importante nel contesto della scoperta, essa rende tuttavia difficoltosa la verifica di ipotesi specifiche (1972, 204)
Questo è probabilmente uno dei principali problemi da affrontare
con le domande aperte, ma vi si può porre rimedio in diverso modo: innanzitutto restringendo la possibilità di risposte pluridimensionali formulando con particolare attenzione la domanda.
Nell’esempio riportato sopra una domanda così posta: “Relativamente agli obiettivi professionali che si poneva, per quali motivi
ha scelto proprio la carriera di medico?” probabilmente avrebbe
evitato alcune delle risposte citate da Phillips convogliando le più
lungo la dimensione ‘obiettivi professionali’ posta (p. es.) dal ricercatore al centro della sua ricerca. Poi, ovviamente, addestrando
bene i rilevatori. È evidente che nel caso di domande aperte è indispensabile un buon intervistatore, consapevole degli obiettivi del
129
lavoro, attento al modo di porgere la domanda, sensibile alla risposta ed ai problemi della sua registrazione.
La più difficoltosa gestione delle domande aperte è comunque innegabile. I problemi non sono solo e tanto relativi ad una buona
formulazione delle domande, come visto ora, ma specialmente alla
post codifica; solo un buon piano di ricerca, realizzato al meglio
con buoni intervistatori, e la presenza di un ricercatore esperto,
possono sostenere l’uso di domande aperte, che comunque, se ben
utilizzate, sono indubbiamente superiori alle chiuse. In particolare
le domande aperte evitano in modo pressoché totale le stereotipie
delle risposte, stereotipie costrette, fra l’altro, dai pre-saperi e dai
pre-giudizi del ricercatore che immagina, a priori, la classificazione che dovrebbe rappresentare l’universo esperienziale
dell’intervistato. Se i pre-giudizi del ricercatore sono anche una
fonte importante cui attingere quando si devono classificare professioni, oggetti posseduti, attività semplici eseguite, ecc., diventano un imbarazzante condizionamento quando ci vogliamo avvicinare ad opinioni e valori degli intervistati.
Conclusione: se manca la sufficiente esperienza, se non sono garantite condizioni tecniche minime, se non c’è la reale necessità
alla luce degli obiettivi della ricerca, è meglio proporre solo o
principalmente domande chiuse. Viceversa, se la ricerca ha necessità di esplorare più in profondità aspetti complessi dell’esperienza
umana, se si ritiene di essere in condizione di poterle gestire, ed in
particolare se il ricercatore ha un buon controllo sulle interviste (se
le realizza lui stesso, o se dispone di ottimi intervistatori), le domande aperte sono indubbiamente superiori sotto ogni profilo;
in breve, la domanda chiusa rappresenta una specie di proiettile di
piccolo calibro. Se l’obiettivo è ben in vista e non è complesso, e se
l’intervistatore ha fiducia nella propria mira, tutto va bene. Per un gioco più ambizioso o in situazioni meno definite, è meglio indicata la
maggiore gittata, rosa di tiro, e potenza di fuoco della domanda aperta
(Kahn - Cannel 1968, 189)
Allora, quando proporre una domanda chiusa? Certamente quando
l’oggetto della domanda riguarda una proprietà discreta di cui si
conoscono tutti gli stati, o i cui stati sono comunque con certezza
riconducibili ad un numero ristretto di classi rispettose dei requisiti
delle classificazioni: sesso, età, titolo di studio, ecc. sono proprietà
rispetto le quali è inutile non precodificare, cosiccome le domande
che richiedono una risposta dicotomica (“Possiede un videoregi-
130
stratore? [] si [] no”), o gli inventari, salvo, in questi casi, lasciare
aperta un ultima classe “Altro (specificare:______)”.
L’inutilità in questi casi della domanda aperta riguarda il necessario successivo sforzo di codificare l’item nello stesso modo in cui
si può codificare a priori; salvo situazioni molto particolari di ricerca, ogni qualvolta la classificazione a posteriori viene fatta con
gli stessi criteri con i quali si sarebbe classificata a priori, il lavoro
è stato inutile, la domanda aperta non ha avuto particolare senso, e
ciò perché, in questo caso, tali criteri sono stati esterni alla ricerca;
vuoi perché presenti in natura (Sesso), vuoi perché facilmente
classificabili in modo conforme alle necessità della ricerca o di eventuali comparazioni (Età, che pur essendo una proprietà continua viene solitamente trattata come discreta).
Ma ‘inutile’, nella ricerca, vuol spesso dire ‘pericoloso’; poiché i
pericoli di distorsione sono sempre dietro l’angolo, ed ogni stimolo
presenta, almeno in modo latente, problemi di questo ed altro genere, occorre limitare in ogni modo l’irruzione, nel questionario, di
effetti non desiderati. Lasciare aperta la domanda “Quanti anni
ha?” potrebbe far tornare, fra le risposte, “Tanti”; lasciare aperta la
domanda “Qual è la sua professione?” potrebbe far tornare, fra le
risposte, “Un mestiere faticoso”; e così via.
Diversamente, laddove cerchiamo di scoprire le opinioni
dell’intervistato, se pure in diversi casi si può immaginare lo stimolo precodificato, è indiscutibilmente meglio l’item aperto.
Possiamo segnalare sostanzialmente due usi diversi della domanda
aperta, e quindi due diverse forme per presentare tale domanda.
In un primo caso, il più usuale, la domanda è strettamente funzionale agli obiettivi centrali della ricerca, e serve per indagare particolari opinioni e atteggiamenti ritenuti fondamentali; se il ricercatore decide di utilizzare item aperti, non ritenendo possibile cogliere aspetti significativi del problema in altro modo, deve probabilmente immaginare un ‘grappolo’ di domande. Se il tema in indagine è tanto complesso da non potersi precodificare, probabilmente una sola domanda può certamente circoscriverlo, ma ad
un alto livello di generalità; alto livello di generalità in un item aperto significa scarsa significatività delle risposte, altrettanto generali, e pericolo di pluridimensionalità. È allora il caso di pensare,
su ogni singolo oggetto in indagine con item aperti, un gruppo di
domande concatenate, alcune con una funzione introduttiva, altre
incaricate di stringere sulle varie dimensioni.
Da una ricerca sull’atteggiamento degli adulti nei riguardi della
lettura si propone un primo esempio (Del Cornò - Bezzi 1985):
131
10) Escludendo il tempo di lavoro, dei viaggi di trasporto al lavoro, e tutto il tempo che deve dedicare ad attività quotidiane casalinghe
e simili, quanto tempo le rimane ogni giorno per fare cose che a lei
piacciono, per le attività che lei sceglie di fare per divertimento o relax? In una parola: di quanto tempo libero dispone?
____________________
____________________________________________________
____________________________________________________
11) E nella settimana che giorni o periodi di giornate riesce a dedicare
a
sé
e
a
ciò
che
le
interessa?
_____________________________
____________________________________________________
____________________________________________________
12) E durante l’anno? (ferie, pause agricole invernali, ecc.) _____
____________________________________________________
____________________________________________________
13) In sostanza lei ha molto/abbastanza/poco tempo libero: come
lo occupa prevalentemente? Quali sono le cose che preferisce fare
quando
ha
un
po’
di
t.l.?
_________________________________________
____________________________________________________
____________________________________________________
14) Le piacerebbe avere più tempo per fare queste cose? Come
mai
non
riesce
a
trovarlo?
______________________________________
____________________________________________________
____________________________________________________
15) Oltre alle cose che lei già fa quando ha un po’ di t.l., ci sono
altre cose che a lei piacerebbe fare avendone di più? Che cosa? Perché?
____________________________________________________
____________________________________________________
Esaminiamo la sequenza; i ricercatori, analizzando il problema del
tempo libero (ritenuto un pre-requisito fondamentale al problema
della lettura), si sono accorti della difficile sua definizione (Dumazedier 1978), legata comunque ad aspetti soggettivi. La prima domanda (la n. 10) propone una estrema sintesi di definizione canonica di ‘tempo libero’, e la sua principale funzione è appunto quella di essere introduttiva, far capire di cosa si intende parlare. Assieme alla due domande successive, che puntualizzano e circoscri-
132
vono sempre di più il problema, i ricercatori intendevano far riflettere l’intervistato sull’argomento, aiutandolo a concentrarsi sul tema con una prefigurazione dei suoi problemi personali in relazione
al tempo libero; a questo punto, dal tenore delle risposte,
l’intervistatore era in grado di collocare l’interlocutore in una
scansione molto/abbastanza/poco tempo, assolutamente legata alle
percezioni dell’intervistato, e non a modalità esterne; la domanda
13 poteva quindi essere ritagliata attorno a questa collocazione e,
assieme alle due successive, sondare diverse dimensioni dello stesso tema: il ‘cosa fa’ del proprio tempo libero (item 13), ed il ‘cosa
farebbe’ avendo più tempo, come ambito di desiderabilità (item 14
e 15). Notare che qui le domande si presentano, anche sul piano
lessicale, in modo diverso, con più frasi interrogative concatenate,
e questo più che altro per suggerire all’intervistatore la necessità di
insistere.
Un secondo diverso caso di utilizzo della domanda aperta è relativo alla proposta, anche in toni provocatori, di problematiche distanti dal tema centrale di ricerca; un esempio, tratto dalla stessa
ricerca citata sopra, è il seguente:
70) Non si fa che parlare della grave situazione economica e sociale dell’Italia: inflazione, disoccupazione, terrorismo, scandali, ...
Secondo lei cosa si dovrebbe fare per fare andare meglio le cose?
___________
____________________________________________________
____________________________________________________
Una domanda di questo genere, altamente provocatoria, non centrata sul tema dell’indagine, e posta in termini così generali, non ha
altro scopo che quello di consentire una sorta di ‘triangolazione’
della complessità culturale, cognitiva, valoriale, dell’intervistato.
In altra parte del questionario i ricercatori hanno già rilevato le sue
principali proprietà (sesso, età, professione, ecc.) per tracciarne
una sorta di identikit descrittivo; nella parte principale hanno sondato adeguatamente tutti gli aspetti relativi al tema centrale della
ricerca (l’atteggiamento verso la lettura); con questa ed altre domande i ricercatori vogliono verificare aspetti anche molto distanti
fra loro del mondo vitale degli intervistati per ricostruire con più
dettagli un quadro problematico più ampio. Lo scopo, quindi, non
è semplicemente avere altre informazioni; non è pensabile trarre
informazioni, p. es., sugli atteggiamenti politici con una domanda
come la 70; essa è troppo generica, posta in modo da lasciar passare più dimensioni, formulata volutamente in modo provocatorio.
133
Lo scopo è appunto scuotere l’intervistato con temi di discussione
molto diversi da quelli quietamente trattati nel corso
dell’intervista, porlo bruscamente davanti ad argomenti spinosi,
scabrosi, conflittuali (o potenzialmente tali) per attribuire poi, in
fase di codifica, un attributo molto approssimativo certo, ma tale
da darci un’idea di massima su aspetti della sua personalità utili
per una comprensione d’insieme e più ampia delle dinamiche di
lettura (si veda come è stata codificata questa domanda al §. 7.2
“La codifica a posteriori”; si veda anche quanto scritto nella seconda parte di 6.3.1 “La trascrizione delle risposte”).
5.2 LE DOMANDE SECONDO LA LORO FUNZIONE
5.2.1 Le domande introduttive
Cosa mettere all’inizio del questionario? C’è un modo preferibile
per affrontare il colloquio strutturato? La risposta non è univoca,
ovviamente; il questionario non è una tecnica standard di una
scienza esatta, ed ogni questionario fa storia a sé. Comunque è vero che l’incipit è piuttosto significativo, e può avere riflessi nella
gestione complessiva del rapporto di intervista.
Il ricercatore deve cercare di prefigurare cosa accade realmente in
questi momenti: il rilevatore ha ottenuto (non sempre senza fatica)
di svolgere l’intervista; entrato in casa dell’intervistato gli ha riassunto gli scopi (usualmente nobili) della ricerca, spiegato chi è il
committente (in genere autorevole), lo ha motivato in vari modi
esaltando il ruolo che proprio lui, Uomo Comune, ha in questo lavoro, dopodiché, con un sorriso, fa la fatidica prima domanda che
spesso non c’entra nulla con le cose dette fino a quel momento;
esempio: se la ricerca riguarda i consumi culturali, o i problemi
della salute, o quant’altro, perché mai si inizia col chiedere sesso,
età, luogo di nascita, ecc.? Il ricercatore è ben consapevole della
necessità di cercare correlazioni fra le opinioni espresse e altre
proprietà, ma non si può spiegare questo problema all’intervistato.
Specie in caso di persone anziane e sole, o poco scolarizzate, la
logica dell’intervista deve essere molto semplificata e lineare, ed è
importante che le prime domande, comunque di carattere generale
e non immediatamente ‘difficili’ od emotivamente connotate, siano in qualche modo in relazione col tema principale della ricerca, a
meno che questo non sia un tema complessivamente delicato, nel
qual caso è meglio porre una domanda neutrale, distante dal tema e
134
che non susciti reazioni polemiche (Goode - Hatt 1969, 218-219;
Pitrone 1986, 70). Una volta che il colloquio è ben avviato si potranno inserire, non necessariamente tutte assieme ma anche distribuite lungo il questionario, domande come l’età, la professione,
ecc. (alcuni, come Dautriat 1970, 68; Pellicciari - Tinti 1983, 251 giungono a relegarle alla fine del questionario).
Certo, in una ricerca sui consumi culturali si potrebbe iniziare dal
titolo di studio; in una ricerca sulla situazione professionale si dovrà utilmente iniziare con domande sulla sua professione; in una
ricerca sulla condizione anziana iniziare con la richiesta dell’età.
Ma se i temi non presentano un evidente aggancio con queste proprietà comunemente rilevate in ogni questionario è opportuno non
chiederle inizialmente, per evitare un avvio ‘freddo’. Una buona
domanda iniziale può quindi essere una domanda generale sul tema principale; anche così tanto generale da favorire la pluridimensionalità delle risposte o da essere poco utilizzabile, ma utile per
mettere a proprio agio l’interlocutore.
Se per vari motivi ciò non è possibile, è opportuno introdurre la
prima domanda con una giustificazione breve e chiara del tipo:
“Benché il tema della ricerca, come lo ho spiegato, sia il tale, ho
bisogno di chiarire inizialmente alcune questioni preliminari che
mi servono per meglio inquadrare l’intervista; per esempio, mi potrebbe dire la sua età?”.
Benché non si tratti necessariamente di domande, va ricordata qui
l’opportunità dell’uso di formule introduttive, sia all’inizio del
questionario che in caso di bruschi passaggi fra zone diverse dello
stesso (Guidicini 1993; Bailey 1985, 166- 169). Tali formule possono avere la forma di una frase sostanzialmente di scuse per il
cambiamento di argomento che si sta per introdurre, del tipo “Dovrei ora farle qualche domanda su [...]”, oppure “Un altro punto
del nostro studio riguarda [...]” (Guidicini 1993), formule queste
non di grandissima utilità in sé ma comunque opportune, oppure
essere delle vere e proprie ‘domande per preparare la scena’, proposte cioè per introdurre in modo non troppo brusco una nuova
sezione tematica del questionario e che potrebbero anche non essere in seguito utilizzate per la codifica e la tabulazione (Goode Hatt 1969, 239).
5.2.2 Le domande filtro e le domande condizionate
Le domande filtro servono, come dice il loro nome, per filtrare i
vari intervistati e selezionarli a seconda di determinate proprietà
allo scopo di sottoporli poi a domande specifiche differenziate.
135
Un esempio astratto di uso della domanda filtro è il seguente:
1) Lei possiede la proprietà y?
[1] Si
[2] No
(se SI passare alla dom. 2; se NO passare alla dom. 3)
2) Cosa pensa di coloro che non sono y?
[1] risposta 1
[2] risposta 2
...
[n] risposta n
(passare alla dom. 4)
3) Cosa pensa di coloro che sono y?
[1] risposta 1
[2] risposta 2
...
[n] risposta n
Con domanda condizionata si intende una domanda “la cui rilevanza per l’intervistato è determinata dalla sua risposta ad una precedente domanda filtro” (Bailey 1985, 163).
Le domande filtro hanno comunque varie forme e scopi: possono
discriminare in modo molto più articolato di quanto visto sopra,
per esempio in abbinamento ad inventari, oppure essere concatenate, come in questo caso:
Le giudica il suo stato di salute attuale:
[1] Pessimo
[2] Non molto buono
[3] Normale; medio; così così
[4] Piuttosto buono
[5] Ottimo
Se ha risposto ‘Pessimo’: conta di farsi vedere da un medico nei
prossimi giorni?
[1] Si
[2] No
Se ‘No’, perché?
[1] risposta 1
[2] risposta 2
...
[n] risposta n
136
Occorre utilizzare con discrezione questi meccanismi, evitandoli il
più possibile nelle forme appena viste. In particolare se le domande filtro sono concatenate vi sarà un appesantimento piuttosto inutile nella matrice dati, con campi sostanzialmente vuoti di informazione (tutti coloro che non hanno dichiarato di avere una pessima salute, più tutti coloro che, pur avendola pessima, andranno dal
medico); questo appesantimento avverrà poi senza sostanziali vantaggi per la ricerca; il ricercatore deve chiedersi: mi serve davvero
discriminare qui i miei intervistati? Nel caso visto sopra, p.es., non
si capisce perché il ricercatore sia interessato ad un’indagine approfondita su coloro che dichiarano una pessima salute, o perché
chieda ragione solo della risposta negativa alla visita medica.
Le domande filtro sono invece utili quando il ricercatore prefigura
una tipologia di intervistati e dedica intere parti di questionario a
ciascun tipo; ciò può accadere in occasione di tipologie naturali,
come nel caso di una ricerca su un campione multietnico in cui si
chieda preliminarmente a quale etnia appartenga l’intervistato per
poi sottoporlo a domande specifiche, oppure in una tipologia logica costruita dal ricercatore e verificata direttamente sul campo.
Questo caso è piuttosto interessante e lo esemplificheremo con una
ricerca reale.
Nel corso di una ricerca sui livelli di lettura nella popolazione adulta (Del Cornò - Bezzi 1985) i ricercatori, sulla scorta di una serie di motivazioni argomentate, avevano costruito, ex ante, una tipologia di ‘lettori’ alla quale ricondurre tutto il campione.
Dopo quattordici domande riferite ai ‘prerequisiti’ della lettura
(tempo libero disponibile, aspirazioni relative al tempo libero ed
attività praticate, libri posseduti ed acquistati, ecc.), domande in
gran parte aperte e ricche di probe, si poneva all’intervistato questa
domanda:
24) In conclusione, lei:
[1] Non legge mai, o quasi mai, e perlopiù limitatamente a stampa
occasionale comprata da altri familiari, o trovata in locali pubblici, in
ogni caso non scelta da lei, salvo in circostanze particolari e rare
(procedere quindi con le domande della sez. III)
[2] Legge con una certa frequenza, o spesso, e comunque in genere opere da lei stesso scelte, perlopiù per svago o per cultura personale
solo saltuariamente legata alla condizione professionale
(procedere quindi con le domande della sez. IV)
137
[3] Passa parecchio tempo a leggere, quasi quotidianamente, perlopiù per motivi in qualche modo legati alla sua condizione professionale, oltre che per svago
(procedere quindi con le domande della sez. V)
Seguivano tre sezioni distinte di questionario, che si somigliavano
come logiche interne ma erano relative tre tipi di intervistati ritenuti profondamente diversi come stile cognitivo. Così, p. es., ai
‘non lettori o lettori occasionali’ si chiedevano i motivi della non
lettura, i giudizi sui lettori e sui libri, ecc.; ai ‘lettori frequenti o
abituali’ si chiedevano i motivi della lettura e una descrizione, articolata in più domande, sul comportamento di lettura; ai ‘lettori di
professione’ si chiedevano motivi del rapporto fra professione e
lettura, ecc.
Indipendentemente dalle logiche di quella ricerca, che qui non interessa ricostruire, è interessante vedere le indicazioni operative
che facevano decidere dell’attribuzione degli intervistati in una
delle tre classi:
L’attribuzione di ciascun intervistato entro la tipologia [...] avveniva durante l’intervista, sulla scorta di una valutazione che
l’intervistatore formulava dopo la somministrazione delle pime due
sezioni di questionario [...]. Nei casi dubbi l’intervistatore aveva la facoltà di decidere assieme all’intervistato la collocazione più idonea,
che rinviava poi ad una specifica e differenziata sezione di questionario (Del Cornò - Bezzi 1985, 72)
Si capisce quindi come il ‘filtro’ qui fosse qualcosa di più complesso di una semplice domanda, che rinviava alla particolare
struttura del questionario, quasi tutto composto da domande aperte,
alla concettualizzazione dei temi in indagine, alla formazione ed al
ruolo degli intervistatori gravati di notevoli responsabilità, ed infine ai correttivi messi in atto dai ricercatori per ovviare almeno in
parte agli errori degli intervistatori operando delle correzioni ex
post sui questionari (Del Cornò - Bezzi 1985, 72, nota 15).
Va comunque ricordato che nelle indagini campionarie l’uso di
domande filtro per effettuare analisi specifiche su segmenti diversi
deve accompagnarsi a particolari attenzioni nel campionamento,
per assicurarsi un’adeguata consistenza numerica in ciascun sotto
insieme del campione.
5.2.3 Le domande sonda ed i probe
138
Le domande sonda servono per stimolare l’intervistato a chiarire il
suo pensiero, spiegare una risposta oscura, incitare a sviluppare un
argomento. Per il carattere spesso improvvisato che possono avere
Guidicini le colloca in un paragrafo dedicato al ‘colloquio in profondità’ (Guidicini 1993). Alcune esperienze ci portano a considerare di grande utilità questi stimoli in quanto effettivamente portatori di informazioni che altrimenti ci sarebbero state negate da un
interlocutore reticente e timido, o anche solo distratto (Goode Hatt 1969, 270, 312-319; Guidicini 1993).
Probe è l’equivalente termine inglese utilizzato da alcuni autori, ed
il verbo derivato significa appunto sondare o anche investigare. I
probe sono insomma domande secondarie, realizzate spesso ad hoc
dall’intervistatore stesso per spronare l’intervistato in seguito
all’inefficacia della domanda principale;
lo scopo di ogni probe, o serie di probes, è quello di trasformare
una risposta inadeguata in una che soddisfi gli obiettivi dell’intervista
(Kahn - Cannel 1968, 281)
I probe vanno indicati per iscritto nel questionario? In parte sì. In
generale gli intervistatori devono conoscere l’opportunità di utilizzare dei probe; il ricercatore potrà anzi segnalare quali domande,
in particolare, vanno stimolate ulteriormente, suggerendo anche le
formule ritenute più opportune (qui è utile avere fatto un pre-test).
Questo cautela diventa pressoché indispensabile in caso di domande aperte. È comunque utile segnalare anche sul questionario tali
probe, con una formula generale che potrà essere ovviamente adattata dal rilevatore, perché in questo modo gli si ricorda
l’importanza della domanda e la necessità di non accontentarsi della prima risposta, semmai frettolosa e banale.
Naturalmente per le domande chiuse il problema è molto diverso e
i colpi di sonda sono riservati ad intervistati piuttosto reticenti.
Si possono utilizzare i probe anche nei questionari autoamministrati se comprendono domande aperte, perché rendono bene
l’idea, nel complesso, della necessità di una risposta ampia ed articolata.
Un esempio di domanda corredata da probe è il seguente:
Lei ritiene di conoscere i pericoli del contagio da virus Hiv e le
modalità tramite le quali si può contrarre l’Aids? Ne è sicuro? Come
ha avuto queste informazioni? Ce le può riassumere?
_______________
____________________________________________________
____________________________________________________
139
È più che evidente che la risposta sarà pluridimensionale, ma se gli
scopi fossero accertarsi, nell’ambito di una ricerca epidemiologica,
delle reali conoscenze degli intervistati, e lo strumento fosse autoamministrato, in questo modo avremmo abbastanza probabilità di
avere un quadro più preciso delle conoscenze diffuse; posta la domanda infatti si insinua prima un dubbio, per lasciare intendere che
ci si rende conto della complessità del problema e far riflettere
l’interlocutore; poi lo si pone di fronte alla questione della fonte di
informazioni, aiutandolo a ricordarla; infine lo si invita a riassumere tale informazione. La codifica di una domanda del genere non
sarà evidentemente relativa ad ogni parte di questa domanda, ma
potrà essere semplicemente una valutazione di insieme del grado
di informazione, semmai stimato con un punteggio, od una scala
del tipo Molto/Abbastanza/Poco informato.
Vi sono numerosissime situazioni che possono richiedere tecniche
di probing, e vi sono ovviamente molti tipi di probe che
l’intervistatore può mettere in atto:
a. brevi affermazioni di comprensione ed interessamento, usate
per ‘sostenere’ il flusso del discorso dell’intervistato (“Capisco”, “A-ha”, “Sì...”), oppure semplicemente uno sguardo carico di attesa;
b. pause, usate dall’intervistato per sottolineare che quanto detto
non è considerato concluso, che si è in attesa di un proseguimento;
c. frasi neutre che rilanciano la domanda, ovvero invitano
l’intervistato a chiarire quanto appena detto (“Cosa vuole dire?”, “Perché?”, “Secondo lei perché è successo?”);
d. riepiloghi, in forma concisa, di quanto appena detto
dall’intervistato, per sottolineare l’interesse dell’intervistatore e
rilanciare il flusso narrativo (p. es. Intervistatore: “Cosa pensa
della pena di morte per i delitti più gravi?”; Rispondente: “Beh,
non saprei, certo che è una pena estremamente grave”; I: “Pensa che sia grave”; R: “Beh, sì! Certo alcuni delinquenti se lo
meriterebbero!”; I: “È grave ma può andare bene per certuni”;
R: “Certo! Così farebbero da esempio e gli altri ci penserebbero due volte”; ...);
e. domande suppletive vere e proprie, adatte alle circostanze (p.
es. I: “Cosa pensa della pena di morte per i delitti più gravi?”;
R: “Credo che sia sbagliato ed ingiusto”; I: “Anche in caso di
reati gravissimi, come la strage terroristica o di stampo mafioso?”);
140
f. riformulazione della domanda in altri termini, o usando se del
caso i termini proposti dall’intervistato nella prima risposta,
quando questa è confusa, incompleta, tautologica, o comunque
inadeguata.
Il concetto di domanda sonda si pone comunque all’interno di una
problematica relativa alla gestione del rapporto di intervista orientato alla cordialità e all’interesse, che determina la strategia
dell’intervistatore, di accattivarsi la simpatia dell’interlocutore con
stimoli concilianti; esiste però l’eventualità di voler provocare reazioni più accentuate per farlo uscire da una situazione difensiva
scarsamente collaborativa; si parla allora di ‘sonda antagonista’,
ben esemplificata da Goode e Hatt 1969 (318-319):
Intervistatore: Vi furono delle occasioni in cui lei ha avuto
l’impressione di non essere leale con suo marito?
Intervistata: Mai. Io sono sempre stata leale con mio marito. Io
non l’ho mai ingannato, sin che non abbiamo divorziato.
Intervistatore: Mi scusi, ma vorrei essere certo di avere capito bene. Lei dice di non aver mai avuto ‘appuntamenti’ con persone
dell’altro sesso sino a dopo il divorzio?
Intervistata: Proprio così. Ero una buona moglie e pensavo che sarebbe stato immorale.
Intervistatore: Allora, prima io devo avere capito male. Lei non ha
detto prima che la sua attività principale nel periodo in cui eravate separati era quella di avere ‘appuntamenti’ con persone dell’altro sesso?
Intervistata: (In modo eccitato) Bene, io ho sempre pensato che
questo non poteva essere considerato un inganno. Dick era come uno
di famiglia, un buon amico nostro, anche quando eravamo sposati. (In
lacrime) Ad ogni modo, dopo ciò che lui aveva fatto a me, mi sembrava di aver diritto di fare ciò che volevo.
Intervistatore: Che cosa ha fatto?
Intervistata: Bene, io ho detto poco fa che dovemmo divorziare
perché non andavamo d’accordo, ma non è così. La verità è che egli
stabilì una relazione con una mia cuginetta, che allora aveva solo diciassette anni, e la mise nei pasticci. Oh, fu uno scandalo tremendo in
famiglia, e io mi sentii terribilmente male per questo...
Qui - commentano Goode e Hatt - se l’intervistatore avesse accettato la dichiarazione dell’intervistata, che ‘sentiva’ di aver trattato lealmente suo marito, non soltanto non avrebbe conosciuto alcuni dati di
fatto, ma non avrebbe individuato la causa centrale della crisi familiare culminata nel divorzio. La richiesta che i fatti contraddittori fossero
spiegati, condusse ad una migliore comprensione delle esperienze emozionali attraverso cui si era determinato il divorzio. Né era necessario accusare l’intervistata di nascondere i fatti, sebbene in alcuni casi
questa accusa possa essere fruttuosa
141
Si possono pensare naturalmente situazioni di intervista meno
drammatiche in cui una sonda antagonista può sbloccare
l’interlocutore, ma è comunque evidente che, a differenza dei probe, le sonde antagoniste possono essere raramente previste in un
questionario ma devono essere lasciate ad intervistatori molto bravi e, soprattutto, molto motivati.
5.2.4 Le domande ad imbuto
Il termine si riferisce ad un gruppo di domande concatenate in sequenza logica, sullo stesso argomento, formulate le prime in modo
generale, solitamente in forma aperta, e le successive via via più
mirate all’oggetto specifico di analisi, generalmente in forma chiusa.
Sono spesso abbinate a domande filtro, e da alcuni con queste accumunate (Guala 1986, 220), ed utilizzate in generale entro strategie volte ad accattivarsi la disponibilità dell’intervistato prendendola alla larga (Bailey 1985, 163). Altri autori accennano a
questa tecnica come strategia, a fianco dell’uso di probe, per meglio condurre quella che Phillips chiama ‘analisi dei motivi’; in
pratica, le prime domande generali consentirebbero di richiamare
alla mente spontaneamente il quadro di riferimento, e le successive
domande specifiche fornirebbero i dati su cui si concentra
l’interesse dell’intervistatore senza pericoli di pluridimensionalità
(Phillips 1972, 205-206).
Un esempio di sequenza ad imbuto (appena aggiornato da chi scrive) è il seguente (Guidicini 1993):
1) Lei cosa pensa dei nostri rapporti con i vari Paesi della CEE?
____________________________________________________
____________________________________________________
2) Come pensa che dovrebbero essere le nostre relazioni con la
Francia? ________________________________________________
____________________________________________________
3) Lei pensa che dovremmo considerare la Francia in maniera diversa da come viene oggi considerata?
[1] Si
[2] No
4) SE SI: Lei pensa che dovremmo essere più rigidi con la Francia?
Perché?
________________________________________________
142
____________________________________________________
Notare che qui l’imbuto è abbinato ad una domanda filtro ed
all’uso di probe; tutti insieme questi piccoli accorgimenti consentono di indagare con maggior sicurezza l’argomento che ci interessa.
In alcuni casi si può usare un ‘imbuto capovolto’, formulando cioè
una successione di domande specifiche su temi circoscritti, in modo da far concentrare l’intervistato su argomenti prossimi alla sua
esperienza, per poi concludere con una domanda più generale,
riassuntiva, che colga la problematica che interessa il ricercatore;
p. es.:
Come giudica i rapporti coi colleghi di lavoro? _______________
____________________________________________________
Come giudica i rapporti coi superiori?______________________
____________________________________________________
Come giudica lo stipendio?_______________________________
____________________________________________________
In conclusione, tenendo presenti tutti questi fattori, come giudica
nel complesso il suo lavoro?_________________________________
____________________________________________________
Le prime tre domande specifiche possono anche essere proposte
nella forma chiusa; è ovvio che l’interesse principale per il ricercatore è nella quarta domanda più generale.
5.2.5 Le domande di controllo
Le domande di controllo sono generalmente discusse come strategia per cogliere in fallo l’intervistato; per esempio,
potremmo chiedere ‘Bisogna legalizzare l’aborto (d’accordo / in
disaccordo)’ in un certo punto del questionario e ‘L’aborto non dovrebbe essere legalizzato (d’accordo / in disaccordo)’ in un punto successivo. Se la domanda è inattendibile, per la sua ambiguità o per
qualche altra ragione, l’intervistato potrebbe dichiararsi d’accordo o in
disaccordo con entrambe [... Ciò] consentirà al ricercatore di individuare le domande inattendibili e di eliminare dall’analisi dei dati
per un unico intervistato o per l’intero campione (Bailey 1985, 162;
un’impostazione simile in Goode - Hatt 1969, 256)
143
La realtà non è così semplice. Come nota Pitrone (1986, 72-74), se
la domanda di controllo si riferisce a proprietà molto semplici,
come p. es. l’età, l’incongruenza fra risposte diverse è facile da rilevare ma porterà, come unico risultato, all’esclusione di
quell’intervista o di quell’item dalla codifica, non potendo stabilire
quale delle due risposte sia veritiera (a meno che l’intervistatore
non colga subito l’incongruenza e non ponga una sonda antagonista all’intervistato); nel caso più probabile di domande più
complesse la situazione è diversa:
Quando [...] si indagano atteggiamenti e opinioni, la domanda di
controllo non svolge nemmeno questa funzione. Due o più domande
che si riferiscono allo stesso concetto devono infatti necessariamente
mettere l’accento su due aspetti diversi del concetto (l’alternativa, ovviamente improponibile, consisterebbe nel ripetere la stessa domanda
esattamente con le stesse parole). Volendo rilevare l’atteggiamento
‘progressismo’, ad esempio, una domanda può mettere l’accento sulla
politica economica, un’altra potrebbe sottolineare nello specifico i
problemi della disoccupazione; risposte che esprimono atteggiamenti
contraddittori dell’intervistato (ad esempio conservatore nella prima, e
progressista nell’altra) non indicano necessariamente che egli stia
mentendo in uno dei due casi o in entrambi. Potrebbero essere risposte
date [dall’intervistato] senza alcuna riflessione, ma potrebbero anche
essere espressioni di un atteggiamento molto complesso e magari contraddittorio - il che non deve sorprendere trattandosi di esseri umani e
non di robots. Piuttosto che di domande di ‘controllo’ si deve quindi
parlare di una normale pluralità di indicatori dello stesso concetto per
illuminarne i vari aspetti (Pitrone 1986, 73)
5.2.6 Le domande di verifica
A volte il ricercatore vuole un’informazione precisa sul comportamento dell’intervistato, e non semplicemente una sua opinione in
merito. Può allora inserire una domanda volta a realizzare una verifica empirica. Relativamente ad un comportamento di consumo,
p. es., si può proporre (Dautriat 1970, 51):
Può mostrarmi la bottiglia (si trattava di un analcolico) che ha attualmente, così che io possa rilevarne la marca e le caratteristiche?
Si.
No.
Deve annotare (questa parte del questionario non viene somministrata all’intervistato, ma è riempita sul terreno dall’intervistatore):
a.
la marca: x ...
144
b.
c.
bottiglia normale, 75 cl.;
mezza bottiglia;
confezione speciale;
denominazione (seguivano due nomi, propri alla
marca studiata);
altra denominazione, e quale?
Relativamente al possesso di un’informazione, in una ricerca sul
rapporto fra cittadini e servizi pubblici in cui la ‘conoscenza dei
servizi’ era un concetto chiave, p.es., si è chiesto (Bezzi - Raschi Tirabassi 1990, 211):
15) Sa dirmi con precisione:
- Dov’è la fermata ATAM più vicina a casa sua? (Far specificare
l’ubicazione)
- Quali linee vi si fermano? (Far specificare)
- Il loro percorso, almeno approssimativamente (Far specificare)
- Gli orari? (Far specificare)
Ovviamente non venivano codificate le specificazioni, ma solo
l’indicazione sul reale possesso dell’informazione corretta.
5.2.7 Le domande rivolte agli intervistatori
Non sono domande rivolte all’intervistato ma a chi lo intervista,
sono generalmente collocate in fondo al questionario e spesso sono
da compilare dopo l’intervista, addirittura all’insaputa
dell’interlocutore.
Possono avere diverse funzioni: verificare l’andamento dell’intervista, la disponibilità dell’intervistato, eventuali interferenze,
ecc.; controllare l’operato dell’intervistatore imponendo di trascrivere minuziosamente tutte le chiamate telefoniche fatte agli interlocutori, le risposte ai primi approcci, ecc. (anche per un esempio
vedi Bailey 1985, 170-172); oppure completare alcuni indicatori
presenti anche nell’intervista in modo più discreto che non crei
perplessità all’intervistato.
Per esempio, se il ricercatore è interessato a stimare il livello economico del campione, oltre a domande abbastanza neutre sulla
professione, titolo di studio, tipo di automobile e di proprietà immobiliare posseduta, ecc., può chiedere all’intervistatore di osservare abbigliamento, suppellettili, accessori, ecc., per correggere, se
del caso, le dichiarazioni ricevute (Pitrone 1986, 57-58).
145
5.3 L’ORDINE DELLE DOMANDE
Benché il problema possa essere rilevante ai fini di una buona riuscita (Pitrone 1986, 69), non vi è un ordine prestabilibile alle domande di un questionario; le indicazioni principali di cautela ed alcuni accorgimenti tattici sono descritti in relazione ad alcuni tipi di
item, in particolare discutendo le domande introduttive e gli imbuti, ed ai difetti principali, per esempio ricordando la necessità di
evitare effetti proxy.
Per il resto devono valere logiche piuttosto banali e regolate dal
buon senso: raggruppare le domande per temi coerenti, per non
confondere l’intervistato passando frequentemente da un argomento all’altro; iniziare con domande attinenti al tema principale
ma molto generali, possibilmente descrittive, in modo che
l’intervistato si senta a suo agio, ovvero con domande generali su
altro argomento se il principale è connotato emotivamente. Inoltre,
se il questionario prodotto è un contenitore complesso e piuttosto
lungo di molti item diversificati, può essere vantaggioso, nel rispetto delle indicazioni fin qui date, distribuire gli stimoli più ‘divertenti’ (termometri, test particolari e coinvolgenti) lungo il percorso, per consentire all’intervistato di riposarsi dalla successione
di domande recuperando interesse; un esempio di articolazione di
questionario diversificato, relativo ad una ricerca sul rapporto fra
cittadini e servizi pubblici, è il seguente (Bezzi - Raschi - Tirabassi
1990):
1) luogo di nascita, ovvero motivi della migrazione nella città oggetto della ricerca
2) progetti migratori infra o interurbani
3) composizione familiare realizzata tramite una griglia idonea a
rilevare tutte le principali proprietà di ogni membro del nucleo
4-5) informazioni sulla casa
6) giudizio generale introduttivo sulla città ed i suoi servizi
7) specificazione analitica delle critiche indicate sopra
8-9) opinione generale sulle attività che dovrebbero principalmente occupare il comune ed ulteriore sintesi
10-11) ‘Gioco delle preferenze fiscali’, ovvero: ‘Se lei fosse il
sindaco’
12-60) domande relative alla conoscenza e al giudizio dei principali servizi pubblici cittadini (trasporti, smaltimento rifiuti, verde pubblico, cultura e sport, servizi sociali, ecc.); comprende anche una ‘storiella’
61) ‘Termometro dei sentimenti’ relativo alle priorità attribuite ai
servizi presenti in un quartiere
62) giudizio sul proprio quartiere
146
63) ‘Storiella’ sulla partecipazione politica
64) domanda relativa alla storiella
65) Scala Likert sulla partecipazione politica
66-70) domande sulla partecipazione politica
71) domanda sull’opinione politica
72) domanda sul reddito
73) disponibilità ad ulteriori approfondimenti
Le prime domande sul luogo di nascita, ovvero sui motivi della
scelta di abitare in quella città, si legavano bene al tema della ricerca che, era stato chiarito, verteva appunto sulla città di residenza. La successiva scheda anagrafica era introdotta dalla seguente
frase:
Le porrò ora alcune domande relative alla sua famiglia: sui suoi
componenti, sulla loro età, sul lavoro che svolgono, la scuola che frequentano per scegliere le domande da sottoporle sull’utilizzo dei servizi oggetto di quest’indagine
Questa introduzione consentiva di realizzare una complessa scheda
anagrafica senza bruschi passaggi dal tema principale dell’indagine e forniva primi indicatori per un indice complessivo di status
socio-economico che utilizzava anche item successivi (casa, reddito). La domanda 6 è la vera domanda generale introduttiva che
funziona da imbuto assieme alla 7 e a diverse delle successive
sparse nel questionario su giudizi specifici sui vari servizi.
A questo punto era introdotto quello che i ricercatori chiamavano
‘gioco delle preferenze fiscali’, un test complesso ma coinvolgente
che permetteva di ricomporre, utilizzando diversi gadget (un tabellone col reale bilancio comunale e fiches rappresentanti diversi tagli di denaro), un bilancio comunale come a lui piaceva, discutendo poi delle economie fatte o del reperimento dei fondi aggiuntivi
che gli necessitavano. Seguivano, servizio per servizio, varie domande sulla conoscenza, uso e giudizio dei principali servizi pubblici cittadini. Passando alle problematiche del decentramento dei
servizi si introduceva un termometro (ne abbiamo discusso precedentemente al §. 4.3), nuovo momento di stacco in quanto anche il
termometro si presenta come ‘gioco’ dotato di gadget colorati da
manipolare liberamente; la parte finale sulla partecipazione ed efficacia politica comprendeva infine una scala Likert ed una storiella (si veda al §. 4.4), sempre piuttosto coinvolgente; due domande
più ‘calde’, sull’opinione politica ed il reddito, erano state relegate
in fondo per ovvi motivi tattici relativi all’eventuale suscettibilità
dell’intervistato.
147
5.4 PARTICOLARI MODALITÀ DI RISPOSTA
5.4.1 Uso di ‘Altro’
Si è già parlato diffusamente in altre parti dell’uso di ‘Altro’, ma è
bene riassumere alcune questioni: ‘Altro’ è una particolare chiusura utilizzabile, in coda ad una lista di risposte, in tre casi:
a) quando l’item si riferisce a proprietà di tipo espressivo (opinioni, atteggiamenti, ...), in quanto il ricercatore, a meno di restare
su livelli altissimi della scala di generalità, non può essere sicuro di esaudire il primo criterio della classificazione (esaustività); domande quindi del tipo: “Lei va al cinema? Se sì: perché?”; “Cosa pensa della posizione della Chiesa nei riguardi
della Legge 194?”; “Cosa vorrebbe suo figlio facesse da grande?”; ecc., possono prevedere, dopo un certo numero di risposte ritenute di maggior probabilità di frequenza, la categoria
‘Altro’;
b) quando l’item si riferisce a proprietà discrete, costituenti però
un insieme vasto e non chiaramente definibile dal ricercatore,
oppure in continua evoluzione; domande del tipo: “Mi può citare i principali hobby che pratica nel tempo libero?”; “Che genere di libri preferisce leggere?”; “Quali elettrodomestici ed
apparecchi elettrici possiede?”; ecc., possono prevedere la categoria ‘Altro’;
c) infine, quando la proprietà, di tipo discreto, fa parte di un insieme interamente noto, ma il ricercatore sa per certo che alcuni dei suoi stati raccolgono frequenze limitate o comunque poco interessanti o comunque tali che il ricercatore preferisce, per
affinità, raggruppare; domande del tipo: “In quale mese preferisce passare il principale periodo di ferie?” (possibili risposte:
Giugno, Luglio, Agosto, Settembre, Altro); ecc., possono prevedere la categoria ‘Altro’.
In generale è bene lasciare aperta la categoria, invitando a specificare per esteso, e questo non tanto come correttivo ad errori del
ricercatore ma per riclassificare entro le categorie previste risposte
erroneamente messe in ‘Altro’ dall’intervistato (ovvero dall’intervistatore); avremo pertanto, p.es.:
Che genere di libri preferisce leggere?
[1] Classici del passato
[2] Poesia, teatro
148
[3] Letteratura contemporanea in generale
[4] ‘Gialli’, Fantascienza, letteratura ‘di genere’
[5] Biografie, opere di storia
[6] Guide, manuali tecnici ed hobbistici
[7] Saggi scientifici
[8] Altro (specificare: _______________)
In un caso come questo, trovando un numero interessante di questionari con specificato ‘Testi d’arte, di critica artistica’, il ricercatore dovrebbe capire di aver compiuto un errore relativo alla non
esaustività della sua lista, ma grazie all’escamotage di ‘Altro’ potrà considerare, a livello di codifica, una categoria aggiuntiva: [9]
Saggi d’arte; invece, trovando specificato, p. es., ‘Romanzi rosa’,
riclassificherà la risposta entro la quarta categoria, essendo anche
la narrativa rosa una letteratura ‘di genere’ (semmai qui il ricercatore potrà trarre un insegnamento sull’utilizzo inopportuno di termini tecnici); infine, qualora trovasse indicato ‘Testi religiosi’, se
la frequenza di questa specificazione fosse veramente bassa potrebbe decidere di lasciare questa ed altre risposte parimenti poco
frequentate nella categoria residuale ‘Altro’, che a questo punto (e
solo a questo punto, a livello di codifica e di conseguenti tabelle)
resta una categoria generica dove il ricercatore ha lasciato risposte
che non ritiene di poter utilizzare. Attenzione: poiché a questo
punto ‘Altro’ accoglie oggetti molto diversi fra loro (nel nostro esempio si potrebbe trattare di Testi religiosi, enciclopedie, e altre
cose poco chiaramente specificate che non si sa come classificare)
questa categoria di risposta è assolutamente inutilizzabile per qualunque incrocio. È pertanto indispensabile che raccolga comunque
un numero molto basso di frequenze.
5.4.2 Uso di ‘Non so’
Molte domande prevedono, fra le risposte, la categoria ‘Non so’,
per consentire all’intervistato una sorta di ‘uscita di sicurezza’ nei
casi in cui il quesito che gli si pone risulti troppo complesso per
lui; in realtà a volte l’intervistato può utilizzare questa risposta per
non esporsi, pur avendo un parere molto chiaro, specie nel caso di
domande su questioni delicate.
Attenzione: un ritorno eccessivo di ‘non so’ è indicatore di malfunzionamento della domanda.
È evidente che molte domande non possono logicamente prevedere questa modalità di risposta; p. es., in generale, quelle relative
alle variabili indipendenti, sesso, età, ecc., oppure quelle relative a
149
comportamenti semplici (“Quante volte alla settimana, in media,
va al cinema?”), ad oggetti posseduti, ed altro.
‘Non so’ è invece utile nel caso di richieste di opinioni (“Secondo
lei cosa si dovrebbe fare per ...?”; “Lei cosa ne pensa di ...?”).
Per i motivi detti sopra spesso però i ‘non so’ sono in realtà dei rifiuti a rispondere. Nel caso che il ricercatore preveda una resistenza all’item, e se ritiene comunque che in sede di codifica o di trattamento dati accorperà queste categorie, è opportuno prevedere nel
questionario un’unica modalità del tipo: ‘Non sa; non risponde’;
oppure anche: ‘Non sa; non risponde; non capisce la domanda’.
Questa procedura è ispirata, ancora una volta, ad un criterio di economia e di logica interna al questionario. Alcune ricerche riportano, per puntigliosità, a fianco delle poche categoria di risposta,
anche una categoria ‘Non so’, una ‘Non risponde’, eventualmente
una ‘Non pertinente’ (nel caso di precedente domanda filtro); ciascuna di queste categorie, se non utilizzata in qualche modo costruttivo (p.es. le mancate risposte come indicatore di resistenza
all’inchiesta), occupa campi della matrice, registra frequenza, incide sulle operazioni matematiche realizzate sulla matrice delle risposte, e insomma complica la vita inutilmente.
5.4.3 Uso di gadget
L’uso di gadget per favorire le risposte può dimostrarsi un’ottima
idea per risolvere non poche questioni: elimina alcuni problemi di
distorsione causati da intervistatori, consente di somministrare
stimoli complessi, comprese le domande chiuse con lunghe liste di
risposte, può anche essere divertente, una sorta di diversivo
all’interno di interviste lunghe.
Col termine ‘gadget’ si intende qui qualunque oggetto manipolabile dall’intervistato, utilizzato nell’ambito dell’intervista per far
meglio comprendere una domanda (o altro stimolo), per aiutare a
riflettere, per registrare una sua risposta.
Per esempio, nel caso di scale Likert o di termometri è assolutamente il caso di preparare dei cartoncini, o dei veri e propri pannelli, da sottoporre all’interlocutore; oppure nel caso di frasi da
scegliere, o da ordinare, è bene stampare queste frasi su cartoncini
separati che l’intervistato può prendere, manipolare, spostare su
una base; in caso di chiusure molto ampie l’intera lista può essere
scritta su un apposito cartoncino in modo che si possa far scorrere
lo sguardo più volte su tutti gli elementi; e così via.
In generale gli intervistati mostrano di gradire molto le interviste
composte da stimoli diversi con uso di gadget, e l’unica avvertenza
150
che il ricercatore deve avere è il limite di alcuni di essi verso certe
fasce di popolazione: gadget scritti, p. es., risulteranno di ostacolo
agli intervistati molto anziani e di scarsa scolarità; in generale per
questa ragione è meglio pensare ai gadget come strumenti non letterali: fiches, simboli da collocare in uno spazio, ecc. In caso contrario occorrerà istruire appositamente gli intervistatori.
5.5 PRINCIPALI DIFETTI DELLE DOMANDE
5.5.1 Fedeltà, validità ed attendibilità
Perché mai una domanda dovrebbe avere un difetto? La risposta a
tale quesito ci darà un’ulteriore prova della fondamentale diversità
del linguaggio del questionario dal linguaggio comune. La domanda, nel questionario, è depurata delle dimensioni simboliche presenti in una normale conversazione, e rappresenta un mezzo per
trarre indicazioni su concetti generali che il ricercatore ha posto al
centro del lavoro. Normalmente, ricordiamo, il ricercatore scompone i concetti della ricerca in indicatori, resi operativi in vari modi, uno dei quali è ‘la domanda’.
La domanda, nella sua formulazione lessicale, nel modo in cui va
posta, ecc., è un insieme di definizioni operative volte a tratteggiare un indicatore (determinate proprietà che il ricercatore ritiene essere in relazione con un concetto).
Generalmente sono due i problemi che possono sorgere: il primo è
relativo al rapporto fra indicatore e concetto, che relativamente ai
nostri problemi pratici sulla ‘bontà’ delle domande si potrebbe tradurre così: questa domanda, che rapporto di indicazione ha col
concetto che pretende di indicare? Ovvero: siamo sicuri che in
questo modo traiamo informazioni proprio su quel concetto?
È il problema della validità che non è risolvibile in alcun modo
certo:
non abbiamo nessun criterio ‘oggettivo’ per misurare a priori (cioè
prima di raccogliere i dati) la parte indicante o la parte estranea, e
quindi neppure la validità (Marradi 1987a, 36);
questa impossibilità è dovuta al legame di tipo semantico che unisce concetto ed indicatore, un legame che non si può misurare in
quanto
151
il rapporto di indicazione ha non solo natura stipulativa (cioè non
esiste ‘nelle cose’, ma dipende da una decisione dei ricercatori [...]),
ma anche validità circoscritta nel tempo e nello spazio (Pitrone 1986,
76; vedi anche Palumbo 1992, 20-22)
Il secondo problema è relativo invece al “rapporto fra il concetto
che ha suggerito la definizione operativa e gli esiti effettivi delle
operazioni che tale definizione prevede” (Marradi 1987a, 36); tale
rapporto si chiama attendibilità: essa
è tanto più alta quanto più fedelmente, attraverso la definizione
operativa, si riescono a registrare gli stati effettivi degli oggetti sulla
proprietà che si studia (Marradi 1987a, 36-37)
Nelle parole di altri autori l’attendibilità è una proprietà dello
strumento, in grado di ottenere gli stessi risultati in successive misurazioni (vedi, anche per una critica, Pitrone 1986, 80-81). Come
si vede il concetto di attendibilità si riferisce a questioni piuttosto
diverse, ed anzi spesso il suo uso impreciso ha consentito di sostenere una grave carenza epistemologica (Marradi 1990, 55-76); è il
caso quindi di precisare meglio distinguendo fra attendibilità come
accordo fra rilevazioni diverse (ciò che attesta quindi la reale presenza di uno stato su una proprietà), e fedeltà come congruenza fra
informazione raccolta e corrispondente stato sulla proprietà, ovvero come qualità di un singolo atto di rilevazione (Marradi 1990,
76-85).
Riepilogando:
• ogni domanda nel questionario cerca di indicare, almeno in
parte, un concetto posto al centro della ricerca, ed è tanto più
‘valida’ quanto più la parte indicante è ampia;
• essa è anche ‘attendibile’, quanto più riesce a cogliere e registrare effettivamente la proprietà in oggetto,
• e ‘fedele’ se il processo di rilevazione/registrazione accoglie
giustappunto quello stato di quella proprietà.
È evidente che fra validità e attendibilità c’è uno stretto legame:
non ha senso un’indicazione operativa di alta validità (ovvero con
una assai probabile connessione fra concetto indicato ed indicatore) se poi non si riesce ad assicurare un’alta attendibilità (se cioè
non si può registrare lo stato della proprietà) (Marradi 1987a, 37),
come è sbagliato realizzare un’alta attendibilità senza assicurarsi
della validità di quell’indicatore (e questo è l’errore probabilmente
più frequente, vedi anche Goode - Hatt 1969, 244-245).
152
Tutti i difetti delle domande sono in qualche modo riconducibili a
problemi di validità, attendibilità e fedeltà (Montesperelli - Gobbi
1993), ma come vedremo possono assumere forme assai diverse.
Problemi che rinviano alla validità sono stati accennati all’inizio
del testo, costantemente ricordati nei primi paragrafi di questo capitolo col rinvio, nella discussione dei vari problemi, ai temi della
ricerca, e ripresi più avanti quando vedremo i ‘criteri per decidere
l’inserimento di stimoli’.
Per quanto riguarda l’attendibilità e la fedeltà vediamo qui di seguito alcuni dei principali problemi, ricordando che anche la forma
del supporto fisico attiene le definizioni operative e quindi incide
sull’attendibilità.
Va comunque ricordato che, indipendentemente dalla competenza
del ricercatore e dalla sua capacità di applicare tecniche sofisticate
o semplicemente avvertite dei problemi,
le distorsioni [...] sono una componente inevitabile della relazione
fra osservatore e osservato che produce il dato stesso (Palumbo 1992,
20)
e questo a causa di una quantità di questioni relative alla contingenza storico-culturale del processo comunicativo, alla riconosciuta valenza negoziale di tutti i concetti che poniamo a fondamento
della costruzione sociale della realtà, del carattere sociale e normativo di ogni rappresentazione mentale, della polisemia del linguaggio, ecc. (un riepilogo in Palumbo 1992, 16-23).
5.5.2 Le domande false o viziate
Le domande false sono domande che nascondono affermazioni assiomatiche, in genere caricate di valenze ideologiche, proposte per
diffondere un messaggio, piuttosto che per rilevare uno stato. Un
esempio ce lo fornisce Guala (1986, 232, ora in Guala 1991, 191)
in relazione ad un’inchiesta del Psi sugli studenti:
Ritieni che la contestazione studentesca, originale sia per la volontà di partecipazione tesa a trasformare in impegno personale ogni valutazione o scelta politica, sia per talune acute individuazioni dei nessi
politici tra aspetti della crisi scolastica e più generali fenomeni sociali,
abbia ancora un ruolo da svolgere nell’ambito della scuola e della società?
[]si
[]no
Come giudichi la posizione del P.S.I. nei confronti di essa?_____
153
____________________________________________________
____________________________________________________
Le domande viziate sono una versione più moderata delle precedenti; non vi è un chiaro messaggio orientativo, ma la formulazione tende a indurre l’intervistato a rispondere in una determinata
maniera; un buon esempio ce lo fornisce Bailey (1985, 140):
La maggior parte dei medici americani ritiene che il fumo sia dannoso; lei è d’accordo?
È evidente che la premessa relativa al parere della ‘maggior parte’
di un gruppo socialmente riconosciuto di esperti (i medici) tende
ad orientare la risposta; occorre un intervistato molto convinto di
ciò che dice per sostenere, in barba ai medici, di non essere
d’accordo.
Se le domande false sono piuttosto rare, e diffuse in ambiti ristretti,
le domande viziate possono far capolino anche inconsapevolmente
in questionari affrettati (alcuni esempi in Hoinville - Jowell 1991,
71-72, che le definiscono domande ‘condizionanti’). Occorre porvi
attenzione; se il ricercatore, per introdurre una domanda, ritiene di
doverla contestualizzare, deve stare attento a porre un contesto
neutrale ove l’intervistato possa comunque riconoscersi, qualunque
sia il suo parere (vedi invece l’esempio riportato in Pellicciari Tinti 1983, 178 di contestualizzazione che gli autori non si accorgono divenire una domanda viziata: “Oggi in genere si dice che i
problemi della famiglia crescono piuttosto che diminuire, anche
per le donne. Lo abbiamo sentito ripetere spesso durante il nostro
studio. Che cosa può dirci Lei, a questo proposito?”). Nell’esempio di Bailey la domanda avrebbe potuto essere formulata in questo modo: “Molte ricerche sembrano dimostrare che il fumo sia
dannoso per la salute, ma non tutti i ricercatori ed i medici sono
d’accordo. Lei cosa ne pensa?”. Questo tipo di formulazione viene
chiamato ‘doppio livello dichiarativo’ (Cacciola - Marradi 1988) e
deve essere utilizzato solo nella forma qui segnalata, di equa e
neutrale distribuzione delle opinioni. Il doppio livello dichiarativo
non è utilizzabile se non all’interno di domande esplicite (“Lei cosa ne pensa?”), perché se presente, p. es., come affermazione in
scale Likert si rischiano confusioni, nell’intervistato, fra item ed
oggetto, con conseguenti distorsioni.
Le domande viziate hanno un effetto distorcente maggiore nel caso
in cui l’intervistato percepisce una situazione di forte subalternità
154
rispetto all’intervista, e possono assumere forme diverse ed insidiose che il ricercatore deve imparare a riconoscere.
C’è però un caso in cui domande fortemente caricate emotivamente, che risulterebbero perciò viziate, sono ugualmente accettate e
volutamente inserite in un questionario; ciò accede quando il ricercatore vuole selezionare gli intervistati con una posizione estrema, quelli così irriducibilmente convinti da non arretrare neppure di fronte ad uno stimolo ‘caricato’. p. es. in una ricerca fu inserita la domanda
“Sareste favorevole a inviare del cibo per nutrire la popolazione
affamata dell’India, che sta morendo di fame?” Questa domanda fu
usata, dopo una serie di domande “imparziali” (unloaded), per stabilire il numero di persone che fossero tanto contrarie alla spedizione di
cibo ad altri paesi da respingere questa idea malgrado il contesto fortemente emotivo della “gente che muore di fame” (Kahn - Cannel
1968, 172)
5.5.3 L’approccio alle questioni delicate
Le questioni delicate ed imbarazzanti (obtrusive) sono quelle relative al sesso, alla politica e a tutte quelle situazione socialmente
connotate in questo modo, che attengono la devianza, non universalmente approvate, o anche più modestamente quelle che, da un
punto di vista dell’immagine sociale, potrebbero mettere in difficoltà l’interlocutore anche se relative a questioni non stigmatizzate.
Queste domande, se necessarie, devono essere formulate quindi in
modo da consentire il più possibile all’intervistato di non sentirsi
giudicato, ed introdotte con dovute cautele specie sul piano linguistico. Un comportamento socialmente indesiderabile deve quindi
essere introdotto come potenzialmente normale, e quindi, p.es.
(Bailey 1985, 141) non:
Lei si masturba?
[1] si
[2] no
Se sì, con che frequenza?
[1] 1 volta al mese
[2] 1 volta a settimana
[3] tutti i giorni
bensì:
155
Con che frequenza lei si masturba?
[1] 1 volta al mese
[2] 1 volta a settimana
[3] tutti i giorni
[4] mai
In ogni caso il ricercatore deve essere molto attento a non banalizzare la domanda, nella sua formulazione, e a non costipare
l’intervistato con una selezione di risposte poco rispettose della
complessità e delle sue possibilità di imbarazzo.
Un esempio piuttosto chiaro di eccessiva schematicità e banalizzazione su argomenti delicati ce lo riporta Guala a proposito di una
ricerca sulla prostituzione realizzata con questionario autoamministrato (Guala 1986, 238-239; ora in Guala 1991, 196) in cui si
chiedeva, fra l’altro:
- Esperienze particolari infanzia
1) visto genitori avere rapporti
2) visto uomini/donne nudi
3) nessuna
- Avuto curiosità sessuali
1) gioco del dottore
2) differenza dei sessi
3) altro
4) nessuna
5) non ricordo
- Masturbazione durante la pubertà (da 12 a 18 anni)
1) da sola
2) in compagnia
3) mai
- Ha avuto rapporti incompleti durante i flirt-fidanzamenti
1) baci
2) toccamenti
3) masturbazioni
4) nessuno
- Guadagno
1) molto
2) poco
3) insufficiente
Probabilmente il modo migliore per affrontare temi imbarazzanti è
costruire grappoli di domande di livello diverso di astrazione, per
‘accompagnare’ l’intervistato verso il tema focale con passaggi
graduali.
156
Hoinville e Jowell (1991, 55) citando un saggio di Burton, ripropongono quattro diverse tecniche per ottenere informazioni su
questioni delicate; per esempio, per sapere se l’intervistato abbia
mai maltrattato la moglie:
In primo luogo [...] c’è l’approccio casuale:
“Le è capitato di aver maltrattato sua moglie?”
C’è poi l’approccio dei cartellini numerati:
“Vuol scegliere, per favore, fra questi cartellini il numero di quello che corrisponde a ciò che è accaduto a sua moglie?”.
In terzo luogo l’approccio generale:
“Come lei sa, in questi ultimi giorni vi sono stati diversi mariti che
hanno maltrattato la propria moglie. Le è capitato di picchiare la
sua?”.
Infine c’è l’approccio indiretto:
“Conosce qualcuno che abbia picchiato la propria moglie?”.
Breve pausa in attesa della risposta e poi: “E lei?”.
5.5.4 Effetto proxy
La proxy, abbreviazione di proximity che significa prossimità, vicinanza, è causa di distorsioni significative che incidono
sull’attendibilità delle domande.
Sostanzialmente l’effetto di una domanda caricata emotivamente si
estende su successive domande diverse provocando quindi distorsioni. Può avvenire, p. es., che l’intervistato senta un dovere di
‘coerenza’ interna fra le cose che dice, e che uniformi il suo pensiero indipendentemente dal reale pensiero che può avere su ogni
circostanza; è un rischio che si corre in particolare su questionari
interamente concernenti aspetti importanti del comportamento individuale (religiosità, sessualità, politica, ...). In generale, se si tratta di singole domande o di piccoli gruppi di domande,
l’accorgimento più diffuso è quello di differirle il più possibile relegandole alla fine del questionario, per evitare che un’eventuale
reazione negativa dell’intervistato comprometta l’intervista.
Uno degli effetti più evidenti delle proxy si riscontrano nelle scale
Lickert quando le batterie non presentino item a polarità invertite.
5.5.5 ‘Desiderabilità sociale’ nelle risposte
È in un certo senso l’effetto contrario delle questioni viste sopra, e
si risolve con un’accentuazione delle risposte ritenute socialmente
desiderabili.
Come scrive Phillips:
157
Se partiamo dalla premessa che il comportamento del soggetto rispondente sia il prodotto dei suoi valori e aspettative, ne consegue allora che le sue aspettative varieranno a seconda delle situazioni di intervista. [...] se ne può dedurre che molte delle dichiarazioni degli intervistati possono risultare fortemente influenzate da ciò che essi pensano sia desiderabile sul piano sociale. Ciò si dovrebbe verificare in
misura variabile da un intervistato all’altro e da un argomento
all’altro, e questa variazione dovrebbe essere connessa all’importanza
attribuita all’apparire in una luce socialmente desiderabile da parte di
un dato intervistato a proposito di un dato argomento (1972, 193)
L’accentuazione della desiderabilità sociale mette in evidenza domande mal costruite (o mal chiuse nelle risposte) che produrranno
inevitabilmente una distorsione delle risposte.
Per estensione possiamo contemplare qui anche quelle domande
che prospettano, anche implicitamente, la scelta fra qualcosa di
positivo, di aggiuntivo, di efficace, rispetto a qualcos’altro di negativo, di minor efficacia; un esempio (negativo) relativo al rapporto
fra popolazione e servizio di trasporto urbano, potrebbe essere il
seguente:
In relazione al trasporto urbano con quale frequenza vorrebbe che
l’autobus fermasse nel suo quartiere?
Che si chiuda la risposta o che la si lasci aperta, è piuttosto evidente che la maggioranza dei cittadini desidera il massimo di efficacia
dei servizi, e da questa domanda verrebbe un’indicazione di grande richiesta di fermate dell’autobus; accettando per buono tale risultato, e dotando improvvidamente il quartiere di molte corse di
autobus, si avrebbe probabilmente la cattiva sorpresa di trovare
veicoli con pochissimi utenti. Questa realtà non sarebbe affatto in
contraddizione con la risposta data al questionario, poiché una cosa è esprimere un auspicio sulla presenza di un servizio, altra cosa
volerlo veramente utilizzare.
Nel caso visto sopra, dovendo trarre indicazioni sui bisogni di trasporto urbano della popolazione di un quartiere, è quindi meglio
porre diverse domande, innanzitutto sull’utilizzo attuale del servizio, quindi sulla sua efficacia, lasciando all’intervistato la responsabilità di dichiarare spontaneamente, se quello è veramente il
problema, che la zona necessita di più corse.
Questa indicazione vale per tutte le domande relative a temi socialmente desiderabili; mai chiedere direttamente “vuoi qualcosa
158
di meglio dalla vita?”, ma lasciare la possibilità di esprimere i propri pensieri.
Se occorre avere attenzione nel formulare domande prive di eccessiva desiderabilità sociale, così occorre evitare anche quelle di
troppo basso livello di desiderabilità; questa eventualità compare
in particolare quando si affrontano argomenti delicati o socialmente discutibili, rispetto ai quali si possono adottare strategie già illustrate altrove. Su questo punto Phillips propone sei criteri guida
così riassumibili:
1) utilizzo del doppio livello dichiarativo su questioni socialmente
indesiderabili (“Molte persone hanno pensato al suicidio in un
qualche momento della loro vita”);
2) equilibrio nella desiderabilità sociale della scelta (“Alcuni leaders politici credono che... mentre altri credono che...”);
3) formulare la domanda come se la caratteristica socialmente indesiderabile sia naturalmente presente nell’interlocutore (vedi
l’esempio iniziale in 5.5.3 “L’approccio alle questioni delicate”);
4) attenzione al lessico, usando eufemismi per le espressioni connotate in modo marcato;
5) se deve esprimere valutazioni critiche, dargli la possibilità di
esprimere prima un giudizio positivo in modo che non abbia
l’impressione di essere ingiusto;
6) contribuire al processo di riflessione dell’intervistato con opportune tecniche e lasciargli la possibilità di riconoscere senza
difficoltà di non avere opinioni al riguardo.
Va osservato che queste direttive generiche non debbono sostituirsi al tentativo di capire bene la dinamica di una data situazione di
intervista. [...] non si deve credere che un approccio imparziale sia
il migliore (Phillips 1972, 207-208; anche Kahn - Cannel 1968,
168-170)
5.5.6 Le doppie domande
Le doppie domande presentano una formulazione lessicale sbagliata, che rinvia in realtà a due distinti quesiti; l’eventuale risposta
non è così riconducibile ad una domanda specifica ed è inutilizzabile.
P. es.:
Lei è d’accordo con una politica occupazionale favorevole alle
donne ed agli immigrati?
[1] si
159
[2] no
In questo caso la risposta potrebbe essere relativa alle sole donne,
ai soli immigrati, o ad entrambi, ed il ricercatore non potrebbe saperlo.
Le domande che contengono le congiunzioni “o” ed “e” dovrebbero essere controllate per verificare se in realtà non siano domande
doppie, da cui ci si attende una sola risposta. Le domande contenenti
“e” sono particolarmente esposte a questo pericolo. Le domande con
“o” possono essere adeguate, specialmente quando i due argomenti
che contengono si possono considerare mutuamente esclusivi. Ad esempio, “frequenta regolarmente i servizi religiosi in chiesa o in sinagoga?”, può non essere una domanda doppia se il ricercatore ritiene
che vi siano delle buone ragioni per considerare i due servizi religiosi
mutuamente esclusivi, per supporre cioè che un intervistato che frequenta la chiesa non frequenti la sinagoga e viceversa (Bailey 1985,
134)
5.5.7 Domande astratte o di grande generalità
Specialmente in relazione alla possibilità del questionario, occorre
evitare di formulare domande su concetti astratti come la felicità,
l’amore o la giustizia (Bailey 1985, 139), a meno che non si adottino particolari cautele, prima fra le quali l’utilizzo di più domande, semmai con la tecnica dell’imbuto; in questo caso si può iniziare con una domanda molto generale, con uno scopo introduttivo, e probabilmente senza necessità postume di codifica ed analisi.
È tipico di questionari dilettanteschi contemplare domande il cui
paradigma è “Cosa ne pensa lei del mondo e della vita?”; tali domande sono necessariamente pluridimensionali, relative a concetti
talmente generali che il ricercatore non potrà in nessun caso controllare, e probabilmente irritanti per l’intervistato che non troverebbe, neppure nel caso di una apertura della risposta, lo spazio
reale di discussione che il tema meriterebbe.
Questi problemi, se per qualche motivo vanno messi al centro della
ricerca, vanno scomposti in più domande di più basso livello di
generalità, proprio come i concetti generali della ricerca vanno
scomposti in indicatori concettualmente dominabili.
5.5.8 Domande relative al passato
Un fattore classico di distorsione nelle risposte è dovuto alle domande relative al passato, che spesso sono presenti in quantità nei
160
questionari. Il problema è duplice: l’affidabilità della memoria
come elemento non controllabile, ed ancor più il potente filtro psicologico dei meccanismi relativi alla memoria, che tende inevitabilmente a dare, del proprio passato, una rappresentazione almeno
in parte trasfigurata, migliorata, dove le contingenze, le incongruenze e gli episodi oscuri di ciascuno di noi vengono ricomposti
in una rappresentazione spesso più chiara, razionalizzata ex post.
È per questo che, in generale, occorre molta cautela nel proporre
questionari relativi ad esperienze passate.
Goode e Hatt citano test di verifica che dimostrerebbero comunque
che
le risposte alle domande ‘obiettive’ [...] sembrano offrire maggiore
variazione di quelle date alle domande sugli atteggiamenti. Naturalmente, ciò è in parte una funzione della precisione. Quando si richiedono risposte molto precise, un minimo errore di memoria diventa
una deviazione percepibile. Quando però le domande sono molto generali, la stessa quantità di errore di memoria non verrà registrata
(1969, 262)
Dovendo comunque porre domande di questo genere si può cercare di realizzare una strategia del questionario che stimoli a meglio
ricordare le questioni che gli si pongono, p. es. con degli imbuti,
anziché aggredire la capacità di memoria con una domanda diretta;
si può iniziare, p. es., con una domanda molto generale che consenta di collegare epoche passate con momenti significativi della
sua vita:
Intervistatore: Mi sa dire cosa faceva, dove abitava, agli inizi degli
anni ‘70? Era già sposato? Studiava o lavorava?
Rispondente: Dunque... in quegli anni mi ero appena iscritto
all’Università; facevo la vita dello studente nella città universitaria.
I: Riesce a ricordare quegli anni? Si ricorda quali studenti frequentava, di cosa parlavate, quali attività praticavate?
R: Sì, ricordo che si faceva molta attività politica. Erano anni ‘caldi’, subito dopo il ‘68; c’era il referendum sul divorzio... Io ed altri
studenti ci dammo molto da fare in quell’occasione.
I: A questo proposito, mi può dire come collocherebbe il suo orientamento politico in quegli anni ?[I mostra un cartoncino]:
- Estrema sinistra
- Sinistra
- Centro-Sinistra
- Centro
- Centro-Destra
- Destra
161
- Estrema destra
In questo modo con le prime domande l’interlocutore ha ricostruito
il contesto della sua esperienza nei primi anni ‘70; per ottenere
questo scopo possono essere utili domande aperte, molto generali,
anche lasciate all’iniziativa dell’intervistato; l’ultima domanda è
quella che finirà in matrice dati, quella che interessa veramente il
ricercatore.
Un’ulteriore questione di cui occorre essere avvertiti è la tendenza
a confondere comportamenti abituali, con quelli recentemente tenuti. Se è interesse del ricercatore distinguere fra di loro, è il caso
di porre domande su entrambi i livelli, a partire da quello più generale, come mostrato da questo esempio (Hoinville - Jovell 1991,
54):
Di solito, a che ora esce di casa per recarsi al lavoro?
A che ora è uscito di casa ieri per recarsi al lavoro?
Il problema delle domande relative al passato si pone in questo
modo complesso solo in casi particolari, in cui l’intervistato deve
recuperare alla memoria valori, giudizi, opinioni relative a periodi
distanti diversi anni.
Più frequentemente il ricercatore è interessato ai comportamenti, e
spesso al recentissimo passato, allo scopo di ‘quantificare’ (in modo anche vago) una certa attività; p. es.:
nell’ultimo anno quanti libri ha comprato, approssimativamente?
L’unità di tempo (in questo caso: ‘nell’ultimo anno’) è un nucleo
concettuale molto importante da definire bene in domande di questo genere. In un’intervista realizzata, poniamo, in autunno, questa
domanda si riferisce all’anno in corso che sta per finire, cioè al periodo di 9-10 mesi intercorsi dal 1° gennaio al momento
dell’intervista, oppure agli ultimi 12 mesi, qualunque sia il momento in cui l’intervistato risponde (che in ricerche complesse e
lunghe può differire significativamente da quello di altri intervistati)? Il ricercatore deve stabilire bene ed in concreto questo problema, anche per evitare che persone diverse interpretino diversamente le domande creando una vistosa distorsione fra intervistati che
contano ‘l’ultimo anno’ come precedente periodo di 12 mesi, e coloro che lo considerano dal 1° gennaio.
162
5.5.9 L’errore dell’esperto
Infine va ricordato l’“errore dell’esperto” (Guidicini 1993), che
incide pesantemente sulla validità e sull’attendibilità.
L’errore è in realtà una sorta di proiezione che il ricercatore compie sulla popolazione che andrà ad indagare, e consiste nel presumere che tutti gli intervistati, oltre a condividere il quadro problematico che sta interessando il ricercatore in quel momento,
comprendano tutti allo stesso modo gli item inseriti nel questionario, sia per quanto riguarda il livello lessicale (le istruzioni dello
stimolo) sia per quello simbolico (i significati generali
dell’intervista) (Bourdieu 1976).
L’errore compare in particolare quando il ricercatore, od il gruppo
di ricerca, lavora isolato, senza confronti, senza realizzare il pretest, e così via.
Poniamo quindi in questa parte anche il riferimento ad un’attenta
formulazione lessicale, che non sia per esempio oscura e criptica,
gergale e così via, o formulata in modo ambiguo, con una doppia
negazione, come in questo esempio (Pitrone 1986, 90)
Quali sono, secondo lei, le industrie che fanno di più per non rendere poco salutare l’ambiente in cui vive la gente?
163
6. GESTIRE
LA RILEVAZIONE DEI
DATI
6.1 IL RUOLO DEGLI INTERVISTATORI
6.1.1 Scelta, formazione e motivazione degli intervistatori
C’è un errore capitale, tipico di molte ricerche (almeno di quelle
eseguite da società private, spesso anche di quelle fatte in istituti
pubblici): utilizzare personale non idoneo nel ruolo, ritenuto secondario, di intervistatore.
Alla radice di questo gravissimo errore vi è un’ideologia scientista
che tende a separare l’osservatore dalla realtà osservata, come se
non ci fosse rapporto ed addirittura interferenza fra i due oggetti,
ed un conseguente atteggiamento behaviouristico, per il quale lo
stimolo, standardizzato e ben realizzato, è sufficiente in sé a garantire del risultato della ricerca, essendo l’intervistato un mero
‘risponditore’ senz’anima. Questa la radice; lo sviluppo dei suoi
virgulti è più banalmente dovuto a problemi economici, gestionali,
ecc.
Ebbene, niente di più sbagliato. Anche se gli intervistatori dovessero limitarsi a porgere le domande proponendo le risposte previste, il loro ruolo è strategico nell’ambito della ricerca. Se poi hanno un margine decisionale in merito alle risposte ricevute è semplicemente irresponsabile non attribuire loro un grande ruolo nel
disegno della ricerca e non porre ogni attenzione al loro reclutamento, addestramento, controllo.
È significativo che in letteratura si sia dato poco spazio agli intervistatori, che pure sono spesso l’unico vero contatto fra ricercatore
e campo di indagine (Boccuzzi 1985; Caruso 1987; Gruppo di lavoro metodologico dell’Università di Catania 1988; Pasquali 1992;
si veda anche Hoinville - Jowell 1991, 146-169, che dedicano un
ottimo capitolo al reclutamento, addestramento, ecc. dei rilevatori,
e Romita 1994 che tratta del ruolo degli intervistatori nelle interviste telefoniche); essi sono anzi una parte integrante del gruppo di
lavoro: devono conoscere al meglio tutti i problemi della ricerca,
essere motivati in più modi (non solo quello economico), credere
nel lavoro che si apprestano a fare.
C’è una vasta aneddotica sui reali modi di lavorare di intervistatori
poco motivati: questionari compilati da loro stessi, intervistati contattati ripetutamente nello stesso circuito parentale ed amicale,
164
ecc.; a parte i controlli che ovviamente il ricercatore potrà voler
fare, è importante prevenire ogni forma di consapevole distorsione
provocata per insipienza o scarsa volontà.
Innanzitutto è preferibile avere intervistatori laureati, possibilmente in sociologia e discipline affini, e questo per due motivi:
la complessità del lavoro di ricerca, ivi compresa la rilevazione, è
tale da suggerire una più alta cultura formale fra i requisiti che deve avere un intervistatore; poi, una delle gratificazioni che gli si
deve assicurare è l’implicita formazione, il tirocinio virtuale che
rappresenta l’esperienza di intervista. Non si tratta di rabbonirlo; in
questa specie di ‘artigianato’ scientifico che è la ricerca, un buon
ricercatore deve avere un’abbondante esperienza di campo, di interviste fatte; i vostri futuri intervistatori dovrebbero essere dei sociologi juniores, convinti di fare un’esperienza propedeutica alla
loro attività futura di ricercatori. Benché questo tipo di motivazione non sia sempre pienamente utilizzabile, è spesso una buona
chiave di stimolo.
Palumbo, che ne parla nel quadro complessivo del management, fa
alcune osservazioni circa il loro reclutamento così riassumibili: i
rilevatori professionali minimizzano i costi di addestramento e sono tempestivi ed efficienti, ma solo per questionari non complessi
e tradizionali; quelli occasionali vanno formati, ma spesso sanno
intervenire meglio nella ricerca perché “meno inclini a dare per
scontati i contenuti e le procedure degli strumenti di rilevazione”;
in questo caso ci sono però rischi di disomogeneità e distorsione
(Palumbo 1991, 80).
In secondo luogo occorre evitare il veloce indottrinamento con il
quale spesso si assolve la formazione iniziale degli intervistatori;
non basta mostrare loro un questionario e spiegare chi devono intervistare. Una gran parte delle distorsioni nelle risposte vengono
evitate se questi collaboratori conoscono bene gli obiettivi della
ricerca, i motivi che hanno condotto ad ogni item, le possibili trappole in cui potrebbero incorrere; gli intervistatori dovrebbero
quindi partecipare, sia pure con un ruolo distinto, alla costruzione
del questionario. Se questo non è possibile dovrebbero partecipare
agli studi preparatori o almeno (questo diventa fondamentale) al
pre-test, e discuterne i risultati coi ricercatori. Se anche questo non
fosse possibile dovrebbero, almeno, realizzare delle simulazioni di
intervista nell’ambito del preventivo orientamento ed addestramento che i ricercatori proporranno (ma questo è comunque poco);
a tale proposito Kahn e Cannel sottolineano l’importanza della
tecnica del role playing nell’addestramento, durante la quale uno
degli intervistati assume il ruolo di una persona reale di sua cono-
165
scenza sottoponendosi all’intervista condotta da un altro membro
del gruppo (Kahn - Cannel 1968, 305-308); questa procedura di
addestramento non costa nulla ma è abbastanza efficace per far
emergere le principali problematiche dell’intervista.
Ovviamente tutto questo ha dei costi.
Un buon ricercatore, che immagina di dover utilizzare intervistatori per la sua ricerca, deve collocare questo impegno (di tempo e
di soldi) nell’iniziale proposta di lavoro che sottopone al committente.
6.1.2 Distorsioni provocate dagli intervistatori
Su questo punto accorre avere una piena consapevolezza:
l’intervistatore produce una quantità notevole, ma non verificabile
e solo in parte controllabile, di distorsioni. Una parte può essere
consapevole e dovuta alla scarsa motivazione (questionari artefatti,
intervistati reperiti nella cerchia amicale, ecc.); altra parte può dipendere da problemi inevitabilmente connessi con la sua persona
(l’esempio classico è l’intervistatore bianco in ricerche multietniche); altri ancora sorgono durante ed a causa l’interazione con
l’intervistato e la mediazione del questionario (sulle distorsioni
dovute ad aspetti psicologici e comunicativi vedi Kahn - Cannel
1968, 15-92).
Varie strategie possono limitare alcuni di questi problemi, ed in
particolare quelli dei primi due tipi, ma qualunque questionario, il
ricercatore deve esserne cosciente, sarà inevitabilmente distorto
anche a causa degli intervistatori.
Vediamo una sintesi delle principali distorsioni di questo tipo e le
principali soluzioni che si possono adottare.
In ordine logico la prima delle possibili distorsioni riguarda
l’intervistatore come persona, ovvero le sue peculiarità rispetto
all’oggetto della ricerca: sesso, età, razza, classe sociale possono
provocare atteggiamenti reattivi nel campione; l’intervistatore di
razza bianca che in una ricerca sul conflitto interetnico intervista
immigrati neri; l’intervistatrice che interroga adolescenti maschi
sui loro problemi sessuali; e così via. In generale si può cercare di
ovviare a questi problemi con una attenta selezione degli intervistatori, con l’avvertenza che si potrebbero poi accentuare le distorsioni, anziché ridurle, come ci avverte questo esempio:
Poniamo il caso che si debbano intervistare dei gruppi d’immigrati
d’origine meridionale. Ci si può presentare questo problema: converrà
scegliere gli intervistatori fra persone d’origine meridionale - correndo
166
il rischio di veder deformate le risposte, per gratificare o facilitare il
lavoro del corregionale - oppure ci si dovrà affidare ad intervistatori
d’origine settentrionale - correndo il rischio di irrigidire l’intervistato
e di ottenere delle risposte poco esaurienti? (Guidicini 1993, 242)
Altre caratteristiche dell’intervistatore sono comunque meno controllabili: quelle relative alla sua dimensione valoriale, p. es., che
potrebbe accentuare l’interpretazione che egli dà delle risposte
ambigue in modo prossimo alle proprie convinzioni. Una parziale
soluzione è lasciare aperta la domanda su temi delicati relativi a
credenze religiose, politiche, ecc., indicando all’intervistatore di
registrare fedelmente l’intera risposta.
Un altro fattore di distorsione riguarda la scelta degli intervistati;
qualora questa fosse lasciata agli intervistatori, inevitabilmente essi tenderebbero a cercarli nell’ambito del loro quartiere ed a partire
da amici e parenti, per una normale maggiore garanzia di accoglimento; ciò provocherebbe evidenti distorsioni e problemi di attendibilità, poiché si può immaginare che determinati ceti sociali (o
classi di età, o altro) sarebbero più rappresentati di altri e perché
l’intervista favorita dall’amicizia personale si svilupperebbe sotto
una sorta di effetto alone dalle conseguenze non controllabili.
L’unica soluzione possibile per un’assoluta garanzia di vera casualità del campione è, ovviamente, fornire ciascun intervistatore di
una lista di nominativi estratti dal ricercatore, sostituire gli eventuali rifiuti e casi irreperibili con altri nominativi sempre indicati
dal ricercatore, e avvertire che sulla corrispondenza fra nominativi
forniti ed interviste realizzate verranno fatti dei controlli.
Una gamma molto vasta di fattori distorcenti ha motivazioni psicologiche, relative agli aspetti simbolici dell’interazione che si sovrappongono a quelli strumentali dell’intervista: per esempio intervistatore ed intervistato si formano delle aspettative l’uno rispetto all’altro, e tendono a riportare tutti gli elementi dell’interazione
entro un quadro coerente uniformato da tali aspettative. L’intervista può presentare elementi che accentuano questo fenomeno; p.
es. se alcune domande rivelano le tendenze politiche
dell’intervistato, chi lo intervista sarà portato ad interpretare tutte
le sue risposte, specie quelle ambigue, entro quel contesto politico.
Un altro aspetto simile riguarda le proiezioni di valori che
l’intervistatore trasmette inconsapevolmente agli interlocutori con
accentuazioni di tono, tratti comunicativi sovrasegmentali (cenni
del capo, movimento delle sopracciglia, ecc.) e così via: p. es. una
domanda di questo genere: “Lei pensa che verso i tossicodipendenti si dovrebbero adottare misure repressive od una politica
167
comprensiva volta al recupero?” l’intervistatore potrebbe, in realtà, porgerla in questo modo:
Lei pensa che verso i tossicodipendenti si dovrebbero adottare misure repressive [leggero cenno laterale della testa e breve pausa] o invece [tono via via più enfatico] una politica comprensiva volta al recupero? [sopracciglia inarcate]
In generale questi problemi sono ridotti dall’utilizzo di intervistatori esperti e ben motivati, consapevoli di questi meccanismi;
in ogni caso la letteratura in argomento tende a non enfatizzare gli
effetti distorcenti di questo tipo (Pitrone 1986, 116).
Ovviamente vanno menzionati anche gli errori materiali: errate registrazioni di risposte, o addirittura errate interpretazioni, da parte
dell’intervistatore, di alcune domande; scarsa capacità a motivare
l’intervistato, a porre probe, a gestire il colloquio, ecc. Tutti questi
problemi vengono molto ridotti (alcuni eliminati) con un buon tirocinio iniziale degli intervistatori, e possibilmente con la loro partecipazione a fasi di pre-test. Se per qualunque motivo non è possibile utilizzare questo personale per il pre-test è buona norma usare le prime due-tre interviste realizzate da ciascun intervistatore
come verifica. In questo caso si chiede agli intervistatori di realizzare, nello stesso breve periodo, le prime poche interviste; in seguito si organizza un momento di incontro in cui discutere di tutti i
problemi emersi e trovare soluzioni.
Infine occorre ricordare agli intervistatori che devono porre attenzione anche all’abbigliamento ed agli aspetti esteriori, i primi che
vengono osservati e valutati.
Kahn e Cannel, che ai problemi della distorsione nel rapporto di
intervista dedicano molto spazio, riassumono i diversi fattori di
distorsione in un modello che li pone in relazione, e che mostra
comunque la centralità (secondo questi autori), dei fattori psicologici:
ogni comportamento nell’intervista può [...] essere fatto risalire,
almeno in teoria, a una percezione [...]. I fattori psicologici (percezioni, atteggiamenti, aspettative, motivazioni) non possono ovviamente
essere percepiti direttamente, e vengono inferiti unicamente in base al
comportamento o ai fattori di background percepiti. Né queste inferenze sono necessariamente corrette. [...] Nello stesso modo, i comportamenti sono facilmente male interpretati, e possono portare a inferenze scorrette e disfunzionali per il processo d’intervista (Kahn Cannel 1968, 253).
168
6.2 LA GESTIONE DELL’INTERVISTA
6.2.1 Il rifiuto all’intervista
I motivi dei rifiuti sono di varia natura, ed in gran parte riconducibili alla non comprensione del lavoro di ricerca. È raro il rifiuto
veramente motivato dalla mancanza di tempo (che è una delle scuse adottate per rifiutarsi), e non è un caso che in generale la maggior parte dei rifiuti provenga da soggetti anziani e soli, e quindi
timorosi di aprire casa ad un estraneo, spesso poco scolarizzati e
comunque poco flessibili verso la comprensione di un meccanismo
che per loro è di complessa ragione.
Occorre tener presente che ormai molte persone bussano alle porte
per i più svariati motivi, e che la ricerca è un’attività piuttosto lontana dall’esperienza della maggior parte della gente.
Nei paragrafi seguenti verranno suggerite alcune strategie per ovviare in parte ai problemi che insorgono, ma è comunque buona
norma, per il ricercatore, preparare due campioni di intervistati:
uno principale, correttamente calcolato ed estratto, che verrà poi
suddiviso fra gli intervistatori, ed un secondo, comunque ampio,
estratto con criteri di casualità come il precedente, da utilizzare per
le sostituzioni dei rifiuti, degli irreperibili e deceduti e degli indisponibili (persone gravemente malate, o non in condizioni psichiche idonee a sostenere un’intervista).
Per la gestione di questa doppia lista si può suggerire il seguente
metodo: periodicamente gli intervistatori tornano dai ricercatori
con i questionari realizzati ed i nominativi che non si sono potuti
intervistare per qualunque motivo (che devono comunque essere in
grado di motivare: nel caso di irreperibilità o rifiuto devono poter
descrivere i diversi tentativi fatti per raggiungere l’obiettivo); i ricercatori forniscono i nuovi nominativi in sostituzione, estratti dalla seconda lista, secondo criteri di similitudine; se cioè una mancata intervista è di una donna di 80 anni di un dato quartiere, si deve
cercare una analoga donna di 80 anni di quel quartiere o, in mancanza, di classi di età prossime, di quartieri simili, ecc.
Malgrado quanto si dice a volte, non occorre enfatizzare queste
mancate interviste e caricarle di significati che non hanno; una cosa è rifiutarsi di rispondere ad una domanda (evento peraltro estremamente raro), che potrebbe significare una specifica resistenza verso un determinato concetto; altra cosa è rifiutarsi
169
all’intervista, in particolare da parte di persone anziane, malate,
sole e depresse, ecc.
6.2.2 La lettera di presentazione ed il ‘passi’
Per sollevare almeno in parte dall’impaccio del primo contatto e da
rifiuti evitabili, e bene utilizzare alcune strategie.
La più diffusa è la lettera di presentazione, inviata con un breve
anticipo (circa una settimana) a casa di ciascun soggetto da intervistare (nota: se il campione è vasto occorre programmare una spedizione scaglionata, per evitare che gli ultimi intervistati abbiano
ricevuto la lettera alcuni mesi prima). La lettera, come forma di
preavviso, è comunque da preferire alla telefonata (Istat 1989c,
19).
La lettera sarà breve, conciliante nel tono e non gergale nello stile,
e conterrà tutte le informazioni e le rassicurazioni già descritte, eccettuate le istruzioni per la compilazione del questionario e con
l’aggiunta, possibilmente, di un’indicazione telefonica alla quale
rivolgersi per informazioni; questo numero di telefono dovrà appartenere, possibilmente, al soggetto più conosciuto ed autorevole,
quindi l’ente pubblico committente (se c’è) e non l’istituto di ricerca.
La lettera di presentazione ha certamente una grossa utilità in soggetti che appartengono a classi sociali medie ed alte, ed ha gli ovvi
limiti di tutti i testi scritti rispetto alla popolazione poco scolarizzata; inoltre viene spesso scambiata per i tanti stampati che arrivano
per posta e sovente cestinata senza leggerla.
Alla lettera di presentazione ed al riferimento telefonico va aggiunto un ‘passi’ personale per ogni intervistatore: questo passi, che
può avere l’aspetto di un badge (tesserina con foto da appuntarsi
all’abito) o di una semplice ulteriore lettera che attesta l’identità
del ricercatore, spiega che è autorizzato a fare quelle interviste, e
ripropone la linea telefonica per ogni eventuale controllo.
Questi espedienti non danno garanzie di successo, ma riducono
certamente gli insuccessi.
6.2.3 Il contatto iniziale
Come si è già visto gli intervistatori dovrebbero possedere elenchi
di intervistati da contattare. A costoro dovrebbe essere già arrivata
una lettera ufficiale che spiega gli obiettivi della ricerca, ne sollecita la collaborazione e preavverte del successivo contatto da parte
dell’intervistatore.
170
L’intervistatore deve essere cosciente del fatto che tale lettera non
è sufficiente a superare remore ed incomprensioni di varia natura
che ostacoleranno comunque l’approvazione al colloquio; innanzitutto diversi soggetti non avranno letto la lettera (perché non
arrivata, perché giunta in mano ad altri familiari che non l’avranno
poi resa nota, perché immediatamente cestinata in quanto confusa
coi tanti altri stampati che quotidianamente invadono la buca delle
lettere, ecc.), ma - più grave - molti altri ne avranno equivocato il
contenuto, per eccesso di diffidenza, per pregresse situazioni sgradevoli sperimentate (falsi intervistatori venditori di enciclopedie),
per semplice difficoltà di comprensione. Quest’ultima è la situazione più grave e diffusa: in particolare fra le persone anziane e
sole, e fra i meno scolarizzati, il rifiuto immediato ed apparentemente fermo, dovuto a paure che nascono da una non comprensione degli scopi del lavoro, è una situazione che capita davvero spesso.
Per evitare lunghi giri a vuoto, a fronte di soggetti non trovati o
che oppongono un rifiuto, è quindi bene che l’intervistatore telefoni, ricordando innanzitutto la lettera che dovrebbe essere già arrivata; in generale il soggetto chiederà spiegazioni, ed è bene che
l’intervistatore sia preparato a ciò, tenendo a mente formule brevi e
semplici che tranquillizzino l’interlocutore sugli scopi della ricerca, sul fatto che il suo nominativo è stato selezionato in modo del
tutto casuale, che le sue risposte interessano solo in quanto rappresentative delle opinioni di tutti, sulla garanzia dell’anonimato, sulla semplicità del compito che si richiede, e così via. Malgrado ciò
diversi fra i soggetti contattati mostreranno ancora perplessità o
vere e proprie resistenze; a questo punto può essere utile il richiamo all’istituzione che sta promuovendo la ricerca, se questa è abbastanza vicina all’esperienza comune e gode di buon credito.
Un’amministrazione pubblica, l’università, un ente molto noto,
possono aprire una breccia nei più ostili, specie se si è in grado di
indicare (cosa che deve essere presente anche nella lettera) un numero di telefono, presso tale istituzione, dove il soggetto può telefonare per verificare la veridicità dell’identità dell’intervistatore e
di quanto sta dicendo. Da evitare, di contro, il riferimento a strutture di ricerca note solo in ristretti ambiti scientifici e culturali, o
peggio ad organizzazioni politiche e sindacali che potrebbero polarizzare le attenzioni dei soggetti.
Superato lo scoglio della telefonata, raggiunto fisicamente il potenziale intervistato, in generale il più è fatto; a questo punto il
‘passi’, il rinvio al numero di telefono già ricordato, e specialmen-
171
te un modo cortese e pacato di presentarsi, sono sufficienti nella
maggioranza dei casi a dare l’avvio all’intervista.
Per avere un ragionevole margine di successo in queste fasi di approccio è indispensabile che l’intervistatore curi la sua immagine;
prendiamo p. es. l’abbigliamento, uno degli elementi più immediati ai fini della valutazione reciproca dello status sociale nei rapporti interpersonali. Quale sia il più indicato è difficile a dirsi, ma
sicuramente vanno aboliti tassativamente gli estremi: aspetto troppo azzimato (stile ‘te-la-vendo-io-la-polizza’) o troppo trasandato
(stile ‘ho-fatto-il-’68’). Sono altresì da evitare comportamenti eccessivamente disinvolti (“si metta a suo agio che faccio tutto io”),
dimessi (“deve solo mettere delle crocette”) o addirittura supplici
(“la prego, è tutto il giorno che cerco un intervistato”).
In sostanza, la chiave del successo del ricercatore è la sua capacità
di ‘leggere’ rapidamente la personalità dell’interlocutore, e di adattarvisi; per questo la partenza deve essere piuttosto neutra
nell’abbigliamento e nelle prime fasi, poiché questi non è conosciuto. Ma poi, con una veloce opera di osservazione (Bezzi - Tirabassi 1990), l’intervistatore deve capire qual è lo stile espressivo
migliore per quell’intervistato, ognuno diverso dall’altro: un soggetto anziano e poco scolarizzato avrà bisogno di un’esposizione
semplice anche sul piano lessicale, e sarà lieto a volte di poter divagare e straparlare; un professionista con poco tempo e più cultura vorrà essere più spiccio, ma richiederà anche modi franchi perché in grado di capire rapidamente le problematiche poste. E così
via.
In buona sostanza si tratta di mettere in atto modalità relazionali e
strategie che non ostacolino lo svilupparsi di una motivazione
nell’interlocutore. A questo proposito è bene ricordare quanto affermano Kahn e Cannel (1968), che distinguono fra motivazioni
estrinseche (volontà di comunicare il proprio pensiero sull’argomento perché ritenuto importante, per contribuire al cambiamento,
ecc.), intrinseche (gratificazione connessa alla relazione intervistato-intervistatore) e derivate dalla conformità a norme sociali (il
‘come ci si comporta’, la necessità di rispettare regole formali,
trattare gentilmente un estraneo, ecc.); le ‘leve’ per ottenere il consenso sono in queste potenziali motivazioni.
Avviato il colloquio, l’intervistato accetta di dare una sorta di potere all’intervistatore; per prima cosa l’intervistato conosce solo a
grandissime linee l’oggetto dell’intervista (o non lo conosce affatto) e non ha alcun modo per prepararsi sul piano logico come su
quello emozionale. In secondo luogo scattano sovente meccanismi
perversi per cui questi, più che intervistato, si sente ‘interrogato’;
172
vale a dire che ha l’impressione che ci sia una risposta ‘giusta’ da
dare e che il suo dovere sia trovare tale risposta, e non semplicemente esprimere il suo parere. In questo senso la situazione di intervista è molto sbilanciata a favore dell’intervistatore. Se ciò può
favorire alcune forme di controllo di cui parleremo, può anche inibire l’interlocutore in modo grave, e l’intervistatore deve cercare
per quanto possibile di evitare tutto ciò.
Oltre alla sensibilità personale, ed ai criteri già segnalati sopra, è
certamente una buona cosa far scivolare l’interlocutore dentro l’intervista, anziché porla in modo aggressivo come meta immediata
alla quale arrivare senza por tempo in mezzo. Qui l’intervistatore
deve anche essere aiutato dalla struttura del questionario, che deve
prevedere delle domande di ingresso particolari.
La prima e fondamentale operazione che l’intervistatore deve
compiere è pertanto quella della presentazione dell’intervista. Non
importa se nella lettera di preavviso o nella telefonata di accordo
sono già state sintetizzate alcune cose, e assolutamente non importa se l’interlocutore non chiede inizialmente ulteriori spiegazioni;
anzi, questo caso dovrebbe insospettire, poiché significa che
l’intervistato sta vivendo il colloquio con un’eccessiva subalternità, all’interno di un preconcetto stereotipo, ma che prima o poi i
suoi dubbi e le sue paure si manifesteranno, semmai a metà intervista, con un disarmante (ed altamente preoccupante) “ma mi spieghi un po’, perché mi fa queste domande?”.
Le indicazioni consigliate per un approccio ottimale all’intervista
sono pertanto queste:
1) precisare lo scopo dell’intervista, l’ente committente, l’ambito
nel quale si colloca;
2) ribadire la garanzia di anonimato;
3) sintetizzare il tema generale, eventualmente precisando, se si
tratta di intervista complessa, che si toccheranno più temi collegati fra loro;
4) motivare: chiarire che non ci sono domande difficili, che comunque non ci sono assolutamente risposte ‘giuste’, e che qualunque sia il parere manifestato, è proprio quello che interessa,
come espressione ed opinione di una persona fra le tante;
5) non barare sulla durata dell’intervista: non dire mai che dura 10
minuti se invece dura un’ora;
6) porre inizialmente domande introduttive (questa ovviamente è
un’indicazione per il ricercatore e non per l’intervistatore) di
carattere generale, e curare gli eventuali passaggi da ambiti logici del questionario ad altri.
173
Quando è chiaro che l’intervistato ha compreso si può partire, con
l’avvertenza che in qualunque momento si possono e devono dare
spiegazioni suppletive se necessario.
6.2.4 La gestione del colloquio
Malgrado quanto detto fin qui circa l’importanza di essere ben accetti, arriva alle volte il momento di utilizzare quella sorta di autorità di cui si è investiti per controllare l’intervistato.
Ci sono sostanzialmente tre casi in cui si deve intervenire con funzioni di controllo: quando l’intervistato è eccessivamente verboso,
quando cerca di carpire informazioni dall’intervistatore, quando ci
sono interferenze da parte di terzi.
Il primo caso può sembrare in contraddizione con l’enfasi posta in
altre parti di questo volume sulla necessità di cogliere il pensiero
degli intervistati; in realtà occorre tener presente che stiamo parlando di una situazione di intervista particolare, svolta attraverso
un medium rigido come il questionario; il ricercatore che promuove una ricerca di questo tipo sa perfettamente quali sono i limiti
dello strumento, e non si sogna di cogliere le profondità del mondo
vitale in questo modo. Ciò è chiarissimo nel caso di domande
chiuse, ma deve essere chiaro anche per quelle aperte, anche se qui
siamo su un piano diverso comunque programmaticamente disponibile a recepire in maggior misura l’espressività degli interlocutori. Ma c’è differenza fra espressività e logorrea, e qui si vede la
diversità fra un buon intervistatore ed uno poco esperto. L’espressività che approfondisce i temi posti al centro della ricerca,
aumentando l’informazione (in estensione ed in intensione) è ovviamente produttiva, e le interviste ricche di questo tipo di comunicazione diventano spesso il perno attorno cui far ruotare
l’interpretazione dei dati di tutta la ricerca. Ma gli intervistati inclini a divagare, aggiungere aneddotiche ripetitive, allontanarsi dal
tema, e così via, sono da controllare e semmai da censurare; non
subito, e comunque con garbo, ma anche con fermezza, per non
trasformare una normale intervista in una faticosa maratona verbale peraltro inutile.
Il secondo caso non crea problemi di tempo ma è più pericoloso. Si
esprime solitamente in una contro-domanda dell’intervistato, il cui
paradigma è “e lei cosa ne pensa invece [del problema posto dalla
domanda]?”. In questo modo egli cerca di ribaltare la situazione di
subalternità in cui è oggettivamente posto, per carpire informazioni
sull’intervistatore ed avere una sorta di potere su di lui; in generale
questo atteggiamento è pericoloso perché manifesta una diffidenza
174
latente riguardo l’intervista, che probabilmente si riflette sulla qualità generale del rapporto comunicativo; inoltre, se l’intervistatore
ingenuamente rivelasse il suo pensiero, se intavolasse addirittura
una discussione con l’intervistato, tutta l’intervista sarebbe falsata,
poiché questi, nel bene o nel male, per adesione o per opposizione,
consapevolmente oppure no, avrebbe comunque un riferimento
preciso di valori (non i suoi) rispetto ai quali interagire.
Anche se può sembrare un ruolo sgradevole da assolvere, qui
l’intervistatore deve essere consapevole dei pericoli e sapere in
ogni caso evitare di dare soddisfazione alle richieste ricevute; vari
autori suggeriscono diverse strategie (p. es. Phillips 1972, 195196), ma il consiglio migliore è probabilmente il seguente:
l’intervistatore deve spiegare, con chiarezza e semplicità, che non
può rispondere, proprio perché l’intervista ne sarebbe condizionata, perché in quel momento il suo è un ruolo professionale
preciso che deve assolvere nel modo prescritto, ecc., ma che, dopo
l’intervista, se l’intervistato ancora vorrà sarà ben lieto di dire con
franchezza il suo pensiero. Se l’intervistato dovesse insistere, malgrado tutto, è meglio interrompere l’intervista.
Una forma diversa di tentativo di controllo da parte
dell’intervistato consiste nel chiedere non già cosa pensi
l’intervistatore, ma cosa hanno risposto gli altri intervistati. Qui è
molto facile replicare che per necessità di garanzia dell’anonimato
queste informazioni non si possono dare; eventualmente, le opinioni in generale degli intervistati potranno essere sintetizzate, per
quanto di conoscenza dell’intervistatore, alla fine del colloquio.
Infine il terzo caso; è il più facile da identificare, ma spesso crea
situazioni spiacevoli. In generale avvengono intromissioni
nell’intervista da parte di altri familiari, specie nei casi - i più frequenti - in cui le interviste vengono realizzate a casa. La madre che
si intromette nelle risposte del figlio, o il marito in quelle della
moglie, sono quasi scontate. La regola è di prevenire queste situazioni cercando di appartarsi; chiedere preventivamente
all’intervistato di andare in un’altra stanza può essere facilmente
motivato con la necessità di una tranquillità complessiva del colloquio; se ciò non è possibile, e nella stanza ci sono altre persone,
nell’introduzione preliminare si insisterà anche su questo particolare, sul fatto cioè che le opinioni sono personali e che deve rispondere solo l’intervistato. Nel caso di interferenze si dovranno assolutamente censurare, fino eventualmente ad interrompere
l’intervista.
Giunto alla fine si deve evitare di ‘scappare’ frettolosamente; si
annunci la conclusione, si chieda se su questi temi l’intervistato
175
avrebbe qualcosa da aggiungere e gli si chieda infine come ha trovato l’intervista (faticosa, facile, ...); queste informazioni dovrebbero comunque trovare una spazio preciso in ogni questionario,
specie se complesso. A questo punto può darsi che l’interlocutore
chieda nuove precisazioni sugli scopi del lavoro, o nuove rassicurazioni sull’anonimato; eventualmente, se è curioso di sapere cosa
hanno risposto altri intervistati (in senso generale, non nominativo)
o quale sia il pensiero dell’intervistatore, è questo il momento per
discuterne, ma senza enfatizzare eventuali diversità nelle opinioni.
Insomma, l’intervistatore deve rispondere in modo esauriente per
lasciare l’interlocutore convinto della bontà della scelta a collaborare; anche perché ogni esperienza positiva in questo senso lo predispone favorevolmente verso future altre situazioni di intervista.
Dopo l’intervista, se sono accaduti fatti notevoli che possono guidare
il
ricercatore
nell’interpretazione
del
pensiero
dell’intervistato, si possono scrivere ulteriori annotazioni in fondo
al questionario in uno spazio che il ricercatore avrà sempre cura di
lasciare; in particolare si dovranno segnalare le interferenze di terzi, specie se pesanti e frequenti, tali da consigliare di cassare
l’intervista (che dovrà ugualmente essere pagata, anche per motivare questo genere di segnalazioni); oppure quegli atteggiamenti
che l’intervistatore può osservare, ma il ricercatore non riscontrerebbe, che fanno pensare che una data risposta sia stata menzognera; ecc.
Infine, se il questionario è stato compilato in modo confuso, con
brutta grafìa, ecc., l’intervistatore dovrà copiarlo in forma pulita
prima di riconsegnarlo al ricercatore.
6.3 LA REGISTRAZIONE DEI DATI
6.3.1 La trascrizione delle risposte
Assumendo il caso dell’intervista ben avviata, nella quale l’intervistatore ponga correttamente le domande e l’intervistato risponda in
modo collaborativo, resta il problema della registrazione delle risposte.
Nel caso di domande chiuse la questione viene solitamente presentata in letteratura in due modi: alcuni autori suggeriscono che
l’intervistatore porga la domanda, legga la lista delle risposte, e
registri poi quella scelta dall’intervistato. Altri autori segnalano un
diverso approccio, ovvero che l’intervistatore legga la domanda,
176
ascolti la risposta così come viene formulata dall’intervistato, poi
decida come ricondurla alla lista di risposte disponibili.
In alcuni casi vengono suggeriti entrambi i metodi, ma è sempre
chiaro che il primo viene considerato preferibile dagli autori che
interpretano la ricerca secondo rigidi parametri comportamentistici. Significativo il manuale dell’Istat che, dopo avere a lungo
enfatizzato la necessità di standardizzazione delle procedure, indica il secondo approccio sopra descritto come “tecnica particolare
[alla quale] si può fare ricorso in casi estremi” (Istat 1989b, 52).
Ci sono i pro ed i contro in entrambi i casi. Molto in sintesi il primo approccio contribuisce alla stereotipie delle risposte, evita
l’insorgere di aspetti inattesi della ricerca, implica una salda competenza del ricercatore che redige la lista delle risposte, ma è certamente più facile da gestire da parte di intervistatori e non dà problemi postumi di codifica. Il secondo approccio consente
all’intervistato di sentirsi maggiormente parte in causa (e quindi
più motivato a rispondere) e non un semplice ‘risponditore’, consente l’irruzione di temi non previsti precedentemente dal ricercatore, ma impone un maggior ruolo dell’intervistatore, con possibili e prevedibili maggiori distorsioni nell’intervista, in quanto deve ‘interpretare’ una risposta semmai ricca ed articolata per ridurla
poi entro una classe molto sintetica (Sormano 1988).
Come già dichiarato in altre parti del volume si suggerisce qui
questo secondo modo di operare, perché i rischi connessi, oltre che
svincolati da un modo di concepire la ricerca che non convince (le
pretese di standardizzazione e di quasi-sperimentalità nella ricerca
sociale sembrano ridicole e poco interessanti) sono anche di gran
lunga compensati dai vantaggi tecnici, oltre che relazionali ed espressivi. Per esempio è difficile leggere una lista di sette od otto
risposte e pretendere che l’intervistato le ricordi tutte allo stesso
modo, e diventano impensabili liste di dodici, quindici o più risposte. In questo testo quindi si intende sempre questo modo di affrontare l’intervista: l’intervistatore legge una domanda,
l’intervistato risponde con le formule espressive che ritiene opportune, eventualmente l’intervistatore chiede precisazioni, oppure
insiste con domande sonda e probe, infine, fattosi il quadro della
risposta, decide quale delle categorie precodificate previste nel
questionario riassume sufficientemente la risposta, eventualmente
facendo annotazioni a margine o addirittura trascrivendo la risposta per intero e rinviando al ricercatore il compito di codificare, se
non trova soddisfacenti le categorie previste (ciò che viene detto
‘approccio critico’; cfr. Palumbo 1992, 33-35 e, in questo volume,
il §. 1.2).
177
Questa apparente discrezionalità e senso di opportunità che sembra
guidare l’intervistatore è assai meno ambiguo e soggettivo di quanto sembri; è quasi una regola che le domande chiuse vertano su argomenti chiaramente circoscrivibili, e che le risposte previste siano
semanticamente e logicamente non ambigue.
In merito alla tecnica preferibile per segnalare la risposta prescelta
c’è poco da dire; in teoria qualunque metodo andrebbe bene, ma
l’esperienza insegna che esistono anche intervistatori pasticcioni e
che quindi è bene omologare anche questi dettagli. Stabiliamo pertanto che un segno di croce, tracciato non a matita ma con penne
ad inchiostro, debba essere posto a ridosso delle caselle quadrate
che fiancheggiano le varie risposte, in coincidenza delle diagonali.
Nel caso di errori (o nel caso l’intervistato ci ripensi, qui non vale
la regola ‘la prima risposta è quella che conta’) si stabilisce convenzionalmente che la croce sulla risposta errata venga racchiusa
entro un segno circolare ad indicare l’errore, mentre una nuova
croce viene posta su un’altra casella; esempi:
TAV. 7 - MODO CORRETTO E SCORRETTO DI CONTRASSEGNARE LE RISPOSTE
Risposta indicata
correttamente
Risposta errata
indicata correttamente
Risposta errata
indicata in modo confuso
Nel caso di domande aperte la questione è molto più complicata,
dipende molto dalla natura della domanda e dagli obiettivi della
ricerca, e la sua funzionalità è legata essenzialmente alla sensibilità
ed alla capacità di chi è chiamato a registrare le risposte.
In generale l’uso di domande aperte è legato alla necessità di cogliere, in modo non rigido, aspetti del ‘mondo vitale’ (Schutz
1975; Ardigò 1980) dell’intervistato, e vertono quindi spesso su
temi generali, su grandi questioni della vita, su questioni comunque impegnative.
L’unica guida, per orientarsi fra le tante cose dette dall’intervistato
e registrarne la parte significativa, sono le ipotesi ed i concetti che
guidano la ricerca. Questa costante attenzione dell’intervistatore
alla ricerca (e non all’intervistato) gli consentirà, se ben preparato
178
e sensibile, di discernere fra questioni fondamentali (dal punto di
vista della ricerca) e secondarie (fossero pure fondamentali per
l’intervistato). Si potrà cogliere qui un’apparente contraddizione
fra quanto detto sopra circa la necessità di avvicinare il ‘mondo
vitale’ degli interlocutori e questa decisa indicazione per gli intervistatori di avere costantemente presenti gli scopi della ricerca,
come criterio di selezione, e non gli intervistati stessi, ma ciò si
spiega facilmente. Diversamente da altre tecniche di ricerca ‘di
profondità’, un questionario, sia pure con domande aperte, non può
essere interessato alla complessa vastità del mondo vitale, o sue
parti significative, per il semplice motivo che il questionario è lo
strumento meno adatto per cogliere tali aspetti. Con le domande
aperte, semplicemente, la rigidità dei pre-giudizi e delle preconoscenze del ricercatore viene smussata, permettendo un ingresso anche prepotente dell’intervistato nella ricerca, ma sempre entro
logiche complessive preordinate (quelle del questionario); diciamo, con una metafora, che le domande aperte, se ben costruire e
ben gestite, consentono di aprire una finestra sul mondo vitale, ma
non di farlo entrare dalla porta. Lo sguardo che il ricercatore potrà
dare da quella finestra è rapido, limitato al ristretto paesaggio che
da lì si vede, e quindi privato del contesto del più vasto territorio
entro cui tale paesaggio è inserito. Il contesto quindi, che dà significato a questo pezzetto di ‘paesaggio’ rendendolo utilizzabile, non
potrà trovarsi che all’interno dello strumento utilizzato, del questionario quindi come interfaccia fra l’intervistato ed i concetti posti dal ricercatore al centro della ricerca. Ecco perché le domande
aperte sono solitamente di carattere generale, e perché spesso ce
n’è più di una; esse servono come ‘indizi’ sul mondo vitale, limitatamente al tema della ricerca.
Se l’intervistatore quindi ha ben chiaro cosa vuole il ricercatore, ed
ha ben compreso i concetti che guidano il lavoro, non dovrebbe
avere troppa difficoltà a cogliere, dall’intera articolazione della risposta, i temi fondamentali e quelli anche solo di una certa rilevanza (un giudizio finale sulla gerarchia per importanza delle questioni sollevate dall’intervistato dovrebbe essere lasciata al ricercatore), scartando quelli assolutamente secondari.
La trascrizione della risposta deve essere comunque compiuta utilizzando i termini usati dall’interlocutore; la riduzione necessariamente compiuta dall’intervistato deve vertere sulle questioni di
contorno, sulla sovrabbondanza di dettagli descrittivi, sull’aneddotica, sulle ripetizioni e le questioni fuori tema. Tutto il resto
deve essere trascritto col massimo di fedeltà testuale e lessicale,
179
utilizzando possibilmente le stesse espressioni usate dall’intervistato.
6.3.2 Uso del registratore
In alcuni casi il ricercatore può essere interessato alla completa registrazione su nastro dell’intervista. In generale le ricerche così
concepite sono di natura diversa da quelle trattate in questo testo,
ma potrebbe essere interessante, per la verifica delle distorsioni,
far registrare un certo numero di interviste anche se realizzate tramite questionario (Kahn - Cannel 1968, 15-17; Phillips 1972, 211212; Sormano 1988).
Questa procedura può risultare particolarmente utile in fase di pretest, o per la verifica delle interviste iniziali.
Un’avvertenza che può suonare curiosa, ma che è opportuno rispettare: vietare all’intervistatore le registrazioni con batterie ed
imporre l’inserimento dell’apparecchio alla rete, e far sempre fare
una prova di registrazione prima di partire con l’intervista effettiva; per quanto ci senta sicuri, infatti, può succedere in questi casi
di perdere il contenuto di una registrazione per batterie ormai scariche, difetti dell’apparecchio, ecc.
6.3.3 La presenza del testimone
Può essere utile nella fase del pre-test, assieme o al posto del registratore. In questo caso il testimone non deve mai ed in alcun modo intervenire, e deve disporsi anche fisicamente in un luogo più
appartato. È opportuno che intervistatore e testimone si scambino i
ruoli nelle varie interviste preliminari realizzate.
6.4 IL CONTROLLO DEL LAVORO DEGLI INTERVISTATORI
Indipendentemente dalle motivazioni che si sono sapute trasmettere agli intervistatori e dalla fiducia che riponiamo verso di loro, ed
anche in considerazione dei doveri che abbiamo assunto verso i
committenti, occorre sottoporre a controllo il lavoro dei collaboratori.
Gli intervistatori devono sapere prima che il loro lavoro sarà controllato (ciò serve da deterrente), e dopo il ricercatore deve essere
conseguente (per non perdere credibilità, anche riguardo a future
ricerche).
180
Il metodo più semplice consiste in un numero casuale di riscontri
telefonici presso intervistati, allo scopo di sincerarsi se quel ricercatore è effettivamente andato ad intervistarlo; si possono porre
anche domande sulla durata del colloquio, ed ovviamente bisogna
sottolineare a chi risponde che non si tratta di una nuova perdita di
tempo per lui, né di un’infrazione all’impegno di anonimato, ma di
un semplice controllo sull’operato di un collaboratore.
Qualora si riscontrasse che un intervistato nega di aver subito
l’intervista occorre controllare tutti gli intervistati di quell’intervistatore, per verificare se c’è stato un vizio di fondo nel suo operato
o se si tratta di un equivoco, se non addirittura di una menzogna
dell’ex intervistato timoroso di essere nuovamente coinvolto.
Nel caso si riscontrasse un comportamento ripetutamente scorretto
da parte dell’intervistatore, gli si può negare il compenso pattuito
(ma nel contratto ciò deve essere chiarito) e occorre cestinare tutti i
suoi questionari provvedendo alla sostituzione dei nominativi per
recuperare le interviste mancanti.
6.5 IL QUESTIONARIO AUTOAMMINISTRATO
6.5.1 Concetti generali
Con questionario autoamministrato si intende un questionario redatto direttamente dall’intervistato, senza interventi da parte del
ricercatore o di un intervistatore.
Si tratta quindi di una modalità specifica di esecuzione, che però
influenza grandemente la struttura stessa del questionario e l’intero
disegno della ricerca. Viene descritta quindi con un paragrafo a se
stante rinviando, per tutti i problemi propri del questionario, alle
altre parti del volume.
Il problema fondamentale di un questionario autoamministrato è il
totale mancato controllo su quanto avvenga mentre l’intervistato lo
compila (ammesso che lo faccia); non c’è controllo, non c’è feedback, non c’è correzione di errore, non c’è interazione che consenta spiegazioni, che dia rassicurazioni, nulla. Un questionario è stato distribuito; passa del tempo; il questionario ritorna compilato.
Quello che è successo in mezzo non è possibile saperlo. In generale questo buco nella possibilità di controllare e sostenere
l’intervistato spaventa i ricercatori, e determina molte delle principali critiche a questo strumento, ma come sempre ogni cosa ha due
aspetti.
181
Vediamo brevemente pregi e difetti dei questionari autoamministrati (adattato da Bailey 1985):
TAV. 8 - PREGI E DIFETTI DEI QUESTIONARI AUTOAMINISTRATI
Pregi
- Risparmio di denaro
- Risparmio di tempo
- Meno personale da impiegare
- Maggiore garanzia di anonimato
- Comodità per l’intervistato che
può gestire il questionario come
crede
- Possibilità per l’intervistato di
riflettere sulle domande poste ed
eventualmente di documentarsi
- Facilità a raggiungere intervistati
in località lontane o isolate
- Assenza di distorsioni dovute
all’intervistatore
- Garanzia di standardizzazione
Difetti
- Mancanza di flessibilità (se
l’intervistato equivoca, o è vago,
non si può intervenire)
- Bassa percentuale di ritorni
- Le informazioni si riferiscono
solo al comportamento verbale
- Alto numero di mancate risposte
- Mancanza di controllo sull’ambiente (è proprio il destinatario che
risponde?)
- Mancanza di controllo sull’ordine
delle domande
- Impossibilità di usare una struttura complessa del questionario
- Impossibilità di registrare risposte
spontanee
- Difficoltà a distinguere i questionari non ritornati per rifiuto a rispondere da quelli mai arrivati al
destinatario
- Assenza di controllo sulla data
della compilazione, e quindi sulla
possibile influenza di eventi esterni
Guala, che li definisce comunque ‘questionari postali’ “indipendentemente dalle modalità di consegna [...] e dalle modalità di restituzione” (Guala 1991, 198), aggiunge, fra i pregi, la possibilità
di diffusione su vaste aree (cosa che rinvia comunque ad aspetti
organizzativi e di costi).
A ben vedere sono assolutamente maggiori e più gravi i difetti rispetto ai pochi pregi, ma come vedremo sotto l’etichetta molto generica di questionario autoamministrato ci sono diverse realtà e diverse opportunità.
Va comunque ricordato con vigore che il questionario autoamministrato non è un questionario come un altro di cui si decide una
diversa forma di distribuzione; il questionario autoamministrato ha
forma e struttura specifiche, particolari, in relazione alle problematiche viste sopra; innanzitutto è un questionario che non può toccare aspetti profondi; poi è un questionario breve, con poche doman-
182
de dirette e chiare, e con istruzioni per la compilazione ben evidenti; è un questionario adatto a raccogliere informazioni tecniche circoscritte (alcune case automobilistiche ne inviano uno ai nuovi acquirenti relativo alle modalità di acquisto), od opinioni su campioni molto omogenei.
6.5.2 Il questionario postale
Il questionario postale è probabilmente il più criticabile di tutti i
questionari autoamministrati per il ‘buco’ rappresentato dalla sottrazione a qualunque controllo del ricercatore della gestione, da
parte del rispondente, del questionario.
Valgono, in generale, tutte le critiche già segnalate nel paragrafo
precedente. In aggiunta si può suggerire di utilizzare il postale solo
in casi particolari, e con alcuni accorgimenti.
Innanzitutto se il campione è piuttosto uniforme dal punto di vista
socioeconomico e culturale (p.es. nel caso delle tipiche ricerche
sugli sbocchi professionali dei laureati in sociologia), in quanto si
limitano le distorsioni non controllabili dovute ai mancati ritorni.
Meglio se il gruppo, oltre che omogeneo, è anche di alto livello
culturale (come nell’esempio appena fatto) per i problemi legati
alla comprensibilità del testo.
Occorre poi che lo strumento sia estremamente conciso e semplice:
poche domande, possibilmente tutte precodificate, su un unico argomento ben circoscritto e non caricato di valenze emotive.
Un maggior ritorno è in genere garantito se si predispone, assieme
al questionario, una busta indirizzata ed affrancata. Spesso si inviano anche alcuni solleciti, anche nella forma di una riproposizione del questionario (in questo caso occorre munire il questionario di un codice-intervistato, per controllare eventuali doppi invii
di questionari da parte delle stesse persone).
Per una valutazione delle distorsioni sarà utile affiancare, al postale, alcune interviste dirette utilizzando lo stesso questionario somministrato; in genere questo è utile farlo su un gruppo di controllo
simile a quello dei non rispondenti al postale.
Guala (1991, 201) illustra un metodo di controllo della distorsione
basato sulla diversa codifica ed elaborazione dei questionari secondo l’ordine di ritorno; la sollecitudine a rispondere, ovvero l’interesse mostrato verso il questionario, rifletterebbe diverse proprietà dei soggetti, per cui i giovani rispondono prima degli anziani, le
persone scolarizzate prima di quelle poco scolarizzate, quelle politicizzate prima degli altri, ecc. L’analisi dei diversi gruppi di ritor-
183
ni dei questionari alla luce di questa riflessione consentirebbe, secondo Guala, un certo controllo sulla distorsione.
6.5.3 Casi in cui è utile usare un questionario autoamministrato
La necessità di conciliare budget, tempi, necessità del committente, ecc., impone a volte l’utilizzo del questionario autoamministrato. Tenendone presente i limiti, ed adottando alcuni accorgimenti visti sopra, la ricerca può comunque avere esiti soddisfacenti. Il questionario autoamministrato diventa addirittura uno
strumento ideale in alcuni casi: pensiamo p. es. a ricerche di ambito scolastico, con la possibilità di raggiungere ampi gruppi di giovani direttamente nelle aule scolastiche, o su gruppi comunque ben
identificabili raggiungibili nei luoghi di lavoro, di svago, ecc.
In questo caso la presenza del ricercatore o dell’intervistatore rende l’intervista qualcosa di intermedio fra il questionario tradizionale e quello autoamministrato; il ricercatore incaricato della distribuzione nelle aule scolastiche, p. es., può illustrare con dovizia
di particolari scopi ed istruzioni di compilazione, può sorvegliare
l’esecuzione e rispondere immediatamente a dubbi degli intervistati, e così via. In questo modo si possono raccogliere rapidamente
numerose interviste realizzate in ambiente controllato e quindi prive di diverse classiche distorsioni dei questionari autoamministrati.
184
7 PREPARARE
I DATI
7.1 LA CODIFICA
7.1.1 Principi generali
Lo Zingarelli definisce il ‘codice’, nel suo significato 4, come
“Rappresentazione di dati o istruzioni in forma simbolica”, specificando poi che tale forma può essere alfabetica, numerica, alfanumerica.
La codifica, per noi, è quindi la trasformazione dei dati della ricerca in simboli, e lo scopo del lavoro è poter immagazzinare in modo
semplice ed ordinato tali simboli per poterli più agevolmente osservare, trattare, elaborare, commentare.
In epoca di elaborazione elettronica la codifica serve quindi per
costruire dei file di dati gestibili con semplicità dall’elaboratore al
fine della successiva elaborazione e per l’applicazione di test statistici (indici di correlazione, ecc.).
I dati della nostra ricerca sono le risposte al questionario: risposte a
domande precodificate, risposte aperte, commenti a storielle e vignette, scelte su scale Likert, ecc.; proposte diverse quindi, che
nella logica del questionario vanno comunque ricondotte ad una
simbologia numerica (per semplicità e consuetudine, per normale
logica dei calcolatori, per poter utilizzare, in alcuni casi, le proprietà dei numeri, p. es. quella ordinale nel caso delle scale; sulla
possibile attribuzione di talune proprietà dei numeri ai valori della
matrice dei dati si veda sinteticamente Marradi 1993, 13-15) che
nel suo insieme andrà a costituire la matrice dati, che è il grande
magazzino che raccoglie, in forma simbolica, tutte le risposte di
tutti i questionari (abbiamo descritto la matrice al §. 1.1; per una
discussione più ampia cfr. Delli Zotti 1985).
La codifica è un passaggio ineludibile nella logica della ricerca
svolta col questionario, e deve essere prevista e contemplata sin
dalle prime fasi della ricerca, o quantomeno in sede di decisione
sugli stimoli da inserire.
Alcuni item complessi, infatti, creeranno problemi in fase di codifica e/o di elaborazione, ed è opportuno sapere prima a cosa si va
incontro.
Estremamente in sintesi la codifica consiste nell’attribuzione di
un’etichetta numerica ad ogni possibile risposta di ogni domanda.
In tutti gli esempi fatti in questo testo si sarà notato che, entro i
185
quadretti a fianco delle risposte, si è sempre inserito un numero
(tale numero poteva anche essere posto a fianco del quadretto), p.
es.:
Sesso dell’intervistato
[1] Maschio
[2] Femmina
‘1’ e ‘2’ sono i codici rispettivamente di Maschio e Femmina, ovvero, nella matrice dati, ogni volta che in relazione al sesso troveremo l’indicazione 1 sapremo che si tratta di un rispondente maschio e viceversa per il 2. È chiaro dall’esempio perché abbiamo
parlato di ‘etichetta numerica’. 1 e 2 non sono i ‘valori’ dei due
sessi, o peggio che mai una loro ‘misura’; femmina non vale il
doppio di maschio, né maschio è prioritario rispetto a femmina
(vedi Marradi 1993, 29-30). Possiamo tranquillamente invertire i
codici fra i sessi, oppure potremmo, in teoria, codificare i sessi ‘a’
e ‘b’, oppure ‘♥’ e ‘#’ (ma ciò sarebbe oltremodo scomodo).
Il principio generale è quindi questo: ai fini della composizione
della matrice dati ogni questionario (o caso, nel linguaggio della
matrice, o record, nel linguaggio dell’elaboratore) deve avere un
numero distinto da 1 ad n, dove n è l’ultimo questionario compilato, ritornato ed accettato dal ricercatore; ogni domanda del questionario (o variabile, nel linguaggio della matrice, o campo, nel
linguaggio dell’elaboratore) deve avere un ulteriore numero da 1
ad m; infine (e qui siamo alla codifica) ogni possibile risposta di
ciascuna diversa domanda (o categoria nel linguaggio della matrice) deve essere ancora numerata da 1 ad i.
Il numero di record e campo identifica, nella matrice dati, la cella
corrispondente a quella variabile (sesso, età, opinione sulla tal cosa, ...) per quel caso (il questionario di R1 o di R2, ecc.), e
l’etichetta numerica racchiusa in quella cella identifica l’esatta risposta data (si veda la Tav. 1).
Come si codifica? Nel caso di domande chiuse la codifica viene
fatta a priori dal ricercatore numerando le risposte che ha previsto,
senza ulteriori problemi; nel caso di domande aperte o altri stimoli
non strutturati l’attribuzione del codice è operazione assai più
complessa da fare a posteriori. Il risultato finale, comunque, non
cambia; la riduzione della realtà operata dal ricercatore prevederà
un numero limitato di stati per ciascuna proprietà, e tali stati sono
numerati, di regola, 1, 2, 3, ..., i (un’eccezione particolare è stata
presentata al §. 5.1.1.7 “Le domande a risposta multipla”).
186
Poiché questa operazione è ineludibile, è buona norma, ogni qual
volta ciò sia possibile (sempre nel caso di domande chiuse) precodificare, ovvero indicare già sul questionario i numeri di codice
corrispondenti alle risposte (come negli esempi fatti). Il motivo è
semplice: un questionario con una buona precodifica può essere
passato direttamente all’operatore incaricato dell’inserimento dei
dati nell’elaboratore (generalmente indicato come consollista) che
digiterà il numero prestampato corrispondente alla risposta barrata;
se tali numeri non fossero già indicati l’operatore dovrebbe contare, partendo da 1, le risposte di ogni domanda, per trovare il numero di codice corrispondente alla risposta data; facciamo un esempio:
Domanda su argomento dato:
risposta a [ ]
risposta b [ ]
risposta c [ ]
risposta d [ ]
risposta e [ ]
risposta f [ ]
risposta g [ ]
risposta h [ ]
L’effettiva risposta (indicata con una croce dentro il quadretto) non
è immediatamente percepibile come la settima della lista, alla quale quindi dare il codice ‘7’, ed il consollista dovrebbe contare ogni
volta, per questa e le altre domande, per individuare quale codice
dare; ciò con grande spreco di tempo e possibilità di errori. La precodifica presenterebbe lo stesso esempio in questo modo:
Domanda su argomento abc:
risposta a [1]
risposta b [2]
risposta c [3]
risposta d [4]
risposta e [5]
risposta f [6]
risposta g [7]
risposta h [8]
Così l’operatore al primo sguardo comprende che, in questo caso,
la risposta prescelta è la settima, ed il codice da immettere è ‘7’.
Molti questionari prevedono anche uno spazio a parte, generalmente lungo il fianco, spesso separato dalla zona in cui sono scritte
187
le domande con una colonna, delle caselle in cui trascrivere i valori di codifica, in questo modo:
1) Sesso:
Maschio [1]
Femmina [2]
2) Età: Fino a 20 anni
[1]
da 21 a 30
[2]
da 31 a 40
[3]
da 41 a 50
[4]
da 51 a 60
[5]
oltre 60
[6]
3) Domanda chiusa:
risposta [1]
risposta
[2]
risposta
[3]
risposta
[4]
risposta
[5]
risposta
[6]
risposta
[7]
risposta
[8]
altro (specificare: ________________)
4) Domanda aperta: _____________________________
_______________________________________
[]
[]
[ ][ ]
[]
I riquadri nella colonna di destra accoglieranno, nella fase di codifica, i valori di codice che il ricercatore deciderà sulla scorta delle
risposte alle domande chiuse (dopo aver sciolto i problemi eventuali dovuti alla disponibilità della risposta ‘Altro’) ed aperte. Lo
scopo è facilitare il lavoro del consollista, ed è propriamente indicato come ‘transcodifica’ (la codifica è la fase primaria di attribuzione di un codice, la transcodifica la trascrizione del codice in appositi spazi). La transcodifica può essere fatta, anziché sul questionario, su appositi fogli predisposti con i vari quadretti che
nell’esempio sopra riportato stanno nella colonna destra; ciò può
favorire il consollista, specie se i questionari sono voluminosi. Notare infine che a volte il ricercatore predispone più di uno spazio di
codifica, laddove prevede più di nove risposte alla sua domanda, e
quindi la necessità di utilizzare due campi, come nel caso della
domanda n.3 nell’esempio immaginario riportato sopra (un’ampia
trattazione delle problematiche della codifica in Martinotti 1967) .
7.1.2 Libro codice
188
Il libro codice è il vocabolario del ricercatore, del codificatore, del
consollista. Vi sono riportate tutte le domande, con le relative risposte decise dal ricercatore ed i relativi valori di codifica.
Il libro codice è inutile in caso di questionari completamente precodificati, mentre diventa quasi indispensabile per questionari con
molte domande aperte ed altri stimoli non strutturati per i quali si è
proceduto alla codifica a posteriori. Tutte le scelte classificatorie
sono riepilogate nel libro codice, che può avere la forma fisica di
un quaderno (una pagina dedicata ad ogni item) o ad un grande foglio ripartito opportunamente, strumento che verrà consultato costantemente in fase di codifica, ovvero quando occorre apporre
concretamente un valore di codice ad ogni risposta. Poiché non si
può pensare che il ricercatore ricordi tutte le classificazioni stabilite, il libro codice gli consente di ritrovare i casi, gli esempi, i tipi
ideali stabiliti ed il corrispondente codice. Nel caso di domande
aperte, specie se pluridimensionali nelle risposte, il libro codice
può contemplare una vera e propria casistica utile per orientare il
ricercatore nella molteplicità di casi che troverà, come in questo
esempio (Del Cornò - Bezzi 1985, 156-157):
25) A lei piacerebbe dedicare un po’ di tempo alla lettura?
No, senza ulteriori spiegazioni
No, per motivi culturali, psichici o fisici dell’intervistato
(“Non mi concentro”, “non sono portato”, “ci vedo poco”, ...)
No, perché la lettura è inutile, o dannosa, quindi
all’intervistato non interessa, preferisce far altro (“Quel
che conta è l’esperienza”, “è roba da femminucce”, “è
per disonesti”, ...)
Solo in determinate circostanze, limitatamente ad alcuni
libri, in modo superficiale, ecc.; “Forse”
Sì, perché la lettura è positiva in sé
Sì, perché ne deriva cultura e/o svago
Sì, senza ulteriori spiegazioni
Mancata risposta
1
2
3
4
5
6
7
8
29) Ci sono persone che passano molto tempo a leggere libri di
fantasia [...]. Lei personalmente cosa ne pensa?
Giudizio positivo (“Lo farei anch’io se avessi tem- 1
po/denaro/cultura”)
Chi lo fa appartiene ad un gruppo percepito come “altro”, le cui regole permettono tali letture, non consone a
lui nella percezione che ha di sé (“Beati loro!”; “Fanno
bene, io non lo farei” ...)
2
189
Giudizio negativo
Non so; altre risposte generiche di estraneità
Mancata risposta
3
4
5
73) Secondo lei è giusto che la donna lavori? Qualunque lavoro? E
se ha famiglia? Perché?
No totale (ideologico); anche: “Non so”, N.R.
1
Sì, ma... impedimenti culturali (“Solo lavori adatti”,“No
se ha famiglia”, ...)
2
Sì, ma... impedimenti sociali (“Solo se ne ha bisogno”,
“Se non toglie lavoro agli uomini”, ...)
3
Sì, ma... entrambi i precedenti
4
Sì assoluto
5
7.1.3 La pulizia dei dati
La fase di codifica non è così tranquilla come può sembrare. I questionari sono in genere un vero concentrato di errori, mancate risposte, confusioni incomprensibili dovute, in gran parte, ad un cattivo lavoro da parte degli intervistatori e degli stessi ricercatori (in
caso di questionari autoamministrati questi problemi crescono enormemente). Tutti i problemi devono essere risolti dal ricercatore
in fase di codifica, mentre la transcodifica e l’immissione dati devono già essere depurati da ogni problema.
Vediamo in breve una casistica:
Mancate risposte: non ci si può fare nulla ed occorre prevedere, in
fase di codifica, un campo apposito denominato ‘Mancata risposta’, spesso sintetizzato con ‘NR’; attenzione a non confondere le
NR con risposte impossibili da dare, da parte dell’intervistato, in
seguito a domande filtro. In questo caso può essere utile codificare
questo ‘buco’ con NP (= Non Pertinente), in quanto spesso la
quantità di non risposte è un indicatore preciso di difficoltà verso i
temi dell’intervista.
Risposte plurime in caso di domanda precodificata che ne richiedeva una sola: non ci si può fare nulla; è un errore considerare come risposta la prima della lista (l’ordine delle risposte è casuale, o
comunque indipendente dalle volontà espressive di chi risponde), o
adottare altri criteri; queste risposte vanno cassate e si codificherà
‘NR’.
Incongruenze: specie in caso di filtri può accadere che
l’intervistato risponda nella sezione diversa da quella indicata nel
filtro; p. es. dopo aver risposto di essere contrario alla pena di morte, ad una successiva domanda “Perché?”, riservata ai favorevoli
190
alla pena, qualcuno potrebbe rispondere “Perché bisogna liberarsi
una volta per sempre di pericolosi criminali”. In un caso come
questo è ovvio che l’intervistato (o l’intervistatore) ha compiuto un
errore materiale nella scelta della risposta nella domanda filtro.
Molte volte però non ci può essere questa certezza, nel qual caso
occorre rassegnarsi a perdere la risposta codificando ‘NR’.
Una volta ripuliti in modo formale i questionari in questo modo
dobbiamo prevedere una seconda opera di controllo sulla matrice
dati, ovvero su quel ‘magazzino’ informativo dove finiranno tutti i
questionari, sotto forma di numeri di codice, per la successiva elaborazione. Il controllo sulla matrice è semplice e veloce se eseguito dal calcolatore, un po’ più complesso se l’elaborazione è manuale; il principio è semplice: da un lato è impossibile che in un
determinato campo della matrice vi sia un valore di codice out of
range, ovvero un sesso = 3, o un codice 6 laddove si prevedevano
un massimo di 5 classi, e così via (qui si parla di ‘controllo degli
errori materiali’); d’altra parte è improbabile che vi siano dirigenti
analfabeti, quindicenni coniugati, ecc. (qui occorre un ‘controllo di
congruenza’). Nel primo caso è ovvio un errore di transcodifica,
nel secondo è possibile (ma non certo, vedi Palumbo 1991, 87-89).
In tutti questi casi occorre riprendere il questionario relativo, controllare, ed eventualmente correggere l’errore sulla matrice.
7.2 LA CODIFICA A POSTERIORI
Per comprendere il significato di questa tecnica, ci rifaremo ai due
esempi riportati quando trattavamo della costruzione di item aperti.
Le domande aperte, vuoi perché più astratte e multidimensionali,
vuoi perché più intenzionate a scavare nel profondo, sono spesso
proposte a gruppi, e si prestano di conseguenza ad essere analizzate assieme, anche codificate assieme.
Per esempio, gli item 10, 11, 12 visti al §. 5.1.2 furono codificati
assieme in questo modo:
Niente t.l.; anche: “pochissimo”
Poco (entro 2 ore feriali in media: non incidenza di periodi di fine settimana e/o ferie festive; anche risposte
tipo: “dipende dai giorni, ma in genere poco”; “poco la
sera”)
Abbastanza (2-4 ore al giorno in media; presenza di t.l.
nei fine settimana e periodi estivi; risposte tipo: “sufficiente...”)
191
1
2
3
Molto (+ di 4 ore, prolungate ferie festive; anche: pensionati, ecc.)
4
Notare che le categorie di risposta hanno esse stesse una formulazione lessicale piuttosto ampia: ci sono vere e proprie quantificazioni orarie, affermazioni sulla presenza/assenza di periodi di
riposo significativi (week-end, ferie), e ‘risposte-tipo’, che veicolano il ‘livello semantico’ su cui collocare la risposta. Una codifica
di questo genere, ovviamente, non può che avvenire dopo un attento spoglio dei questionari, e dopo una riflessione sul significato
che le varie risposte, certo più articolate della codifica, potevano
avere. Si deve operare insomma una vera e propria riduzione di
carattere fenomenologico di comportamenti considerati simili da
un qualche punto di vista che il ricercatore può esplicitare, riduzione che è una delle possibili, scelta con criteri di opportunità interni alla ricerca, e operazionalizzata sovente con approcci di carattere ermeneutico, vale a dire ‘leggendo’ i questionari come protocolli, cercando di ricostruire la personalità e le motivazioni
dell’intervistato, e dando infine una interpretazione delle sue risposte che non può che essere valutativa. La codifica vista ora, pur
‘quantificando’ apparentemente il tempo libero degli intervistati,
in realtà ne dà una valutazione.
Non si può nascondere che ci sono non pochi problemi teorici e
pratici in questo lavoro di riduzione dei protocolli in categorie più
semplici. Per esempio quello di una banalizzazione estrema che di
fatto rende inutile la presenza di tanta ricchezza espositiva, ovvero
l’eccesso di classificazione (operata per perdere meno informazioni possibile) di fatto ingestibile; a questo proposito, p.es, Marradi,
parlando delle distorsioni operate dalla classificazione con scale
con categorie ordinate, afferma:
Per inciso, la stessa difficoltà si manifesta anche quando vengono
registrate le risposte spontanee degli intervistati anziché chiedere loro
di scegliere fra alternative pre-codificate, e in seguito si raggruppano
tali risposte in un certo numero di categorie, operando cioè una classificazione ex post anziché preventivamente. In tal caso, accade spesso
di costituire, stimolati dalla varietà delle risposte, troppe categorie, cui
poi non siamo in grado di dare un’accettabile disposizione ordinale sul
continuum. Beninteso, di fronte a una difficoltà del genere, si può
sempre decidere di non ordinare le categorie; ma se si è convinti che
la proprietà è correttamente rappresentabile come un continuum, ciò
significa rinunciare a parte delle informazioni raccolte (Marradi
1987a, 61)
192
Questo tipo di preoccupazioni porta a volte a gestire la domanda
aperta in modo estremamente riduttivo, che di fatto banalizza ed
isterilisce la ricchezza informativa raccolta in questo modo (così fa
Delli Zotti 1992). La proposta qui illustrata è l’analisi attenta e
protocollare delle risposte ed una loro riduzione sulla base di logiche interpretative che hanno un senso di carattere nomotetico per il
ricercatore; ogni classificazione rigida, sulla base di logiche idiografiche, volte alla catalogazione degli ‘oggetti’ citati nelle risposte, rende inutile l’item aperto (esempi concordi con quanto qui
affermato in Agnoli 1992, 153-158, in cui si deve notare, specialmente, l’opera di riduzione fenomenologica operata a partire da un
accorpamento delle classi, ciò che consente una migliore gestione
dell’analisi bivariata)
Benché nella ricerca esemplificata ciò non sia stato fatto, il lavoro
di codifica complessiva di un grappolo di item poteva essere concentrato su tutto l’insieme delle domande presentate, interpretando
e valutando non più solo la quantità di t.l. percepito, ma anche il
suo uso prevalente; elaborazioni di questo genere non sono in alternativa al lavoro di codifica item per item, ma possono essere aggiuntive (un esempio di pluricodifica della stessa batteria di domande in Agnoli 1992, 151-152).
Insomma, il lavoro che viene fatto sul ‘testo’ questionario è volto a
trovare vettori, chiaramente identificabili, rivelatori di atteggiamenti e valori distintamente connotati e discriminanti del mondo
vitale dell’intervistato secondo tipologie non predefinibili e non
troppo ampie, tipologie ciascuna rinviante ad una specifica ‘provincia finita di significato’, come direbbe Schutz, e chiaramente
alternative (non necessariamente entro continui bipolari) che senza
ambiguità definiscano il ‘tipo fenomenologico’ a cui appartiene
ciascun intervistato. Non quindi un lavoro sul piano lessicale,
semmai con un’analisi del contenuto (come suggerisce Guala
1986, 196) che può fornire solo alcuni elementi quantitativi sulla
struttura delle risposte, ma un lavoro sul piano semantico, con
un’analisi di tipo ermeneutico alla ricerca dei significati sottostanti.
Questo carattere sintetico-interpretativo della post-codifica degli
item aperti si evidenzia in modo particolare a partire dal secondo
esempio, relativo alla domanda sulla situazione italiana vista alla
fine del §. 5.1.2 (“Non si fa che parlare della grave situazione economica...”); è evidente che al ricercatore non interessava entrare
nel merito di tale giudizio, che esulava completamente dall’oggetto
della ricerca. Né si pensava che tale giudizio fosse un concetto
portante di tale oggetto. Questa domanda (assieme ad altre) doveva
193
fornire indicazioni su vettori culturali-valoriali da considerare, in
un certo qual senso, ‘variabili indipendenti’, rispetto all’oggetto, al
pari del sesso, età, ecc.
La codifica adottata è stata la seguente:
70) Non si fa che parlare della grave situazione economica e sociale dell’Italia [...]. Secondo lei cosa si dovrebbe fare per fare andare
meglio le cose?
Non lo so / NR (anche risposte tipo: “queste cose non le
capisco”, “è un discorso troppo complicato”)
1
Massimo di frammentario: risposte improntate al massimalismo, qualunquismo, e alla contraddittorietà e parzialità (“Ammazzare tutti i delinquenti”, “Cambiare tutto”, “Leggi più severe”, ...)
2
Frammentario verso il massimo: risposte ancora generiche o parziali ma meno massimaliste; indicazioni di coinvolgimento (“Più onestà nella gente”, “Lavoro per tutti”, “Cambiare governo” in contesto frammentario); generici cambiamenti
3
Frammentario verso il minimo; anche massimalismo, ma
visione più coerente dei problemi con indicazioni di merito (“Cambiare governo” in contesto partecipativo,
“Provvedimenti contro l’inflazione, per l’agricoltura,
ecc.”)
4
Minimo di framm.: indicazioni articolate e non massimaliste
5
A parte la posizione 1, le quattro categorie di risposta formano una
sorta di scala, da un minimo ad un massimo di ‘frammentario’ (che
il ricercatore aveva tratto dal concetto gramsciano di ‘senso comune’, che comprende l’adesione a stereotipie, la ristrettezza
dell’orizzonte culturale di riferimento e il rifiuto del nuovo, la
mancanza di giudizi articolati, ecc.).
Il ricercatore ha costruito così una tipologia valutativa, che nella
sua estrema sinteticità trascura le articolazioni espressive
dell’intervistato (non interessanti per la ricerca da un punto di vista
del merito), per definirlo però più chiaramente in quanto a ‘mondo
vitale’. È chiaro che da questo item scaturiva un indicatore di
mondo vitale, di orientamento valoriale. Altri erano tratti da item
diversi, come quello sul lavoro femminile visto sopra.
Questo strumento presenta una gamma di problemi abbastanza diversificata, tanto da indurre molti a considerarlo generalmente poco opportuno. In realtà si tratta per la maggior parte di problemi di
gestione, in quanto per ogni possibile appunto di carattere episte-
194
mologico rivolto agli item aperti se ne può contrapporre uno analogo o contrapposto per quelli chiusi.
In ogni caso i vantaggi di questa tecnica vertono essenzialmente
sulla possibilità di scegliere, ex post, quella tipologia che il ricercatore ritiene più adeguata, giudizio che viene dato dopo la lettura
dei questionari-protocollo. La carica di arbitrarietà, o comunque di
forte soggettività da parte del ricercatore, è in qualche modo da
bilanciare col fatto, estremamente significativo, che egli matura le
proprie scelte sulla scorta di un materiale vivo. Ciò permette una
grande flessibilità dello strumento, che consentendo letture diverse
(tutte ipoteticamente ‘giuste’) porta il ricercatore ad avere più
chiavi interpretative dello stesso fenomeno, possibilità straordinaria specie se comparata alle strettoie imposte da strumenti più rigidi.
Facciamo un esempio. Supponiamo che, entro un’ipotetica ricerca
sul tempo libero degli adulti, si vogliano indagare i ‘giochi’ eventualmente praticati: un item chiuso dovrebbe prevedere una serie
abbastanza lunga di opzioni (carte, scacchi, videogiochi, ...), con
possibilità per di dare più risposte (ci si riferisce all’esempio già
proposto in 5.1.1.7 “Le domande a risposta multipla”, dove si è
anche segnalata una possibile codifica sintetica). Necessità di gestione imporrebbero una preliminare riduzione (nel senso comune
di ‘restringimento’) delle opzioni a giudizio del ricercatore apparentabili; p.es. è probabile che ci sia un’opzione ‘carte’, senza distinzione della complessità del gioco (da rubamazzo al bridge), di
qualità dell’interazione (dal solitario, ai giochi di squadra, alle catene dello chemin de fer), di contesto motivazionale (giochi natalizi come mercante in fiera, giochi d’azzardo come poker, giochi
d’osteria come ‘padrone e sotto’, giochi di società, uso divinatorio
coi tarocchi, ecc.); le diverse dimensioni del gioco delle carte, notare, si situano su piani diversi, rinvianti a concetti diversi. Lo stesso vale per gli altri possibili giochi: si può giocare a scacchi in solitario (nella risoluzioni di problemi), nella classica sfida uno contro uno, in contesti più ampi (p.es. nella simultanea uno contro
molti), o contro un computer; in quest’ultimo caso, p.es., il gioco
degli scacchi è ancora gioco degli scacchi o è imparentabile ad altri giochi elettronici? Si tratta di un’interazione (uomo/macchina) o
siamo più prossimi al solitario?
Come si vede, anche un tema apparentemente semplice, risolvibile
entro un approccio descrittivo, può presentare articolazioni insospettabili. Questa ‘complessificazione’ della realtà non è sempre
risolvibile, a livello metodologico, impostando correttamente la
ricerca a partire dai concetti per scendere agli indicatori; la concet-
195
tualizzazione della nostra ipotetica ricerca ha infatti stabilito che
uno degli indicatori del concetto ‘tempo libero’ sia le attività ludiche degli adulti, sostenuta in ciò dalla letteratura in argomento, e
che tale indicatore sia trasformabile, fra l’altro, nell’item descritto
sopra (‘giochi praticati’); per quanto le ipotesi della ricerca possano indirizzare questa concettualizzazione verso vettori specifici
(p.es. sugli assi solitudine/socialità, giochi tradizionali/giochi tecnologici, ecc.), è solo dall’analisi del reale ventaglio di giochi dichiarati, contestualizzati con le tecniche viste sopra, che il ricercatore riceve informazioni decisive per stabilire quale vettore
diviene significativo. La domanda sui giochi, lasciata aperta e supportata anche semplicemente da probe del genere “perché?”, rivela
quindi non solo il gioco giocato, ma dinamiche anche profonde, atteggiamenti generali relativi a valori e orientamenti tipici degli intervistati. Leggendo come protocolli i questionari, il ricercatore
non dispone più semplicemente di una lista analitico-descrittiva di
giochi, lista uni-dimensionale, privata di qualunque spessore valoriale, culturale e motivazionale, ma di un panorama di spiegazioni
di ciascun intervistato circa il suo gioco e perché lo fa. Ciascun
questionario, ciascun ‘protocollo’, prima di diventare un valore
sulla matrice è quindi interpretato non attraverso griglie esterne ma
con strumenti interni all’intervistato (nei limiti, ovviamente, delle
possibilità dello strumento).
Il ricercatore, illuminato dal testo, potrebbe allora decidere per
qualunque codifica, anche per una nella quale si finisca con perdere il significato esplicito del gioco per recuperarne di impliciti
sull’intervistato stesso (una proposta di precodifica di un item di
questo genere, con lo stesso spirito, al §. 5.1.17)
7.3 STIMOLI NON CODIFICABILI ENTRO IL QUESTIONARIO
Occorre prestare attenzione a quegli stimoli inseriti in un questionario che non possono però essere opportunamente codificati per
l’inserimento in matrice dati. In generale si tratta di stimoli non
strutturati e non direttivi, come le vignette e le storielle. Benché,
come abbiamo visto parlando delle storielle, a volte si possano ridurre anche questi stimoli entro una matrice, perdendo comunque
molto del loro spessore originario, in generale ciò non è possibile.
Occorre tenere presente che questi stimoli generalmente necessitano di un registratore, e che il ricercatore analizza con sottili procedimenti ermeneutici, di analisi del contenuto, ecc., la registrazione.
196
Benché quindi difficoltosi, ed assolutamente inadatti per ricercatori inesperti o all’interno di ricerche molto semplici, può essere utile
introdurre queste tecniche per stimolare l’intervistato, aiutarlo
nell’opera di riflessione, trarre elementi vitali per una maggiore
comprensione della ricerca da parte del ricercatore; questo è un
aspetto molto importante, ed un ricercatore esperto può trarre un
grande giovamento nell’affiancare, all’opera di elaborazione della
matrice dati, una lettura dei questionari come protocolli, specie se
ricchi di domande aperte e stimoli non direttivi; in questo contesto
anche vignette e storielle presentate nel modo canonico e registrate
su nastro possono offrire molte chiavi di interpretazione altrimenti
irragiungibili.
197
8
L’ELABORAZIONE E L
DATI
’ANALISI
DEI
8.1 INTRODUZIONE
Le fasi conclusive di un processo di ricerca consistono
nell’elaborazione e analisi dei dati. Con il primo termine intendiamo riferirci a qualunque procedimento (non solo statistico) di trattamento dei dati rilevati; con il secondo alle riflessioni che applichiamo ai (o che ci vengono suggerite dai) risultati
dell’elaborazione dei dati.
Proponiamo una definizione così generale perché sia il trattamento
cui sottoporremo i dati rilevati, sia le riflessioni che ne deriveranno, sono innanzi tutto determinati dalle ipotesi formulate inizialmente. Ciò vale, di norma, per qualunque tipo di ricerca (descrittiva, esplicativa, applicativa, valutativa, ecc.).
Tali ipotesi possono configurarsi, in primo luogo, come semplici
criteri di rilevanza: in una ricerca descrittiva ci si può limitare ad
ipotizzare che esista un certo numero di aspetti, successivamente
operativizzati in variabili, meritevoli di essere rilevati. In questo
caso, nello stadio dell’elaborazione ed analisi dei dati, ci si preoccuperà principalmente di fornire una descrizione di tali aspetti, attraverso l’ausilio della statistica e la produzione di tabelle e grafici
anche elementari.
Molto più spesso le ipotesi iniziali prevedono anche la ricerca di
relazioni tra variabili; in questo caso attraverso l’elaborazione dei
dati ci si prefiggerà di misurare l’esistenza e, ove possibile,
l’intensità e il tipo di relazioni riscontrate, ed in fase di analisi verrà valutata la rilevanza di tali relazioni rispetto sia a ricerche analoghe sia alle teorie sociologiche prese a riferimento.
Nelle ricerche esplicative le ipotesi saranno formulate fin
dall’inizio con un maggior grado di precisione: in altre parole, sapremo con molta chiarezza cosa stiamo cercando, e molto spesso
anche i tipi di elaborazione cui sottoporre i dati saranno definiti fin
dall’inizio, in rapporto alle ipotesi di partenza.
In una ricerca valutativa gli obiettivi iniziali influenzeranno in modo altrettanto cogente l’elaborazione e l’analisi. Gli obiettivi della
valutazione svolgeranno un ruolo simile a quello delle ipotesi da
confermare, in quanto predetermineranno le relazioni tra variabili
da misurare e le valutazioni che saranno fornite di tali relazioni.
198
Un esempio per chiarire. Gli stessi dati rilevati da un questionario,
relativi ad esempio a percorsi scolastici e comportamenti devianti
dei giovani, potranno essere elaborati ed analizzati in modo diverso a seconda del tipo di ricerca che si sta svolgendo. In una ricerca
descrittiva ci si prefiggerà di conoscere la distribuzione dei due
caratteri; per esempio, di conoscere la percentuale di abbandoni
scolastici nella fascia dell’obbligo e la percentuale di consumatori
di droghe tra i giovani. L’analisi dei dati potrà limitarsi a valutare
se l’abbandono scolastico è aumentato o diminuito nel tempo, se è
maggiore in un quartiere o in un altro, ecc. In una ricerca esplicativa sarà stata inizialmente ipotizzata una relazione tra i due fenomeni; con l’elaborazione ed analisi dei dati si cercherà quindi di
misurare l’esistenza e l’intensità di tale relazione. Ad esempio,
quindi, si cercherà di vedere se tra i giovani che hanno abbandonato anzitempo la scuola si registra una concentrazione più elevata di
consumatori di droga: ovvero se l’assunzione di droghe preceda o
segua gli abbandoni scolastici. Infine, in una ricerca valutativa,
mirata ad esempio alla valutazione dell’efficacia di una campagna
di prevenzione, si porranno in relazione i consumi di droga registrati prima e dopo la campagna (oppure tra un gruppo esposto alla
campagna e un altro che non ne è stato oggetto) per valutare se vi
siano differenze e se tali differenze corrispondano a quelle poste
come obiettivo della campagna stessa.
Come si è detto in precedenza, molto spesso una ricerca sociale si
pone, miscelati in vario modo, tutti gli obiettivi sopra detti. Una
ricerca sull’abbandono scolastico può prefiggersi l’obiettivo sia di
misurarne la portata in generale e nei diversi contesti territoriali e
sociali di appartenenza dei giovani, sia di cercarne le relazioni con
altre variabili (status socio economico e culturale della famiglia,
tipo di quartiere di residenza, ecc.), sia infine di individuare variabili causali sulle quali intervenire a livello di politiche sociali, ovvero di misurare gli effetti di politiche già avviate.
In tutti i casi, l’elaborazione e l’analisi dei dati serviranno a descrivere i fenomeni rilevati e a cercare relazioni tra le variabili costruite per rilevarli.
A ben vedere, queste due fasi della ricerca sono caratterizzate da
due processi ben diversi tra loro. Si può innanzi tutto immaginare
la ricerca come un processo di riduzione della realtà, che passa attraverso le fasi seguenti:
a) astrazione dalla realtà sociale (composta da infiniti fenomeni
caratterizzati da mille aspetti) di alcuni elementi rilevanti per
l’oggetto della ricerca sui quali verrà condotta l’indagine empirica (a fini descrittivi o interpretativi/valutativi);
199
b) precisazione dei concetti rilevanti per la ricerca e loro traduzione in variabili o indicatori (qui l’ulteriore riduzione deriva
dal fatto che quasi mai gli indicatori colgono per intero
l’estensione dei concetti);
c) misurazione delle variabili (in questo caso si ha un’ulteriore
riduzione della realtà dovuta al fatto che vengono ‘forzati’ nelle classificazioni utilizzate aspetti molto più articolati e complessi di quelli riferibili alle classificazioni stesse);
d) elaborazione dei dati (in questo caso una nuova riduzione deriva dall’utilizzo di statistiche che, sintetizzando in un indice o in
una distribuzione un numero elevato di informazioni elementari, mettono in forte evidenza un aspetto a scapito di altri).
Anche in questo caso un esempio può essere d’aiuto. In
un’indagine sui giovani riduco in primo luogo il loro mondo vitale
a quei concetti che altre ricerche o teorie sociologiche hanno definito come rilevanti. Ad esempio, decido di misurare, tra i vari aspetti, il rendimento scolastico e lo status familiare. Per inciso, la
scelta di operare su di un campione comporta un’ulteriore riduzione, in questo caso del campo di indagine e non del tema oggetto
della ricerca. In secondo luogo, per tradurre questi concetti in domande sul questionario, debbo ridurre ulteriormente i concetti alle
loro componenti misurabili. Decido ad esempio di misurare il rendimento scolastico in base alle bocciature subite (escludendo così
altri aspetti, quali i voti conseguiti, l’apprendimento non registrato
dalle votazioni, ecc.). In terzo luogo, costruisco categorie che riducono ulteriormente le differenze; magari aggregando il numero di
bocciature a prescindere dall’anno in cui si sono verificate o dalla
loro sequenza. Infine, in sede di elaborazione mi posso limitare a
indici, come la media, che al vantaggio di sintetizzare in un solo
numero una distribuzione di migliaia di casi, unisce tuttavia il
grosso limite di ‘appiattire’ le differenze interne. Ad esempio, una
media di una bocciatura per studente può derivare sia da
un’equidistribuzione del fenomeno (tutti i rispondenti hanno subito
una ed una sola bocciatura), sia da una sua distribuzione polare (un
terzo ha conosciuto tre bocciature, due terzi nessuna).
Come si vede dall’esempio, i mille aspetti rilevanti della condizione giovanile sono stati via via ridotti fino ad essere espressi in un
numero (la media delle bocciature). Anche se si tratta di un caso
estremo, l’esempio illustra come la conoscenza scientifica derivi
da un processo continuo di semplificazione o astrazione dalla realtà sociale: si tratta del prezzo da pagare per conseguire una conoscenza più puntuale di quella propria di ogni membro competente
200
della società, ovvero della cosiddetta conoscenza del senso comune.
Ovviamente non ci sono tuttavia solo prezzi da pagare, ma anche
vantaggi. Il più evidente deriva dalla possibilità di fornire una descrizione puntuale di fenomeni che a livello di senso comune sono
conosciuti solo in modo approssimato se non errato. Ma un secondo importante vantaggio deriva dalla possibilità di misurare con
precisione relazioni tra variabili che a livello di senso comune possono essere solo ipotizzate: un conto è dire che una famiglia di alto
status sociale aiuta nella riuscita scolastica, un altro è poter misurare l’intensità di questa relazione, ovvero trasformarla in un percorso causale.
Qui emerge il secondo processo, opposto al primo, che caratterizza
la ricerca: quello che consente di scoprire qualcosa di nuovo grazie
ai dati rilevati e alle elaborazioni effettuate. Sotto questo aspetto, il
ricercatore deve anche sapersi fare ‘trovatore’, ossia essere disposto a riconoscere nessi causali o relazioni rilevanti che non era stato capace di ipotizzare fin dall’inizio della ricerca.
In termini generali, in una ricerca descrittiva, l’elaborazione consisterà principalmente in una restituzione dei dati in forma grafica o
di tabella, tale da evidenziare la distribuzione delle diverse caratteristiche del campione (o dell’universo) in ragione delle varie proprietà considerate rilevanti. Nel caso di una ricerca esplicativa, i
dati verranno organizzati in modo da consentire il controllo delle
ipotesi. Si è detto peraltro che la distinzione è relativa, in quanto
nelle ricerche descrittive si tende comunque a mettere in rilievo
alcune relazioni significative tra variabili, o elaborando tabelle a
doppia entrata, oppure ricorrendo a procedimenti statistici più sofisticati, mentre ogni ricerca esplicativa contiene comunque una più
o meno ampia parte descrittiva.
La diffusione dell’impiego del computer nella ricerca sociale finisce anzi per sollecitare il ricercatore ad applicare modelli di elaborazione sempre più sofisticati ai dati raccolti. In taluni casi si assiste addirittura a strategie di ricerca al cui interno si cerca di identificare l’esistenza di qualunque relazione fra qualunque coppia di
variabili, proponendosi poi l’obiettivo di ‘spiegare’ le relazioni più
rilevanti riscontrate (cfr., per una critica, Marradi 1980).
In coerenza con il carattere di circolarità del processo di ricerca più
volte citato, è sicuramente necessario mantenere la disponibilità
alla revisione delle ipotesi iniziali alla luce dei risultati delle elaborazioni effettuate. Ma nessuna elaborazione ha realmente un senso,
se non è sorretta da una riflessione sociologicamente fondata che
sappia leggere ogni relazione individuata in termini di connessioni
201
di senso al livello degli attori sociali e di riferimento a teorie sociologiche più generali. Weber affermò del resto che
se manca l’adeguazione di senso... ha luogo soltanto la probabilità
statistica non intelligibile, o intelligibile solo in maniera imperfetta.
(...) Solamente le uniformità statistiche che corrispondono al senso intelligibile di un agire sociale, costituiscono tipi di azione intelligibili...
e quindi ‘regole sociologiche’” (1974, I, 11, corsivo nel testo).
Inoltre, qualunque persona di buon senso è in grado di proporre
una spiegazione plausibile per ogni relazione rilevata. Il sociologo
deve saper andare al di là della plausibilità, formulando le proprie
ipotesi in modo tale da poterle confermare o smentire con i dati di
ricerca e non solo con un cocktail casereccio di teorie, evidenze
empiriche e buon senso.
Proprio i nessi che legano le conoscenze acquisite mediante la ricerca empirica a modelli interpretativi di più ampia portata rendono la ricerca sul campo una fonte di continuo ripensamento, revisione e progresso della teoria. Se un’analisi condotta sui giovani
presuppone una serie di modelli, teorie ed ipotesi generali sulla
struttura delle società, sui processi di socializzazione, sui percorsi
di trasmissione culturale, i suoi risultati costringono quasi sempre
a perfezionare o ripensare tali modelli e teorie, in un processo senza fine di approfondimento della conoscenza della realtà sociale.
Anche l’impiego pratico della ricerca è impossibile senza adeguati
riferimenti al livello teorico: è impossibile condurre una buona ricerca valutativa senza disporre di un modello di funzionamento
della realtà sociale sul quale il pianificatore compie simulazioni
(ex ante) o costruisce percorsi causali (ex post) che gli permettano
di organizzare in modo efficace gli interventi o valutarne gli esiti.
In linea generale, l’elaborazione dei dati serve dunque sia per descrivere in modo più compatto e sintetico i dati raccolti, anche a
fini comparativi, sia per ricercare relazioni tra variabili. Al di là
delle competenze specifiche possedute dal ricercatore, è bene ricordare che ogni statistica risponde ad un interrogativo e mette in
luce alcuni aspetti a scapito di altri. Quindi va utilizzata nella consapevolezza dei suoi limiti e delle sue potenzialità. Inoltre, anche
l’utilizzo di grafici e tabelle per presentare i dati deve essere coerente con l’intendimento illustrativo del ricercatore. I dati non parlano da soli, e neppure si presentano da soli. Ogni elaborazione
corrisponde ad una scelta e come tale va meditata e motivata (Per
un approfondimento si rinvia ad un buon manuale di statistica, ad
es., Mood - Graybill - Boes 1984). Per inciso, va segnalato che in
202
Italia manca una tradizione di testi di statistica per la ricerca sociale (quali ad es. il ‘vecchio’ Blalock jr. 1969), mentre i principali
manuali in uso dedicano un’attenzione spesso scarsa
all’elaborazione dei dati. Va tuttavia segnalata la pubblicazione,
iniziata nel 1993, della collana Metodologia delle scienze umane,
per i tipi di Angeli, curata dalla Sezione Metodologia dell’AIS e
diretta da Alberto Marradi. Tra i volumi pubblicati segnaliamo, in
quanto pertinenti all’argomento, Biorcio (1993); Itzcovich (1993);
Marradi (1993); Ricolfi (1993); Micheli e Manfredi (1995). Gli
utenti di SPSS possono inoltre avvalersi dell’ultima versione del
manuale, che richiede comunque di essere integrata con ulteriori
letture).
In tema di elaborazione dei dati le principali distinzioni corrono tra
variabili qualitative e quantitative e tra elaborazioni riferite a una,
due o più variabili. Ci avvaliamo di quest’ultima strategia espositiva, essendo la più diffusa, facendo riferimento al tipo di variabili
all’interno di ogni paragrafo.
8.2 L’ANALISI MONOVARIATA
Richiamiamo brevemente, per chiarezza, la matrice dei dati (già
vista al §. 1.1), che costituisce il punto di partenza di ogni elaborazione: sappiamo che essa è costituita da un numero di colonne corrispondente al numero di variabili utilizzato e da tante righe quanti
sono i casi rilevati. La prima e più semplice consiste nel conteggio,
per ogni variabile, di quanti casi sono stati rilevati per ogni classe
in cui la variabile stessa è stata articolata.
Occorre infatti ricordare che ogni variabile (qualitativa o quantitativa che sia) è costituita da due elementi: il primo è rappresentato
dalle classi in cui è articolata la proprietà o il fenomeno che è stato
rilevato (colore degli occhi, anno di nascita, classe di reddito,
ecc.); il secondo elemento corrisponde invece al numero di casi
che rientrano in una delle classi costruite in sede di rilevazione (o,
in taluni casi, aggregate in sede di codifica dei dati). Su questa base si fonda ogni elaborazione statistica (o presentazione in forma
tabellare o grafica) dei dati. Se ad esempio in un questionario rivolto a 1.000 studenti è stato chiesto quanti sono stati promossi,
rimandati o bocciati nell’anno precedente, la variabile così costruita risulta la seguente:
Tab. 1 Distribuzione degli studenti secondo l’esito degli scrutini*
Modalità
promossi
rimandati
bocciati
totale
203
Numero casi 750
150
100
1.000
Frequenze
75%
15%
10%
100%
* Si noti che il titolo della tabella evidenzia innanzi tutto chi sono
i soggetti dei quali viene rilevata una proprietà (gli studenti) e, in subordine, la proprietà di cui viene riportata la distribuzione.
Nella sua forma standard la variabile è composta dalle prime due
righe. La terza costituisce un’elaborazione della seconda, e viene
ottenuta dividendo la numerosità di ogni singola cella per il totale
e moltiplicando per 100 il risultato. L’elaborazione di percentuali è
sempre possibile, indipendentemente dalla forma, alfabetica o numerica, in cui sono espresse le modalità della variabile, in quanto
le operazioni aritmetiche vengono svolte solo sul numero di casi.
Abbiamo introdotto subito le percentuali perché rappresentano un
mezzo molto efficace per comparare diverse distribuzioni della
stessa variabile. Prendiamo ad esempio tre diverse scuole, in cui è
stata rilevata la distribuzione riportata nella Tab. 2: dalla lettura
dei valori assoluti non è di immediata evidenza quale sia la scuola
con la maggior incidenza di promossi, di rimandati o di bocciati.
Tab. 2 Distribuzione degli studenti delle scuole A, B, C secondo
l’esito degli scrutini
Modalità
promossi
rimandati
bocciati
totale
Scuola A
750
150
100
1.000
Scuola B
600
117
92
829
Scuola C
847
141
126
1.114
Le comparazioni sono invece immediatamente effettuabili se i dati
vengono percentualizzati, come in Tab 3.
Tab. 3 Distribuzione percentuale degli studenti delle scuole A, B,
C secondo l’esito degli scrutini
Modalità
promossi
rimandati
bocciati
totale
Scuola A
75,0
15,0
10,0
100,0
Scuola B
72,4
16,5
11,1
100,0
Scuola C
76,0
12,7
11,3
100,0
Anche un esame frettoloso della Tab. 3 consente di vedere che la
più alta percentuale di promossi è stata registrata nella Scuola C e
la più bassa nella B, e di procedere in modo analogo per un confronto delle altre due modalità. Si noti che nella Tab. 3 la percentuale è stata calcolata fino al primo decimale. La scelta del numero
ottimale di decimali dipende dal numero di modalità della variabile
204
e, soprattutto, dal numero di casi. Se la base di calcolo è molto
ampia può avere un senso scendere a due decimali, soprattutto se
anche le modalità sono numerose, in quanto scostamenti anche
modesti nei valori percentuali possono corrispondere a differenze
consistenti in valore assoluto (ad es., una differenza di 0,1% corrisponde, in un campione di mille unità, a un individuo; in un universo di 10 milioni di unità a ben 10.000 soggetti); di contro, se la
base di calcolo è modesta (ad es., 200 unità) e ridotto il numero di
modalità (al limite, ‘si’ e ‘no’) può essere opportuno evitare i decimali. Va da sé che, quale che sia il numero di decimali utilizzato,
è quasi sempre indispensabile ‘arrotondare’ le cifre, in modo che la
loro somma corrisponda al totale (100). Si usa arrotondare al valore superiore quando il primo decimale successivo a quello che verrà indicato in tabella è superiore o uguale a 5 ed evitare
l’arrotondamento quando è inferiore a 5. Ad esempio, 7,5723 diventa 7,6, mentre 7,5486 rimane 7,5. Nei non infrequenti casi in
cui anche usando l’arrotondamento si ottiene come somma il poco
gradevole valore di 100,1 o di 99,9 è bene evitare
l’arrotondamento del più basso tra i valori con scarto superiore a 5
e, nel caso opposto, arrotondare al decimale superiore il più elevato dei valori tra quelli con scarto inferiore a 5. Nella Tab. 4 è riportato un esempio.
Tab. 4 Esempio di arrotondamenti di percentuali
Modalità
promossi rimanda- bocciati
ti
Numero casi
753
150
100
Freq. a 5 decimali
75,07477 14,95513 9,97008
Arrotondamento
75,1
15,0
10,0
Arrotond. corretto
75,1
14,9
10,0
Numero casi
747
150
100
Freq. a 5 decimali
74,92477 15,04513 10,03009
Arrotondamento
74,9
15,0
10,0
Arrotond. corretto
74,9
15,1
10,0
totale
1.003
99,99998
100,1
100,0
997
99,99999
99,9
100,0
La distribuzione percentuale dei casi consente anche, se la variabile è espressa almeno su di una scala ordinale, di calcolare le cosiddette frequenze cumulate. Una volta prescelto un ordine di organizzazione delle categorie (nell’esempio fin qui utilizzato, il grado
decrescente di successo scolastico, secondo il quale la modalità
‘rimandato’ sta prima di ‘bocciato’ ma dopo ‘promosso’), si riporta per ognuna di queste la somma delle percentuali relative alle
modalità maggiori o uguali. Un esempio è riportato nella tab. 5,
205
che riprende i dati di Tab. 3 al fine di evidenziare l’utilità comparativa delle frequenze cumulate.
Tab. 5 Distribuzione degli studenti delle scuole A, B, C secondo le
frequenze cumulate dell’esito degli scrutini
Modalità
promossi
rimandati
bocciati
Scuola A
75,0
90,0
100,0
Scuola B
72,4
88,9
100,0
Scuola C
76,0
88,7
100,0
Si noti che nella tabella non viene riportata la colonna del totale
perché questa costituirebbe una duplicazione dell’ultima modalità,
che già contiene la somma di tutte le modalità precedenti più quella propria della colonna. Mentre nella Tab. 3 si notava che la Scuola C era caratterizzata dalla più elevata percentuale sia di promossi
che di bocciati, dalla Tab. 5 emerge che la Scuola C è quella caratterizzata dal più basso tasso di successo, se si considerano unitamente le due modalità ‘promossi o rimandati’.
Naturalmente ognuna delle tabelle riportate come esempio è suscettibile di essere tradotta in un grafico. Le rappresentazioni grafiche possibili sono assai numerose; ciascuna evidenzia alcuni aspetti mettendone in ombra altri. Data l’efficacia e l’immediatezza
della comunicazione iconica è consigliabile scegliere attentamente
il tipo di rappresentazione che meglio si adatta al messaggio che si
intende trasmettere o all’aspetto che si vuole evidenziare.
Per brevità consideriamo qui solo il caso degli istogrammi, ossia i
rettangoli costruiti su di un piano cartesiano in cui di norma si riportano sull’asse X le modalità e sull’asse Y le frequenze (o il numero assoluto di casi). È bene ricordare tuttavia che i grafici, essendo caratterizzati dalla continuità dei valori disposti sugli assi,
dovrebbero essere correttamente utilizzati solo per rappresentare
distribuzioni di variabili misurate su scale metriche. Per un esempio si vedano i tre grafici sotto riportati, relativi l’uno alla distribuzione per sesso, l’altra per esito scolastico, l’altra ancora per età di
un ipotetico campione di 1.000 persone.
In effetti, il primo grafico è scorretto in quanto suggerisce un ordine tra i due caratteri che non è ipotizzabile per una variabile nominale, mentre il secondo suggerisce l’equidistanza fra le tre modalità che non può essere postulata per una variabile ordinale. Entrambi riportano poi una base sull’asse X relativa alle modalità (maschi/femmine; promossi/rimandati/bocciati), mentre non è possibile ipotizzarne alcuna (la modalità dovrebbe essere indicata da un
punto e l’istogramma ridursi a un segmento). Perfino il terzo grafi-
206
co, in cui è corretto l’ordine crescente delle tre classi, è in realtà
sbagliato per due ragioni: in primo luogo perché assegna uguale
estensione alle tre classi, mentre la prima ha un’origine indefinita,
fissabile arbitrariamente a 6 anni, e quindi un’estensione di 10 anni
(dall’età scolare a 15 anni) e la terza un termine indefinito (di fatto
l’età dello studente più anziano del campione); in secondo luogo
perché posiziona arbitrariamente i punti di origine e termine delle
classi, con una soluzione di continuità tra ‘15’ e ‘>15’ e tra ‘20’ e
‘>20’ che non esiste in realtà (la distanza è infinitesima).
Grafico 1 - Esempio di distribuzione di una popolazione per tre
diversi caratteri
Di contro, l’impiego rigoroso delle rappresentazioni grafiche deve
obbedire a requisiti specifici. Nel caso in esame, degli istogrammi
di frequenza, vanno rispettate le condizioni secondo le quali le aree
dei singoli rettangoli sono proporzionali alla frequenza e le basi
sono proporzionali all’estensione delle singole classi (calcolabile
solo per variabili metriche).
Come si è anticipato nell’introduzione non si danno solo rappresentazioni grafiche o tabellari delle variabili. Esiste un’ampia
gamma di statistiche utilizzabili nell’analisi monovariata (per una
trattazione esaustiva vedi Marradi 1993), al cui interno le più utilizzate sono, in sintesi, le seguenti:
a) moda: evidenzia la classe che è caratterizzata dal maggior numero di casi, ovvero “il valore o i valori che ricorrono più di frequente nella distribuzione” (Blalock jr. 1969, 105). Nella variabile
di Tab. 3, ad esempio, la moda è costituita dalla modalità ‘promosso’ in tutte e tre le scuole considerate. Come si evince
dall’esempio, può essere calcolata anche per le variabili nominali,
in quanto chiama in causa solo le frequenze e non le categorie in
cui si articola la variabile. Ovviamente, una distribuzione può ave-
207
re più d’una moda se più d’una modalità presenta un massimo relativo di casi (ad esempio: promossi 500, rimandati 500, bocciati
200 è una distribuzione detta bimodale, in quanto presenta due
mode in corrispondenza delle modalità ‘promosso’ e ‘rimandato’);
b) mediana: è il valore assunto dal caso che sta a metà di una distribuzione ordinata (non importa se in senso crescente o decrescente). La mediana può dunque essere calcolata anche per variabili misurate su scale ordinali, attraverso la distribuzione delle frequenze cumulate (in tal caso la modalità mediana è la prima che
supera il 50% dei casi delle frequenze cumulate);
c) decili, quartili, percentili: in una distribuzione ordinata, sono i
valori assunti dal caso che ha sotto di sé il dieci, il venticinque o
l’un per cento degli altri casi. Sono utilizzati quando si intende sottolineare quale parte della distribuzione sia al di sotto o al di sopra
di certi valori di soglia. Affermare ad esempio che il primo decile
della distribuzione del reddito degli italiani ha un valore di
800.000 lire al mese significa affermare che il 10% degli italiani
ha un reddito inferiore o uguale a questa cifra. Dalla distribuzione
di frequenza deriva la distribuzione delle frequenze cumulate, possibile solo per variabili ordinali o metriche, che consente di calcolare il coefficiente di concentrazione (una statistica che ha senso se
si è in presenza di una proprietà redistribuibile);
d) media aritmetica: è data dalla somma dei valori registrati da ogni caso fratto il numero totale dei casi. Poiché richiede
un’operazione di somma delle modalità in cui è articolata una variabile, è consentita solo per quelle misurate su scale a intervalli o
di rapporti. A partire dal noto aforisma di Trilussa, la media è una
delle statistiche più usate e criticate. In questa sede basta ricordare
che rappresenta un valore di sintesi di un’intera distribuzione, ed è
quindi utile a fini comparativi a condizione che le distribuzioni
stesse non siano troppo disomogenee. Ad esempio, calcolare l’età
media dei residenti nelle regioni italiane è utile per confrontarne in
modo sintetico la distribuzione per età in quanto non ci sono ragioni per pensare che le distribuzioni siano troppo diverse al loro
interno.
Va ricordato che esistono altre medie, dalle formule più complesse
(media geometrica, media armonica, in generale medie di potenza)
che sono tuttavia in casi particolari assai più utili della media aritmetica per sintetizzare in un indice statistico una distribuzione;
e) scarto quadratico medio: viene utilizzato per rappresentare con
un solo indice numerico la variabilità di una distribuzione, ossia il
grado di dispersione attorno alla media dei diversi valori. Può essere calcolato solo per variabili misurate su scale a intervalli o di
208
rapporti, in quanto chiama in causa nella formula anche le categorie in cui una variabile è articolata. È costituito dalla radice quadrata della somma dei quadrati degli scarti dalla media fratto il
numero totale dei casi, ovvero “dalla radice quadrata della media
aritmetica dei quadrati degli scarti dei valori dalla media” (Blalock
jr 1969, 116). Spesso usato come ‘correttivo’ della media, consente di capire quanto quest’ultima rappresenti bene la distribuzione.
Se infatti i valori sono distribuiti in un’area molto ridotta attorno
alla media lo scarto quadratico assume un valore molto basso,
mentre sale rapidamente se i valori sono distribuiti su un’area più
vasta. Elevato al quadrato assume il nome di varianza. Una prima,
grezza misura della dispersione è consentita già dall’esame del
campo di variazione (differenza tra il valore più elevato e quelle
più basso assunto dalla variabile) e dalla differenza interquartile
(differenza tra i valori posti al 25° e al 75° percentile di una distribuzione ordinata);
f) coefficiente di variabilità: è dato dal rapporto tra scarto quadratico medio e media. Molto usato a scopo comparativo, in quanto
anche lo scarto quadratico medio è influenzato dal valore della
media, mentre tale influenza viene depurata da questo procedimento;
g) indici di asimmetria o di curtosi: consentono di evidenziare, sintetizzandolo in un indice numerico, il grado di scostamento della
distribuzione dalla cosiddetta ‘normale’ o gaussiana, che costituisce una distribuzione di riferimento (La curva normale è caratterizzata dalla simmetricità della distribuzione rispetto alla media,
che coincide con la mediana e la moda).
Le statistiche relative ad una variabile sono anche usualmente distinte in misure della tendenza centrale o indici di posizione (moda, mediana, media), della dispersione (scarto quadratico medio,
varianza), della forma della distribuzione (indici di asimmetria e di
curtosi).
A scopo esemplificativo riportiamo una serie di statistiche relative
alla distribuzione di una variabile in tre ipotetici campioni, riportati in Tab. 6. Nella Tabella, per motivi di semplicità, si utilizza una
distribuzione per classi chiuse, ovvero caratterizzate tutte da un
valore iniziale e finale predefinito. Di norma nella distribuzione
del reddito si utilizza invece una classe finale ‘aperta’
(nell’esempio, oltre 7 milioni), che tuttavia comporta problemi nel
calcolo della media e delle statistiche a questa collegate.
Tab. 6 Distribuzione del reddito mensile in quattro popolazioni.
Valori in milioni di lire
209
Popol. A
Popol. B
Popol. C
Popol. D
0-1
20,0
25,0
45,0
5,0
>1-2
35,0
20,0
4,0
10,0
>2-4
20,0
25,0
2,0
70,0
>4-7
15,0
15,0
4,0
10,0
>7-10
10,0
10,0
45,0
5,0
Totale
100,0
100,0
100,0
100,0
Le principali statistiche proprie di ognuna delle quattro popolazioni sono le seguenti
Moda
Popol. A
Popol. B
Popol. C
Popol. D
classe
>1-2
classi
0-1 e >2-4
classi 0-1
e >7-10
classe
>2-4
Mediana
Media
1,857143
Sc. quadr. Coeff. var.
medio
2,9
2,44949 0,844652
2,4
2,85
2,44875
0,85921
3
3
4,094509 1,364836
3
3
1,635543 0,545181
Si nota agevolmente che media e mediana sono uguali nella terza e
quarta distribuzione, che sono state volutamente costruite in modo
simmetrico, ossia con uguale andamento ai due lati della media,
non ostante raffigurino due situazioni opposte: la C di grossa dispersione e la D di forte concentrazione dei casi attorno alla media.
Lo scarto quadratico medio è infatti più basso nella popolazione D,
per la quale la media costituisce un indice statistico un po’ più attendibile che negli altri tre casi. Soprattutto nella popolazione C,
che presenta infatti lo scarto quadratico medio più alto, la media
rappresenta molto male la distribuzione, dal momento che solo il
2% della popolazione fa parte della classe che comprende la media. Solo la moda fa capire che la popolazione C presenta una distribuzione di tipo polare, è caratterizzata cioè da un consistente
numero di individui a basso reddito ed uno altrettanto elevato ad
alto reddito. In tutti i casi si coglie solo grazie allo scarto quadratico medio e al coefficiente di variazione la disuguaglianza nella distribuzione del reddito, soprattutto a fronte della popolazione D.
Utile nelle due distribuzioni non simmetriche (la A e la B) il confronto tra mediana e media, dal quale si legge che nella popolazione A la media rappresenta la distribuzione meno bene che nella B,
dal momento che la distanza tra media e mediana è in un caso di
oltre un milione, nell’altro di meno della metà.
210
Esula dagli scopi di questo libro illustrare nel dettaglio la differenza di calcolo delle diverse statistiche nel caso di una distribuzione
di dati grezzi rispetto ad una con i dati raggruppati in classi. Basti
qui dire che in quest’ultima si ipotizza l’equidistribuzione dei casi
entro la classe. Se ad es. la classe di reddito ‘>1 milione fino a 2
milioni’ contiene 11 casi, si ipotizza che il primo sia posto a
1.000.001; il secondo a 1.100.000; il terzo a 1.200.000 e così via
fino a 2.000.000. Assumendo questa ipotesi, la media di ogni distribuzione interna a una classe è, per definizione, uguale al valore
centrale della classe stessa, che ne costituisce la media e la mediana. Nei calcoli ci si regola quindi come se tutti i casi fossero concentrati nel punto medio della classe. Questa convenzione può essere fonte di distorsioni, quando accade che i valori reali siano distribuiti in modo diverso entro la classe. Se ad es. degli undici casi
dell’esempio precedente sei assumessero il valore di 1,2 milioni e
cinque di 1,5, la media reale della classe non sarebbe 1,5 milioni,
bensì (1,2*6 + 1,5*5)/11 = (7,2 + 7,5)/11 = 14,7/11 = 1,34 milioni.
Si nota per inciso che questa possibilità di distorsione sta alla base
delle scelte del ricercatore di raccogliere, per certi fenomeni, dati
puntuali piuttosto che aggregati. Ad esempio, di chiedere in un
questionario di indicare l’età piuttosto che di barrare una casella in
corrispondenza di una classe d’età. È infatti sempre possibile aggregare successivamente in classi i dati, soprattutto per la loro restituzione in forma di tabella, mentre non si può risalire ai dati
puntuali se questi sono rilevati in forma aggregata.
Le elaborazioni presentate, e altre che esulano dalle finalità di questo testo, rientrano nella cosiddetta statistica descrittiva, che mira a
rappresentare in modo sintetico, attraverso indici numerici, la distribuzione di una variabile. Una crescente diffusione sta avendo
tuttavia la cosiddetta statistica esplorativa, che consente di selezionare le parti della distribuzione che meglio si prestano alla più
puntuale definizione del fenomeno. Ad esempio, una distribuzione
caratterizzata da alcuni casi limite (nel caso di un questionario potrebbero corrispondere anche ad errori di codifica) potrebbe generare indici statistici poco affidabili. Si pensi ad esempio ad una
comunità di poveri al cui interno vengano registrati due miliardari:
la media e lo scarto quadratico medio schizzerebbero verso l’alto,
mentre basterebbe escludere i due nababbi dalla distribuzione per
ottenere delle statistiche assai affidabili. Senza procedere oltre
nell’esempio, occorre dire che, grazie anche alla diffusione di programmi quali l’SPSS e il SAS, è possibile con poca fatica ‘interrogare’ i dati in modo ben più approfondito che in passato. Corrispondentemente, cresce tuttavia la necessità di inserire nel baga-
211
glio culturale di ogni ricercatore una robusta dose di statistica, se
non si vuole rischiare di porre ai dati meno domande di quelle a
cui potrebbero rispondere (o, peggio, di far porre dal computer
domande sbagliate ovvero di ottenere risposte inutili o incomprensibili).
Nello schema che segue si riportano le statistiche di uso corrente
consentite a seconda del tipo di variabile, o meglio del tipo di scala
su cui essa è misurata.
Tipo di statistica
Moda
Mediana
Freq. accumulate e indice di concentrazione
Campo di variazione, differenza interquartile
Media
Scarto quadratico medio e varianza
Indici di asimmetria e di curtosi
Tipi di variabili cui è
applicabile
Tutte
Ordinali o metriche
Ordinali o metriche
Metriche
Metriche
Metriche
Metriche
Per concludere, una breve riflessione sull’utilizzo delle analisi monovariate. In generale, la distribuzione di una variabile secondo le
diverse modalità assume un interesse modesto, se non viene impiegata all’interno di una comparazione, nel tempo o nello spazio.
Sapere che il 21,2% dei residenti a Genova, alla data del Censimento 1991, ha 65 anni o più è ben poco significativo, se non si
compara questo dato a quello relativo ad altre grandi città o alla
regione nel suo complesso, ovvero al valore che ha assunto a Genova nei Censimenti precedenti.
La comparazione nello spazio avviene di solito costruendo tabelle
a doppia entrata in cui si pongono in riga i singoli casi (ad esempio
le diverse città che si intende comparare) e in colonna le diverse
modalità della variabile (nell’esempio, i residenti per classi di età).
Va da sé che una percentualizzazione dei dati ‘in orizzontale’ (cioè
fatto uguale a 100 il totale di riga) consente una comparazione
immediata.
Un poco più complessa la comparazione nel tempo. Il modo più
semplice di realizzarla è quello di calcolare le variazioni, assolute
e percentuali. Le prime si ottengono come differenza tra il valore a
fine periodo e quello a inizio periodo, le seconde come quoziente
(per cento) tra la differenza assoluta e il valore di inizio periodo.
Se tuttavia si dispone di una serie storica di dati è più agevole utilizzare i numeri indice. In questo caso si pone pari a cento il valore
di un anno (di solito quello di inizio periodo, ma si può scegliere
212
un anno diverso, ad esempio quello in cui è stato registrato il valore massimo o minimo della serie) e si indica per ogni anno il quoziente (per cento) ottenuto dividendo il valore assoluto dell’anno
per quello dell’anno assunto come base di calcolo. In questo modo
si può evidenziare l’andamento nel tempo di serie storiche che risulterebbero illeggibili se si riportassero le sole variazioni percentuali tra un anno e l’altro. Per inciso, il rapporto tra due numeri indice (meno 100) corrisponde alla variazione percentuale tra i due
anni cui si riferisce l’indice, mentre la differenza tra il numero indice di un anno e 100 corrisponde alla variazione percentuale tra
l’anno di riferimento e quello considerato. La tab. 7 fornisce un
esempio di quanto detto.
Tab 7 Serie temporale dei residenti a Genova alla data dei Censimenti e relative statistiche.
anni
1951
1961
1971
1981
1991
Residenti
688.447
Var. ass.*
var. %*
N. Indice**
100
784.194
816.872
762.895
678.771
95.747
32.678
-53.977
-84.124
13,91
4,17
-6,61
-11,03
113,91
118,65
110,81
98,59
* Le variazioni sono calcolate rispetto al dato censuario precedente
** I numeri indice sono calcolati assumendo come base il 1951
I due decimali consentono di evidenziare che ogni numero indice è
composto da 100 più la differenza percentuale tra l’anno di riferimento e quello cui si riferisce il numero indice. Con semplici calcoli il lettore potrà constatare che il rapporto (per cento) tra due
numeri indice è pari alla variazione percentuale del periodo meno
cento (ad es., il rapporto tra il numero indice del 1981 e quello del
1971 per cento è 93,39; sottraendo 100 da questo valore si ottiene
per l’appunto -6,61, variazione percentuale tra la popolazione dei
due anni in questione).
8.3 L’ANALISI BIVARIATA E MULTIVARIATA
Si è detto più volte che l’interesse del ricercatore è rivolto prevalentemente alla ricerca delle relazioni tra variabili, sia che queste
siano state ipotizzate fin dall’inizio della ricerca, sia che emergano
dall’analisi dei dati e richiedano pertanto una revisione o un arricchimento delle ipotesi iniziali.
213
Buona parte delle tecniche di elaborazione dei dati sono quindi rivolte all’esplorazione delle relazioni tra variabili, ovvero alla cosiddetta analisi bivariata o multivariata.
Vale la pena innanzi tutto di notare che l’esame delle relazioni tra
variabili fornisce informazioni assai più ricche della semplice analisi delle loro distribuzioni. Se ad esempio in una ricerca si registrasse, da un lato, che il 50% del campione è composto da ricchi,
l’altro 50% da poveri, e d’altro lato che il 50% è composto da appartenenti alla fede religiosa A, l’altro 50% da fedeli della religione B, l’aspetto più interessante sarebbe costituito non già dalle due
distribuzioni isolate, ma dalla relazione tra le due distribuzioni: se
tutti i poveri professassero la religione A, tutti i ricchi la B, saremmo in presenza di una società a forte discriminazione su base
religiosa. Del pari, se in una società scoprissimo che i figli riproducono lo status sociale dei padri parleremmo di società priva di
mobilità sociale. Nel converso, se la povertà fosse equidistribuita
rispetto alla religione, o lo status sociale dei figli non riproducesse
quello dei padri, riterremmo di essere in presenza di una società
non discriminatoria, quantomeno sotto questi due importanti punti
di vista.
In linea generale, per evidenziare l’esistenza di una relazione tra
due o più variabili occorre considerare la loro distribuzione congiunta (infatti in statistica si parla di variabilità a due o più dimensioni). Il modo più semplice per farlo è quello di costruire una tabella, detta a doppia entrata, che riproduca tale distribuzione. Si
tratta anche in questo caso di una matrice, diversa tuttavia dalla
matrice dei dati, dai quali peraltro discende. È infatti una matrice
‘variabile per variabile’, in quanto porta nella prima riga e nella
prima colonna (dette anche ‘tessuto metrico’) le modalità assunte
dalla variabile; nelle caselle che risultano dagli incroci delle diverse modalità (dette ‘tessuto connettivo’) il numero di casi che presentano congiuntamente gli stati sulle proprietà descritti
dall’intestazione di riga e di colonna; nell’ultima riga e colonna
(dette ‘marginali’) i totali dei casi che presentano una modalità
specifica della variabile di riga o di colonna. Per convenzione, si
pone usualmente nelle righe la variabile dipendente e nelle colonne
quella indipendente (anche se non sempre è possibile ipotizzare a
priori una relazione di dipendenza tra le due variabili).
L’esempio di Tab. 8 illustra quanto fin qui detto.
Tab. 8 Distribuzione di una popolazione campionaria adulta per
livello d’istruzione ed età*
214
età 18-30 anni 31-50 anni 51 e oltre
Totale
liv. istr.
Basso
45
75
175
295
Medio
131
231
143
505
Alto
107
70
23
200
Totale
283
376
341
1.000
* Si noti che nell’indicazione delle due variabili si pone al primo
posto quella riportata nelle righe e al secondo quella riportata nelle colonne.
La Tab. 8 rappresenta una matrice quadrata, in quanto il numero
delle righe è pari al numero delle colonne, o una matrice ‘3 x 3’ (si
contano, ovviamente, solo le modalità assunte dalle due variabili,
non le intestazioni di riga o colonna e i totali finali, ossia le righe o
colonne marginali). Si tratta altresì di una tabella in cui sicuramente una variabile è indipendente (l’età), mentre l’altra potrebbe essere dipendente (qualora si ipotizzasse, com’è plausibile, che la recente esplosione della scolarizzazione superiore abbia interessato
più i giovani che gli adulti, ormai usciti dal circuito scolastico).
Analogamente a quanto si è visto nell’analisi monovariata, i valori
assoluti non aiutano a capire se vi sia o no una relazione tra le due
variabili. In questo caso, tuttavia, abbiamo la scelta fra ben tre diverse modalità di costruire le percentuali, riportate nelle tabelle
seguenti.
Tab. 9 Distribuzione percentuale per livello d’istruzione secondo
l’età*
età 18-30 anni 31-50 anni 51 e oltre
Totale
liv. istr.
Basso
15,25
25,42
59,32
100,00
Medio
25,94
45,74
28,32
100,00
Alto
53,50
35,00
11,50
100,00
Totale
28,30
37,60
34,10
100,00
* Il titolo della tabella chiarisce che è l’età la variabile secondo la
quale viene effettuata la percentualizzazione di ogni singolo livello
d’istruzione
Le differenze tra le tabelle derivano dal fatto che rispondono a
domande differenti. La 9, infatti, consente di evidenziare se i tre
livelli d’istruzione siano differenziati rispetto alla distribuzione per
età, ovvero di rispondere alla domanda “qual è la composizione
per età di ogni gruppo di individui con pari titolo di studio?”. La
risposta è che esiste una composizione differenziata: infatti gli in-
215
dividui in possesso di elevato titolo di studio sono per oltre il 50%
giovani, non ostante questi rappresentino meno del 30% del campione; di contro, solo per l’11,5% sono anziani, benché gli anziani
abbiano un peso addirittura maggiore dei giovani sul totale generale. Una situazione quasi speculare si registra per gli individui con
basso livello d’istruzione.
Questo breve commento mostra che i dati sono stati analizzati mettendo a confronto i valori delle singole caselle con la media e tra di
loro, sottolineando gli scostamenti positivi o negativi più rilevanti.
Le conclusioni che trarremmo da questa modalità di percentualizzazione sono che l’età influenza il livello d’istruzione in modo abbastanza sensibile.
Nella tabella 10 leggiamo invece la distribuzione di ogni gruppo
d’età secondo il livello d’istruzione. In questo caso si ci si chiede
come sono distribuiti i diversi gruppi d’età rispetto all’istruzione e
si noterà che i giovani fanno registrare una consistente presenza di
livelli d’istruzione elevati e, soprattutto, che gli anziani sono caratterizzati da una notevole presenza di livelli d’istruzione bassi.
Tab. 10 Distribuzione percentuale per età secondo il livello
d’istruzione*
età 18-30 anni 31-50 anni 51 e oltre
Totale
liv. istr.
Basso
15,90
19,95
51,32
29,50
Medio
46,29
61,44
41,94
50,50
Alto
37,81
18,62
6,74
20,00
100,00
100,00
100,00
100,00
Totale
* Il titolo chiarisce che si tratta della situazione opposta rispetto
alla tabella precedente
Solo la Tab. 11 evidenzia tuttavia un addensamento di valori lungo
la diagonale secondaria della matrice, che conferma l’esistenza di
quella relazione di proporzionalità inversa che già avevamo ipotizzato analizzando le tabelle precedenti. In questo caso i valori di
ogni casella riproducono il ‘peso’ di ognuna di queste sul totale
generale, mentre le marginali indicano la quota di casi appartenenti
a quella modalità sul totale.
Tab. 11 Distribuzione percentuale per livello d’istruzione ed età
età 18-30 anni
31-50 anni
51 e oltre
Totale
liv. istr.
Basso
4,50
7,50
17,50
29,50
216
Medio
13,10
23,10
14,30
50,50
Alto
10,70
7,00
2,30
20,00
Totale
28,30
37,60
34,10
100,00
Alcune regole pratiche in tema di tabelle: qualora per brevità si
riportino solo le distribuzioni percentuali che si considerano importanti per la presentazione dei dati, non si mancherà di evidenziare, sotto il totale percentuale di 100 (che va sempre indicato, per
consentire di cogliere subito la direzione di calcolo delle percentuali), il numero totale dei casi di riga o di colonna. Inoltre, si eviterà di calcolare delle percentuali se i valori assoluti sono modesti:
su di un totale di 50 casi ha già poco senso elaborare le frequenze
relative, ma non ne ha alcuno elaborare le frequenze di una tabella
a doppia entrata, che presenterebbe sicuramente caselle vuote e
righe o colonne con meno di dieci casi!
Una corretta presentazione dei dati in forma tabellare richiede inoltre un titolo corretto ed esaustivo (nelle Tabb. 9, 10, 11, ad es., non
si dice di quali soggetti venga riportata la distribuzione), nonché
l’indicazione della fonte e degli anni cui si riferiscono i dati o la
rilevazione.
Molto utili sono piuttosto le rappresentazioni grafiche delle relazioni tra variabili. Una tra le più comuni, utilizzata soprattutto usando i valori ordinati secondo le due variabili, più raramente con i
dati accorpati in classi, è costituita dal cosiddetto scatter diagram,
che si ottiene disegnando un punto per ogni caso su un piano definito da due assi ortogonali che corrispondono alle due variabili. In
questo modo si nota agevolmente se esistono addensamenti dei casi in certe zone del piano, ovvero se i casi tendono a disporsi secondo una curva nota.
I due grafici che seguono riportano il diagramma di dispersione di
due distribuzioni di un ipotetico campione di adulti. Nella prima è
stata ipotizzata una perfetta relazione tra peso e statura (Grafico 2):
in questo caso tutti i valori sono distribuiti lungo una retta. Nel secondo caso (Grafico 3), pur rimanendo leggibile la relazione lineare tra le due variabili, si nota una certa dispersione rispetto alla retta del Grafico 2.
217
L’interesse del ricercatore di focalizza, ovviamente, sulla ricerca di
relazioni tra le due variabili. Ci si chiede, innanzi tutto, se esista
una qualche relazione; in caso affermativo, di che tipo sia e, infine,
quale sia la sua intensità.
Per rispondere a queste domande si è soliti confrontare la distribuzione in esame con due tipi di situazioni-limite, che possono essere
sempre costruite a partire da tale distribuzione.
Il primo caso-limite è costituito dall’assenza di qualsiasi tipo di
relazioni tra le due variabili. Questa situazione è nota in statistica
come ‘indipendenza stocastica’, e si verifica quando le frequenze
di ogni singola cella (calcolate in diagonale, ossia secondo le modalità di cui alla Tab. 11) sono uguali al prodotto delle frequenze
marginali. Si usa dire in questi casi che pij=pi*qj, dove pij è la frequenza di una casella all’incrocio tra la colonna i e la riga j, pi è la
frequenza di colonna e qj è la frequenza di riga. La Tab. 12 riproduce la situazione di indipendenza stocastica relativamente ai dati
di Tab. 8, a partire dai valori delle marginali ivi contenuti.
Tab. 12 Distribuzione di una popolazione campionaria adulta per
livello d’istruzione ed età in condizione di indipendenza stocastica
Valori assoluti*
età 18-30 anni 31-50 anni 51 e oltre
Totale
liv. istr.
Basso
83
111
101
295
Medio
143
190
172
505
57
75
68
200
283
376
341
1000
Alto
Totale
Valori percentuali
età 18-30 anni
31-50 anni
liv. istr.
218
51 e oltre
Totale
Basso
8,35
11,09
10,06
29,50
Medio
14,29
18,99
17,22
50,50
Alto
Totale
5,66
7,52
6,82
20,00
28,30
37,60
34,10
100,00
* I valori assoluti si ottengono moltiplicando i totali di riga e di
colonna e dividendo il prodotto per il numero totale dei casi; p.es.: 83
(casella 1.1) è = 295 x 283 ÷ 1.000
Il modo più semplice di misurare la distanza che intercorre tra la
situazione teorica di indipendenza stocastica e la distribuzione reale in esame è quello di calcolare le differenze che si registrano, cella per cella, tra le due distribuzioni. Tali differenze, ottenute sottraendo per ogni casella le frequenze osservate da quelle teoriche,
prendono il nome di contingenze; la loro formula è cij=pij-pi*qj.
La Tab. 13 riporta i valori delle contingenze sia in valore assoluto
che in percentuale, ottenute nel primo caso sottraendo ai valori della Tab. 8 quelli della prima parte della Tab. 12; nel secondo sottraendo ai valori della Tab. 11 quelli della seconda parte della Tab.
12. Si ricordi che gli indici di connessione utilizzano i valori assoluti o le frequenze pure, ossia non percentualizzate.
Tab. 13 Tabella delle contingenze
Valori assoluti
età 18-30 anni 31-50 anni 51 e oltre
Totale
liv. istr.
Basso
-38,49
-35,92
74,41
0,00
Medio
Alto
Totale
-11,91
41,12
-29,21
0,00
50,40
-5,20
-45,20
0,00
0,00
0,00
0,00
0,00
Valori percentuali
età 18-30 anni 31-50 anni 51 e oltre
Totale
liv. istr.
Basso
-3,85
-3,59
7,44
0,00
Medio
-1,19
4,11
-2,92
0,00
Alto
5,04
-0,52
-4,52
0,00
Totale
0,00
0,00
0,00
0,00
Si noti che i totali delle contingenze di riga e di colonna sono pari
a zero, dal momento che la tecnica di calcolo è tale da evidenziare
gli scostamenti interni alla riga o alla colonna registrati tra la di-
219
stribuzione osservata e quella teorica di riferimento. Di conseguenza gli indici statistici costruiti a partire da questa tabella, come
il chi quadro e altri che da questo derivano, utilizzano sempre i
quadrati delle contingenze.
Il chi quadro può assumere un valore minimo di zero, in condizione di identità tra distribuzione osservata e distribuzione teorica
(ossia quando esiste indipendenza stocastica tra le due variabili). Il
valore massimo è invece indeterminato, in quanto dipende dalla
numerosità dei casi contenuti nella tabella (per un approfondimento sul tema, si veda Bailey 1985, 473 e segg.).
Il vantaggio che presentano il chi quadro e gli indici statistici da
questo derivati consiste nel fatto che sono calcolabili per qualunque tipo di coppia di variabili, anche se nominali. Il chi quadro
nulla dice, tuttavia, sulla forma assunta dall’eventuale relazione
riscontrata.
Di contro, per valutare anche il tipo di legame tra due variabili è
necessario che queste siano quantomeno ordinali, meglio ancora
metriche. In questi casi si utilizzano altri casi-limite di riferimento.
Il più diffuso è quello della relazione perfetta tra due variabili. Il
caso più semplice di relazione perfetta tra variabili è dato da una
relazione lineare, che sta alla base del calcolo degli indici di correlazione e di regressione. Si tratta della situazione opposta a quella
presa a riferimento dal chi quadro: non più l’assenza di qualunque
relazione, ma la presenza di una specifica relazione. In questo caso
si assume che una variabile sia espressa da una funzione (lineare)
dell’altra. La Tab. 14 riproduce una matrice quadrata in cui si ha
perfetta relazione lineare positiva, ossia un rapporto di proporzionalità diretta tra le due variabili, mentre la 15 riproduce con gli
stessi dati una situazione di perfetta relazione negativa, ossia di
proporzionalità inversa.
Tab. 14 Esempio di relazione lineare positiva perfetta
età 18-30 anni 31-50 anni 51 e oltre
Totale
liv. istr.
Basso
300
0
0
300
Medio
0
400
0
400
Alto
0
0
300
300
300
400
300
1.000
Totale
Tab. 15 Esempio di relazione lineare negativa perfetta
età 18-30 anni 31-50 anni 51 e oltre
Totale
liv. istr.
220
Basso
0
0
300
300
Medio
0
400
0
400
Alto
300
0
0
300
Totale
300
400
300
1.000
Nelle Tabelle 14 e 15 si ha una corrispondenza biunivoca tra righe
e colonne: gli individui con livello d’istruzione basso sono tutti di
età superiore a 50 anni, quelli con livello alto al di sotto dei 31 anni, eccetera. Si noti che questa situazione è possibile, quando si
opera su dati aggregati, solo se vengono rispettate due condizioni:
la matrice è quadrata e le marginali di riga e colonna sono uguali a
due a due.
Nel caso della Tab. 14 i valori sono allineati lungo la diagonale
principale della matrice e, poiché entrambe le variabili sono articolate in classi ordinate in senso crescente, si ha una relazione lineare
positiva o proporzionalità diretta (ossia, al crescere dell’età cresce
anche il livello d’istruzione). Nella Tab. 15 si ha invece una relazione lineare negativa perfetta, ovvero una proporzionalità inversa,
in quanto al crescere dell’età decresce il titolo di studio.
Il lettore attento noterà che quando ci si discosta dalla situazione
tipo illustrata (matrici quadrate con corrispondenza tra le marginali) l’eventuale relazione tra variabili può essere messa in ombra.
Consideriamo ad esempio i dati di Tab. 16.
Tab. 16 Distribuzione di una popolazione campionaria per livello
d’istruzione ed età
età 18-24 25-30 31-40 45-50 51-60 61 e
Totale
liv. istr.
oltre
alfabeta
0
0
0
0
50
100
150
lic. elem.
0
0
0
0
100
50
150
med. inf
0
0
0
200
0
0
200
med. sup.
laurea
post lau.
Totale
0
0
200
0
0
0
200
150
50
0
0
0
0
200
0
100
0
0
0
0
100
150
150
200
200
150
150
1000
La Tabella contiene, con maggior dettaglio, gli stessi dati delle
Tabb. 14 e 15. Tuttavia, si nota innanzi tutto che non c’è corrispondenza biunivoca tra ogni riga e colonna: la classe di età 25-30
e le due finali presentano infatti due caselle piene e non una, e lo
stesso accade per le righe ‘alfabeta’, ‘lic. elem.’ e ‘laurea’. Pur
221
trattandosi degli stessi dati, quindi, non evidenzierebbero la stessa
relazione perfetta che emerge dalla Tab. 15 o dalla 14. Analogamente, se si decidesse di accorpare alla voce ‘livello d’istruzione
basso’ l’insieme dei soggetti compresi tra alfabeti e in possesso di
licenza media inferiore, lasciando nella categoria ‘medio’ il solo
diploma, si otterrebbe di nuovo una tabella da cui non emerge la
relazione perfetta evidenziata dalle Tabb. 14 e 15.
Senza procedere oltre nell’esempio, va quindi ribadito che la ricerca di relazioni tra variabili è influenzata anche dalle operazioni di
accorpamento delle classi in cui si articola una variabile, oltre che,
ovviamente, dalla sua struttura iniziale. Va tuttavia distinto il caso
in cui l’articolazione in classi è costitutiva della variabile, essendo
operata prima della rilevazione come prerequisito essenziale per
effettuarle (come accade, ad esempio, se si chiede di barrare una
casella in corrispondenza di un livello d’istruzione predefinito) da
quello in cui viene rilevato un dato più fine (ad es. il numero di
anni scolastici frequentati con successo o il reddito mensile in lire),
successivamente accorpato in classi. Le formule per il calcolo delle relazioni tra variabili operano infatti sia su dati aggregati in classi che su dati individuali: in questo secondo caso l’accorpamento
effettuato in sede di presentazione dei dati non influenza, ovviamente, il calcolo, effettuato sui dati rilevati e non su quelli accorpati successivamente.
La relazione lineare tra variabili è misurata dal coefficiente di correlazione lineare, il cui valore varia tra 1 (perfetta relazione positiva), 0 (assenza di relazione lineare), -1 (perfetta relazione negativa). Tuttavia l’assenza di relazione lineare non comporta, ovviamente, l’assenza di qualunque tipo di relazione. Nel mondo sociale
abbondano anzi i casi di relazioni curvilinee (si pensi ad esempio
alla soddisfazione per unità di prodotto: sale fino al livello di saturazione, dopo di che scende progressivamente; in questo caso potrebbe esistere una relazione parabolica perfetta, a fronte della quale la relazione lineare sarebbe ovviamente nulla). In altre parole,
poiché i dati rispondono alle nostre domande, dobbiamo avere
l’accortezza di porre quelle giuste (magari aiutati da una prima lettura del grafico di distribuzione dei casi, che già suggerisce la forma delle eventuali relazioni tra le variabili). Ciò significa, da un
lato, disporre di un set di ipotesi iniziali dalle quali far discendere
le elaborazioni cui sottoporre i dati; d’altro lato la capacità di passare dai risultati delle elaborazioni all’analisi dei dati e viceversa,
ossia di saper usare la statistica per interrogare i dati alla luce delle
conoscenze sostantive sul fenomeno che stiamo analizzando.
222
Le conoscenze sostantive sono fondamentali anche per un’altra
ragione, che qui citiamo solo brevemente: la statistica fornisce informazioni sulla relazione tra due variabili, non sulla direzione di
questa relazione. In altre parole, se si registra una correlazione perfetta tra livello d’istruzione e reddito, è in base a conoscenze sostantive che si definisce quale sia la variabile dipendente e quella
indipendente. In aggiunta, l’assegnazione preliminare del carattere
dipendente o indipendente a una variabile influenza anche il tipo di
elaborazione statistica da effettuare. Se è ipotizzata fin dall’inizio
una relazione di dipendenza, si utilizza la regressione; se si ipotizza l’interdipendenza, ci si avvale della correlazione. La formula di
calcolo del coefficiente di correlazione presuppone infatti che gli
scostamenti dal caso-limite ipotizzato (nella correlazione lineare,
una retta) siano attribuibili ad entrambe le variabili. Quella del coefficiente di regressione presuppone invece che solo la variabile
dipendente sia responsabile degli scostamenti (nella regressione
lineare, ancora una retta).
Il coefficiente di correlazione lineare merita tuttavia un ulteriore
cenno, in quanto costituisce la base di molte elaborazioni statistiche più complesse, che rientrano nell’analisi multivariata, quali
l’analisi dei fattori e l’analisi dei gruppi (cluster analysis; per una
trattazione approfondita si rinvia a Micheli - Manfredi 1995). il
suo calcolo presuppone la standardizzazione delle variabili di partenza, ossia un’operazione (consentita solo su variabili metriche)
in forza della quale ogni valore di una variabile viene trasformato
in un nuovo valore, dato dalla differenza tra il valore originario e
la media della distribuzione, diviso per lo scarto quadratico medio.
In questo modo si ottiene la cosiddetta ‘variabile standardizzata’,
costituita anche nei valori argomentali da numeri puri (in quanto
quoziente di grandezze dello stesso ordine e tipo). Questa operazione è fondamentale perché consente di ottenere una nuova distribuzione avente media zero e scarto quadratico medio uguale a uno.
Le due variabili così trasformate sono agevolmente rappresentabili
in uno spazio cartesiano in cui l’origine (zero) corrisponde alla
media delle due variabili e la posizione dei singoli punti è correttamente raffrontabile con le bisettrici del primo e terzo o secondo e
quarto quadrante, che identificano, rispettivamente, i casi di perfetta relazione positiva o negativa. Già l’esame del diagramma di dispersione di due variabili standardizzate consente di ipotizzare
l’esistenza di una relazione lineare o curvilinea e di capire quanto
un’eventuale curva nota (retta, parabola, iperbole, ecc.) interpolata
tra i diversi punti li rappresenti correttamente (detto anche grado di
fitness di una curva).
223
Si è fino a questo punto parlato di analisi statistica della relazione
tra due variabili senza distinguere tra una distribuzione campionaria e quella dell’intera popolazione; limitandoci cioè alla statistica
descrittiva senza chiamare in causa la statistica inferenziale. In realtà, poiché di solito si lavora su campioni, si pone innanzi tutto il
problema di stabilire quanto la relazione rilevata nel campione corrisponda ad un fenomeno proprio anche dell’universo, ovvero vada
attribuita all’errore di campionamento. Non a caso, ad esempio, il
chi quadro viene presentato dai manuali di statistica come un test,
per decidere tra queste due alternative.
La scelta viene effettuata ovviamente su basi probabilistiche, ossia
stabilendo un livello di probabilità al di sopra del quale si può ritenere che la relazione registrata non sia attribuibile ad errore di
campionamento. Solo successivamente si procede, ove possibile, a
misurare l’intensità e la forma di tale relazione.
Si è detto ‘ove possibile’, in quanto il tipo di elaborazioni cui sottoporre i dati dipende, anche nel caso dell’analisi bivariata, dal
modo in cui queste sono state misurate. Mentre le variabili metriche ammettono la quasi totalità delle elaborazioni possibili (fatta
salva la differenza, segnalata da Ricolfi 1995, tra scale assolute e
scale posizionali), quelle ordinali e, soprattutto, le nominali subiscono molte limitazioni. Modelli di elaborazione di crescente diffusione, come la già citata analyse des données e i modelli log lineari (cfr. Chiari e Peri 1987; Corbetta 1994), hanno peraltro arricchito in modo significativo le possibilità di lavoro del sociologo, le
cui variabili più significative sono spesso di carattere non metrico.
Un altro modo per superare le limitazioni che derivano
dall’impiego di variabili non metriche è quello di trasformarle in
una variabile dicotomica, assegnando i valori convenzionali di zero (assenza di proprietà) e uno (presenza della proprietà) alle due
categorie così ottenute. Nel caso del livello d’istruzione, sopra riportato, è possibile ‘dicotomizzare’ la variabile trasformandola in
vario modo. Ad esempio distinguendo tra ‘livello inferiore o pari
all’obbligo’ e ‘oltre l’obbligo’, oppure tra ‘alfabeti senza titolo di
studio’ e ‘in possesso di un titolo di studio’. Va da sé che queste
trasformazioni corrono spesso il rischio di deformare la distribuzione, rendendo in realtà invisibili relazioni che pure esistono, o
peggio di invalidare l’operazione di classificazione da cui la variabile dicotomica ha origine (cfr. Marradi 1987a). Se ad es. si dicotomizza tra ‘nessun titolo di studio’ (=alfabeti) e ‘con titolo di studio’ (=tutte le altre categorie), si assegna, di fatto, lo stesso peso al
possesso di una specializzazione post laurea e alla licenza elementare. È pur vero che, per prudenza, di solito si ripete l’operazione
224
per ogni categoria (considerando residuali tutte le altre), oppure si
cerca di effettuare accorpamenti sensati (ad esempio tra obbligo
scolastico e post obbligo), ma in tutti i casi i rischi di distorsione
sono consistenti.
Ci si è soffermati su questo esempio perché in sede di elaborazione
dei dati si pone, in modo rovesciato, un problema analogo a quello
segnalato da Ricolfi (1995) in ordine all’ispezionabilità della base
empirica. In altri termini, se in sede di elaborazione dei dati vengono compiute delle scelte non trasparenti per il lettore, i principi
della ripetibilità, pubblicità e controllabilità del processo di ricerca,
che sono costitutivi del suo carattere scientifico, vengono messi in
discussione altrettanto seriamente. È peraltro vero che la disponibilità dei dati elementari consentirebbe a qualunque ricercatore di
sottoporre gli stessi a procedure di elaborazione diverse, mentre la
ripetibilità è assai più difficile da realizzare in gran parte delle ricerche qualitative.
Senza alcuna pretesa di esaustività, ci limitiamo a ricordare nel seguito le principali tecniche statistiche utilizzate nell’analisi bivariata in ragione del tipo di variabile in esame.
Quando la variabile dipendente è di tipo qualitativo si utilizzano
tabelle di contingenza e misure derivate (come in Chi quadro), ivi
incluse le misure di associazione consentite da variabili ordinali;
l’analisi logistica; l’analisi delle corrispondenze.
Quando la variabile dipendente è di tipo quantitativo si ricorre:
• se l’indipendente è qualitativa all’analisi della varianza;
• se l’indipendente è quantitativa a correlazione e regressione;
• indipendentemente dal carattere della variabile indipendente è
possibile impiegare l’analisi della covarianza e la regressione
con variabili fittizie (ossia ottenute dicotomizzando le quantitative).
Per quanto un sociologo tenti di semplificare i propri modelli di
lettura della realtà, difficilmente è in grado di trarre conclusioni
importanti sulla base della sola analisi bivariata. Fenomeni quali la
devianza, lo status sociale, il grado di socializzazione, non possono
essere spiegati da una sola variabile indipendente, ma dipendono
in diversa misura da famiglia di origine, tipo e livello d’istruzione
posseduta, età, condizione occupazionale, ecc. È evidente allora
che molto spesso è necessario utilizzare tecniche di elaborazione
che consentano di tener conto simultaneamente di più variabili, per
misurare le relazioni reciproche. Per una trattazione approfondita
del caso più semplice, quello relativo a tre variabili, si rinvia a Ricolfi (1993); per una panoramica più generale, si veda Corbetta
(1994).
225
La base di partenza è spesso costituita dalla matrice dei coefficienti di correlazione lineare tra le diverse variabili: quindi un nuovo
tipo di matrice, variabili per variabili, che all’interno delle celle
riporta le correlazioni tra quelle indicate in riga o in colonna.
Il problema più rilevante che si pone nell’elaborare questa matrice
deriva dal fatto che quasi mai ci si trova dinanzi ad una situazione
in cui una variabile può essere definita dipendente e tutte le altre
indipendenti. In altre parole, non è mai di immediata evidenza, conoscendo i coefficienti di correlazione di una variabile dipendente
Y da altre due variabili X e Z considerate indipendenti, quanto
davvero Y dipenda da X e da Z, poiché occorre (cfr. Ricolfi 1993)
sia scontare l’effetto delle relazioni tra queste due, sia tener conto
dei limiti propri del coefficiente di correlazione lineare (che misura
solo le relazioni lineari dell’intera distribuzione, mentre potrebbero
esistere sia relazioni non lineari, sia relazioni lineari parziali).
Inoltre, assume particolare importanza nell’analisi multivariata la
disponibilità, da parte del ricercatore, di un modello plausibile di
relazioni tra le variabili. Un modello, ad esempio, in grado di definire quali siano le variabili rilevanti per l’analisi e quali relazioni
possano essere spurie, (ossia dovute all’effetto di una terza variabile interveniente, o apparenti, ossia annullate dall’inserimento di
una variabile di controllo (cfr. per alcuni esempi Bailey 1985, 513
e segg; Boudon 1970, 67-77).
In questa sede ci limitiamo a citare due modalità di elaborazione
assai diffuse nella ricerca sociale. La prima è costituita dall’analisi
dei fattori, che si è ormai differenziata in numerosi filoni, a seconda che prevalgano gli interessi interpretativi o quelli classificatori
(consente infatti, come si è accennato in precedenza, di assegnare
pesi ai diversi indicatori per costruire unindice sintetico de concetto misurato). Nell’ambito dell’impiego interpretativo, l’analisi dei
fattori nasce dalla constatazione che le variabili che compongono
la matrice di correlazione possono essere considerate indicatori di
un minor numero sottostante di fattori, ai quali le variabili sono in
vario modo correlate. Esistono diverse tecniche di elaborazione
che rientrano nell’analisi dei fattori, distinte ad esempio
dall’ipotizzare o meno l’ortogonalità dei fattori tra di loro.
226
BIBLIOGRAFIA DEI TESTI
CITATI
Amaturo Enrica
1989
Analyse del données e analisi dei dati nelle scienze sociali, Centro Scientifico Editore, Torino
Amendola Giandomenico
1989
Prevedere per valutare: gli spazi della sociologia nella valutazione d'impatto ambientale, in Martinelli Franco (a cura di), I
sociologi e l'ambiente, Bulzoni, Roma
Agnoli M. Stella
1992
La costruzione delle variabili tra rilevazione e analisi dei dati:
il caso dei sondaggi, in Marradi Alberto - Gasperoni Giancarlo
(a cura di), 1992
Ardigò Achille
1980
Crisi di governabilità e mondi vitali, Cappelli, Bologna
Armillei Giorgio - Bezzi Claudio
1992
La teoria sociologica come orizzonte della sociologia professionale, “Sociologia e professione”, II, 5
Armillei Giorgio - Bezzi Claudio - Tirabassi Amalia
1991
L’Osservatorio sociale, Irres, Perugia
Amisano Ernesto - Rinaldi Giuseppe
1988
Confronto tra forme diverse di “chiusura” degli items Likert, in
Marradi Alberto (a cura di), 1992
Bailey Kenneth D.
1985
Metodi della ricerca sociale, Il Mulino, Bologna
Barthes Roland
1981
Lezione, Einaudi, Torino
Bauer B. (a cura di)
1967
Social Indicators, Cambridge, M.I.T. Press
Bendix Reinard - Lipset Seymour Martin
1975
La mobilità sociale nelle società industriali, Etas Libri, Milano
Berger Peter - Luckmann Thomas
1969
La realtà come costruzione sociale, Il Mulino, Bologna
227
Bernstein Basil
1973
Classe, linguaggio e socializzazione, in Giglioli Pierpaolo (a
cura di), “Linguaggio e società” , Il Mulino, Bologna
Bertin Giovanni
1989
Decidere nel pubblico. Tecniche di decisione e valutazione nella
gestione dei servizi pubblici, Etas Libri, Milano
1995
Valutazione e sapere sociologico, F. Angeli, Milano
Bezzi Claudio
1982
Di fronte alla diversità, “Riforma della scuola”, n. 3
1988
All’indice!, “Studi e informazioni”, n.1
1990
(a cura di) Percorsi e temi di ricerca sociale, Protagon, Perugia
1992
Il management della ricerca, “Sociologia e professione”, II, 6-7
Bezzi Claudio - Raschi Damiana - Tirabassi Amalia
1990
Silenzio, consenso e partecipazione. Il rapporto tra cittadini e
servizi pubblici a Perugia, Protagon, Perugia
Bezzi Claudio - Scettri Marta (a cura di)
1994
La valutazione come ricerca e come intervento, Irres, Perugia
Bezzi Claudio - Tirabassi Amalia
1990
Problemi della ricerca sociologica. La gestione dell’intervista,
“Studi e informazioni”, n. 6
Bezzi Claudio e altri
1989
Facciamoci le nostre ricerche!, “Studi e informazioni”, n. 2
Biorcio Roberto
1993
L’analisi dei gruppi, F. Angeli, Milano
Blalock jr. Hubert M.
1969
Statistica per la ricerca sociale, Il Mulino, Bologna (II ed.
1984)
Boccuzzi Ermelinda
1985
Parcellizzazioni e reificazioni nelle ricerche sociologiche: il
punto di vista di un’intervistatrice, in Marradi Alberto (a cura
di), 1985a
Bogardus Emory S.
1933
A Social Distance Scale, in "Sociology and Social Research",
XVII, 2
Boileau Anna Maria
228
1987
Ricerca valutativa, in F. Demarchi - A. Ellena - B. Cattarinussi
(a cura di), “Nuovo Dizionario di Sociologia”, Edizioni Paoline,
Milano
Boudon Raymond
1970
Metodologia della ricerca sociologica, Il Mulino, Bologna
Bourdieu Pierre
1976
L’opinione pubblica non esiste, “Problemi dell’informazione”,
n.1
1983
La distinzione, Il Mulino, Bologna
Bruschi Alessandro
1991
Logica e metodologia, “Sociologia e ricerca sociale”, n. 35
Bryman, Alan
1984
The debate about quantitative and qualitative research: a question of method or epistemology?, in "British Journal of Sociology", XXXV, 1
Cacciola Salvatore - Marradi Alberto
1988
Contributo al dibattito sulle scale Likert basato sull’analisi di
interviste registrate, in Marradi Alberto (a cura di), 1988a
Campelli Enzo
1991
Il metodo e il suo contrario, F. Angeli, Milano
Cannavò Leonardo
1989
Qualità e quantità: tra metodologia sociologica e sociologia
della scienza, “Sociologia e ricerca sociale”, n. 28
Capecchi Vittorio
1963
Analisi qualitativa e quantitativa in sociologia, in "Quaderni di
Sociologia", XII
Carbonaro Antonio - Ceccatelli Gurrieri Giovanna - Venturi Domenico
1992
La ricerca sociale. Funzioni, metodi e strumenti, La Nuova Italia Scientifica, Roma
Cardano Mario - Miceli Renato
1991
Il linguaggio delle variabili, Torino, Rosenberg & Sellier
Cartocci Roberto
1984
Concetti e indicatori: il contributo della nuova retorica, in "Sociologia e ricerca sociale", V, 13
Caruso Maria Girolama
229
1987
Osservazioni dell’intervistatore, in R. Palomba (a cura di), “Vita
di coppia e figli”, La Nuova Italia, Firenze
Ceri Paolo e altri
1994
Manuale di sociologia, Utet libreria, Torino
Cesareo Vincenzo
1993
Sociologia. Teorie e problemi, Vita e Pensiero, Milano
Chiari Giorgio - Corbetta Piergiorgio
1973
Il problema del campionamento nella ricerca sociologica, in
"Rassegna italiana di sociologia", XIV, 3 e XIV, 4
Chiari Giorgio - Peri Pierangelo
1987
I modelli log-lineari nella ricerca sociologica, Quaderno 11-12
del Dipartimento di Politica Sociale, Università di Trento, Paradisi, Trento
Cipolla Costantino
1988
Teoria della metodologia sociologica, F. Angeli, Milano
Colombis Alessio
1991
Costruzione e modificazione di concetti. Dalle scale ai fattori,
Liguori, Napoli
Corbetta Piergiorgio
1994
Metodi di analisi multivariata per le scienze sociali, Il Mulino,
Bologna
Crespi Franco
1985
Le vie della sociologia. Problemi, teorie, metodi, Il Mulino, Bologna
Curatolo Renato
1979
Indicatori sociali per la Toscana, Regione Toscana, Firenze
Dahrendorf Ralph
1985
Pensare e fare politica, Bari, Laterza
Dautriat Huguette
1970
Il questionario, F. Angeli, Milano II ed.
Dall'Osso Luigi
1987
Le città dove si vive meglio, Milano, Angeli
Del Cornò Lucio - Bezzi Claudio
230
1985
Leggere. Lettura e cultura nel mondo quotidiano degli adulti,
Volumnia ed., Perugia
de Lillo Antonio - Schizzerotto Antonio
1985
La valutazione sociale delle occupazioni. Una scala di stratificazione occupazionale per l’Italia contemporanea, Il Mulino,
Bologna
Delli Zotti Giovanni
1985
Tipologia delle matrici utilizzate nella ricerca sociale, “Rassegna Italiana di sociologia”, n.2
1992
Il problema più importante per noi, in Marradi Alberto - Gasperoni Giancarlo (a cura di), 1992
Del Zotto Maura
1988
I testimoni qualificati in sociologia, in Marradi Alberto (a cura
di), 1988a
Di Cara Mirella
1992
Elementi di ricerca sociale, La Nuova Italia Scientifica, Roma
Dumazedier J.
1978
Sociologia del tempo libero, F. Angeli, Milano
Fleck Ludwik
1983
Genesi e sviluppo di un fatto scientifico, Il Mulino, Bologna
Frudà Luigi
1989
Le scale di atteggiamento nella ricerca sociale, Euroma-La Goliardica, Roma
Giddens Antony
1990
La costituzione della società, Comunità, Milano
Goode William J. - Hatt Paul K.
1969
Metodologia della ricerca sociale, Il Mulino, Bologna, IV ed.
Gruppo di lavoro metodologico dell’Università di Catania
1988
Riflessioni su un sondaggio di agenzia, in Marradi Alberto (a
cura di), 1988a
Guala Chito
1986
Strategie di ricerca. La preparazione del dato, Tirrenia Stampatori, Torino
1991
I sentieri della ricerca sociale, La Nuova Italia Scientifica, Roma
231
Guidicini Paolo
1993
Nuovo manuale della ricerca sociologica, F. Angeli, Milano
10^ ed. ampliata
Guttman Louis A.
1944
A Basis for Scaling Qualitative Data, in "American Sociological
Review", IX
1981
What Is What Not in Theory Costruction, in I. Borg (a cura di),
Multidimentional Data Representation. When and Why, Ann
Harbor, Mathesis Press
Hyman Herbert H.
1967
Disegno della ricerca e analisi sociologica, 2 voll., Marsilio ed.,
Vicenza
Hoinville Gerald - Jowell Roger
1991
Come fare i sondaggi. Guida pratica alla realizzazione di ricerche campionarie qualitative e quantitative, F. Angeli, Milano 3^
ed.
Istat
1989a
Manuale di tecniche di indagine. 1- tecniche di campionamento:
teoria e pratica, “Note e relazioni”, n. 1
1989b Manuale di tecniche di indagine. 2 - il questionario: progettazione, redazione e verifica, “Note e relazioni”, n. 1, Roma
1989c
Manuale di tecniche di indagine. 3 - tecniche di somministrazione del questionario, “Note e relazioni”, n. 1, Roma
1991a
Classificazione delle attività economiche, “Metodi e norme”,
serie C, n. 11, Roma
1991b Classificazione delle professioni, “Metodi e norme”, serie C, n.
12, Roma
Itzcovich Oscar
1993
L'uso del calcolatore in storiografia, Angeli, Milano
Khan Robert L. - Cannel Charles
1968
La dinamica dell’intervista, Marsilio, Padova
Kuhn Thomas S.
1978
La struttura delle rivoluzioni scientifiche, Einaudi, Torino
Lanzetti Clemente (a cura di)
1990
Qualità e senso della vita in ambiente urbano ed extraurbano,
Milano, Angeli
Lazarsfeld Paul F.
1967
Metodologia e ricerca sociologia, Il Mulino, Bologna
232
1969
Dai concetti agli indici empirici, in R. Boudon - P.F. Lazarsfeld,
“L’analisi empirica nelle scienze sociali. Volume I: Dai concetti
agli indici empirici”, Il Mulino, Bologna
Leti Giuseppe
1983
Statistica descrittiva, Il Mulino, Bologna
Madge John
1972
Lo sviluppo dei metodi di ricerca empirica in sociologia, Il Mulino, Bologna IV ed.
Marradi Alberto
1980
Strategie per l’elaborazione elettronica dei dati nelle scienze
sociali, “Rassegna italiana di sociologia”, XXI, 1
1981
Misurazione e scale: qualche riflessione e una proposta, "Rassegna Italiana di Sociologia", XXIX, 4
1985
(a cura di), Strumenti concettuali per la raccolta e l’analisi dei
dati, “Rassegna Italiana di sociologia” (numero monografico), n.
2
1987a
Concetti e metodi per la ricerca sociale, La Giuntina, Firenze
1987b Linguagio scientifico o torre di babele?, in "Rivista Italiana di
Scienza Politica", XVII, 1, pp. 135-156
1988a
(a cura di), Costruire il dato. Sulle tecniche di raccolta delle
informazioni nelle scienze sociali, Franco Angeli, Milano
1988b Casualità e rappresentatività di un campione: contributo a una
sociologia del linguaggio scientifico, in R. Mannheimer (a cura
di), “I sondaggi elettorali e le scienze politiche. Problemi metodologici”, Quaderni Fondazione Feltrinelli, n. 37, F. Angeli, Milano
1990
Fedeltà di un dato, affidabilità di una definizione operativa,
“Rassegna Italiana di sociologia”, n. 1
1991
Classification Typology, Taxonomy, “Quality and Quantity”,
XXIV, 2
1993
L’analisi monoviariata, F. Angeli, Milano
1994
Referenti, pensiero e linguaggio: una questione rilevante per gli
indicatori, in "Sociologia e Ricerca Sociale", 43, I
Marradi Alberto - Gasperoni Giancarlo
1992
(a cura di), Costruire il dato 2. Vizi e virtù di alcune tecniche di
raccolta delle informazioni, Franco Angeli, Milano
Martinotti Guido
1967
La codifica e l’elaborazione dei dati, in H. Hyman, 1967, II
1988
Milano ore sette: come vivono i milanesi, Maggioli, Milano
Merton R. K.
1966
Teoria e struttura sociale, Bologna, Il Mulino
233
Micheli Giuseppe A. - Manfredi Piero
1995
Correlazione e regressione, Angeli, Milano
Montesperelli Paolo
1990
Marginalità senza esclusione: alcune difficoltà nella ricerca
sociale, in C. Bezzi (a cura di), 1990
1993
Intervista e approccio ermeneutico, relazione al Convegno
“L’intervista: tra approcci qualitativi e interviste strutturate”,
Torino, 26.5.1993
Montesperelli Paolo - Gobbi Nadia
1993
Fedeltà e attendibilità nella ricerca sociale: una rilevazione
empirica, “Studi e informazioni”, n. 14
Mongardini Carlo
1984
La conoscenza sociologica III. Teoria e ricerca empirica, ECIG
Genova,
Mood A.M. - Graybill F.A. - Boes D.
1984
Introduzione alla statistica, McGraw - Hill, Milano
Morin Edgar
1985a
Sociologia della sociologia, Ed. Lavoro, Roma
1985b Il metodo, Feltrinelli, Milano
Nagel Ernest
1968
La struttura della scienza, Feltrinelli, Milano
Nicolini Giovanna
1984
Su un metodo per le previsioni demografiche basato sulla definizione di aree omogenee, “Quaderni di sociologia”, n. 1
Palumbo Mauro
1991
Problemi di metodologia della ricerca sociale, Ecig, Genova II^
ed.
1992
Concetti dell’uomo della strada e concetti del ricercatore, in
Marradi Alberto - Gasperoni Giancarlo (a cura di), 1992
1992-93 L’inferma scienza e la dubbia scelta, “Sociologia e professione”, n. 8-9
Pasquali Marco
1992
Ho fatto il Censimento, Stampalternativa, Viterbo
Pellicciari Giovanni - Tinti Giancarlo
1983
Tecniche di ricerca sociale, Franco Angeli, Milano V^ ed.
234
Phillips Bernard S.
1972
Metodologia della ricerca sociale, Il Mulino, Bologna
Pitrone Maria C.
1986
Il sondaggio, F. Angeli, Milano II ed.
Razzi Marco
1992
Fedeltà dei dati raccolti mediante questionario: un controllo
empirico, in Marradi Alberto - Gasperoni Giancarlo (a cura di),
1992
Ricolfi Luca
1985
Operazioni di ricerca e scale, in "Rassegna Italiana di Sociologia", XXVI, 2
1993
Tre variabili. Un’introduzione all’analisi multivariata, F. Angeli, Milano
1995
La ricerca empirica nelle scienze sociali. Una tassonomia, paper presentato al Convegno A.I.S. sui Dottorati di ricerca, Roma, 17 marzo.
Romita Tullio
1994
Il laboratorio CATI dell’Università della Calabria, “Sociologia
e professione”, 14-15
Roskam Edward E.
1989
Operazionalization: a superfluous concept, in "Quality and
Quantity", XXII, 3-4, pp. 237-275
Russo Bianca - Vasta Cristina
1988
Uso combinato di scale Likert e figure tematiche in una ricerca
sugli atteggiamenti, in Marradi Alberto (a cura di), 1988a
Santarelli Ulderico
1982
Un campione di quanti casi? Guida pratica al progetto ottimale
di ricerche e controlli campionari, Milano, Angeli
Schutz Alfred
1975
Il problema della rilevanza, Rosenberg & Sellier, Torino
Schützenberger Anne Ancelin
1975
La Sociometria, Armando, Roma
Schwartz Howard - Jacobs Jerry
1987
Sociologia qualitativa. Un metodo nella follia, Il Mulino, Bologna
Siza Remo
235
1994
La programmazione e le relazioni sociali, Angeli, Milano
Sormano Andrea
1988
L’intervistatore come attore. Ovvero, le infedeltà che non importa superare, “Rassegna Italiana di sociologia”, n. 3
Statera Gianni
1984
Metodologia e tecniche della ricerca sociale, Palumbo, Palermo
1990
Le epistemologie post-empiriste e la logica dell’indagine sociologica, “Sociologia e ricerca sociale”, n. 33
Stevens Stanley Smith
1991
La teoria delle scale di misura, in M. Cardano R. Miceli ( cura
di) (1991)
Vergati Serena (a cura di)
1989
Dimensioni sociali e territoriali della qualità della vita, Euroma-La Goliardica, Roma
Weber Max
1974
Economia e società, 2 voll., Comunità, Milano (3^ ed.)
Wright Mills Charles
1962
L'immaginazione sociologica, Il Saggiatore, Milano
Zajczyk Francesca
1991
La conoscenza sociale del territorio. Fonti e qualità dei dati, F.
Angeli, Milano
236