Analisi trivariata - Dipartimento di Comunicazione e Ricerca

Transcript

Analisi trivariata - Dipartimento di Comunicazione e Ricerca
ANALISI TRI-VARIATA
Procedura logica e tecnico-operativa per l’esplorazione dei nessi di dipendenza tra
variabili, i cui fondamenti risalgono all’impiego che ne fece É. Durkheim (cfr. Il
suicidio- 1897) e il cui sviluppo si deve a P.F. Lazarsfeld e alla sua scuola, che negli
anni ’40-’50 esplicitò e formalizzò la logica dell’analisi delle relazioni di dipendenza
statistica.
Al pari dell’esperimento, può essere intesa come un metodo di imputazione causale,
ma a differenza dell’esperimento si basa su dati osservativi prodottisi
indipendentemente da un intervento deliberato del ricercatore. Nella ricerca di
un’alternativa all’esperimento classico, le scienze sociali hanno messo a punto due
varianti del concetto di “controllo” (inteso come poter far variare qualcosa ma anche
come capacità di far restare immutato tutto il resto): procedimento di stratificazione e
procedimento di depurazione, specificamente appropriati, rispettivamente, per
variabili qualitative e per variabili quantitative.
1. VARIABILI QUALITATIVE = CONTROLLO PER STRATIFICAZIONE:
il campione totale sul quale è stata osservata la relazione viene stratificato in
tanti sottogruppi quante sono le modalità della variabile selezionata come
variabile di controllo: ciascun gruppo contiene tutti e solo i casi osservati che
sono caratterizzati dal presentare una stessa modalità della variabile di
controllo. In tale modo si neutralizza il supposto effetto della variabile Z.
2. VARIABILI QUANTITATIVE = CONTROLLO PER DEPURAZIONE:
attraverso il ricorso alla correlazione parziale, procedura di tipo matematicostatistico, si depurano le variabili della relazione originaria dagli effetti di una o
più variabili di controllo, e si ragiona sulle variabili residuo così risultanti. Il
coefficiente di correlazione parziale al quadrato esprime la quantità di varianza
di Y spiegata da X tenendo sotto controllo Z.
L’analisi trivariata costituisce il caso più semplice e al tempo stesso il paradigma
concettuale dell’analisi multivariata della dipendenza: consiste nell’indagare in
merito alla “natura” del nesso di associazione o di indipendenza osservato tra due
variabili, mediante l’introduzione nell’analisi di una terza variabile - per tale
ragione è essenziale ricorrervi in sede di analisi bivariata, da cui possono emergere
relazioni ingannevoli!!!
L’analisi muove da ciò che si osserva in sede di analisi bivariata e che viene
denominato relazione originaria; la terza variabile che si introduce nell’analisi è
denominata variabile di controllo.
Nella relazione originaria si può osservare una relazione di indipendenza o di
associazione
Nel caso in cui la relazione originaria risulti di associazione (XY) l’analisi può
essere orientata in base a tre modelli: spiegazione, interpretazione, specificazione
Nel caso in cui la relazione originaria risulti di indipendenza, l’analisi è orientata dal
modello denominato occultamento di una relazione
MODELLI DI ANALISI TRIVARIATA
1. SPIEGAZIONE = orienta a distinguere le relazioni vere o genuine da quelle
spurie o false o apparenti. In questo modello la variabile
di controllo Z è antecedente rispetto alla X della relazione
originaria
Z X  Y
Oppure
RELAZIONE SPURIA
Z


X
Y
-------
2. INTERPRETAZIONE = orienta a distinguere relazioni dirette da relazioni
mediate o indirette. In questo modello la variabile di
controllo Z è susseguente rispetto alla X e antecedente
rispetto alla Y della relazione originaria: Z = variabile
interveniente
XZY
------------
RELAZIONE INDIRETTA
3. SPECIFICAZIONE: orienta a scoprire, individuare, specificare, le condizioni
alle quali la relazione originaria cambia, nel senso che si
mostra più o meno marcata, ovvero le condizioni alle quali
essa “tiene” o “non tiene”. In questo modello la variabile di
controllo Z è comunque interveniente rispetto alla
relazione originaria, ma in un senso completamente
diverso da quello in cui lo è nel modello
dell’interpretazione nel senso, cioè, che non media tra x e
Y ma interagisce con esse
Z

X Y
RELAZIONE CONDIZIONATA
L’analisi trivariata può inoltre essere utile per
a) mettere in evidenza variabili occultatrici, e dunque svelare l’esistenza di
relazioni occulte o soppresse
b) segnalare rapporti di causalità multipla
L’insieme delle operazioni di ricerca che è necessario svolgere per condurre analisi
tri-variata è reso, in termini simbolici, dalla seguente espressione:
xy)= xy;z1  xy;zn  xz  zy
xy = relazione originaria
xy;z1 e xy;zn = relazioni parziali o locali o condizionate
xz  zy = relazioni marginali
 = somma logica
= prodotto logico
ESEMPI DI APPLICAZIONE DI MODELLI DI ANALISI
TRIVARIATA MEDIANTE STRATIFICAZIONE
1. MODELLO DELLA SPIEGAZIONE
L’associazionismo dei pretori che trattano cause di lavoro in quale tipo di
relazione è con l’esito delle cause trattate?
X= TIPO DI ASSOCIAZIONISMO
X1= associazionismo di centro
X2= associazionismo di sinistra
Y = ESITO DELLE CAUSE TRATTATE
Y1 = esito favorevole al lavoratore
Y2 = esito favorevole al datore di lavoro
Tab. 1 = relazione originaria xy
Es. fav. al lavoratore
Es. fav. al datore di
lavoro
Totale
Assoc. di centro
27,0
73,0
Assoc. di sinistra
68,0
32,0
100,0
(60)
100,0
(72)
xy = 68% - 27% = 41% = 0,41
 = test o indice della differenza percentuale: la sua applicazione è limitata alle
tabelle tetracoriche (definite da varibili entrambe dicotomiche, che danno origine a
quattro celle). A partire da valori di  0,30 la relazione di associazione tra due
variabili si considera rilevante
Si introduce la variabile di controllo Z = orientamento politico che si considera
antecedente rispetto ad X
Z= ORIENTAMENTO POLITICO
Z1 = conservatore
Z2 = progressista
- se la relazione originaria xy è genuina, allora essa si conferma in tutte le
relazioni parziali
- se la relazione originaria xy è spuria, allora essa si annulla in tutte le relazioni
parziali
Tab. 2 = relazione parziale xy;z1 = orientamento conservatore
Es. fav. al lavoratore
Es. fav. al datore di lav.
Totale
Ass. di centro
60,0
40,0
100,0
(43)
Ass. di sinistra
54,0
46,0
100,0
(37)
xy = 60% - 54% = 6% = 0,06
Tab. 3 = relazione parziale xy;z2 = orientamento progressista
Es. fav. al lavoratore
Es. fav. al datore di lav.
Totale
xy = 41% - 34% = 7% = 0,07
Ass. di centro
41,0
59,0
100,0
(17)
Ass. di sinistra
34,0
66,0
100,0
(35)
Tab. 4 = relazione marginale zx
Ass. di centro
Ass. di sinistra
Totale
Conservatore
64,0
36,0
100,0
(80)
Progressista
17,0
83,0
100,0
(52)
Conservatore
31,0
69,0
100,0
(80)
Progressista
77,0
23,0
100,0
(52)
zx = 64% - 17% = 47% = 0,47
Tab. 5 = relazione marginale zy
Es. fav. al lavoratore
Es. fav. al datore di lav.
Totale
zy = 77% - 31% = 46% = 0,46
2. MODELLO DELL’ INTERPRETAZIONE
Lo stato civile in quale tipo di relazione è con l’assenteismo sul lavoro?
X= STATO CIVILE
X1= libero/a
X2= coniugato/a
Y = LIVELLO DI ASSENTEISMO
Y1 = basso
Y2 = alto
Tab. 6 = relazione originaria xy
Ass. basso
Ass. alto
Totale
Libero/a
69,0
31,0
100,0
(160)
Coniugato/a
36,0
64,0
100,0
(160)
xy = 69% - 36% = 33% = 0,33
Si introduce la variabile di controllo Z = carico di lavoro domestico, che si considera
interveniente tra X e Y
Z= CARICO DI LAVORO DOMESTICO
Z1 = lieve
Z2 = pesante
- se la relazione originaria xy è diretta, allora essa si conferma in tutte le
relazioni parziali
- se la relazione originaria xy è indiretta/mediata , allora essa si annulla in tutte
le relazioni parziali
Tab. 7 = relazione parziale xy;z1 = carico lieve
Ass. basso
Ass. alto
Totale
Libero/a
82,0
18,0
100,0
(120)
Coniugato/a
75,0
25,0
100,0
(40)
xy = 82% - 75% = 7% = 0,07
Tab. 8 = relazione parziale xy;z2 = carico pesante
Ass. basso
Ass. alto
Totale
Libero/a
30,0
70,0
100,0
(40)
Coniugato/a
25,0
75,0
100,0
(120)
Libero/a
75,0
25,0
100,0
(160)
Coniugato/a
25,0
75,0
100,0
(160)
Carico lieve
80,0
20,0
100,0
(160)
Carico pesante
26,0
74,0
100,0
(160)
xy = 30% - 25% = 5% = 0,05
Tab. 9 = relazione marginale xz
Carico lieve
Carico pesante
Totale
xz = 75% - 25% = 50% = 0,50
Tab. 10 = relazione marginale zy
Ass. basso
Ass. alto
Totale
zy = 80% - 26% = 54% = 0,54
3. MODELLO DELLA SPECIFICAZIONE
In quale tipo di relazione è il sesso del genitore con la sanzione disciplinare
adottata in caso di trasgressioni da parte dei figli?
X= SESSO DEL GENITORE
X1 = madre
X2 = padre
Y = SANZIONE DISCIPLINARE ADOTTATA
Y1 = corporale
Y2 = verbale
Tab. 11 = relazione originaria xy
Corporale
Verbale
Totale
Madre
37,0
63,0
100,0
(600)
Padre
58,0
42,0
100,0
(400)
xy = 37% - 58% = 21%= 0,21
Si introduce la variabile di controllo Z =
classe sociale, che si considera
interveniente tra X e Y ma non dipendente dalla X
Z= CLASSE SOCIALE
Z1 = bassa
Z2 = alta
Tab. 12 = relazione parziale xy;z1 = classe sociale bassa
Corporale
Verbale
Totale
Madre
48,0
Padre
93,0
52,0
100,0
(250)
7,0
100,0
(150)
xy = 48% - 93% = 45% = 0,45
Tab. 13 = relazione parziale xy;z2 = classe sociale alta
Corporale
Verbale
Totale
Madre
29,0
71,0
100,0
(350)
Padre
36,0
64,0
100,0
(250)
Madre
42,0
58,0
100,0
(600)
Padre
38,0
62,0
100,0
(400)
Classe bassa
65,0
35,0
100,0
(400)
Classe alta
32,0
68,0
100,0
(6000)
xy = 29% - 36% = 0,7% = 0,07
Tab. 14 = relazione marginale xz
Classe bassa
Classe alta
Totale
xz = 42% - 38% = 4% = 0,04
Tab. 15 = relazione marginale zy
Corporale
Verbale
Totale
zy = 65% - 32% = 33% = 0,33
4. OCCULTAMENTO DI UNA RELAZIONE (si applica quando dalla
relazione originaria risulti indipendenza tra X e Y)
Quale tipo di relazione c’è fra classe sociale dei genitori e comportamento nei
confronti dei figli, in caso di trasgressioni disciplinari?
X= CLASSE SOCIALE
X1 = bassa
X2 = alta
Y = COMPORTAMENTO NEI CONFRONTI DEI FIGLI
Y1 = repressivo
Y2 = permissivo
Tab. 16 = relazione originaria xy
Repressivo
Permissivo
Totale
Classe bassa
63,0
37,0
100,0
(195)
Classe alta
63,0
37,0
100,0
(115)
xy = 63% - 63% = 0,0
Si introduce la variabile di controllo Z = Tipo di infrazione interveniente tra X e Y
Z= TIPO DI INFRAZIONE
Z1 = intra-familiare
Z2 = extra-familiare
Tab. 17 = relazione parziale xy;z1 = infrazione intra-familiare
Repressivo
Permissivo
Totale
Classe bassa
75,0
25,0
100,0
(80)
Classe alta
43,0
57,0
100,0
(70)
xy = 75% - 43% = 32% = 0,32
Tab. 18 = relazione parziale xy;z2 = infrazione extra-familiare
Classe bassa
Classe alta
45,0
93,0
Repressivo
55,0
7,0
Permissivo
100,0
100,0
Totale
(55)
(45)
xy = 45% - 93% = 0,48% = 0,48