Analisi trivariata - Dipartimento di Comunicazione e Ricerca
Transcript
Analisi trivariata - Dipartimento di Comunicazione e Ricerca
ANALISI TRI-VARIATA Procedura logica e tecnico-operativa per l’esplorazione dei nessi di dipendenza tra variabili, i cui fondamenti risalgono all’impiego che ne fece É. Durkheim (cfr. Il suicidio- 1897) e il cui sviluppo si deve a P.F. Lazarsfeld e alla sua scuola, che negli anni ’40-’50 esplicitò e formalizzò la logica dell’analisi delle relazioni di dipendenza statistica. Al pari dell’esperimento, può essere intesa come un metodo di imputazione causale, ma a differenza dell’esperimento si basa su dati osservativi prodottisi indipendentemente da un intervento deliberato del ricercatore. Nella ricerca di un’alternativa all’esperimento classico, le scienze sociali hanno messo a punto due varianti del concetto di “controllo” (inteso come poter far variare qualcosa ma anche come capacità di far restare immutato tutto il resto): procedimento di stratificazione e procedimento di depurazione, specificamente appropriati, rispettivamente, per variabili qualitative e per variabili quantitative. 1. VARIABILI QUALITATIVE = CONTROLLO PER STRATIFICAZIONE: il campione totale sul quale è stata osservata la relazione viene stratificato in tanti sottogruppi quante sono le modalità della variabile selezionata come variabile di controllo: ciascun gruppo contiene tutti e solo i casi osservati che sono caratterizzati dal presentare una stessa modalità della variabile di controllo. In tale modo si neutralizza il supposto effetto della variabile Z. 2. VARIABILI QUANTITATIVE = CONTROLLO PER DEPURAZIONE: attraverso il ricorso alla correlazione parziale, procedura di tipo matematicostatistico, si depurano le variabili della relazione originaria dagli effetti di una o più variabili di controllo, e si ragiona sulle variabili residuo così risultanti. Il coefficiente di correlazione parziale al quadrato esprime la quantità di varianza di Y spiegata da X tenendo sotto controllo Z. L’analisi trivariata costituisce il caso più semplice e al tempo stesso il paradigma concettuale dell’analisi multivariata della dipendenza: consiste nell’indagare in merito alla “natura” del nesso di associazione o di indipendenza osservato tra due variabili, mediante l’introduzione nell’analisi di una terza variabile - per tale ragione è essenziale ricorrervi in sede di analisi bivariata, da cui possono emergere relazioni ingannevoli!!! L’analisi muove da ciò che si osserva in sede di analisi bivariata e che viene denominato relazione originaria; la terza variabile che si introduce nell’analisi è denominata variabile di controllo. Nella relazione originaria si può osservare una relazione di indipendenza o di associazione Nel caso in cui la relazione originaria risulti di associazione (XY) l’analisi può essere orientata in base a tre modelli: spiegazione, interpretazione, specificazione Nel caso in cui la relazione originaria risulti di indipendenza, l’analisi è orientata dal modello denominato occultamento di una relazione MODELLI DI ANALISI TRIVARIATA 1. SPIEGAZIONE = orienta a distinguere le relazioni vere o genuine da quelle spurie o false o apparenti. In questo modello la variabile di controllo Z è antecedente rispetto alla X della relazione originaria Z X Y Oppure RELAZIONE SPURIA Z X Y ------- 2. INTERPRETAZIONE = orienta a distinguere relazioni dirette da relazioni mediate o indirette. In questo modello la variabile di controllo Z è susseguente rispetto alla X e antecedente rispetto alla Y della relazione originaria: Z = variabile interveniente XZY ------------ RELAZIONE INDIRETTA 3. SPECIFICAZIONE: orienta a scoprire, individuare, specificare, le condizioni alle quali la relazione originaria cambia, nel senso che si mostra più o meno marcata, ovvero le condizioni alle quali essa “tiene” o “non tiene”. In questo modello la variabile di controllo Z è comunque interveniente rispetto alla relazione originaria, ma in un senso completamente diverso da quello in cui lo è nel modello dell’interpretazione nel senso, cioè, che non media tra x e Y ma interagisce con esse Z X Y RELAZIONE CONDIZIONATA L’analisi trivariata può inoltre essere utile per a) mettere in evidenza variabili occultatrici, e dunque svelare l’esistenza di relazioni occulte o soppresse b) segnalare rapporti di causalità multipla L’insieme delle operazioni di ricerca che è necessario svolgere per condurre analisi tri-variata è reso, in termini simbolici, dalla seguente espressione: xy)= xy;z1 xy;zn xz zy xy = relazione originaria xy;z1 e xy;zn = relazioni parziali o locali o condizionate xz zy = relazioni marginali = somma logica = prodotto logico ESEMPI DI APPLICAZIONE DI MODELLI DI ANALISI TRIVARIATA MEDIANTE STRATIFICAZIONE 1. MODELLO DELLA SPIEGAZIONE L’associazionismo dei pretori che trattano cause di lavoro in quale tipo di relazione è con l’esito delle cause trattate? X= TIPO DI ASSOCIAZIONISMO X1= associazionismo di centro X2= associazionismo di sinistra Y = ESITO DELLE CAUSE TRATTATE Y1 = esito favorevole al lavoratore Y2 = esito favorevole al datore di lavoro Tab. 1 = relazione originaria xy Es. fav. al lavoratore Es. fav. al datore di lavoro Totale Assoc. di centro 27,0 73,0 Assoc. di sinistra 68,0 32,0 100,0 (60) 100,0 (72) xy = 68% - 27% = 41% = 0,41 = test o indice della differenza percentuale: la sua applicazione è limitata alle tabelle tetracoriche (definite da varibili entrambe dicotomiche, che danno origine a quattro celle). A partire da valori di 0,30 la relazione di associazione tra due variabili si considera rilevante Si introduce la variabile di controllo Z = orientamento politico che si considera antecedente rispetto ad X Z= ORIENTAMENTO POLITICO Z1 = conservatore Z2 = progressista - se la relazione originaria xy è genuina, allora essa si conferma in tutte le relazioni parziali - se la relazione originaria xy è spuria, allora essa si annulla in tutte le relazioni parziali Tab. 2 = relazione parziale xy;z1 = orientamento conservatore Es. fav. al lavoratore Es. fav. al datore di lav. Totale Ass. di centro 60,0 40,0 100,0 (43) Ass. di sinistra 54,0 46,0 100,0 (37) xy = 60% - 54% = 6% = 0,06 Tab. 3 = relazione parziale xy;z2 = orientamento progressista Es. fav. al lavoratore Es. fav. al datore di lav. Totale xy = 41% - 34% = 7% = 0,07 Ass. di centro 41,0 59,0 100,0 (17) Ass. di sinistra 34,0 66,0 100,0 (35) Tab. 4 = relazione marginale zx Ass. di centro Ass. di sinistra Totale Conservatore 64,0 36,0 100,0 (80) Progressista 17,0 83,0 100,0 (52) Conservatore 31,0 69,0 100,0 (80) Progressista 77,0 23,0 100,0 (52) zx = 64% - 17% = 47% = 0,47 Tab. 5 = relazione marginale zy Es. fav. al lavoratore Es. fav. al datore di lav. Totale zy = 77% - 31% = 46% = 0,46 2. MODELLO DELL’ INTERPRETAZIONE Lo stato civile in quale tipo di relazione è con l’assenteismo sul lavoro? X= STATO CIVILE X1= libero/a X2= coniugato/a Y = LIVELLO DI ASSENTEISMO Y1 = basso Y2 = alto Tab. 6 = relazione originaria xy Ass. basso Ass. alto Totale Libero/a 69,0 31,0 100,0 (160) Coniugato/a 36,0 64,0 100,0 (160) xy = 69% - 36% = 33% = 0,33 Si introduce la variabile di controllo Z = carico di lavoro domestico, che si considera interveniente tra X e Y Z= CARICO DI LAVORO DOMESTICO Z1 = lieve Z2 = pesante - se la relazione originaria xy è diretta, allora essa si conferma in tutte le relazioni parziali - se la relazione originaria xy è indiretta/mediata , allora essa si annulla in tutte le relazioni parziali Tab. 7 = relazione parziale xy;z1 = carico lieve Ass. basso Ass. alto Totale Libero/a 82,0 18,0 100,0 (120) Coniugato/a 75,0 25,0 100,0 (40) xy = 82% - 75% = 7% = 0,07 Tab. 8 = relazione parziale xy;z2 = carico pesante Ass. basso Ass. alto Totale Libero/a 30,0 70,0 100,0 (40) Coniugato/a 25,0 75,0 100,0 (120) Libero/a 75,0 25,0 100,0 (160) Coniugato/a 25,0 75,0 100,0 (160) Carico lieve 80,0 20,0 100,0 (160) Carico pesante 26,0 74,0 100,0 (160) xy = 30% - 25% = 5% = 0,05 Tab. 9 = relazione marginale xz Carico lieve Carico pesante Totale xz = 75% - 25% = 50% = 0,50 Tab. 10 = relazione marginale zy Ass. basso Ass. alto Totale zy = 80% - 26% = 54% = 0,54 3. MODELLO DELLA SPECIFICAZIONE In quale tipo di relazione è il sesso del genitore con la sanzione disciplinare adottata in caso di trasgressioni da parte dei figli? X= SESSO DEL GENITORE X1 = madre X2 = padre Y = SANZIONE DISCIPLINARE ADOTTATA Y1 = corporale Y2 = verbale Tab. 11 = relazione originaria xy Corporale Verbale Totale Madre 37,0 63,0 100,0 (600) Padre 58,0 42,0 100,0 (400) xy = 37% - 58% = 21%= 0,21 Si introduce la variabile di controllo Z = classe sociale, che si considera interveniente tra X e Y ma non dipendente dalla X Z= CLASSE SOCIALE Z1 = bassa Z2 = alta Tab. 12 = relazione parziale xy;z1 = classe sociale bassa Corporale Verbale Totale Madre 48,0 Padre 93,0 52,0 100,0 (250) 7,0 100,0 (150) xy = 48% - 93% = 45% = 0,45 Tab. 13 = relazione parziale xy;z2 = classe sociale alta Corporale Verbale Totale Madre 29,0 71,0 100,0 (350) Padre 36,0 64,0 100,0 (250) Madre 42,0 58,0 100,0 (600) Padre 38,0 62,0 100,0 (400) Classe bassa 65,0 35,0 100,0 (400) Classe alta 32,0 68,0 100,0 (6000) xy = 29% - 36% = 0,7% = 0,07 Tab. 14 = relazione marginale xz Classe bassa Classe alta Totale xz = 42% - 38% = 4% = 0,04 Tab. 15 = relazione marginale zy Corporale Verbale Totale zy = 65% - 32% = 33% = 0,33 4. OCCULTAMENTO DI UNA RELAZIONE (si applica quando dalla relazione originaria risulti indipendenza tra X e Y) Quale tipo di relazione c’è fra classe sociale dei genitori e comportamento nei confronti dei figli, in caso di trasgressioni disciplinari? X= CLASSE SOCIALE X1 = bassa X2 = alta Y = COMPORTAMENTO NEI CONFRONTI DEI FIGLI Y1 = repressivo Y2 = permissivo Tab. 16 = relazione originaria xy Repressivo Permissivo Totale Classe bassa 63,0 37,0 100,0 (195) Classe alta 63,0 37,0 100,0 (115) xy = 63% - 63% = 0,0 Si introduce la variabile di controllo Z = Tipo di infrazione interveniente tra X e Y Z= TIPO DI INFRAZIONE Z1 = intra-familiare Z2 = extra-familiare Tab. 17 = relazione parziale xy;z1 = infrazione intra-familiare Repressivo Permissivo Totale Classe bassa 75,0 25,0 100,0 (80) Classe alta 43,0 57,0 100,0 (70) xy = 75% - 43% = 32% = 0,32 Tab. 18 = relazione parziale xy;z2 = infrazione extra-familiare Classe bassa Classe alta 45,0 93,0 Repressivo 55,0 7,0 Permissivo 100,0 100,0 Totale (55) (45) xy = 45% - 93% = 0,48% = 0,48