Test t Test t - Dipartimento di Psicologia
Transcript
Test t Test t - Dipartimento di Psicologia
Analizza/Confronta medie ELEMENTI DI PSICOMETRIA Esercitazione n. 77-8-9-10 t-test e confronto tra medie chi quadrato C.d.L. Comunicazione e Psicologia a.a. 2008/09 Medie… Calcola medie e altre statistiche di una data variabile (dipendente) in diversi sottogruppi. I sottogruppi sono creati a partire dalle categorie di una (o più) variabili indipendenti. Confronta con “dividi” e “esplora” categorie NB: tramite il comando “opzioni” è possibile selezionare diversi indici (es: d.s., mediana, ecc) Test t Test t H0 : µ1 = µ2 Il t-test è usato per valutare se la differenza tra le medie di due gruppi o condizioni è significativa Capire se la differenza osservata tra (necessariamente) campioni corrisponde ad una differenza reale H1 : µ1 ≠ µ2 (bidirezionale) oppure µ1 > µ2 (monodirezionale dx) oppure µ1 < µ2 (monodirezionale sx) Quanto è probabile che ci sia differenza nel campione se non esiste differenza nella popolazione? p<.05 rifiuto H0! “Quante code ha la bestia?” Test t Due code Campione unico Campioni indipendenti Campioni appaiati Non facciamo previsioni sulla differenza Teniamo il p così come ci è dato Una coda Ipotizziamo ci sia una “direzionalità” Dimezziamo il p dato da SPSS Nel caso la differenza sia nella direzione non prevista, però, dobbiamo considerare insensati i nostri dati! Test t: campione unico Test t: campione unico Confronta la media di una campione con un valore prefissato (teorico) Qui si inserisce il valore di riferimento ASSUNTI E’ possibile anche chiedere gli intervalli di confidenza Normalità (vedi lezione precedente) Indipendenza delle osservazioni Test t: campione unico Esercizi Significatività (p-value) Intervalli di confidenza File impl.xls Compito di elaborazione implicita: parole (n=50) e nonparole (n=50) sono presentate per 35ms (non percepibili) e i soggetti hanno il compito di identificarle. Vorremmo soggetti di circa 20 anni. L’età dei partecipanti è significativamente diversa da 20? Calcoliamo la prestazione in termini di accuratezza (da 0 a 1) Come possiamo valutare se la performance dei partecipanti è diversa dal caso? Possiamo concludere che ci sia una percezione implicita delle parole a 35ms? Esercizi File aphasia.xls Prestazione di pazienti con disturbi del linguaggio ad un compito di lettura di parole A metà pazienti (gruppo 1) sono somministrati 50 stimoli, all’altra metà (gruppo 2) 120 stimoli Calcolare accuratezza del singolo paziente Il compito è molto facile: i soggetti sani hanno prestazione a soffitto La performance dei pazienti è significativamente diversa da quella dei normali? Valutare la performance di ognuno dei due gruppi. Cosa possiamo concludere? Correlazione: cenni Che significa “correlati”?! La correlazione misura il grado di associazione delle variabili in esame Test t: campioni appaiati Fornisce la significatività statistica della differenza tra le medie di due variabili Esempi: Due condizioni (es: due test) a cui un unico gruppo è sottoposto Due gruppi altamente correlati (es: marito e moglie, coppie di fratelli) Questa caratteristica si riflette nell’organizzazione del data-set! Ogni singolo caso (riga) incrocia le due variabili (colonne) da confrontare. Coefficiente di correlazione (r): -1<r<1 r<0: al crescere di v1 diminuisce v2 r>0: al crescere di v1 aumenta v2 r=0: non c’è associazione Test t: campioni appaiati ASSUNTI Normalità della differenza tra i punteggi Indipendenza delle osservazioni Test t: campioni appaiati Si inseriscono le coppie di variabili da confrontare (è possibile inserire più coppie per fare confronti multipli) E’ possibile anche chiedere gli intervalli di confidenza Test t: campioni appaiati Indice di correlazione. Se le due variabili non risultano correlate non stiamo usando il test corretto! Esercizi File pubbl.xls Pubblicità di una data marca di bibite. Abbiamo valutazioni della stessa prima e dopo aver visto lo spot: nel punteggio sono comprese le valutazioni di diversi aspetti del prodotto Lo spot riesce a modificare le opinioni del cliente sul prodotto? Se sì, come? Significatività (p-value) Esercizi File amnesia.xls Programma di riabilitazione dell’amnesia. Si valutano i pazienti prima e dopo il trattamento, con un test standardizzato (punteggio da 1 a 20, patologico sotto il 12) Il trattamento è efficace? Dividiamo i soggetti a seconda che siano o meno patologici. Il trattamento è efficace in entrambi gruppi? Test t: campioni indipendenti Serve a capire se le medie di due gruppi sono diverse in modo significativo Esempi: Due gruppi di pazienti sottoposti a diverse terapie (farmacologica vs. psicoterapia) QI di due gruppi di soggetti di estrazione sociale differente Esercizi File recog.xls Riconoscimento di volti ed oggetti noti. Sono registrati i tempi di reazione. La velocità di risposta ai due tipi di stimoli è differente? A quali si risponde più velocemente? Tra gli assunti del t-test vi è anche la normalità delle distribuzioni. Le distribuzioni sono normali? In caso negativo, possiamo normalizzarle? Cambia qualcosa nei risultati? Anche questa caratteristica si vede nell’organizzazione del data-set! C’è una sola variabile di interesse e una variabile che definisce i diversi gruppi. ATTENZIONE! Data-set molto diverso rispetto a campioni appaiati Test t: campioni indipendenti Test t: campioni indipendenti Variabile di interesse (solito sistema) Variabile che definisce i gruppi ASSUNTI Normalità della differenza tra i punteggi Indipendenza delle osservazioni Varianze uguali nei due gruppi (poi ne riparliamo) Definire i gruppi secondo le modalità della variabile Inserita o indicando un punto di divisione Test t: campioni indipendenti Test di Levene Test di Levene: ci informa di possibili violazioni dell’assunto sull’uguaglianza delle varianze. Due possibilità: non significativo (p>.05): le varianze non differiscono in modo significativo. Tutto ok, procedo col normale t-test e guardo la prima riga Significativo (p<.05): ATTENZIONE, le varianze sono diverse. Devo usare una versione “corretta” del t-test; guardo quindi la seconda riga Significatività (p-value) Test t: campioni indipendenti Esercizi File farmaco.xls Per valutare l’efficacia di un farmaco si esaminano due gruppi di pazienti: ad un gruppo è somministrato il farmaco stesso, ad un altro un placebo. Il farmaco è efficace? Sospettiamo che il farmaco abbia effetto solo su pazienti abbastanza giovani (<30 anni) Che riga devo guardare? Come possiamo verificarlo? Il nostro sospetto era fondato? Esercizi Chi quadrato File musica.xls Compito di riconoscimento di melodie in un gruppo di musicisti e in un gruppo di controllo. I musicisti sono più rapidi dei controlli? Quante “code” considero? Non potrebbe essere un effetto di scolarità? Valutare se la scolarità è differente in modo significativo Se sì, come si potrebbe valutare la sua eventuale influenza? Chi quadrato Si usa per valutare se due o più campioni espressi in frequenze differiscono significativamente l’uno dall’altro. NB: si usano le frequenze di dati qualitativi Esempio: Preferenze musicali in diversi gruppi di età Da matrice di dati grezzi Si inseriscono le due variabili che si incrociano (righe x colonne) Inserimento dati: 1. 2. Da matrice di dati grezzi Da matrice con dati pesati (frequenze) Da dati pesati Chi quadrato Si inseriscono le frequenze così da “pesare” i dati QUI SI PUO’ CHIEDERE IL CHI QUADRATO Poi si procede come nel caso precedente Impostare le celle come si preferisce Tabelle di contingenza Chi quadrato Frequenze osservate contro frequenze attese (è quello su cui si basa il test) Altrimenti problema! (vedi dopo) Casi particolari Chi quadrato – singolo campione Variabile di interesse Significatività (p-value) Test esatto di Fisher Per tabelle 2x2 quando una o più frequenze attese sono minori di 5 Computato automaticamente da SPSS Inserire distribuzione uniforme o distribuzione di frequenza nota Test di McNemar Serve a valutare la presenza di cambiamenti nel tempo (cfr. t-test campioni appaiati) Analizza/Test non parametrici/2 campioni relati/ Esercizi File programmi.sav Vogliamo sapere maschi e femmine differiscono nelle loro preferenze riguardo diversi programmi televisivi (i.e., se esiste una relazione tra il genere e il tipo di programmi preferiti) File aborto.sav Vogliamo sapere se esiste un relazione tra età e opinione riguardo il tema dell’aborto Esercizi File sinestesia.sav Campione di soggetti con sospetta sinestesia. Ad un’indagine approfondita, solo pochi risultano presentare davvero il fenomeno. Diverso per maschi e femmine? File politica.sav Vogliamo sapere se le preferenze dei soggetti (n=250) sono ugualmente distribuite tra i 5 candidati Esercizi File india.sav L’incidenza della demenza AD a livello mondiale è di 8% in soggetti con più di 75 anni. Sembra però che nel sub-continente indiano sia presente in misura molto minore. Si ha un campione di 200 soggetti, indiani, con più di 75 anni. Valutare se l’incidenza di AD è davvero differente rispetto al resto del mondo.