Test t Test t - Dipartimento di Psicologia

Transcript

Test t Test t - Dipartimento di Psicologia
Analizza/Confronta medie
ELEMENTI DI PSICOMETRIA
Esercitazione n. 77-8-9-10
t-test e confronto tra medie
chi quadrato
C.d.L. Comunicazione e Psicologia
a.a. 2008/09
Medie…
Calcola medie e altre statistiche di una
data variabile (dipendente) in diversi
sottogruppi.
I sottogruppi sono creati a partire dalle
categorie di una (o più) variabili
indipendenti.
Confronta con “dividi” e “esplora”
categorie
NB: tramite il comando “opzioni” è possibile
selezionare diversi indici (es: d.s.,
mediana, ecc)
Test t
Test t
H0 : µ1 = µ2
Il t-test è usato per valutare se la
differenza tra le medie di due gruppi o
condizioni è significativa
Capire se la differenza osservata tra
(necessariamente) campioni corrisponde
ad una differenza reale
H1 : µ1 ≠ µ2 (bidirezionale)
oppure
µ1 > µ2 (monodirezionale dx)
oppure
µ1 < µ2 (monodirezionale sx)
Quanto è probabile che ci sia differenza
nel campione se non esiste differenza
nella popolazione?
p<.05 rifiuto H0!
“Quante code ha la bestia?”
Test t
Due code
Campione
unico
Campioni indipendenti
Campioni appaiati
Non facciamo previsioni sulla differenza
Teniamo il p così come ci è dato
Una coda
Ipotizziamo ci sia una “direzionalità”
Dimezziamo il p dato da SPSS
Nel caso la differenza sia nella direzione
non prevista, però, dobbiamo considerare
insensati i nostri dati!
Test t: campione unico
Test t: campione unico
Confronta la media di una campione con un
valore prefissato (teorico)
Qui si inserisce il
valore di riferimento
ASSUNTI
E’ possibile anche
chiedere gli intervalli
di confidenza
Normalità (vedi lezione precedente)
Indipendenza delle osservazioni
Test t: campione unico
Esercizi
Significatività (p-value)
Intervalli di confidenza
File impl.xls
Compito di elaborazione implicita: parole (n=50) e nonparole (n=50) sono presentate per 35ms (non
percepibili) e i soggetti hanno il compito di identificarle.
Vorremmo soggetti di circa 20 anni. L’età dei
partecipanti è significativamente diversa da 20?
Calcoliamo la prestazione in termini di accuratezza
(da 0 a 1)
Come possiamo valutare se la performance dei
partecipanti è diversa dal caso?
Possiamo concludere che ci sia una percezione
implicita delle parole a 35ms?
Esercizi
File aphasia.xls
Prestazione di pazienti con disturbi del linguaggio ad un
compito di lettura di parole
A metà pazienti (gruppo 1) sono somministrati 50 stimoli,
all’altra metà (gruppo 2) 120 stimoli
Calcolare accuratezza del singolo paziente
Il compito è molto facile: i soggetti sani hanno
prestazione a soffitto
La performance dei pazienti è significativamente
diversa da quella dei normali?
Valutare la performance di ognuno dei due gruppi.
Cosa possiamo concludere?
Correlazione: cenni
Che significa “correlati”?!
La correlazione misura il grado di associazione delle
variabili in esame
Test t: campioni appaiati
Fornisce la significatività statistica della
differenza tra le medie di due variabili
Esempi:
Due condizioni (es: due test) a cui un unico
gruppo è sottoposto
Due gruppi altamente correlati (es: marito e
moglie, coppie di fratelli)
Questa caratteristica si
riflette nell’organizzazione
del data-set!
Ogni singolo caso (riga)
incrocia le due variabili
(colonne) da confrontare.
Coefficiente di correlazione (r): -1<r<1
r<0: al crescere di v1 diminuisce v2
r>0: al crescere di v1 aumenta v2
r=0: non c’è associazione
Test t: campioni appaiati
ASSUNTI
Normalità della differenza tra i
punteggi
Indipendenza delle osservazioni
Test t: campioni appaiati
Si inseriscono le coppie
di variabili da confrontare
(è possibile inserire più
coppie per fare confronti
multipli)
E’ possibile anche
chiedere gli intervalli
di confidenza
Test t: campioni appaiati
Indice di correlazione.
Se le due variabili non
risultano correlate non
stiamo usando il test
corretto!
Esercizi
File pubbl.xls
Pubblicità di una data marca di bibite. Abbiamo
valutazioni della stessa prima e dopo aver visto
lo spot: nel punteggio sono comprese le
valutazioni di diversi aspetti del prodotto
Lo spot riesce a modificare le opinioni del
cliente sul prodotto?
Se sì, come?
Significatività (p-value)
Esercizi
File amnesia.xls
Programma di riabilitazione dell’amnesia. Si
valutano i pazienti prima e dopo il trattamento,
con un test standardizzato (punteggio da 1 a 20,
patologico sotto il 12)
Il trattamento è efficace?
Dividiamo i soggetti a seconda che siano o
meno patologici.
Il trattamento è efficace in entrambi gruppi?
Test t: campioni indipendenti
Serve a capire se le medie di due gruppi
sono diverse in modo significativo
Esempi:
Due gruppi di pazienti sottoposti a diverse
terapie (farmacologica vs. psicoterapia)
QI di due gruppi di soggetti di estrazione
sociale differente
Esercizi
File recog.xls
Riconoscimento di volti ed oggetti noti. Sono registrati i
tempi di reazione.
La velocità di risposta ai due tipi di stimoli è
differente?
A quali si risponde più velocemente?
Tra gli assunti del t-test vi è anche la normalità delle
distribuzioni.
Le distribuzioni sono normali?
In caso negativo, possiamo normalizzarle?
Cambia qualcosa nei risultati?
Anche questa
caratteristica si vede
nell’organizzazione del
data-set!
C’è una sola variabile
di interesse e una
variabile che definisce i
diversi gruppi.
ATTENZIONE!
Data-set molto diverso
rispetto a campioni
appaiati
Test t: campioni indipendenti
Test t: campioni indipendenti
Variabile di interesse
(solito sistema)
Variabile che definisce
i gruppi
ASSUNTI
Normalità della differenza tra i
punteggi
Indipendenza delle osservazioni
Varianze uguali nei due gruppi (poi
ne riparliamo)
Definire i gruppi secondo le
modalità della variabile
Inserita o indicando un
punto di divisione
Test t: campioni indipendenti
Test di Levene
Test di Levene: ci
informa di possibili
violazioni dell’assunto
sull’uguaglianza delle
varianze.
Due possibilità:
non significativo (p>.05): le varianze non differiscono in modo
significativo. Tutto ok, procedo col normale t-test e guardo la prima riga
Significativo (p<.05): ATTENZIONE, le varianze sono diverse. Devo
usare una versione “corretta” del t-test; guardo quindi la seconda riga
Significatività (p-value)
Test t: campioni indipendenti
Esercizi
File farmaco.xls
Per valutare l’efficacia di un farmaco si esaminano due
gruppi di pazienti: ad un gruppo è somministrato il
farmaco stesso, ad un altro un placebo.
Il farmaco è efficace?
Sospettiamo che il farmaco abbia effetto solo su
pazienti abbastanza giovani (<30 anni)
Che riga devo guardare?
Come possiamo verificarlo?
Il nostro sospetto era fondato?
Esercizi
Chi quadrato
File musica.xls
Compito di riconoscimento di melodie in un
gruppo di musicisti e in un gruppo di controllo.
I musicisti sono più rapidi dei controlli?
Quante “code” considero?
Non potrebbe essere un effetto di scolarità?
Valutare se la scolarità è differente in modo
significativo
Se sì, come si potrebbe valutare la sua
eventuale influenza?
Chi quadrato
Si usa per valutare se due o più campioni
espressi in frequenze differiscono
significativamente l’uno dall’altro.
NB: si usano le frequenze di dati qualitativi
Esempio:
Preferenze musicali in diversi gruppi di età
Da matrice di dati grezzi
Si inseriscono le due variabili
che si incrociano
(righe x colonne)
Inserimento dati:
1.
2.
Da matrice di dati grezzi
Da matrice con dati pesati (frequenze)
Da dati pesati
Chi quadrato
Si inseriscono le frequenze
così da “pesare” i dati
QUI SI PUO’ CHIEDERE IL
CHI QUADRATO
Poi si procede come nel caso precedente
Impostare le celle
come si preferisce
Tabelle di contingenza
Chi quadrato
Frequenze osservate contro frequenze attese
(è quello su cui si basa il test)
Altrimenti problema!
(vedi dopo)
Casi particolari
Chi quadrato – singolo campione
Variabile di interesse
Significatività (p-value)
Test esatto di Fisher
Per tabelle 2x2 quando una o più frequenze
attese sono minori di 5
Computato automaticamente da SPSS
Inserire distribuzione uniforme
o distribuzione di frequenza nota
Test di McNemar
Serve a valutare la presenza di cambiamenti
nel tempo (cfr. t-test campioni appaiati)
Analizza/Test non parametrici/2 campioni relati/
Esercizi
File programmi.sav
Vogliamo sapere maschi e femmine differiscono
nelle loro preferenze riguardo diversi programmi
televisivi (i.e., se esiste una relazione tra il
genere e il tipo di programmi preferiti)
File aborto.sav
Vogliamo sapere se esiste un relazione tra età e
opinione riguardo il tema dell’aborto
Esercizi
File sinestesia.sav
Campione di soggetti con sospetta sinestesia.
Ad un’indagine approfondita, solo pochi risultano
presentare davvero il fenomeno. Diverso per
maschi e femmine?
File politica.sav
Vogliamo sapere se le preferenze dei soggetti
(n=250) sono ugualmente distribuite tra i 5
candidati
Esercizi
File india.sav
L’incidenza della demenza AD a livello mondiale
è di 8% in soggetti con più di 75 anni. Sembra
però che nel sub-continente indiano sia presente
in misura molto minore.
Si ha un campione di 200 soggetti, indiani, con
più di 75 anni. Valutare se l’incidenza di AD è
davvero differente rispetto al resto del mondo.