Elementi di Psicometria con Laboratorio di SPSS 1

Transcript

Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1
05-Deviazione standard e punteggi z
vers. 1.1 (22 ottobre 2014)
Germano Rossi1
[email protected]
1 Dipartimento
di Psicologia, Università di Milano-Bicocca
2014-2015
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
1 / 26
Introduzione
Per le variabili quantitative usiamo delle unità di misura (anni,
numero di errori. . . )
I punteggi grezzi (ciò che abbiamo misurato) sono semplici da
interpretare se conosciamo la scala su cui sono misurati (i metri, i
gradi centigradi e simili)
Non sono facili da interpretare se usano scale non conosciute (ad
es. intervallo 6-36 oppure 30-180)
Variabili diverse possono usare unità diverse (età,
soddisfazione. . . ) con metriche diverse (età -> 0-n; soddisfazione
-> 0-10, . . . ) che possono cambiare da una cultura all’altra (kg o
libbre, km o miglia, . . . )
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
2 / 26
Introduzione
Non sono molto utili neppure per confrontare fra loro variabili
diverse: un 25 in un test di abilità matematica (AM) è migliore o
peggiore di un 55 in un test di abilità verbale (AV)?
Dipende dalle relative scale:
se AM ha un range 1-30
e AV un range 10-60
entrambi i punteggi sono abbastanza vicini al valore massimo
Ma uno è “migliore” dell’altro?
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
3 / 26
Introduzione
Nella vita reale, le unità di misura sono già un’enorme
semplificazione della nostra vita
Confrontare variabili diverse fra loro non è possibile se non
usando la stessa scala di misura e lo stesso metro
È come decidere se 3 banane sono di più di 3 arance
Sono cose diverse e non possiamo confrontarle
A meno di non trasformarle in una stessa unità di misura
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
4 / 26
Confrontare variabili
Ad esempio
“3 banane pesano di più di 3 arance?”
“In 3 banane ci sono più vitamine che in 3 arance?”
“3 banane occupano più spazio di 3 arance?”
“ci sono più frutti di tipo ’banane’ o di tipo ’arance’?”
Ma in statistica vorremmo avere un’unica un’unità di misura che valga
per misurare qualsiasi variabile
Quale potrebbe essere questa unità di misura?
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
5 / 26
Distanze dalla media
0
1
2
3
4
5
6
7
8
9
10
L’unità di misura parte da 0 e va fino a 10. Se sottraiamo 5 a tutti i punteggi
otteniamo:
-5
-4
-3
-2
-1
0
+1
+2
+3
+4
+5
L’unità di misura parte da -5 e va fino a +5
Non cambia nulla, abbiamo trasformato lo zero assoluto in uno zero relativo.
La nuova unità di misura è la deviazione dalla media (x − M ); in termini più
precisi è “quante unità di misura di questa variabile, ogni punteggio dista
dalla media della variabile”.
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
6 / 26
Deviazione standard
Non basta modificare la metrica ed esprimere tutto in base a
“quanti scarti ci sono da qui alla media”
perché ogni variabile ha una sua estensione e una sua unità di
misura specifica
Anche se diciamo che “X dista 2 dalla sua media” e “Y dista 3
dalla sua media”, se X misura i chilometri e Y il peso. . . . non
possiamo fare confronti.
Ma la deviazione standard è la radice quadrata della varianza
s
P
√
(Xi − X)2
ds = var =
N
e se esprimiamo gli scarti in termini di distanza. . . .
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
7 / 26
Trasformazioni lineari
Abbiamo visto che se aggiungo o sottraggo una costante ad una
distribuzione, la media subisce la stessa trasformazione
X
X
X=
X⇒
(X + k) = X + k
per cui se io tolgo ad AM e AV la loro media, trasformo le due variabili in
modo che abbiano entrambe M=0
X
(X − X) = X − X = 0
Ho semplicemente spostato le misure in modo che la media di entrambe
fosse 0.
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
8 / 26
Trasformazioni lineari
Adesso hanno la stessa media (zero) ma hanno ancora varianza diversa
Come possiamo rendere i campi di variazione uguali?
Una prima possibilità è di dividere tutto per un determinato valore (ad
es. le rispettive gamme) e poi moltiplicare tutto per uno stesso valore
(ad es. 100)
Un’altra possibilità è quella di usare la deviazione standard come unità
di misura
In pratica, ci chiediamo “Quante deviazioni standard ci sono fra un
determinato valore X e la media?”
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
9 / 26
Variabili standardizzate
Punti z
“Quante deviazioni standard ci sono fra un determinato valore X e
la media?”
La risposta implica utilizzare la deviazione standard (σ) come
nuova unità di misura
Gli scarti dalla media (X − X) vengono divisi per la dev. st.:
zx =
X −X
σ
Il punteggio trasformato in “numero di scarti dalla media” si
chiama punto z o punteggio z
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
10 / 26
Variabili standardizzate
Punti z
Il punto z è una misura standard
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
11 / 26
Variabili standardizzate
Punti z
Il punto z è una misura standard
La media dei punti z è 0 (z = 0), visto che un qualunque punteggio
corrispondente alla media sarebbe a 0 scarti dalla media
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
11 / 26
Variabili standardizzate
Punti z
Il punto z è una misura standard
La media dei punti z è 0 (z = 0), visto che un qualunque punteggio
corrispondente alla media sarebbe a 0 scarti dalla media
X
La somma dei punti z è 0 (
z = 0), perché i punti z sono scarti
dalla media trasformati in modo uniforme e la somma degli scarti
è0
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
11 / 26
Variabili standardizzate
Punti z
Il punto z è una misura standard
La media dei punti z è 0 (z = 0), visto che un qualunque punteggio
corrispondente alla media sarebbe a 0 scarti dalla media
X
La somma dei punti z è 0 (
z = 0), perché i punti z sono scarti
dalla media trasformati in modo uniforme e la somma degli scarti
è0
La deviazione standard dei punti z è 1 (σz = 1), perché la
deviazione standard è l’unità di misura
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
11 / 26
Variabili standardizzate
Punti z
Il punto z è una misura standard
La media dei punti z è 0 (z = 0), visto che un qualunque punteggio
corrispondente alla media sarebbe a 0 scarti dalla media
X
La somma dei punti z è 0 (
z = 0), perché i punti z sono scarti
dalla media trasformati in modo uniforme e la somma degli scarti
è0
La deviazione standard dei punti z è 1 (σz = 1), perché la
deviazione standard è l’unità di misura
Valori negativi indicano punteggi inferiori alla media
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
11 / 26
Variabili standardizzate
Punti z
Il punto z è una misura standard
La media dei punti z è 0 (z = 0), visto che un qualunque punteggio
corrispondente alla media sarebbe a 0 scarti dalla media
X
La somma dei punti z è 0 (
z = 0), perché i punti z sono scarti
dalla media trasformati in modo uniforme e la somma degli scarti
è0
La deviazione standard dei punti z è 1 (σz = 1), perché la
deviazione standard è l’unità di misura
Valori negativi indicano punteggi inferiori alla media
Valori positivi, punteggi sopra la media
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
11 / 26
Variabili standardizzate
Punti Z
La trasformazione in punti z, si dice anche “standardizzazione”
La distribuzione dei punti z si dice “distribuzione standardizzata”
perché è una delle tante possibili curve di frequenza, ma con
media e ds conosciute a priori
I punti z permettono di confrontare fra loro punteggi provenienti da
distribuzioni di frequenza diverse
Esempio
x=70, M=82, σ=12 (z=-1) x=23, M=35, σ= 6 (z=-2)
23 è 2 ds al di sotto della sua media, mentre 70 è solo 1 ds sotto la
sua media; se fossero punteggi di profitto, confrontandoli, dovremmo
dire 23 è un valore “peggiore” rispetto a 70 non perché è più piccolo
ma perché il suo punto z è inferiore
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
12 / 26
Variabili standardizzate
Esempi d’uso dei punti z
Conoscendo media, varianza e il punto z, si può calcolare il valore
di X (cioè il punto grezzo):
X = X + zx σx
Esempio
Se un test di profitto ha M=82 è σ=12, a quale punteggio corrisponde il
punto z=1.2?
X = 82 + 1.2 ∗ 12 = 96.4
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
13 / 26
Variabili standardizzate
Scale derivate dai punti z
Ci sono scale standardizzate utilizzate comunemente in psicologia
(specie per i test) che derivano dai punti z
punteggi T: hanno media 50 e ds=10. Si ottengono con
T = 10z + 50
punteggi SAT: hanno media 500 e ds=100. Si ottengono con
SAT = 100z + 500
QI o IQ: la maggior parte dei test d’intelligenza (come il WAIS)
utilizza una media di 100 e ds=15. Si ottengono con
QI = 15z + 100
QI o IQ: il test d’intelligenza Stanford-Binet utilizza una media di
100 e ds=16. Si ottengono con QI = 16z + 100
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
14 / 26
Variabili standardizzate
Spss: punti z
Spss permette di calcolare i punti z di una variabile per ogni unità
statistica, tramite Analizza | Statistiche descrittive
| Descrittive... e attivando il flag Salva valori
standardizzati come variabili
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
15 / 26
Variabili standardizzate
Spss: punti z
Viene aggiunta una variabile con il nome corrispondente
preceduto da Z
Questa variabile può essere usata come qualsiasi altra
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
16 / 26
Variabili standardizzate
Tavole della distr. normale
Nella curva normale
ogni z corrisponde ad
un area
L’area può essere
proposta in modi diversi
Ad ogni z corrisponde
un’area fino a z=−∞
Fra z=−3 e z=−∞ c’è
un’area del 99.87%
La tavola del vostro libro (Howitt) propone l’area per determinati
punti z
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
17 / 26
Variabili standardizzate
Tavole della distr. normale
Alcuni punti z corrispondono ad
aree particolari
z=-1.64 corrisponde al 5%/95%
z=-1.96 corrisponde al
2.5%/97.5%
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
18 / 26
Variabili standardizzate
Tavole della distr. normale
La curva normale è simmetrica
Quindi ogni metà è il 50%
Allontanandoci da z=0 abbiamo
aree simili per z simili
z=-0.10 -> 53.98% (cioè 3.98%
sotto)
z=0.10 -> 46.02% (cioè
50-46.02=3.98% sopra la media)
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
19 / 26
Variabili standardizzate
Tavole della distr. normale
z=1.64 corrisponde al 95%/5%
z=1.96 corrisponde al
97.5%/2.5%
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
20 / 26
Variabili standardizzate
Tavole della distr. normale
Altri libri riportano tavole più complete (ad es. Welkowitz, Cohen, Ewen:
Tavola A, p. 473 ss.)
La tavola riporta le proporzione di
area sottese alla curva normale
calcolate a partire dalla media
(ricordarsi che l’intera area è
simmetrica)
Per ogni punto z viene indicata
l’area fra z=0 e il punto z stesso
(area in grigio)
La proporzione di area è indicata
come percentuale (34,13) con
due decimali
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
21 / 26
Variabili standardizzate
Tavole della distr. normale
La prima colonna indica il primo decimale del punto z, ogni colonna
successiva indica il secondo decimale
All’incrocio fra una riga (ad es. 0,3) e una colonna (0,05) troviamo l’area
corrispondente (ad es. 0,35)
Es. l’area fra z=0,35 e 0 è pari a 13,68
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
22 / 26
Variabili standardizzate
Esempi d’uso dei punti z
Qual è la % di soggetti con un punteggio inferiore o uguale a 120 (M=100,
s=20)?
calcolo il punto z
[(120-100)/20=1]
tavole della normale; cerco la riga
corrispondente a z=1.0, avanzo
fino alla colonna 0 e leggo l’area
corrispondente [34,13]
questa è l’area fra la z=0 e z=|1|;
mi interessa anche la metà
inferiore, sommo 50,00 [50,00 +
34.13 = 84.13%]
oppure Howitt; cerco 1.00, trovo
15.87%, ma è quella superiore,
quindi 100-15.87=84.13%
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
23 / 26
Variabili standardizzate
Esempi d’uso dei punti z
Qual è la % di soggetti con un punteggio inferiore a 80 (M=100, s=20)?
calcolo il punto z [(80-100)/20=-1]
negativo perché sotto la media
tavole della normale; cerco la riga
corrispondente a z 1.0, avanzo
fino alla colonna 0 e leggo l’area
corrispondente [34,13]
poiché questa è l’area fra la z=0
e z=|1| e mi interessa l’area
inferiore, faccio il complemento
[50,00 - 34,13 = 15.87%]
oppure Howitt; cerco -1.00, trovo
84.13%, ma è quella superiore,
quindi 100-84.13=15.87%
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
24 / 26
Variabili standardizzate
Esempi d’uso dei punti z
Qual è la % di soggetti con punteggio compreso fra 80 e 120?
calcolo i punti z [-1 e +1]
tavole della normale; cerco la riga
corrispondete al punto z 1.0,
avanzo fino alla colonna 0 e leggo
l’area corrispondente [34,13]
poiché questa è l’area fra la z=0
e z=|1| ed entrambe sono uguali,
sommo l’area 2 volte [34,13 +
34,13 = 68.26%]
oppure Howitt; cerco 1.00, trovo
34.13%, raddoppio, quindi 34,13
+ 34,13 = 68.26%
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
25 / 26
Variabili standardizzate
Esempi d’uso dei punti z
A quale punto z corrisponde l’area con il 10% di punteggi superiori?
poiché le tavole indicano l’area
fra z=0 e z=x, devo trovare il resto
di 10,00 [50,00-10,00=40,00]
cerco dentro le tavole una
proporzione che si avvicini a
40,00. . . corrisponde a z=1.28
i punteggi il cui z è >= di 1.28,
rientrano nel 10% superiore
oppure Howitt; cerco un’area
vicina al 10% sul lato positivo;
trovo 9.68% -> z=1.30
G. Rossi (Dip. Psicologia)
ElemPsico
2014-2015
26 / 26