Elementi di Psicometria con Laboratorio di SPSS 1
Transcript
Elementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 05-Deviazione standard e punteggi z vers. 1.1 (22 ottobre 2014) Germano Rossi1 [email protected] 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2014-2015 G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 1 / 26 Introduzione Per le variabili quantitative usiamo delle unità di misura (anni, numero di errori. . . ) I punteggi grezzi (ciò che abbiamo misurato) sono semplici da interpretare se conosciamo la scala su cui sono misurati (i metri, i gradi centigradi e simili) Non sono facili da interpretare se usano scale non conosciute (ad es. intervallo 6-36 oppure 30-180) Variabili diverse possono usare unità diverse (età, soddisfazione. . . ) con metriche diverse (età -> 0-n; soddisfazione -> 0-10, . . . ) che possono cambiare da una cultura all’altra (kg o libbre, km o miglia, . . . ) G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 2 / 26 Introduzione Non sono molto utili neppure per confrontare fra loro variabili diverse: un 25 in un test di abilità matematica (AM) è migliore o peggiore di un 55 in un test di abilità verbale (AV)? Dipende dalle relative scale: se AM ha un range 1-30 e AV un range 10-60 entrambi i punteggi sono abbastanza vicini al valore massimo Ma uno è “migliore” dell’altro? G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 3 / 26 Introduzione Nella vita reale, le unità di misura sono già un’enorme semplificazione della nostra vita Confrontare variabili diverse fra loro non è possibile se non usando la stessa scala di misura e lo stesso metro È come decidere se 3 banane sono di più di 3 arance Sono cose diverse e non possiamo confrontarle A meno di non trasformarle in una stessa unità di misura G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 4 / 26 Confrontare variabili Ad esempio “3 banane pesano di più di 3 arance?” “In 3 banane ci sono più vitamine che in 3 arance?” “3 banane occupano più spazio di 3 arance?” “ci sono più frutti di tipo ’banane’ o di tipo ’arance’?” Ma in statistica vorremmo avere un’unica un’unità di misura che valga per misurare qualsiasi variabile Quale potrebbe essere questa unità di misura? G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 5 / 26 Distanze dalla media 0 1 2 3 4 5 6 7 8 9 10 L’unità di misura parte da 0 e va fino a 10. Se sottraiamo 5 a tutti i punteggi otteniamo: -5 -4 -3 -2 -1 0 +1 +2 +3 +4 +5 L’unità di misura parte da -5 e va fino a +5 Non cambia nulla, abbiamo trasformato lo zero assoluto in uno zero relativo. La nuova unità di misura è la deviazione dalla media (x − M ); in termini più precisi è “quante unità di misura di questa variabile, ogni punteggio dista dalla media della variabile”. G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 6 / 26 Deviazione standard Non basta modificare la metrica ed esprimere tutto in base a “quanti scarti ci sono da qui alla media” perché ogni variabile ha una sua estensione e una sua unità di misura specifica Anche se diciamo che “X dista 2 dalla sua media” e “Y dista 3 dalla sua media”, se X misura i chilometri e Y il peso. . . . non possiamo fare confronti. Ma la deviazione standard è la radice quadrata della varianza s P √ (Xi − X)2 ds = var = N e se esprimiamo gli scarti in termini di distanza. . . . G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 7 / 26 Trasformazioni lineari Abbiamo visto che se aggiungo o sottraggo una costante ad una distribuzione, la media subisce la stessa trasformazione X X X= X⇒ (X + k) = X + k per cui se io tolgo ad AM e AV la loro media, trasformo le due variabili in modo che abbiano entrambe M=0 X (X − X) = X − X = 0 Ho semplicemente spostato le misure in modo che la media di entrambe fosse 0. G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 8 / 26 Trasformazioni lineari Adesso hanno la stessa media (zero) ma hanno ancora varianza diversa Come possiamo rendere i campi di variazione uguali? Una prima possibilità è di dividere tutto per un determinato valore (ad es. le rispettive gamme) e poi moltiplicare tutto per uno stesso valore (ad es. 100) Un’altra possibilità è quella di usare la deviazione standard come unità di misura In pratica, ci chiediamo “Quante deviazioni standard ci sono fra un determinato valore X e la media?” G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 9 / 26 Variabili standardizzate Punti z “Quante deviazioni standard ci sono fra un determinato valore X e la media?” La risposta implica utilizzare la deviazione standard (σ) come nuova unità di misura Gli scarti dalla media (X − X) vengono divisi per la dev. st.: zx = X −X σ Il punteggio trasformato in “numero di scarti dalla media” si chiama punto z o punteggio z G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 10 / 26 Variabili standardizzate Punti z Il punto z è una misura standard G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 11 / 26 Variabili standardizzate Punti z Il punto z è una misura standard La media dei punti z è 0 (z = 0), visto che un qualunque punteggio corrispondente alla media sarebbe a 0 scarti dalla media G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 11 / 26 Variabili standardizzate Punti z Il punto z è una misura standard La media dei punti z è 0 (z = 0), visto che un qualunque punteggio corrispondente alla media sarebbe a 0 scarti dalla media X La somma dei punti z è 0 ( z = 0), perché i punti z sono scarti dalla media trasformati in modo uniforme e la somma degli scarti è0 G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 11 / 26 Variabili standardizzate Punti z Il punto z è una misura standard La media dei punti z è 0 (z = 0), visto che un qualunque punteggio corrispondente alla media sarebbe a 0 scarti dalla media X La somma dei punti z è 0 ( z = 0), perché i punti z sono scarti dalla media trasformati in modo uniforme e la somma degli scarti è0 La deviazione standard dei punti z è 1 (σz = 1), perché la deviazione standard è l’unità di misura G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 11 / 26 Variabili standardizzate Punti z Il punto z è una misura standard La media dei punti z è 0 (z = 0), visto che un qualunque punteggio corrispondente alla media sarebbe a 0 scarti dalla media X La somma dei punti z è 0 ( z = 0), perché i punti z sono scarti dalla media trasformati in modo uniforme e la somma degli scarti è0 La deviazione standard dei punti z è 1 (σz = 1), perché la deviazione standard è l’unità di misura Valori negativi indicano punteggi inferiori alla media G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 11 / 26 Variabili standardizzate Punti z Il punto z è una misura standard La media dei punti z è 0 (z = 0), visto che un qualunque punteggio corrispondente alla media sarebbe a 0 scarti dalla media X La somma dei punti z è 0 ( z = 0), perché i punti z sono scarti dalla media trasformati in modo uniforme e la somma degli scarti è0 La deviazione standard dei punti z è 1 (σz = 1), perché la deviazione standard è l’unità di misura Valori negativi indicano punteggi inferiori alla media Valori positivi, punteggi sopra la media G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 11 / 26 Variabili standardizzate Punti Z La trasformazione in punti z, si dice anche “standardizzazione” La distribuzione dei punti z si dice “distribuzione standardizzata” perché è una delle tante possibili curve di frequenza, ma con media e ds conosciute a priori I punti z permettono di confrontare fra loro punteggi provenienti da distribuzioni di frequenza diverse Esempio x=70, M=82, σ=12 (z=-1) x=23, M=35, σ= 6 (z=-2) 23 è 2 ds al di sotto della sua media, mentre 70 è solo 1 ds sotto la sua media; se fossero punteggi di profitto, confrontandoli, dovremmo dire 23 è un valore “peggiore” rispetto a 70 non perché è più piccolo ma perché il suo punto z è inferiore G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 12 / 26 Variabili standardizzate Esempi d’uso dei punti z Conoscendo media, varianza e il punto z, si può calcolare il valore di X (cioè il punto grezzo): X = X + zx σx Esempio Se un test di profitto ha M=82 è σ=12, a quale punteggio corrisponde il punto z=1.2? X = 82 + 1.2 ∗ 12 = 96.4 G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 13 / 26 Variabili standardizzate Scale derivate dai punti z Ci sono scale standardizzate utilizzate comunemente in psicologia (specie per i test) che derivano dai punti z punteggi T: hanno media 50 e ds=10. Si ottengono con T = 10z + 50 punteggi SAT: hanno media 500 e ds=100. Si ottengono con SAT = 100z + 500 QI o IQ: la maggior parte dei test d’intelligenza (come il WAIS) utilizza una media di 100 e ds=15. Si ottengono con QI = 15z + 100 QI o IQ: il test d’intelligenza Stanford-Binet utilizza una media di 100 e ds=16. Si ottengono con QI = 16z + 100 G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 14 / 26 Variabili standardizzate Spss: punti z Spss permette di calcolare i punti z di una variabile per ogni unità statistica, tramite Analizza | Statistiche descrittive | Descrittive... e attivando il flag Salva valori standardizzati come variabili G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 15 / 26 Variabili standardizzate Spss: punti z Viene aggiunta una variabile con il nome corrispondente preceduto da Z Questa variabile può essere usata come qualsiasi altra G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 16 / 26 Variabili standardizzate Tavole della distr. normale Nella curva normale ogni z corrisponde ad un area L’area può essere proposta in modi diversi Ad ogni z corrisponde un’area fino a z=−∞ Fra z=−3 e z=−∞ c’è un’area del 99.87% La tavola del vostro libro (Howitt) propone l’area per determinati punti z G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 17 / 26 Variabili standardizzate Tavole della distr. normale Alcuni punti z corrispondono ad aree particolari z=-1.64 corrisponde al 5%/95% z=-1.96 corrisponde al 2.5%/97.5% G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 18 / 26 Variabili standardizzate Tavole della distr. normale La curva normale è simmetrica Quindi ogni metà è il 50% Allontanandoci da z=0 abbiamo aree simili per z simili z=-0.10 -> 53.98% (cioè 3.98% sotto) z=0.10 -> 46.02% (cioè 50-46.02=3.98% sopra la media) G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 19 / 26 Variabili standardizzate Tavole della distr. normale z=1.64 corrisponde al 95%/5% z=1.96 corrisponde al 97.5%/2.5% G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 20 / 26 Variabili standardizzate Tavole della distr. normale Altri libri riportano tavole più complete (ad es. Welkowitz, Cohen, Ewen: Tavola A, p. 473 ss.) La tavola riporta le proporzione di area sottese alla curva normale calcolate a partire dalla media (ricordarsi che l’intera area è simmetrica) Per ogni punto z viene indicata l’area fra z=0 e il punto z stesso (area in grigio) La proporzione di area è indicata come percentuale (34,13) con due decimali G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 21 / 26 Variabili standardizzate Tavole della distr. normale La prima colonna indica il primo decimale del punto z, ogni colonna successiva indica il secondo decimale All’incrocio fra una riga (ad es. 0,3) e una colonna (0,05) troviamo l’area corrispondente (ad es. 0,35) Es. l’area fra z=0,35 e 0 è pari a 13,68 G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 22 / 26 Variabili standardizzate Esempi d’uso dei punti z Qual è la % di soggetti con un punteggio inferiore o uguale a 120 (M=100, s=20)? calcolo il punto z [(120-100)/20=1] tavole della normale; cerco la riga corrispondente a z=1.0, avanzo fino alla colonna 0 e leggo l’area corrispondente [34,13] questa è l’area fra la z=0 e z=|1|; mi interessa anche la metà inferiore, sommo 50,00 [50,00 + 34.13 = 84.13%] oppure Howitt; cerco 1.00, trovo 15.87%, ma è quella superiore, quindi 100-15.87=84.13% G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 23 / 26 Variabili standardizzate Esempi d’uso dei punti z Qual è la % di soggetti con un punteggio inferiore a 80 (M=100, s=20)? calcolo il punto z [(80-100)/20=-1] negativo perché sotto la media tavole della normale; cerco la riga corrispondente a z 1.0, avanzo fino alla colonna 0 e leggo l’area corrispondente [34,13] poiché questa è l’area fra la z=0 e z=|1| e mi interessa l’area inferiore, faccio il complemento [50,00 - 34,13 = 15.87%] oppure Howitt; cerco -1.00, trovo 84.13%, ma è quella superiore, quindi 100-84.13=15.87% G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 24 / 26 Variabili standardizzate Esempi d’uso dei punti z Qual è la % di soggetti con punteggio compreso fra 80 e 120? calcolo i punti z [-1 e +1] tavole della normale; cerco la riga corrispondete al punto z 1.0, avanzo fino alla colonna 0 e leggo l’area corrispondente [34,13] poiché questa è l’area fra la z=0 e z=|1| ed entrambe sono uguali, sommo l’area 2 volte [34,13 + 34,13 = 68.26%] oppure Howitt; cerco 1.00, trovo 34.13%, raddoppio, quindi 34,13 + 34,13 = 68.26% G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 25 / 26 Variabili standardizzate Esempi d’uso dei punti z A quale punto z corrisponde l’area con il 10% di punteggi superiori? poiché le tavole indicano l’area fra z=0 e z=x, devo trovare il resto di 10,00 [50,00-10,00=40,00] cerco dentro le tavole una proporzione che si avvicini a 40,00. . . corrisponde a z=1.28 i punteggi il cui z è >= di 1.28, rientrano nel 10% superiore oppure Howitt; cerco un’area vicina al 10% sul lato positivo; trovo 9.68% -> z=1.30 G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 26 / 26