Metodi Quanti – Qualitativi per le scienze sociali

Transcript

Metodi Quanti – Qualitativi per le scienze sociali
5/9/2012
Metodi Quanti – Qualitativi per
le scienze sociali
Incontro 4
Scuola di dottorato – Variabili e livelli di misurazione
Alessandro Pepe
Mail: [email protected]
Riassunti livelli di misurazione
Descrittori, indicatori semplici e formato Likert
Indicatori compositi e modelli di misurazione
Studio della distribuzione delle variabili
Distribuzioni normali e non normali
Livelli di misurazione
Nominale
Ordinale
Intervalli equivalenti
Rapporti equivalenti
1
5/9/2012
Misurazione Nominale
Variabili senza un particolare “valore” numerico, hanno solo un
nome, valenza descrittiva genere, scuola di appartenenza,
nazionalità
Distinguono esclusivamente fra stati fisici diversi di una
determinata condizione
Esempio:
Indichi il suo stato civile.
__Coniugato/a __ Divorziato/a __ Single __ Vedovo/a
Indichi il suo genere.
__Maschile __ Femminile
Misurazione Ordinale
Ordinale variabili a cui è iniziato ad associare un particolare “
valore numerico”, si possono ordinare livello di istruzione, classe
scolastica, scale Likert
Esempio.
Indichi il suo livello di istruzione:
__Elementare __ Media inferiore __ Media superiore __ Univerisità __ Altro
Indichi la sua età:
__fino a 18 __ da 18 a 30__ da 30 a 60__ sopra 60
Misurazione intervalli equivalenti
Intervalli equivalenti variabili a cui è iniziato ad associare un particolare “ valore
numerico” con distanze relative equivalenti, si possono ordinare ma ci consentono
anche di stabilire la distanza esistente fra due stati diversi della medesima proprietà punteggi ai test, punteggi di personalità, QI
Esempio.
Consiglieresti l’hotel XYZ ad un familiare?
Decisamente no
1
2
Decisamente sì
3
4
5
6
7
Indichi la sua età:
__fino a 20 __ da 21 a 40__ da 41 a 60 __ da 61 a 80 __altro
2
5/9/2012
Misurazione rapporti equivalenti
variabili con il massimo livello di misurazione, sono le
variabili tipiche delle scienze dure, presentano tutte le
caratteristiche degli altri livelli di misurazione, in più
presentano anche una origine non relativa (=zero reale) altezza,età, reddito.
Esempio:
Indichi il numero di alunni che mostrano un comportamento “difficile” nell’attuale
anno scolastico_
0 1 2 3 4 5 6
7 (se più di sette specificare il numero___)
Indichi la sua età:
__
Muoversi tra le scale
Posso salire tra i livelli di misurazione?
Tendenzialmente no. E’ possibile però
utilizzare il livello ordinale cumulato per
ottenere variabili con proprietà simili ad
intervalli equivalenti.
Posso scendere tra i livelli di misurazione?
Sì, tutte le volte che voglio basta scegliere
criteri di classificazione e/o raggruppamento
Caratteristiche delle scale – Rule of thumb
Rapporti: Esiste uno zero assoluto?
Intervalli : Esiste una misura standard?
Ordinali : Posso ordinare le categorie?
Nominale: Sono tutte categorie ?
3
5/9/2012
Errori frequenti
Concettualizzazione troppo ampia
Operazionalizzazione non precisa
Non coerenza tra metodi di indagine e natura del dato
Campioni insufficienti
Alterazione del dato (involontaria)
Non coerenza tra metodologie e livelli di misurazione
Non ripulire gli effetti.
Riassunti livelli di misurazione
Descrittori, indicatori semplici e formato Likert
Indicatori compositi e modelli di misurazione
Studio della distribuzione delle variabili
Distribuzioni normali e non normali
Descrittori
Sono spesso variabili “indipendenti”
(indicatori) che possono essere ricondotte a
caratteristiche generali e/o specifiche dei
partecipanti al disegno di ricerca.
Variabili socio-demografiche
Correlati di interesse
Altre informazioni
4
5/9/2012
Indicatori semplici
Descrittori di comportamenti e fatti reali
Nelle ultime due settimane mi sono sentito…
Descrittori di atteggiamenti
Conosci le seguenti marche…
Descrittori di stati psicologici
Quanto spesso ti capita di…
Descrittori di conoscenze
Esprimi il tuo grado di accordo
Descrittori di comportamenti ipotetici.
Se ti dovessi trovare nella situazione di….
Modalità di risposta Likert
Una “scala” Likert è un formato
di risposta ordinale che permette
ai rispondenti di indicare il
grado di “accordo/disaccordo”
ad una serie di domande (item)
Granularità (grana) numero modalità di
risposta (5-punti, 7-punti, 9-punti).
Esempi
5
5/9/2012
Modalità di gestione
Nelle scienze sociali i singoli item raramente sono gestiti
singolarmente (livello ordinale)
“non c’è modo di capire se la distanza tra “molto
d’accordo” e “d’accordo” è la stessa che esiste tra
“d’accordo” e “neutrale”.
Punteggi sommativi analisi fattoriale
I punteggi degli item misurati tramite likert possono
essere sommati:
Se le Likert sono equivalenti
Se le Likert misurano tutte lo stesso concetto
Se esiste una ragionevole (e difendibile)
approssimazione ad una scala ad intervalli
Riassunti livelli di misurazione
Descrittori, indicatori semplici e formato Likert
Indicatori compositi e modelli di misurazione
Studio della distribuzione delle variabili
Distribuzioni normali e non normali
Indicatori compositi
Rappresentano processi di raggruppamento
di indicatori semplici attraverso operazioni
matematiche
Scale di misurazione di costrutti
Indicatori di performance
Indicatori sintetici
6
5/9/2012
Perché indicatori compositi
Fenomeni complessi come la qualità della
vita o il benessere sono “misurabili”
attraverso gruppi di variabili, ciascuna
empiricamente osservabile, ma che solo
prese insieme rappresentano il fenomeno in
analisi.
L’indicatore composito non può essere
osservato empiricamente ma è il risultato di
operazioni matematiche
Modelli di misurazione – Salute fisica
Modelli di misurazione -Qualità della vita
7
5/9/2012
Riassunti livelli di misurazione
Descrittori, indicatori semplici e formato Likert
Indicatori compositi e modelli di misurazione
Studio della distribuzione delle variabili
Distribuzioni normali e non normali
Idea di distribuzione
Distribuzione dei dati
Due gruppi di persone (g1, g2) compilano un
questionario, ottenendo entrambi nella
variabile “test” un punteggio medio (M) di
81.5.
Possiamo dire che i gruppi sono uguali?
No. La media non ci dice nulla circa la
confrontabilità dei gruppi.
Ho bisogno di una misura della distribuzione
dei punteggi.
8
5/9/2012
Punteggi
grezzi del
gruppo 1
nella
variabile test
72
76
80
80
81
83
84
85
85
89
Media:
81.5
Media
Deviazione standard (DS)
La deviazione standard è il numero che
misura quanto i valori del mio campione
sono “dispersi” attorno al valore medio
Più la deviazione è grande, maggiore sarà
la dispersione dei valori
Più la deviazione standard è piccola,
minore sarà la dispersione dei punteggi
9
5/9/2012
Punteggi
grezzi
gruppo_1
gruppo_2
72
76
80
80
81
83
84
85
85
89
Media:
81.5
57
65
83
94
95
96
98
93
71
63
Considerando il punteggio più basso (72), qual’è la sua distanza dalla
media ? E considerando il punteggio più alto (89), quanto è distante dalla
media?
72 - 81.5 = - 9.5
Calcolo
tutte le
distanze, le
elevo al
quadrato e
le sommo.
72
76
80
80
81
83
84
85
85
89
89 - 81.5 = 7.5
- 9.5
7.5
Distanza
dalla
media
Distanza
al
quadrato
- 9.5
- 5.5
- 1.5
- 1.5
- 0.5
1.5
2.5
3.5
3.5
7.5
90.25
30.25
2.25
2.25
0.25
2.25
6.25
12.25
12.25
56.25
10
5/9/2012
In verde il
valore della
varianza.
In giallo il
valore della
deviazione
standard.
Stesse
operazioni
per il
secondo
gruppo.
72
76
80
80
81
83
84
85
85
89
57
65
83
94
95
96
98
93
71
63
Distanza
dalla
media
Distanza
al
quadrato
- 9.5
- 5.5
- 1.5
- 1.5
- 0.5
1.5
2.5
3.5
3.5
7.5
90.25
30.25
2.25
2.25
0.25
2.25
6.25
12.25
12.25
56.25
Distanza
dalla
media
Distanza
al
quadrato
- 24.5
- 16.5
1.5
12.5
13.5
14.5
16.5
11.5
- 10.5
-18.5
600.25
272.25
2.25
156.25
182.25
210.25
272.25
132.25
110.25
342.25
Somma:
214.5
= 21.4
= 4.88
Somma:
2280.5
228,05
= 15.10
DS = 4.81
Media
DS = 15.10
11
5/9/2012
Riassunti livelli di misurazione
Descrittori, indicatori semplici e formato Likert
Indicatori compositi e modelli di misurazione
Studio della distribuzione delle variabili
Distribuzioni normali e non normali
Punteggi nelle tabelle di frequenza
Punteggi osservati
65
70
75
80
85
90
95
Frequenza (N=16)
1
2
3
4
3
2
1
Grafico di distribuzione delle frequenze
4
Frequenza
3
2
1
65
70
75
80
85
90
95
Test Punteggi
12
5/9/2012
Galton’s Board
http://www.youtube.com/watch?v=AUSKTk9ENzg
http://www.youtube.com/watch?v=xDIyAOBa_yU
Some care is needed to obtain these idealized results, however, as the actual
distribution of balls depends on physical properties of the setup, including the
elasticity of the balls (as characterized by their coefficient of restitution), the
radius of the nails, and the offsets of the balls over the funnel's opening when
they are dropped (Kozlov and Mitrofanova 2002).
Valutare la normalità della distribuzione
La distribuzione è normale quando:
-è simmetrica
-assume la forma della curva Gaussiana
-esiste concordanza tra gli indicatori di tendenza
centrale
-le code non toccano mai l’asse X
-ci sono almeno 30 punteggi osservati (N>30)
Per valutare la concordanza tra gli indicatori di tendenza centrale si usano:
media, moda e mediana devono essere molto simili (quasi sovrapposte)
Asimmetria e Curtosi (SPSS, analizza descrittive frequenze statistiche)
Indici di normalità
Asimmetria (skweness) indica il grado di simmetria della
distribuzione [accettabile per valori compresi tra -1 e +1]
Curtosi (Kurtosis) indica il grado di schiacciamento della
distribuzione [accettabile per valori compresi tra -1 e +1]
13
5/9/2012
Indicatori di tendenza centrale
Moda (è il valore con frequenza più alta)
Mediana (è il valore che divide la
distribuzione a metà)
Media e deviazione standard
Medie ridotte (trimmered 5%)
Nel nostro caso Media (1280/16=80, ds= 8.16), media
ridotta (80), moda (80) e mediana (80) si sovrappongono
la distribuzione può essere considerata normale
SPSS (analizza descrittive esplora)
Distribuzione di una variabile
Se il livello di misurazione è nominale, la
distribuzione dei dati grezzi può essere studiata
usando moda e distribuzione di frequenza
(istogrammi, torte, ecc…).
Se il livello è ordinale la distribuzione dei dati
grezzi può essere studiata attraverso la mediana
e i range (min-max, percentili) ( oltre alla moda e
alle distribuzioni di frequenza)
Per livelli di misurazione ad intervalli e a rapporti
equivalenti è invece possibile utilizzare media e
deviazione standard (oltre a tutte le precedenti)
Perché normalità è essenziale?
Perché in base alla condizione di normalità
della distribuzione di una variabile effettuiamo
la prima scelta metodologica:
Analisi parametriche (assunti normalità OK)
Analisi non-parametriche (assunti normalità
violati)
14
5/9/2012
Uso della DS per identificare gli outlier.
Esempio pratico: l’età del campione
Riepilogo dei casi
Casi
Validi
N
Age
Percentuale
143
1,0
Mancanti
N
2
Totale
Percentuale
,0
N
145
Percentuale
1,0
Descrittive
Age
Media
Media 5% trim
Statistica
Errore std.
32,92
,707
32,29
Mediana
32,00
Varianza
71,542
Deviazione std.
8,458
Minimo
21
Massimo
59
Intervallo
Distanza interquartilica
Asimmetria
Curtosi
38
11
1,463
,203
,793
,403
Distribuzioni non-normali
15
5/9/2012
Evitare conclusioni numeriche distorte
Validità
La ricerca misura davvero ciò per cui è stata costruita? Gli strumenti
di misurazione scelti ci permettono di “far centro” (Joppe, 2000, p.1)
E’ la sovrapposizione tra la definizione concettuale e la definizione
operativa
Diversi tipi di validità:
Di facciata
Di contenuto
Operazionalizzazione funziona
Di costrutto
È la serietà apparente ed esteriore che una
misura o un piano di ricerca presenta
Validità di contenuto
Predizione funziona
Validità di facciata
Predittiva (di criterio)
Concorrente
Discriminante
Gli indicatori selezionati riflettono il contenuto
della ricerca
Validità di costrutto
Gli indicatori selezionati misurano effettivamente il
costrutto che si vuole misurare
16
5/9/2012
Validità predittiva
Validità concorrente
capacità di uno strumento di fare previsioni
accurate
la misura correla con altri strumenti che si
ritengono validi nel misurare la stessa
caratteristica
Validità discriminante
la misura NON correla con altri strumenti che
misurano altre caratteristiche (precisione)
17