indici statistici media, moda, mediana, varianza

Transcript

indici statistici media, moda, mediana, varianza
Lezione 7
- Indici statstici : media, moda, mediana, varianza
1
INDICI STATISTICI
MEDIA, MODA, MEDIANA, VARIANZA
GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007
Lezione 7
- Indici statstici : media, moda, mediana, varianza
2
Principali Indici Statistici
di posizione
{
MODA
MEDIANA
MEDIA
SCARTO QUADRATICO MEDIO
INDICE
di dispersione
di forma
{
{
VARIANZA
RANGE
ASIMMETRIA (SKEWNESS)
CURTOSI ( KURTOSIS)
GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007
Lezione 7
- Indici statstici : media, moda, mediana, varianza
3
INDICI DI POSIZIONE
Frequenza
Consentono di valutare l’ordine di grandezza delle
manifestazioni e servono per localizzare la
distribuzione, ovvero individuare attorno a quale
valore del carattere si accentra la distribuzione stessa.
Moda
Media
Mediana
X
Sono espressi nella stessa unità di misura con cui si
estrinseca il fenomeno
MODA
E' definita come il valore che ha la frequenza più alta.
MEDIANA
E' quel valore al di sotto del quale cadono la metà dei
valori campionari.
GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007
Lezione 7
- Indici statstici : media, moda, mediana, varianza
4
INDICI DI POSIZIONE
Frequenza
Moda
Media
Mediana
MEDIA Aritmetica
n
∑X
X = i=1
n
i
X
E' quel valore che corrisponde alla somma di tutti i valori diviso il numero
dei valori stessi.
Rappresenta il valore che sostituito a ciascun xi lascia invariata la intensità
totale (somma)
dove:
Xi = esito i-ma misura - n = numero dei dati (taglia del campione)
GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007
Lezione 7
- Indici statstici : media, moda, mediana, varianza
5
MODA E MEDIA sono indici di posizione, poiché la loro variazione sposta
appunto la posizione della curva (verso destra o verso sinistra) in funzione del segno
della variazione.
densita' di probabilita'
280
NELLA CURVA NORMALE (simmetrica)
240
200
MEDIA= MODA = MEDIANA
f(x)
160
120
80
media=2.06
40
moda=0.1
mediana=0.45
0
moda=mediana=media
600
x
540
480
420
n.osservaz.
360
300
240
180
120
60
0
<= 1,345
(2,69;4,035]
(1,345;2,69]
(5,38;6,726]
(4,035;5,38]
(8,071;9,416]
(6,726;8,071]
GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007
Lezione 7
- Indici statstici : media, moda, mediana, varianza
6
ESEMPIO 1
utilizzo strumento di analisi: statistica descrittiva
Numero di componenti familiari
0,5
0,4
media
0,2
moda
0,1
0
1,000
Frequenze relative componenti nucleo f amiliare
3,000
5,000
7,000
9,000
11,000
Media = 4.5 > 4 = mediana=moda
0,5
Ci sono più osservazioni alla sinistra della media
0,4
0,3
La distribuzione è più concentrata alla sinistra della media
MA
la coda è più lunga a destra
0,2
0,1
studenti.xls
media
0,3
0
1
2
3
4
5
6
7
8
9
10 11 12
GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007
Lezione 7
- Indici statstici : media, moda, mediana, varianza
7
altezza
media = 169 > 168 = mediana>Moda=160
Ci sono più osservazioni alla sinistra della media
La distribuzione è più concentrata alla sinistra della media
e
la coda è più lunga a destra
altezza - ampiezza = 1 cm
altezza - ampiezza=3cm
450
400
300
250
198
195
192
189
186
183
180
177
174
171
168
165
194
191
188
185
182
179
176
173
170
167
164
161
158
155
152
149
162
50
0
159
0
156
50
200
150
100
100
146
studenti.xls
150
153
350
300
250
200
150
utilizzo strumento di analisi: statistica descrittiva
ESEMPIO 2
GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007
Lezione 7
- Indici statstici : media, moda, mediana, varianza
8
MISURE DI DISPERSIONE
xmax -xmin
RANGE
(Campo di variazione)
SCARTO MEDIO ASSOLUTO
VARIANZA
(Media degli Scarti al Quadrato)
σ2 =
s2 =
VARIANZA CAMPIONARIA
(Calcolata da Excel)
s=
DEVIAZIONE STANDARD CAMPIONARIA
CV =
σ
X
COEFFICIENTE DI VARIAZIONE
GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007
Lezione 7
- Indici statstici : media, moda, mediana, varianza
9
l’importanza della varianza
Media uguale
Deviazione Standard Diversa
Media uguale (2) e Varianza diversa 0,34 e 7,68 rispettivamente
CHI1
80
400
70
350
60
300
50
250
40
200
No of obs
30
150
20
100
10
50
0
0
-0,2
0,0
0,2
0,4
0,6
0,8
1,0
1,2
1,4
1,6
1,8
2,0
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28
Expected
Normal
Upper Boundaries (x <= boundary)
GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007
Lezione 7
- Indici statstici : media, moda, mediana, varianza
10
ESEMPI 1-2
studenti.xls
utilizzo strumento di analisi: statistica descrittiva
Componenti familiari e altezza
Calcolare
1.range
2. Scostamento medio assoluto
3. varianza
4.scarto quadratico medio
5. Coefficiente di variazione
GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007
Lezione 7
- Indici statstici : media, moda, mediana, varianza
11
ESEMPIO 3
Media > mediana =
= moda
Più osservazioni a
sinistra della
media
Dev. Stand.
piccola rispetto
al range
Non c’è molta
dispersione
GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007
Lezione 7
- Indici statstici : media, moda, mediana, varianza
12
Ci si aspetta una distribuzione, con una lunga coda a destra e la maggior parte della
distribuzione concentrata a sinistra con un picco intorno alla media=mediana.
Frequenze età
0,40
0,35
0,30
0,25
0,20
0,15
0,10
0,05
0,00
19-20
20-21
21-22
22-23
23-24
24-25
25-27
27-33
33-50
>50
GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007
Lezione 7
- Indici statstici : media, moda, mediana, varianza
13
I dati raggruppati
…e se non abbiamo a disposizione i dati grezzi, ma solo le distribuzioni di
frequenza? Come determiniamo gli indici di sintesi?
NUMERO DI FIGLI
FREQUENZA
xi
fi
0
1
2
3
4
5
6
9
Totale
5
6
15
13
4
3
3
1
50
Tabella: Distribuzione di
frequenza del numero di figli di
50 famiglie di una comunità
Caso discreto
CLASSE DI
VALORI
FREQUEN ZA
CLASSE
fi
10-19
20-29
30-39
40-49
50-59
60-69
4
66
47
36
12
4
Totale
169
Tabella: Distribuzione delle età
di 169 soggetti
Caso raggruppamento
per classi
GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007
Lezione 7
- Indici statstici : media, moda, mediana, varianza
14
Caso discreto : LA MEDIA PONDERATA
ESEMPIO:
k
x=
∑m f
i =1
k
FREQUENZA
xi
fi
0
1
2
3
4
5
6
9
Totale
5
6
15
13
4
3
3
1
50
Somma degli
elementi del
campione
i i
∑f
i =1
NUMERO DI FIGLI
i
=n
taglia
del
campione
Tabella: Distribuzione di frequenza del numero
di figli di 50 famiglie di una comunità
k
x=
∑m f
i =1
k
i i
∑f
i =1
=
0 × 5 + 1× 6 + K + 9 × 1
= 2.66
5 + 6 + ... + 1
i
GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007
Lezione 7
- Indici statstici : media, moda, mediana, varianza
15
LA MEDIA PER DATI RAGGRUPPATI IN CLASSI
k
mi
fi
valore centrale della classe i-ma
x=
Frequenza della classe i-ma
∑m f
i =1
k
ESEMPIO:
C LA S S E D I
VA LOR I
10-19
20-29
30-39
40-49
50-59
60-69
V A LO R E C E N T R A L E
C LA SSE
FR E Q UE N ZA
C LA SS E
mi
fi
m i fi
14.5
24.5
35.5
44.5
54.5
64.5
4
66
47
36
12
4
58.0
1617.0
1621.5
1602.0
654.0
258.0
169
5810.5
Totale
i i
∑f
i =1
Somma degli
elementi del
campione
i
=n
taglia del
campione
k
x=
∑m f
i =1
k
i i
∑f
i =1
=
5810.5
= 34.48
169
i
GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007
Lezione 7
- Indici statstici : media, moda, mediana, varianza
16
LA VARIANZA PER DATI RAGGRUPPATI IN CLASSI
mi
fi
k
valore centrale della classe i-ma
s2 =
Frequenza della classe i-ma
∑ (m − x )
2
i
i =1
k
∑f
i =1
i
−1
fi
=n -1
ESEMPIO:
C LASSE DI
VA LOR I
10-19
20-29
30-39
40-49
50-59
60-69
FR EQUENZA
C LASSE
VALORE CENTRALE
CLASSE
mi
fi
(m i - x)
14.5
24.5
35.5
44.5
54.5
64.5
4
66
47
36
12
4
-19.88
-9.88
.12
10.18
20.12
30.12
Totale
(m i - x) 2
395.2144
97.6144
.0144
102.4144
404.2144
907.2144
169
(m i - x) 2 f i
1580.8576
6442.5504
.6768
3686.9184
4857.7728
3628.8576
20197.6336
k
s2 =
∑ (m − x )
2
i
i =1
k
∑f
i =1
i
−1
fi
=−
20197.6336
= 120.224
168
GRUPPO MAT06 – Dip. Matematica, Università di Milano - Probabilità e Statistica per le Scuole Medie - SILSIS - 2007