indice chi-quadro. Covarianza e correlazione per tabelle di

Transcript

indice chi-quadro. Covarianza e correlazione per tabelle di
Università di Cassino
Esercitazioni di Statistica 1 del 12 Marzo 2010
Dott. Mirko Bevilacqua
ESERCIZIO n° 1
Sono stati intervistati i laureati di una Facoltà di Economia e dalle risposte ai quesiti è stata costruita la
seguente tabella doppia di frequenze
Tempo (in mesi) per trovare lavoro dopo la laurea
6
12
18
24
3
2
0
0
1
2
1
0
45
26
11
23
9
5
2
5
58
35
14
28
Residenza
Nord-ovest
Nord –est
Centro
Sud
Totale
Totale
5
4
105
21
135
Calcolare l’indice Chi-quadrato di Pearson e l’indice di Fisher e commentare i risultati ottenuti.
Soluzione:
La misura dell’associazione tra due caratteri qualitativi sconnessi avviene tramite l’indice Chi-quadrato di
Pearson:
χ2 =
r
2
(nij − ˆnij )
c
∑∑
ˆ
nij
i =1 j =1
Nella tabella che segue sono rappresentate le frequenze teoriche ˆ
n ij =
n i. × n . j
N
Tempo
6
12
18
24
Totale
2,1
1,7
45,1
9,0
58
1,3
1,0
27,2
5,4
35
0,5
0,4
10,9
2,2
14
1,0
0,8
21,8
4,4
28
5
4
105
21
135
(in mesi)
Residenza
Nord – ovest
Nord – est
Centro
Sud
Totale
2
χ =
r
c
∑∑
(n
i =1 j =1
ij
−ˆ
nij
n̂ij
2
)
2
(3 − 2,1)
=
2,1
1,3
φ2 =
Indice di Fisher:
2
(2 − 1,3)
+
2
(2 − 2,2)
+ ...... +
2,2
2
(5 − 4, 4)
+
4, 4
= 5,396
χ2 5,396
=
= 0, 04
n
135
;
ossia, quasi assenza di associazione tra i caratteri: il tempo occorso per trovare lavoro dopo la laurea non
dipende dal luogo di residenza.
ESERCIZIO n° 2
Nella seguente tabella è data la distribuzione congiunta secondo il sesso, il peso e la statura (in cm) di un
collettivo di individui.
Peso maschi
Peso femmine
Statura
40-45
50- 75
75-90
40-45
50- 75
75-90
160 -165
6
27
10
25
21
1
165 -170
3
34
13
10
33
5
170-175
1
29
37
5
18
5
175-180
0
9
52
1
9
8
Si calcolino covarianza e correlazione del carattere statura sia con il peso dei maschi che con quello delle
donne. Commentare i risultati ottenuti.
Soluzione:
a) Calcolo covarianza e correlazione del carattere altezza relativamente al carattere “Peso maschi”
Peso
maschi
42,5
62,5
82,5
Tot.
6
3
1
0
10
27
34
29
9
99
10
13
37
52
112
43
50
67
61
221
Statura
162,5
167,5
172,5
177,5
Tot.
•
Medie e Varianze per i caratteri statura e peso in riferimento al collettivo di sesso maschile:
(i simboli PM e SM indicano, rispettivamente, i caratteri peso dei maschi e statura maschi)
µ PM =
µ SM =
( 4 2, 5 ⋅ 1 0 ) + ..... + ( 8 2, 5 ⋅ 1 1 2 )
221
(1 6 2 , 5
⋅ 4 3 ) + . . . . . + (1 7 7 , 5 ⋅ 6 1 )
221
σ
2
S M
= µ
σ
S M
=
σ
2
P M
= µ
σ
P M
=
= 7 1, 7
S M 2
−
2
(µ S M )
= 1 7 0, 8
= 2 9 2 0 2 ,8 6 −
(1
7 0 ,8
2
)
= 2 9 ,1
2 9 ,1 = 5 , 4
P M 2
−
2
(µ P M )
1 3 5 ,6
= 5 2 8 0 ,9 −
= 1 1 ,6
(7
1 ,7
2
)
= 1 3 5 ,6
•
Covarianze tra i caratteri statura e peso per il sesso maschile
PM
42,5
SM
162,5
41438
167,5
21356
172,5
7331
177,5
0
µSM⋅PM =
62,5
82,5
Tot.
274219
355938
312656
99844
134063
179644
526556
761475
449719
556938
846544
861319
2714519
1
2714519
∑ ∑ SMi ⋅PMj ⋅ nij = 221 = 12282 , 9
n i j
cov ( SM; PM) = µSM⋅PM − µPM ⋅ µSM = 12282 , 9 − (71, 7 ⋅ 170 , 8 ) = 31, 05
•
Correlazione tra i caratteri Statura e altezza in riferimento al sesso maschile:
ρ S M ,P M =
c o v (P M ; S M )
31,05
=
= 0 ,49
σ SM ⋅ σPM
5,4 ⋅ 11,6
b) Calcolo covarianza e correlazione del carattere altezza relativamente al carattere “Peso maschi”
•
Peso
femmine
Statura
42,5
62,5
42,5
Tot.
162,5
167,5
172,5
177,5
Tot.
25
10
5
1
41
21
33
18
9
81
1
5
5
8
19
47
48
28
18
141
Medie e Varianze per i caratteri statura e peso in riferimento al collettivo di sesso femminile
(i simboli PF e SF indicano, rispettivamente, i caratteri peso-femmine e statura-Femmine)
µ PF =
µ SF =
( 4 2, 5 ⋅ 4 1 ) + ..... + ( 8 2, 5
141
(1 6 2 , 5
2
S F
= µ
σ
S F
=
= 5 9, 4
⋅ 4 7 ) + . .. . . + (1 7 7 , 5 ⋅ 1 8 )
141
σ
⋅ 19)
S F2
−
2 5 ,7
2
(µ S F )
= 5 ,1
= 1 6 8,1
= 2 8 2 8 4 ,3 −
(1
6 8 ,1
2
)
= 2 5 ,7
•
σ
2
P F
= µ
σ
P F
=
P F2
−
2
(µ P F )
1 6 0 ,5
= 3 6 8 6 ,4 −
(5
9 , 4
2
)
= 1 6 0 ,5
= 1 2 ,7
Covarianze tra i caratteri statura e peso per il sesso femminile
PF
SF
162,5
167,5
172,5
177,5
µSF⋅PF =
42,5
62,5
172656
71188
36656
7544
213281
345469
194063
99844
82,5
13406
69094
71156
117150
Tot.
399344
485750
301875
224538
1411506
1
1411506
SFi ⋅PF j ⋅ nij =
= 10011
∑
∑
n i j
141
cov ( SF ; PF ) = µSF ⋅PF − µPF ⋅ µSF = 10011 − (59 , 4 ⋅ 168 ,1) = 28 , 8
•
Correlazione tra i caratteri Statura e altezza in riferimento al sesso femminile:
ρ S F ,P F =
c o v (P F ; S F
σ SF ⋅ σPF
)
=
28 ,8
= 0 ,45
5 ,1 ⋅ 1 2 , 7
ESERCIZIO n° 3
Con riferimento alla seguente distribuzione di 5 famiglie secondo il reddito e il consumo medio mensile
misurati in migliaia di euro:
Reddito 5 6 8 3 6
Consumo 4 2 5 2 3
a) Calcolare i parametri della retta di regressione del consumo Y sul reddito X
b) Dalla relazione trovata si può affermare che mediamente circa metà del reddito di una famiglia
finisce in consumi?
c) La retta spiega più del 50% della variabilità totale?
d) Quale sarebbe il consumo di una famiglia che guadagna 4 mila euro?
Soluzione:
a) Calcolo dei coefficienti di regressione
Reddito
(R)
5
6
8
3
6
•
•
•
Consumo
(C)
4
2
5
2
3
R·C
R2
C2
20
12
40
6
18
96
25
36
64
9
36
170
16
4
25
4
9
58
Reddito e consumo medio delle 5 famiglie
µC =
4+2+5+2+3
= 3, 2
5
µR =
5+6+8+3+6
= 5,6
5
Varianze di Reddito e Consumo
σ
2
R
= µ
σ
R
=
σ
2
C
= µ
σ
C
=
R 2
2
(µ R )
−
2 ,6 4
C 2
−
1 7 0
−
5
(5
,6
2
)
= 2 ,6 4
= 1 ,6
2
(µ C )
1 ,3 6
=
=
5 8
−
5
(3
,2
2
)
= 1 ,3 6
= 1 ,2
Covarianza Reddito – Consumo
µ C ⋅R =
96
= 1 9, 2
5
cov ( C;R ) = µC⋅R − µC ⋅ µR = 19,2 − (3,2 ⋅ 5, 6) = 1,28
•
Stima dei Coefficiente di Regressione
b =
c o v (C , R
v a r (R )
)
1 ,2 8
= 0,48
2 ,64
=
a = µC − b ⋅ µR = 3,2 − ( 0,48 ⋅ 5,6) = 0, 48
•
Retta di Regressione.
ˆ
C
i
= 0,48 + 0 ,48 ⋅R
i
b) Si, essendo b=0,48, circa metà del reddito finisce in consumo.
c) Calcolo del coefficiente di determinazione R2
R
2
 c o v (C , R
= 
σC ⋅ σR

)


2
1 ,2 8


= 

1 ,6 ⋅1 ,2 
2
= 0 ,456
No, il modello spiega soltanto il 45,6% della variabilità totale.
d) Stima del consumo per una famiglia che guadagna 4.000 euro, attraverso il modello di regressione
ˆ
C
i
= 0,48 + 0 ,48 ⋅R
ˆ
C
i
= 0,48 + 0 ,48 ⋅ 4 = 2 ,42
i
Il modello stima in 2.420 euro il consumo per una generica famiglia che ha reddito pari a 4.000 euro.