indice chi-quadro. Covarianza e correlazione per tabelle di
Transcript
indice chi-quadro. Covarianza e correlazione per tabelle di
Università di Cassino Esercitazioni di Statistica 1 del 12 Marzo 2010 Dott. Mirko Bevilacqua ESERCIZIO n° 1 Sono stati intervistati i laureati di una Facoltà di Economia e dalle risposte ai quesiti è stata costruita la seguente tabella doppia di frequenze Tempo (in mesi) per trovare lavoro dopo la laurea 6 12 18 24 3 2 0 0 1 2 1 0 45 26 11 23 9 5 2 5 58 35 14 28 Residenza Nord-ovest Nord –est Centro Sud Totale Totale 5 4 105 21 135 Calcolare l’indice Chi-quadrato di Pearson e l’indice di Fisher e commentare i risultati ottenuti. Soluzione: La misura dell’associazione tra due caratteri qualitativi sconnessi avviene tramite l’indice Chi-quadrato di Pearson: χ2 = r 2 (nij − ˆnij ) c ∑∑ ˆ nij i =1 j =1 Nella tabella che segue sono rappresentate le frequenze teoriche ˆ n ij = n i. × n . j N Tempo 6 12 18 24 Totale 2,1 1,7 45,1 9,0 58 1,3 1,0 27,2 5,4 35 0,5 0,4 10,9 2,2 14 1,0 0,8 21,8 4,4 28 5 4 105 21 135 (in mesi) Residenza Nord – ovest Nord – est Centro Sud Totale 2 χ = r c ∑∑ (n i =1 j =1 ij −ˆ nij n̂ij 2 ) 2 (3 − 2,1) = 2,1 1,3 φ2 = Indice di Fisher: 2 (2 − 1,3) + 2 (2 − 2,2) + ...... + 2,2 2 (5 − 4, 4) + 4, 4 = 5,396 χ2 5,396 = = 0, 04 n 135 ; ossia, quasi assenza di associazione tra i caratteri: il tempo occorso per trovare lavoro dopo la laurea non dipende dal luogo di residenza. ESERCIZIO n° 2 Nella seguente tabella è data la distribuzione congiunta secondo il sesso, il peso e la statura (in cm) di un collettivo di individui. Peso maschi Peso femmine Statura 40-45 50- 75 75-90 40-45 50- 75 75-90 160 -165 6 27 10 25 21 1 165 -170 3 34 13 10 33 5 170-175 1 29 37 5 18 5 175-180 0 9 52 1 9 8 Si calcolino covarianza e correlazione del carattere statura sia con il peso dei maschi che con quello delle donne. Commentare i risultati ottenuti. Soluzione: a) Calcolo covarianza e correlazione del carattere altezza relativamente al carattere “Peso maschi” Peso maschi 42,5 62,5 82,5 Tot. 6 3 1 0 10 27 34 29 9 99 10 13 37 52 112 43 50 67 61 221 Statura 162,5 167,5 172,5 177,5 Tot. • Medie e Varianze per i caratteri statura e peso in riferimento al collettivo di sesso maschile: (i simboli PM e SM indicano, rispettivamente, i caratteri peso dei maschi e statura maschi) µ PM = µ SM = ( 4 2, 5 ⋅ 1 0 ) + ..... + ( 8 2, 5 ⋅ 1 1 2 ) 221 (1 6 2 , 5 ⋅ 4 3 ) + . . . . . + (1 7 7 , 5 ⋅ 6 1 ) 221 σ 2 S M = µ σ S M = σ 2 P M = µ σ P M = = 7 1, 7 S M 2 − 2 (µ S M ) = 1 7 0, 8 = 2 9 2 0 2 ,8 6 − (1 7 0 ,8 2 ) = 2 9 ,1 2 9 ,1 = 5 , 4 P M 2 − 2 (µ P M ) 1 3 5 ,6 = 5 2 8 0 ,9 − = 1 1 ,6 (7 1 ,7 2 ) = 1 3 5 ,6 • Covarianze tra i caratteri statura e peso per il sesso maschile PM 42,5 SM 162,5 41438 167,5 21356 172,5 7331 177,5 0 µSM⋅PM = 62,5 82,5 Tot. 274219 355938 312656 99844 134063 179644 526556 761475 449719 556938 846544 861319 2714519 1 2714519 ∑ ∑ SMi ⋅PMj ⋅ nij = 221 = 12282 , 9 n i j cov ( SM; PM) = µSM⋅PM − µPM ⋅ µSM = 12282 , 9 − (71, 7 ⋅ 170 , 8 ) = 31, 05 • Correlazione tra i caratteri Statura e altezza in riferimento al sesso maschile: ρ S M ,P M = c o v (P M ; S M ) 31,05 = = 0 ,49 σ SM ⋅ σPM 5,4 ⋅ 11,6 b) Calcolo covarianza e correlazione del carattere altezza relativamente al carattere “Peso maschi” • Peso femmine Statura 42,5 62,5 42,5 Tot. 162,5 167,5 172,5 177,5 Tot. 25 10 5 1 41 21 33 18 9 81 1 5 5 8 19 47 48 28 18 141 Medie e Varianze per i caratteri statura e peso in riferimento al collettivo di sesso femminile (i simboli PF e SF indicano, rispettivamente, i caratteri peso-femmine e statura-Femmine) µ PF = µ SF = ( 4 2, 5 ⋅ 4 1 ) + ..... + ( 8 2, 5 141 (1 6 2 , 5 2 S F = µ σ S F = = 5 9, 4 ⋅ 4 7 ) + . .. . . + (1 7 7 , 5 ⋅ 1 8 ) 141 σ ⋅ 19) S F2 − 2 5 ,7 2 (µ S F ) = 5 ,1 = 1 6 8,1 = 2 8 2 8 4 ,3 − (1 6 8 ,1 2 ) = 2 5 ,7 • σ 2 P F = µ σ P F = P F2 − 2 (µ P F ) 1 6 0 ,5 = 3 6 8 6 ,4 − (5 9 , 4 2 ) = 1 6 0 ,5 = 1 2 ,7 Covarianze tra i caratteri statura e peso per il sesso femminile PF SF 162,5 167,5 172,5 177,5 µSF⋅PF = 42,5 62,5 172656 71188 36656 7544 213281 345469 194063 99844 82,5 13406 69094 71156 117150 Tot. 399344 485750 301875 224538 1411506 1 1411506 SFi ⋅PF j ⋅ nij = = 10011 ∑ ∑ n i j 141 cov ( SF ; PF ) = µSF ⋅PF − µPF ⋅ µSF = 10011 − (59 , 4 ⋅ 168 ,1) = 28 , 8 • Correlazione tra i caratteri Statura e altezza in riferimento al sesso femminile: ρ S F ,P F = c o v (P F ; S F σ SF ⋅ σPF ) = 28 ,8 = 0 ,45 5 ,1 ⋅ 1 2 , 7 ESERCIZIO n° 3 Con riferimento alla seguente distribuzione di 5 famiglie secondo il reddito e il consumo medio mensile misurati in migliaia di euro: Reddito 5 6 8 3 6 Consumo 4 2 5 2 3 a) Calcolare i parametri della retta di regressione del consumo Y sul reddito X b) Dalla relazione trovata si può affermare che mediamente circa metà del reddito di una famiglia finisce in consumi? c) La retta spiega più del 50% della variabilità totale? d) Quale sarebbe il consumo di una famiglia che guadagna 4 mila euro? Soluzione: a) Calcolo dei coefficienti di regressione Reddito (R) 5 6 8 3 6 • • • Consumo (C) 4 2 5 2 3 R·C R2 C2 20 12 40 6 18 96 25 36 64 9 36 170 16 4 25 4 9 58 Reddito e consumo medio delle 5 famiglie µC = 4+2+5+2+3 = 3, 2 5 µR = 5+6+8+3+6 = 5,6 5 Varianze di Reddito e Consumo σ 2 R = µ σ R = σ 2 C = µ σ C = R 2 2 (µ R ) − 2 ,6 4 C 2 − 1 7 0 − 5 (5 ,6 2 ) = 2 ,6 4 = 1 ,6 2 (µ C ) 1 ,3 6 = = 5 8 − 5 (3 ,2 2 ) = 1 ,3 6 = 1 ,2 Covarianza Reddito – Consumo µ C ⋅R = 96 = 1 9, 2 5 cov ( C;R ) = µC⋅R − µC ⋅ µR = 19,2 − (3,2 ⋅ 5, 6) = 1,28 • Stima dei Coefficiente di Regressione b = c o v (C , R v a r (R ) ) 1 ,2 8 = 0,48 2 ,64 = a = µC − b ⋅ µR = 3,2 − ( 0,48 ⋅ 5,6) = 0, 48 • Retta di Regressione. ˆ C i = 0,48 + 0 ,48 ⋅R i b) Si, essendo b=0,48, circa metà del reddito finisce in consumo. c) Calcolo del coefficiente di determinazione R2 R 2 c o v (C , R = σC ⋅ σR ) 2 1 ,2 8 = 1 ,6 ⋅1 ,2 2 = 0 ,456 No, il modello spiega soltanto il 45,6% della variabilità totale. d) Stima del consumo per una famiglia che guadagna 4.000 euro, attraverso il modello di regressione ˆ C i = 0,48 + 0 ,48 ⋅R ˆ C i = 0,48 + 0 ,48 ⋅ 4 = 2 ,42 i Il modello stima in 2.420 euro il consumo per una generica famiglia che ha reddito pari a 4.000 euro.