Esami_Vecchi_Esercitazione_con soluzione
Transcript
Esami_Vecchi_Esercitazione_con soluzione
Vecchie prove d’esame – Statistica e Calcolo delle Probabilità (con soluzioni) Esame 11 Gennaio 2005 Esercizio 2 Alla fine di una giornata di lavoro un intervistatore si accorge di aver perso i dati raccolti su un certo numero di famiglie relativamente al numero X di televisori posseduti e al numero Y di componenti della famiglia. Ricostruendo a memoria le interviste fatte, arriva alla seguente tabella: no. televisori X 0 1 2 Totale 1 0 3 1 4 no. componenti Y 2 3 6 4 13 Totale 3 1 7 3 11 4 16 8 28 a) Si completi la tabella. no. TV b) Si costruisca la distribuzione che contiene le frequenze relative del numero di televisori per le famiglie con 2 componenti: c) Si determinino la mediana e la moda del carattere numero di componenti la famiglia: __moda= 2, mediana =2 _____________________ no. 2 compontenti 0 0,23 1 0,46 2 0,31 1 d) Presenta una maggiore variabilità il carattere X o il carattere Y? Si risponda utilizzando un opportuno indicatore: __No. TELEVISORI: media =1,14 sqm=0,64 CV=0.56____________________________________ __No. COMPONENTI: media =2,25 sqm=0,69 CV=0.31____________________________________ Esame del 4 Novembre 2004 (Prova A) Esercizio 1: Si considerino le distribuzioni per classi di età della popolazione residente (espressa in migliaia) in Piemonte e Campania nel 1979: Classi di età Piemonte Campania 0 |- 6 322 603 6 |-14 507 827 14 |- 21 477 808 21 |- 25 218 351 25 |- 45 1.282 1.366 45 |- 65 1.087 1.038 65 e oltre 703 531 Totale 4596 5524 a) Quante sono le unità statistiche osservate?_4596+5524=10120______________________________ b) La classe di età 25|-45 è più frequente in Piemonte o in Campania? (motivare la risposta):_frequenze relative in % di colonna_________ c) Fra coloro che hanno un età compresa fra 21 e 25 anni qual è la Piemonte Campania 0,28 0,25 percentuale di coloro che risiedono in Piemonte? __frequenza relativa in % di riga: 0.38________ 1 d) Indicare la classe di età modale in Piemonte:__ 14 |- 21____________________________________ e) Calcolare l’età media in Piemonte e Campania: _39.61__32.77______________________________ f) Calcolare l’età media nell’insieme delle 2 regioni:_35.87___________________________________ g) Calcolare la varianza dell’età nelle due regioni:___Var.Piem= 597.76, Var.Campania=546.35_______ h) Calcolare la varianza dell’età nell’insieme delle due regioni: _Var. Tot=581,3134________________ i) In quale delle due regioni l’età presenta la maggiore variabilità? Rispondere utilizzando un opportuno indicatore: ___CV.Piem=0.62__CV.Camp=0.71__________________________________ Esercizio 2: Rispondere alle seguenti domande: 1) La mediana delle seguenti osservazioni {1, 7, 2, 3, 7, -1, 0} è a) 7 c) 3 b) 2 2) La varianza di una variabile statistica può diventare negativa: a) solo se la variabile è costante b) per variabili che assumono valori negativi c) mai 3) La somma degli scarti dalla media aritmetica è sempre pari a: a) 0 b) –1 c) +1 4) Aggiungendo una costante positiva c a tutti i valori di una variabile la media aritmetica: a) aumenta di c b) diminuisce di c c) non si modifica 5) La varianza di 3X è pari: a) alla varianza di X b) a 3 volte la varianza di X c) a 9 volte la varianza di X 6) Se di una variabile X che assume valori {-1, 0 , +1} non si conoscono le frequenze, allora la media aritmetica può essere: a) –1,25 b) + 1,25 c) + 0,25 7) Se la variabile trasferibile X assume i valori {20, 0, 0, 0, 0, 0, 1} il rapporto di concentrazione di Gini: a) vale esattamente 1 b) è vicino a 1 c) è vicino a 0 8) Se la media aritmetica di X è 10 e la varianza di X è 100 allora il coefficiente di variazione è uguale a: a) 10 c) 100 b) 1 9) Dalla frequenza relativa di una certa modalità si può risalire alla frequenza assoluta purchè si conosca: a) la numerosità della popolazione b) di quale modalità si tratta c) la media e la mediana Esame del 4 Novembre 2004 (Prova B) Esercizio 1: Si considerino le distribuzioni per classi di voto dei maschi e delle femmine laureati in una facoltà in un certo anno accademico: 2 Voto di laurea Maschi 17 26 13 22 11 19 66-80 81-90 91-95 96-100 101-105 106-110 Femmine 1 5 11 10 5 26 a) Quante sono le unità statistiche osservate? ____166______________________________________ b) La classe di voto 96-100 è più frequente fra i maschi o fra le femmine? (motivare la risposta): ______maschi: frequenze relative in % di colonna, maschi=0.20 femmine=0.17________________ c) Fra coloro che hanno un voto compreso fra 106 e 110 qual è la percentuale delle femmine? ______ ____ frequenza relativa in % di riga: 0.58________________________________ d) Indicare la classe di voto modale nei maschi: ___96-100, con densità di frequenza pari a 5.50______ e) Calcolare il voto medio nei maschi e nelle femmine: __maschi: 92.72___femmine: 100.46________ f) Calcolare il voto medio nell’insieme dei laureati: __totale: 95.42____________________________ g) Calcolare la varianza del voto di laurea nei maschi e nelle femmine:_maschi: 131.29_ _femmine:69.93_ h) Calcolare la varianza del voto di laurea nell’insieme dei laureati: _totale: 123.45_______________ i) In quale dei due gruppi, maschi e femmine, il voto di laurea presenta la maggiore variabilità? Rispondere utilizzando un opportuno indicatore: __CVmaschi: 0.12___CVfemmine:0.08__________ Esame del 10 Novembre 2006 (Prova A) Anni di istruzione 1960 1991 0-| 5 18 15 5 -| 8 28 20 8 -| 11 10 12 11 -| 13 24 25 Esercizio 1 Nella tabella è riportata la distribuzione percentuale della popolazione della Gran Bretagna secondo gli anni di scolarizzazione: a) Si determini il livello medio di scolarizzazione nei due anni: __M60=9.3____M91=10.295___________________________ b) E’ più variabile il livello di istruzione nel 1960 o nel 1991? Si 13 -| 19 20 indichi l’indicatore utilizzato utile per il confronto e lo si calcoli: __CV60=0.496__CV91=0.455____ c) Il 50% delle persone meno istruite nel 1991 aveva un livello di istruzione inferiore o uguale a La distribuzione cumulata relativa al 1991 è Anni di istruzione Freq Cumulate 1991 0-|5 15 5 -| 8 35 8 -| 11 47 11 -| 13 72 28 13 -| 19 100 da cui possiamo affermare che la 50esima persona è inclusa nella classe 11-13. Si può impostare la proporzione: (72 - 47) : (13 - 11) = (50 - 47) : (x - 11) da cui: x = 11 + (2 · 3)/25= 11.24 Esercizio 2 L’Università di Bologna decide di aumentare di 65 euro le tasse di iscrizione all’università. Come cambierebbe il valore medio delle tasse se questa decisione fosse realizzata? Aumenterebbe di 65 euro E lo scarto quadratico medio? La varianza e pertanto anche lo scarto quadratico medio sono invarianti a traslazioni e dunque rimane lo stesso. 3 Se invece l’università decidesse di aumentare le tasse del 5% come cambierebbero media e scarto quadratico medio? Aumentare le tasse del 5% significa applicare sull’importo di partenza un coefficiente moltiplicativo pari a 1,05. Quindi la media aumenterebbe del 5%. La varianza passerebbe da X a (1,05)2X=1.1025X e dunque aumenterebbe del 10,25% e lo scarto quadratico medio aumenterebbe del 5%. Esercizio 3 In un esperimento 250 soggetti vengono assegnati al gruppo di trattamento e 249 al gruppo di controllo. Il risultato dell’esperimento viene valutato attraverso un punteggio che va da 0 a 100. Alla fine dell’esperimento il punteggio medio del gruppo di trattamento è risultato 66 con uno scarto quadratico medio di 21, mentre nel gruppo di controllo il punteggio medio è 59 con uno scarto quadratico medio di 20. Qual è il punteggio medio del gruppo dei 499 soggetti che hanno partecipato all’esperimento? E qual e’ la varianza? Per quanto riguarda la media aritmetica si tratta di n1 n2 n calcolare una media aritmetica ponderata fra le due 250 249 499 medie. Per quanto riguarda la varianza del gruppo totale occorre ricorrere alla scomposizione della devianza e quindi ricordarsi che la devianza totale m1 m2 m non è data dalla semplice somma delle due 66 59 62.50701 devianze ma concorre al suo calcolo anche la devianza tra. s1 s2 21 20 Var1 441 Var2 400 Dev1 110250 Dev2 99600 Dev tra 6112.725 Dev tot 215962.7255 Var tot 432.791033 Esercizio 4 Uomini Ad un campione di 2237 soggetti viene chiesto se sono mancini, Donne destrimani, o ambidestri ottenendo la distribuzione riportata in Destrimani tabella. Completare la tabella nelle informazioni mancanti e Mancini 92 Ambidestri 8 rispondere alle seguenti domande: 934 2004 La tabella completa è Uomini Destrimani Mancini Ambidestri 934 113 20 1067 TOTALE Donne 1070 92 8 1170 1067 2004 205 28 2237 a) Qual è la percentuale dei soggetti uomini e destrimani? ___________________________________ _Gli uomini destrimani sono 934 su 2237 e pertanto la loro percentuale è 41.75%_______________ 4 TOTALE 28 b) Sono più frequenti i mancini fra gli uomini o fra le donne?__________________________________ __I mancini fra gli uomini sono 113 su 1067 e dunque il 10.59% mentre i mancini fra le donne sono 92 su 1170 e dunque il 7.86%._________________________________________________________ c) Tra gli ambidestri è più facile trovare un uomo o una donna?________________________________ _Fra il totale degli ambidestri, che sono 28, ci sono 20 uomini, ovvero il 71.43%, e 8 donne ovvero il restante 28.57%.___________________________________________________________________ Esame del 10 Novembre 2006 (Prova B) Esercizio 1 Ad un campione di 2490 soggetti viene misurato il livello di colesterolo totale nel sangue ottenendo la distribuzione riportata in tabella. Completare la tabella nelle informazioni mancanti e rispondere alle seguenti domande: Uomini Donne TOTALE Basso 238 270 La tabella completa è Normale 876 Uomini Donne Alto 693 Basso 32 238 270 TOTALE 1121 Normale 876 651 1527 Alto 461 232 693 1369 1121 2490 a) Qual è la percentuale dei soggetti uomini con colesterolo nella norma? _Gli uomini con colesterolo normale sono 876 su 2490 persone in totale e dunque la loro percentuale è il 35.18%.___________ b) Sono più frequenti le persone con colesterolo alto fra gli uomini o fra le donne?________________ _Fra gli uomini 461 su un totale di 1369 hanno il colesterolo alto ovvero il 33.67%, fra le donne 232 su 1121 hanno il colesterolo alto ovvero una frazione del 20.70%.____________________________ c) Tra coloro che hanno il colesterolo basso, è più facile trovare un uomo o una donna?____________ _Fra le 270 persone che hanno il colesterolo basso, l’11.85% sono uomini e l’88.15% sono donne.__ Esercizio 2 In un esperimento 350 soggetti vengono assegnati al gruppo di trattamento e 200 al gruppo di controllo. Il risultato dell’esperimento viene valutato attraverso un punteggio che va da 0 a 100. Alla fine dell’esperimento il punteggio medio del gruppo di trattamento è risultato 67 con uno scarto quadratico medio di 21, mentre nel gruppo di controllo il punteggio medio è 58 con uno scarto quadratico medio di 19. Qual è il punteggio medio del gruppo dei 550 soggetti che hanno partecipato all’esperimento? E qual è la varianza? Per quanto riguarda la media aritmetica si tratta di calcolare una media aritmetica ponderata fra le due medie. Per quanto riguarda la varianza del gruppo totale occorreva ricorrere alla scomposizione della devianza e quindi ricordarsi che la devianza totale non è data dalla semplice somma delle due devianze ma concorre al suo calcolo anche la devianza tra. n1 350 n2 200 n 550 m1 67 m2 58 m 63.72727 s1 21 s2 19 5 Var1 441 Var2 361 Dev1 154350 Dev2 72200 Dev tra 10309.09 Dev tot 226859.1 Var tot 430.6529 Esercizio 3 Nella tabella è riportata la distribuzione percentuale della popolazione della Gran Bretagna secondo gli anni di scolarizzazione: Anni di istruzione 1960 1991 a) Si determini il livello medio di scolarizzazione nei due 0-| 5 28 15 anni:__M60= 8.9__M91= 10.175______________________ 5 -| 8 18 20 8 -| 11 10 12 b) E’ più variabile il livello di istruzione nel 1960 o nel 1991? 11 -| 13 24 28 Si indichi l’indicatore utilizzato utile per il confronto e lo si 13 -| 19 20 25 calcoli: __CV60=0.561___CV91=0.450___________________________ c) Il 50% delle persone meno istruite nel 1960 aveva un livello di istruzione inferiore o uguale a… _________ __Si fa la cumulata relativa al 1960: Anni di istruzione cumulata 1960 0 -| 5 28 5 -| 8 46 8 -| 11 11 -| 13 13 -| 19 56 80 100 da cui si evince che il 50simo soggetto cade nella classe 8-|11. Si può quindi impostare la proporzione: (56 - 46) : (11 - 8) = (50 - 46) : (x - 8) da cui: x = 8 + (3 · 4)/10= 9.2 Esercizio 4 L’Università di Bologna decide di aumentare di 70 euro le tasse di iscrizione all’università. Come cambierebbe il valore medio delle tasse se questa decisione fosse realizzata? _Aumenterebbe di 70 euro E lo scarto quadratico medio? __La varianza e pertanto anche lo scarto quadratico medio sono invarianti a traslazioni e dunque rimane lo stesso._________________________________________________________ Se invece l’università decidesse di aumentare le tasse del 5% come cambierebbero media e scarto quadratico medio? __Aumentare le tasse del 5% significa applicare sull’importo di partenza un coefficiente moltiplicativo pari a 1,05. Quindi la media aumenterebbe del 5%. La varianza passerebbe da X a (1,05)2X=1.1025X e dunque aumenterebbe del 10,25% e lo scarto quadratico medio aumenterebbe del 5%. Esame del 10 Gennaio 2006 (Prova A) Esercizio 3 La seguente tabella esprime i tempi di durata (in ore) di 150 apparecchiature elettroniche di due marche differenti: 6 Durata 0-100 100-200 200-300 300-400 400-500 500-600 600-700 700-800 800-900 900-2000 Marca A Marca B 30 48 30 18 10 5 4 3 2 0 150 27 38 25 23 11 8 5 5 4 4 150 a) Trovare i dati mancanti: __________________________________________________________________ b) Calcolare la durata media delle apparecchiature della marca A: _mediaA=242__mediaB=313__________ c) Calcolare la percentuale di apparecchiature della marca A che hanno funzionato per un tempo minore della media:__ Si fa la cumulata della Marca A: Durata 0-100 100-200 200-300 300-400 400-500 500-600 600-700 700-800 800-900 900-2000 Freq. Cumulate Marca A 30 78 108 126 136 141 145 148 150 150 La media delle apparecchiature della marca A è di 242 ore e cade nella classe 200 |-300. Si può quindi impostare la proporzione: (300 - 200) : 30 = (242-200) : x da cui x = (30 * 42)/100= 12.6 -> dunque (78+12.6)/150*100=60.4% d) E’ più variabile la durata delle apparecchiature della marca A o quella delle apparecchiature della marca B? Motivare la risposta: ____CVmarcaA=_0.740_____CVmarcaB=_0.886____________________ Esame del 10 Gennaio 2006 (Prova B) Esercizio 1 La seguente tabella esprime i tempi di durata (in ore) di 200 apparecchiature elettroniche di due marche differenti: Durata 0-100 100-200 200-300 300-400 400-500 500-600 600-700 700-800 800-900 900-2000 Marca A 80 48 30 18 10 5 4 3 2 0 200 Marca B 77 38 25 23 11 8 5 5 4 4 200 7 a) Trovare i dati mancanti: _____________________________________________________________ b) Calcolare la durata media delle apparecchiature della marca A: _ mediaA=194__mediaB=247__________ c) Calcolare la percentuale di apparecchiature della marca A che hanno funzionato per un tempo minore della media: ___ Si fa la cumulata della Marca A: Durata Freq. Cumulate Marca A 0-100 100-200 200-300 300-400 400-500 500-600 600-700 700-800 800-900 900-2000 80 128 158 176 186 191 195 198 200 200 La media delle apparecchiature della marca A è di 194 ore e cade nella classe 100 |-200. Si può quindi impostare la proporzione: (200 - 100) : 48 = (194-100) : x da cui x = (48 * 94)/100= 45.12 -> dunque (80+45.12)/200*100=62.56% d) E’ più variabile la durata delle apparecchiature della marca A o quella delle apparecchiature della marca B? Motivare la risposta: ____CVmarcaA=_0.907_____CVmarcaB=_1.075_____________________________ Esame del 8 Febbraio 2006 (Prova A) Esercizio 2: La seguente tabella riporta il tempo di percorrenza di un tratto autostradale per 70 automobilisti: Tempo di percorrenza N. automobili Meno di 1h 1h |- 1h 20 min 1h 20 min |- 1h 40 min 1h 40 min |-2h 2h |- 4h Totale 8 18 23 14 7 70 a) Calcolare il tempo medio di percorrenza in minuti: __media=91___________________________ b) Individuare lo scarto quadratico medio: __sqm= 37.46__________________________________ c) Sapendo che il tratto autostradale, di lunghezza 155 km, è sottoposto all’accertamento della velocità e che il limite di velocità autostradale è di 130 km/h, qual è la percentuale di automobilisti che verranno sanzionati? _ Si fa la cumulata del tempo di percorrenza: Tempo di percorrenza Freq. Cumulate < 1h 8 1h |- 1h20min 1h20min|-1h40min 26 49 1h40min|-2h 63 2h|-4h 70 Il tempo impiegato da coloro che vanno a 130 è di 71.5383 minuti, e cade nella classe 60 |-80 minuti. Si può quindi impostare la proporzione: (80 - 60) : 18 = (80-71.5383) : x da cui x = (18 * 8.46154)/20= 7.61538 -> dunque (70-26+7.61538)/70*100=73.74% 8 Esame del 8 Febbraio 2006 (Prova B) Esercizio 1: La seguente tabella riporta il tempo di percorrenza di un tratto autostradale per 80 automobilisti: Tempo di percorrenza N. automobili Meno di 1h 1h |- 1h 20 min 1h 20 min |- 1h 40 min 1h 40 min |-2h 2h |- 4h Totale 11 19 23 20 7 80 a) Calcolare il tempo medio di percorrenza in minuti: __media= 89.88_______________________________ b) Individuare lo scarto quadratico medio: ___sqm= 37.42________________________________________ c) Sapendo che il tratto autostradale, di lunghezza 160 km, è sottoposto all’accertamento della velocità e che il limite di velocità autostradale è di 130 km/h, qual è la percentuale di automobilisti che verranno sanzionati? _ Si fa la cumulata del tempo di percorrenza: Tempo di percorrenza Freq. Cumulate < 1h 11 1h |- 1h20min 1h20min|-1h40min 30 53 1h40min|-2h 73 2h|-4h 80 Il tempo impiegato da coloro che vanno a 130 è di 73.8462 minuti, e cade nella classe 60 |-80 minuti. Si può quindi impostare la proporzione: (80 - 60) : 19 = (80-73.8462) : x da cui x = (19 * 6.15385)/20= 5.84615 -> dunque (80-30+5.84615)/80*100=69.81% Esame del 18 gennaio 2011 (Prova A) Esercizio 3: Nella seguente tabella sono riportati i dati relativi alla mortalità alla nascita (rapporto fra numero di nati morti sul totale dei nati) e al reddito pro capite rilevati in alcuni Paesi. Natimortalità (x 100) Reddito p.c. in migliaia dollari 22 1 15 3 12 4 8 5 7 8 6 10 5 12 4.8 15 4.7 16 4.4 18 a) Si calcoli la mediana del reddito La mediana è 9 b) Quale dei due caratteri è più variabile nei vari Paesi? (motivare la risposta) CVnatimort=0.62, CVreddito=0.61 c) Sapendo che il reddito di un undicesimo Paese è pari a 13 e che i parametri del modello di regressione lineare stimato su tutti i Paesi sono b0=16,4422 e b1= –0,8282, determinare il tasso di mortalità osservato dell’undicesimo Paese. Il tasso di mortalità osservato per l'11esimo paese è pari a 5,0032 Esercizio 4: 9 Si consideri la successione di valori (24, 17, ?, 10, 9, 8, 7, 6.8, 6.7, 6.4) in cui si è persa la terza osservazione. Tuttavia è noto che la somma degli scarti degli altri nove valori rispetto alla media aritmetica complessiva è pari a –3.11. Ricostruire il valore mancante. ̅ 24 + 17 + . . . . = ̅ ̅ + 3.11 + 10 + 9 + 8 + 7 + 6.8 + 6.7 + 6.4 = 10 ̅ = 10.89 + 3.11 = 14 ̅ = 10.89 → Esame del 18 gennaio 2011 (Prova B) Esercizio 1: Nella seguente tabella sono riportati i dati relativi alla mortalità alla nascita (rapporto fra numero di nati morti sul totale dei nati) e al reddito pro capite rilevati in alcuni Paesi. Natimortalità (x 100) Reddito p.c. in migliaia dollari 24 4 17 5 14 6 10 7 9 10 8 12 7 14 6.8 17 6.7 18 6.4 20 a) Si calcoli la mediana del reddito La mediana è 11 b) Quale dei due caratteri è più variabile nei vari Paesi? (motivare la risposta) CVnatimort=0.59, CVreddito=0.49 c) Sapendo che il reddito di un undicesimo Paese è pari a 15 e che i parametri del modello di regressione lineare stimato su tutti i Paesi sono b0=20,1717 e b1= –0,8280, determinare il tasso di mortalità osservato dell’undicesimo Paese. Il tasso di mortalità osservato per l'11esimo paese è pari a 7,0047 Esercizio 4: Si consideri la successione di valori (22, 15, 12, 8, 7, 6, 5, ?, 4.7, 4.4) in cui si è persa l’ottava osservazione. Tuttavia è noto che la somma degli scarti degli altri nove valori rispetto alla media aritmetica complessiva è pari a 4,09. Ricostruire il valore mancante. 22 + 15 + 12 + 8 + 7 + 6 + 5 + ̅ − 4.09 + 4.7 + 4.4 = ̅ 10 22 + 15 + 12 + 8 + 7 + 6 + 5 + ̅ = 8.89 → ̅ − 4.09 + 4.7 + 4.4 = 10 ̅ = 8.89 − 4.09 = 4.8 10 Esercizio 1: Nella seguente tabella sono riportati le ore di studio e il voto all'esame di statistica: Ore di studio Voto 30 18 33 21 35 23 40 25 45 27 52 28 58 29 a) di quanto varia in media il voto all'aumentare di un'ora di studio? b0=9.23, b1=0.36 b) Quante ore devo studiare in più se voglio migliorare in media di due punti il mio voto? Devo aumentare di 5,51 ore. c) Quanto vale la correlazione fra ore di studio e voto? La correlazione r vale 0.94 d) Come cambierebbe la misura di correlazione se anziché misurare il tempo in ore misurassi il tempo in minuti? Non cambierebbe. Esercizio 2: • • • • Trovare l'equazione della retta di regressione per prevedere il punteggio all'esame finale, sulla base di quello ottenuto in un esame parziale. I dati sono: parziale: punteggio medio=70, scarto quadratico medio=10 finale: punteggio medio=55, scarto quadratico medio=20 Coefficiente di correlazione lineare r=0.6 b1=r Sy/Sx=0.6*20/10=1.2 b0=y.medio-b1*x.medio=55-1.2*70= -29 Quale voto si aspetta di prendere all'esame finale uno che abbia conseguito 80 all'esame parziale? y*=-29+1.2*80=67 Quanto vale la devianza di dispersione per il modello considerato? Non si può determinare perché non si ha a disposizione nessuna informazione su n. Se i voti anziché essere espressi in centesimi fossero espressi in 30 come varierebbe il coefficiente di regressione? In questo caso il coefficiente di regressione non cambia. Alcuni ricercatori hanno studiato i dati relativi alle immatricolazioni presso una certa facoltà: ogni studente deve riempire un questionario con i suoi dati anagrafici e quelli della sua famiglia. • Il coefficiente di correlazione tra l'età dello studente e il suo anno di nascita è: -1 circa -1 un valore negativo 0 un valore positivo circa 1 1 • Il coefficiente di correlazione tra l'età dello studente e quello della madre è: -1 circa -1 un valore negativo 0 un valore positivo circa 1 1 Esercizio 3: E' stato effettuato un sondaggio per esplorare l'atteggiamento dei residenti in una città nei confronti della chiusura totale al traffico di alcune vie del centro storico. La tabella seguente riporta la classificazione dei 654 rispondenti secondo i due caratteri 'fascia d'età' e 'tipo di atteggiamento': 16 -| 25 25 -| 40 Contrario 20 26 Incerto 24 36 11 Favorevole 180 123 40 -| 65 65 -| 85 80 90 30 20 15 10 a) Qual è la percentuale di persone che si sono dichiarate favorevoli e hanno più di 65 anni? 10/654*100=1.53% b) Qual è la percentuale di contrari fra i giovani (16 -| 25 anni)? 20/224*100=8.93% c) Il tipo di atteggiamento è indipendente in distribuzione dall'età? Rispondere utilizzando l'indicatore più adeguato e commentare il risultato No, Tchuprov=0.43141 Esercizio 4: Si consideri la distribuzione percentuale, secondo il voto riportato all'esame di maturità e il sesso per gli studenti iscritti ai corsi di laurea in Matematica nell'a.a. 2004-05: Sesso/Voto F M 60-69 9.5 22.5 15.8 70-79 16.9 19.6 18.2 80-89 17.9 18.5 18.0 90-100 55.7 39.4 48.0 100 100 100 a) Si completi la distribuzione b) Sapendo che le femmine sono 866 e i maschi 799 si calcoli l'indicatore χ2 : 69.24 c) Si calcoli il voto medio dei maschi : 82.177 Esercizio 5: Uno studio condotto su 1000 famiglie ha dato luogo ai seguenti risultati: Statura media del marito=173 cm scarto quadratico medio=7cm Statura media della moglie=160 cm scarto quadratico medio=6cm Coefficiente di correlazione lineare r=0.45 a) Si determinino l'intercetta e il coefficiente di regressione della retta di regressione riferita alle variabili in oggetto in cui la statura del marito è assunta quale variabile indipendente: b1=r Sy/Sx=0.45*6/7=0.386 b0=y.medio-b1*x.medio=160-0.386*173=93.222 b) Si preveda la statura della moglie il cui marito è alto 183cm y*=93.222+0.386*183=163.86 Esercizio 7: Il proprietario di una ditta di consegna di nafta per riscaldamento effettua un'indagine circa la rapidità con la quale vengono saldate le fatture in tre diverse zone periferiche. Estrae a tal fine da ognuna delle tre zone un campione di 100 conti, registrando il numero di giorni intercorrenti tra la consegna della nafta e il saldo della fattura. I risultati sono riportati nella tabella che segue: Da 1 a 15 giorni Da 16 a 30 giorni Più di 30 giorni Zona I 34 48 18 100 Zona II 42 50 8 100 12 Zona III 40 46 14 100 Valutare, con un opportuno indicatore, se il numero di giorni necessari per saldare le fatture dipende in distribuzione dalla zona periferica. Tchuprov=0.09003 Esercizio 8: Fra due variabili X e Y esiste la relazione lineare calcolata con il metodo dei minimi quadrati: Y=13.5-0.80X. Conoscendo solo le seguenti informazioni X Residui 5 2.9 3 0.3 6 -1.3 4 -1.9 4 0 a) Inserire il valore mancante nella tabella b) Calcolare i valori osservati della variabile Y: y.oss 11,95 10,95 6,95 7,95 9,85 Esercizio 1 Un virus informatico ha cancellato alcuni dati relativi ad un’analisi di regressione lineare semplice effettuata su un campione di 24 osservazioni. I dati ancora leggibili sono i seguenti: media di X = 5, media di Y= 10, varianze di X = 100 e di Y = 49, intercetta = 11.7 ottenuta con il metodo dei minimi quadrati. a) si ricavi il coefficiente di regressione lineare: b1=0.34 b) si ricavi R2, l’indice di determinazione lineare del modello: R2=0.24 c) se una unità statistica presenta un valore della variabile indipendente X pari a 5 quale sarà il corrispondente valore y* sulla retta di regressione: y*=10, è il baricentro Esercizio 2 In uno studio volto a studiare la relazione tra la distanza tra due città e la corrispondente tariffa aerea si sono rilevate le distanze tra Baltimora e 12 diverse città americane (in miglia) e il costo dei relativi biglietti aerei per viaggi di sola andata (in dollari). Si sono ottenuti i seguenti valori Distanza media = 712,7 Scarto quadratico medio della distanza = 402,7 Coefficiente di correlazione lineare = 0,795 Costo medio del biglietto = 166,9 Scarto quadratico medio del costo del biglietto=59,5 a) si ricavi il coefficiente di regressione lineare del modello di regressione che assume il costo del biglietto come variabile dipendente e la distanza come variabile indipendente: b1=0.112 b) si ricavi la devianza di regressione: DevRegr=24473.649 c) se una unità città dista da Baltimora 576 miglia quale sarà il corrispondente costo del biglietto y* ? y*=151.5699 Esercizio 3 Si vuole studiare la relazione tra la durata di un messaggio pubblicitario televisivo e il tempo di ricordo dello stesso. Durante un programma televisivo di 1 ora vengono mostrati a 60 individui messaggi pubblicitari di 13 durata diversa relativi allo stesso dentifricio. Ogni individuo viene poi sottoposto a un test volto a misurare la quantità di caratteristiche del prodotto che ricorda. Si ottengono i seguenti risultati: Durata media del messaggio pubblicitario = 38 secondi Codevianza fra durata e punteggio = 3060 Coefficiente di correlazione lineare = 0,538 Punteggio medio nel test di memoria = 13,8 Devianza del punteggio = 28296 a) si ricavi la devianza della variabile durata del messaggio pubblicitario: Dev(dur.)=11423.28 b) si ricavi il coefficiente di regressione lineare del modello di regressione che assume il punteggio del test di memoria come variabile dipendente e la durata del messaggio come variabile indipendente: b1=2.68 c) Se la somma dei residui y-y* relativi ai primi 59 individui è 3, quanto vale il residuo relativo all’ultima unità statistica?: y60-y*60=-3 14