23/6/08
Transcript
23/6/08
1 Università di Venezia - Corso di Statistica I + II (Cb-Ga) Prova Pratica di Statistica I+II - Prof. M. Romanazzi 23 Giugno 2008 Cognome e Nome ............................................ Punteggio 1: 2: 3: 4: N. Matricola ............ Totale Valutazione Il punteggio massimo teorico di questa prova è 26/30 (2/30 per ciascuno dei 13 quesiti). La prova è sufficiente se il punteggio è maggiore o uguale a 18/30. Alla prova orale è riservato un punteggio massimo teorico di 6/30. Indica qui sotto la modalità dell’esame. Statistica I: esercizi 1, 2, 3 e 4 Statistica II: esercizi 5, 6, 7 e 8 Statistica I + II: esercizi 1, 3, 5 e 7 Orale: II◦ appello III◦ appello 2 1. La tabella mostra la distribuzione di frequenza % dei divorzi del biennio 2004-05 secondo la durata del matrimonio in anni (fonte: ISTAT). Il numero dei divorzi è pari a 92133. Anni (0, 5) [5, 10) [10, 15) % 2.84 25.32 24.24 % Cum. Anni [15, 20) [20, 25) ≥ 25 % 16.84 11.90 18.86 % Cum. • Qual è l’espressione della funzione di ripartizione FX (x) per 5 ≤ x < 10? FX (x) = • Qual è il primo quartile della distribuzione? x0.25 = • Disegna nello spazio sottostante l’istogramma della distribuzione, ponendo uguale a 35 l’estremo superiore dell’ultima classe. Quali sono le caratteristiche salienti (unimodale/multimodale, simmetrica/asimmetrica, uniforme, gaussiana)? 3 2. Di una variabile X, di tipo continuo, si sa che è simmetrica rispetto a x = 0 e che il 100% dei dati è compreso fra −1 e 1. • Qual è la mediana x0.5 della distribuzione? Qual è la relazione con la media µX ? x0.5 = µX < x0.5 µX = x0.5 µX > x0.5 • È vero che X è una variabile standardizzata? Giustifica accuratamente, specificando le proprietà delle variabili standardizzate. Falso Vero Dati insufficienti Giustificazione: 0.6 0.4 0.2 0.0 F. Ripartizione 0.8 1.0 • Il grafico mostra l’andamento della funzione di ripartizione di X. Segna sul grafico il secondo decile della distribuzione e la frequenza relativa dei dati X ≤ 0.5 e indica i corrispondenti valori. −1.0 −0.5 0.0 X x0.2 = %= 0.5 1.0 4 3. Il ramo-foglia mostra la distribuzione del tasso di motorizzazione1 dei comuni capoluogo di provincia (dati riferiti al 2006; fonte: ISTAT). I dati sono standardizzati. n = 110 1| 3 si legge 1.3 (unità standard) -3 -2 -1 -0 0 1 2 3 5 81 76555433311110000 999766655555555533222222211111100 000011112222233334445555566666777788999 00111222233347 1124 (ST ) • Il Pdato standardizzato P 2 di Padova è xP D = −0.533. Ricava il dato originario sapendo che x = 68117, i i i xi = 42521545. xP D = • Completa la tabella con la % dei comuni compresi negli intervalli (aperti) (−1, 1), (−2, 2), (−3, 3). È plausibile l’approssimazione gaussiana, alla luce dei risultati? Intervallo % osservata % teorica gaussiana (−1, 1) (−2, 2) (−3, 3) • Qual è il primo decile della trasformazione Y = 1 + 2XST ? y0.1 = 1 Numero di autovetture circolanti ogni 1000 abitanti. 5 4. La tabella mostra la distribuzione % dei divorzi del 2005 secondo il titolo di studio dei coniugi (X : marito, Y : moglie; fonte: ISTAT). Le modalità delle due variabili sono: licenza elementare o nessun titolo (LE), licenza di scuola media inferiore (LI), diploma di scuola superiore (DS), diploma universitario o laurea (DL). Il numero dei divorzi è pari a 47036. Marito, X LE LI DS DL Marginale, Y LE 3.00 1.92 0.43 0.05 Moglie, Y LI DS 2.56 0.77 26.86 11.92 8.22 27.33 0.08 4.64 DL 0.09 1.16 4.24 6.64 Marginale, X • Qual è la moda della distribuzione congiunta? E quella della distribuzione marginale di X? Moda distr. congiunta: Moda marginale X: • Qual è la % dei divorzi in cui marito e moglie hanno lo stesso livello di educazione? • Riporta nella tabella sottostante le mode delle distribuzioni subordinate Y |X = x e commenta i risultati: le variabili sono indipendenti? quale relazione emerge tra Y e X? Titolo di studio del marito, X Moda di Y |X = x LE LI DS DL Commento: • Supponi che, in una coppia divorziata appartenente al collettivo in esame, il marito sia diplomato. Qual è la previsione statistica del titolo di studio della moglie? Previsione: 6 5. La figura mostra il diagramma di dispersione del consumo annuo di elettricità per uso domestico rilevato nei comuni capoluogo di provincia nel 2005 (X) e nel 2006 (Y ). La linea tratteggiata indica la bisettrice del primo quadrante. I dati, di fonte ISTAT, sono espressi in kwh per abitante. Le statistiche riassuntive sono riportate di seguito. n 111 xn 1163 yn 1087 sX 167 sY 157 sX,Y 24614 1400 1200 1000 800 Consumo Elettricità 2006 1600 Province Italiane 1000 1200 1400 1600 1800 Consumo Elettricità 2005 • Calcola i coefficienti della retta dei minimi quadrati yb = a∗0 + a∗1 x. Il consumo pro capite di una famiglia nel 2005 è pari a 1120 kwh; qual è il consumo previsto per il 2006? a∗0 = a∗1 = Previsione: • E’ vero che la retta dei minimi quadrati è parallela alla bisettrice? Giustifica con cura. Vero Falso Giustificazione: • Qual è l’indice di bontà della retta dei minimi quadrati? Quale valore assume nel caso in esame? Indice: Valore: • La variabile Z = (X + Y )/2 misura il consumo medio pro capite di elettricità nel biennio 2005-2006. Calcolane la media z e la deviazione standard sZ . z= sZ = 7 6. Dall’urna contenente 90 biglietti numerati da 1 a 90 preleviamo 5 biglietti, a caso e senza reinserimento. Anna scommette sull’evento A : due pari nella cinquina. Bruno scommette sull’evento B : cinque numeri minori o al massimo uguali a 50. • Qual è la probabilità che vincano entrambi? • Qual è la probabilità che nessuno dei due vinca? • Il banco rende noto che Bruno ha vinto. Come valuta Anna la sua probabilità di vittoria, alla luce di questa informazione? I due eventi sono dipendenti o indipendenti? A, B indipendenti A, B dipendenti 8 7. In una lotteria ad ogni puntata si estrae a caso un numero da 1 a 10. Se il numero è minore di 6, il giocatore perde 1 euro; se è uguale a 6 o 7, non perde e non vince nulla; negli altri casi vince 1 euro. • Supponi di puntare due volte. Qual è la probabilità che il pagamento totale sia pari a 0? • Supponi di puntare 10 volte e considera gli eventi: A : pagamento 0 in due puntate, B : pagamento −1 in due puntate, C : pagamento 1 in due puntate. Qual è l’evento più probabile? A B C AeB AeC BeC Eventi equiprobabili • Supponi di puntare 100 volte e indica con T100 il corrispondente pagamento totale. Qual è la probabilità che T100 sia maggiore di 0? 9 8. Il ramo-foglia mostra i voti nella prova pratica di Statistica I del primo appello estivo. Supponi che i partecipanti all’esame siano un campione casuale dalla popolazione di riferimento. n = 63 1| P9 si legge 19 (rapportato a 30) Pi xi2 = 1117 i xi = 21257 0 1 1 2 2 5789 001112223334 566666888888889999999 0001111112222222233333444 5 • Calcola media e mediana dei voti. Quale tipologia distributiva viene suggerita dai dati? x63 = x0.5 = Tipologia distributiva: • Indica con pA la frequenza relativa dei sufficienti (voto uguale o superiore a 18) nella popolazione. Qual è l’intervallo di confidenza per pA di livello 0.95? • Indica con µ il voto medio nella popolazione. Qual è la sua stima campionaria? Qual è la misura dell’errore di campionamento?