23/6/08

Transcript

23/6/08
1
Università di Venezia - Corso di Statistica I + II (Cb-Ga)
Prova Pratica di Statistica I+II - Prof. M. Romanazzi
23 Giugno 2008
Cognome e Nome
............................................
Punteggio
1:
2:
3:
4:
N. Matricola
............
Totale
Valutazione
Il punteggio massimo teorico di questa prova è 26/30 (2/30 per ciascuno dei 13 quesiti).
La prova è sufficiente se il punteggio è maggiore o uguale a 18/30. Alla prova orale è
riservato un punteggio massimo teorico di 6/30. Indica qui sotto la modalità dell’esame.
Statistica I: esercizi 1, 2, 3 e 4
Statistica II: esercizi 5, 6, 7 e 8
Statistica I + II: esercizi 1, 3, 5 e 7
Orale: II◦ appello
III◦ appello
2
1. La tabella mostra la distribuzione di frequenza % dei divorzi del biennio 2004-05 secondo la durata
del matrimonio in anni (fonte: ISTAT). Il numero dei divorzi è pari a 92133.
Anni
(0, 5)
[5, 10)
[10, 15)
%
2.84
25.32
24.24
% Cum.
Anni
[15, 20)
[20, 25)
≥ 25
%
16.84
11.90
18.86
% Cum.
• Qual è l’espressione della funzione di ripartizione FX (x) per 5 ≤ x < 10?
FX (x) =
• Qual è il primo quartile della distribuzione?
x0.25 =
• Disegna nello spazio sottostante l’istogramma della distribuzione, ponendo uguale a 35 l’estremo
superiore dell’ultima classe. Quali sono le caratteristiche salienti (unimodale/multimodale,
simmetrica/asimmetrica, uniforme, gaussiana)?
3
2. Di una variabile X, di tipo continuo, si sa che è simmetrica rispetto a x = 0 e che il 100% dei dati
è compreso fra −1 e 1.
• Qual è la mediana x0.5 della distribuzione? Qual è la relazione con la media µX ?
x0.5 =
µX < x0.5
µX = x0.5
µX > x0.5
• È vero che X è una variabile standardizzata? Giustifica accuratamente, specificando le proprietà delle variabili standardizzate.
Falso
Vero
Dati insufficienti
Giustificazione:
0.6
0.4
0.2
0.0
F. Ripartizione
0.8
1.0
• Il grafico mostra l’andamento della funzione di ripartizione di X. Segna sul grafico il secondo
decile della distribuzione e la frequenza relativa dei dati X ≤ 0.5 e indica i corrispondenti
valori.
−1.0
−0.5
0.0
X
x0.2 =
%=
0.5
1.0
4
3. Il ramo-foglia mostra la distribuzione del tasso di motorizzazione1 dei comuni capoluogo di provincia
(dati riferiti al 2006; fonte: ISTAT). I dati sono standardizzati.
n = 110
1| 3 si legge 1.3 (unità standard)
-3
-2
-1
-0
0
1
2
3
5
81
76555433311110000
999766655555555533222222211111100
000011112222233334445555566666777788999
00111222233347
1124
(ST )
• Il
Pdato standardizzato
P 2 di Padova è xP D = −0.533. Ricava il dato originario sapendo che
x
=
68117,
i i
i xi = 42521545.
xP D =
• Completa la tabella con la % dei comuni compresi negli intervalli (aperti) (−1, 1), (−2, 2),
(−3, 3). È plausibile l’approssimazione gaussiana, alla luce dei risultati?
Intervallo
% osservata
% teorica gaussiana
(−1, 1)
(−2, 2)
(−3, 3)
• Qual è il primo decile della trasformazione Y = 1 + 2XST ?
y0.1 =
1 Numero
di autovetture circolanti ogni 1000 abitanti.
5
4. La tabella mostra la distribuzione % dei divorzi del 2005 secondo il titolo di studio dei coniugi
(X : marito, Y : moglie; fonte: ISTAT). Le modalità delle due variabili sono: licenza elementare o
nessun titolo (LE), licenza di scuola media inferiore (LI), diploma di scuola superiore (DS), diploma
universitario o laurea (DL). Il numero dei divorzi è pari a 47036.
Marito, X
LE
LI
DS
DL
Marginale, Y
LE
3.00
1.92
0.43
0.05
Moglie, Y
LI
DS
2.56
0.77
26.86 11.92
8.22 27.33
0.08
4.64
DL
0.09
1.16
4.24
6.64
Marginale, X
• Qual è la moda della distribuzione congiunta? E quella della distribuzione marginale di X?
Moda distr. congiunta:
Moda marginale X:
• Qual è la % dei divorzi in cui marito e moglie hanno lo stesso livello di educazione?
• Riporta nella tabella sottostante le mode delle distribuzioni subordinate Y |X = x e commenta
i risultati: le variabili sono indipendenti? quale relazione emerge tra Y e X?
Titolo di studio del marito, X
Moda di Y |X = x
LE
LI
DS
DL
Commento:
• Supponi che, in una coppia divorziata appartenente al collettivo in esame, il marito sia diplomato. Qual è la previsione statistica del titolo di studio della moglie?
Previsione:
6
5. La figura mostra il diagramma di dispersione del consumo annuo di elettricità per uso domestico
rilevato nei comuni capoluogo di provincia nel 2005 (X) e nel 2006 (Y ). La linea tratteggiata indica
la bisettrice del primo quadrante. I dati, di fonte ISTAT, sono espressi in kwh per abitante. Le
statistiche riassuntive sono riportate di seguito.
n
111
xn
1163
yn
1087
sX
167
sY
157
sX,Y
24614
1400
1200
1000
800
Consumo Elettricità 2006
1600
Province Italiane
1000
1200
1400
1600
1800
Consumo Elettricità 2005
• Calcola i coefficienti della retta dei minimi quadrati yb = a∗0 + a∗1 x. Il consumo pro capite di
una famiglia nel 2005 è pari a 1120 kwh; qual è il consumo previsto per il 2006?
a∗0 =
a∗1 =
Previsione:
• E’ vero che la retta dei minimi quadrati è parallela alla bisettrice? Giustifica con cura.
Vero
Falso
Giustificazione:
• Qual è l’indice di bontà della retta dei minimi quadrati? Quale valore assume nel caso in
esame?
Indice:
Valore:
• La variabile Z = (X + Y )/2 misura il consumo medio pro capite di elettricità nel biennio
2005-2006. Calcolane la media z e la deviazione standard sZ .
z=
sZ =
7
6. Dall’urna contenente 90 biglietti numerati da 1 a 90 preleviamo 5 biglietti, a caso e senza reinserimento. Anna scommette sull’evento A : due pari nella cinquina. Bruno scommette sull’evento B :
cinque numeri minori o al massimo uguali a 50.
• Qual è la probabilità che vincano entrambi?
• Qual è la probabilità che nessuno dei due vinca?
• Il banco rende noto che Bruno ha vinto. Come valuta Anna la sua probabilità di vittoria, alla
luce di questa informazione? I due eventi sono dipendenti o indipendenti?
A, B indipendenti
A, B dipendenti
8
7. In una lotteria ad ogni puntata si estrae a caso un numero da 1 a 10. Se il numero è minore di 6,
il giocatore perde 1 euro; se è uguale a 6 o 7, non perde e non vince nulla; negli altri casi vince 1
euro.
• Supponi di puntare due volte. Qual è la probabilità che il pagamento totale sia pari a 0?
• Supponi di puntare 10 volte e considera gli eventi: A : pagamento 0 in due puntate, B :
pagamento −1 in due puntate, C : pagamento 1 in due puntate. Qual è l’evento più probabile?
A
B
C
AeB
AeC
BeC
Eventi equiprobabili
• Supponi di puntare 100 volte e indica con T100 il corrispondente pagamento totale. Qual è la
probabilità che T100 sia maggiore di 0?
9
8. Il ramo-foglia mostra i voti nella prova pratica di Statistica I del primo appello estivo. Supponi che
i partecipanti all’esame siano un campione casuale dalla popolazione di riferimento.
n = 63
1|
P9 si legge 19 (rapportato a 30)
Pi xi2 = 1117
i xi = 21257
0
1
1
2
2
5789
001112223334
566666888888889999999
0001111112222222233333444
5
• Calcola media e mediana dei voti. Quale tipologia distributiva viene suggerita dai dati?
x63 =
x0.5 =
Tipologia distributiva:
• Indica con pA la frequenza relativa dei sufficienti (voto uguale o superiore a 18) nella popolazione. Qual è l’intervallo di confidenza per pA di livello 0.95?
• Indica con µ il voto medio nella popolazione. Qual è la sua stima campionaria? Qual è la
misura dell’errore di campionamento?