Esercitazione 4 - Dipartimento di Economia, Finanza e Statistica

Transcript

Esercitazione 4 - Dipartimento di Economia, Finanza e Statistica
Esercitazioni di Istituzioni di Statistica e Statistica Economica – L. Scrucca
Istituzioni di Statistica e Statistica Economica
Università degli Studi di Perugia
Facoltà di Economia, Assisi, a.a. 2013/14
Esercitazione n. 4
A. Si supponga che la durata in giorni delle lampadine prodotte da una certa fabbrica abbia distribuzione normale con media µ = 8 e varianza σ2 = 3.9. Si immagini di estrarre campioni di n = 6
lampadine.
1. Si indichi la distribuzione della media campionaria e si calcolino il valore atteso e la varianza.
2. Si calcoli la probabilità che la media campionaria sia maggiore di 8.5 e minore di 7.8.
3. Si calcoli il valore atteso della varianza campionaria.
X̄ − µ
4. Si indichi la distribuzione della statistica T = p
e si calcoli il valore atteso. Inoltre, si
S 2 /n
calcolino i percentili di T corrispondenti a γ = 0.025 e γ = 0.005.
B. Si considerino le seguenti caratteristiche osservate su un campione casuale di n = 8 turisti di una
struttura albeghiera:
Unità
1
2
3
4
5
6
7
8
Numero di giorni di permanenza
12
6
7
7
6
4
4
7
Sesso
Cliente precedente
F
F
M
F
M
F
M
F
NO
SI
NO
NO
SI
NO
SI
NO
Sulla base di tale campione:
1. si stimi il numero di giorni di permanenza media µ dei clienti dell’albergo e si costruisca un
intervallo di confidenza al 99% per la media sotto l’ipotesi che il numero di giorni di permanenza
abbia distribuzione normale con varianza σ2 = 5;
2. si stimi la proporzione di turisti che sono stati già clienti della struttura alberghiera in passato
(sugg: si utilizzi la variabile casuale X che è pari a 1 nel caso di cliente precedente e 0 altrimenti,
e si assuma che tale variabile ha nella popolazione distribuzione Bernoulliana, X ∼ Bin(1, p), dove
p è il parametro da stimare);
3. si stimi un intervallo di confidenza al 95% per la proporzione di donne tra i turisti della struttura
alberghiera.
C. Un’indagine è stata condotta inerente il consumo televisivo in Italia da parte degli individui tra i 35
e i 50 anni. Nell’ambito di tale indagine viene estratto casualmente un campione di 12 persone nella
fascia di età in questione, alle quali viene chiesto il numero di ore di televisione (X ) seguite in media
ogni giorno. Il numero di ore di consumo televisivo quotidiano dichiarato sono le seguenti:
Ore
4
5
7
3
2
4
3
0
2
3
0
3
Sotto l’assunzione che X abbia nella popolazione distribuzione normale X ∼ N(µ, σ):
1. si calcolino le stime non distorte di µ e σ2 ;
2. si costruisca un intervallo di confidenza al 95% per il numero medio di ore che quotidianamente
il collettivo di riferimento guarda la televisione.
D. Nell’ambito di un’indagine sui consumi delle famigli italiane è stato osservato un campione di
n = 250 unità. È risultato che le famiglie intervistate spendono mediamente x̄ = 62 euro al mese per
l’acquisto di carne, con una varianza campionaria pari a s2 = 289, e che 41 di esse hanno almeno un
componente della famiglia vegetariano. Sulla base di questi dati:
Esercitazioni di Istituzioni di Statistica e Statistica Economica – L. Scrucca
1. si costruisca un intervallo di confidenza al 90% per la spesa media di carne delle famiglie italiane
(sugg. si usi la tecnica per grandi campioni);
2. si stimi la proporzione delle famiglie che hanno almeno un componente della famiglia vegetariano;
3. si costruisca un intervallo di confidenza al 95% per il parametro p di cui al punto precedente.
E.
Per un campione di n = 8 lampadine è stata rilevata la durata di funzionamento (X ) in ore:
248,
251,
254,
249,
256,
246,
252,
257.
Assumendo che X si distribuisca normalmente con media µ e varianza σ2 incognite:
1. si verifichi l’ipotesi H0 : µ = 252 contro l’alternativa H1 : µ 6= 252 al livello α = 0.10;
2. si verifichi l’ipotesi H0 : µ = 250 contro l’alternativa H1 : µ < 250 al livello α = 0.05.
F. L’amministratore di un’impresa commerciale con problemi di liquidità vuole analizzare l’importo
medio dei crediti concessi ai propri clienti. In base all’esperienza stabilisce che crediti di importo
troppo elevato rappresentano un pericolo per la stabilità finanziaria dell’impresa. A tal fine osserva
che l’importo (in migliaia di €) dei crediti concessi nell’arco di una settimana sono stati pari a:
12.7,
15.9,
15.2,
39,
2.8,
31,
19.1,
3.3,
12.1,
11.8,
4.5,
2.9,
17.8,
13.5,
10.3.
Indicando con X la variabile casuale che descrive l’importo del credito e assumendo che X ∼ N (µ, σ2 ),
con σ = 10:
1. si verifichi l’ipotesi H0 : µ = 12 contro l’alternativa H1 : µ > 12 al livello α = 0.10;
2. si ripeta la verifica delle ipotesi di cui al punto precedente supponendo di non conoscere il valore
vero di σ2 .
G. Un’azienda produttrice di bevande in lattina vuole verificare se un macchinario per il riempimento
automatico delle lattine soddisfa gli standard produttivi. Secondo tali standard il contenuto effettivo
X (in centilitri) ha valore atteso µ = 33. Si osserva un campione di n = 150 lattine trovando un valore
di x̄ = 31.9 e s2 = 15.75.
1. Si verifichi l’ipotesi H0 : µ = 33 contro l’alternativa H1 : µ < 33 al livello α = 0.05;
2. Si verifichi l’ipotesi H0 : µ = 33 contro l’alternativa H1 : µ 6= 33 al livello α = 0.01.
H. L’ufficio marketing di una grande azienda sostiene che il 21% delle famiglie acquista un determinato prodotto per la pulizia della casa. Si decide di effettuare un’indagine campionaria su n = 240
famiglie da cui risulta che 63 famiglie acquistano quel prodotto.
1. Calcolare un intervallo di confidenza al 95% per la proporzione delle famiglie che intende acquistare il prodotto in esame.
2. Si verifichi l’ipotesi H0 : p = 0.21 contro l’alternativa H1 : p 6= 0.21 al livello α = 0.01;
3. Si verifichi l’ipotesi H0 : p = 0.21 contro l’alternativa H1 : p > 0.21 al livello α = 0.1.
Esercitazioni di Istituzioni di Statistica e Statistica Economica – L. Scrucca
I. Si indichi se ognuna delle seguenti affermazioni è vera o falsa:
N.
Domanda
1
L’inferenza statistica consiste nel trarre delle conclusioni su una popolazione sulla
base di un’indagine totale (censimento)
2
Se X ha nella popolazione distribuzione Normale, anche la distribuzione della
media campionaria (X̄ ) è Normale
3
T è uno stimatore non distorto di θ se e solo se la sua distorsione è nulla
4
La varianza campionaria S 2 è uno stimatore consistente di σ2
5
Una statistica campionaria è una variabile aleatoria
6
Il parametro è una variabile aleatoria
7
Se uno stimatore è non distorto, il suo errore quadratico medio coincide con la
sua varianza
8
Nel caso di una popolazione Bernoullina, la distribuzione di X̄ tende a quella
Normale al tendere della dimensione campionaria a infinito
9
Per ogni campione osservato, la media campionaria ( x̄ ) coincide con la media della
popolazione (µ)
10
Se uno stimatore è consistente in media quadratica è anche asintoticamente non
distorto
11
La media campionaria (X̄ ) è un parametro
12
L’errore quadratico medio di X̄ , come stimatore di µ, è σ2 /n
13
Uno stimatore non distorto può essere meno efficiente di uno distorto
14
La distribuzione della media campionaria (X̄ ) è sempre Normale, a prescindere
dalla distribuzione della variabile di interesse (X ) nella popolazione
15
A parità di altre circostanze, l’ampiezza dell’intervallo di confidenza per la media è
tanto minore quanto maggiore è il valore di α
16
Usualmente l’ipotesi nulla e quella alternativa coincidono
17
La zona di accettazione e quella di rifiuto utilizzate per verificare una certa ipotesi
hanno sempre almeno un elemento in comune
18
La probabilità dell’errore di II tipo è definita come la probabilità che il campione cada nella zona di accettazione quando il valore vero del parametro soddisfa
l’ipotesi alternativa
19
Se X ∼ N (µ, σ2 ), con σ2 non noto, si rifiuta H0 : µ = µ0 in favore di H1 : µ > µ0 ogni
volta che x̄ ≥ µ0
20
Se si assume che X ∼ Bin(1, p) e H0 : p = p0 , la varianza di X̄ sotto l’ipotesi nulla è
p0 (1 − p0 )/n
21
Se X ∼ N (µ, σ2 ) con σ2 noto, il test per H0 : µ = µ0 contro H1 : µ < µ0 al livello α
consiste nel rifiutare H0 quando z ≥ zα
22
Con errore di I tipo si intende quello che consiste nell’accettare l’ipotesi nulla
quando è falsa
V
F
Esercitazioni di Istituzioni di Statistica e Statistica Economica – L. Scrucca
Istituzioni di Statistica e Statistica Economica
Università degli Studi di Perugia
Facoltà di Economia, Assisi, a.a. 2013/14
Soluzione esercitazione n. 4
A.
1. La media campionaria X̄ ha distribuzione normale con media E(X̄ ) = µ = 8 e varianza Var(X̄ ) =
σ2 /n = 3.9/6 = 0.65.
2.
8.5 − 8
P(X̄ > 8.5) = P Z > p
= P(Z > 0.62) = 1 − Φ(0.62) = 1 − 0.7324 = 0.2676
0.65
7.8 − 8
P(X̄ < 7.8) = P Z < p
= P(Z < −0.25) = Φ(−0.25) = 1 − Φ(0.25) = 1 − 0.5987 = 0.4013
0.65
3. Per la varianza campionaria si ha E(S 2 ) = σ2 = 3.9.
X̄ − µ
si distribuisce come una t di Student con (n − 1) gradi di libertà ed ha
4. La statistica T = p
S 2 /n
valore atteso nullo, cioè E(T ) = 0.
In questo caso i gradi di libertà sono 5 e, quindi, il percentile corrispondente a γ = 0.025 è pari a
2.571, cioè


X̄ − µ
Pp
≥ 2.571 = 0.025
S 2 /n
mentre il percentile corrispondente a γ = 0.005 è pari a 4.032, cioè


X̄ − µ
Pp
≥ 4.032 = 0.005
S 2 /n
B.
1. Stima del numero di giorni di permanenza media µ dei clienti dell’albergo:
x̄ =
n
1X
n
xi =
i=1
1
8
(12 + 6 + 7 + 7 + 6 + 4 + 4 + 7) = 53/8 = 6.625
Estremi dell’intervallo di confidenza al 99% per µ:
p
p
(x̄ ± zα/2 σ2 /n) = (6.625 ± 2.576 5/8) = (4.589, 8.662)
dove z0.01/2 = 2.576.
2. Indichiamo con X i = 1 se il cliente i -esimo è già stato cliente dell’albergo e con X i = 0 altrimenti.
Quindi, la stima della proporzione di turisti che sono stati già clienti della struttura alberghiera
in passato è pari a:
p̂ =
n
1X
n
xi =
i=1
1
8
(0 + 1 + 0 + 0 + 1 + 0 + 1 + 0) = 3/8 = 0.375
3. Stima dell’intervallo di confidenza al 95% per la proporzione proporzione di donne tra i turisti
dell’albergo:
p
p
(p̂ ± zα/2 p̂(1 − p̂)/n) = (0.625 ± 1.96 0.625(1 − 0.625)/8) = (0.2895, 0.9605)
dove z0.05/2 = 1.96 e
p̂ =
n
1X
n
i=1
xi =
1
8
(1 + 1 + 0 + 1 + 0 + 1 + 0 + 1) = 5/8 = 0.625
Esercitazioni di Istituzioni di Statistica e Statistica Economica – L. Scrucca
C.
1. La stima non distorta del numero medio di ore di televisione viste è pari a:
x̄ =
n
1X
n
xi =
i=1
1
12
(4 + 5 + 7 + 3 + 2 + 4 + 3 + 0 + 2 + 3 + 0 + 3) = 36/12 = 3
mentre la stima non distorta della varianza è pari a:
s2 =
1
n−1
n
X
(x i − x̄)2 =
i=1
1
12 − 1
[(4 − 3)2 + (5 − 3)2 + . . . + (3 − 3)2 ] = 42/11 = 3.818
2. L’intervallo di confidenza al 95% per µ (con σ2 incognito) è dato da
p
p
P(X̄ − t α/2;n−1 S 2 /n ≤ µ ≤ X̄ + t α/2;n−1 S 2 /n) = 1 − α
Pertanto, gli estremi dell’intervallo sono:
p
(3 ± 2.201 3.818/12) = (1.758, 4.242)
dove t 0.05/2;11 = 2.201.
D.
1. L’intervallo di confidenza al 90% per µ (con σ2 incognito, caso dei grandi campioni) è dato da:
p
p
P(X̄ − zα/2 S 2 /n ≤ µ ≤ X̄ + zα/2 S 2 /n) = 1 − α
Pertanto, gli estremi dell’intervallo sono:
p
(62 ± 1.645 289/250) = (60.231, 63.769)
dove z0.1/2 = 1.645.
2. Stima della proporzione di famiglie che hanno almeno un componente della famiglia vegetariano:
p̂ =
41
250
= 0.164
3. L’intervallo di confidenza al 95% per p (caso dei grandi campioni) è dato da:
p
p
P(p̂ − zα/2 p̂(1 − p̂)/n ≤ p ≤ p̂ + zα/2 p̂(1 − p̂)/n) = 1 − α
Pertanto, gli estremi dell’intervallo sono:
p
(0.164 ± 1.96 0.164(1 − 0.164)/250) = (0.1181, 0.2099)
dove z0.05/2 = 1.96.
E.
Stima della durata media di funzionamento delle lampadine:
x̄ =
n
1X
n
i=1
xi =
1
8
(248 + 251 + . . . + 257) =
2013
8
= 251.63
Stima della varianza σ2 :
s2 =
1
n−1
n
X
(x i − x̄)2 =
i=1
1
8−1
[(248 − 251.63)2 + (251 − 251.63)2 + . . . + (257 − 251.63)2 = 15.125
Esercitazioni di Istituzioni di Statistica e Statistica Economica – L. Scrucca
1. Per verificare l’ipotesi H0 : µ = 252 contro l’alternativa H1 : µ 6= 252 al livello α = 0.10 calcoliamo
251.63 − 252
x̄ − µ0
= p
= −0.27
t=p
15.125/8
s2 /n
e lo confrontiamo con il quantile t 0.1/2;7 = 1.895. Essendo |t| < t 0.1/2;7 si accetta H0 al livello
α = 0.10.
2. Per verificare l’ipotesi H0 : µ = 250 contro l’alternativa H1 : µ < 250 al livello α = 0.05 calcoliamo
x̄ − µ0
251.63 − 250
t=p
= p
= 1.185
2
15.125/8
s /n
e lo confrontiamo con il quantile −t 0.05;7 = −1.895. Essendo t > −t 0.05;7 si accetta H0 al livello
α = 0.05.
F.
1. Stima dell’importo medio del credito:
x̄ =
n
1X
n
i=1
xi =
1
15
(12.7 + 15.9 + . . . + 10.3) =
211.9
15
= 14.127
Per verificare l’ipotesi H0 : µ = 12 contro l’alternativa H1 : µ > 12 al livello α = 0.10 calcoliamo
14.123 − 12
x̄ − µ0
= p
= 0.824
z=p
100/15
σ2 /n
e lo confrontiamo con il quantile z0.1 = 1.282. Essendo z < z0.1 si accetta H0 al livello α = 0.10.
2. Se il valore vero di σ2 fosse incognito, per verificare l’ipotesi di cui al punto precedente dovremmo innanzi tutto stimare σ2 :
n
1 X
1
2
s =
[(12.7 − 14.123)2 + (15.2 − 14.123)2 + . . . + (10.3 − 14.123)2 = 102.62
(x i − x̄)2 =
n − 1 i=1
15 − 1
Quindi, calcoliamo
x̄ − µ0
14.123 − 12
t=p
=p
= 0.813
2
102.62/15
s /n
e lo confrontiamo con il quantile t 0.1;14 = 1.345. Essendo t < t 0.1 si accetta H0 al livello α = 0.10.
G.
1. Per verificare l’ipotesi H0 : µ = 33 contro l’alternativa H1 : µ < 33 al livello α = 0.05 calcoliamo
x̄ − µ0
31.9 − 33
z=p
=p
= −3.39
2
15.75/150
s /n
e lo confrontiamo con il quantile z0.05 = 1.645. Essendo z < −z0.05 si rifiuta H0 al livello α = 0.05.
2. Per verificare l’ipotesi H0 : µ = 33 contro l’alternativa H1 : µ 6= 33 al livello α = 0.01 confrontiamo
il valore di z calcolato precedentemente con il quantile z0.01/2 = 2.576. Essendo |z| > z0.01/2 si
rifiuta H0 al livello α = 0.01.
H.
1. La stima della proporzione di famiglie che intendono acquistare il prodotto è pari a:
p̂ =
63
240
= 0.2625
Gli estremi dell’intervallo di confidenza al 95% per p (caso dei grandi campioni) sono dati da:
p
p
p̂ ± zα/2 p̂(1 − p̂)/n = (0.2625 ± 1.96 0.2625(1 − 0.2625)/240) = (0.2068, 0.3182)
dove z0.05/2 = 1.96.
Esercitazioni di Istituzioni di Statistica e Statistica Economica – L. Scrucca
2. Per verificare l’ipotesi H0 : p = 0.21 contro l’alternativa H1 : p 6= 0.21 al livello α = 0.01 calcoliamo
z=p
p̂ − p0
p0 (1 − p0 )/n
=p
0.2625 − 0.21
0.21(1 − 0.21)/240
= 1.997
e lo confrontiamo con il quantile z0.01/2 = 2.576. Essendo |z| < z0.01/2 si accetta H0 al livello
α = 0.01.
3. Per verificare l’ipotesi H0 : p = 0.21 contro l’alternativa H1 : p > 0.21 al livello α = 0.10 confrontiamo il valore di z calcolato precedentemente con il quantile z0.10 = 1.282. Essendo z > z0.10 si
rifiuta H0 al livello α = 0.10.
Esercitazioni di Istituzioni di Statistica e Statistica Economica – L. Scrucca
I.
N.
Domanda
V
F
1
L’inferenza statistica consiste nel trarre delle conclusioni su una popolazione sulla
base di un’indagine totale (censimento)
2
Se X ha nella popolazione distribuzione Normale, anche la distribuzione della
media campionaria (X̄ ) è Normale
X
3
T è uno stimatore non distorto di θ se e solo se la sua distorsione è nulla
X
4
La varianza campionaria S è uno stimatore consistente di σ
X
5
Una statistica campionaria è una variabile aleatoria
6
Il parametro è una variabile aleatoria
7
Se uno stimatore è non distorto, il suo errore quadratico medio coincide con la
sua varianza
X
8
Nel caso di una popolazione Bernoullina, la distribuzione di X̄ tende a quella
Normale al tendere della dimensione campionaria a infinito
X
9
Per ogni campione osservato, la media campionaria ( x̄ ) coincide con la media della
popolazione (µ)
10
Se uno stimatore è consistente in media quadratica è anche asintoticamente non
distorto
11
La media campionaria (X̄ ) è un parametro
12
L’errore quadratico medio di X̄ , come stimatore di µ, è σ /n
X
13
Uno stimatore non distorto può essere meno efficiente di uno distorto
X
14
La distribuzione della media campionaria (X̄ ) è sempre Normale, a prescindere
dalla distribuzione della variabile di interesse (X ) nella popolazione
15
A parità di altre circostanze, l’ampiezza dell’intervallo di confidenza per la media è
tanto minore quanto maggiore è il valore di α
16
Usualmente l’ipotesi nulla e quella alternativa coincidono
X
17
La zona di accettazione e quella di rifiuto utilizzate per verificare una certa ipotesi
hanno sempre almeno un elemento in comune
X
18
La probabilità dell’errore di II tipo è definita come la probabilità che il campione cada nella zona di accettazione quando il valore vero del parametro soddisfa
l’ipotesi alternativa
19
Se X ∼ N (µ, σ2 ), con σ2 non noto, si rifiuta H0 : µ = µ0 in favore di H1 : µ > µ0 ogni
volta che x̄ ≥ µ0
20
Se si assume che X ∼ Bin(1, p) e H0 : p = p0 , la varianza di X̄ sotto l’ipotesi nulla è
p0 (1 − p0 )/n
21
Se X ∼ N (µ, σ2 ) con σ2 noto, il test per H0 : µ = µ0 contro H1 : µ < µ0 al livello α
consiste nel rifiutare H0 quando z ≥ zα
X
22
Con errore di I tipo si intende quello che consiste nell’accettare l’ipotesi nulla
quando è falsa
X
2
2
X
X
X
X
X
X
2
X
X
X
X
X