Esercitazione n. 14

Transcript

Esercitazione n. 14
STATISTICA (2) – ESERCITAZIONE 5
26.02.2014
Dott.ssa Antonella Costanzo
Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)
Il responsabile del controllo qualità di un’ azienda che produce manufatti cementizi è
interessato a determinare la lunghezza µ del diametro di tubi in calcestruzzo fabbricati
in serie. Egli sa che, a causa degli errori di misurazione, la misura che può effettuare
con i suoi strumenti è una realizzazione di una variabile casuale normale di media µ e
varianza . Dopo aver effettuato 25 misurazioni ottiene che la somma dei valori
osservati è pari a 4250 mm, e la varianza è 225 .
a) Ricavare un intervallo di confidenza al 95% e al 99% per µ. Commentare i
risultati ottenuti.
b) Determinare la numerosità campionaria necessaria affinché l’intervallo di
confidenza per la lunghezza media del diametro dei tubi al livello del 95% abbia
un ampiezza b = 10 mm.
c) Considerando un IC al 99% per la media, volendo mantenere lo stesso margine
di errore richiesto al punto b) quanto dovrebbe essere grande il campione da
esaminare?
d) Senza fare i conti, sarebbe diversa la risposta ottenuta al punto a) se il
responsabile avesse ottenuto le stesse stime della media e della varianza con un
campione di 256 misure? Perchè?
Soluzione
a) X=lunghezza del diametro dei tubi segue una legge normale, la varianza è ignota. A
partire dal campione sappiamo che:
√( − )
√ ~,⁄
, ⁄ indica il quantile α/2 della distribuzione t con n-1 g.d.l.
1
Intervallo casuale
( − ,⁄
√
≤ ≤ + ,⁄
√
= 1 − []
Sostituendo i dati campionari si ottiene l’intervallo di confidenza. In particolare:
%&'
= ∑#$ "# =
= 170 ; √ = 15 ; ,+ = 2.064 con α=0.05, n=25. Il valore 1- α
&
indica il livello di copertura fornito dall’intervallo.
Intervallo di confidenza al 95%:
01[2&%,4] = 5170 − 2.064
15
√25
; 170 + 2.064
[163.81; 176.19]
15
√25
7
L’interpretazione probabilistica dell’IC tiene conto del Principio del campionamento
ripetuto: estraendo n campioni casuali da X (con → ∞) e su ciascuno di essi si stima
un intervallo di confidenza, il 95% degli intervalli costruiti come illustrato in [A]
contiene (copre) il parametro vero.
Intervallo di confidenza al 99%:
01[22%,4] = 5170 − 2.797
,+ = 2.797 con α=0.01.
15
√25
; 170 + 2.797
[161.61; 178.39]
15
√25
7
Commento: un aumento del livello (1-α) - che corrisponde a richiedere maggiore
affidabilità - si ottiene solo al prezzo di un ampliamento dell’IC.
b) In generale, la lunghezza (ampiezza) dell’intervallo di confidenza è data da:
= = 2 ∗ ;
√
2
Occorre determinare la numerosità campionaria affinché l’intervallo di confidenza per
la media al 95% non sia più lungo di un valore fissato b=10 mm
=
√ ≥ 2 ∗ ;
Ossia n deve essere almeno pari a
≥
4;⁄ =
Sostituendo nel nostro caso ,+ = 2.064, = 15, b=10 si ottiene
≥ 38.337 ≈ 38
Nota: Ampiezza IC per µ al 95% =12.38 mm. Se b=10 mm è l’ampiezza richiesta per un
IC al 95% ( quindi un’ampiezza minore) occorre aumentare la numerosità campionaria.
c) Se si vuole mantenere lo stesso margine d’errore di cui al punto b) allora la
numerosità campionaria per l’IC al 99% per µ sarà pari a:
≥ 4 ∙ 2−1;⁄2
Con−1,+2 = 2.797 e = 15, b=10 si ottiene:
2
=2
≥ 70.405 ≈ 70
Osservazione: aumentando il livello di confidenza e volendo mantenere invariata
l’ampiezza dell’intervallo è necessario aumentare ulteriormente la numerosità
campionaria
d) Sappiamo che all’aumentare della numerosità campionaria, a parità di livello di
confidenza, risulta minore la lunghezza degli intervalli di confidenza, poiché la
maggiore quantità di informazioni riduce il grado di incertezza sul parametro.
Quando n è sufficientemente grande (e questo accade per n = 256), per il TLC, la
distribuzione della è ben approssimata dalla Normale standard. Avremo allora che
un intervallo di confidenza per µ al livello 1 − α = 0.95 risulterebbe:
3
01[2&%,4] = 5170 − 1.96
15
√25
; 170 + 1.96
[168.162; 171.838]
15
√25
7
Esercizio 2. Stima intervallare: IC per la media incognita (varianza ignota, n>30) e
per la proporzione
Nell'ambito di un’indagine sui consumi delle famiglie italiane è stato osservato un
campione di n = 320 unità. E' risultato che le famiglie intervistate spendono mediamente
62 euro al mese per l'acquisto di carne (la varianza campionaria è pari a 289) e che 297
di queste possiedono più di un telefono cellulare.
a) Si costruisca un intervallo di confidenza al 95% per la spesa media di carne delle famiglie italiane.
b) Si stimi la frequenza relativa BC delle famiglie che possiedono più di un telefono
cellulare.
c) Si costruisca un intervallo di confidenza al 95% per il parametro B di cui al
punto precedente
Soluzione
a) I parametri e della popolazione sono entrambi incogniti. Tuttavia si osserva su
un campione casuale sufficientemente grande (n>30) per cui,
√( − )
√ → D(0,1)
Intervallo casuale:
− E
√
≤ ≤ + E
√
=1−
4
Intervallo di confidenza al 95%:
Sostituendo quindi i valori campionari e con E'.2F& = 1.96
01[2&%,4] = G62 − 1.96
√289
√320
; 62 + 1.96
[60.1373; 63.862]
√289
√320
H
b) La frequenza relativa delle famiglie con più di un telefono cellulare è pari a:
BC =
297
= 0.9828
320
c) La costruzione dell’intervallo si basa sul seguente risultato: La frequenza relativa
campionaria
BC =
I
è una variabile casuale dove I~JK(, BC)numero di famiglie con più di un telefono
cellulare. Essendo n sufficientemente grande per il TLC:
BC =
da questo fatto si deduce che:
I
BC(1 − BC)
→ D LB,
M
BC − B
NBC(1 − BC)
Intervallo casuale:
P (1 − B
P)
B
P − E Q
OB
→ D(0,1)
P (1 − B
P)
B
P − E Q
≤B≤B
R=1−
Nota: poichéB non è noto, gli estremi dell’intervallo di confidenza sono ancora
parzialmente ignoti. A ciò si rimedia sostituendo B con BC.
5
Intervallo di confidenza al 95%
P (1 − B
P)
B
P − E Q
01[2&%,S] = TB
P (1 − B
P)
B
P + E Q
;B
U
0.9281(1 − 0.9281)
0.9281(1 − 0.9281)
; 0.9281 + 1.96Q
T0.9281 − 1.96Q
U
320
320
Esercizio 3. Stima puntuale: IC per la varianza incognita (media ignota)
Si vuole verificare se la quantità X di una sostanza inquinante emessa dalle marmitte
prodotte da un’azienda sono contenute entro limiti prestabiliti. A tal fine, si estrae un
campione di n = 3 marmitte dalla produzione settimanale dell’azienda e attraverso prove
su strada si rilevano le seguenti quantità (in mg per Km) della sostanza nociva rilasciate:
" = 895, " = 902, "V = 894.
Sapendo che la quantità emessa della sostanza in esame ha distribuzione normale di
parametri µ e incogniti, determinare la stima intervallare di al livello di
confidenza del 99%.
Soluzione
Poiché X ha distribuzione normale con media µ incognita, segue che:
( − 1) ~Wα⁄2,
che è distribuita come una variabile casuale chi-quadro con n-1 gradi di libertà.
Intervallo casuale:
T
( − 1) W
;
≤ ≤
( − 1) W
;
U=1−
6
sostituendo i valori:
= 897
1
1
=
Y(# − ) = (895 − 897) + (902 − 897) + (894 − 897) = 19
−1
2
#$
W'.''&,
= 10.6 percentile di destra,
W'.22&,
= 0.01 percentile di sinistra
Intervallo di confidenza al 99%:
01[22%,Z[ ] = 5
2(19) 2(19)
;
7
10.6 0.01
7