Esercitazione n. 14
Transcript
Esercitazione n. 14
STATISTICA (2) – ESERCITAZIONE 5 26.02.2014 Dott.ssa Antonella Costanzo Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota) Il responsabile del controllo qualità di un’ azienda che produce manufatti cementizi è interessato a determinare la lunghezza µ del diametro di tubi in calcestruzzo fabbricati in serie. Egli sa che, a causa degli errori di misurazione, la misura che può effettuare con i suoi strumenti è una realizzazione di una variabile casuale normale di media µ e varianza . Dopo aver effettuato 25 misurazioni ottiene che la somma dei valori osservati è pari a 4250 mm, e la varianza è 225 . a) Ricavare un intervallo di confidenza al 95% e al 99% per µ. Commentare i risultati ottenuti. b) Determinare la numerosità campionaria necessaria affinché l’intervallo di confidenza per la lunghezza media del diametro dei tubi al livello del 95% abbia un ampiezza b = 10 mm. c) Considerando un IC al 99% per la media, volendo mantenere lo stesso margine di errore richiesto al punto b) quanto dovrebbe essere grande il campione da esaminare? d) Senza fare i conti, sarebbe diversa la risposta ottenuta al punto a) se il responsabile avesse ottenuto le stesse stime della media e della varianza con un campione di 256 misure? Perchè? Soluzione a) X=lunghezza del diametro dei tubi segue una legge normale, la varianza è ignota. A partire dal campione sappiamo che: √( − ) √ ~,⁄ , ⁄ indica il quantile α/2 della distribuzione t con n-1 g.d.l. 1 Intervallo casuale ( − ,⁄ √ ≤ ≤ + ,⁄ √ = 1 − [] Sostituendo i dati campionari si ottiene l’intervallo di confidenza. In particolare: %&' = ∑#$ "# = = 170 ; √ = 15 ; ,+ = 2.064 con α=0.05, n=25. Il valore 1- α & indica il livello di copertura fornito dall’intervallo. Intervallo di confidenza al 95%: 01[2&%,4] = 5170 − 2.064 15 √25 ; 170 + 2.064 [163.81; 176.19] 15 √25 7 L’interpretazione probabilistica dell’IC tiene conto del Principio del campionamento ripetuto: estraendo n campioni casuali da X (con → ∞) e su ciascuno di essi si stima un intervallo di confidenza, il 95% degli intervalli costruiti come illustrato in [A] contiene (copre) il parametro vero. Intervallo di confidenza al 99%: 01[22%,4] = 5170 − 2.797 ,+ = 2.797 con α=0.01. 15 √25 ; 170 + 2.797 [161.61; 178.39] 15 √25 7 Commento: un aumento del livello (1-α) - che corrisponde a richiedere maggiore affidabilità - si ottiene solo al prezzo di un ampliamento dell’IC. b) In generale, la lunghezza (ampiezza) dell’intervallo di confidenza è data da: = = 2 ∗ ; √ 2 Occorre determinare la numerosità campionaria affinché l’intervallo di confidenza per la media al 95% non sia più lungo di un valore fissato b=10 mm = √ ≥ 2 ∗ ; Ossia n deve essere almeno pari a ≥ 4;⁄ = Sostituendo nel nostro caso ,+ = 2.064, = 15, b=10 si ottiene ≥ 38.337 ≈ 38 Nota: Ampiezza IC per µ al 95% =12.38 mm. Se b=10 mm è l’ampiezza richiesta per un IC al 95% ( quindi un’ampiezza minore) occorre aumentare la numerosità campionaria. c) Se si vuole mantenere lo stesso margine d’errore di cui al punto b) allora la numerosità campionaria per l’IC al 99% per µ sarà pari a: ≥ 4 ∙ 2−1;⁄2 Con−1,+2 = 2.797 e = 15, b=10 si ottiene: 2 =2 ≥ 70.405 ≈ 70 Osservazione: aumentando il livello di confidenza e volendo mantenere invariata l’ampiezza dell’intervallo è necessario aumentare ulteriormente la numerosità campionaria d) Sappiamo che all’aumentare della numerosità campionaria, a parità di livello di confidenza, risulta minore la lunghezza degli intervalli di confidenza, poiché la maggiore quantità di informazioni riduce il grado di incertezza sul parametro. Quando n è sufficientemente grande (e questo accade per n = 256), per il TLC, la distribuzione della è ben approssimata dalla Normale standard. Avremo allora che un intervallo di confidenza per µ al livello 1 − α = 0.95 risulterebbe: 3 01[2&%,4] = 5170 − 1.96 15 √25 ; 170 + 1.96 [168.162; 171.838] 15 √25 7 Esercizio 2. Stima intervallare: IC per la media incognita (varianza ignota, n>30) e per la proporzione Nell'ambito di un’indagine sui consumi delle famiglie italiane è stato osservato un campione di n = 320 unità. E' risultato che le famiglie intervistate spendono mediamente 62 euro al mese per l'acquisto di carne (la varianza campionaria è pari a 289) e che 297 di queste possiedono più di un telefono cellulare. a) Si costruisca un intervallo di confidenza al 95% per la spesa media di carne delle famiglie italiane. b) Si stimi la frequenza relativa BC delle famiglie che possiedono più di un telefono cellulare. c) Si costruisca un intervallo di confidenza al 95% per il parametro B di cui al punto precedente Soluzione a) I parametri e della popolazione sono entrambi incogniti. Tuttavia si osserva su un campione casuale sufficientemente grande (n>30) per cui, √( − ) √ → D(0,1) Intervallo casuale: − E √ ≤ ≤ + E √ =1− 4 Intervallo di confidenza al 95%: Sostituendo quindi i valori campionari e con E'.2F& = 1.96 01[2&%,4] = G62 − 1.96 √289 √320 ; 62 + 1.96 [60.1373; 63.862] √289 √320 H b) La frequenza relativa delle famiglie con più di un telefono cellulare è pari a: BC = 297 = 0.9828 320 c) La costruzione dell’intervallo si basa sul seguente risultato: La frequenza relativa campionaria BC = I è una variabile casuale dove I~JK(, BC)numero di famiglie con più di un telefono cellulare. Essendo n sufficientemente grande per il TLC: BC = da questo fatto si deduce che: I BC(1 − BC) → D LB, M BC − B NBC(1 − BC) Intervallo casuale: P (1 − B P) B P − E Q OB → D(0,1) P (1 − B P) B P − E Q ≤B≤B R=1− Nota: poichéB non è noto, gli estremi dell’intervallo di confidenza sono ancora parzialmente ignoti. A ciò si rimedia sostituendo B con BC. 5 Intervallo di confidenza al 95% P (1 − B P) B P − E Q 01[2&%,S] = TB P (1 − B P) B P + E Q ;B U 0.9281(1 − 0.9281) 0.9281(1 − 0.9281) ; 0.9281 + 1.96Q T0.9281 − 1.96Q U 320 320 Esercizio 3. Stima puntuale: IC per la varianza incognita (media ignota) Si vuole verificare se la quantità X di una sostanza inquinante emessa dalle marmitte prodotte da un’azienda sono contenute entro limiti prestabiliti. A tal fine, si estrae un campione di n = 3 marmitte dalla produzione settimanale dell’azienda e attraverso prove su strada si rilevano le seguenti quantità (in mg per Km) della sostanza nociva rilasciate: " = 895, " = 902, "V = 894. Sapendo che la quantità emessa della sostanza in esame ha distribuzione normale di parametri µ e incogniti, determinare la stima intervallare di al livello di confidenza del 99%. Soluzione Poiché X ha distribuzione normale con media µ incognita, segue che: ( − 1) ~Wα⁄2, che è distribuita come una variabile casuale chi-quadro con n-1 gradi di libertà. Intervallo casuale: T ( − 1) W ; ≤ ≤ ( − 1) W ; U=1− 6 sostituendo i valori: = 897 1 1 = Y(# − ) = (895 − 897) + (902 − 897) + (894 − 897) = 19 −1 2 #$ W'.''&, = 10.6 percentile di destra, W'.22&, = 0.01 percentile di sinistra Intervallo di confidenza al 99%: 01[22%,Z[ ] = 5 2(19) 2(19) ; 7 10.6 0.01 7