Esercitazion n 4

Transcript

Esercitazion n 4
Esercitazione n.4
Inferenza su varianza
Esercizio 1
Un’industria che produce lamiere metalliche ha ricevuto un ordine di acquisto di un grosso
quantitativo di lamiere di un dato spessore. Per assicurare la qualità della propria fornitura,
l’azienda vuole tenere sotto controllo la propria produzione. Assumendo che lo spessore X delle
lamiere prodotte abbia distribuzione normale e avendo osservato un campione di lamiere per le
quali gli spessori sono risultati essere:
2,88
2,93
2,98
2,89
2,88
2,95
2,87
3,01
3,02
3,05
determinare la stima intervallare al livello del 95% per la varianza incognita σ2 dello spessore.
Soluzione 1
Si tratta di determinare l’intervallo di confidenza della varianza. La v.c. di riferimento è la
9
.
Lo stimatore corretto della varianza della popolazione è
∑
0,03944
0,004382
1
9
∑
,
dove
2,946
!"
L’intervallo di confidenza è:
$% &
$% .
1
;"," (
)* )
1
;", +(
,
9 ∙ 0,004382
9 ∙ 0,004382
)* )
1
19,023
2,700
$% 0,002073 ) * ) 0,014607
0,95
0,95
0,95
Con una probabilità pari al 95% l’intervallo precedente potrebbe essere uno di quelli che contiene
la varianza incognita.
Esercizio 2
In una fabbrica di generi alimentari, si vuole determinare il valore medio di “grasso totale” (in
grammi) in una confezione regolare di patatine. Si analizzano 110 sacchetti e si ottengono i
seguenti risultati: 2̅ 18, 2 %. , 5
0,56 %. Assumendo che la popolazione di tali misurazioni
sia distribuita normalmente, si determinino gli intervalli di confidenza al 90% sia per 6 che per * .
Soluzione 2
L’intervallo di confidenza di μ (varianza incognita e grande campione) è:
5
5
$% 82̅ 9:;
= 6 = 2̅ > 9:;
? 1 @
√
√
0,74833
0,74833
$% 818,2 1,645
= 6 = 18,2 1,645
? 0,90
√101
√101
$%A18,08 = 6 = 18,32B 0,90
Con una probabilità pari al 90% l’intervallo precedente potrebbe essere uno
di quelli che contiene la media incognita.
1
L’intervallo di confidenza di * è:
1
$% &
Esercitazione n.4
Inferenza su varianza
!"";","(
1
)* )
!"";", (
,
0,90
Le tavole disponibili non ci permettono di individuare i valori del
in corrispondenza
di 100 gradi di libertà, a meno che non disponga di un qualunque software statistico. In
questo caso il programma ci restituirebbe i valori dei
utili per costruire il relativo
intervallo di confidenza:
100 ∙ 0,56
100 ∙ 0,56
$% .
)* )
1 0,90
124,3
77,93
$% 0,45 ) * ) 0,72
0,90
Non disponendo di un software statistico, è necessario ricorrere all’approssimazione
alla distribuzione normale:
della distribuzione del
C D E2
per cui l’intervallo è:
1 @ Pr H 9:; ) C ) >9:; I
E2
1
9:; ) E2
$%
E2
1 ) >9:;
Dove g = n -1; dopo semplici passaggi abbiamo:
1
0,90
@
$% J
2
2∑
3 > 9:; > 29:; √2
Tenendo conto che ∑
$% L
2 ∙ 101
∙
2 ∙ 56
3 > 1,645 > 2 ∙ 1,645 ∙ √2 ∙ 101
3
)* )
2∑
2
1 , abbiamo :
3
)* )
2 ∙ 101
$% 0,4514 ) * ) 0,7212
Il risultato è identico al precedente.
3 > 9:;
29:; √2
3 > 1,645
K
3
2 ∙ 56
0,90
2 ∙ 1,645 ∙ √2 ∙ 101
M
3
Esercizio 3
Un produttore di batterie per auto ha immesso sul mercato un nuovo modello per il quale il tempo
di durata ha distribuzione normale. Il produttore sostiene che la varianza del tempo di durata delle
batterie è pari a 1 anno. Su un campione di 12 batterie del nuovo tipo prodotto, sono stati
registrati seguenti tempi (anni) di durata:
1,9
2,4
3,0
3,5
4,2
3,3
2,5
3,4
2,7
3,5
2,8
2,8
Verificare al livello α = 0.05, la veridicità dell’affermazione del produttore.
Soluzione 3
2
N" :*
1
N! :* P 1
Esercitazione n.4
Inferenza su varianza
Il sistema d’ipotesi è: 8
Q! R S
TUS
Il test da utilizzare è
Lo stimatore corretto della varianza della popolazione è
∑
4,18
1
11
∑
V
dove
3
!
Quindi:
4,18
!!∙",VW
!
Dalla tavola del
0,38
in corrispondenza di 11 gradi di libertà, troviamo:
3,816 "," ( 21,920
", +(
Essendo il risultato del test interno ai suddetti valori, possiamo accettare l’ipotesi nulla e quindi
confermare l’affermazione del produttore.
Esercizio 4
In un’azienda che produce componenti meccaniche, il responsabile di produzione sottopone la
opportunità di introdurre un nuovo macchinario per la produzione di bulloni. Il nuovo
macchinario, secondo il responsabile, dovrebbe migliorare la produzione riducendo la variabilità
delle misure dei bulloni prodotti rispetto al macchinario in uso il quale produce bulloni la cui
varianza è 0,5 mm2. Il diametro dei bulloni prodotti dalla nuova macchina segue una distribuzione
normale con media µ e varianza σ2 entrambe incognite. Per valutare la qualità della produzione
ottenuta attraverso il nuovo macchinario si misura il diametro di un campione di 20 bulloni
prodotti, ottenendo i risultati dati:
4,6
4,8
5,5
4,7
5,1
5,2
4,7
4,5
4,6
4,5
4,8
5,4
4,8
4,6
4,9
4,8
4,9
5,4
4,7
5,5
Verificare ad un livello di significatività del 5% se la variabilità dei diametri dei bulloni prodotti
dal nuovo macchinario è inferiore a quella del vecchio macchinario.
Soluzione 4
N" :*
0,5
N! :* ) 0,5
Il sistema d’ipotesi è: 8
Il test da utilizzare è
Q! R S
TUS
Lo stimatore corretto della varianza della popolazione è
3
Esercitazione n.4
Inferenza su varianza
dove
Quindi:
∑
4,9
W
"
! ∙",!!"(
Dalla tavola del
",(
∑
1
2,1
19
0,1105
4,2
in corrispondenza di 19 gradi di libertà, troviamo:
", ("
10,117
Il risultato del test (4,2) è inferiore al valore soglia (10,117) e quindi cade nella zona di rifiuto per
cui possiamo ritenere che il nuovo macchinario produce bulloni con una varianza del diametro
inferiore a 0,5 mm2. La probabilità di errore di I tipo (rifiutare l’ipotesi nulla mentre in realtà è
vera) è inferiore al 5%. Calcolato (con Excel o altro software statistico) il p-value in
corrispondenza di
4,2, troviamo p-value=0,00015469. Un valore così basso ci conforta sulla
decisione che abbiamo assunto.
Esercizio 5
Nelle informazioni nutrizionali stampate su una lattina di 355 ml di una bevanda dietetica, si
afferma che vi sono soltanto 35 mg di sodio. Per affermare legittimamente ciò, si mantiene il
contenuto di sodio nell’acqua a 6 34,5X * 0,24X . Durante i regolari controlli di
qualità, si selezionano casualmente 100 lattine della linea di produzione e tra le altre analisi, se lo
scarto quadratico medio del campione è significativamente maggiore (con @ 0,05 di 0,24 mg,
la linea di produzione viene fermata e il dosaggio del processo viene riaggiustato.
Nel controllo effettuato s = 0,29 mg. Si determini se è necessario il riaggiustamento.
Soluzione 4
N" :*
0,24
N! :* Y 0,24
Il sistema d’ipotesi è: 8
Il test da utilizzare è
Q! R S
TUS
ma trattandosi di grande campione, possiamo utilizzare
l’approssimazione alla curva normale:
Sostituendo, otteniamo:
C D E2
C D Z2 [
C D E2 ∙ 0,29 ∙ 99⁄0,24
E2
1
;*"
E2
√2 ∙ 99
1
1
2,97
In corrispondenza di @ 0,05 il valore soglia è z = 1,645. Essendo il valore del test (2,97)
maggiore del valore soglia, dobbiamo rifiutare l’ipotesi nulla e affermare che lo scarto quadratico
medio del campione è significativamente maggiore di 0,24 mg, per cui la linea di produzione
dovrebbe essere fermata e il dosaggio del processo dovrebbe essere riaggiustato. Si potrebbe
commettere l’errore di I tipo (rifiutare l’ipotesi nulla mentre in realtà è vera). Il p-value è 0,0015 e
con un valore così basso la decisione assunta dovrebbe essere corretta.
4
Esercitazione n.4
Inferenza su varianza
Esercizio 5
Due appezzamenti di uno stesso frutteto sono stati trattati con due diversi fertilizzanti. In ciascun
appezzamento è stato scelto a caso un campione di piante controllandone il peso della produzione.
1° campione 25,3 32,6 18,7 29,4
2° campione 31,5 23,4 29,2 34,6 27,5
Supponendo che nelle due popolazioni il peso della produzione abbia distribuzione normale:
a) Preliminarmente testare la uguaglianza delle due varianze al livello di significatività pari
all’ 1%;
b) successivamente stabilire se tra i pesi medi vi è una differenza al livello di significatività
pari al 5%.
Soluzione 5
Calcoliamo le medie e le varianze campionarie:
_
∑aìc_
]_` _de
^_
]
ge, hig_
f
a_
^g
]
g
∑aìc_
]g`
ag
_fe
h
gk, gigg
∑ ]_`
a_
∑ ]g`
ag
^_
]
_
^g
]
_
g
g
je, d
_l, l
a) Per poter supporre che le due varianze delle popolazioni siano ignote ma uguali, *!
*
* dobbiamo effettuare un test di confronto tra varianze.
N ∶*
*
Il sistema d’ipotesi è 8 " !
N! ∶ *! P *
Il test da utilizzare è n
RoS
Il risultato del test è: n
RoS
RSS
che rappresenta una v.c. F di Snedecor e Fisher con n1-1 e n2-
1 gradi di libertà, il cui risultato bisogna confrontarlo con il valore soglia dalla tavola della
F in corrispondenza della colonna con 3 gdl e la riga con 4 gdl.
RSS
V ,"
!+,+
2,03
A questo punto occorre confrontare detto valore con i valori soglia della distribuzione F
con @ 0,01p %q r r rsp%tà%r5vpttrwqXp tp3p4:
F3;4;0,01=16,69 (valore soglia superiore), possiamo accettare tranquillamente l’ipotesi nulla
e quindi supporre che le due varianze siano uguali (omoschedasticità).
Per determinare il valore critico inferiore (Fi) è sufficiente considerare il valore critico
superiore Fs*, di una distribuzione F con i gradi di libertà invertiti, cioè con (n2-1) e (n1-1).
Il valore critico inferiore si ottiene calcolando il reciproco di Fs*
1
1
n
0,06
nx 16,69
b) Prima di effettuare il test sulle medie occorre stimare la varianza comune attraverso la
media ponderata delle due varianze dei campioni:
yg_ a_ _ > ygg ag _
je j > _l, l f
g
y
gh, hf
a_ > ag g
l
Quindi S = 5,05
5
Esercitazione n.4
Inferenza su varianza
Il sistema d’ipotesi è 8
zd ∶ { _ { g
z_ ∶ { _ P { g
Trattandosi di piccoli campioni, la statistica test da adottare per verificare l’ipotesi è
^_ }
^g
}
ge, h gk, g
|
d, ~_
_
_
_
_
Z
iZ >
a_ ag h, dh f > h
Dalla tavola della T, in corrispondenza di 7 gradi di libertà e di un livello di significatività
del 5%, troviamo i valori soglia – 2,365 e + 2,365.
Decisione: poiché il valore empirico è interno ai valori soglia, si accetta l’ipotesi nulla.
Tale decisione è supportata dal valore del p-value, il quale è compreso tra il 40 e il 50%.
Non vi è differenza significativa di peso delle piante nei due appezzamenti.
Esercizio 6
Supponiamo che una società che produce software di tipo finanziario voglia valutare la bontà di un
nuovo programma prima di lanciarlo sul mercato. La società desidera che, a parità di risultati e
caratteristiche, il nuovo software sia significativamente più veloce rispetto a quello attualmente in
circolazione.
Una possibilità a disposizione dell’analista consiste nell’estrarre due campioni casuali e
indipendenti di tempi di elaborazione e verificare l’esistenza di una differenza nei tempi medi
richiesti dal vecchio e dal nuovo programma per portare a termine diverse applicazioni di carattere
finanziario. I dati sono riportati nella seguente tabella:
SW attualmente
SW nuovo
in uso
9,98
9,88
9,88
9,95
9,84
9,75
9,99
9,80
9,94
9,87
9,86
9,84
10,12
9,87
9,90
9,86
9,91
9,83
9,84
9,86
Dopo aver verificato la uguaglianza delle due varianze con un livello di significatività
@ 0,05,verificare se il tempo medio richiesto dal nuovo software è significativamente
inferiore rispetto al tempo medio richiesto dal software attualmente in uso (@ 0,05)?
Soluzione 6
Preliminarmente calcoliamo le medie e le varianze campionarie:
o
∑ìc!
∑ 2! 2̅!
2!
2̅!
9,9265! 1
!
!
S
∑ìc!
2
∑ 2
0,007449
2̅
0,002767
1
Verifichiamo ora la uguaglianza tra le due varianze (omoschedasticità):
2̅
9,8515
6
Il sistema d’ipotesi è 8
N" ∶ *! *
N! ∶ *! P *
Il test da utilizzare è n
RoS
RSS
Esercitazione n.4
Inferenza su varianza
",""+
","" + +
2,69
che rappresenta una v.c. F di Snedecor e Fisher con n1-1 e n2-1 gradi di libertà, il cui risultato
bisogna confrontarlo con il valore soglia dalla tavola della F in corrispondenza della colonna con 9
gdl e la riga con 9 gdl, cioè 3,18. Il risultato del test (2,69) è inferiore al valore soglia (3,18) per
cui possiamo accettare l’ipotesi nulla e cioè l’uguaglianza delle due varianze.
Per verificare se il tempo medio del nuovo software è significativamente inferiore al tempo medio
richiesto dal software attualmente in uso, impostiamo il sistema d’ipotesi:
z ∶ {_ {g
8 d
z_ ∶ { _ Y { g
La statistica test è
Dove
o Q!
RoS •
•
S Q!
o• SQ
̅o Q ̅S
o
o
xZ •
€o €S
RSS
",""+
,
","+!
Q ,W(!
∙ •","" + +∙
!W
o o
oU oU
(Z •
1,57
0,0051073
S = 0,071465
La statistica test, se è vera H0, si distribuisce approssimativamente come una t di Student con
n1+n2-2 gradi di libertà. Dalla tavola della T risulta in corrispondenza di 18 gradi di libertà e α
=0,10 (il livello di significatività si raddoppia quando l’ipotesi alternativa è unidirezionale) che il
valore soglia è 1,784. La regola di decisione è: si accetta l’ipotesi nulla in quanto il risultato del
test è inferiore al valore soglia. Si può quindi concludere che il tempo medio richiesto dal nuovo
software per portare a termine applicazioni di tipo finanziario non è significativamente inferiore
rispetto al tempo medio richiesto dal software attualmente in uso (il p-value è 6,7%).
7