Esercitazioni-aula-parte-III Esempio par.7.2) Ross Sia (X1 - Iac-Cnr

Transcript

Esercitazioni-aula-parte-III Esempio par.7.2) Ross Sia (X1 - Iac-Cnr
Esercitazioni-aula-parte-III
Esempio par.7.2) Ross
Sia (X1 , ..., Xn ) un campione aleatorio estratto da una popolazione esponenziale di parametro θ incognito. Determinare l’espressione dello stimatore di
massima verosimiglianza per θ.
Esercizio)
∑n
∑n
verificare la formula i=1 (Xi − X̄)2 = i=1 Xi2 − nX̄ 2
Esercizio 1) Ross cap.7 num.4
Vogliamo misurare l’altezza di una torre per le telecomunicazioni sfruttando
la distanza orizzontale X tra la sua base e la nostra posizione, e l’angolo verticale
θ sotto cui la torre viene vista a tale distanza (si faccia riferimento alla Figura
7.6). Le 5 misurazioni della distanza X hanno dato (in piedi) i valori seguenti
150.42 150.45 150.49 150.52 150.40
Le 4 misurazioni dellangolo θ hanno dato in gradi
40.26 40.27 40.29 40.26
e dunque in radianti
0.7027 0.7028 0.7032 0.7027
Stima l’altezza della torre.
Esercizio 2) ROSS cap. 7 num. 6
Le piene dei fiumi vengono misurate tramite la loro portata (espressa di
seguito in piedi cubi al secondo). Un numero v é detto valore di una piena
secolare se
P (D ≥ v) = 0.01
dove D é la portata della piú grande piena in un anno a caso. La tabella seguente
riporta le portate delle maggiori piene del fiume Blackstone River, a Woonsocket
nel Rhode Island, negli anni da 1929 al 1965. Assumendo che la distribuzione
di questi dati sia lognormale, stima il valore di una piena secolare.
4570 5810 1970 2030 8220 3620 4530 4920 5780 4090 6560 5570 7500 9400
15000 32900 6340 8710 15100 3850 3840 4970 5860 5398 4480 4780 3330 4020
5310 5790 3830 4510 3410 5520 3830 5300 3150
Esercizio 3) (Ross Cap.6 n.15)
Una squadra di basket ha di fronte una stagione con 60 incontri. Di queste
partite, 32 sono con squadre di livello A e 28 sono con squadre di livello B. I
risultati delle partite sono tutti indipendenti; la probabilitá di vittoria é del 50%
contro una squadra di tipo A e del 70% contro una squadra di tipo B. Sia X il
numero totale di vittorie ottenute durante la stagione.
(a) La distribuzione di X é binomiale?
1
Siano XA e XB il numero di vittorie contro squadre di livello A e B rispettivamente.
(b) Che tipo di variabili aleatorie sono XA e XB? (c) Quale relazione lega
XA, XB e X? (d) Quanto vale approssimativamente la probabilitá che vi siano
almeno 40 vittorie?
Esercizio 4) Ross 7.16
Supponiamo di volere stimare la media di una popolazione normale che ha
entrambi i parametri incogniti. In particolare cerchiamo di determinare che
numerositá deve avere il campione affinché ad un livello di confidenza 1 − α,
l’intervallo di confidenza bilaterale abbia ampiezza non piú grande di A. Spiega
come si possa realizzare approssimativamente questo progetto tramite un doppio
campionamento che preveda di raccogliere un campione preliminare di ampiezza
30 e usarne i dati per dimensionare il campione definitivo.
Esercizio 5) Ross cap 7 n.10
La deviazione standard per i punteggi dei candidati ad un certo esame pubblico ha tipicamente un valore di 11.3. Se quest’anno un primo campione di 81
candidati presenta una punteggio medio di 74.6, qual é l’intervallo di confidenza
bilaterale al 90% per il punteggio medio di tutti i candidati?
Esercizio 6) (Ross Esempio 7.3.6)
Si determini un intervallo di confidenza al 95% per la media della frequenza
cardiaca a riposo degli iscritti di una palestra, nell’ipotesi che un campione
casuale di 15 di queste persone abbia fornito i seguenti dati:
54 63 58 72 49 92 70 73 69 104 48 66 80 64 77.
Si trovi anche un intervallo di confidenza sinistro, sempre al 95%.
Esercizio 7)(Ross Cap.6 n.18)
La temperatura alla quale un termostato scatta, ha distribuzione gaussiana
con varianza σ 2 . Considerato che lo strumento viene testato 5 volte, calcola
(a) P (S 2 /σ 2 ≤ 1.8)
(b) P (0.85 ≤ S 2 /σ 2 ≤ 1.15)
dove S 2 é la varianza campionaria dei cinque dati misurati.
esercizio 8) Generare n (i.e.,n = 100) dati da una distribuzione normale
con media e varianza fissata, successivamente calcolare l’intervallo di confidenza
al 95% per il parametro della media (supponendo di non conoscere la varianza
della popolazione). Quindi calcolare l’ampiezza dell’intervallo ottenuto e verificare se l’intervallo costruito contenga o meno il parametro di media corretto.
Ripetere il procedimento appena descritto k volte (k=1000) e contare quante
volte l’intervallo di confidenza contiene il parametro di media corretto.
2
Esercizio 9)
Supponi di essere incaricato da una ditta di produzione di lampadine di
stimare la qualitá della produzione. Cioé la ditta ti richiede di stimare la probabilitá p che una lampadina prodotta dalla ditta sia non difettosa. Il sistema di
produzione ti garantisce che le lampadine prodotte hanno tutte la stessa probabilitá di essere difettose e che i difetti in differenti lampadine sono indipendenti.
(a) Supponi di testare n lampadine scelte a caso tra quelle prodotte dalla ditta.
Qual é una buona stima (diciamola Zn) della probabilitá p, tale che Zn converge
a p in probabilitá? (b) Se tu testi 50 lampadine, qual é la probabilitá che la tua
stima sia nel range p±0.1? (c) Il manager della ditta ti richiede che la tua stima
cada nel range con probabilitá 0.95. Quante lampadine hai bisogno di testare
per soddisfare la sua richiesta?
Esercizio 10)
Supponiamo di sapere che negli Stati Uniti la statura media di un maschio
adulto é di 70 pollici, con una deviazione standard di 3 pollici. Per verificare che
gli uomini di una cittá sono ’nella media’, si sceglie un campione di 20 maschi
adulti e se ne misura la statura, ottenendo i risultati seguenti: 72 68.1 69.2
72.8 71.2 72.2 70.8 74 66 70.3 70.4 76 72.5 74 71.8 69.6 75.6 70.6 76.2 77 Cosa
concludi? Spiega quali assunzioni stai facendo.
Esercizio 11)
Si supponga di aver somministrato ad un gruppo di n=12 cavie un particolare
farmaco e di aver riscontrato i seguenti incrementi di peso: 55, 62,54, 57, 65,
64, 60, 63, 58, 67, 63 e 61 grammi. Sapendo che le cavie del tipo considerato (di
uguale etá e condizione), quando non sono sottoposte a trattamenti, mostrano
un incremento medio di peso pari a 65 grammi, ci si domanda se le osservazioni
siano tali da poter attribuire al farmaco la differenza riscontrata nell’incremento
medio di peso; in particolare si vuole sapere cioé se il farmaco possa consentire
una riduzione dell’aumento del peso o oppure se tale differenza possa essere
attribuita a fattori aventi carattere puramente accidentale.
Esercizio 12) Ross cap.8 n.2
Un laboratorio di analisi possiede una colonia di diverse migliaia di topi,
usate come cavie. É noto che il peso medio dei topi é di 32 grammi, con una
deviazione standard di 4 grammi. Uno scienziato chiede ad un assistente di
selezionare un campione casuale di 25 cavie; decide poi di pesarle, per controllare
che la casualitá della scelta dell’assistente non sia stata falsata da qualche criterio
inconscio (se ad esempio i topi scelti fossero quelli piú lenti nell’evitare la mano
dell’assistente, questo potrebbe indicare una certa inferioritá fisica di questo
gruppo). Se le 25 cavie risultano in un peso medio di 30.4 grammi, si puó dire
che questo evidenzi al 5% di significativitá che il campione non é stato scelto in
3
maniera casuale?
Esercizio 13) Ross cap.8 n.3
Una distribuzione di popolazione ha deviazione standard 20. Calcola il pdei-dati per il test dell’ipotesi che la media sia 50, supponendo che la media
campionaria su 64 osservazioni sia stata di (a) 52.5; (b) 55.0; (c) 57.5.
Esercizio 14)
Una distribuzione di popolazione gaussiana ha deviazione standard 20. Calcola il p-dei-dati per il test dell’ipotesi che la media sia 50, supponendo che
la media campionaria sia 55 su un campione di osservazioni di numerositá (a)
n=10; (b) n=60; (c) n=120.
Esercizio 15) Ross cap.8 n.5
Si richiede che la pressione di rottura media di un certo tipo di fibbra sia
almeno pari a 200 psi. La nostra esperienza passata ci dice che la deviazione
standard per questo genere di fibbre é di 5 psi. Un campione di 8 esemplari ha
fornito i valori seguenti: 210 195 197.4 199 198 202 196 195.5 Concluderesti (a)
al 5% o (b) al 10% di significativitá che la fibbra non é accettabile?
Esercizio 18) Ross cap.8 n.15 Venti anni fa i maschi del primo anno di una
certa scuola superiore erano in grado di fare in media 24 flessioni in 60 secondi.
Per vedere se questo sia ancora vero al giorno d’oggi, si sceglie un campione
casuale di 36 maschi del primo anno, e si trova una media campionaria di 22.5,
con una deviazione standard di 3.1. Possiamo concludere che la media non é
piú pari a 24? Usa un livello di significativitá del 5%.
Esercizio 19) Ross cap.8 n.39
A 10 donne incinte é stata somministrata una iniezione di pitocina (una
forma sintetica dell’ossitocina) per stimolarne il travaglio. Le pressioni sanguigne sistoliche immediatamente prima e dopo la somministrazione sono state:
Prima 134 122 132 130 128 140 118 127 125 142
Dopo 140 130 135 126 134 138 124 126 132 144
Ti sembra che i dati indichino che l’iniezione provochi un cambiamento della
pressione sanguigna?
Esercizio 20) Ross cap.8 n.17
La pubblicitá di una nuova auto afferma che essa é in grado di fare 30 miglia
di guida in autostrada con un gallone di benzina. Volendo verificare questo
fatto, si fanno 10 esperimenti indipendenti, e con quella quantitá di carburante
4
l’automobile copre 26, 24, 20, 25, 27, 25, 28, 30, 26 e 33 miglia. Si puó credere
all’annuncio? Che ipotesi stai facendo?
Esercizio 21 (Ross Cap.6 n.4)
La roulette di un casinó ha 38 settori, numerati con 0, 00, e da 1 a 36.
Scommettendo 1 su un certo numero, si vince 35 se quel numero esce, e si
perde 1 altrimenti. Supponendo di continuare a scommettere in questo modo,
determine approssimativamente la probabilitá di stare vincendo: (a) dopo 34,
(b) dopo 1 000, e (c) dopo 100 000 scommesse. Puoi assumere che tutti i 38
risultati escano con la stessa probabilitá, e che quelli di giocate diverse siano
indipendenti.
Esercizio 22 (Ross Cap.6 n.8)
Il numero di settimane di funzionamento di un certo tipo di batterie é una
variabile aleatoria con media 5 e deviazione standard 1.5. Quando una batteria si esaurisce, viene immediatamente sostituita con una nuova. Calcola approssimativamente la probabilitá che in un anno si debbano impiegare 13 o piú
batterie.
Esercizio 23 (Ross Cap.6 n.9)
Il tempo di vita di un certo componente elettrico é una variabile aleatoria
di media 100 ore e deviazione standard 20 ore. Se si provano 16 componenti
di questo tipo, quanto vale la probabilitá che la media campionaria delle loro
durate sia (a) minore di 104; (b) compresa tra 98 e 104?
5
Soluzione 1) l’altezza della torre T = Xtg(θ) é una v.a. che possiamo
vedere come il prodotto di due v.a. indipendenti perché possiamo supporre che
gli errori di misura sulla distanza X e sull’angolo θ siano indipendenti, dunque
possiamo dire che E(T ) = E(X)E(tag(θ)). Supponendo che ognuna delle due
v.a. abbia distribuzione di probabilitá gaussiana essendo una misura sperimentale ed ipotizzando strumenti non distorti, lo stimatore di maxverosimiglianza
per la media risulta la media campionaria e dunque una stima di E(T ) =
150.4560 · 0.8472 = 127.4606 (piedi).
Soluzione 2)
il logaritmo di questi dati é distribuito come una v.a. normale logD ∼
N (µ, σ 2 ). Possiamo stimare dunque µ̂ = X̄ = 8.5803 e σˆ2 = 0.2757 utilizzando
il log dei dati e scrivere
P (D ≥ d) = P (log(D) ≥ log(d)) = P (Z ≥
log(d) − 8.5803
√
) = 0.01
0.2757
dove Z é una N (0, 1). Poiché P (Z ≥ 2.32) = 0.01 segue che
log(d) − 8.5803
√
= 2.32
0.2757
↔
d = 18000
soluzione 3)
La probabilitá di vittoria ad ogni incontro é data
p = P (V ) = P (V |A)P (A) + P (V |B)P (B) = (32 ∗ 0.5 + 28 ∗ 0.7)/60 = 0.5933.
Poich gli incontri sono tutti indipendenti allora, la v.a. X numero di successi é
una Binomiale di parametri n=60 e p=0.5933. Per lo stesso motivo la variabile
XA é Binomiale di parametri n=32 e p=0.5 ed analogamente XB é Binomiale
di parametri n=28 e p=0.7. La relazione che lega X, XA e XB é la seguente
X = XA + XB dunque X é la somma di 2 Binomiali indipendenti
Calcoliamo la probabilitá chiesta al punto (d): P (X ≥ 40) = 1 − P (X ≤
39) = 1 − cdf (′ bino′ , 39, 60, 0.5933) = 0.1524
Oppure se non si dispone di un calcolare per il conto di sopra possiamo
usare l’approssimazione del T.C.L. vedendo la binomiale come somma di 60
bernulliane i.i.d.,
X − np
39.5 − np
1 − P (X ≤ 39) = 1 − P (X ≤ 39.5) = 1 − P ( √
≤√
)
np(1 − p)
np(1 − p)
con n = 60 e p = 0.5933 abbiamo che la probabilitá appena scritta é approssimabile con 1 − P (Z ≤ √ 39.5−60·0.5933 ) = 1 − P (Z ≤ 1.0255) = 0.1526
60·0.5933(1−0.5933)
Soluzione 4) se il capione é normale, con media e varianza incogniti,
l’intervallo di confidenza richiesto ha la seguente forma
6
√
√
[X̄ − tα/2,n−1 S/ n, X̄ + tα/2,n−1 S/ n]
√
la cui ampiezza 2tα/2,n−1 S/ n deve soddisfare il vincolo richiesto
√
2tα/2,n−1 S/ n ≤ A.
.
Se adesso potessimo disporre di un primo campione di taglia n=30 potremmo
calcolare S e sostituendolo nell’equazione data trovare n ≥ (2tα/2,n−1 S/A)2
Soluzione 5) Indichiamo con X la variabile casuale punteggio dell’esame
e supponiamo che sia gaussiana, dal testo si evince che X ∼ N (µ, 11.32 ). Ci
é dunque richiesta una stima intervallare per la media di questa popolazione
utilizzando un campione casuale di taglia n=81 e media campionaria X̄ = 74.6.
Allora siccome zα/2 = z0.05 = 1.645 possiamo scrivere l’intervalo di confidenza
√
√
al 90% come [X̄ − z0.05 11.37/ 81, X̄ + z0.05 11.3/ 81] = [72, 76].
Soluzione 6)
Ipotizziamo che il campione abbia distribuzione normale e stimiamo media
e varianza campionaria
X̄ = 69.2667
S 2 = 230.0667
Non conoscendo la varianza vera della popolazione dobbiamo richiamare il
X̄−µ
√ ∼ tn−1 e dunque avremo nel nostro caso √ X̄−µ
risultato per cui S/
∼ t14
n
230.07/15
scriviamo allora un intervallo di confidenza al 95% per una Student con 14 gradi
di libertá; avremo per α = 0.05
P (−tα/2,14 ≤ T ≤ tα/2,14 ) = 1 − α
⇕
X̄ − µ
P (−tα/2,14 ≤ √
≤ tα/2,14 ) = 1 − α
230.07/15
√
e dunque essendo
t0.025,14 = 2.145 avremo P (X̄ − 2.145 · 230.07/15 ≤ µ ≤
√
X̄ − 2.145 · 230.07/15) = P (60.8661 ≤ µ ≤ 77.6672) = 1 − 0.05 = 0.95
Per trovare un intervallo di confidenza sinistro, sfruttiamo sempre la distribuzione della statistica √ X̄−µ
∼ t14 : avremo per α = 0.05
230.07/15
P (T ≥ −tα,14 ) = 1 − α
⇕
X̄ − µ
P(√
≥ −tα,14 ) = 1 − α
230.07/15
e dunque essendo t0.05,14 = 1.761 avremo P (µ ≤ X̄ + tα,14
P (µ ≤ 76.1634) = 1 − 0.05 = 0.95
7
√
230.07/15) =
Soluzione 7)
Dalla teoria sappiamo che (n − 1)S 2 /σ 2 é una v.a. distribuita come una
2
χ (n−1) e questo qualunque sia n. Non é un risultato asintotico! Nel nostro caso
il campione ha taglia n=5 e dunque avremo: 4S 2 /σ 2 ∼ χ2 (4). La probabilitá
richiesta al punto a) é la seguente
P (S 2 /σ 2 ≤ 1.8) = (4S 2 /σ 2 ≤ 1.8 · 4) = P (χ2 (4) ≤ 7.2) = 0.8743
La probabilitá richiesta al punto b) é la seguente
P (0.85 ≤ S 2 /σ 2 ≤ 1.15) = (4·0.85 ≤ 4S 2 /σ 2 ≤ 1.15·4) = P (3.4 ≤ χ2 (4) ≤ 4.6) = 0.1624
Soluzione 8) da implementare al calcolatore
Soluzione 9)
Definiamo la generica v.a. di Bernulli Xi che assume valore 1 con probabilitá
p e valore 0 con probabilitá 1-p. Allora abbiamo che E(Xi ) = p e var(Xi ) =
p(1 − p),∑inoltre per la l.d.g.n. abbiamo che una buona stima di p é la v.a.
n
Zn = n1 i=1 Xi perché essa converge in probabilitá alla media della v.c. che é
appunto p.
(a) La domanda si traduce nel calcolare oppure approssimare la seguente
probabilitá P (|Z50 − p| ≤ 0.1) Poiché Z50 é una v.a. proporzionale ad una
Binomiale di parametri n=50 e p incognito, possiamo dire che E(Z50 ) = p e
var(Z50 ) = p(1−p)
e dunque possiamo maggiorare la probabilitá richiesta con la
50
disuguaglianza di Chebychev (che vale per qualunque v.a.):
P (|Z50 − p| ≤ 0.1) ≥ 1 −
p(1 − p)
50 · 0.12
(1)
Poiché p varia nell ’intervallo [0,1] si ha p(1 − p) ≤ 1/4, si ha che la varianza
piú grande, e dunque secondo membro delle disuguaglianza piú piccolo, é il caso
p=1/2. Per cui, nel caso peggiore cioé quando la varianza delle Xi é massima
cioé vale 1/4 e quindi p = 1/2, otteniamo
P (|Z50 − p| ≤ 0.1) ≥ 1 −
1/4
= 0.5
50 · 0.12
la quale non é tanto buona essendo la stima nel range di precisone richiesto solo
con una confidenza del 50%.
Un’alternativa alla soluzione percorsa é fornita dal T.C.L. che essendo (n =
50 > 30) possiamo pensare di applicare; per cui diciamo che con una buona
approssimazione Z50 ∼ N (p, p(1−p)
50 ),
da cui segue che
|Z50 − p|
0.1
0.7071
P (|Z50 −p| ≤ 0.1) = P ( √
≤√
) ∼ P (|Z| ≤ √
)
p(1 − p)/50
p(1 − p)/50
p(1 − p)
Ancora√una volta quanto piú
√ p é vicino agli estremi (0,1) tanto piú l’intervallo
[−0.7071/ p(1 − p), 0.7071/ p(1 − p)] é grande e dunque la probabilitá di una
8
normale standard di starci√dentro é grande; √
tanto piú p é vicino ad 1/2 tanto
piú l’intervallo [−0.7071/ p(1 − p), 0.7071/ p(1 − p)] é piccolo e dunque la
probabilitá di una normale di starci dentro é piccola. Il caso peggiore si ha
quando p=1/2 e dunque l’intervallo vale [−1.4142, 1.4142]. per cui la probabilitá
di una normale standard di starci dentro é F(1.4142)-F(-1.4142)= 0.8427.
Dunque nel caso peggiore (p=1/2) varianza massima della popolazione Bernulliana in esame, a paritá di precisione l’approssimazione fornita dal T.C.L. é piú
confidente di quella fornita dalla disuguaglianza di Chebychev.
(b) La richiesta equivale a trovare il minimo n (numero di lampadine da
testare) tale che la seguente disuguaglianza venga soddisfatta
P (|Zn − p| ≤ 0.1) ≥ 0.95
e dunque dalla disuguaglianza di Chebychev (1), scritta per un n qualsiasi,
dobbiamo trovare il minimo n per cui vale la seguente disuguaglianza
P (|Zn − p| ≤ 0.1) ≥ 1 −
p(1 − p)
≥ 0.95
n · 0.12
↔
n≥
p(1 − p)
0.05 · 0.12
Poich p é incognita possiamo solo dire che la richiesta di sopra é sicuramente soddisfatta quando n é maggiore del massimo che pu assumere il secondo
1
membro dunque n ≥ 4·0.05·0.1
2 = 500.
Notate che n maggiore di 500 garantisce l’accuratezza richiesta 0.1 con la
confidenza richiesta 95% per tutti i possibili valori di p anche per quello che
massimizza la varianza, cioe’ p=1/2. Comunque siccome ci aspettiamo che p
sia lontano da 1/2 , possiamo dire che n maggiore di 500 é un’approssimazione
per eccesso del numero di lampadine necessarie da testare.
Vediamo se sfruttando il T.C.L. possiamo assicurarci la stessa accuratezza,
0.1, con la stessa confidenza, 95%, con un numero diverso di lampadine....
Dall’approssimazione fornita dal T.C.L. si ha che per n ”abbastanza grande”
P (|Zn −p| ≤ 0.1) = P ( √
|Zn − p|
p(1 − p)/n
≤√
0.1
p(1 − p)/n
) ∼ P (|Z| ≤ √
0.1
p(1 − p)/n
)
Poiché per una normale standard vale P (|Z| ≤ 1.96) = 0.95, essendo z0.025 =
1.96 , dobbiamo imporre che
√
0.1
p(1 − p)/n
≥ 1.96
↔
n≥
1.962 p(1 − p)
= 385p(1 − p)
0.12
Ancora una volta per garantire la richiesta anche nel caso peggiore (p=1/2)
si ha che n ≥ 97
Osserviamo che ancora una volta il T.C.L. porge risultati migliori della disuguaglianza di Chebichev.
Soluzione 10) Testiamo l’ipotesi H0 : µ = 70 contro l’alternativa H1 : µ ̸=
70, si ottiene un p- dei dati pari a 0.0027 e dunque l’ipotesi nulla é da rifiutare
9
Soluzione 11) Testiamo l’ipotesi H0 : µ ≥ 65 contro l’alternativa H1 : µ <
6570, si ottiene un p- dei dati pari a PH0 (t11 < −3.63) = 0.004 e dunque l’ipotesi
nulla é da rifiutare
Soluzione 12)
testiamo l’ipotesi nulla H0 : µ = 32 che é appunto l’ipotesi neutra e vediamo se il campione ci fornisce un’evidenza sperimentale che la contraddice
a favore dell’alternativa H1 : µ ̸= 32. Abbiamo dunque X̄ = 30.4, σ = 4,
n = 25, anche se la popolazione non fosse gaussiana potremmo usare comunque
l’approssimazione fornita dal teorema centrale del limite e dunque usiamo z-test
X̄ − µ
√ = −2
σ/ n
⇒
| − 2| > 1.96 = z0.025
X̄−µ
√ fornisce un valore nella regione critica al livello di
e dunque la statistica σ/
n
significativitá del 5%. Il p-dei-dati vale P (|Z| ≥ −2) = 2P (Z ≥ 2) = 0.0455 che
infatti é piú piccolo di α = 0.05. Notate che se avessimo chiesto un livello α =
0.01 la regione critica sarebbe stata |Z| > 2.576 e avremmo dunque accettato
l’ipotesi. Il p-dei-dati ci dice qualcosa di piú: é piccolo e dunque é poco plausibile
che i dati siano stati estratti da una popolazione di media µ = 32.
Soluzione 13)
dobbiamo testare l’ipotesi nulla H0 : µ = 50, contro l’alternativa che H1 :
µ ̸= 50. Il campione ha numerositá n=64, dunque é abbastanza numeroso
√ 0 = X̄−50
√
per poter utilizzare l’approssimazione del T.C.L. per cui Z = X̄−µ
σ/ n
20/ 64
distribuita come una normale standard.
Valutiamo il p-dei dati nelle tre situazioni
1. (a) X̄ = 52.5 → z = 0.9922 da cui segue
pvalue = P (|Z| > |0.9922|) = 2P (Z > 0.9922) = 0.32
questo é un p piuttosto alto che ci spinge ad accettare con ogni livello di
significativitá plausibile (α = 0.1; 0.05; 0.01) l’ipotesi nulla.
2. (b) X̄ = 55 → z = 1.9843 da cui segue
pvalue = P (|Z| > |1.9843|) = 2P (Z > 1.9843) = 0.04
se il livello di significativitá é fissato ad α = 0.1 oppure α = 0.05 l’ipotesi
é rifiutata, mentre se α = 0.01 l’ipotesi nulla sarebbe da accettare. Ecco
perché il pvalue puó essere una misura piú specifica della plausibilitá dell’ipotesi
nulla piuttosto che la sola risposta accetto/rifiuto con significativitá α.
3. (c) X̄ = 57.5 → z = 2.9765 da cui segue
pvalue = P (|Z| > |2.9765|) = 2P (Z > 2.9765) = 0.003
questo é un p piccolissimo che, ad ogni livello di significativitá plausibile,
ci autorizza a rifiutare l’ipotesi nulla.
10
Soluzione 14)
dobbiamo testare l’ipotesi nulla H0 : µ = 50, contro l’alternativa che H1 :
¯ ed una numerositá n = 10; n =
µ ̸= 50. Il campione ha media campionaria 55
√ 0 = X̄−50
√ distribuita come una
60; n = 120, utilizziamo la statistica Z = X̄−µ
σ/ n
20/ n
normale standard.
Valutiamo il p-dei dati nelle tre situazioni
1. (a) n = 10 → z = 0.7906 da cui segue
pvalue = P (|Z| > |0.7906|) = 2P (Z > 0.7906) = 0.4292
questo é un p piuttosto alto che ci spinge ad accettare con ogni livello di
significativitá plausibile (α = 0.1; 0.05; 0.01) l’ipotesi nulla, sarebbe piú
giusto dire che non possiamo rifiutarla abbiamo troppi pochi dati....
2. (b) n = 60 → z = 1.9365 da cui segue
pvalue = P (|Z| > |1.9365|) = 2P (Z > 1.9365) = 0.0528
se il livello di significativitá é fissato ad α = 0.1 l’ipotesi é rifiutata, mentre se α = 0.05 oppure α = 0.01 l’ipotesi nulla sarebbe da accettare.
Ecco perché il pvalue puó essere una misura piú specifica della plausibilitá
dell’ipotesi nulla piuttosto che la sola risposta accetto/rifiuto con significativitá α. In questo caso 60 dati sono sufficienti a far dubitare fortemente
dell’ipotesi nulla....
3. (c) n = 120 → z = 2.7386 da cui segue
pvalue = P (|Z| > |2.7386|) = 2P (Z > 2.7386) = 0.0062
questo é un p piccolissimo che, ad ogni livello di significativitá plausibile,
ci autorizza a rifiutare l’ipotesi nulla. Con 120 siamo molto piú confidenti
nel rifiuto dell’ipotesi nulla
Soluzione 15)
La fibbra é accetabile se µ ≥ 200. Testiamo allora l’ipotesi H0 : µ ≥ 200
contro l’alternativa H1 : µ < 200 che la fibbra non sia accetabile. Ipotizziamo
che la popolazione possa essere descritta da una normale ed essendo σ = 5
√ 0 nel nostro campione, poiché
nota, utilizziamo lo z-test. Valutiamo Z = X̄−µ
σ/ n
X̄ = 199.1125 la statistica assume valore z = −0.5020, utilizziamo il test ad
una coda (il terzo della tabella 8.1) ed otteniamo
α = 0.05 →
−0.5020 > −1.645 = −z0.05
α = 0.1 →
−0.5020 > −1.2816 = −z0.1
in entrambe i casi accettiamo dunque l’ipotesi nulla, o meglio non possiamo
rifiutarla.
11
Soluzione 18)
dobbiamo testare l’ipotesi H0 : µ = 24 contro l’alternativa che la media sia
cambiata H1 : µ ̸= 24. Il campione é abbastanza numeroso, per cui anche se non
√ 0 con n − 1 gradi
fosse normale potremmo usare la statistica di student T = X̄−µ
S/ n
√
libertá; nel nostro caso la statistica assume valore (22.5−24) 35/3.1 = −2.8626.
Essendo poi t0.025,35 = −2.0301 → | − 2.8626| > | − 2.0301| e dunque l’ipotesi
nulla viene rifiutata, per cui si puó concludere che la media non sia piú quella
del passato.
Soluzione 19)
Calcoliamo la differenza tra le pressioni sanguigne prima e dopo l’iniezione
ed otteniamo d = [6, 8, 3, −4, 6, −2, 6, −1, 7, 2]. Ipotizziamo che la differenza sia
una v.a. gaussiana ed testiamo l’ipotesi nulla H0 : µ = 0 contro l’alternativa che
H1 : µ ̸= 0. poiché X̄ = 3.1000, S = 4.2019, n = 10, otteniamo che la statistica
√ 0 , vale 2.3330 e dunque ad un livello di significativitá
di student T = X̄−µ
S/ n
α = 0.05 possiamo dire che essendo 2.333 > t0.025,9 = 2.262 rifiutiamo l’ipotesi
nulla. Oppure valutando il p-dei-dati otteniamo p = P (|T9 | ≥ 2.333) = 2P (T9 >
2.333) = 0.0445 e dunque rifiuteremmo l’ipotesi nulla ad un qualunque livello
di significativitá piú alto di 0.0445. Rifiutando l’ipotesi che la differenza sia
zero sia accetta l’alternativa (con un margine di errore anche abbastanza basso
0.0445) che la differenza di pressione sia diversa da zero.
Soluzione 20)
Sotto l’ipotesi che i dati siano distribuiti gaussianamente possiamo sfruttare
X̄−30
√
la statistica T = S/
che nel nostro campione assume valore t = −3.2504 ed
10
é distribuita come una Student con n − 1 = 9 gradi di libertá.
Per verificare quanto affermato dalla pubblicitá ad un livello di significativitá
α = 0.05, vediamo se i dati raccolti sono compatibili con l’ipotesi che l’auto
proposta sia in grado di fare almeno 30 miglia cioe’, verifichiamo H0 : µ ≥ 30
contro l’alternativa H1 : µ < 30. Il test da fare é un test di student ad una
coda, in particolare ad un livello di significativitá α = 0.05, abbiamo t0.05,9 =
1.833. Poiché −3.2504 < −t0.05,9 = −1.833 siamo costretti a rifiutare l’ipotesi
nulla, dicendo che c’é un’evidenza sperimentale che ci spinge a dire che vale
l’alternativa e dunque non vale l’ipotesi della ditta.
soluzione 21)
∑n
Indichiamo con Sn = i=1 Xi la vincita dopo n giocate, dove le Xi sono
i.i.d. ciascuna distribuita nella seguente maniera P (Xi = −1) = 37/38 e P (Xi =
35) = 1/38, per cui la sua media e la sua varianza saranno E(X) = −0.0526
e var(X) = 33.2078. Per il TCL sappiamo che la probabilitá che S√n −nE(X)
nvar(X)
appartenga ad un certo intervallo é ben approssimabile con la probabilitá che
una N (0, 1) appartenga allo steso intervallo. In questo caso l’intervallo a cui
siamo interessati é (0, +∞) e dunque avremo
• (a) P (S34 > 0) ∼ P (Z >
√34·0.0526 )
34·33.2078
12
= P (Z > 0.0532) = 0.4788
• (b) ...=0.328
• (c)...=0
soluzione22)
Un anno é costituito da 52 settiane e dunque affinché in un anno si debbano
impiegare 13 o piú batterie il numero di settimane di vita di 12 batterie deve
essere minore
∑12 di 52. Il numero di settimane di vita di 12 batterie consecutive
é S12 = i=1 Xi dove le Xi sono i.i.d. con distribuzione incognita ma di cui
conosciamo la E(Xi ) = 5 e var(Xi ) = 1.52 . Per il TCL
P (S12 < 52) = P (
52 − 12 · 5
S12 − 12 · 5
√
√
<
) ∼ P (Z < −1.5396) = 0.06
1.5 12
1.5 12
soluzione 23)
A prescindere da quale sia la distribuzione della generica v.c. Xi che descrive il tempo di vita del componente elettrico, noi conosciamo E(Xi ) = 100 e
var(Xi ) = 202 e dunque per il TCL possiamo approssimare la probabilitá che
X̄−100
√
stia in un certo intervallo con la probabilitá che una normale standard
20/ n
sia in quell’intervallo.
X̄−100
√
• (a) P (X̄ < 104) = P ( 20/
<
16
104−100
√
)
20/ 16
∼ P (Z < −19.2) = 0.788
• (b) P (98 < X̄ < 104) ∼ P (−0.4 < Z < −19.2) = 0.4436
References
[1] G. Dall’Aglio Caloclo delle probabilitá. sec Edizione Zanichelli.
[2] Ross Sheldon Probabilitá e Statistica per l’ingegneria e le Scienze APOGEO
ed.
13