(in ore) di un (modello di) lettore DVD - imati-cnr

Transcript

Esercitazione dell’ 8.05.2013
Esercizio 9.10 con aggiunta.
La durata di funzionamento (in ore) di un (modello di) lettore DVD ha funzione di
ripartizione:
F (x) =
1 − e−x/2000 x ≥ 0
0
x<0
a. Qual è la probabilità che un lettore DVD di questo modello si rompa entro le
prime 1000 ore di funzionamento?
b. Qual è la probabilità che un lettore DVD di questo modello funzioni per almeno
2000 ore?
c. Considerando un lotto di 200 lettori di DVD di questo modello, determinare il
numero medio di lettori del lotto che dureranno almeno 2000 ore.
d. Calcolare la probabilità che la quota di lettori in un lotto di 200 che funzioneranno
per almeno 2000 ore sia minore del 30%.
e. Calcolare la probabilità che un lettore di questo modello duri per almeno 2000
ore sapendo che ha già funzionato per 1000 ore.
Soluzione.
Sia X la variabile casuale “durata di funzionamento (in ore)” di un lettore DVD.
Ricordiamo che F (x) = P (X ≤ x). La distribuzione di X è detta esponenziale.
F (x) è rappresentata in Figura 1.
La derivata di F (x) è la densità esponenziale, f (x):
1 −x/2000
e
x≥0
2000
f (x) =
0
x<0
ed è rappresentata in Figura 2.
a. Per definizione, un lettore si rompe entro le prime 1000 ore se la sua durata è
minore di 1000, quindi si deve calcolare P (X ≤ 1000), che è proprio dato F :
F (1000) = 1 − e−1000/2000 = 1 − e−0.5 = 0.61
b. Analogamente,
P (X ≥ 2000) = P (X > 2000) = 1 − P (X ≤ 2000) = 1 − F (2000) = 1 − (1 − e−1 ) =
1
FHxL
1
0.8
0.6
0.4
0.2
x
2500 5000 7500 10000 12500 15000
Figura 1: Grafico della funzione di ripartizione F (x).
fHxL
0.0005
0.0004
0.0003
0.0002
0.0001
2500
5000
x
7500 10000 12500 15000
Figura 2: Grafico della funzione di densità f (x).
2
= e−1 = 0.37.
c. Considerando il lotto da 200 lettori come un campione casuale dalla distribuzione
F (quindi, le durate dei lettori sono indipendenti e tutte le durate hanno funzione di
ripartizione F ), la probabilità che un qualunque lettore del lotto duri almeno 2000
ore è 0.37, calcolata al punto b. Per ogni lettore, possiamo considerare la variabile
casuale
Yi =
1 se il lettore dura almeno 2000 ore
0 altrimenti
e, allora, le variabili Yi , i = 1, . . . , 200 formano uno schema di 200 prove ripetute di
Bernoulli con probabilità di successo 0.37. Quindi, il numero di successi (= lettori
funzionanti per almeno 2000 ore) nel campione è una variabile S200 ∼ Binomiale(200,
0.37), ed il numero medio di successi è E(S200 )=200×0.37=74.
d. La quota di lettori funzionanti per almeno 2000 ore è data da S200 /200 e quindi
dobbiamo calcolare
S200
< 30% = P (S200 < 200 × 0.30) = P (S200 < 60) =
P
200
S200 − 74
60 − 74
=P √
<√
≈ P (Z < −2.05) = 0.02
200 × 0.37 × 0.63
200 × 0.37 × 0.63
ove abbiamo usato l’approssimazione gaussiana.
e. Dobbiamo calcolare la probabilità condizionata:
P (X > 2000|X > 1000) =
P (X > 2000 ∩ X > 1000)
.
P (X > 1000)
La probabilità al denominatore è 1-P (X ≤ 1000) = 1 − 0.61 = 0.39 e discende dal
punto a. L’evento al numeratore coincide con X > 2000 (se X > 2000 allora è anche
X > 1000), e la probabilità è quella calcolata al punto b., 0.37. Quindi:
P (X > 2000|X > 1000) =
P (X > 2000 ∩ X > 1000)
0.37
=
= 0.61
P (X > 1000)
0.61
Osserviamo che P (X > 2000|X > 1000) = P (X > 1000), cioè la probabilità che
il lettore che ho comprato la settimana scorsa e che ho già usato per 1000 ore ha
probabilità di durare altre 1000 ore coincidente con la probabilità che aveva all’inizio
(quando l’ho comprato) di durare 1000 ore. Allo stesso modo, la probabilità che
3
duri per più di 3000 ore, sapendo che ha già funzionato per 1000 ore, è uguale
alla probabilità che il lettore aveva al momento dell’acquisto di durare per almeno
2000 (3000-1000) ore. Questo risultato non è casuale, non dipende dai valori scelti
(1000, 2000 o 3000), ma è un risultato generale e si chiama assenza di usura.
In appendice, fornisco la dimostrazione generale di quanto detto, per coloro che
fossero interessati. L’assenza di usura è una proprietà esclusiva della distribuzione
esponenziale.
Esercizio 10.6 con testo modificato.
Gli occupati di un dato settore economico vengono pagati con un salario mensile
lordo la cui media è 5500 euro e la cui deviazione standard è 500 euro. Si assuma la
distribuzione normale del salario mensile lordo.
a. Calcolare la probabilità che il salario di un occupato scelto a caso nel settore sia
compreso tra 5200 e 5800 euro.
b. Calcolare la probabilità che il salario mensile lordo medio di un campione casuale
di 5 addetti del settore sia compreso tra 5200 e 5800 euro.
c. Si effettui lo stesso calcolo per un campione di ampiezza n=20.
Cenni della soluzione. Sia X la variabile casuale che descrive il salario mensile lordo
di un addetto del settore. Allora assumiamo X ∼ N(5500, 5002). Per rispondere
ad a. si deve calcolare P (5200 < X < 5800). Al punto b. siamo interessati
alla variabile “media degli stipendi di 5 addetti del settore scelti a caso”, che è la
variabile X̄5 = (X1 + X2 + X3 + X4 + X5 )/5. Siccome tutte le Xi sono N(5500, 5002)
2
allora X̄5 ∼ N(5500, 500
) e si deve calcolare P (5200 < X̄5 < 5800). Al punto c. si
5
P20
1
procede analogamente al b., ma considerando X̄20 = 20
i=1 Xi che ha distribuzione
2
N(5500, 500
). Le tre probabilità valgono, rispettivamente, 0.45, 0.82 e 0.99.
20
Esercizio dal tema d’esame del 3.09.2012
Un campione casuale (X1 , . . . , Xn ) è stato estratto da una popolazione descritta dal
modello (variabile casuale) con densità di probabilità
f (x) =
θ
,
(1 + x)1+θ
4
x > 0; θ > 0.
a. Determinare la funzione di log-verosimiglianza.
b. Scrivere la formula dello stimatore di massima-verosimiglianza.
c. È stato osservato il campione di 6 dati: 2.1, 3.4, 2.0, 4.5, 1.2, 1.8. Sulla base di
questo campione, sarebbe più verosimile θ = 0.5 o θ = 1?
d. Calcolare il valore assunto dallo stimatore di massima verosimiglianza in corrispondenza al campione osservato.
Soluzione.
a.
L(θ; x1 , . . . , xn ) =
n
Y
f (xi ) =
i=1
n
Y
i=1
e, dunque, la log-verosimiglianza è
l(θ) = ln L(θ; x1 , . . . , xn ) = ln θn −
= n ln θ − (1 + θ)
n
X
i=1
n
X
i=1
θ
θn
Q
=
n
θ+1
(1 + xi )1+θ
i=1 (1 + xi )
ln(1 + xi )1+θ = n ln θ −
ln(1 + xi ) = n ln θ −
n
X
i=1
n
X
(1 + θ) ln(1 + xi ) =
i=1
ln(1 + xi ) − θ
n
X
ln(1 + xi ).
i=1
b. Cerchiamo il valore θ̂ che massimizza l(θ) cercando gli zeri della derivata di l(θ).
P
n
n − θ ni=1 ln(1 + xi )
dl(θ)
n X
= −
ln(1 + xi ) = 0 ⇔
=0⇔
dθ
θ
θ
i=1
n−θ
n
X
i=1
n
i=1 ln(1 + xi )
ln(1 + xi ) = 0 ⇔ θ̂ = Pn
Dobbiamo, infine, verificare che il valore trovato sia un punto di massimo o studiando
il segno della derivata prima (come fatto a lezione) o guardando al segno della
derivata seconda in corrispondenza a θ̂:
d2 l(θ)
n
=− 2
2
dθ
θ
che è negativa per tutti i valori di θ e dunque anche per θ̂, assicurando che si tratta
effettivamente di un massimo.
c. Dei due valori indicati, il più verosimile sarà quello con valore di log-verosimiglianza
più alto.
l(0.5) = 6 ln 0.5 − 1.5(ln2.1 + ln 3.4 + ln 2.0 + ln 4.5 + ln 1.2 + ln 1.8) = −15.01
5
l(1) = . . . = −14.47
e dunque i dati rendono più verosimile il valore θ = 1.
d. Sostituendo nell’espressione trovata al punto a., si ha θ̂ =
6
7.23
= 0.83.
Gli esercizi svolti a lezione riguardanti gli intervalli di confidenza sono stati presi,
senza modifiche, dal libro di testo: 12.7, 12.9, 12.10.
Appendice sulla distribuzione esponenziale.
Riprendendo il primo esercizio, mostriamo che la probabilità che un lettore funzioni
per almeno H ore, sapendo che ha già funzionato per T ore, con H > T , è uguale alla
probabilità che un lettore funzioni per almeno H − T ore (nel punto e. dell’esercizio
avevamo H=2000 e T =1000). Ricordiamo che X descrive la durata in ore di un
lettore e che F indica la sua funzione di ripartizione.
P (X > H|X > T ) =
=
P (X > H ∩ X > T )
= (se X > H allora X > T perchè H > T ) =
P (X > T )
P (X > H)
1 − P (X ≤ H)
1 − F (H)
1 − (1 − e−H/2000 )
e−H/2000
=
=
=
=
=
P (X > T )
1 − P (X ≤ T )
1 − F (T )
1 − (1 − e−T /2000 )
e−T /2000
= e−H/2000+T /2000 = e−(H−T )/2000 = 1 − (1 − e−(H−T )/2000 ) = 1 − F (H − T ) =
= 1 − P (X ≤ H − T ) = P (X > H − T ).
6

(in ore) di un (modello di) lettore DVD - imati-cnr

Transcript

Documenti analoghi

1 PREVISIONI E PREVISIONI SUBORDINATE (1) Si lancino due

VII Foglio di Esercizi (distribuzioni uniforme, gaussiana ed

3 - UniFI

Esame 2012-06-06 (soluzioni)

testi - Disfida matematica

Calcolo Combinatorio e Probabilit`a

Indipendenza Indipendenza probabilistica o stocastica A

testo

PS 25.11.08f3

1 RACCOLTA DI ESERCIZI SUL TEOREMA DI BAYES DA

Allenamento di matematica Combinatoria e probabilit`a