Esercizi risolti di probabilità e statistica

Transcript

Esercizi risolti di probabilità e statistica
I seguenti quesiti ed il relativo svolgimento sono coperti dal diritto d’autore, pertanto essi non possono essere sfruttati a fini
commerciali o di pubblicazione editoriale senza autorizzazione esplicita e scritta dell’autore. Ogni abuso sarà perseguito a
termini di legge dal titolare del diritto.
Esercizi 4
(1) In uno spazio campionario Ω, un evento A ha probabilità p(A) = 1/2 ed un secondo
evento B ha probabilità p(B) = 2/3. Cosa si può affermare a proposito di A ∩ B?
(2) È dato su uno spazio campionario Ω = {a, b, c, d, e} dotato della funzione di probabilità
seguente:
p(00 a00 ) = 1/3,
p(00 b00 ) = 1/9,
p(00 c00 ) = 1/9,
p(00 d00 ) = 1/9,
p(00 e00 ) = 1/3,
una variabile aleatoria X i cui valori sono
X(00 a00 ) = 1,
X(00 b00 ) = 3,
X(00 c00 ) = 5,
X(00 d00 ) = 7,
X(00 e00 ) = 9.
Calcolare la media e la varianza di X.
(3) Sullo spazio campionario Ω = [1, 2] è assegnata la funzione di densità di probabilità:
f (x) = 2(x − 1).
Calcolare la media e la varianza di questa distribuzione.
(4) Sullo spazio campionario Ω = [−2, 2] è assegnata la seguente funzione di densità di
probabilità:


(x + 2)/2 x ∈ [−2, −1]
f (x) = 1/2
x ∈ [−1, 1]


(2 − x)/2 x ∈ [1, 2].
Calcolare la media e la varianza di questa densità.
(5) Un esperimento ha prodotto le seguenti misure di una data grandezza:
1.2,
1.3,
1.5,
0.6,
1.0 .
Calcolare la media e la varianza di questi dati.
(6) Due dadi a sei facce, numerate da 1 a 6 e non truccati sono lanciati contemporaneamente.
Sia X la variabile aleatoria il cui valore è la somma dei valori usciti ad ogni lancio.
Calcolare media e varianza di X.
(7) Per quali valori del parametro reale α, la funzione
f (x) = (α + 1)xα + (2α + 1)x2α
può essere considerata come una densità di probabilità sullo spazio campionario continuo
Ω = [1, 2]?
(8) I valori di una variabile aleatoria X sono distribuiti come una binomiale di parametri
N = 4 e p = 1/3. Calcolare la media e la varianza di X, di X + 2 e di X 2 .
(9) Su un spazio campionario Ω sono date due variabili aleatorie X, Y , le cui probabilità
congiunte sono date dalla seguente tabella:
1
X\Y
1
2
3
2
4
6
8
1/12 1/12 1/24 1/4
1/4 1/12
0
1/12
1/12
0
1/24
0
Calcolare M [X], M [Y ] e Cov[X, Y ]. X ed Y sono indipendenti? Sono incorrelate?
(10) Su un spazio campionario Ω sono date due variabili aleatorie X, Y le cui probabilità
congiunte sono date dalla seguente tabella:
X\Y
2
3
4
3
5
7
9
1/12 1/12 1/24 1/24
1/6 1/6 1/12 1/12
1/12 1/12 1/24 1/24
Calcolare M [X], M [Y ] e Cov[X, Y ]. X ed Y sono incorrelate? Sono indipendenti?
(11) Si consideri il seguente gioco al casinò. Il gioco è giocato da un solo giocatore contro
il banco, tenuto dal croupier. Il giocatore lancia una coppia di dadi e vince 2 Euro se
la somma dei valori usciti sui due dadi è 7, in ogni altro caso perde 1 Euro. Dopo aver
giocato 100 partite, qual è la probabilità che il giocatore abbia guadagnato almeno 1
Euro? Quale quella di aver perso almeno 40 Euro?
(12) Come nell’esercizio precedente, ma questa volta la somma vinta per ogni uscita del
numero 7 è pari a 5 Euro, mentre in caso di perdita si perde sempre 1 Euro. Dopo le
solite 100 partite, qual è la probabilità che il giocatore abbia guadagnato almeno 1 Euro?
Quale quella di aver perso almeno 40 Euro?
(13) Una coppia di dadi è stata truccata in modo che al lancio di ogni dado la faccia 1
compaia con probabilità 1/3, mentre le altre facce restano tra loro equiprobabili. Qual
è la probabilità che lanciando la coppia di dadi la somma dei numeri sulle facce sia 7?
(14) Un’azienda produttrice di lampadine sostiene che ogni lampadina prodotta ha probabilità
p = 1/1000 di essere messa in vendita nonostante sia guasta. Tale azienda riesce ad
aggiudicarsi un appalto per la fornitura di lampade ad un ospedale che ne acquista
un primo lotto di 10000. Qual è la probabilità che in questo lotto vi siano più di 15
lampadine guaste?
(15) Nell’esercizio precedentemente discusso, si supponga di testare ogni lampadina acquistata e di averne trovate almeno 20 guaste: che conclusioni possiamo trarre riguardo
la dichiarazione del produttore di lampadine? E se le lampadine trovate guaste fossero
state almeno 40?
(16) Un test medico per la ricerca di un dato enzima si sa essere affidabile al 99%, ovvero
esso produce una segnalazione errata con probabilità 1/100. Qual è la probabilità che
impiegando questo test su 1000 campioni esso dia luogo a più di 7 segnalazioni errate?
(17) In una certa classe d’età, la probabilità di essere malati di ipertensione è 0.10. Il test A
risulta positivo nel 99% dei casi in una persona malata e il 5% dei casi in una sana.
a) Qual è la probabilità di una corretta diagnosi con il test A?
b) Qual è la probabilità che una persona sia malata, nonostante il test sia risultato
negativo?
(18) Per quali valori del parametro α la funzione α sin x − sin(2x) è una densità di probabilità
sullo spazio Ω = [0, π/2]?
(19) Un’azienda produce sistemi di controllo che ritiene particolarmente affidabili in quanto
afferma che detti A e B gli eventi seguenti:
2
A = “lo strumento segnala che il componente in esame è difettoso”
B = “il componente in esame è difettoso”
allora p(A|B) = 95% e p(Ac |B c ) = 95%. In una partita di componenti molto numerosa
è noto che p(B) = 5%. Calcolare la probabilità che posto che lo strumento segnali un
difetto, il componente in esame lo sia veramente.
(20) Una dattilografa ha circa il 20% di probabilità di commettere un errore in una pagina.
Qual è la probabilità che in un libro di 400 pagine ci siano al massimo 70 pagine con
qualche errore?
(21) Due dadi piramidali con 4 sole facce numerate da 1 a 4 vengono lanciati. Sia X la
variabile aleatoria che fornisce il risultato del primo dado e sia Y quella che fornisce il
risultato del secondo dado. Siano poi U e V due nuove variabili aleatorie, definite da:
V = |X − Y |.
U = min(X, Y ),
Calcolare la probabilità congiunta di U e V e stabilire se si tratta di variabili aleatorie
incorrelate.
(22) Un agricoltore ha stimato che il 20% della semente di melone che ha prodotto non
germoglierà. Egli vende questa semente in scatole contenenti 50 semi ciascuna. Calcolare
la probabilità che una data scatola contenga più di un seme sterile.
(23) Si fanno vari lanci con una moneta equilibrata, e ci si ferma alla prima uscita del lato “Testa”. (quindi possibili risultati degli esperimenti sono i seguenti: CCCT , CT ,
CCCCCCCT e cosı̀ via). Calcolare la probabilità di ottenere “Testa” esattamente al
quarto lancio.
(24) Un’urna contiene 4 palle bianche e 2 nere. Si estraggono due palle dall’urna senza
reimmissione (cioè la prima palla estratta non viene rimessa nell’urna). Calcolare la
probabilità che entrambe le palle estratte siano bianche.
(25) Sia X una variabile aleatoria che assume i valori −1, 0, 1 con uguale probabilità. Trovare la distribuzione congiunta di X ed X 2 e la probabilità condizionata di X sotto la
condizione X 2 = 1.
(26) Una prima urna contiene 3 palle rosse e 1 bianca. Una seconda urna ne contiene invece 3
bianche ed 1 rossa. Si estraggono una palla dalla prima urna ed una palla dalla seconda.
Calcolare la probabilità che le palle estratte abbiano diverso colore.
(27) Siano A e B due eventi indipendenti e si supponga che p(A) = 0.5 e p(A ∩ B) = 0.2.
Calcolare p(B).
(28) Siano A e B due eventi indipendenti tali che p(A) = p(B|A) = 0.5. Calcolare p(A ∪ B).
(29) Studi epidemiologici mostrano che il 10% delle persone ha la bronchite cronica, che il
65% delle persone con la bronchite fuma, mentre il 35% delle persone senza bronchite
fuma. Determinare la percentuale dei fumatori con bronchite rispetto a tutti i fumatori.
(30) Si lanciano due dadi a quattro facce (due tetraedri) numerate da 1 a 4. Sia X la variabile
aleatoria che fornisce il più piccolo dei numeri usciti e sia invece Y la variabile aleatoria
che ne dà il più grande. Trovare la distribuzione congiunta di X ed Y e la distribuzione
di Y condizionata da X = 3.
(31) X è una variabile aleatoria la cui distribuzione è binomiale con parametri (ignoti) N e
p. Si sa però che M [X] = 5 e che Var X = 4. Determinare N ed p.
3
(32) X è una variabile aleatoria la cui distribuzione è di Poisson con parametro (ignoto) λ.
Si sa però che p(X = 0) = p(X = 1). Determinare λ. Calcolare poi M [X] e Var[X].
(33) Da un’urna contenente tre palle numerate da 1 a 3 ne vengono estratte due senza reimmissione (cioè la prima estratta non viene rimessa nell’urna). Sia X il numero della
prima palla estratta ed Y il più grande dei due estratti. Determinare la distribuzione
congiunta di X e Y e trovare p(X = 1|Y = 3).
(34) Sono dati due eventi A e B per i quali sono noti i seguenti fatti:
p(A|B) = 1/3,
p(B c ) = 6/7,
p(A ∪ B) = 1/2.
Gli eventi A e B sono indipendenti?
(35) Una casa da gioco ha deciso di introdurre un nuovo gioco d’azzardo. Consiste nel lancio
di un dato a forma ottagonale, nel quale le facce 1, 2, 3, 4 sono tra loro equiprobabili,
cosı̀ come pure sono tra loro equiprobabili le facce 5, 6, 7, 8, tuttavia, le due piramidi
contrapposte che costituiscono il dado sono realizzate in materiali diversi, cosı̀ che di fatto
la faccia 1 ha una probabilità tripla rispetto a quella della faccia 5. Il gioco consiste in
questo: il giocatore lancia una sola volta il dado e se esce 1, 2, 3 o 5 allora egli paga al
banco 10 Euro, mentre se esce 4, 6, 7 o 8 egli vince X Euro. Determinare il valore di X
in modo che il gioco sia equo (il che significa che il guadagno medio del banco è pari a
0).
(36) Il malfunzionamento di una lavatrice porta all’allagamento del locale che la ospita. Vi
sono solo due possibili cause del suo malfunzionamento: la presenza di una cricca nel
suo oblò e l’intasamento del suo filtro. La prima causa ha probabilità 0.2. Inoltre, è noto
che nel primo caso la probabilità di un allagamento è 0.9, mentre nel secondo è pari a
0.3. Supponiamo che una volta messa in funzione la lavatrice effettivamente si assista
(ahinoi!) all’allagamento del locale. Qual è la probabilità che esso sia dovuto alla cattiva
pulizia del filtro?
(37) Determinare per quale valore del parametro reale c la funzione
( √
x ∈ [0, 1/2)
c x
√
f (x) =
c 1 − x x ∈ [1/2, 1]
fornisce una densità di probabilità su [0, 1]. Per tale valore di c si calcolino poi media e
varianza dello spazio campionario.
(38) Su un spazio campionario Ω sono date due variabili aleatorie X, Y le cui probabilità
congiunte sono date dalla seguente tabella:
X\Y
-1
2
-2
0
2
1/8 1/8 1/8
1/8 3/8 1/8
Calcolare M [X], M [Y ], M [2X −3Y ], Cov[X, Y ] e Var[X +Y ]. X ed Y sono indipendenti?
(39) Il mal funzionamento dell’apparato W ha tre sole possibili cause, dette “causa A”, “causa
B” e “causa C”. Il costruttore di W dichiara che se la causa A si realizza, essa produce
il guasto di W nel 10% dei casi, se a realizzarsi è la causa B essa produce il guasto di W
nel 40% dei casi e, da ultimo, che se a realizzarsi è la causa C essa determina il guasto
di W nel 60% dei casi.
4
Gianni acquista l’apparato W e lo installa in un ambiente in cui probabilità che l’evento
“causa A” si verifichi è 50% mentre la probabilità che a verificarsi sia l’evento “causa B”
è 40%. Calcolare anzitutto la probabilità che si verifichi l’evento “causa C”.
A seguito di un mal funzionamento di W, Gianni decide di consultare il call-center
messo a disposizione dei suoi clienti dal costruttore di W. Il tecnico del call-center non ha
accesso a W e decide di guidare Gianni nel tentativo di risolvere il mal funzionamento.
Le cause A,B,C hanno però rimedi distinti e quindi per non perdere tempo conviene
partire dalla causa più probabile: qual è?
(40) La probabilità di trovare una perla in un’ostrica non coltivata è pari a circa 0.001. Quante
ostriche si dovranno pescare per poter disporre, con probabilità maggiore od uguale a
0.3, di almeno 10 perle?
(41) Guardavo il Tg2 del 10 ottobre e mi sono soffermato su un servizio. L’argomento è lo
“stalking” (perseguitare, seguire, fare la posta). La voce di una giornalista in sottofondo
diceva che un italiano su cinque (20%) ha subito molestie; su 100 omicidi volontari, dieci
(10%) sono stati preceduti da un fenomeno di stalking. Qual è secondo voi il rischio di
essere uccisi da uno stalker? Per rispondere è utile tenere presente che Il tasso di omicidi
in Italia è di uno ogni 100 mila persone nel 2006 (fonte: Rapporto del Viminale sulla
criminalità).
(42) Determinare per quali valori della costante reale c la funzione f (x) = 3cx + 3c2 x2 è una
densità sullo spazio campionario Ω = [0, 1]. Si calcoli poi media µ e varianza σ 2 per
ciascuna di esse.
(43) Determinare per quali valori della costante reale c la funzione f (x) = c2 x − 23 cx2 sia
una densità sullo spazio campionario Ω = [0, 1]. Si calcoli poi media µ e varianza σ 2 per
ciascuna della densità trovate.
(44) Un pediatra sa che la presenza di macchie rosse sulla pelle di un bambino può essere
sintomo di una infezione da varicella, di una infezione da morbillo oppure avere una
origine non meglio precisata. Sulla base della sua esperienza egli stima: p(morbillo) = 0.5
e p(varicella) = 0.3; egli inoltre sa che l’infezione da morbillo provoca la comparsa delle
macchie nel 30% dei casi che l’infezione da varicella provoca la comparsa delle macchie
nel 60% dei casi e infine che le macchie possono comparire anche nel 20% dei bimbi sani.
In presenza di un paziente che presenta il sintomo ‘macchie rosse’, qual è la causa più
probabile?
(45) Il moto di un grave in caduta libera da un’altezza x0 con velocità iniziale nulla e trascurando le forze di resistenza è regolato dalla legge x(t) = x0 − g2 t2 , dove g è l’accelerazione
di gravità. Un esperimento consiste nel lanciare da un pallone aerostatico un grave nelle
condizioni precedenti, e nel registrare la posizione ad intervalli di tempo prefissati. Cosı̀
facendo si sono ottenuti i dati seguenti:
t in secondi | 0
1 2 3 4
x in metri | 102 97 83 58 24
Usando il metodo dei minimi quadrati determinare una stima per le costanti x0 e g.
Attenzione! la legge che lega x al tempo non è lineare, tuttavia lo è quella che lega x a t2 . È
dunque a queste variabili che deve essere applicato il metodo dei minimi quadrati.
(46) La quantità Z di zinco deposta al catodo di un bagno elettrochimico dipende linearmente
dalla quantità di carica q che vi fluisce. Si ha cioè che Z = z0 + m · q dove z0 rappresenta
la quantità di zinco già presente al catodo al momento dell’accensione del bagno ed m
rappresenta una costante di proporzionalità. Durante un bagno chimico sono fatte le
5
seguenti misure:
q in Coulomb |
2
3
7
9
12
15
Z in grammi | 20.2 28.1 64.2 78.2 108.2 129.5
Usando il metodo dei minimi quadrati determinare una stima per le costanti m ed z0 .
(47) A seguito del procedere di una reazione chimica la concentrazione C della sostanza ℵ
decade secondo la legge C = C0 e−bt dove C0 misura la concentrazione al tempo t = 0 e b è
un parametro di reazione costante nel tempo. La legge che lega C (variabile dipendente)
al tempo t (variabile indipendente) non è lineare, tuttavia da essa segue che
log C = log C0 − b · t
per cui se si assumono come nuove variabili il tempo t (variabile indipendente) e log C
(variabile dipendente) la legge appare della forma lineare: log C = q + m · t (dove
l’ordinata all’origine q di fatto coincide con log C0 e il coefficiente angolare coincide con
−b). Un esperimento fornisce i seguenti dati:
t in secondi |
1
2
3
4
5
C
| 0.135355 0.018315 0.002478 0.000123 0.000016
Usando il metodo dei minimi quadrati determinare una stima per le costanti C0 e b.
Suggerimento: per ogni valor di C calcolare log C ed interpolare linearmente log C e t.
(48) Presso un certo pronto soccorso di XXX il numero di casi di tetano diagnosticati ogni
mese è distribuito come una poissoniana con λ = 4.5.
(a) Qual è la probabilità che in un certo mese venga diagnosticato un (sott. inteso
unico) caso di tetano?
(b) Qual è la probabilità che in un certo mese vengano diagnosticato più di tre casi di
tetano?
(49) In un periodo di 120 anni ci sono stati nel mondo 87 terremoti di alta intensità.
a) Calcolare il numero medio di terremoti di alta intensità in un anno.
b) Calcolare la probabilità che il numero di terremoti in un anno selezionato a caso sia
esattamente 2.
c) Quale sarà il numero di anni su 120 in cui si sono verificati 2 terremoti?
(50) La tabella riassume il gruppo sanguigno e il fattore Rh di un campione di 100 persone.
0 A B AB
Rh+ 38 25 11 6
Rh- 7 6 4
3
a) Scegliendo a caso una persona, determinare la probabilità che:
1. il suo gruppo sanguigno non sia 0
2. abbia il gruppo AB o il fattore Rh+
3. abbia il fattore Rh- sapendo che ha gruppo A
b) Scegliendo a caso tre persone, determinare la probabilità che abbiano il gruppo B.
(51) Su 150 analisi effettuate in un laboratorio, sono state riscontrate le seguenti frequenze
dei vari gruppi sanguigni.
Gruppo Fr. assolute
0
78
A
48
B
15
AB
9
a) Calcolare le corrispondenti frequenze percentuali.
b) Calcolare la probabilità che scelti due individui a caso essi abbiano lo stesso gruppo
sanguigno.
6
c) Come è noto le trasfusioni di sangue sono possibili: dal gruppo 0 a tutti i gruppi;
dal gruppo A ai gruppi A, AB; dal gruppo B ai gruppi B, AB; dal gruppo AB al
gruppo AB. Calcolare la probabilità che un individuo scelto a caso possa donare il
proprio sangue a un secondo individuo scelto a caso.
(52) Consideriamo tre urne, la prima contiene 2 palline bianche e 3 nere, la seconda contiene
4 palline bianche e una nera, la terza contiene 3 palline bianche e 4 nere.
a) Si sceglie a caso un’urna e si estrarre una pallina bianca. qual è la probabilità che
questa provenga dalla prima urna?
b) Si ripongono tutte le palline in un’unica urna e se ne estraggono 5 senza reimmissione. Calcola la probabilità che 3 siano bianche e due nere.
(53) In una vasta regione pianeggiante sono distribuite 40000 querce. per studiare il territorio
la regione è suddivisa in 10000 zone. sapendo che la distribuzione di piante su un
territorio può essere studiata utilizzando la distribuzione di poisson:
a) qual è la probabilità di trovare esattamente 2 querce in una zona scelta a caso?
b) Qual è la probabilità di trovarne meno di quattro?
(54) Il Ministero della salute riferisce che la probabilità di avere l’HIV nella popolazione a
rischio è del 16%. Un test di screening con sensibilità pari al 90% ha fornito 6570 esiti
negativi in un campione di 9000 soggetti.
a) Calcolare il valore predittivo del test.
b) Calcolare la specificità del test.
c) Quanti falsi negativi mi aspetto nel campione in esame?
7
Soluzioni
(1) L’intersezione A ∩ B non può essere l’insieme vuoto. Infatti, se gli eventi A e B non si
intersecassero, succederebbe che
p(A ∪ B) = p(A) + p(B) − p(A ∩ B) = p(A) + p(B) − p(∅) = 1/2 + 2/3 − 0 = 7/6
cosa che però è assurda, visto che la probabilità di ogni evento deve essere sempre un
numero tra 0 e 1.
(2) Per ottenere il valore di M [X] basta tener presente la definizione di media di X:
X
M [X] =
X(α)p(00 α00 ),
α∈Ω
e quindi nel caso in esame si ha
M [X] = 1p(00 a00 ) + 3p(00 b00 ) + 5p(00 c00 ) + 7p(00 d00 ) + 9p(00 e00 )
= 1 · 1/3 + 3 · 1/9 + 5 · 1/9 + 7 · 1/9 + 9 · 1/3 = 45/9 = 5.
Analogamente otteniamo
M [X 2 ] = 12 p(00 a00 ) + 32 p(00 b00 ) + 52 p(00 c00 ) + 72 p(00 d00 ) + 92 p(00 e00 )
= 12 · 1/3 + 32 · 1/9 + 52 · 1/9 + 72 · 1/9 + 92 · 1/3 = 329/9.
Dalla formula Var[X] = M [X 2 ] − (M [X])2 otteniamo
Var[X] = M [X 2 ] − (M [X])2 = 329/9 − 52 = 104/9.
(3) Ricordo che quando lo spazio Ω è continuo, la media e varianza della distribuzione di
probabilità sono definite tramite integrali:
Z +∞
Z +∞
2
(x − µ)2 f (x)dx.
xf (x)dx, varianza = σ =
media = µ =
−∞
−∞
In questo caso Ω = [1, 2] e questa situazione rientra in quella ricordata qui sopra, pur di
pensare alla densità di probabilità come ad una funzione che vale 0 fuori dell’intervallo
[1, 2]. Dunque è:
Z +∞
Z 2
Z 2
µ=
xf (x)dx =
x2(x − 1)dx =
(2x2 − 2x)dx
=
−∞
2 3
(3x
1
1
2
− x )1 = ( 23 23 − 22 ) − ( 23 13 − 12 ) = 35 .
2
Per calcolare la varianza, possiamo usare la formula σ 2 = Var[X] = M [X 2 ] − (M [X])2 =
M [X 2 ] − µ2 , dove X è la variabile aleatoria che sul punto x assume il valore x. Tuttavia,
anche per variare un po’ le cose, questa volta calcoliamo σ 2 direttamente dalla sua
definizione:
Z +∞
Z 2
Z 2
2
2
5 2
25
σ =
(x − µ) f (x)dx =
(x − 3 ) 2(x − 1)dx = 2
(x2 − 10
3 x + 9 )(x − 1)dx
−∞
Z 2
=2
1
(x3 −
1
= 2( 41 24 −
13 2
3 x
13 3
9 2
+
+
55
9 x
55 2
18 2
−
−
1
25
9 )dx
25
9 2)
= 2( 14 x4 −
− 2( 41 −
13
9
8
+
13 3
9 x
55
18
−
+
55 2
18 x
25
9 )
=
−
1
18 .
25 2
9 x) 1
(4) Procedo come nell’esercizio precedente:
Z
Z −1
Z +∞
x(x + 2)/2 dx +
xf (x)dx =
µ=
=
Z
2
1
Z
(x /2 + x) dx +
−2
3
x/2 dx +
−1
2
2
Z
x(2 − x)/2 dx
x · 1/2 dx +
−1
−2
−∞
Z −1
1
1
2
(x − x2 /2) dx
1
−1
1
2
= (x /6 + x2 /2)−2 + (x /4)−1 + (x2 /2 − x3 /6)1 = − 13 + 0 +
1
3
= 0.
Il fatto che il valor medio sia 0 non è casuale e poteva essere anticipato: la funzione f
è infatti una funzione pari (ovvero soddisfa l’identità f (x) = f (−x)), e la media di una
distribuzione pari è sempre uguale a 0.
Per il calcolo della varianza, abbiamo
Z 2
Z +∞
2
2
x2 f (x) dx
(x − µ) f (x)dx =
σ =
−∞
−1
Z
Z
2
−2
−1
Z
(x3 /2 + x2 )dx +
=
−2
4
2
Z
x2 (2 − x)/2dx
x 1/2dx +
x (x + 2)/2dx +
=
−2
1
2
Z
−1
1
x2 /2dx +
−1
1
2
Z
(x2 − x3 /2)dx
1
−1
1
2
= (x /8 + x /3)−2 + (x3 /6)−1 + (x3 /3 − x4 /8)1 =
3
11
24
+
1
3
+
11
24
= 54 .
(5) Sia X la variabile aleatoria il cui valore è il risultato di ogni singola misura. In mancanza
di ulteriori informazioni i valori di X sono assunti tutti equiprobabili e nel caso in esame
essi sono in tutto 5 quindi a ciascuno compete una probabilità pari a p = 1/5. La media
di X è dunque pari a:
M [X] = 1.2p(1.2) + 1.3p(1.3) + 1.5p(1.5) + 0.6p(0.6) + 1.0p(1.0)
= 1.2 ·
1
5
+ 1.3 ·
1
5
+ 1.5 ·
1
5
+ 0.6 ·
1
5
+ 1.0 ·
1
5
= 5.6 ·
1
5
= 1.12.
Per il calcolo della varianza è invece conveniente usare la formula secondo cui
Var[X] = M [X 2 ] − (M [X])2 ,
e cosı̀
M [X 2 ] = 1.22 p(1.2) + 1.32 p(1.3) + 1.52 p(1.5) + 0.62 p(0.6) + 1.02 p(1.0)
= 1.22 ·
1
5
+ 1.32 ·
1
5
+ 1.52 ·
1
5
+ 0.62 ·
1
5
+ 1.02 ·
1
5
= 6.74 ·
1
5
= 1.348.
La varianza è quindi pari a:
Var[X] = M [X 2 ] − (M [X])2 = 1.348 − (1.12)2 = 0.0936.
(6) I dadi sono dichiarati non truccati, quindi le probabilità con cui ciascuna faccia esce
al lancio di ogni dado è pari ad 1/6. I dadi lanciati sono però due e quindi dobbiamo
considerare lo spazio campionario Ω = {00 100 ,00 200 ,00 300 ,00 400 ,00 600 } × {00 100 ,00 200 ,00 300 ,00 400 ,00 600 }
corrispondente a tutte le possibili coppie di risultati corrispondenti al lancio simultaneo di
due dadi. Inoltre, dato che non si afferma nulla riguardo possibili interferenze del primo
dado sul secondo, è sicuramente lecito supporre che i due lanci siano indipendenti, e
quindi le probabilità congiunte da assegnarsi allo spazio cartesiano Ω saranno i prodotti
delle corrispondenti distribuzioni marginali: ma le probabilità di ogni faccia è 1/6, quindi
ad ogni evento dello spazio Ω compete la probabilità 1/·1/6 = 1/36. Per calcolare Media
9
e varianza di X dobbiamo quindi calcolare le seguenti somme:
M [X] =
X
X(α)p(α) =
=
(n + m)p(00 (n, m)00 )
n=1 m=1
α∈Ω
=
6 X
6
X
6
X
6
X
1
=
(n + m) 36
1
36
6 X
6
X
(n + m)
n=1 m=1
n=1 m=1
1
36 (1+1)+(1+2)+(1+3)+(1+4)
+(1+5)+(1+6)+(2+1)+(2+2)+· · ·+(6+6) = 7.
2
M [X ] =
X
6 X
6
X
2
X(α) p(α) =
n=1 m=1
α∈Ω
=
=
6
X
(n + m)2 p(00 (n, m)00 )
6
X
1
(n + m)2 36
=
1
36
6 X
6
X
(n + m)2
n=1 m=1
n=1 m=1
2
2
2
1
(1+1)
+(1+2)
+(1+3)
+(1+4)2
36
2
2
2
2
+(1+5) +(1+6) +(2+1) +(2+2) +· · ·+(6+6)2
= 329/6.
Quindi
Var[X] = M [X 2 ] − (M [X])2 = 329/6 − 72 = 35/6.
C’è anche un secondo metodo, un po’ più rapido, che consente di ottenere il medesimo
risultato. Osserviamo che dei 36 possibili eventi di Ω (le 6 · 6 possibili uscite dal lancio
contemporaneo di due dadi), X assume il valore 2 solo su 1 di essi (l’evento (00 (1, 1)00 )),
il valore 3 su 2 di essi (gli eventi (00 (1, 2)00 ) e (00 (2, 1)00 )), il valore 4 su 3 di essi (gli eventi
(00 (1, 3)00 ), (00 (2, 2)00 ) e 00 (3, 1)00 ), e cosı̀ via secondo la tabella seguente:
2 3 4 5 6 7 8 9 10 11 12
valore di X
numero di volte 1 2 3 4 5 6 5 4 3 2 1
e che quindi ai valori di X competono le seguenti probabilità:
valore di X
2
3
4
5
6
7
8
9
10
11
12
probabilità 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
e quindi
X
M [X] =
a p(a) =
a=valore di X
2
1
2 · 36
+3 · 36
+4
=
= 7.
M [X 2 ] =
=
X
12
X
a p(a)
a=2
·
3
36 +5
a2 p(a) =
·
12
X
4
36 +6
·
5
36 +7
·
6
36 +8
·
5
36 +9
·
4
36 +10
·
3
36 +11
·
2
36 +12
·
1
36
a p(a)
a=2
a=valore di X
2 1
2 2
2 3
4
5
6
5
4
3
2
1
2 · 36 +3 · 36 +4 · 36 +52 · 36
+62 · 36
+72 · 36
+82 · 36
+92 · 36
+102 · 36
+112 · 36
+122 · 36
= 329/6.
Evidentemente i valori trovati coincidono con quelli precedentemente trovati; il vantaggio
che si ha nel condurre il calcolo nel secondo modo deriva dal fatto che ora si devono
eseguire meno somme.
10
(7) Per poter essere considerata come una densità di probabilità la funzione f (x) deve essere
continua a tratti, essere a valori non negativi e il suo integrale su tutto il dominio deve
valere 1. La funzione in esame soddisfa sicuramente i primi due requisiti, quindi resta
da controllare quando (e se) è soddisfatta anche la terza ipotesi.
Z 2
2
((α + 1)xα + (2α + 1)x2α ) dx = (xα+1 + x2α+1 )1 = 2α+1 + 22α+1 − 2.
1=
1
Ovvero
2 · 22α + 2 · 2α − 3 = 0.
Per risolvere l’equazione poniamo 2α = x, cosı̀ che essa diventa
(
(
√
2x2 + 2x − 3 = 0
x = −1±2 7
=⇒
2α = x
2α = x
√
−1− 7
non è accettabile
2
√
7−1
solo 2 da cui
delle due soluzioni trovate la x =
caso soluzione), e quindi resta
√
2 = ( 7 − 1)/2
α
(poiché 2α = x non ha in quel
√
log(( 7 − 1)/2)
=⇒ α =
.
log 2
(8) Affermare che i valori di una variabile aleatoria X sono distribuiti come una binomiale
di parametri N = 4 e p = 1/3 significa affermare che X assume i valori 0, 1, 2, 3, 4, con
una probabilità che è pari a
N n
4
N −n
p(X = n) =
p (1 − p)
=
(1/3)n (2/3)4−n ,
n = 0, 1, 2, 3, 4.
n
n
Per il calcolo di M [X] e di Var[X] possiamo procedere ricordando che essi sono dati dalle
seguenti formule: (caso di distribuzione binomiale)
M [X] = N p = 4 ·
1
3
= 43 ,
Var[X] = N p(1 − p) = 4 ·
1
3
·
2
3
= 89 .
Per il calcolo di M [X + 2] possiamo usare le proprietà formali dell’operatore di media:
M [X + 2] = M [X] + M [2] = M [X] + 2 =
4
3
+2=
10
3 .
Per il calcolo della varianza di X + 2 invece non possiamo procedere in modo analogo (la
varianza di una somma non è, in generale, la somma delle varianze), tuttavia osserviamo
che le proprietà della media consentono di dimostrare le seguenti uguaglianze
Var[(X + 2)] = M [(X + 2)2 ] − (M [X + 2])2 = M [X 2 + 4X + 4] − (M [X] + 2)2
= M [X 2 ] + 4M [X] + 4 − (M [X])2 − 4M [X] − 4 = M [X 2 ] − (M [X])2
= Var[X],
quindi Var[X + 2] = Var[X] = 89 .
Per il calcolo di M [X 2 ] possiamo usare la formula:
Var[X] = M [X 2 ] − (M [X])2
=⇒
M [X 2 ] = Var[X] + (M [X])2 =
8
9
+ ( 43 )2 = 83 .
Per il calcolo della varianza di X 2 non c’è scampo e ci tocca eseguire tutte le somme;
infatti
Var[X 2 ] = M [(X 2 )2 ] − (M [X 2 ])2 = M [X 4 ] − (M [X 2 ])2
11
e quindi abbiamo bisogno di conoscere M [X 4 ]. Si ha:
4
4
X
X
4
4
4
4
M [X ] =
n p(X = n) =
n
(1/3)n (2/3)4−n
n
n=0
n=0
4
4
4
4
0
4−0
4
1
4−1
4
=0 ·
(1/3) (2/3)
+1 ·
(1/3) (2/3)
+2 ·
(1/3)2 (2/3)4−2
1
2
0
4
4
+ 34 ·
(1/3)3 (2/3)4−3 + 44 ·
(1/3)4 (2/3)4−4
4
3
= 0 · 1 · 1(2/3)4 + 1 · 4 · (1/3)(2/3)3 + 16 · 6 · (1/3)2 (2/3)2 + 81 · 4(1/3)3 (2/3)1
+ 256 · 1 · (1/3)4 1
=
4·8
81
+
16·6·4
81
+
81·4·2
81
256
81
+
=
440
27 ,
quindi
Var[X 2 ] = M [X 4 ] − (M [X 2 ])2 =
440
27
− ( 83 )2 =
248
27 .
(9) Per poter calcolare la media di X è necessario anzitutto conoscere con quale probabilità
X assuma i propri valori. Dato che si conosce la distribuzione congiunta di X ed Y , la
probabilità di X è data dalla distribuzione marginale: quindi, ad esempio,
p(X = 1) = p(X = 1, Y = 2) + p(X = 1, Y = 4) + p(X = 1, Y = 6) + p(X = 1, Y = 8)
= 1/12 + 1/12 + 1/24 + 1/4 = 11/24.
Di fatto si tratta della somma dei dati che nella tabella compaiono nella prima riga. La
probabilità di X può essere quindi rapidamente ottenuta come somma sulle righe, ed
analogamente quella di Y è ottenuta come somma sulle colonne:
X\Y
1
2
3
Marginale Y
2
4
6
8
Marginale X
1/12 1/12 1/24 1/4
11/24
1/4 1/12
0
1/12
5/12
1/12
0
1/24
0
1/8
5/12 1/6 1/12 1/3
Possiamo ora calcolare il valor medio di X:
X
M [X] =
a · p(X = a) = 1 · p(X = 1) + 2 · p(X = 2) + 3 · p(X = 3)
=
a valore di X
5
1 · 11
24 + 2 12
+3·
1
8
= 53 .
Analogamente
X
M [Y ] =
b · p(Y = b) = 2 · p(Y = 2) + 4 · p(Y = 4) + 6 · p(Y = 6) + 8 · p(Y = 8)
=
b valore di Y
5
2 · 12
+ 4 61
+6·
1
12
+8·
1
3
=
14
3 .
Possiamo ora calcolare la covarianza di X ed Y :
X
Cov[X, Y ] =
(a − M [X])(b − M [Y ]) p(X = a, Y = b)
(a,b)∈Ω
= (1 − 35 )(2 −
+ (1 −
+ (2 −
+ (2 −
+ (3 −
+ (3 −
14
5
14
3 )p(X = 1, Y = 2) + (1 − 3 )(4 − 3 )p(X = 1, Y = 4)
5
14
5
14
3 )(6 − 3 )p(X = 1, Y = 6) + (1 − 3 )(8 − 3 )p(X = 1, Y =
5
14
5
14
3 )(2 − 3 )p(X = 1, Y = 2) + (2 − 3 )(4 − 3 )p(X = 1, Y =
5
14
5
14
3 )(6 − 3 )p(X = 1, Y = 6) + (2 − 3 )(8 − 3 )p(X = 1, Y =
5
14
5
14
3 )(2 − 3 )p(X = 1, Y = 2) + (3 − 3 )(4 − 3 )p(X = 1, Y =
5
14
5
14
3 )(6 − 3 )p(X = 1, Y = 6) + (3 − 3 )(8 − 3 )p(X = 1, Y =
12
8)
4)
8)
4)
8)
Cov[X, Y ] = (1 − 35 )(2 −
14
3 )
+ (1 − 53 )(6 −
+ (2 − 35 )(2 −
+ (2 − 53 )(6 −
+ (3 − 35 )(2 −
+ (3 − 35 )(6 −
1
5
14
1
12 + (1 − 3 )(4 − 3 ) · 12
14
1
5
14
1
3 ) · 24 + (1 − 3 )(8 − 3 ) · 4
14
1
5
14
1
3 ) · 4 + (2 − 3 )(4 − 3 ) · 12
14
5
14
1
3 ) · 0 + (2 − 3 )(8 − 3 ) · 12
14
1
5
14
3 ) · 12 + (3 − 3 )(4 − 3 ) · 0
14
1
5
14
3 ) · 24 + (3 − 3 )(8 − 3 ) · 0
·
= − 79 .
Dato che Cov[X, Y ] 6= 0, X ed Y non sono incorrelate, quindi non sono neanche
indipendenti.
(10) Procediamo come nell’esercizio precedente. La probabilità di X può essere rapidamente
ottenuta come somma sulle righe, ed analogamente quella di Y è data dalla somma sulle
colonne della tabella contenente la distribuzione congiunta:
X\Y
2
3
4
Marginale Y
3
5
7
9
Marginale X
1/12 1/12 1/24 1/24
1/4
1/6 1/6 1/12 1/12
1/2
1/12 1/12 1/24 1/24
1/4
1/3 1/3 1/6 1/6
Possiamo ora calcolare il valor medio di X:
X
M [X] =
a · p(X = a) = 2 · p(X = 2) + 3 · p(X = 3) + 4 · p(X = 4)
a valore di X
1
1
4 + 32 +
=2·
4·
1
4
= 3.
Analogamente
X
M [Y ] =
b · p(Y = b) = 3 · p(Y = 3) + 5 · p(Y = 5) + 7 · p(Y = 7) + 9 · p(Y = 9)
b valore di Y
1
1
3 + 53 +
=3·
7·
1
6
+9·
1
6
=
16
3 .
Possiamo ora calcolare la covarianza di X ed Y :
X
Cov[X, Y ] =
(a − M [X])(b − M [Y ]) p(X = a, Y = b)
(a,b)∈Ω
16
16
3 )p(X = 2, Y = 3) + (2 − 3)(5 − 3 )p(X = 2, Y = 5)
16
+ (2 − 3)(7 − 16
3 )p(X = 2, Y = 7) + (2 − 3)(9 − 3 )p(X = 2, Y = 9)
16
+ (3 − 3)(3 − 16
3 )p(X = 3, Y = 3) + (3 − 3)(5 − 3 )p(X = 3, Y = 5)
16
+ (3 − 3)(7 − 16
3 )p(X = 3, Y = 7) + (3 − 3)9 − 3 )p(X = 3, Y = 9)
16
+ (4 − 3)(3 − 16
3 )p(X = 4, Y = 3) + (4 − 3)(5 − 3 )p(X = 4, Y = 5)
16
+ (4 − 3)(7 − 16
3 )p(X = 4, Y = 7) + (4 − 5)(9 − 3 )p(X = 4, Y = 9)
1
16
1
(2 − 3)(3 − 16
3 ) · 12 + (2 − 3)(5 − 3 ) · 12
1
16
1
+ (2 − 3)(7 − 16
3 ) · 24 + (2 − 3)(9 − 3 ) · 24
1
16
1
+ (3 − 3)(3 − 16
3 ) · 6 + (3 − 3)(5 − 3 ) · 6
1
16
1
+ (3 − 3)(7 − 16
3 ) · 12 + (3 − 3)(9 − 3 ) · 12
1
16
1
+ (4 − 3)(3 − 16
3 ) · 12 + (4 − 3)(5 − 3 ) · 12
1
16
1
+ (4 − 3)(7 − 16
3 ) · 24 + (4 − 3)(9 − 3 ) · 24
= (2 − 3)(3 −
=
= 0.
13
Dato che Cov[X, Y ] = 0, X ed Y sono incorrelate. In realtà, le variabili sono addirittura
indipendenti poiché è possibile verificare direttamente che la probabilità congiunta è
sempre data come prodotto delle due probabilità marginali, ovvero che
p(X = a, Y = b) = p(X = a) · p(Y = b) ∀a, b.
Ad esempio (ma la verifica va fatta per tutti i 12 casi!)
p(X = 2, Y = 3) = 1/12 = 1/4 · 1/3 = p(X = 2) · p(Y = 3).
(11) Si tratta di un problema interessante ed istruttivo. La cosa più difficile è indubbiamente
riuscire a matematizzare in modo corretto il problema. Anzitutto studiamo gli eventi.
Tutto è regolato dal lancio di due dadi a 6 facce: vi sono quindi 6 · 6 = 36 eventi possibili
corrispondenti a tutte le possibili coppie. I lanci sono tra loro indipendenti e quindi la
probabilità di ciascuna coppia è pari al prodotto delle probabilità delle singole uscite: i
dadi non sono truccati, quindi ogni faccia esce con probabilità pari a 1/6, ragion per cui
la probabilità di ogni coppia è pari a 1/6 · 1/6 = 1/36. Delle 36 coppie, solo 6 hanno
per somma il numero 7, quindi i casi favorevoli alla vincita sono in tutto 6. Gli altri
30 invece producono una perdita. Ad ogni lancio di una coppia di dadi, quindi, si ha
probabilità p = 6/36 = 1/6 di vincere e probabilità 1 − p = 30/36 = 5/6 di perdere. Sia
S la variabile aleatoria che conta il numero totale di vincite (attenzione! S dà il numero
di partite vinte, non la somma vinta) dopo aver eseguito le N = 100 partite.
Da considerazioni generali sappiamo che la variabile S è distribuita come una binomiale con parametri N = 100 e p = 1/6 (ripetizione di N volte del medesimo singolo
esperimento che ha probabilità p di riuscire. Le ripetizioni sono indipendenti ed S conta
il numero totale di successi).
La variabile aleatoria V che fornisce la somma vinta è collegata evidentemente alla
variabile S. Il legame è il seguente: ogni vittoria fa guadagnare 2 Euro, ogni perdita
fa spendere 1 Euro, inoltre, se si vincono S partite, evidentemente se ne sono perse
N − S = 100 − S, quindi
V = 2S − (N − S) = 3S − N = 3S − 100.
Ciò che il testo chiede di calcolare per primo è la probabilità che V sia maggiore o uguale
ad 1 Euro, e quindi:
p(V ≥ 1) = p(3S − 100 ≥ 1) = p(3S ≥ 101) = p(S ≥ 101/3) = p(S ≥ 33.6̄).
Dato che S ha una distribuzione di tipo binomiale con parametri N = 100 e p = 1/6,
abbiamo che
p(V ≥ 1) = p(S ≥ 33.6̄) = p(S = 34) + p(S = 35) + p(S = 36) + · · · =
100
X
p(S = n)
n=34
100 X
100
=
(1/6)n (5/6)100−n .
n
n=34
Questa formula è corretta ma purtroppo non è certo di agevole calcolo: ci sono 67
addendi, ciascuno dei quali è prodotto di un numero enorme (il binomiale) moltiplicato
per un numero molto piccolo (il prodotto delle probabilità). È quindi sicuramente una
buona idea tentare un approccio approssimato. Osserviamo che
M [S] = N p = 100 · 1/6 = 16.6̄,
Var[S] = N p(1 − p) = 100 · 1/6 · 5/6 = 13.8̄;
entrambe i parametri della distribuzione sono ben maggiori di 5, per cui possiamo sicuramente utilizzare il Teorema del Limite Centrale (ed il suo corollario) e pensare ad S come
ad una variabile distribuita come una Normale (cosa che però è falsa!): il valore ottenuto
14
sotto questa ipotesi differisce ben poco (meno di 1%) dal valore corretto. Abbiamo
S − M [S]
33.6̄ − 16.6̄
p(V ≥ 1) = p(S ≥ 33.6̄) = p( p
≥ √
)
Var[S]
13.8̄
S − M [S]
≥ 4.56) = 1 − Φ(4.56) < 1 − 0.999995 = 5 · 10−6 = 0.005%.
= p( p
Var[S]
(In questo calcolo Φ è la funzione di ripartizione di probabilità per la distribuzione
Normale Standard ed il suo valore è stato ricavato dalle note tabelle).
La seconda probabilità che si chiede di calcolare è la probabilità di perdere almeno 40
Euro, ovvero che V ≤ −40. Procedendo come prima, ed usando ancora il Teorema del
limite Centrale, abbiamo:
S − M [S]
20 − 16.6̄
p(V ≤ −40) = p(3S − 100 ≤ −40) = p(3S ≤ 60) = p(S ≤ 20) = p( p
≤ √
)
Var[S]
13.8̄
S − M [S]
≤ 0.89) = Φ(0.89) = 0.8133 ∼ 81.3%.
= p( p
Var[S]
Come si vede, le probabilità di vincere qualcosa sono estremamente basse, mentre decisamente elevata è quella di perdere una “bella cifretta”!
(12) Procedere come nell’esercizio precedente.
(13) Anzitutto occorre calcolare la probabilità con cui al lancio di un dado esce una delle
facce diverse dalla 1. Nel testo si dice che la faccia 1 ha probabilità 1/3, quindi resta una
probabilità pari a 1 − 1/3 = 2/3 da spartirsi tra le altre facce. Dato che il testo afferma
che esse sono equiprobabili, a ciascuna di esse compete un quinto della loro probabilità
totale, e quindi le facce 2, 3, 4, 5, 6 hanno tutte probabilità pari a 1/5 · 2/3 = 2/15.
L’esperimento consiste però nel lancio indipendente di due dadi: le probabilità appena
calcolate vanno quindi intese come probabilità marginali associate ad una probabilità
congiunta ancora da calcolarsi, e che rappresentiamo nella solita forma a tabella:
dado 1 \ dado 2
1
2
3
4
5
6
Marginale dado 1
1
1/3
2
2/15
3
2/15
4
2/15
5
2/15
6
2/15
Marginale dado 2 1/3 2/15 2/15 2/15 2/15 2/15
Dato che i lanci sono indipendenti, la probabilità congiunta è data dal prodotto delle
marginali, per cui la tabella si completa nel modo seguente
dado 1 \ dado 2
1
2
3
4
5
6
Marginale dado 2
1
1/9
2/45
2/45
2/45
2/45
2/45
1/3
2
2/45
4/225
4/225
4/225
4/225
4/225
2/15
3
2/45
4/225
4/225
4/225
4/225
4/225
2/15
4
2/45
4/225
4/225
4/225
4/225
4/225
2/15
5
2/45
4/225
4/225
4/225
4/225
4/225
2/15
6
Marginale dado 1
2/45
1/3
4/225
2/15
4/225
2/15
4/225
2/15
4/225
2/15
4/225
2/15
2/15
La somma dei valori della coppia vale 7 solo per le seguenti coppie:
(1, 6)
(2, 5)
(3, 4)
(4, 3)
15
(5, 2)
(6, 1)
Quindi la probabilità cercata è
p(00 a + b = 700 ) = p((1, 6)) + p((2, 5)) + p((3, 4)) + p((4, 3)) + p((5, 2)) + p((6, 1))
= 2/45 + 4/225 + 4/225 + 4/225 + 4/225 + 2/45
= 4/25.
(14) Sia N = 10000, il numero di lampadine vendute, e sia p = 1/1000 la probabilità di ogni
singola lampadina di essere guasta. Immaginiamo di fare effettivamente il controllo di
tutto il lotto di lampadine e di indicare con X1 la variabile aleatoria che assume il valore
1 se la prima lampadina è guasta, 0 se la prima lampadina è non guasta. Analogamente
con X2 indica la variabile aleatoria che assume il valore 1 se la seconda lampadina è
guasta, 0 se la seconda lampadina è non guasta, e cosı̀ via: Xn vale 1 se la lampadina
numero n è guasta, 0 altrimenti. Quindi ogni Xn assume due soli valori, 1 e 0, ed ha
probabilità pari a p di assumere il valore 1.
In questo schema, il numero totale di lampadine guaste è rappresentato dalla somma
S=
N
X
Xn .
n=1
Osserviamo che le Xn sono N variabili aleatorie identiche (stessa distribuzione di probabilità) e tra loro indipendenti (il fatto che la lampadina numero 6 sia guasta o no non ha
influenza sul fatto che lo sia o meno la lampadina numero 17). Dai principi generali sappiamo che S è una variabile aleatoria i cui valori sono distribuiti secondo una binomiale
con parametri N e p, e che quindi la probabilità che cerchiamo è
N 10000
X
X 10000
N n
N −n
p(S > 15) =
p (1 − p)
=
(1/1000)n (999/1000)10000−n .
n
n
n=16
n=16
La formula precedente, seppur corretta, è assolutamente intrattabile: contiene ben 9985
addendi,
un prodotto tra un numero molto grande (il binomiale
ciascuno dei quali è dato
10000
2000
ad esempio vale circa 10
e quindi è un intero con circa 2000 cifre in rappre500
sentazione decimale) ed uno invece molto piccolo (il prodotto della probabilità). Per
poter eseguire effettivamente il calcolo avremmo dunque bisogno di poter rappresentare
circa 10000 numeri e ciascuno con almeno 2000 cifre decimali esatte (in realtà ne servono
molte di più). Evidentemente occorre escogitare qualcosa di meglio. Osserviamo che
M [S] = N p = 10000 · 1/1000 = 10,
Var[S] = N p(1 − p) = 10000 · 1/1000 · 999/1000 = 999/100,
e che quindi entrambi questi parametri sono ben maggiori di 5. Come abbiamo osservato
precedentemente la variabile S è somma di variabili aleatorie identicamente distribuite
ed indipendenti; possiamo quindi applicare il Teorema del Limite Centrale (o meglio,
un suo corollario) che mostra che quando i parametri M [S] e Var[S] sono maggiori di
5, il calcolo può essere condotto come se S fosse distribuita come una normale: l’errore
che cosı̀ si commette (inevitabile dato che in realtà S è distribuito come una binomiale)
è sicuramente inferiore a 0.01%. Supponendo dunque S distribuito come una normale,
abbiamo
15 − 10
S − M [S]
>p
)
p(S > 15) = p( p
Var[S]
999/100
S − M [S]
= p( p
> 1.582) = 1 − Φ(1.58) = 1 − 0.943 ∼ 5.7%.
Var[S]
16
(15) Si procede come nell’esercizio precedente, solo che ora si deve calcolare p(S ≥ 20) e
p(S ≥ 40). Usando ancora il Teorema del Limite Centrale abbiamo:
S − M [S]
20 − 10
p(S ≥ 20) = p( p
≥p
)
Var[S]
999/100
S − M [S]
= p( p
≥ 3.163) = 1 − Φ(3.163) = 1 − 0.9992 ∼ 0.1%.
Var[S]
Analogamente
40 − 10
S − M [S]
≥p
)
p(S > 40) = p( p
Var[S]
999/100
S − M [S]
= p( p
≥ 9.49) = 1 − Φ(9.49) < 1 − 0.999995 ∼ 5 · 10−6 .
Var[S]
Già nel primo caso, quindi, ma a maggior ragione nel secondo, ci troviamo con un dilemma: l’evento che si è prodotto, più di 20 lampadine guaste, è estremamente improbabile,
quindi o crediamo al venditore, ma allora dobbiamo pensare di essere stati estremamente sfortunati, o non crediamo più al venditore (egli dichiara che la probabilità di essere
guasta per ogni lampadina è 1/1000, ma forse l’evento è molto più probabile...)
(16) Sia N = 1000, il numero di test eseguiti, e sia p = 1/100 la probabilità che ogni singolo
test fornisca un dato errato. Immaginiamo di fare effettivamente tutti gli N test ed
indichiamo con Xn la variabile aleatoria che assume il valore 1 se il test numero n ha
fornito il risultato scorretto, 0 se invece ha dato il risultato corretto: tutto ciò ovviamente
per n = 1, 2, 3, · · · , N .
In questo schema, il numero totale di test errati è rappresentato dalla variabile aleatoria
N
X
S=
Xn .
n=1
Osserviamo che le Xn sono N variabili aleatorie identiche (stessa distribuzione di probabilità) e tra loro indipendenti (il fatto che il test numero 6 fornisca la risposta errata non
ha influenza sul fatto che lo stesso accada o meno per il test numero 107). Dai princı̀pi
generali sappiamo che S è una variabile aleatoria i cui valori sono distribuiti secondo
una binomiale con parametri N e p e che quindi la probabilità che cerchiamo è
1000
N X 1000
X
N n
N −n
p (1 − p)
=
(1/100)n (99/100)1000−n .
p(S ≥ 8) =
n
n
n=8
n=8
La formula precedente, seppur corretta, è assolutamente ineseguibile (anche su un PC):
evidentemente occorre escogitare qualcosa di meglio. Osserviamo che
M [S] = N p = 1000 · 1/100 = 10,
Var[S] = N p(1 − p) = 1000 · 1/100 · 99/100 = 9.9,
e che quindi entrambi questi parametri sono ben maggiori di 5. Come abbiamo osservato
precedentemente la variabile S è somma di variabili aleatorie identicamente distribuite
ed indipendenti; possiamo quindi applicare il Teorema del Limite Centrale (o meglio,
un suo corollario) che mostra che quando i parametri M [S] e Var[S] sono maggiori di
5, il calcolo può essere condotto come se S fosse distribuita come una normale: l’errore
che cosı̀ si commette (inevitabile dato che in realtà S è distribuito come una binomiale)
è sicuramente inferiore a 1%. Supponendo dunque S distribuito come una normale,
abbiamo
S − M [S]
8 − 10
≥ √
p(S ≥ 8) = p( p
)
9.9
Var[S]
S − M [S]
≥ −0.63) = Φ(0.63) = 0.7357 ∼ 73.5%.
= p( p
Var[S]
17
(17) Indichiamo con + il fatto che il test abbia dato esito positivo e con − il fatto che il test
abbia dato esito negativo. Indichiamo poi con m il fatto che il paziente sia malato, e con
s il fatto che non lo sia. Lo spazio campionario da considerare è quindi bidimensionale:
Test \ Salute m s
+
Il testo fornisce quindi i seguenti dati: p(m) = 1/10 (probabilità di essere malato pari ad
1/10), p(+|m) = 99/100 (probabilità che su un paziente malato il test risulti positivo)
ed infine p(+|s) = 5/100 (probabilità che su un paziente sano il test risulti positivo).
Conoscere p(m) significa conoscere una delle probabilità marginali:
m s Marginale Test
Test \ Salute
+
Marginale Salute .1
Il fatto che le marginali siano delle particolari distribuzioni di probabilità dice subito che
p(s) = 1 − p(m) = .9. Aggiungiamo questo dato alla tabella
m s Marginale Test
Test \ Salute
+
Marginale Salute .1 .9
Ora utilizziamo le informazioni sulle probabilità condizionate: dal fatto che p(+|m) =
99/100 e dalla definizione di probabilità condizionata segue che
p((+, m)) = p(+|m) · p(m) = 99/100 · 1/10 = 99/1000.
Dal fatto che p(+|s) = 5/100 ricaviamo che
p((+, s)) = p(+|s) · p(s) = 5/100 · 0.9 = 45/1000.
Aggiungiamo anche questi dati alla tabella
Test \ Salute
m
s
Marginale Test
+
99/1000 45/1000
Marginale Salute
0.1
0.9
Guardando la tabella precedente, si vede come in ogni colonna manchi un solo dato; tuttavia i dati di ogni colonna devono fornire la probabilità marginale riportata nella riga inferiore, quindi possiamo ricavare p((−, m)) = p(m)−p((+, m)) = .1−99/1000 = 1/1000,
ed analogamente p((−, s)) = p(s) − p((+, s)).9 − 45/1000 = 855/1000. Riportiamo anche
questi dati nella tabella
Test \ Salute
m
s
Marginale Test
+
99/1000 45/1000
1/1000 855/1000
Marginale Salute
0.1
0.9
Ora possiamo anche calcolare le altre probabilità marginali, come somma sulle righe:
18
Test \ Salute
m
s
Marginale Test
+
99/1000 45/1000
144/1000
1/1000 855/1000
856/1000
Marginale Salute
0.1
0.9
Possiamo ora rispondere alle domande poste
a) Si chiede di calcolare la probabilità di una diagnosi corretta, ovvero che il test risulti
positivo su un paziente effettivamente malato oppure che il test risulti negativo su un
paziente effettivamente sano. In formule si tratta di calcolare
p((+, m)) + p((−, s)) = 99/1000 + 855/1000 = 954/1000 ∼ 95.4%.
b) Si chiede di calcolare la probabilità che, dato un test negativo, il paziente sia di
fatto malato. In formule si tratta di calcolare la probabilità condizionata p(m|−). Dalla
sua definizione segue
p(m|−) =
p((−, m))
1/1000
1
=
=
∼ .0011 = .11%.
p(−)
856/1000
856
(18) Perché la funzione possa essere pensata come densità di probabilità è necessario che
Z π/2
(α sin(x) − sin(2x)) dx = 1.
0
Calcolando l’integrale si ottiene una semplice equazione per α la cui soluzione è α = 2.
Si osservi che però l’esercizio non è finito qui: dobbiamo controllare che quando α = 2 i
valori della funzione sono non negativi per ogni x ∈ [0, π/2]. Questo è vero, ma sapreste
dimostrarlo? Come?
(19) L’esercizio chiede di calcolare p(B|A). Visti i dati forniti, è abbastanza chiaro che prima
o poi si dovrà usare la formula di Bayes. Per maggiore chiarezza conviene ricostruire la
formula man mano che si eseguono i calcoli. Osserviamo che
p(B|A) =
p(B ∩ A)
p(B ∩ A)
=
.
p(A)
p(A ∩ B) + p(A ∩ B c )
La prima di queste relazioni è la definizione di probabilità condizionata, la seconda deriva
dal fatto che B, B c è una partizione dello spazio campionario. Sempre dalla definizione
di probabilità condizionata abbiamo che
p(A ∩ B) = p(A|B)p(B),
p(A ∩ B c ) = p(A|B c )p(B c ),
quindi
p(A|B)p(B)
.
p(A|B)p(B) + p(A|B c )p(B c )
(La formula appena scritta è proprio la formula di Bayes). Per calcolare p(B c ) e p(A|B c ),
osserviamo che valgono le relazioni seguenti:
p(B|A) =
p(B) + p(B c ) = 1,
p(A|B c ) + p(Ac |B c ) = 1,
la cui validità deriva dal fatto che p(·) e p(·|B c ) sono delle probabilità sullo spazio
campionario Ω. Di conseguenza si ha:
p(B|A) =
p(A|B)p(B)
0.95 · 0.05
1
=
= .
c
c
c
p(A|B)p(B) + (1 − p(A |B ))(1 − p(B ))
0.95 · 0.05 + (1 − 0.95)(1 − 0.05)
2
Come si vede il risultato è abbastanza sbalorditivo: la probabilità che il componente sia
difettoso veramente, posto che lo strumento lo segnali come tale, è solo 50%! Significa
che lo strumento non è poi cosı̀ eccezionale come sembrava dalle alte probabilità date
nel testo per p(A|B) (probabilità che lo strumento segnali effettivamente un componente
difettoso) e per p(Ac |B c ) (probabilità che lo strumento non segnali come difettoso un
campione che non lo è).
19
(20) Si tratta di un esercizio il cui impianto logico è già stato discusso (ad esempio negli
esercizi 14 e 15). In sostanza, per ogni n = 1, 2, 3, · · · , 400 sia Xn la variabile aleatoria
il cui valore è 1 se la pagina numero n presenta qualche errore, altrimenti vale 0. I
valori di Xn sono quindi solo 1 e 0, e la probabilità p(Xn = 1) è pari a 0.2, stando
a quanto è detto nel testo. Evidentemente possiamo pensare alle variabili Xn come
a variabili indipendenti (la presenza di errori in una data pagina non influenza la
presenza di errori in una pagina diversa). Questo sarà particolarmente utile in seguito.
P400
Sia S :=
n=1 Xn . Questa variabile aleatoria conta il numero totale di pagine che
contengono qualche errore. Sotto le ipotesi precedenti sappiamo che S è distribuita
come una binomiale con parametri N = 400 e p = 0.2. Ciò che il testo chiede è il
numero p(S ≤ 70). Quindi:
70
70 70 X
X
X
N n
400
p(S ≤ 70) =
p(S = n) =
p (1 − p)N −n =
(0.2)n (0.8)400−n .
n
n
n=0
n=0
n=0
Purtroppo questa formula non è di agevole calcolo; cerchiamo quindi di calcolarne il
valore in modo approssimato. Osserviamo che
M [S] = N · p = 400 · 0.2 = 80,
Var[S] = N · p · (1 − p) = 400 · 0.2 · 0.8 = 64.
Entrambi i parametri sono evidentemente maggiori di 5. Per il Teorema del Limite
Centrale (ed il suo corollario) sappiamo che sotto queste condizioni possiamo trattare S
come se fosse distribuito come una normale (cosa che evidentemente non è visto che è
una binomiale), sapendo che cosı̀ facendo introduciamo un errore che è inferiore a 1%
nella probabilità. Grazie a questa osservazione abbiamo
S − M [S]
70 − 80
≤ √
)
p(S ≤ 70) = p( p
64
Var[S]
S − M [S]
= p( p
≤ −1.25) = 1 − Φ(1.25) = 1 − 0.8944 ∼ 10.5%.
Var[S]
(21) Dato che si lanciano in modo indipendente due dadi di 4 facce ciascuno, è sicuramente
conveniente pensare ad uno spazio campionario Ω composto dalle 4 · 4 = 16 possibili
combinazioni:
X\Y
1
2
3
4
1 2 3 4
Dato che i dadi sono assunti non truccati (altrimenti si direbbe in che cosa consiste il
trucco), le facce sono equiprobabili, quindi le marginali sono
X\Y
1
2
3
4
Marginale Y
1
2
3
4
Marginale X
1/4
1/4
1/4
1/4
1/4 1/4 1/4 1/4
e visto che i lanci sono indipendenti, le probabilità congiunte sono date dal prodotto
delle rispettive marginali, ovvero
20
X\Y
1
2
3
4
Marginale Y
1
1/16
1/16
1/16
1/16
1/4
2
1/16
1/16
1/16
1/16
1/4
3
1/16
1/16
1/16
1/16
1/4
4
Marginale X
1/16
1/4
1/16
1/4
1/16
1/4
1/16
1/4
1/4
Siamo ora in grado di individuare lo spazio campionario per la coppia di variabili U, V .
Evidentemente U assume i valori 1, 2, 3, 4, mentre V assume i valori 0, 1, 2, 3, quindi lo
spazio campionario per questa coppia è Ω0 dato dalla seguente tabella:
U \V
1
2
3
4
0 1 2 3
Per ciascuno degli eventi della coppia (X, Y ) rintracciamo il corrispondente evento (U, V ):
(X = 1, Y = 1)
=⇒ (U = 1, V = 0),
(X = 3, Y = 1)
=⇒ (U = 1, V = 2),
(X = 1, Y = 2)
=⇒ (U = 1, V = 1),
(X = 3, Y = 2)
=⇒ (U = 2, V = 1),
(X = 1, Y = 3)
=⇒ (U = 1, V = 2),
(X = 3, Y = 3)
=⇒ (U = 3, V = 0),
(X = 1, Y = 4)
=⇒ (U = 1, V = 3),
(X = 3, Y = 4)
=⇒ (U = 3, V = 1),
(X = 2, Y = 1)
=⇒ (U = 1, V = 1),
(X = 4, Y = 1)
=⇒ (U = 1, V = 3),
(X = 2, Y = 2)
=⇒ (U = 2, V = 0),
(X = 4, Y = 2)
=⇒ (U = 2, V = 2),
(X = 2, Y = 3)
=⇒ (U = 2, V = 1),
(X = 4, Y = 3)
=⇒ (U = 3, V = 1),
(X = 2, Y = 4)
=⇒ (U = 2, V = 2),
(X = 4, Y = 4)
=⇒ (U = 4, V = 0).
Per ottenere la probabilità nella tabella (U, V ) occorre quindi sommare sulle probabilità
di tutti gli eventi corrispondenti nella tabella (X, Y ). Ad esempio l’evento (U = 1, V = 2)
è prodotto sia da (X = 1, Y = 3) che da (X = 3, Y = 1), quindi
p(U = 1, V = 2) = p(X = 1, Y = 3) + p(X = 3, Y = 1) = 1/16 + 1/16 = 1/8.
Procedendo in questo modo si ottiene
U \V
1
2
3
4
0
1
2
3
1/16 1/8 1/8 1/8
1/16 1/8 1/8 0
1/16 1/8 0
0
1/16 0
0
0
Per poter stabilire se U, V sono non correlate occorre anzitutto calcolare le marginali di
U e V e poi utilizzare queste distribuzioni per ottenere M [U ] e M [V ]. Abbiamo
U \V
1
2
3
4
Marginale V
0
1/16
1/16
1/16
1/16
1/4
1
2
3 Marginale U
1/8 1/8 1/8
7/16
1/8 1/8 0
5/16
1/8 0
0
3/16
0
0
0
1/16
3/8 1/4 1/8
21
e quindi
X
M [U ] =
u · p(U = u) = 1 · 7/16 + 2 · 5/16 + 3 · 3/16 + 4 · 1/16 = 15/8,
u valore di U
M [V ] =
X
v · p(V = v) = 0 · 1/4 + 1 · 3/8 + 2 · 1/4 + 3 · 1/8 = 5/4.
v valore di V
Ora possiamo calcolare la covarianza di U e V .
X
Cov(U, V ) =
(u − M [U ])(v − M [V ]) · p(U = u, V = v) = . . . = −15/32.
u valore di U
v valore di V
Dato che Cov(U, V ) 6= 0, le variabili sono correlate.
(22) Lo schema è quello ormai ben noto (esercizi 14,15,20), ma con una piccola variazione
interessante. Sia p = 0.2 la probabilità di ogni seme di essere sterile. Sia S il numero
totale di semi sterili in un campione di N = 50 semi. Quello che si vuole calcolare è
p(S > 1). Osserviamo che S è distribuito come una binomiale con parametri N , p, e
quindi possiamo scrivere
50
50 50 X
X
X
N n
50
N −n
p(S > 1) =
p(S = n) =
p (1 − p)
=
(0.2)n (0.8)50−n .
n
n
n=2
n=2
n=2
Questa somma è troppo complessa per poter essere eseguita effettivamente. Fortunatamente però non ce ne è alcun bisogno! Infatti possiamo osservare che
p(S > 1) + p(S ≤ 1) = 1
poiché gli eventi S > 1 ed S ≤ 1 sono complementari, e quindi
p(S > 1) = 1 − p(≤ 1) = 1 − p(S = 0) − p(S = 1)
50
50
0
50−0
=1−
(0.2) (0.8)
−
(0.2)1 (0.8)50−1
0
1
= 1 − 1 · 1 · (0.8)50 − 50 · 0.2 · (0.8)49
∼ 0.9998 = 99.98%.
(23) Dire che la moneta equilibrata significa dire che Testa e Croce sono equiprobabili e che
quindi hanno entrambi probabilità 1/2. Ciò che si chiede di calcolare è la probabilità
della sequenza CCCT . Siccome i lanci sono tra loro indipendenti la probabilità congiunta
è data dal prodotto delle probabilità marginali e quindi
p(CCCT ) = p(lancio 1=C, lancio 2=C, lancio 3=C, lancio 4=T)
= p(lancio 1=C) · p(lancio 2=C) · p(lancio 3=C) · p(lancio 4=T)
= 1/2 · 1/2 · 1/2 · 1/2 = 1/16.
(24) Alla prima estrazione c’è ua probabilità pari a 4/6 di estrarre una palla bianca, ovvero p(prima = bianca) = 4/6. Posto che alla prima estrazione si sia estratta una
pallina bianca, alla seconda estrazione sono rimaste 3 palline bianche su un totale di
5, quindi p(seconda=bianca | prima = bianca) = 3/5. Ciò che si chiede di calcolare è
p(seconda=bianca , prima = bianca) che dalla definizione di probabilità condizionata
risulta essere uguale a:
p(seconda=bianca, prima=bianca) = p(seconda=bianca|prima=bianca) · p(prima=bianca)
= 3/5 · 4/6 = 2/5.
22
(25) Osserviamo che X 2 assume solo i valori 0, 1. Lo spazio campionario per la coppia X, X 2
è quindi il seguente:
X\X 2 0 1
-1
0
1
Il testo dice che i valori di X sono equiprobabili quindi a ciascuno di essi compete
probabilità 1/3, che nella tabella precedente compaiono come marginali di X:
X\X 2 0 1 Marginale X
-1
1/3
0
1/3
1
1/3
Dato che
X = −1
=⇒ X 2 = 1,
X=0
=⇒ X 2 = 0,
=⇒ X 2 = 1,
X=1
quindi nella tabella compaiono sicuramente i seguenti zeri:
X\X 2 0 1 Marginale X
-1
0
1/3
0
0
1/3
1
0
1/3
Le altre caselle rimaste incognite possono essere determinate dal fatto che le marginali
su X sono le somme sulle righe:
X\X 2 0
1 Marginale X
-1
0 1/3
1/3
0
1/3 0
1/3
1
0 1/3
1/3
Possiamo quindi calcolare le probabilità su X 2 :
X\X 2
0
1 Marginale X
-1
0 1/3
1/3
0
1/3 0
1/3
1
0 1/3
1/3
2
Marginale X 1/3 2/3
Le probabilità di X condizionate da X 2 = 1 sono quindi:
p(X = −1|X 2 = 1) = p(X = −1, X 2 = 1)/p(X 2 = 1) =
1/3
1
= ,
2/3
2
p(X = 0|X 2 = 1) = p(X = 0, X 2 = 1)/p(X 2 = 1) = 0,
p(X = 1|X 2 = 1) = p(X = 1, X 2 = 1)/p(X 2 = 1) =
23
1/3
1
= .
2/3
2
(26) Si tratta di calcolare la seguente somma:
p(prima=bianca, seconda=rossa) + p(prima=rossa, seconda=bianca).
Date che le estrazioni avvengono in due contenitori distinti, è sicuramente lecito immaginare che le estrazioni siano indipendenti e che quindi
p(prima=bianca, seconda=rossa) = p(prima=bianca) · p(seconda=rossa)
p(prima=rossa, seconda=bianca) = p(prima=rossa) · p(seconda=bianca).
Nella prima urna vi sono in tutto 4 palle, una sola delle quali è bianca, quindi
p(prima=bianca) = 1/4,
p(prima=rossa) = 3/4.
Nella seconda urna vi sono in tutto 4 palle, una sola delle quali è rossa, quindi
p(seconda=bianca) = 3/4,
p(seconda=rossa) = 1/4.
Concludendo,
p(prima=bianca, seconda=rossa)+p(prima=rossa, seconda=bianca) = 1/4·1/4+3/4·3/4 = 5/8.
(27) Per ipotesi gli eventi A e B sono indipendenti, quindi p(A ∩ B) = p(A) · p(B). Quindi
p(B) =
p(A ∩ B)
0.2
=
= 0.4.
p(A)
0.5
(28) Sappiamo che p(A ∪ B) = p(A) + p(B) − p(A ∩ B). Per ipotesi A e B sono indipendenti,
quindi p(A ∩ B) = p(A) · p(B) cosı̀ che
p(A ∪ B) = p(A) + p(B) − p(A) · p(B).
L’indipendenza di A e B implica anche che P (B|A) = p(A ∩ B)/p(A) = p(B), quindi le
ipotesi danno p(A) = p(B) = 0.5 e la formula precedente dà
p(A ∪ B) = 0.5 + 0.5 − 0.5 · 0.5 = 0.75.
(29) Si risolve con lo stesso metodo usato per l’esercizio 17.
(30) Si risolve con lo stesso metodo usato per l’esercizio 21.
(31) Sappiamo che quando i valori di X sono distribuiti come una binomiale con parametri
N e p, il valor medio di X è M [X] = N p e la sua varianza è Var[X] = N p(1 − p). Di
conseguenza
N p(1 − p)
Var[X]
4
=
= .
(1 − p) =
Np
M [X]
5
Quindi p = 1 − 4/5 = 1/5. Ora che p è noto, ricaviamo N da N = N p/p = M [X]/p =
5/(1/5) = 25.
(32) Sappiamo che quando i valori di X sono distribuiti come una distribuzione di Poisson,
allora p(X = n) = e−λ λn /n!. Di conseguenza
p(X = 0) = e−λ λ0 /0! = e−λ ,
p(X = 1) = e−λ λ1 /1! = e−λ λ,
quindi
e−λ λ
p(X = 1)
=
= 1.
−λ
p(X = 0)
e
Infine, sappiamo che per le distribuzioni di Poisson M [X] = Var[X] = λ, quindi in questo
caso entrambe valgono 1.
λ=
24
(33) Siccome non c’è reimmissione, le uniche possibili estrazioni sono le seguenti:
Prima Seconda
1
2
1
3
2
1
2
3
3
1
3
2
(mancano cioè le estrazioni (1, 1), (2, 2), (3, 3)). Questi eventi sono tra loro equiprobabili
e quindi hanno ciascuno probabilità 1/6. Per ciascuno di essi calcoliamo il valore della
corrispondente coppia (X, Y ):
(Prima = 1, seconda = 2)
=⇒
(X = 1, Y = 2),
(Prima = 1, seconda = 3)
=⇒
(X = 1, Y = 3),
(Prima = 2, seconda = 1)
=⇒
(X = 2, Y = 2),
(Prima = 2, seconda = 3)
=⇒
(X = 2, Y = 3),
(Prima = 3, seconda = 1)
=⇒
(X = 3, Y = 3),
(Prima = 3, seconda = 2)
=⇒
(X = 3, Y = 3).
Nello spazio campionario Ω per la coppia X, Y , quindi, non accadono mai gli eventi
(X = 1, Y = 1), (X = 2, Y = 1), (X = 3, Y = 1), (X = 3, Y = 2) che quindi avranno
probabilità 0. Gli altri avranno la probabilità che deriva dalla precedente tabella e
quindi:
X\Y
1
2
3
1 2
3
0 1/6 1/6
0 1/6 1/6
0 0 1/3
Che completata con le marginali diventa
X\Y
1
2
3
Marginale Y
1 2
3 Marginale X
0 1/6 1/6
1/3
0 1/6 1/6
1/3
0 0 1/3
1/3
0 1/3 2/3
Da questa tabella e dalla definizione di probabilità condizionata segue poi che
p(X = 1, Y = 3)
1/6
p(X = 1|Y = 3) =
=
= 0.25.
p(Y = 3)
2/3
(34) Si tratta di stabilire se nel caso in esame vale la relazione p(A ∩ B) = p(A)p(B). Da
p(B c ) = 6/7 ricaviamo che
p(B) = 1 − p(B c ) = 1 − 6/7 = 1/7.
Dalla definizione di probabilità condizionata secondo cui p(A|B) = p(A ∩ B)/p(B)
ricaviamo
p(A ∩ B) = p(A|B)P (B) = 1/3 · 1/7 = 1/21.
Infine, dalla relazione p(A ∪ B) = p(A) + p(B) − p(A ∩ B) otteniamo
p(A) = p(A ∪ B) − P (B) + p(A ∩ B) = 1/2 − 1/7 + 1/21 = 17/42.
Dato che
p(A ∩ B) = 1/21 6= 17/42 · 1/7 = p(A)p(B)
25
concludiamo che gli eventi A e B non sono indipendenti.
(35) Anzitutto occorre trovare le probabilità con cui le facce del dado possono apparire. Indichiamo con p la probabilità della faccia 5. Le informazioni fornite sul dado consentono
di affermare che:
p(0 10 ) = p(0 20 ) = p(0 30 ) = p(0 40 ) = 3p,
p(0 50 ) = p(0 60 ) = p(0 70 ) = p(0 80 ) = p.
Il valore di p può essere determinato osservando che per definizione di probabilità deve
essere
1 = p(0 10 ) + p(0 20 ) + p(0 30 ) + p(0 40 ) + p(0 50 ) + p(0 60 ) + p(0 70 ) + p(0 80 ) = 4 · 3p + 4p = 16p,
da cui p = 1/16, e quindi
p(0 10 ) = p(0 20 ) = p(0 30 ) = p(0 40 ) = 3/16,
p(0 50 ) = p(0 60 ) = p(0 70 ) = p(0 80 ) = 1/16.
Sia ora G la variabile aleatoria che misura la somma vinta del banco (e quindi persa
dal giocatore) ad ogni partita. Il banco vince quando esce 1, 2, 3 o 5 e quindi la sua
probabilità di vincere è
p(0 banco vince0 ) = p(0 10 ) + p(0 20 ) + p(0 30 ) + p(0 50 ) = 10/16.
e quindi
p(0 banco perde0 ) = 1 − p(0 banco vince0 ) = 6/16.
Quando vince, il banco vince 10 Euro, mentre quando perde esso perde X Euro. Di
conseguenza G è la variabile aleatoria che assume i seguenti valori:
(
10 con probabilità 10/16
G=
X con probabilità 6/16.
La vincita media (ovvero la media di G) è quindi pari a M [G] = 10 · 10/16 + X · 6/16,
ma per ipotesi la vincita media è 0, quindi
0 = M [G] = 10 · 10/16 + X · 6/16
=⇒
X = −100/6 ≈ −16.7.
Il gioco è dunque equo se il banco è disposto a pagare 16.7 Euro ad ogni vincita (del
concorrente).
(36) Per comodità è bene introdurre la seguente nomenclatura:
B = allagamento, A = oblò criccato, Ac = filtro sporco.
Si osservi che gli eventi A e Ac sono effettivamente i complementari uno dell’altro dato che
per ipotesi non vi sono altre possibili cause d’allagamento. Usando queste convenzioni i
dati del problema sono quindi:
p(A) = 0.2,
probabilità di una cricca
p(B|A) = 0.9,
c
p(B|A ) = 0.3
probabilità che una cricca provochi l’allagamento
probabilità che il filtro sporco provochi l’allagamento.
Quello che si chiede di valutare è quindi semplicemente
p(Ac |B) = probabilità che l’allagamento sia dovuto al filtro sporco.
Usando la formula di Bayes si ha:
p(B|Ac )p(Ac )
+ p(B|(Ac )c )p((Ac )c )
p(B|Ac )p(Ac )
=
p(B|Ac )p(Ac ) + p(B|A)p(A)
0.3 · (1 − 0.2)
=
0.3 · (1 − 0.2) + 0.9 · 0.2
≈ 0.57.
p(Ac |B) =
p(B|Ac )p(Ac )
26
V’è quindi un 57% di probabilità che l’allagamento sia dovuto al filtro, mentre la probabilità che esso sia dovuto all’oblò difettoso è pari al 47% circa (quindi, in caso di
allagamento, dopo aver tolto la tensione all’impianto elettrico conviene anzitutto
dare un’occhiata al filtro della lavatrice).
(37) Per essere una densità è necessario che la funzione sia continua a tratti ed a valori nonnegativi; ciò accade per ogni valore di c ≥ 0. Perché sia una densità su [0, 1] è dunque
necessario e sufficiente che l’integrale di f su [0, 1] valga 1. Quindi
Z 1
Z 1/2
Z 1
1/2
1
√
√
2
2
1=
f (x) dx =
c x dx +
c 1 − x dx = c x3/2 − c (1 − x)3/2 3
3
0
1/2
0
0
1/2
2c
2c
2c
1/2 2c
1
= x3/2 − (1 − x)3/2 = (1/2)3/2 + (1/2)3/2
3
3
3
3
0
1/2
e quindi
4c
1 = (1/2)3/2
3
√
da cui c = 3/ 2.
La media di f per tale valore di c è quindi
Z 1
Z 1/2
Z 1
√
√
3
3
µ=
xf (x) dx = √
x x dx + √
x 1 − x dx
2 0
2 1/2
0
Z 1/2
Z 1/2
1/2
√
3
3
3 2 3/2 2 5/2 1/2
3 2
=√
x3/2 dx + √
(1 − t) t dt = √ x5/2 + √
t − t
5
0
0
2 0
2 0
25
2 3
1
= .
2
Si osservi che il fatto che µ sia uguale ad 1/2 era prevedibile fin dall’inizio, dato che la
densità di probabilità è simmetrica attorno al valore 1/2.
Calcoliamo ora la varianza:
Z 1/2
Z 1
Z 1
√
3
3
2√
2
2
2
x x dx + √
x2 1 − x dx − µ2
σ =
x f (x) dx − µ = √
2 0
2 1/2
0
Z 1/2
Z 1/2
√
3
3
x5/2 dx + √
(1 − t)2 t dt − µ2
=√
2 0
2 0
1/2
3 2 7/2 1/2
3 2 3/2
2
2
= √ x |0 + √
t − 2 · t5/2 + t7/2 − µ2
5
7
0
27
2 3
2
3
2
2
3 2
= √ (1/2)7/2 + √
(1/2)3/2 − 2 · (1/2)5/2 + (1/2)7/2 − µ2
5
7
27
2 3
2
= .
35
(38) Le probabilità marginali sono:
X\Y
-1
2
-2
0
2
1/8 1/8 1/8 3/8
1/8 3/8 1/8 5/8
1/4 1/2 1/4
e quindi
3
5
7
+2· = ,
8
8
8
1
1
1
M [Y ] = −2 · + 0 · + 2 · = 0,
4
2
4
M [X] = −1 ·
M [2X − 3Y ] = 2M [X] − 3M [Y ] = 2 ·
27
7
7
−3·0= .
8
4
Per il calcolo della covarianza, usiamo la formula Cov[X, Y ] = M [XY ] − M [X]M [Y ];
quindi
M [XY ] = (−1) · (−2) ·
1
1
1
1
+ (−1) · (2) · + (2) · (−2) · + (2) · (2) · = 0
8
8
8
8
segue che Cov[X, Y ] = M [XY ] − M [X]M [Y ] = 0 − 87 · 0 = 0 e che quindi X, Y sono non
correlate. Dalla formula Var[X + Y ] = Var[X] + Var[Y ] + 2 Cov[X, Y ] si ha poi:
h
3
5 i 7 2 135
Var[X] = M [X 2 ] − (M [X])2 = 12 · + 22 ·
,
−
=
8
8
8
64
h
1
1i
Var[Y ] = M [Y 2 ] − (M [Y ])2 = (−2)2 · + 22 ·
= 2,
4
4
135
263
Var[X + Y ] = Var[X] + Var[Y ] + 2 Cov[X, Y ] =
+2=
.
64
64
Infine, dal fatto che
p(X = −1) · p(Y = −2) =
3
1
3 1
· =
6= = p(X = −1, Y = −2)
8 4
32
8
segue che X ed Y non sono indipendenti.
(39) I dati del problema possono essere riassunti nella seguente lista di informazioni:
p(W guasto |“causa A”) = 0.1,
p(W guasto |“causa B”) = 0.4,
p(W guasto |“causa C”) = 0.6,
e che
p(“causa A”) = 0.5,
p(“causa B”) = 0.4 .
Visto che le cause possibili sono solo tre, si ha
p(“causa A”) + p(“causa B”) + p(“causa C”) = 1
e quindi la probabilità dell’evento “causa C” è pari a
p(“causa C”) = 1 − 0.5 − 0.4 = 0.1 .
Per affrontare la risoluzione dal guasto conviene partire dalla causa che si rivela più
probabile una volta tenuto conto che W è guasto. Ciò significa che conviene partire
da quella causa x tra A, B, C in corrispondenza delle quali p(“causa x”|W guasto ) è
massima. Per calcolare tali probabilità usiamo la formula di Bayes, cosı̀ che
p(“causa A”|W guasto )
p(W guasto |“A”) · p(“A”)
p(W guasto |“A”) · p(“A”) + p(W guasto |“B”) · p(“B”) + p(W guasto |“C”) · p(“C”)
0.1 · 0.5
=
≈ 0.185 = 18.5%,
0.1 · 0.5 + 0.4 · 0.4 + 0.6 · 0.1
=
p(“causa B”|W guasto )
p(W guasto |“B”) · p(“B”)
p(W guasto |“A”) · p(“A”) + p(W guasto |“B”) · p(“B”) + p(W guasto |“C”) · p(“C”)
0.4 · 0.4
=
≈ 0.592 = 59.2%,
0.1 · 0.5 + 0.4 · 0.4 + 0.6 · 0.1
=
28
p(“causa C”|W guasto )
p(W guasto |“C”) · p(“C”)
p(W guasto |“A”) · p(“A”) + p(W guasto |“B”) · p(“B”) + p(W guasto |“C”) · p(“C”)
0.6 · 0.1
=
≈ 0.222 = 22.2%.
0.1 · 0.5 + 0.4 · 0.4 + 0.6 · 0.1
Dai calcoli precedenti risulta che conviene supporre che il guasto sia dovuto alla causa
B.
=
(40) Sia N il numero di perle pescate e sia p = 0.001 la probabilità che una data ostrica
contenga una perla. Sia S il numero totale di perle: S è distribuito come una binomiale
di parametri N e p. Il problema richiede di determinare N in modo che p(S ≥ 10) risulti
≥ 0.3. Approssimiamo S ad una gaussiana (lo facciamo utilizzando il teorema del limite
centrale, riservandoci di verificare a posteriori che sussistano effettivamente le condizioni
perché ciò sia corretto) e scriviamo quindi
10 − N p
10 − N p
S − M [S]
≥p
) = 1 − Φ( p
).
0.3 ≤ p(S ≥ 10) = p( p
Var[S]
N p(1 − p)
N p(1 − p)
La condizione sarà quindi soddisfatta quando il valore di N sarà tale da far sı̀ che
10 − N p
Φ( p
) ≤ 1 − 0.3 = 0.7.
N p(1 − p)
Dalle tabelle risulta che Φ(0.53) = 0.7, dalla monotonia della funzione Φ segue allora
che N deve soddisfare la richiesta
10 − N p
p
≤ Φ−1 (0.7) = 0.53;
N p(1 − p)
questa è una disequazione che va risolta in N . Osserviamo che la quantità 1 − p =
1 − 0.001 ≈ 1, possiamo quindi semplificare un poco i calcoli necessari usando nella
disuguaglianza precedente l’approssimazione (1 − p) ≈ 1, cosı̀ che essa diventa
10 − N p
10 − N p
√
≈p
≤ 0.53;
Np
N p(1 − p)
ovvero
p
p
10 − N p ≤ 0.53 N p
=⇒
N p + 0.53 N p − 10 ≥ 0 .
√
Questa può essere vista come una equazione di secondo grado in N p, cosı̀ che risolvendola si ha
√
√
p
p
−0.53 + 0.532 − 4 · 10
−0.53 − 0.532 − 4 · 10
Np ≤
≈ −3.43,
Np ≥
≈ 2.91.
2
2
Delle due soluzioni ovviamente solo la seconda è accettabile e da essa si ricava la stima
N ≥ 2.912 /p = 8468.
Infine, osserviamo che per tali valori di N si ha M [S] = N p ≥ 8468 · 0.001 ≥ 8.46 ed
Var[S] = N p(1 − p) ≥ 8468 · 0.001 · 0.999 = 8.45: l’uso del teorema del limite centrale
per l’approssimazione della binomiale appare quindi giustificato.
In conclusione, perché la probabilità di avere almeno 10 perle sia almeno 0.3 è necessario
pescare almeno 8468 ostriche.
(41) Stando a quei numeri non sorprenderebbe che qualcuno pensasse che è un rischio non
trascurabile. Del resto se la probabilità che una persona a caso in Italia possa essere
molestata è del 20% e il 10% degli assassini sono anche stalkers... In realtà la risposta è
la seguente. Schematizziamo la situazione:
Eventi:
A: essere molestati (da Stalker),
Ac : non essere molestati
B: essere uccisi,
B c : non essere uccisi
29
Dati:
p(A) = 20%
p(B) = 10−5 (Viminale)
p(A|B) = 10% (gli stalker sono responsabili del 10% degli omicidi).
Si chiede di calcolare p(B|A) = probabilità che, posto di essere molestati, si venga uccisi.
p(A ∩ B) = p(A|B)p(B) = 10−6
quindi
p(B|A) = p(B ∩ A)/p(A) = 5 · 10−6
Stando a quei dati, la probabilità di essere uccisi da uno stalker è dello 0.0005%. Avete
letto bene, 5 su un milione. Il problema dello stalking è grave e pericoloso?
R
R1
(42) La condizione 1 = Ω f (x)dx diventa 1 = 0 (3cx + 3c2 x2 )dx = 32 c + c2 la quale ha le
due soluzioni c = −2 e c = 1/2. Per c = −2 la funzione diventa f (x) = 12x2 − 6x che
però è negativa in (0, 1/2) e quindi non è una densità. Per c = 1/2 la funzione diventa
f (x) = 3x/2 + 3x2 /4 che è positiva in [0, 1] e continua (è un polinomio), quindi definisce
effettivamente una densità. Posto f (x) = 3x/2 + 3x2 /4 si ha:
Z
Z 1
Z 1
µ=
xf (x)dx =
x(3x/2 + 3x2 /4) dx =
(3x2 /2 + 3x3 /4) dx = 1/2 + 3/16 = 11/16.
Ω
0
0
Analogamente si ha
σ2 =
Z
x2 f (x)dx − µ2 =
Ω
Z
1
x2 (3x/2 + 3x2 /4) dx − µ2 = . . . = 67/1280.
0
R
(43) Come nell’esercizio di prima; la condizione 1 = Ω f (x)dx è soddisfatta solo per c = −1
e c = 2. Entrambi i valori producono una densità.
(44) Per brevità indichiamo S il sintomo “avere macchie rosse” e con con A (morbillo), B
(varicella) e C (causa non precisata) le tre possibili cause del sintomo. I dati contenuti
nel testo possono essere schematizzati dicendo che:
p(A) = 0.5, p(B) = 0.3, p(S|A) = 0.3, p(S|B) = 0.6 e che p(S|C) = 0.2.
In presenza di un paziente con il sintomo S il medico deve valutare quale causa più
probabile quella, delle tre possibili A, B o C, che corrisponde al massimo di p(A|S),
p(B|S) e p(C|S). Per calcolarle anzitutto osserviamo che p(C) = 1 − p(A) − p(B) = 0.2,
e che, per la relazione di Bayes, deve essere:
p(S|A) · p(A)
0.5 · 0.3
15
=
=
p(S|A) · p(A) + p(S|B) · p(B) + p(S|C) · p(C)
0.5 · 0.3 + 0.3 · 0.6 + 0.2 · 0.2
37
p(S|B) · p(B)
0.3 · 0.6
18
p(B|S) =
=
=
p(S|A) · p(A) + p(S|B) · p(B) + p(S|C) · p(C)
0.5 · 0.3 + 0.3 · 0.6 + 0.2 · 0.2
37
p(S|C) · p(C)
0.2 · 0.2
4
=
= .
p(C|S) =
p(S|A) · p(A) + p(S|B) · p(B) + p(S|C) · p(C)
0.5 · 0.3 + 0.3 · 0.6 + 0.2 · 0.2
37
p(A|S) =
In presenza del sintomo, quindi, la causa più probabile è la B, nonostante in mancanza
di informazioni sulla presenza o meno del sintomo la malattia più probabile sia A (poiché
p(A) > p(B)).
(45) Il testo ricorda che la legge che lega lo spostamento x (variabile dipendente) al tempo
t (variabile indipendente) è x = x0 − g2 t2 e quindi non è lineare. Essa però lo diventa
si prendiamo come variabile indipendente t2 al posto di t. In sostanza applichiamo il
30
metodo dei minimi quadrati alla coppia di grandezze X ed Y , dove:
t in secondi
| 0
1 2 3 4
X := t2 in secondi2 | 02 12 22 32 42
Y := x in metri
| 102 97 83 58 24
In particolare vogliamo determinare i valori “ottimali” per i parametri m e q nella legge
lineare Y = mX + q. Per farlo procediamo con il calcoli di vari parametri statistici:
1
(0 + 1 + 4 + 9 + 16) = 6
5
1
M [X 2 ] = (02 + 12 + 42 + 92 + 162 ) = 70.8
5
1
M [Y ] = (102 + 97 + 83 + 58 + 24) = 72.8
5
1
2
M [Y ] = (1022 + 972 + 832 + 582 + 242 ) = 6128.4
5
1
M [XY ] = (0 · 102 + 1 · 97 + 4 · 83 + 9 · 58 + 16 · 24) = 267
5
Cov[X, Y ] = M [XY ] − M [X] · M [Y ] = −157.8
M [X] =
Var[X] = M [X 2 ] − (M [X])2 = 34.8
Var[Y ] = M [Y 2 ] − (M [Y ])2 = 828.56
Il coefficiente angolare m è quindi pari a
m=
Cov[X, Y ]
≈ −4.53
Var[X]
e l’ordinata all’origine è
q = M [Y ] − m · M [X] ≈ 99.98
Abbiamo quindi ottenuto che x = 99.98 − 4.53 · t2 la quale, per confronto con la formula
x = x0 − g2 t2 , dà per g il valore 2·4.53 = 9.06 in metri al secondo quadro (il valore “vero”
di g è 9.8m/s2 ma il valore determinato coi minimi quadrati è evidentemente affetto da
errori di misurazione dei dati di partenza).
Infine, è possibile calcolare il coefficiente di correlazione:
Cov[X, Y ]
r=p
Var[X] · Var[Y ]
≈ −0.92
tale valore (vicino a −1) è indice di una buona vicinanza dei valori misurati ai valori
previsti tramite la retta di interpolazione.
(46) Il testo ricorda che la legge che lega Z (variabile dipendente) alla carica q (variabile
indipendente) è: Z = z0 + m · q e quindi è lineare. Per risolvere l’esercizio basta quindi
applicare il metodo dei minimi quadrati alla coppia di grandezze X ed Y , dove:
X := q in Coulomb |
2
3
7
9
12
15
Y := Z in grammi | 20.2 28.1 64.2 78.2 108.2 129.5
In particolare vogliamo determinare i valori “ottimali” per i parametri m e q nella legge
lineare Y = mX + q. Per farlo procediamo con il calcoli di vari parametri statistici:
31
1
(2 + 3 + 7 + 9 + 12 + 15) = 8
6
1
M [X 2 ] = (22 + 32 + 72 + 92 + 122 + 152 ) = 85.33
6
1
M [Y ] = (20.2 + 28.1 + 64.2 + 78.2 + 108.2 + 129.5) = 71.4
6
1
2
M [Y ] = (20.22 + 28.12 + 64.22 + 78.22 + 108.22 + 129.52 ) = 6652.0
6
1
M [XY ] = (2 · 20.2 + 3 · 28.1 + 7 · 64.2 + 9 · 78.2 + 12 · 108.2 + 15 · 129.5) = 753.13
6
Cov[X, Y ] = M [XY ] − M [X] · M [Y ] = 181.93
M [X] =
Var[X] = M [X 2 ] − (M [X])2 = 21.33
Var[Y ] = M [Y 2 ] − (M [Y ])2 = 1554.04
Il coefficiente angolare m è quindi pari a
m=
Cov[X, Y ]
≈ 8.52
Var[X]
e l’ordinata all’origine è
q = M [Y ] − m · M [X] ≈ 3.24
Abbiamo quindi ottenuto che Z = 3.24 + 8.52 · t.
Infine, è possibile calcolare il coefficiente di correlazione:
r=p
Cov[X, Y ]
Var[X] · Var[Y ]
≈ 0.999
tale valore (estremamente vicino a 1) è indice di una buona vicinanza dei valori misurati
ai valori previsti tramite la retta di interpolazione.
(47) Il testo ricorda che la legge che lega la concentrazione C (variabile dipendente) al tempo
t (variabile indipendente) è C = C0 e−bt e quindi non è lineare. Essa però lo diventa
se prendiamo come variabile dipendente log C al posto di C. In sostanza applichiamo il
metodo dei minimi quadrati alla coppia di grandezze X ed Y , dove:
X := t in secondi |
1
2
3
4
5
C
| 0.135355 0.018315 0.002478 0.000123 0.000016
Y := log C
| −1.9998 −4.0000 −6.0003 −9.0033 −11.0429
In particolare vogliamo determinare i valori “ottimali” per i parametri m e q nella legge
lineare Y = mX + q. Per farlo procediamo con il calcoli di vari parametri statistici:
1
(1 + 2 + 3 + 4 + 5) = 3
5
1
M [X 2 ] = (12 + 22 + 32 + 42 + 52 ) = 11.2
5
1
M [Y ] = (−1.9998 − 4.0000 − 6.0003 − 9.0033 − 11.0429) = −6.4092
5
1
2
M [Y ] = (1.99982 + 4.00002 + 6.00032 + 9.00332 + 11.04292 ) = 51.8015
5
1
M [XY ] = (1 · (−1.9998) + 2 · (−4.0000) + 3 · (−6.0003) + · · · ) = −23.8456
5
Cov[X, Y ] = M [XY ] − M [X] · M [Y ] = −4.6180
M [X] =
Var[X] = M [X 2 ] − (M [X])2 = 2.2
Var[Y ] = M [Y 2 ] − (M [Y ])2 = 10.7236
32
Il coefficiente angolare m è quindi pari a
Cov[X, Y ]
m=
≈ −2.099
Var[X]
e l’ordinata all’origine è
q = M [Y ] − m · M [X] ≈ −0.1122
Abbiamo quindi ottenuto che log C = −0.1122 − 2.099 · t la quale, per confronto con la
formula log C = log C0 − b t, dà per C0 il valore e−0.1122 ≈ 0.89 e per b il valore −2.099.
Abbiamo perciò determinato che
C = 0.89 · e−2.099·t .
Infine, è possibile calcolare il coefficiente di correlazione:
Cov[X, Y ]
≈ −0.95
r=p
Var[X] · Var[Y ]
tale valore (vicino a −1) è indice di una buona vicinanza dei valori misurati ai valori
previsti tramite la retta di interpolazione.
(48) In base alla definizione di distribuzione di Poisson, la probabilità che vengano diagnosticati n casi è data da
λn
p(n) = e−λ
per ogni n = 0, 1, 2, . . ..
n!
Nel caso in esame λ = 4.5. La prima domanda ha per soluzione il numero
4.51
λ1
= e−4.5
= 0.05.
1!
1!
La seconda domanda ha per soluzione:
p(1) = e−λ
p(più di due casi) = p(3) + p(4) + p(5) + · · · .
Tale somma fornisce la risposta ma purtroppo non è di agevole calcolo poiché presenta
infiniti addendi. Possiamo più facilmente ottenere il medesimo risultato osservando che
p(più di due casi) = 1 − p(meno di tre casi)
= 1 − (p(0) + p(1) + p(2))
λ0
λ1
λ2
+ e−λ
+ e−λ )
0!
1!
2!
≈ 1 − 0.173 = 0.927.
= 1 − (e−λ
(49) Il numero medio di terremoti è semplicemente il numero di terremoti registrati in 120
anni / 120 anni, ovvero 87/120 = 0.725. In base a questo dato, la probabilità che in
un anno qualsiasi si verifichino esattamente n terremoti ha distribuzione di Poisson con
parametro λ = 0.725, e quindi
λn
∀n ∈ N,
p(n) = e−λ
n!
quindi
0.7252
p(2) = e−0.725
≈ 12.7%.
2!
Ci si attende quindi che su un totale di 120 anni, in 120 · 0.127 ≈ 15 di essi si siano
verificati esattamente due terremoti all’anno.
(50) Le probabilità sono
0
A
B
AB
Rh+ 0.38 0.25 0.11 0.06
Rh- 0.07 0.06 0.04 0.03
33
con marginali pari a:
0
A
B
AB
Rh+ 0.38 0.25 0.11 0.06 0.8
Rh- 0.07 0.06 0.04 0.03 0.2
0.45 0.31 0.15 0.09
Si ha quindi:
p(gruppo non 0) = p({A, B, AB}) = p(A) + p(B) + p(AB) = 0.31 + 0.05 + 0.09 = 0.55 = 55%,
p(gruppo AB o fattore Rh+) = p(gruppo AB ∪ fattore Rh+)
= p(AB) + p(Rh+) − p(AB ∩ Rh+) = 0.09 + 0.8 − 0.06
= 0.83 = 83%,
p(Rh − |A) =
p({Rh−} ∩ {A})
p(Rh−, A)
0.06
=
=
≈ 19.2%.
p(A)
p(A)
0.31
Infine, è ragionevole supporre che la scelta delle tre persone con gruppo B avvenga in
condizioni di indipendenza, per tale motivo
p(scelte tre persone con gruppo B) = p({B})· ({B})· ({B}) = p({B})3 = 0.153 ≈ 0.3%.
Questo però solo la scelta delle tre persone non esclude dalle scelte successive le persone
già scelte (ovvero solo se la la scelta avviene con reimmissione). Se si desidera invece
calcolare la probabilità che scelte tre persone distinte, esse abbiano gruppo B si dovrà
tener conto che ad ogni estrazione successiva, la persona scelta al passo precedente non
è più disponibile, e cosı̀ si avrà
p(tre persone distinte con gruppo B) =
15 14 13
·
·
≈ 0.28%.
100 99 98
(51) Le frequenze percentuali sono
Gruppo Fr. assolute
0
78/150 = 0.52
A
48/150 = 0.32
15/150 = 0.1
B
AB
9/150 = 0.06
Scegliendo due persone si avranno quindi le seguenti coppie di possibili gruppi sanguigni
0 A B AB
0
A
B
AB
con marginali pari a:
0
A
B
AB
0
A
B
AB
0.52
0.32
0.1
0.06
0.52 0.32 0.1 0.06
Le due persone sono scelte indipendentemente una dall’altra, quindi probabilità congiunte saranno prodotto delle corrispondenti marginali e si avrà
34
0
A
B
AB
0 0.2704 0.1664 0.052 0.0312 0.52
A 0.1664 0.1024 0.032 0.0192 0.32
B
0.052 0.032 0.01
0.006
0.1
AB 0.0312 0.0192 0.006 0.00036 0.06
0.52
0.32
0.1
0.06
Possiamo ora rispondere alle domande poste nell’esercizio:
p(gruppo sanguigno uguale) = p((0, 0)) + p((A, A)) + p((B, B)) + p((AB, AB))
= 0.2704 + 0.1024 + 0.01 + 0.00036 ≈ 38%,
e
p(persona 1 può donare a persona 2)
= p((0, 0)) + p((0, A)) + p((0, B)) + p((0, AB)) + p((A, A)) + p((A, AB))
+ p((B, B)) + p((B, AB)) + p((AB, AB))
= 0.2704 + 0.1664 + 0.052 + 0.0312 + 0.1024 + 0.0192 + 0.01 + 0.006 + 0.00036 ≈ 65.8%.
(52) Soluzione:
a) Si chiede calcolare la probabilita’ condizionata p(urna 1|bianca). In base alla formula di Bayes si ha:
p(urna 1|bianca) =
p(bianca|urna 1) · p(urna 1)
.
p(bianca|urna 1) · p(urna 1) + p(bianca|urna 2) · p(urna 2) + p(bianca|urna 3) · p(urna 3)
In questo calcolo le urne vengono scelte a caso, quindi p(urna 1) = p(urna 2) =
p(urna 3) e quindi il valore comune è 1/3.
Inoltre, l’urna 1 contiene 2 bianche su 5, quindi p(bianca|urna 1) = 2/5; l’urna 2
contiene 4 bianche su 5, quindi p(bianca|urna 2) = 4/5; l’urna 3 contiene 3 bianche
su 7, quindi p(bianca|urna 3) = 3/7. Sostituendo questi dati nella formula di prima
si ha:
2/5
14
(2/5) · (1/3)
=
= .
p(urna 1|bianca) =
(2/5) · (1/3) + (4/5) · (1/3) + (3/7) · (1/3)
2/5 + 4/5 + 3/7
57
b) Le palle vengono riunite in un’unica urna, che quindi contiene 9 bianche e 8 nere. Si
fanno cinque estrazioni senza reimmissione, qual è la probabilità di avere 3 bianche
e 2 nere?
di seguito elenchiamo tutte le estrazioni che producono 3 bianche e 2 nere. Il numero
di tali sequenza è uguale al binomiale di indici 5 e 3 e quindi è 53 = 5·4·3
3·2·1 = 10; esse
sono:
bbbnn,
bbnnb,
bbnbn,
nbbbn,
bnbbn,
nbbnb,
bnnbb,
nbnbb,
bnbnb,
nnbbb.
la prima ha probabilità: (9/17) · (8/16) · (7/15) · (8/14) · (7/13). Questo perché la
probabilità di estrarre una bianca alla prima estrazione è 9/17 (9 bianche su totale
di 17); posto che alla prima estrazione sia uscita bianca, la probabilità che alla
seconda estrazione esca ancora bianca è 8/16 (restano 8 bianche nel vaso, su totale
di 16); posto che alle prime due estrazioni siano uscite bianche, la probabilità che
alla terza estrazione esca ancora bianca è 7/15 (restano 7 bianche nel vaso, su totale
di 15); posto che alle prime tre estrazioni siano uscite bianche, la probabilità che
alla quarta estrazione esca nera è 8/14 (restano 8 nere nel vaso, su totale di 14);
posto che alle prime tre estrazioni siano uscite bianche e alla quarta sia uscita nera,
la probabilità che alla quinta estrazione esca ancora nera è 7/13 (restano 7 nere nel
vaso, su totale di 13).
35
Conti analoghi danno le probabilità delle altre combinazioni che quindi saranno:
p(bbbnn) = (9/17) · (8/16) · (7/15) · (8/14) · (7/13)
p(bbnbn) = (9/17) · (8/16) · (8/15) · (7/14) · (7/13)
p(bnbbn) = (9/17) · (8/16) · (8/15) · (7/14) · (7/13)
p(bnnbb) = (9/17) · (8/16) · (7/15) · (8/14) · (7/13)
p(bnbnb) = (9/17) · (8/16) · (8/15) · (7/14) · (7/13)
p(bbnnb) = (9/17) · (8/16) · (8/15) · (7/14) · (7/13)
p(nbbbn) = (8/17) · (9/16) · (8/15) · (7/14) · (7/13)
p(nbbnb) = (8/17) · (9/16) · (8/15) · (7/14) · (7/13)
p(nbnbb) = (8/17) · (9/16) · (7/15) · (8/14) · (7/13)
p(nnbbb) = (8/17) · (7/16) · (9/15) · (8/14) · (7/13)
La probabilità cercata è la somma delle probabilità che sono scritte a destra. Si
osservi che nonostante le differenti scritture, queste probabilità sono tutte uguali
tra loro, e valgono
9·8·7·8·7
;
17 · 16 · 15 · 14 · 13
la probabilità cercata quindi è
9·8·7·8·7
84
10 ·
=
≈ 38.%
17 · 16 · 15 · 14 · 13
221
N.B. Queste simmetrie non sono casuali e nascondono una teoria generale che può
essere usata per ottenere il risultato più agevolmente.
(53) La teoria generale mostra che la variabile aleatoria X =“numero di querce in una casella
scelta a caso” assume i propri valori con probabilità molto vicine ad una Poisson di
parametro λ = 40000/10000 = 4.
2
2
a) p(X = 2) = e−λ · λ2! = e−4 · 42 ≈ 14.6%;
0
1
2
3
b) p(X < 4) = p(X = 0)+p(X = 1)+p(X = 2)+p(X = 3) = e−λ ·( λ0! + λ1! + λ2! + λ3! ) ≈
43.3%.
(54) Indichiamo con ‘+’ l’evento: ‘il test è risultato positivo’, con ‘−’ l’evento: ‘il test è
risultato negativo’, con ‘M ’ l’evento: ‘il paziente è malato’ ed infine con ‘S’ l’evento: ‘il
paziente è sano’. Il testo del problema fornisce le seguenti informazioni:
6570
p(M ) = 0.16,
p(−) =
= 0.73,
p(+|M ) = sensibilità = 0.90.
9000
Possiamo quindi calcolare:
p(+, M ) = p(x|M ) · p(M ) = 0.9 · 0.16 = 0.144.
Di conseguenza:
Valore predittivo = p(M |+) =
p(M, +)
0.144
0.144
=
=
≈ 0.626 ≈ 62.6%.
p(+)
1 − p(−)
0.23
Dalla relazione p(M ) = p(+, M ) + p(−, M ) ricaviamo che p(−, M ) = p(M ) − p(+, M ) =
0.16 − 0.144 = 0.016.
Dalla relazione p(−) = p(−, M ) + p(−, S) ricaviamo che p(−, S) = p(−) − p(−, M ) =
0.73 − 0.016 = 0.714. Possiamo cosı̀ concludere che
p(−, S)
0.714
0.714
Specificità = p(−|S) =
=
=
= 0.85 = 85%.
p(S)
1 − p(M )
0.84
Infine, il valore atteso di falsi negativi sul campione di 6000 è pari a 6000 · p(−|M ) =
6000 · (1 − p(+|M )) = 6000 · (1 − 0.90) = 600.
36