Leggi congiunte di variabili aleatorie

Transcript

Leggi congiunte di variabili aleatorie
ROSS06-233-296.Ita
9-07-2004
10:33
Pagina 233
CAPITOLO
6
Leggi congiunte
di variabili aleatorie
6.1
FUNZIONI DI DISTRIBUZIONE CONGIUNTE
Fino a ora abbiamo considerato unicamente le leggi di singole variabili aleatorie.
Tuttavia, siamo spesso interessati a studiare problemi di probabilità legati al valore
congiunto di due o più variabili aleatorie. Per trattare queste probabilità, definiamo,
per due variabili aleatorie X e Y, la funzione di distribuzione congiunta di X e Y
come
F1a, b2 = P5X … a, Y … b6
- q 6 a, b 6 q
La funzione di distribuzione di X può essere ottenuta da quella congiunta di X e Y
come segue:
FX1a2 = P5X … a6
= P5X … a, Y 6 q 6
= P Q lim 5X … a, Y … b6 R
b: q
= lim P5X … a, Y … b6
b: q
= lim F1a, b2
b: q
K F1a, q 2
Il lettore può notare che nelle precedenti uguaglianze abbiamo fatto uso una volta di
più del fatto che la probabilità è un funzione d’insieme continua. In maniera analoga, la
funzione di distribuzione della variabile Y è data da
FY1b2 = P5Y … b6
= lim F1a, b2
a: q
K F1 q , b2
Le funzioni di distribuzioni FX e FY sono definite le funzioni di distribuzione marginali
di X e Y.
Tutte le proprietà riguardanti le probabilità relative alle variabili X e Y possono, in
teoria, essere espresse in termini della loro funzione di distribuzione congiunta. Per
esempio, supponiamo di voler calcolare la probabilità che X sia maggiore di a e Y sia
maggiore di b.
ROSS06-233-296.Ita
234
9-07-2004
Capitolo 6
10:33
Pagina 234
Leggi congiunte di variabili aleatorie
Questo può essere fatto nel seguente modo:
P5X 7 a, Y 7 b6 = 1 - P15X 7 a, Y 7 b6c2
= 1 - P15X 7 a6c ´ 5Y 7 b6c2
= 1 - P15X … a6 ´ 5Y … b62
(1.1)
= 1 - 3P5X … a6 + P5Y … b6 - P5X … a, Y … b64
= 1 - FX1a2 - FY1b2 + F1a, b2
La Formula (1.1) è un caso speciale della Formula (1.2), la cui dimostrazione è lasciata
come esercizio.
P5a1 6 X … a2 , b1 6 Y … b26
= F1a2 , b22 + F1a1 , b12 - F1a1 , b22 - F1a2 , b12
(1.2)
quando a1 6 a2 , b1 6 b2 .
Nel caso in cui sia X che Y siano variabili aleatorie discrete, è conveniente definire
la (funzione di) densità discreta congiunta di X e Y come segue
p1x, y2 = P5X = x, Y = y6
La densità discreta di X può essere ottenuta da p1x, y2 tramite
pX1x2 = P5X = x6
=
a
p1x, y2
y:p1x, y2 7 0
In maniera analoga,
pY1y2 =
a
p1x, y2
x:p1x, y2 7 0
Esempio 1a. Supponiamo che vengano scelte a caso 3 palline da un’urna contenente
3 palline rosse, 4 bianche e 5 blu. Se denotiamo con X e Y, rispettivamente, il
numero di palline rosse e bianche scelte, allora la densità discreta congiunta di X
e Y, p1i, j2 = P5X = i, Y = j6, è data da
5
12
10
p10, 02 = a b n a b =
3
3
220
4 5
12
40
p10, 12 = a b a b n a b =
1 2
3
220
4 5
12
30
p10, 22 = a b a b n a b =
2 1
3
220
4
12
4
p10, 32 = a b n a b =
3
3
220
3 5
12
30
p11, 02 = a b a b n a b =
1 2
3
220
3 4 5
12
60
p11, 12 = a b a b a b n a b =
1 1 1
3
220
ROSS06-233-296.Ita
9-07-2004
10:33
Pagina 235
6.1
TABELLA 6.1
Funzioni di distribuzione congiunte
235
P5X = i, Y = j6
i
j
0
1
2
3
Somme sulla riga =
P5X = i6
0
10
220
40
220
30
220
4
220
84
220
1
30
220
60
220
18
220
0
108
220
2
15
220
12
220
0
0
27
220
3
1
220
0
0
0
1
220
56
220
112
220
48
220
4
220
Somme sulla colonna = P5Y = j6
3 4
12
18
p11, 22 = a b a b n a b =
1 2
3
220
3 5
12
15
p12, 02 = a b a b n a b =
2 1
3
220
3 4
12
12
p12, 12 = a b a b n a b =
2 1
3
220
3
12
1
p13, 02 = a b n a b =
3
3
220
Queste probabilità possono facilmente essere tabulate come nella Tabella 6.1. Il
lettore noti che la densità discreta della variabile X si ottiene calcolando le somme
sulle righe, mentre quella di Y si ottiene sommando i valori sulle colonne. Siccome le densità discrete di X e Y appaiono ai margini di questa tabella, per questo
motivo hanno ricevuto il nome di densità marginali.
■
Esempio 1b. Supponiamo che il 15 per cento delle famiglie in una certa comunità non
abbia bambini, che il 20 per cento ne abbia 1, il 35 per cento ne abbia 2 e il 30 per
cento ne abbia 3; e supponiamo, inoltre, che in ogni famiglia, ogni figlio sia con
uguale probabilità maschio o femmina in maniera indipendente. Se scegliamo a
caso una famiglia di questa comunità, allora M, il numero di maschi e F, il
numero delle femmine, in questa famiglia hanno la densità discreta congiunta
mostrata nella Tabella 6.2.
TABELLA 6.2
P5B = i, G = j6
j
1
2
3
Somme sulla riga =
P5B = i6
0.15
0.10
0.0875
0.0375
0.3750
0.10
0.175
0.1125
0
0.3875
2
0.0875
0.1125
0
0
0.2000
3
0.0375
0
0
0
0.0375
i
0
0
1
Somme sulla colonna=P5G = j6
0.3750
0.3875 0.2000
0.0375
ROSS06-233-296.Ita
236
9-07-2004
Capitolo 6
10:33
Pagina 236
Leggi congiunte di variabili aleatorie
Queste probabilità si ottengono come segue:
P5B = 0, G = 06 = P5senza figli6 = 0.15
P5B = 0, G = 16 = P51 femmina e in totale 1 figlio6
= P51 figlio6P51 femmina1 figlio6 = 10.202 A 12 B
P5B = 0, G = 26 = P52 femmine e in totale 2 figli6
= P52 figli6P52 femmine 2 figli6 = 10.352 A 12 B
2
Lasciamo al lettore di verificare l’esattezza degli altri valori della Tabella 6.2.
■
Diciamo che le variabili aleatorie X e Y sono congiuntamente (assolutamente) continue se esiste una funzione f1x, y2 integrabile, che abbia la proprietà che per ogni sottoinsieme C dello spazio delle coppie di numeri reali
P51X, Y2 H C6 =
O
f1x, y2 dx dy
(1.3)
1x, y2HC
La funzione f1x, y2 è chiamata (funzione di) densità congiunta di X e Y. Se A e B
sono una qualsiasi coppia di sottoinsiemi della retta reale, allora definendo
C = 51x, y2: x H A, y H B6, dalla Formula (1.3) otteniamo che
P5X H A, Y H B6 =
LB LA
f1x, y2 dx dy
(1.4)
Poiché
F1a, b2 = P5X H 1- q , a4, Y H 1- q , b46
b
=
a
L- q L- q
f1x, y2 dx dy
segue, differenziando, che
f1a, b2 =
02
F1a, b2
0a 0b
sempre che le derivate parziali di F abbiano senso. Un’ulteriore interpretazione della
densità congiunta si ottiene dalla Formula (1.4) nel modo seguente:
d + db
P5a 6 X 6 a + da, b 6 Y 6 b + db6 =
Lb
a + da
La
f1x, y2 dx dy
L f1a, b2 da db
quando da e db sono “piccoli” e f1x, y2 è continua in (a, b). Perciò f1a, b2 risulta una
misura di quanto sia probabile che il vettore (aleatorio) 1X, Y2 sia vicino a 1a, b2.
Se X e Y sono congiuntamente continue, esse lo saranno anche individualmente, e
le loro densità si posso ottenere come segue:
P5X H A6 = P5X H A, Y H 1- q , q 26
ROSS06-233-296.Ita
9-07-2004
10:33
Pagina 237
6.1
Funzioni di distribuzione congiunte
q
=
LA L- q
=
LA
f1x, y2 dy dx
fX1x2 dx
dove
fX1x2 =
q
L- q
f1x, y2 dy
è perciò la densità (marginale) della variabile aleatoria X.
In maniera analoga, la densità (marginale) di Y è data da
fY1y2 =
Esempio 1c.
q
L- q
f1x, y2 dx
La densità congiunta di X e Y è data da
f1x, y2 = b
2e-xe-2y
0
0 6 x 6 q, 0 6 y 6 q
altrimenti
Si calcolino (a) P5X 7 1, Y 6 16, (b) P5X 6 Y6, e (c) P5X 6 a6.
Soluzione
1
(a) P5X 7 1, Y 6 16 =
2e -xe -2y dx dy
L0 L1
1
=
q
L0
2e -2y ¢ -e -x ` ≤ dy
q
1
1
= e -1
L0
2e -2y dy
= e -111 - e -22
(b) P5X 6 Y6 =
O
2e -xe -2y dx dy
1x, y2: x 6 y
y
q
=
L0
L0
q
=
L0
2e -xe -2y dx dy
2e -2y11 - e -y2 dy
q
=
L0
= 1 =
1
3
q
2e -2y dy 2
3
L0
2e -3y dy
237
ROSS06-233-296.Ita
238
9-07-2004
10:33
Capitolo 6
Pagina 238
Leggi congiunte di variabili aleatorie
a
(c) P5X 6 a6 =
q
L0 L0
2e -2ye -x dy dx
a
e -x dx
L0
= 1 - e -a
=
■
Esempio 1d. Si consideri un cerchio di raggio R e supponiamo di scegliere a caso un
punto dentro il cerchio in modo tale che tutte le regioni di uguale area interne al
cerchio abbiano uguale probabilità di contenere il punto. (In altre parole, il
punto è uniformemente distribuito dentro il cerchio.) Se fissiamo il centro del
cerchio come l’origine di un sistema di assi cartesiani e X e Y rappresentano le
coordinate del punto scelto (Figura 6.1), segue che, essendo 1X, Y2 un punto
scelto a caso e in modo uniforme, la densità congiunta di X e Y è data da
f1x, y2 = b
se x2 + y2 … R2
se x2 + y2 7 R2
c
0
per un qualche c.
(a) Si determini la costante c.
(b) Si determinino le densità marginali di X e Y.
(c) Si calcoli la probabilità che D, la distanza dall’origine del punto selezionato,
sia minore o uguale a a.
(d) Si trovi E3D4.
Soluzione (a) Poiché
q
q
L- q L- q
f1x, y2 dy dx = 1
segue che
c
2
O
2
dy dx = 1
2
x +y …R
y
R
(X, Y)
(0, 0)
x
Figura 6.1
Distribuzione congiunta.
ROSS06-233-296.Ita
9-07-2004
10:33
Pagina 239
6.1
Funzioni di distribuzione congiunte
239
Possiamo calcolare 4x2 + y2 … R2 dy dx utilizzando la trasformazione a coordinate polari, o più semplicemente notando che essa rappresenta l’area del cerchio ed è quindi uguale a pR2. Quindi
1
pR2
c =
(b) fX1x2 =
q
f1x, y2 dy
L- q
1
=
dy
pR2 Lx2 + y2 … R2
c
1
=
dy
c = 2R2 - x2
pR2 L-c
=
2
2R2 - x2
pR2
x2 … R2
ed è uguale a 0 quando x2 7 R2. Per simmetria la densità marginale di Y è data da
fY1y2 =
2
2R2 - y2
pR2
y2 … R2
y2 7 R2
= 0
(c) Per la funzione di distribuzione di D = 2X2 + Y2 , la distanza dall’origine,
si ottiene quanto segue: per 0 … a … R,
FD1a2 = P E 2X2 + Y2 … a F
= P5X2 + Y2 … a26
=
2
O
2
f1x, y2 dy dx
2
x +y …a
=
1
pR2
2
O
2
dy dx
x +y …a
2
=
pa
pR2
=
a2
R2
dove abbiamo utilizzato il fatto che 4x2 + y2 … a2 dy dx è l’area del cerchio di raggio
a e quindi è pari a pa2.
(d) Per il punto (c) otteniamo che la densità di D è
fD1a2 =
2a
R2
0 … a … R
ROSS06-233-296.Ita
240
9-07-2004
Capitolo 6
10:33
Pagina 240
Leggi congiunte di variabili aleatorie
Quindi
R
E3D4 =
Esempio 1e.
2R
2
a2 da =
2
3
R L0
■
La densità congiunta di X e Y è data da
f1x, y2 = b
e-1x + y2
0
0 6 x 6 q, 0 6 y 6 q
altrimenti
Si determini la densità della variabile X>Y.
Soluzione Iniziamo calcolando la funzione di distribuzione di X>Y. Per a 7 0,
FX>Y1a2 = P e
=
X
… af
Y
O
e -1x + y2 dx dy
x>y … a
q
=
L0
L0
q
=
ay
L0
e -1x + y2 dx dy
11 - e -ay2e -y dy
e -1a + 12y
r`
a + 1
0
q
= b -e -y +
= 1 -
1
a + 1
Differenziando otteniamo che la densità di X>Y è data da fX>Y1a2 = 1>1a + 122,
0 6 a 6 q.
■
Possiamo definire in maniera analoga al caso di due variabile, la distribuzione di
probabilità congiunta di n variabili aleatorie. Per esempio, la funzione di distribuzione
congiunta F1a1 , a2, p , an2 di n variabili aleatorie X1 , X2, p , Xn si definisce
F1a1 , a2, p , an2 = P5X1 … a1 , X2 … a2, p , Xn … an6
Inoltre, le n variabili aleatorie sono dette congiuntamente continue se esiste una funzione f1x1 , x2, p , xn2, detta densità congiunta, tale che per ogni sottoinsieme C dello
spazio delle n-uple di numeri reali
P51X1 , X2, p , Xn2 H C6 =
O
p
L
1x1, p , xn2HC
f1x1, p , xn2 dx1 dx2 p dxn
In particolare, per ogni famiglia di sottoinsiemi A1 , A2, p , An della retta reale
P5X1 H A 1 , X2 H A 2, p , Xn H A n6
ROSS06-233-296.Ita
9-07-2004
10:33
Pagina 241
6.2
=
LAn LAn - 1
p
Variabili aleatorie indipendenti
LA1
241
f1x1, p , xn2 dx1 dx2 p dxn
Esempio 1f. La distribuzione multinomiale. Una delle più importanti distribuzioni congiunte è certamente la multinomiale, che si ottiene quando si ripeta n
volte un esperimento in forma indipendente. Supponiamo che ogni esperimento possa avere come risultato uno qualsiasi tra r possibili esiti, con probabir
lità pari a p1 , p2, p , pr , a pi = 1, rispettivamente. Se denotiamo con Xi il numei=1
ro degli n esperimenti che hanno dato come risultato l’esito numero i, allora
P5X1 = n1 , X2 = n2, p , Xr = nr6 =
n!
pn1pn2 p pnr r
n1! n2! p nr! 1 2
(1.5)
r
ogni volta che a ni = n.
i=1
La Formula (1.5) è verificata notando che ogni successione degli esiti degli n
esperimenti che portano al fatto che l’esito i si verifichi esattamente ni volte, per
i=1, 2, p , r, avrà probabilità pari a pn1 1pn2 2 p pnr r, grazie all’ipotesi di indipendenza. Essendoci n!>1n1! n2! p nr!2 di tali sequenze (vi sono n!>n1! p nr! permutazioni di n oggetti dei quali n1 sono uguali tra loro, n2 sono uguali tra loro, p , nr
sono uguali tra loro) la Formula (1.5) risulta verificata. La distribuzione congiunta determinata dalla densità discreta congiunta data dalla Formula (1.5) è
detta distribuzione multinomiale. Il lettore noterà che per r = 2, la distribuzione
multinomiale si riduce all’usuale binomiale.
Come applicazione della distribuzione multinomiale, supponiamo di lanciare 9
volte un dado equilibrato. La probabilità che 1 appaia tre volte, 2 e 3 due volte ciascuno,
4 e 5 una sola volta ciascuno e il 6 mai, è pari a
9!
1 3 1 2 1 2 1 1 1 1 1 0
9!
1 9
a b a b a b a b a b a b =
a b
3! 2! 2! 1! 1! 0! 6
6
6
6
6
6
3! 2! 2! 6
6.2
■
VARIABILI ALEATORIE INDIPENDENTI
Le variabili aleatorie X e Y si dicono indipendenti se, per ogni coppia di sottoinsiemi
della retta reale A e B,
P5X H A, Y H B6 = P5X H A6P5Y H B6
(2.1)
In altre parole, X e Y sono indipendenti se, per ogni A e B, gli eventi EA = 5X H A6 e
FB = 5Y H B6 sono indipendenti.
Grazie agli assiomi della probabilità si può provare che l’Equazione (2.1) è verificata se e solo se per ogni coppia di numeri reali a, b,
P5X … a, Y … b6 = P5X … a6P5Y … b6
ROSS06-233-296.Ita
242
9-07-2004
Capitolo 6
10:33
Pagina 242
Leggi congiunte di variabili aleatorie
Quindi, in termini della distribuzione congiunta F di X e Y, abbiamo che X e Y sono
indipendenti se e solo se
F1a, b2 = FX1a2FY1b2
per ogni a, b
Quando X e Y sono variabili aleatorie discrete, la definizione d’indipendenza (2.1)
risulta equivalente a
p1x, y2 = pX1x2pY1y2
per ogni x, y
(2.2)
L’equivalenza segue poiché, se (2.1) è soddisfatta, allora otteniamo la (2.2) ponendo A
e B uguali, rispettivamente, ai sottoinsiemi formati da un solo punto A = 5x6,
B = 5y6. Inoltre, se (2.2) è soddisfatta, allora per ogni coppia di sottoinsiemi A e B,
P5X H A, Y H B6 = a a p1x, y2
yHB xHA
= a a pX1x2pY1y2
yHB xHA
= a pY1y2 a pX1x2
yHB
xHA
= P5Y H B6P5X H A6
e quindi la (2.1) risulta verificata.
Nel caso di variabili congiuntamente continue la condizione d’indipendenza è equivalente a
f1x, y2 = fX1x2fY1y2
per ogni x, y
Perciò, semplificando, X e Y sono indipendenti se la conoscenza del valore di una
non cambia la distribuzione dell’altra. Le variabili che non sono indipendenti vengono
definite dipendenti.
Esempio 2a. Supponiamo che vengano eseguite n + m prove indipendenti, ognuna
delle quali abbia probabilità pari a p di risultare in un successo. Se X è il numero
di successi nelle prime n prove e Y il numero di successi nelle m prove successive, allora X e Y sono indipendenti, già che conoscere il numero dei successi
nelle prime n prove non modifica la distribuzione del numero di successi nelle
ulteriori m prove (per l’ipotesi di indipendenza delle prove). Infatti, per valori
interi positivi x e y,
n
m
P5X = x, Y = y6 = a b px11 - p2n - x a b py11 - p2m - y
x
y
0 … x … n,
0 … y … m
= P5X = x6P5Y = y6
D’altra parte anche X e Z saranno indipendenti, dove Z è il numero totale di suc■
cessi nelle n + m prove (perché?).
Esempio 2b. Supponiamo che il numero di persone che entrano in un ufficio postale
in un dato giorno sia descrivibile con una variabile di Poisson di parametro l. Si
provi che, se ogni persona che entra nell’ufficio postale è un uomo con probabilità pari a p e donna con probabilità pari a 1 – p, allora il numero di uomini e
ROSS06-233-296.Ita
9-07-2004
10:33
Pagina 243
6.2
Variabili aleatorie indipendenti
243
donne che entrano nell’ufficio postale sono variabili aleatorie di Poisson indipendenti di parametri rispettivamente pari a lp e l11 - p2.
Soluzione Denotiamo con X e Y, rispettivamente, il numero di uomini e donne
che entrano nell’ufficio postale. Proveremo che sono indipendenti dimostrando che la Formula (2.2) è verificata. Per ottenere questa espressione per
P5X = i, Y = j6, condizioniamo rispetto a X + Y come segue:
P5X = i, Y = j6 = P5X = i, Y = jX + Y = i + j6P5X + Y = i + j6
+ P5X = i, Y = jX + Y Z i + j6P5X + Y Z i + j6
[Il lettore noti come questa formula non sia altro che un caso particolare della
formula P1E2 = P1E F2P1F2 + P1EFc2P1Fc2.]
Essendo P5X = i, Y = jX + Y Z i + j6 chiaramente pari a 0, otteniamo
P5X = i, Y = j6 = P5X = i, Y = jX + Y = i + j6P5X + Y = i + j6
(2.3)
Ora, siccome X + Y rappresenta il numero totale di persone che entrano nell’ufficio postale, segue, per ipotesi, che
li + j
P5X + Y = i + j6 = e-l
(2.4)
1i + j2!
Inoltre, dato che i + j persone entrano nell’ufficio postale e con probabilità pari a
p ognuna di esse è un uomo, segue che la probabilità che esattamente i di essi sia un
uomo (e quindi j siano donne) è semplicemente la densità discreta di una variabii + j i
le binomiale di parametri i + j e p valutata in i, ovvero a
b p 11 - p2j. Quindi
i
P5X = i, Y = jX + Y = i + j6 = a
i + j i
b p 11 - p2j
i
(2.5)
Sostituendo la (2.4) e la (2.5) nella (2.3) abbiamo
P5X = i, Y = j6 = a
i + j i
li + j
b p 11 - p2je -l
i
1i + j2!
= e -l
=
Perciò
P5X = i6 = e -lp
1lp2i
3l11 - p24j
i! j!
e -lp1lp2i -l11 - p2 3l11 - p24j
e
i!
j!
(2.6)
1lp2i
3l11 - p24j
1lp2i
-l11 - p2
-lp
e
=
e
i! a
j!
i!
j
(2.7)
e in maniera simile
P5Y = j6 = e -l11 - p2
3l11 - p24j
j!
Le Formule (2.6), (2.7) e (2.8) verificano quanto desiderato.
(2.8)
■