COPPIE DI VARIABILI ALEATORIE 1. Funzioni di ripartizione

Transcript

COPPIE DI VARIABILI ALEATORIE 1. Funzioni di ripartizione
COPPIE DI VARIABILI ALEATORIE
E. DI NARDO
1. Funzioni di ripartizione congiunte e marginali
Definizione 1.1. Siano X, Y v.a. definite su uno stesso spazio di probabilità
(Ω, F, P ). La coppia (X, Y ) viene detta v.a. bidimensionale.
Si osservi che per ogni coppia di numeri reali (x, y) si ha
{ω ∈ Ω : X(ω) ≤ x, Y (ω) ≤ y} = {ω ∈ Ω : X(ω) ≤ x} ∩ {ω ∈ Ω : Y (ω) ≤ y},
tale evento, essendo intersezione di elementi in F, appartiene ancora ad F.
Definizione 1.2. Si dice funzione di ripartizione congiunta delle v.a. (X, Y ) la
funzione FX,Y : R2 → [0, 1] cosı̀ definita
FX,Y (x, y) = P (X ≤ x, Y ≤ y) = P ({ω ∈ Ω : X(ω) ≤ x, Y (ω) ≤ y}).
Si noti che
lim FX,Y (x, y) = FY (y)
lim FX,Y (x, y) = FX (x)
x→∞
y→∞
lim FX,Y (x, y) = 0
lim FX,Y (x, y) = 0
x→−∞
y→−∞
mentre
lim FX,Y (x, y) = 1.
x,y→∞
Le funzioni di ripartizione FX (x) e FY (y) vengono dette marginali.
La funzione di ripartizione congiunta è non decrescente. Trattandosi di una
funzione in due variabili, questo equivale a dire che se x1 < x2 e y1 < y2 allora la
variazione della funzione FX,Y (x, y) sul rettangolo [x1 , x2 ] × [y1 , y2 ] è non negativa.
Infatti una variazione semplice della FX,Y è l’incremento della FX,Y lungo una delle
sue due variabili, ossia FX,Y (x2 , y) − FX,Y (x1 , y) per x1 < x2 oppure FX,Y (x, y2 ) −
FX,Y (x, y1 ) per y1 < y2 . La variazione doppia si ottiene variando la FX,Y prima
lungo una variabile e poi lungo l’altra, ossia
2
∆xx21 ,y
,y1 FX,Y (x, y) = [FX,Y (x2 , y2 ) − FX,Y (x2 , y1 )] − [FX,Y (x1 , y2 ) − FX,Y (x1 , y1 )].
Si tratta allora di provare che
2
∆xx21 ,y
,y1 FX,Y (x, y) = P (x1 < X ≤ x2 , y1 < Y ≤ y2 ) ≥ 0.
E infatti per l’additività della probabilità
P (x1 < X ≤ x2 , y1 < Y ≤ y2 ) = P (x1 < X ≤ x2 , Y ≤ y2 )−P (x1 < X ≤ x2 , Y ≤ y1 )
essendo poi
P (x1 < X ≤ x2 , Y ≤ y2 )
= P (X ≤ x2 , Y ≤ y2 ) − P (X ≤ x1 , Y ≤ y2 )
= FX,Y (x2 , y2 ) − FX,Y (x1 , y2 )
Ad integrazione della Lezione 10 - Calcolo delle Probabilità e Statistica Matematica II.
1
2
E. DI NARDO
e
P (x1 < X ≤ x2 , Y ≤ y1 )
= P (X ≤ x2 , Y ≤ y1 ) − P (X ≤ x1 , Y ≤ y1 )
= FX,Y (x2 , y1 ) − FX,Y (x1 , y1 ).
segue l’asserto. In particolare risulta
∀x1 < x2 FX,Y (x1 , y) ≤ FX,Y (x2 , y) ∀y1 < y2 FX,Y (x, y1 ) ≤ FX,Y (x, y2 ).
Anche nel caso bidimensionale, è possibile utilizzare l’integrale di Riemann-Stieltjes
per unificare la notazione tra coppie di v.a. discrete e coppie di v.a. assolutamente
continue. Pertanto per ogni B ∈ B(R2 ) scriveremo
Z
P [(X, Y ) ∈ B] =
dFX,Y (x, y).
B
1.1. Caso discreto. Data una v.a. doppia discreta (X, Y ) si definisce
pr,s = P (X = xr , Y = ys ) r = 1, 2, . . . , s = 1, 2, . . .
P
massa di probabilità congiunta. Ovviamente risulta pr,s ≥ 0 e r,s pr,s = 1. I valori
X
X
pr =
pr,s =
P (X = xr , Y = ys ) = P (X = xr )
ps =
s
s
X
X
pr,s =
r
P (X = xr , Y = ys ) = P (Y = ys )
r
sono detti probabilità marginali della coppia (X, Y ). Si ha inoltre
X
P [(X, Y ) ∈ B] =
pr,s .
(xr ,ys )∈B
1.2. Caso assolutamente continue. La coppia di v.a. (X, Y ) si dice assolutamente continua se esiste una funzione f (x, y) detta funzione densità congiunta tale
che
Z
Z
x
y
−∞
−∞
FX,Y (x, y) =
f (u, v)dudv.
Ovviamente risulta
∂2
FX,Y (x, y) = f (x, y)
∂x∂y
ed in particolare f (x, y) ≥ 0 per ogni (x, y) ∈ R2 ed inoltre
Z +∞ Z +∞
f (x, y)dxdy = 1.
−∞
−∞
Si ha inoltre
Z
P [(X, Y ) ∈ B] =
f (x, y)dxdy.
B
Un cenno a parte meritano le densità marginali. Poiché FX (x) = limy→∞ FX,Y (x, y)
dall’essere
Z
x
FX (x) =
fX (u)du
−∞
e
Z
x
Z
lim FX,Y (x, y) =
y→∞
−∞
R
f (u, v)dv du
COPPIE DI VARIABILI ALEATORIE
3
segue che
Z
fX (u) =
f (u, v)dv.
R
2. Relazioni tra due variabili aleatorie
Avendo definito le v.a. come funzioni sullo spazio campione Ω esse sono uguali
quando X(ω) = Y (ω) per ogni ω ∈ Ω. Dall’uguaglianza di due v.a. segue che
FX (z) = FY (z) per ogni z ∈ R. Quando vale questa relazione, ossia quando le
funzioni di ripartizione sono uguali, diremo che X è somigliante a Y e scriveremo
d
X = Y. Ovviamente la somiglianza non implica l’uguaglianza. Esiste poi il concetto
di v.a. uguali quasi certamente. In tal caso l’evento {ω ∈ Ω : X(ω) = Y (ω)} ha
probabilità di occorrenza pari ad 1, ossia P (X = Y ) = 1, in tal caso scriveremo
q.c.
X = Y. Pertanto si ha
q.c.
d
X = Y ⇒ X = Y ⇒ X = Y.
2.1. Indipendenza.
Definizione 2.1. Due v.a. X e Y si dicono indipendenti se e solo se
FX,Y (x, y) = FX (x)FY (y) ∀(x, y) ∈ R2 .
Proposizione 2.2. Due v.a. X e Y sono indipendenti se e solo se
P [(X, Y ) ∈ A × B] = P (X ∈ A)P (Y ∈ B)
∀A, B ∈ B(R).
Proof. Scegliendo A = (−∞, x] e B = (−∞, y] è immediato dimostrare che X e Y
sono indipendenti. L’implicazione inversa segue osservando che
Z
Z
Z
P [(X, Y ) ∈ A × B] =
dFX,Y (x, y) =
dFX (x)
dFY (y).
A×B
A
B
Se le v.a. sono discrete, risultano indipendenti se e solo se
P (X = xr , Y = ys ) = P (X = xr )P (Y = ys ),
mentre se sono assolutamente continue sono indipendenti se e solo se
f (x, y) = fX (x)fY (y) ∀(x, y) ∈ R2 ,
dove fX e fY rappresentano le densità marginali di X e Y.
2.2. Condizionamento. Sia (X, Y ) una coppia di v.a. discrete. È possibile considerare la probabilità condizionata
P (X = xr , Y = ys )
.
P (X = xr |Y = ys ) =
P (Y = ys )
Tenendo fisso ys le probabilità P (X = xr |Y = ys ) forniscono una distribuzione di
probabilità poiché si può dimostrare che
X
P (X = xr |Y = ys ) ≥ 0
P (X = xr |Y = ys ) = 1.
r
Tale distribuzione di probabilità prende il nome di distribuzione di probabilità di X
condizionata da Y.
Nel caso di v.a. assolutamente continue la costruzione della distribuzione di
probabilità condizionata è molto più delicata, poichè in tal caso P (X = x) = 0.
4
E. DI NARDO
Dati due numeri reali h, k si definisca l’evento Ah,k = {ω ∈ Ω : x − h < X(ω) ≤
x + k}. Si scelga l’intervallo (x − k, x + k] in modo tale che P (Ah,k ) > 0. Pertanto
ha senso definire
P (B ∩ Ah,k )
P (B ∩ Ah,k )
P (B|Ah,k ) =
=
.
P (Ah,k )
FX (x + k) − FX (x − h)
Definizione 2.3. Assegnata una v.a. X con funzione di ripartizione FX (x) e un
evento B ∈ F si definisce probabilità condizionata di B dato il valore x assunto
dalla v.a. X il seguente limite (se esiste):
P (B|x) = lim
h,k→0
P (B ∩ Ah,k )
.
FX (x + k) − FX (x − h)
Sia ora Y una seconda v.a. definita sullo stesso spazio di probabilità di X e sia
B = {ω ∈ Ω : Y (ω) ≤ y}. In tale caso
P (B ∩ Ah,k ) = FX,Y (x + k, y) − FX,Y (x − h, y).
Se allora esiste il limite di
lim
h,k→0
FX,Y (x + k, y) − FX,Y (x − h, y)
FX (x + k) − FX (x − h)
esso prende il nome di funzione di ripartizione di Y dato X e viene indicato con
FY |X (y|x) = P (Y ≤ y|X = x).
Proposizione 2.4. Se esiste P (B|x) e se è integrabile rispetto allla funzione FX (x)
si ha:
Z
∞
P (B) =
P (B|x)dFX (x).
−∞
Proof. Dati n − 1 reali x1 < x2 < . . . < xn−1 e posto x0 = −∞ e xn = ∞
consideriamo gli eventi Ak = {ω ∈ Ω : xk−1 < X(ω) ≤ xk } per k = 1, 2, . . . , n.
Questi eventi costituiscono un sistema completo di ipotesi, e per il teorema delle
alternative, tali che
X
X
P (B) =
P (B|Ak )P (Ak ) =
P (B|Ak )[FX (xk ) − FX (xk−1 )]
k
k
da cui il risultato passando al limite e ricordando la definizione dell’integrale di
Riemann-Stieltjes.
In particolare posto B = {ω ∈ Ω : Y (ω) ≤ y} si ha
Z ∞
FY (y) =
FY |X (y|x)dFX (x).
−∞
Supponiamo ora che X e Y siano v.a. assolutamente continue e quindi dotate
di funzione densità rispettivamente fX (x) e fY (y). Scelto h = 0 e k = ε si ha
FY |X (y|x)
FX,Y (x + ε, y) − FX,Y (x, y)
ε→0
FX (x + ε) − FX (x)
FX,Y (x + ε, y) − FX,Y (x, y)
ε
= lim
ε→0
ε
FX (x + ε) − FX (x)
1
∂
=
FX,Y (x, y)
fX (x) ∂x
=
lim
COPPIE DI VARIABILI ALEATORIE
5
e passando alle derivate parziali
∂
1
∂2
f (x, y)
FY |X (y|x) =
FX,Y (x, y) =
.
∂y
fX (x) ∂x∂y
fX (x)
Posto
∂
FY |X (y|x)
∂y
tale funzione prende il nome Rdi densità di probabilità di Y condizionata da X.
È ovvio che fY |X (y|x) ≥ 0 e R fY |X (y|x)dy = 1. I ruoli di X e di Y si possono
scambiare e quindi è possibile definire anche fX|Y (x|y) ossia la densità di probabilità
di X condizionata da Y. Risulta poi
∂
f (x, y)
fY |X (y|x) =
FY |X (y|x) =
⇒ f (x, y) = fY |X (y|x)fX (x)
∂y
fX (x)
e dunque
Z
Z
fY |X (y|x) =
∞
fY (y) =
∞
f (x, y)dx =
−∞
fY |X (y|x)fX (x)dx.
−∞
Sussiste anche un analogo del teorema di Bayes al caso continuo, ossia:
fY |X (y|x)fX (x)
fY |X (y|x)fX (x)
fX|Y (x|y) =
= R∞
.
fY (y)
f
(y|x)fX (x)dx
−∞ Y |X
Vale il seguente teorema
Teorema 2.5. Se X e Y sono v.a. indipendenti, le seguenti relazioni sono equivalenti
i) fX,Y (x, y) = fX (x)fY (y);
ii) fY |X (y|x) = fY (y);
iii) fX|Y (x|y) = fX (x).
In particolare si ha
FY |X (y|x) =
∂
1
∂
1
FX,Y (x, y) =
[FX (x)FY (y)] = FY (y)
fX (x) ∂x
fX (x) ∂x
e scambiando il ruolo di X e Y segue FX|Y (x|y) = FX (x).
3. Funzioni di due variabili aleatorie
Nel caso (X, Y ) siano v.a. discrete, la v.a. U = g(X, Y ) viene studiata esattamente come nel caso discreto, osservando che
X
P (U = u) =
P (X = xr , Y = ys ).
r,s:g(xr ,ys )=u
Nel caso (X, Y ) siano assolutamente continue, esiste un teorema che consente di
caratterizzare la legge di probabilità della coppia (U, V ) in funzione di (X, Y ) attraverso le relazioni U = g1 (X, Y ) e V = g2 (X, Y ). Premettiamo il seguente risultato.
Teorema 3.1. Sia g : R2 → R integrabile e sia O ⊂ R2 un insieme aperto tale che
g(x, y) = 0 per (x, y) ∈ Oc . Sia poi φ : O → φ(O) ⊂ R2 un diffeomorfismo di classe
C 1 . Allora per ogni A ∈ B(R2 ) si ha
Z
Z
g(x, y)dxdy =
g[φ−1 (u, v)]| det(Dφ−1 (u, v))|dudv
A
φ(O∩A)
6
E. DI NARDO
dove Dφ−1 è la matrice iacobiana di φ−1 .
Corollario 3.2. Sia (X, Y ) una coppia di v.a. assolutamente continue e g : R2 →
R2 un diffeomorfismo tale che esiste un aperto U per il quale P [(X, Y ) ∈ U ] = 1.
Allora la coppia di v.a. (U, V ) = g(X, Y ) è assolutamente continua ed ha funzione
densità di probabilità congiunta data da
fU,V (u, v) = fX,Y (x, y)(x,y)=g−1 (u,v) | det(Dg −1 (u, v))|
(u, v) ∈ g(U )
mentre è nulla al di fuori.
Proof. Essendo P [(X, Y ) ∈ U ] = 1 si può assumere fX,Y (x, y) = 0 per (x, y) ∈ U c .
Allora se I = I1 × I2 per il teorema precedente si ha
Z
−1
P [(U, V ) ∈ I] = P [(X, Y ) ∈ g (I)] =
f (x, y)dxdy
g −1 (I)
Z
fX,Y (x, y)(x,y)=g−1 (u,v) | det(Dg −1 (u, v))|dudv
=
I
da cui la conclusione segue immediatamente.
Un caso particolare è quando g(x, y) = A (x, y)T + b, dove A è una matrice
quadrata di dimensione 2 invertibile e b è un vettore di dimensione 2. L’inversa di
g è g −1 (u, v) = A−1 [(u, v)T − b] e quindi | det(Dg −1 (u, v))| = det A−1 = (det A)−1 .
Pertanto si ha
fX,Y (A−1 [(u, v)T − b])
.
fU,V (u, v) =
det A
3.1. Somme. Siano X ed Y due v.a. assolutamente continue e sia Z = X + Y.
Si vuole conoscere la funzione densità di Z. La tecnica da utilizzare consiste nel
completare la trasformazione (X, Y ) → X + Y in una trasformazione invertibile
alla quale applicare il risultato del corollario precedente. Ad esempio consideriamo
la funzione g : (x, y) → (x + y, y). Siamo nel caso in cui
x
1 1
g(x, y) = A
dove A =
.
y
0 1
Si noti che det A = 1 e si ha
A−1 =
1 −1
0 1
.
Essendo g(X, Y ) = (Z, Y ) dal corollario segue che
fZ,Y (z, y) = fX,Y (g −1 (z, y)) = fX,Y (z − y, y).
La funzione densità di Z si calcola come marginale di (Z, Y ) pertanto
Z
fZ (z) =
fX,Y (z − y, y)dy.
R
Se X ed Y sono indipendenti, si ha
Z
fZ (z) =
fX (z − y)fY (y)dy.
R
Spesso questa ultima formula si scrive fX+Y = fX ∗ fY dove ∗ denota il prodotto
di convoluzione definito da
Z
g ∗ h(y) =
g(z − y)h(y)dy.
R
COPPIE DI VARIABILI ALEATORIE
7
Ovviamente per il caso Z = X − Y si ha
Z
fZ (z) =
fX,Y (z + y, y)dy.
R
Esercizio Siano X e Y v.a. esponenziali indipendenti. Studiare la v.a. X + Y.
Esercizio Siano X e Y v.a. gaussiane standard indipendenti. Studiare la v.a.
X 2 + Y 2.
3.2. Prodotti. Siano X ed Y due v.a. assolutamente continue e sia Z = XY.
Si vuole conoscere la funzione densità di Z. La tecnica da utilizzare consiste nel
completare la trasformazione (X, Y ) → XY in una trasformazione invertibile alla
quale applicare il risultato del corollario precedente. Ad esempio consideriamo la
funzione g : (x, y) → (xy, y). La g è un diffeomorfismo e la sua inversa g −1 : (u, v) →
(u/v, v). Lo iacobiano di tale trasformazione è
1
1/v −u/v 2
Dg −1 =
tale che | det Dg −1 (u, v)| =
0
1
|v|
Dal corollario segue che
u 1
fZ,Y (u, v) =
fX,Y
,v
|v|
v
e quindi
Z
z 1
fX,Y
, v dv.
fZ (z) =
v
R |v|
In modo del tutto analogo si dimostra che
Z
fX/Y (z) =
|v|fX,Y (zv, v) dv.
R
Esercizio Siano X e Y v.a. gaussiane standard indipendenti. Studiare la v.a.
X/Y.