COPPIE DI VARIABILI ALEATORIE 1. Funzioni di ripartizione
Transcript
COPPIE DI VARIABILI ALEATORIE 1. Funzioni di ripartizione
COPPIE DI VARIABILI ALEATORIE E. DI NARDO 1. Funzioni di ripartizione congiunte e marginali Definizione 1.1. Siano X, Y v.a. definite su uno stesso spazio di probabilità (Ω, F, P ). La coppia (X, Y ) viene detta v.a. bidimensionale. Si osservi che per ogni coppia di numeri reali (x, y) si ha {ω ∈ Ω : X(ω) ≤ x, Y (ω) ≤ y} = {ω ∈ Ω : X(ω) ≤ x} ∩ {ω ∈ Ω : Y (ω) ≤ y}, tale evento, essendo intersezione di elementi in F, appartiene ancora ad F. Definizione 1.2. Si dice funzione di ripartizione congiunta delle v.a. (X, Y ) la funzione FX,Y : R2 → [0, 1] cosı̀ definita FX,Y (x, y) = P (X ≤ x, Y ≤ y) = P ({ω ∈ Ω : X(ω) ≤ x, Y (ω) ≤ y}). Si noti che lim FX,Y (x, y) = FY (y) lim FX,Y (x, y) = FX (x) x→∞ y→∞ lim FX,Y (x, y) = 0 lim FX,Y (x, y) = 0 x→−∞ y→−∞ mentre lim FX,Y (x, y) = 1. x,y→∞ Le funzioni di ripartizione FX (x) e FY (y) vengono dette marginali. La funzione di ripartizione congiunta è non decrescente. Trattandosi di una funzione in due variabili, questo equivale a dire che se x1 < x2 e y1 < y2 allora la variazione della funzione FX,Y (x, y) sul rettangolo [x1 , x2 ] × [y1 , y2 ] è non negativa. Infatti una variazione semplice della FX,Y è l’incremento della FX,Y lungo una delle sue due variabili, ossia FX,Y (x2 , y) − FX,Y (x1 , y) per x1 < x2 oppure FX,Y (x, y2 ) − FX,Y (x, y1 ) per y1 < y2 . La variazione doppia si ottiene variando la FX,Y prima lungo una variabile e poi lungo l’altra, ossia 2 ∆xx21 ,y ,y1 FX,Y (x, y) = [FX,Y (x2 , y2 ) − FX,Y (x2 , y1 )] − [FX,Y (x1 , y2 ) − FX,Y (x1 , y1 )]. Si tratta allora di provare che 2 ∆xx21 ,y ,y1 FX,Y (x, y) = P (x1 < X ≤ x2 , y1 < Y ≤ y2 ) ≥ 0. E infatti per l’additività della probabilità P (x1 < X ≤ x2 , y1 < Y ≤ y2 ) = P (x1 < X ≤ x2 , Y ≤ y2 )−P (x1 < X ≤ x2 , Y ≤ y1 ) essendo poi P (x1 < X ≤ x2 , Y ≤ y2 ) = P (X ≤ x2 , Y ≤ y2 ) − P (X ≤ x1 , Y ≤ y2 ) = FX,Y (x2 , y2 ) − FX,Y (x1 , y2 ) Ad integrazione della Lezione 10 - Calcolo delle Probabilità e Statistica Matematica II. 1 2 E. DI NARDO e P (x1 < X ≤ x2 , Y ≤ y1 ) = P (X ≤ x2 , Y ≤ y1 ) − P (X ≤ x1 , Y ≤ y1 ) = FX,Y (x2 , y1 ) − FX,Y (x1 , y1 ). segue l’asserto. In particolare risulta ∀x1 < x2 FX,Y (x1 , y) ≤ FX,Y (x2 , y) ∀y1 < y2 FX,Y (x, y1 ) ≤ FX,Y (x, y2 ). Anche nel caso bidimensionale, è possibile utilizzare l’integrale di Riemann-Stieltjes per unificare la notazione tra coppie di v.a. discrete e coppie di v.a. assolutamente continue. Pertanto per ogni B ∈ B(R2 ) scriveremo Z P [(X, Y ) ∈ B] = dFX,Y (x, y). B 1.1. Caso discreto. Data una v.a. doppia discreta (X, Y ) si definisce pr,s = P (X = xr , Y = ys ) r = 1, 2, . . . , s = 1, 2, . . . P massa di probabilità congiunta. Ovviamente risulta pr,s ≥ 0 e r,s pr,s = 1. I valori X X pr = pr,s = P (X = xr , Y = ys ) = P (X = xr ) ps = s s X X pr,s = r P (X = xr , Y = ys ) = P (Y = ys ) r sono detti probabilità marginali della coppia (X, Y ). Si ha inoltre X P [(X, Y ) ∈ B] = pr,s . (xr ,ys )∈B 1.2. Caso assolutamente continue. La coppia di v.a. (X, Y ) si dice assolutamente continua se esiste una funzione f (x, y) detta funzione densità congiunta tale che Z Z x y −∞ −∞ FX,Y (x, y) = f (u, v)dudv. Ovviamente risulta ∂2 FX,Y (x, y) = f (x, y) ∂x∂y ed in particolare f (x, y) ≥ 0 per ogni (x, y) ∈ R2 ed inoltre Z +∞ Z +∞ f (x, y)dxdy = 1. −∞ −∞ Si ha inoltre Z P [(X, Y ) ∈ B] = f (x, y)dxdy. B Un cenno a parte meritano le densità marginali. Poiché FX (x) = limy→∞ FX,Y (x, y) dall’essere Z x FX (x) = fX (u)du −∞ e Z x Z lim FX,Y (x, y) = y→∞ −∞ R f (u, v)dv du COPPIE DI VARIABILI ALEATORIE 3 segue che Z fX (u) = f (u, v)dv. R 2. Relazioni tra due variabili aleatorie Avendo definito le v.a. come funzioni sullo spazio campione Ω esse sono uguali quando X(ω) = Y (ω) per ogni ω ∈ Ω. Dall’uguaglianza di due v.a. segue che FX (z) = FY (z) per ogni z ∈ R. Quando vale questa relazione, ossia quando le funzioni di ripartizione sono uguali, diremo che X è somigliante a Y e scriveremo d X = Y. Ovviamente la somiglianza non implica l’uguaglianza. Esiste poi il concetto di v.a. uguali quasi certamente. In tal caso l’evento {ω ∈ Ω : X(ω) = Y (ω)} ha probabilità di occorrenza pari ad 1, ossia P (X = Y ) = 1, in tal caso scriveremo q.c. X = Y. Pertanto si ha q.c. d X = Y ⇒ X = Y ⇒ X = Y. 2.1. Indipendenza. Definizione 2.1. Due v.a. X e Y si dicono indipendenti se e solo se FX,Y (x, y) = FX (x)FY (y) ∀(x, y) ∈ R2 . Proposizione 2.2. Due v.a. X e Y sono indipendenti se e solo se P [(X, Y ) ∈ A × B] = P (X ∈ A)P (Y ∈ B) ∀A, B ∈ B(R). Proof. Scegliendo A = (−∞, x] e B = (−∞, y] è immediato dimostrare che X e Y sono indipendenti. L’implicazione inversa segue osservando che Z Z Z P [(X, Y ) ∈ A × B] = dFX,Y (x, y) = dFX (x) dFY (y). A×B A B Se le v.a. sono discrete, risultano indipendenti se e solo se P (X = xr , Y = ys ) = P (X = xr )P (Y = ys ), mentre se sono assolutamente continue sono indipendenti se e solo se f (x, y) = fX (x)fY (y) ∀(x, y) ∈ R2 , dove fX e fY rappresentano le densità marginali di X e Y. 2.2. Condizionamento. Sia (X, Y ) una coppia di v.a. discrete. È possibile considerare la probabilità condizionata P (X = xr , Y = ys ) . P (X = xr |Y = ys ) = P (Y = ys ) Tenendo fisso ys le probabilità P (X = xr |Y = ys ) forniscono una distribuzione di probabilità poiché si può dimostrare che X P (X = xr |Y = ys ) ≥ 0 P (X = xr |Y = ys ) = 1. r Tale distribuzione di probabilità prende il nome di distribuzione di probabilità di X condizionata da Y. Nel caso di v.a. assolutamente continue la costruzione della distribuzione di probabilità condizionata è molto più delicata, poichè in tal caso P (X = x) = 0. 4 E. DI NARDO Dati due numeri reali h, k si definisca l’evento Ah,k = {ω ∈ Ω : x − h < X(ω) ≤ x + k}. Si scelga l’intervallo (x − k, x + k] in modo tale che P (Ah,k ) > 0. Pertanto ha senso definire P (B ∩ Ah,k ) P (B ∩ Ah,k ) P (B|Ah,k ) = = . P (Ah,k ) FX (x + k) − FX (x − h) Definizione 2.3. Assegnata una v.a. X con funzione di ripartizione FX (x) e un evento B ∈ F si definisce probabilità condizionata di B dato il valore x assunto dalla v.a. X il seguente limite (se esiste): P (B|x) = lim h,k→0 P (B ∩ Ah,k ) . FX (x + k) − FX (x − h) Sia ora Y una seconda v.a. definita sullo stesso spazio di probabilità di X e sia B = {ω ∈ Ω : Y (ω) ≤ y}. In tale caso P (B ∩ Ah,k ) = FX,Y (x + k, y) − FX,Y (x − h, y). Se allora esiste il limite di lim h,k→0 FX,Y (x + k, y) − FX,Y (x − h, y) FX (x + k) − FX (x − h) esso prende il nome di funzione di ripartizione di Y dato X e viene indicato con FY |X (y|x) = P (Y ≤ y|X = x). Proposizione 2.4. Se esiste P (B|x) e se è integrabile rispetto allla funzione FX (x) si ha: Z ∞ P (B) = P (B|x)dFX (x). −∞ Proof. Dati n − 1 reali x1 < x2 < . . . < xn−1 e posto x0 = −∞ e xn = ∞ consideriamo gli eventi Ak = {ω ∈ Ω : xk−1 < X(ω) ≤ xk } per k = 1, 2, . . . , n. Questi eventi costituiscono un sistema completo di ipotesi, e per il teorema delle alternative, tali che X X P (B) = P (B|Ak )P (Ak ) = P (B|Ak )[FX (xk ) − FX (xk−1 )] k k da cui il risultato passando al limite e ricordando la definizione dell’integrale di Riemann-Stieltjes. In particolare posto B = {ω ∈ Ω : Y (ω) ≤ y} si ha Z ∞ FY (y) = FY |X (y|x)dFX (x). −∞ Supponiamo ora che X e Y siano v.a. assolutamente continue e quindi dotate di funzione densità rispettivamente fX (x) e fY (y). Scelto h = 0 e k = ε si ha FY |X (y|x) FX,Y (x + ε, y) − FX,Y (x, y) ε→0 FX (x + ε) − FX (x) FX,Y (x + ε, y) − FX,Y (x, y) ε = lim ε→0 ε FX (x + ε) − FX (x) 1 ∂ = FX,Y (x, y) fX (x) ∂x = lim COPPIE DI VARIABILI ALEATORIE 5 e passando alle derivate parziali ∂ 1 ∂2 f (x, y) FY |X (y|x) = FX,Y (x, y) = . ∂y fX (x) ∂x∂y fX (x) Posto ∂ FY |X (y|x) ∂y tale funzione prende il nome Rdi densità di probabilità di Y condizionata da X. È ovvio che fY |X (y|x) ≥ 0 e R fY |X (y|x)dy = 1. I ruoli di X e di Y si possono scambiare e quindi è possibile definire anche fX|Y (x|y) ossia la densità di probabilità di X condizionata da Y. Risulta poi ∂ f (x, y) fY |X (y|x) = FY |X (y|x) = ⇒ f (x, y) = fY |X (y|x)fX (x) ∂y fX (x) e dunque Z Z fY |X (y|x) = ∞ fY (y) = ∞ f (x, y)dx = −∞ fY |X (y|x)fX (x)dx. −∞ Sussiste anche un analogo del teorema di Bayes al caso continuo, ossia: fY |X (y|x)fX (x) fY |X (y|x)fX (x) fX|Y (x|y) = = R∞ . fY (y) f (y|x)fX (x)dx −∞ Y |X Vale il seguente teorema Teorema 2.5. Se X e Y sono v.a. indipendenti, le seguenti relazioni sono equivalenti i) fX,Y (x, y) = fX (x)fY (y); ii) fY |X (y|x) = fY (y); iii) fX|Y (x|y) = fX (x). In particolare si ha FY |X (y|x) = ∂ 1 ∂ 1 FX,Y (x, y) = [FX (x)FY (y)] = FY (y) fX (x) ∂x fX (x) ∂x e scambiando il ruolo di X e Y segue FX|Y (x|y) = FX (x). 3. Funzioni di due variabili aleatorie Nel caso (X, Y ) siano v.a. discrete, la v.a. U = g(X, Y ) viene studiata esattamente come nel caso discreto, osservando che X P (U = u) = P (X = xr , Y = ys ). r,s:g(xr ,ys )=u Nel caso (X, Y ) siano assolutamente continue, esiste un teorema che consente di caratterizzare la legge di probabilità della coppia (U, V ) in funzione di (X, Y ) attraverso le relazioni U = g1 (X, Y ) e V = g2 (X, Y ). Premettiamo il seguente risultato. Teorema 3.1. Sia g : R2 → R integrabile e sia O ⊂ R2 un insieme aperto tale che g(x, y) = 0 per (x, y) ∈ Oc . Sia poi φ : O → φ(O) ⊂ R2 un diffeomorfismo di classe C 1 . Allora per ogni A ∈ B(R2 ) si ha Z Z g(x, y)dxdy = g[φ−1 (u, v)]| det(Dφ−1 (u, v))|dudv A φ(O∩A) 6 E. DI NARDO dove Dφ−1 è la matrice iacobiana di φ−1 . Corollario 3.2. Sia (X, Y ) una coppia di v.a. assolutamente continue e g : R2 → R2 un diffeomorfismo tale che esiste un aperto U per il quale P [(X, Y ) ∈ U ] = 1. Allora la coppia di v.a. (U, V ) = g(X, Y ) è assolutamente continua ed ha funzione densità di probabilità congiunta data da fU,V (u, v) = fX,Y (x, y)(x,y)=g−1 (u,v) | det(Dg −1 (u, v))| (u, v) ∈ g(U ) mentre è nulla al di fuori. Proof. Essendo P [(X, Y ) ∈ U ] = 1 si può assumere fX,Y (x, y) = 0 per (x, y) ∈ U c . Allora se I = I1 × I2 per il teorema precedente si ha Z −1 P [(U, V ) ∈ I] = P [(X, Y ) ∈ g (I)] = f (x, y)dxdy g −1 (I) Z fX,Y (x, y)(x,y)=g−1 (u,v) | det(Dg −1 (u, v))|dudv = I da cui la conclusione segue immediatamente. Un caso particolare è quando g(x, y) = A (x, y)T + b, dove A è una matrice quadrata di dimensione 2 invertibile e b è un vettore di dimensione 2. L’inversa di g è g −1 (u, v) = A−1 [(u, v)T − b] e quindi | det(Dg −1 (u, v))| = det A−1 = (det A)−1 . Pertanto si ha fX,Y (A−1 [(u, v)T − b]) . fU,V (u, v) = det A 3.1. Somme. Siano X ed Y due v.a. assolutamente continue e sia Z = X + Y. Si vuole conoscere la funzione densità di Z. La tecnica da utilizzare consiste nel completare la trasformazione (X, Y ) → X + Y in una trasformazione invertibile alla quale applicare il risultato del corollario precedente. Ad esempio consideriamo la funzione g : (x, y) → (x + y, y). Siamo nel caso in cui x 1 1 g(x, y) = A dove A = . y 0 1 Si noti che det A = 1 e si ha A−1 = 1 −1 0 1 . Essendo g(X, Y ) = (Z, Y ) dal corollario segue che fZ,Y (z, y) = fX,Y (g −1 (z, y)) = fX,Y (z − y, y). La funzione densità di Z si calcola come marginale di (Z, Y ) pertanto Z fZ (z) = fX,Y (z − y, y)dy. R Se X ed Y sono indipendenti, si ha Z fZ (z) = fX (z − y)fY (y)dy. R Spesso questa ultima formula si scrive fX+Y = fX ∗ fY dove ∗ denota il prodotto di convoluzione definito da Z g ∗ h(y) = g(z − y)h(y)dy. R COPPIE DI VARIABILI ALEATORIE 7 Ovviamente per il caso Z = X − Y si ha Z fZ (z) = fX,Y (z + y, y)dy. R Esercizio Siano X e Y v.a. esponenziali indipendenti. Studiare la v.a. X + Y. Esercizio Siano X e Y v.a. gaussiane standard indipendenti. Studiare la v.a. X 2 + Y 2. 3.2. Prodotti. Siano X ed Y due v.a. assolutamente continue e sia Z = XY. Si vuole conoscere la funzione densità di Z. La tecnica da utilizzare consiste nel completare la trasformazione (X, Y ) → XY in una trasformazione invertibile alla quale applicare il risultato del corollario precedente. Ad esempio consideriamo la funzione g : (x, y) → (xy, y). La g è un diffeomorfismo e la sua inversa g −1 : (u, v) → (u/v, v). Lo iacobiano di tale trasformazione è 1 1/v −u/v 2 Dg −1 = tale che | det Dg −1 (u, v)| = 0 1 |v| Dal corollario segue che u 1 fZ,Y (u, v) = fX,Y ,v |v| v e quindi Z z 1 fX,Y , v dv. fZ (z) = v R |v| In modo del tutto analogo si dimostra che Z fX/Y (z) = |v|fX,Y (zv, v) dv. R Esercizio Siano X e Y v.a. gaussiane standard indipendenti. Studiare la v.a. X/Y.