Correlazione tra variabili casuali Possiamo generalizzare un poco il
Transcript
Correlazione tra variabili casuali Possiamo generalizzare un poco il
Correlazione tra variabili casuali Possiamo generalizzare un poco il nostro punto di vista sull’incertezza, e immaginare mondi in cui i possibili fatti sono descritti dal valore congiunto di due variabili casuali. Ogni possibile fatto, cioè, è descritto esaustivamente solo se vengono comunicati i valori di entrambe le variabili, per esempio la quotazione in borsa del titolo X e contemporaneamente la quotazione del titolo Y. Ora tuttavia entrambe le variabili sono casuali, e dunque qualsiasi quotazione congiunta dei due titoli è essa stessa un fatto casuale. Le possibili quotazioni congiunte potrebbero essere rappresentate, come al solito, da punti in un piano cartesiano. Inoltre, se potessimo sapere che le quotazioni ammissibili di ciascun titolo non possono mai essere inferiori a zero né eccedere certi estremi, per esempio MAXX e MAXY, allora i soli fatti possibili di questo mondo si situerebbero in un rettangolo nel piano cartesiano, con un vertice nell’origine e il vertice opposto nel punto che ha coordinate MAXX e MAXY. Poiché si tratta di fatti casuali, tutti i punti fuori da tale rettangolo avrebbero probabilità pari a zero, mentre la somma delle probabilità di tutti i punti del rettangolo è uno. Ognuna delle due quotazioni è una variabile casuale, ed è caratterizzata da certi valori sintetici come il valore atteso e la varianza. Tuttavia potremmo sfruttare il fatto di essere in un mondo bidimensionale, e cercare di studiare se esiste qualche relazione tra le due quotazioni. Potremmo cioè cercare di capire se, ipotizzando di conoscere il valore assunto da una delle due quotazioni, ciò ci dia informazioni sulla probabilità dei valori dell’altra quotazione. Questo studio si chiama studio della correlazione fra le due variabili casuali. Intuitivamente, dire che le due quotazioni sono correlate tra loro significa che i punti che le rappresentano nel piano cartesiano tendono ad “accumularsi” in certe aree del rettangolo di cui parlavamo prima: per ogni possibile quotazione X, le possibili quotazioni Y assumono prevalentemente certi valori e non altri. Se, addirittura, per ogni possibile valore di X avessimo un solo valore possibile di Y, saremmo nel caso di grafico di una relazione deterministica: una linea. Viceversa, se le due quotazioni non sono correlate osserveremo punti sparsi uniformemente in tutto il rettangolo. Qui non ci concentriamo però sull’analisi grafica, bensì consideriamo un caso semplice. Supponiamo che le due quotazioni, cioè variabili casuali, X e Y possano assumere ciascuna due soli valori, basso e alto: avremo allora per X i valori BX e AX, e per Y i valori BY e AY. Presa separatamente, ciascuna variabile ha esiti equi–probabili, cioè le probabilità dei suoi due valori sono pari a ½. Ma, considerando congiuntamente le due quotazioni, i possibili fatti del mondo sono quattro, che potremmo indicare come segue: (BX, BY), (AX, BY), (BX, AY), (AX, AY). Si tratta di quattro eventi casuali del più ampio mondo a due variabili, cosicché ciascuno avrà una sua probabilità in quel mondo; siccome essi sono i soli possibili esiti in tale mondo, la somma delle loro quattro probabilità deve essere pari ad uno. Diremo che le due variabili sono non correlate, o indipendenti, se il verificarsi di uno dei due valori di X non influenza la probabilità degli esiti di Y. Quindi, qualsiasi sia il valore di X, le probabilità di BY e AY continuano ed essere ½. Ma i due valori possibili di X hanno di per sé probabilità ½ ciascuno; dunque la probabilità di ognuno dei quattro eventi congiunti (BX, BY), (AX, BY), (BX, AY), (AX, AY) deve essere ¼, il prodotto di ½ per ½. Infatti, dire per esempio che X assuma il valore BX, evento che di per sé ha probabilità ½, lascia ancora aperte per l’altra variabile le due possibilità BY e AY, ciascuna delle quali a sua volta ha probabilità ½ di accadere. In altri termini, in un mondo a due variabili X e Y, la frase “X vale BX” significa che può prevalere lo stato (BX, BY) oppure lo stato (BX, AY). Quindi ciascuno dei due eventi (BX, BY) e (BX, AY) ha probabilità ¼. E così anche nel caso AX: come si vede, la somma delle probabilità dei quattro esiti è uno. Diremo, invece, che le due variabili sono perfettamente correlate se il verificarsi di uno dei due valori di X determina in modo univoco quale valore assumerà la Y. In altri termini, per ogni dato il valore assunto dalla X, la Y può assumere uno solo dei suoi due valori con probabilità uno. Possiamo avere due sotto–casi: le due variabili sono perfettamente correlate in modo positivo se quando una assume il valore basso (alto) anche l’altra assume certamente il valore basso (alto). Oppure le due variabili sono perfettamente correlate in modo negativo se quando una assume il valore basso (alto) l’altra assume invece certamente il valore alto (basso). Capite bene, allora, che in realtà in queste circostanze i fatti possibili del mondo sono solo due: per esempio nel caso di perfetta correlazione positiva abbiamo solo (BX, BY) e (AX, AY). Ne segue che ciascuno dei due casi possibili ha probabilità ½, mentre i casi (BX, AY) e (AX, BY) hanno probabilità zero. Anche qui la somma delle probabilità dei quattro esiti è uno. Naturalmente, i casi sopra analizzati sono casi puri: si avranno casi intermedi quando, noto un esito di X, per esempio il valore basso, la probabilità di un esito di Y, per esempio il valore basso, non sarà esattamente zero (perfetta correlazione negativa), né esattamente ½ (perfetta indipendenza), né esattamente uno (perfetta correlazione positiva). Diversificare il rischio Consideriamo due individui, Rossi e Bianchi, che guadagnano il medesimo reddito monetario, diciamo 100. Entrambi fanno il medesimo lavoro, che richiede l’utilizzo di un automezzo. Durante i loro spostamenti in automobile essi rischiano di provocare incidenti che causano danni a terzi. Supponiamo che il danno che essi possono arrecare sia valutabile in 100, e che la probabilità di provocare un incidente sia ½ per entrambi. Ciascuno dei due si trova allora in una situazione incerta: con probabilità ½ possono avere un reddito di 100, se non causano incidenti, oppure di zero, se causando un incidente devono risarcire il danno provocato. Faremo tre ipotesi alternative circa l’incertezza del mondo in cui vivono Rossi e Bianchi. i) L’evento “Rossi provoca un incidente” accade solo simultaneamente all’evento “Bianchi provoca un incidente”, e lo stesso vale per gli eventi “Rossi non provoca un incidente” e “Bianchi non provoca un incidente”. Ciò è possibile, per esempio, se Rossi e Bianchi sono i soli automobilisti che percorrono la stessa strada. In tali circostanze gli eventi possibili nel nostro mondo sono solo due, “Rossi non provoca un incidente e Bianchi non provoca un incidente” e “Rossi provoca un incidente e Bianchi provoca un incidente”, e ciascuno di questi due eventi ha probabilità ½. Si dice in questo caso che gli incidenti di Rossi e Bianchi sono perfettamente correlati in modo positivo. ii) Il fatto che Rossi provochi o meno un incidente è indipendente dal fatto che Bianchi provochi o meno un incidente, per esempio perché essi frequentano località tra loro distanti. I casi possibili in questo mondo sono dunque quattro, cioè tutte le combinazioni delle diverse possibilità: “Rossi non provoca un incidente e Bianchi non provoca un incidente”; “Rossi non provoca un incidente e Bianchi provoca un incidente”; eccetera. La probabilità di ognuno di questi quattro casi è pari a ¼. iii) L’evento “Rossi provoca un incidente” accade solo simultaneamente all’evento “Bianchi non provoca un incidente”, e lo stesso vale per gli eventi “Rossi non provoca un incidente” e “Bianchi provoca un incidente”. Ciò è possibile, anche se il caso è molto artificiale, se Rossi e Bianchi, lavorando come soci, la mattina estraggono a sorte chi userà l’unica automobile della società ed è certo che l’uso dell’automobile provoca un incidente. In tali circostanze gli eventi possibili nel nostro mondo sono solo due, “Rossi provoca un incidente e Bianchi non provoca un incidente” e “Rossi non provoca un incidente e Bianchi provoca un incidente”. Ciascuno di questi due eventi ha probabilità ½, ma ciò significa che avviene certamente un solo incidente. Si dice in questo caso che gli incidenti di Rossi e Bianchi sono perfettamente correlati in modo negativo. Consideriamo ora Verdi, un assicuratore, che propone a Rossi e Bianchi di assicurarsi. Per semplicità, possiamo pensare che il premio individuale sia pari a 40 e il risarcimento lordo promesso a ciascuno sia pari a 80, cioè il risarcimento al netto del premio sia 80 – 40 = 40. Se Rossi e Bianchi sono sufficientemente più avversi al rischio di Verdi, sappiamo già che è possibile stabilire premi di assicurazione tali per cui il contratto migliora l’utilità attesa sia degli assicurati che dell’assicuratore. Ciò è vero considerando separatamente i rapporti bilaterali fra i due assicurati e l’assicuratore. Ma guardiamo più da vicino la reale posizione di Verdi nei confronti del pool dei suoi assicurati, cioè Rossi e Bianchi congiuntamente. Per poter risarcire gli assicurati egli deve accantonare complessivamente riserve per 80, poiché, pur incassando premi per un valore globale di 80, nel caso più sfavorevole (due incidenti) Verdi deve risarcire somme per un valore complessivo di 160. Le sue prospettive sono diverse a seconda che valga l’ipotesi (i), oppure la (ii), oppure la (iii) di quelle introdotte sopra. Consideriamo separatamente i tre casi. i) Gli incidenti di Rossi e Bianchi sono eventi tra loro perfettamente correlati in modo positivo: Verdi ha una ricchezza iniziale pari a 80 e incassa premi complessivi per 40 + 40 = 80. D’altra parte, con probabilità ½ deve pagare un risarcimento pari a 80 + 80 = 160 se Rossi e Bianchi hanno due incidenti contemporaneamente, e con probabilità ½ non deve pagare nulla se costoro non hanno incidenti. La sua ricchezza finale, dunque, è pari a 80 + 80 – 160=0 con probabilità ½, oppure 80 + 80 = 160 con probabilità ½. La ricchezza finale attesa di Verdi è 80. ii) Gli incidenti di Rossi e Bianchi sono eventi tra loro indipendenti: Verdi continua ad avere una ricchezza iniziale di 80 e a incassare un premio complessivo di 80, ma deve pagare le seguenti somme a titolo di risarcimento: 0 se nessuno provoca incidenti (probabilità ¼); 160 se entrambi provocano un incidente (probabilità ¼); 80 se solo uno solo dei due provoca un incidente, ma poiché esistono due eventi di questo tipo, ciascuno di probabilità ¼, la probabilità complessiva è ½. La ricchezza finale posseduta da Verdi è 80 + 80 = 160 con probabilità ¼; 80 + 80 – 160 = 0 con probabilità ¼; 80 + 80 – 80 = 80 con probabilità ½. Anche in questo caso la ricchezza finale attesa di Verdi è 80. iii) Gli incidenti di Rossi e Bianchi sono eventi tra loro perfettamente correlati in modo negativo: Verdi continua ad avere una ricchezza iniziale di 80 e a incassare un premio complessivo di 80. Però ora, benché la probabilità di un incidente di Rossi oppure uno di Bianchi sia sempre ½, è certo che avvenga un solo incidente. Quindi Verdi, indipendentemente da chi abbia avuto l’incidente, deve pagare un risarcimento pari a 80 con probabilità 1. La sua ricchezza finale, dunque, è 80 + 80 – 80 = 80 con probabilità 1, e ovviamente anche in questo terzo caso la ricchezza finale attesa di Verdi è 80. La cosa importante da osservare è che le tre diverse prospettive hanno implicazioni diverse per il benessere di Verdi. Abbiamo infatti ipotizzato che costui sia avverso al rischio, benché lo sia meno di Rossi e Bianchi, cosa quest’ultima che rende possibile la scrittura di contratti individuali di assicurazione. L’avversione al rischio di Verdi, però, fa sì che le tre prospettive siano progressivamente una più gradita dell’altra per l’assicuratore. Sappiamo infatti che il caso (i) ha varianza superiore al caso (ii), che a sua volta ha varianza superiore al caso (iii). Ciò dipende dal fatto che le variabili casuali “ricchezza finale” dei tre diversi casi, pur avendo gli stessi valori estremi e il medesimo valore atteso, sono tali che cresce sempre più la probabilità che si verifichi l’esito pari al valore atteso, mentre si riduce la probabilità degli esiti estremi. Perciò la varianza si riduce progressivamente, come mostrato nella Fig. 1: lasciamo a voi di verificare il calcolo della varianza dei tre casi. Figura 1 La probabilità della ricchezza finale in tre casi diversi (i) Perfetta correlazione positiva (ii) Indipendenza (iii) Perfetta correlazione negativa livelli della ricchezza 0 80 160 loro probabilità 0 ½ ½ ¼ ½ ¼ 0 1 0 valore atteso 80 80 80 varianza 6.400 3.200 0 Dunque l’utilità attesa di Verdi, avverso al rischio, è inferiore nel caso (i) rispetto al caso (ii), ed è inferiore nel caso (ii) rispetto al caso (iii). Dunque è preferibile assicurare soggetti i cui rischi sono tra loro indipendenti rispetto a soggetti i cui rischi sono correlati positivamente, ed è preferibile assicurare soggetti i cui rischi sono addirittura correlati negativamente rispetto a soggetti i cui rischi sono tra loro indipendenti. Il caso di perfetta correlazione negativa, il più favorevole all’assicuratore, è talora chiamato in gergo contro– assicurazione: da una parte l’assicuratore Verdi protegge Rossi assicurandolo, ma dall’altra protegge poi se stesso assicurando anche Bianchi il cui rischio va in direzione opposta a quella di Rossi. In un certo senso la posizione di Bianchi contro–assicura Verdi nei confronti dei rischi di Rossi, che Verdi stesso si è assunto in parte. Questo caso, anche per come l’abbiamo giustificato nell’ipotesi (iii) di cui sopra, potrebbe apparire del tutto teorico e di difficile riscontro empirico: il meglio che possa capitare all’assicuratore sembrerebbe essere il caso di indipendenza tra i rischi degli assicurati. È tuttavia facile intuire che, se il numero di assicurati con rischi indipendenti aumenta, la varianza diminuisce progressivamente e la situazione diviene simile al caso di perfetta correlazione negativa. Infatti, per un fenomeno che in statistica prende il nome di legge dei grandi numeri, se avesse un numero molto elevato di assicurati l’assicuratore dovrebbe pagare ogni anno risarcimenti pari ad una somma praticamente fissa. Questa somma è data dall’ammontare del risarcimento individuale, moltiplicato per il numero degli assicurati, moltiplicato ancora per la probabilità degli incidenti. Accade lo stesso fenomeno per cui, lanciando moltissime volte una moneta, il numero effettivo di volte in cui esce testa in rapporto ai casi possibili diviene sempre più simile alla probabilità dell’esito testa. Per l’assicuratore non vi sarebbe allora alcuna incertezza, ed egli si troverebbe nella posizione per lui ottima, sempre posto che sia avverso al rischio. Tutto ciò significa semplicemente che, quando l’assicuratore si trova di fronte a rischi indipendenti o ha addirittura la possibilità di contro–assicurarsi tramite un numero molto elevato di contraenti, l’incertezza a cui si sottopone si riduce. Dunque l’assicuratore, essendo avverso al rischio, si accontenterebbe di una ricchezza finale attesa inferiore. In altri termini egli sarebbe disposto a far pagare premi inferiori, poiché anche ottenendo premi inferiori egli riuscirebbe a compensare il rischio di cui si carica facendo il suo mestiere. Abbiamo mostrato due aspetti molto rilevanti del mondo delle assicurazioni. Da un lato, è saggia politica per un assicuratore quella di diversificare al massimo il rischio; dall’altro lato, una regolazione pubblica che rendesse obbligatorio per tutti i soggetti assicurarsi contro un dato evento incerto potrebbe aumentare il benessere sociale, in quanto farebbe aumentare il numero degli assicurati. Infatti, se vi è avversione al rischio ciò consentirebbe di aumentare il benessere di ciascun individuo rispetto a una situazione nella quale non vi fosse la possibilità di assicurarsi, e i premi assicurativi potrebbero essere più bassi per chiunque senza disincentivare l’assicuratore. Osserviamo in chiusura che molti problemi diffusi nella società si prestano ad una soluzione di tipo assicurativo. Un lavoratore potrebbe essere incerto se nel futuro avrà ancora il suo lavoro oppure sarà licenziato, cosa che implica un’incertezza sul suo reddito futuro. Il lavoratore, quindi, potrebbe essere disposto a versare ogni anno un contributo al fondo disoccupazione (o al fondo cassa integrazione) per ricevere un sussidio se sarà disoccupato (o sarà in cassa integrazione). In alternativa il lavoratore potrebbe accettare un salario stabile ma inferiore a quello che potrebbe ottenere negli anni di buona riuscita dell’impresa, in cambio della promessa che non sarà licenziato negli anni di magra. Un individuo potrebbe essere incerto sul proprio stato di salute futuro, che di nuovo potrebbe implicare abbandono del lavoro e mancanza di reddito, e potrebbe essere disposto a pagare un contributo al fondo malattia per ricevere un’indennità quando dovrà assentarsi. Si immagini infine il seguente caso. Un soggetto sta accumulando risparmi per potersi sostenere anche nella parte della vita in cui non lavorerà più, per un periodo residuo atteso che dipende dalla lunghezza media della vita e dall’età di pensionamento. Potrebbe però capitargli il caso “sfortunato” di vivere più a lungo della vita media, e dunque non avere accumulato risorse sufficienti. Allora gli potrebbe convenire consorziarsi con molti altri in un fondo pensione, dove i rischi indipendenti dei partecipanti si diluiscono nell’aggregato: i contributi versati da chi vive meno compensano le esigenze di chi vive più a lungo, e i contributi individuali possono essere più bassi di quanto accade se ciascuno deve cautelarsi da solo rispetto alle esigenze di una vita lunga.