Correlazione tra variabili casuali Possiamo generalizzare un poco il

Transcript

Correlazione tra variabili casuali Possiamo generalizzare un poco il
Correlazione tra variabili casuali
Possiamo generalizzare un poco il nostro punto di vista sull’incertezza, e immaginare mondi in cui i possibili
fatti sono descritti dal valore congiunto di due variabili casuali. Ogni possibile fatto, cioè, è descritto
esaustivamente solo se vengono comunicati i valori di entrambe le variabili, per esempio la quotazione in
borsa del titolo X e contemporaneamente la quotazione del titolo Y. Ora tuttavia entrambe le variabili sono
casuali, e dunque qualsiasi quotazione congiunta dei due titoli è essa stessa un fatto casuale. Le possibili
quotazioni congiunte potrebbero essere rappresentate, come al solito, da punti in un piano cartesiano. Inoltre,
se potessimo sapere che le quotazioni ammissibili di ciascun titolo non possono mai essere inferiori a zero né
eccedere certi estremi, per esempio MAXX e MAXY, allora i soli fatti possibili di questo mondo si situerebbero
in un rettangolo nel piano cartesiano, con un vertice nell’origine e il vertice opposto nel punto che ha
coordinate MAXX e MAXY. Poiché si tratta di fatti casuali, tutti i punti fuori da tale rettangolo avrebbero
probabilità pari a zero, mentre la somma delle probabilità di tutti i punti del rettangolo è uno.
Ognuna delle due quotazioni è una variabile casuale, ed è caratterizzata da certi valori sintetici come il valore
atteso e la varianza. Tuttavia potremmo sfruttare il fatto di essere in un mondo bidimensionale, e cercare di
studiare se esiste qualche relazione tra le due quotazioni. Potremmo cioè cercare di capire se, ipotizzando di
conoscere il valore assunto da una delle due quotazioni, ciò ci dia informazioni sulla probabilità dei valori
dell’altra quotazione. Questo studio si chiama studio della correlazione fra le due variabili casuali.
Intuitivamente, dire che le due quotazioni sono correlate tra loro significa che i punti che le rappresentano
nel piano cartesiano tendono ad “accumularsi” in certe aree del rettangolo di cui parlavamo prima: per ogni
possibile quotazione X, le possibili quotazioni Y assumono prevalentemente certi valori e non altri. Se,
addirittura, per ogni possibile valore di X avessimo un solo valore possibile di Y, saremmo nel caso di grafico
di una relazione deterministica: una linea. Viceversa, se le due quotazioni non sono correlate osserveremo
punti sparsi uniformemente in tutto il rettangolo. Qui non ci concentriamo però sull’analisi grafica, bensì
consideriamo un caso semplice.
Supponiamo che le due quotazioni, cioè variabili casuali, X e Y possano assumere ciascuna due soli valori,
basso e alto: avremo allora per X i valori BX e AX, e per Y i valori BY e AY. Presa separatamente, ciascuna
variabile ha esiti equi–probabili, cioè le probabilità dei suoi due valori sono pari a ½. Ma, considerando
congiuntamente le due quotazioni, i possibili fatti del mondo sono quattro, che potremmo indicare come
segue: (BX, BY), (AX, BY), (BX, AY), (AX, AY). Si tratta di quattro eventi casuali del più ampio mondo a due
variabili, cosicché ciascuno avrà una sua probabilità in quel mondo; siccome essi sono i soli possibili esiti in
tale mondo, la somma delle loro quattro probabilità deve essere pari ad uno.
Diremo che le due variabili sono non correlate, o indipendenti, se il verificarsi di uno dei due valori di X non
influenza la probabilità degli esiti di Y. Quindi, qualsiasi sia il valore di X, le probabilità di BY e AY
continuano ed essere ½. Ma i due valori possibili di X hanno di per sé probabilità ½ ciascuno; dunque la
probabilità di ognuno dei quattro eventi congiunti (BX, BY), (AX, BY), (BX, AY), (AX, AY) deve essere ¼, il
prodotto di ½ per ½. Infatti, dire per esempio che X assuma il valore BX, evento che di per sé ha probabilità
½, lascia ancora aperte per l’altra variabile le due possibilità BY e AY, ciascuna delle quali a sua volta ha
probabilità ½ di accadere. In altri termini, in un mondo a due variabili X e Y, la frase “X vale BX” significa
che può prevalere lo stato (BX, BY) oppure lo stato (BX, AY). Quindi ciascuno dei due eventi (BX, BY) e (BX, AY)
ha probabilità ¼. E così anche nel caso AX: come si vede, la somma delle probabilità dei quattro esiti è uno.
Diremo, invece, che le due variabili sono perfettamente correlate se il verificarsi di uno dei due valori di X
determina in modo univoco quale valore assumerà la Y. In altri termini, per ogni dato il valore assunto dalla
X, la Y può assumere uno solo dei suoi due valori con probabilità uno. Possiamo avere due sotto–casi: le due
variabili sono perfettamente correlate in modo positivo se quando una assume il valore basso (alto) anche
l’altra assume certamente il valore basso (alto). Oppure le due variabili sono perfettamente correlate in modo
negativo se quando una assume il valore basso (alto) l’altra assume invece certamente il valore alto (basso).
Capite bene, allora, che in realtà in queste circostanze i fatti possibili del mondo sono solo due: per esempio
nel caso di perfetta correlazione positiva abbiamo solo (BX, BY) e (AX, AY). Ne segue che ciascuno dei due casi
possibili ha probabilità ½, mentre i casi (BX, AY) e (AX, BY) hanno probabilità zero. Anche qui la somma delle
probabilità dei quattro esiti è uno.
Naturalmente, i casi sopra analizzati sono casi puri: si avranno casi intermedi quando, noto un esito di X, per
esempio il valore basso, la probabilità di un esito di Y, per esempio il valore basso, non sarà esattamente zero
(perfetta correlazione negativa), né esattamente ½ (perfetta indipendenza), né esattamente uno (perfetta
correlazione positiva).
Diversificare il rischio
Consideriamo due individui, Rossi e Bianchi, che guadagnano il medesimo reddito monetario, diciamo 100.
Entrambi fanno il medesimo lavoro, che richiede l’utilizzo di un automezzo. Durante i loro spostamenti in
automobile essi rischiano di provocare incidenti che causano danni a terzi. Supponiamo che il danno che essi
possono arrecare sia valutabile in 100, e che la probabilità di provocare un incidente sia ½ per entrambi.
Ciascuno dei due si trova allora in una situazione incerta: con probabilità ½ possono avere un reddito di 100,
se non causano incidenti, oppure di zero, se causando un incidente devono risarcire il danno provocato.
Faremo tre ipotesi alternative circa l’incertezza del mondo in cui vivono Rossi e Bianchi.
i) L’evento “Rossi provoca un incidente” accade solo simultaneamente all’evento “Bianchi provoca un
incidente”, e lo stesso vale per gli eventi “Rossi non provoca un incidente” e “Bianchi non provoca un
incidente”. Ciò è possibile, per esempio, se Rossi e Bianchi sono i soli automobilisti che percorrono la stessa
strada. In tali circostanze gli eventi possibili nel nostro mondo sono solo due, “Rossi non provoca un
incidente e Bianchi non provoca un incidente” e “Rossi provoca un incidente e Bianchi provoca un
incidente”, e ciascuno di questi due eventi ha probabilità ½. Si dice in questo caso che gli incidenti di Rossi e
Bianchi sono perfettamente correlati in modo positivo.
ii) Il fatto che Rossi provochi o meno un incidente è indipendente dal fatto che Bianchi provochi o meno un
incidente, per esempio perché essi frequentano località tra loro distanti. I casi possibili in questo mondo sono
dunque quattro, cioè tutte le combinazioni delle diverse possibilità: “Rossi non provoca un incidente e
Bianchi non provoca un incidente”; “Rossi non provoca un incidente e Bianchi provoca un incidente”;
eccetera. La probabilità di ognuno di questi quattro casi è pari a ¼.
iii) L’evento “Rossi provoca un incidente” accade solo simultaneamente all’evento “Bianchi non provoca un
incidente”, e lo stesso vale per gli eventi “Rossi non provoca un incidente” e “Bianchi provoca un incidente”.
Ciò è possibile, anche se il caso è molto artificiale, se Rossi e Bianchi, lavorando come soci, la mattina
estraggono a sorte chi userà l’unica automobile della società ed è certo che l’uso dell’automobile provoca un
incidente. In tali circostanze gli eventi possibili nel nostro mondo sono solo due, “Rossi provoca un incidente
e Bianchi non provoca un incidente” e “Rossi non provoca un incidente e Bianchi provoca un incidente”.
Ciascuno di questi due eventi ha probabilità ½, ma ciò significa che avviene certamente un solo incidente. Si
dice in questo caso che gli incidenti di Rossi e Bianchi sono perfettamente correlati in modo negativo.
Consideriamo ora Verdi, un assicuratore, che propone a Rossi e Bianchi di assicurarsi. Per semplicità,
possiamo pensare che il premio individuale sia pari a 40 e il risarcimento lordo promesso a ciascuno sia pari
a 80, cioè il risarcimento al netto del premio sia 80 – 40 = 40. Se Rossi e Bianchi sono sufficientemente più
avversi al rischio di Verdi, sappiamo già che è possibile stabilire premi di assicurazione tali per cui il
contratto migliora l’utilità attesa sia degli assicurati che dell’assicuratore.
Ciò è vero considerando separatamente i rapporti bilaterali fra i due assicurati e l’assicuratore. Ma guardiamo
più da vicino la reale posizione di Verdi nei confronti del pool dei suoi assicurati, cioè Rossi e Bianchi
congiuntamente. Per poter risarcire gli assicurati egli deve accantonare complessivamente riserve per 80,
poiché, pur incassando premi per un valore globale di 80, nel caso più sfavorevole (due incidenti) Verdi deve
risarcire somme per un valore complessivo di 160. Le sue prospettive sono diverse a seconda che valga
l’ipotesi (i), oppure la (ii), oppure la (iii) di quelle introdotte sopra. Consideriamo separatamente i tre casi.
i) Gli incidenti di Rossi e Bianchi sono eventi tra loro perfettamente correlati in modo positivo: Verdi ha una
ricchezza iniziale pari a 80 e incassa premi complessivi per 40 + 40 = 80. D’altra parte, con probabilità ½
deve pagare un risarcimento pari a 80 + 80 = 160 se Rossi e Bianchi hanno due incidenti
contemporaneamente, e con probabilità ½ non deve pagare nulla se costoro non hanno incidenti. La sua
ricchezza finale, dunque, è pari a 80 + 80 – 160=0 con probabilità ½, oppure 80 + 80 = 160 con probabilità
½. La ricchezza finale attesa di Verdi è 80.
ii) Gli incidenti di Rossi e Bianchi sono eventi tra loro indipendenti: Verdi continua ad avere una ricchezza
iniziale di 80 e a incassare un premio complessivo di 80, ma deve pagare le seguenti somme a titolo di
risarcimento: 0 se nessuno provoca incidenti (probabilità ¼); 160 se entrambi provocano un incidente
(probabilità ¼); 80 se solo uno solo dei due provoca un incidente, ma poiché esistono due eventi di questo
tipo, ciascuno di probabilità ¼, la probabilità complessiva è ½. La ricchezza finale posseduta da Verdi è 80 +
80 = 160 con probabilità ¼; 80 + 80 – 160 = 0 con probabilità ¼; 80 + 80 – 80 = 80 con probabilità ½.
Anche in questo caso la ricchezza finale attesa di Verdi è 80.
iii) Gli incidenti di Rossi e Bianchi sono eventi tra loro perfettamente correlati in modo negativo: Verdi
continua ad avere una ricchezza iniziale di 80 e a incassare un premio complessivo di 80. Però ora, benché la
probabilità di un incidente di Rossi oppure uno di Bianchi sia sempre ½, è certo che avvenga un solo
incidente. Quindi Verdi, indipendentemente da chi abbia avuto l’incidente, deve pagare un risarcimento pari
a 80 con probabilità 1. La sua ricchezza finale, dunque, è 80 + 80 – 80 = 80 con probabilità 1, e ovviamente
anche in questo terzo caso la ricchezza finale attesa di Verdi è 80.
La cosa importante da osservare è che le tre diverse prospettive hanno implicazioni diverse per il benessere
di Verdi. Abbiamo infatti ipotizzato che costui sia avverso al rischio, benché lo sia meno di Rossi e Bianchi,
cosa quest’ultima che rende possibile la scrittura di contratti individuali di assicurazione. L’avversione al
rischio di Verdi, però, fa sì che le tre prospettive siano progressivamente una più gradita dell’altra per
l’assicuratore. Sappiamo infatti che il caso (i) ha varianza superiore al caso (ii), che a sua volta ha varianza
superiore al caso (iii). Ciò dipende dal fatto che le variabili casuali “ricchezza finale” dei tre diversi casi, pur
avendo gli stessi valori estremi e il medesimo valore atteso, sono tali che cresce sempre più la probabilità che
si verifichi l’esito pari al valore atteso, mentre si riduce la probabilità degli esiti estremi. Perciò la varianza si
riduce progressivamente, come mostrato nella Fig. 1: lasciamo a voi di verificare il calcolo della varianza dei
tre casi.
Figura 1
La probabilità della ricchezza finale in tre casi diversi
(i) Perfetta correlazione positiva
(ii) Indipendenza
(iii) Perfetta correlazione negativa
livelli della ricchezza
0
80
160
loro probabilità
0
½
½
¼
½
¼
0
1
0
valore
atteso
80
80
80
varianza
6.400
3.200
0
Dunque l’utilità attesa di Verdi, avverso al rischio, è inferiore nel caso (i) rispetto al caso (ii), ed è inferiore
nel caso (ii) rispetto al caso (iii). Dunque è preferibile assicurare soggetti i cui rischi sono tra loro
indipendenti rispetto a soggetti i cui rischi sono correlati positivamente, ed è preferibile assicurare soggetti i
cui rischi sono addirittura correlati negativamente rispetto a soggetti i cui rischi sono tra loro indipendenti.
Il caso di perfetta correlazione negativa, il più favorevole all’assicuratore, è talora chiamato in gergo contro–
assicurazione: da una parte l’assicuratore Verdi protegge Rossi assicurandolo, ma dall’altra protegge poi se
stesso assicurando anche Bianchi il cui rischio va in direzione opposta a quella di Rossi. In un certo senso la
posizione di Bianchi contro–assicura Verdi nei confronti dei rischi di Rossi, che Verdi stesso si è assunto in
parte.
Questo caso, anche per come l’abbiamo giustificato nell’ipotesi (iii) di cui sopra, potrebbe apparire del tutto
teorico e di difficile riscontro empirico: il meglio che possa capitare all’assicuratore sembrerebbe essere il
caso di indipendenza tra i rischi degli assicurati. È tuttavia facile intuire che, se il numero di assicurati con
rischi indipendenti aumenta, la varianza diminuisce progressivamente e la situazione diviene simile al caso di
perfetta correlazione negativa. Infatti, per un fenomeno che in statistica prende il nome di legge dei grandi
numeri, se avesse un numero molto elevato di assicurati l’assicuratore dovrebbe pagare ogni anno
risarcimenti pari ad una somma praticamente fissa. Questa somma è data dall’ammontare del risarcimento
individuale, moltiplicato per il numero degli assicurati, moltiplicato ancora per la probabilità degli incidenti.
Accade lo stesso fenomeno per cui, lanciando moltissime volte una moneta, il numero effettivo di volte in
cui esce testa in rapporto ai casi possibili diviene sempre più simile alla probabilità dell’esito testa. Per
l’assicuratore non vi sarebbe allora alcuna incertezza, ed egli si troverebbe nella posizione per lui ottima,
sempre posto che sia avverso al rischio.
Tutto ciò significa semplicemente che, quando l’assicuratore si trova di fronte a rischi indipendenti o ha
addirittura la possibilità di contro–assicurarsi tramite un numero molto elevato di contraenti, l’incertezza a
cui si sottopone si riduce. Dunque l’assicuratore, essendo avverso al rischio, si accontenterebbe di una
ricchezza finale attesa inferiore. In altri termini egli sarebbe disposto a far pagare premi inferiori, poiché
anche ottenendo premi inferiori egli riuscirebbe a compensare il rischio di cui si carica facendo il suo
mestiere.
Abbiamo mostrato due aspetti molto rilevanti del mondo delle assicurazioni. Da un lato, è saggia politica per
un assicuratore quella di diversificare al massimo il rischio; dall’altro lato, una regolazione pubblica che
rendesse obbligatorio per tutti i soggetti assicurarsi contro un dato evento incerto potrebbe aumentare il
benessere sociale, in quanto farebbe aumentare il numero degli assicurati. Infatti, se vi è avversione al rischio
ciò consentirebbe di aumentare il benessere di ciascun individuo rispetto a una situazione nella quale non vi
fosse la possibilità di assicurarsi, e i premi assicurativi potrebbero essere più bassi per chiunque senza
disincentivare l’assicuratore.
Osserviamo in chiusura che molti problemi diffusi nella società si prestano ad una soluzione di tipo
assicurativo.
Un lavoratore potrebbe essere incerto se nel futuro avrà ancora il suo lavoro oppure sarà licenziato, cosa che
implica un’incertezza sul suo reddito futuro. Il lavoratore, quindi, potrebbe essere disposto a versare ogni
anno un contributo al fondo disoccupazione (o al fondo cassa integrazione) per ricevere un sussidio se sarà
disoccupato (o sarà in cassa integrazione). In alternativa il lavoratore potrebbe accettare un salario stabile ma
inferiore a quello che potrebbe ottenere negli anni di buona riuscita dell’impresa, in cambio della promessa
che non sarà licenziato negli anni di magra. Un individuo potrebbe essere incerto sul proprio stato di salute
futuro, che di nuovo potrebbe implicare abbandono del lavoro e mancanza di reddito, e potrebbe essere
disposto a pagare un contributo al fondo malattia per ricevere un’indennità quando dovrà assentarsi. Si
immagini infine il seguente caso. Un soggetto sta accumulando risparmi per potersi sostenere anche nella
parte della vita in cui non lavorerà più, per un periodo residuo atteso che dipende dalla lunghezza media della
vita e dall’età di pensionamento. Potrebbe però capitargli il caso “sfortunato” di vivere più a lungo della vita
media, e dunque non avere accumulato risorse sufficienti. Allora gli potrebbe convenire consorziarsi con
molti altri in un fondo pensione, dove i rischi indipendenti dei partecipanti si diluiscono nell’aggregato: i
contributi versati da chi vive meno compensano le esigenze di chi vive più a lungo, e i contributi individuali
possono essere più bassi di quanto accade se ciascuno deve cautelarsi da solo rispetto alle esigenze di una
vita lunga.