Valori Estremi e Analisi dei Rischi Ambientali

Transcript

Valori Estremi e Analisi dei Rischi Ambientali
Valori Estremi e Analisi dei Rischi Ambientali
Tratto da Sis-Magazine
http://old.sis-statistica.org/magazine
Valori Estremi e Analisi dei
Rischi Ambientali
- Articoli -
Data di pubblicazione : venerdì 13 maggio 2011
Sis-Magazine
Copyright © Sis-Magazine
Page 1/5
Valori Estremi e Analisi dei Rischi Ambientali
Introduzione
Con il termine eventi estremi o rari ci si riferisce a quei fenomeni che accadono di rado o con bassa frequenza
come ad esempio i terremoti, le alluvioni, il crollo dei mercati finanziari, ecc. La teoria probabilistica che si occupa di
questi fenomeni ha lo scopo di sviluppare metodi e modelli matematici per lanalisi e la descrizione dell insolito
piuttosto che del solito. Utilizzando i dati storici si vuole quindi determinare una stima della probabilità con cui
fenomeni inconsueti possono verificarsi. La comunità scientifica ha iniziato a studiare gli eventi estremi a causa degli
enormi impatti che alcuni fenomeni naturali avversi possono avere sulla società. Questi fenomeni naturali hanno
causato diversi morti ed ingenti danni strutturali con conseguenti perdite economiche per le città e i paesi colpiti.
Pertanto, è cruciale cercare metodi per predire queste calamità. I primi studi scientifici sui valori estremi risalgono alla
prima parte del ventesimo secolo, ma è solo negli anni quaranta che dei veri e propri modelli sono impiegati per
lanalisi di fenomeni fisici reali. Uno dei pionieri è stato il matematico tedesco Emil Gumbel che nel suo articolo del
1941 (Gumbel, 1941) ha pubblicato una delle prime applicazioni in ambito idrologico. La teoria dei valori estremi si è
affermata nel tempo e ha conseguito un notevole successo proprio in campo ingegneristico civile. Tuttavia negli
ultimi anni lanalisi dei valori estremi si sta affermando come un utile metodo di ricerca in molte altre discipline e
scienze applicate come ad esempio: in finanza per la valutazione del rischio di mercato, nelle telecomunicazioni per
la predizione del traffico di trasmissione, nel settore assicurativo per la regolazione del portafoglio, ecc.
Concetti di Base
Uno degli obiettivi primari della teoria dei valori estremi è la quantificazione del comportamento di un fenomeno
aleatorio quando questo assume dei valori insolitamente grandi o piccoli, e stimare quindi la probabilità di eventi
ancora più grandi (o piccoli) di quelli che sono già stati osservati. Per illustrare in modo semplice alcuni concetti di
base sugli estremi presentiamo il seguente esempio.
È noto che buona parte della città di Venezia si trova sotto il livello del mare. A causa del fenomeno dell acqua alta
in alcuni periodi dellanno la marea arriva a sommergere la città, anche fino al 90%. Nella seconda metà del secolo
scorso, e in particolare negli anni: 1966, 1970, 2001 e 2004, si sono verificati i casi più eccezionali con i livelli del
mare che hanno raggiunto i 190 cm circa. Supponiamo che il governo desideri proteggere Venezia dalle inondazioni
tramite linstallazione di alcune dighe di protezione. Valutando un bilancio tra costi di realizzazione e la sicurezza
auspicata, si decide che laltezza delle dighe dovrebbe essere tale da rendere la probabilità di un inondazione in un
qualsiasi anno pari a 103 . Il quesito finale consiste nel determinare laltezza massima delle dighe da costruire in
modo da soddisfare la richiesta.
Sono disponibili diverse serie temporali dei livelli del mare, si veda ad esempio Pirazzoli (1982), ma anche il sito
http://www.istitutoveneto.it/venezi.... Combinando queste due serie temporali si ottiene una sequenza di misurazioni
per un periodo approssimativamente lungo 100 anni. Tuttavia, la probabilità fissata si riferisce a un evento che
accade una volta ogni 1000 anni, e sembrerebbe necessario avere molto più di 100 anni di dati per stimare un tal
evento, ad esempio se si usasse la cumulata empirica. Il problema sembra apparentemente impossibile da risolvere,
ma la teoria dei valori estremi fornisce una base teorica e metodologica per calcolare la probabilità dellevento
richiesto.
Copyright © Sis-Magazine
Page 2/5
Valori Estremi e Analisi dei Rischi Ambientali
Figura 1: Livelli delle marea della citta di Venezia: il grafico di sinistra mostra il livello medio giornaliero in cm dal
1983 al 2010 misurato a Punta della Salute. Il grafico di destra mostra il valore massimo annuo in cm dal 1931 al
2010 unendo la serie di Punta della Salute e quella proposta da Pirazzoli.
In linea generale, la teoria dei valori estremi studia il comportamento delle code della distribuzione di probabilità
(dora in poi, per brevità distribuzione) del fenomeno. Questo corrisponde a operare con una classe di distribuzioni
ottenuta come limite, i cui parametri possono essere stimati dai dati delle code. Con la teoria dei valori estremi sono
disponibili quindi degli stimatori naturali per quantità rilevanti come i quantili estremi dellesempio e inoltre è possibile
valutare laccuratezza di questi stimatori. Il paradigma dei valori estremi, nel semplice caso univariato, funziona come
segue. Supponiamo che X1, X2, . . . sia la sequenza dei livelli orari della marea, per un certo periodo temporale di t
osservazioni, chiamato blocco. Se ne consideri il valore massimo e si indichi tale massimo con Mt = max(X1, . . . , X
t). Un esempio classico è il massimo annuale, in questo caso la marea massima registrata nellarco di un anno o 365
(366) × 24 osservazioni orarie. Si osservi sul grafico di destra di figura 1 la sequenza di massimi annuali ottenuta dai
dati disponibili. Se fosse nota la distribuzione delle Xi e si trattasse di una successione indipendente, allora saremo in
grado di derivare anche quella di Mt. Questo però non succede spesso nelle applicazioni. Unalterativa a questo
inconveniente è fornito dalla teoria dei valori estremi. Se la successione rispetta alcune condizioni non troppo
restrittive e il numero di osservazioni orarie in un anno è sufficientemente grande da giustificare i risultati asintotici,
allora essa stabilisce unapprossimazione della distribuzione per Mt. Questo risultato fornisce un modello, anche se
approssimato, utile in pratica per la stima fuori campione dei livelli non osservati della marea. Valutare il livello
dellapprossimazione fornita da un modello è importante e andrebbe sempre fatto (si vedano ad esempio Leadbetter,
Lindgren e Rootzen (1983) e Reiss (1989) per approfondimenti).
Nel caso univariato, la classe di modelli probabilistici usata per descrivere i valori estremi di un certo fenomeno
aleatorio prende il nome di distribuzione generalizzata dei valori estremi. In termini generali, se si indica con Y la
variabile aleatoria ottenuta come limite di Mt (si rinvia a Leadbetter, Lindgren e Rootzen, 1983, per i dettagli) allora,
quale che sia la distribuzione di Xt, quasi sempre la distribuzione di Y apparterrà alla famiglia generalizzata di
modelli per i valori estremi che ha espressione:
Copyright © Sis-Magazine
Page 3/5
Valori Estremi e Analisi dei Rischi Ambientali
dove (x)+ = max(x,0) e ¼, Ã e ¾ sono i parametri della distribuzione che rappresentano rispettivamente la posizione
la scala e la forma della distribuzione stessa. Questa classe di modelli raggruppa tre distribuzioni note e molto
utilizzate in statistica. Le distribuzioni sono: la Fr echet quando ¾ > 0, la Weibull quando ¾ < 0 e la Gumbel ottenuta
come limite per ¾ ’ . In precedenza si è utilizzato il termine quasi perchè esistono dei contro esempi dove alcune
distribuzioni sottostanti non convergono ad alcuna distribuzione limite.
Riprendendo lesempio delle maree di Venezia, a partire dalle serie delle mareeorarie X1, X2, ...
,siricavalasequenzadeimassimiannualiindicata per semplicità da
Y1, Y2, .... Con questultima si possono stimare
i parametri ¼, Ã e ¾ del modello generalizzato dei valori estremi. Allora, invertendo lequazione
dove lespressione delle distribuzione è definita in (1), si può ottenere una stima di:
La quantità yp è chiamato livello di ritorno associato al periodo di ritorno T = 1/p. Il livello di ritorno rappresenta quel
valore che è superato dal massimo annuale in ogni anno con probabilità p o in termini più generali è quel valore che
ci si aspetta sia superato dal massimo annuale in media ogni T anni. Con la stima del livello di ritorno, si può anche
calcolare una misura dellincertezza o variabilità della stima anchessa valutabile in pratica attraverso i dati disponibili
(si rinvia per i dettagli al testo di Coles, 2001). Con i dati di Venezia, si ottiene ad esempio in corrispondenza a un
periodo di ritorno di 50 anni una stima puntuale del livello di ritorno della marea pari a 167 cm. Questa stima
soggetta a variabilità e per questo si è calcolato anche una stima di valori plausibili detta stima intervallare.
Figura 2: Stime dei valori di ritorno della marea: la curva di sinistra illustra delle stime verosimili di livelli di ritorno
corrispondenti ad un periodo di ritorno di 50 anni. Il valore massimo della curva, pari a 167 cm, coincide con la stima
più verosimile del livello di ritorno. Le linee verticali tratteggiate rappresentano gli estremi (158, 183) cm di un
intervallo di confidenza per il livello di ritorno con livello di fiducia 0.95. La curva di destra rappresenta delle stime dei
livelli di ritorno al variare del periodo di ritorno. Le curve tratteggiate descrivono un intervallo di confidenza puntuale
del livello di ritorno con livello di fiducia 0.95. I punti simboleggiano i quantili empirici dei livelli osservati della marea.
Lincrocio tra le linee (verticale ed orizzontale) tratteggiate rappresenta una stima del livello di ritorno, pari a 194 cm,
corrispondente ad un periodo di ritorno di 1000 anni.
Copyright © Sis-Magazine
Page 4/5
Valori Estremi e Analisi dei Rischi Ambientali
Il grafico di sinistra di figura 2 illustra un intervallo di livelli di ritorno verosimili della marea. In particolare, con un
livello di fiducia del 95%, si è ottenuto un intervallo di confidenza con estremo inferiore pari a 158 cm ed estremo
superiore pari a 183 cm. Del valore di ritorno si può anche calcolare una curva di valori stimati al variare del periodo
di ritorno come illustrato dal grafico di destra della figura 2. La linea intera rappresenta le stime dei valori più
verosimili mentre le curve tratteggiate rappresentano gli intervalli di confidenza puntuali corrispondenti a un livello di
fiducia del 95%. In conclusione per rispondere al quesito iniziale sullaltezza delle dighe, con un periodo di ritorno di
1000 anni si stima un valore di ritorno della marea pari 194 cm. Perciò per proteggere la città di Venezia da tutte le
possibili maree da qui a 1000 anni si dovrebbe costruire delle dighe con unaltezza di circa 2 m.
Terminiamo ricordando che abbiamo presentato un esempio illustrativo senza pretendere di fornire una soluzione
completa del problema. Ricordiamo infine che la teoria dei valori estremi può aiutare a predire i fenomeni naturali
avversi, ma per limitarne i danni serve unattenta valutazione del rischio e servono delle caute decisioni da parte
delluomo.
Per saperne di più
Coles, S. G. (2001). An Introduction to Statistical Modeling of Extreme Values. London: Springer.
Gumbel, E. J. (1941). The return period of flood flows, Ann. Math. Statist. 6 12, 163190
Leadbetter, M. R., Lindgren, G. e Rootzen, H. (1983). Extremes and Related Properties of Random Sequences and
Series. New York: Springer.
Pirazzoli, P.(1982). Maree estreme a Venezia (periodo 18721981). Acqua e Aria, 10, 10231039.
Reiss, R. D. (1989). Approximate distributions of order statistics: With applications to nonparametric statistics. New
York: SpringerVerlag. 7
L'autore
S.A. Padoan, (simone.padoan __AT__ unibg.it)
Department of Information Technology and Mathematical Methods, Viale Marconi 5, 24044, Dalmine, Bergamo,
University of Bergamo.
Copyright © Sis-Magazine
Page 5/5