Valori Estremi e Analisi dei Rischi Ambientali
Transcript
Valori Estremi e Analisi dei Rischi Ambientali
Valori Estremi e Analisi dei Rischi Ambientali Tratto da Sis-Magazine http://old.sis-statistica.org/magazine Valori Estremi e Analisi dei Rischi Ambientali - Articoli - Data di pubblicazione : venerdì 13 maggio 2011 Sis-Magazine Copyright © Sis-Magazine Page 1/5 Valori Estremi e Analisi dei Rischi Ambientali Introduzione Con il termine eventi estremi o rari ci si riferisce a quei fenomeni che accadono di rado o con bassa frequenza come ad esempio i terremoti, le alluvioni, il crollo dei mercati finanziari, ecc. La teoria probabilistica che si occupa di questi fenomeni ha lo scopo di sviluppare metodi e modelli matematici per lanalisi e la descrizione dell insolito piuttosto che del solito. Utilizzando i dati storici si vuole quindi determinare una stima della probabilità con cui fenomeni inconsueti possono verificarsi. La comunità scientifica ha iniziato a studiare gli eventi estremi a causa degli enormi impatti che alcuni fenomeni naturali avversi possono avere sulla società. Questi fenomeni naturali hanno causato diversi morti ed ingenti danni strutturali con conseguenti perdite economiche per le città e i paesi colpiti. Pertanto, è cruciale cercare metodi per predire queste calamità. I primi studi scientifici sui valori estremi risalgono alla prima parte del ventesimo secolo, ma è solo negli anni quaranta che dei veri e propri modelli sono impiegati per lanalisi di fenomeni fisici reali. Uno dei pionieri è stato il matematico tedesco Emil Gumbel che nel suo articolo del 1941 (Gumbel, 1941) ha pubblicato una delle prime applicazioni in ambito idrologico. La teoria dei valori estremi si è affermata nel tempo e ha conseguito un notevole successo proprio in campo ingegneristico civile. Tuttavia negli ultimi anni lanalisi dei valori estremi si sta affermando come un utile metodo di ricerca in molte altre discipline e scienze applicate come ad esempio: in finanza per la valutazione del rischio di mercato, nelle telecomunicazioni per la predizione del traffico di trasmissione, nel settore assicurativo per la regolazione del portafoglio, ecc. Concetti di Base Uno degli obiettivi primari della teoria dei valori estremi è la quantificazione del comportamento di un fenomeno aleatorio quando questo assume dei valori insolitamente grandi o piccoli, e stimare quindi la probabilità di eventi ancora più grandi (o piccoli) di quelli che sono già stati osservati. Per illustrare in modo semplice alcuni concetti di base sugli estremi presentiamo il seguente esempio. È noto che buona parte della città di Venezia si trova sotto il livello del mare. A causa del fenomeno dell acqua alta in alcuni periodi dellanno la marea arriva a sommergere la città, anche fino al 90%. Nella seconda metà del secolo scorso, e in particolare negli anni: 1966, 1970, 2001 e 2004, si sono verificati i casi più eccezionali con i livelli del mare che hanno raggiunto i 190 cm circa. Supponiamo che il governo desideri proteggere Venezia dalle inondazioni tramite linstallazione di alcune dighe di protezione. Valutando un bilancio tra costi di realizzazione e la sicurezza auspicata, si decide che laltezza delle dighe dovrebbe essere tale da rendere la probabilità di un inondazione in un qualsiasi anno pari a 103 . Il quesito finale consiste nel determinare laltezza massima delle dighe da costruire in modo da soddisfare la richiesta. Sono disponibili diverse serie temporali dei livelli del mare, si veda ad esempio Pirazzoli (1982), ma anche il sito http://www.istitutoveneto.it/venezi.... Combinando queste due serie temporali si ottiene una sequenza di misurazioni per un periodo approssimativamente lungo 100 anni. Tuttavia, la probabilità fissata si riferisce a un evento che accade una volta ogni 1000 anni, e sembrerebbe necessario avere molto più di 100 anni di dati per stimare un tal evento, ad esempio se si usasse la cumulata empirica. Il problema sembra apparentemente impossibile da risolvere, ma la teoria dei valori estremi fornisce una base teorica e metodologica per calcolare la probabilità dellevento richiesto. Copyright © Sis-Magazine Page 2/5 Valori Estremi e Analisi dei Rischi Ambientali Figura 1: Livelli delle marea della citta di Venezia: il grafico di sinistra mostra il livello medio giornaliero in cm dal 1983 al 2010 misurato a Punta della Salute. Il grafico di destra mostra il valore massimo annuo in cm dal 1931 al 2010 unendo la serie di Punta della Salute e quella proposta da Pirazzoli. In linea generale, la teoria dei valori estremi studia il comportamento delle code della distribuzione di probabilità (dora in poi, per brevità distribuzione) del fenomeno. Questo corrisponde a operare con una classe di distribuzioni ottenuta come limite, i cui parametri possono essere stimati dai dati delle code. Con la teoria dei valori estremi sono disponibili quindi degli stimatori naturali per quantità rilevanti come i quantili estremi dellesempio e inoltre è possibile valutare laccuratezza di questi stimatori. Il paradigma dei valori estremi, nel semplice caso univariato, funziona come segue. Supponiamo che X1, X2, . . . sia la sequenza dei livelli orari della marea, per un certo periodo temporale di t osservazioni, chiamato blocco. Se ne consideri il valore massimo e si indichi tale massimo con Mt = max(X1, . . . , X t). Un esempio classico è il massimo annuale, in questo caso la marea massima registrata nellarco di un anno o 365 (366) × 24 osservazioni orarie. Si osservi sul grafico di destra di figura 1 la sequenza di massimi annuali ottenuta dai dati disponibili. Se fosse nota la distribuzione delle Xi e si trattasse di una successione indipendente, allora saremo in grado di derivare anche quella di Mt. Questo però non succede spesso nelle applicazioni. Unalterativa a questo inconveniente è fornito dalla teoria dei valori estremi. Se la successione rispetta alcune condizioni non troppo restrittive e il numero di osservazioni orarie in un anno è sufficientemente grande da giustificare i risultati asintotici, allora essa stabilisce unapprossimazione della distribuzione per Mt. Questo risultato fornisce un modello, anche se approssimato, utile in pratica per la stima fuori campione dei livelli non osservati della marea. Valutare il livello dellapprossimazione fornita da un modello è importante e andrebbe sempre fatto (si vedano ad esempio Leadbetter, Lindgren e Rootzen (1983) e Reiss (1989) per approfondimenti). Nel caso univariato, la classe di modelli probabilistici usata per descrivere i valori estremi di un certo fenomeno aleatorio prende il nome di distribuzione generalizzata dei valori estremi. In termini generali, se si indica con Y la variabile aleatoria ottenuta come limite di Mt (si rinvia a Leadbetter, Lindgren e Rootzen, 1983, per i dettagli) allora, quale che sia la distribuzione di Xt, quasi sempre la distribuzione di Y apparterrà alla famiglia generalizzata di modelli per i valori estremi che ha espressione: Copyright © Sis-Magazine Page 3/5 Valori Estremi e Analisi dei Rischi Ambientali dove (x)+ = max(x,0) e ¼, Ã e ¾ sono i parametri della distribuzione che rappresentano rispettivamente la posizione la scala e la forma della distribuzione stessa. Questa classe di modelli raggruppa tre distribuzioni note e molto utilizzate in statistica. Le distribuzioni sono: la Fr echet quando ¾ > 0, la Weibull quando ¾ < 0 e la Gumbel ottenuta come limite per ¾ ’ . In precedenza si è utilizzato il termine quasi perchè esistono dei contro esempi dove alcune distribuzioni sottostanti non convergono ad alcuna distribuzione limite. Riprendendo lesempio delle maree di Venezia, a partire dalle serie delle mareeorarie X1, X2, ... ,siricavalasequenzadeimassimiannualiindicata per semplicità da Y1, Y2, .... Con questultima si possono stimare i parametri ¼, Ã e ¾ del modello generalizzato dei valori estremi. Allora, invertendo lequazione dove lespressione delle distribuzione è definita in (1), si può ottenere una stima di: La quantità yp è chiamato livello di ritorno associato al periodo di ritorno T = 1/p. Il livello di ritorno rappresenta quel valore che è superato dal massimo annuale in ogni anno con probabilità p o in termini più generali è quel valore che ci si aspetta sia superato dal massimo annuale in media ogni T anni. Con la stima del livello di ritorno, si può anche calcolare una misura dellincertezza o variabilità della stima anchessa valutabile in pratica attraverso i dati disponibili (si rinvia per i dettagli al testo di Coles, 2001). Con i dati di Venezia, si ottiene ad esempio in corrispondenza a un periodo di ritorno di 50 anni una stima puntuale del livello di ritorno della marea pari a 167 cm. Questa stima soggetta a variabilità e per questo si è calcolato anche una stima di valori plausibili detta stima intervallare. Figura 2: Stime dei valori di ritorno della marea: la curva di sinistra illustra delle stime verosimili di livelli di ritorno corrispondenti ad un periodo di ritorno di 50 anni. Il valore massimo della curva, pari a 167 cm, coincide con la stima più verosimile del livello di ritorno. Le linee verticali tratteggiate rappresentano gli estremi (158, 183) cm di un intervallo di confidenza per il livello di ritorno con livello di fiducia 0.95. La curva di destra rappresenta delle stime dei livelli di ritorno al variare del periodo di ritorno. Le curve tratteggiate descrivono un intervallo di confidenza puntuale del livello di ritorno con livello di fiducia 0.95. I punti simboleggiano i quantili empirici dei livelli osservati della marea. Lincrocio tra le linee (verticale ed orizzontale) tratteggiate rappresenta una stima del livello di ritorno, pari a 194 cm, corrispondente ad un periodo di ritorno di 1000 anni. Copyright © Sis-Magazine Page 4/5 Valori Estremi e Analisi dei Rischi Ambientali Il grafico di sinistra di figura 2 illustra un intervallo di livelli di ritorno verosimili della marea. In particolare, con un livello di fiducia del 95%, si è ottenuto un intervallo di confidenza con estremo inferiore pari a 158 cm ed estremo superiore pari a 183 cm. Del valore di ritorno si può anche calcolare una curva di valori stimati al variare del periodo di ritorno come illustrato dal grafico di destra della figura 2. La linea intera rappresenta le stime dei valori più verosimili mentre le curve tratteggiate rappresentano gli intervalli di confidenza puntuali corrispondenti a un livello di fiducia del 95%. In conclusione per rispondere al quesito iniziale sullaltezza delle dighe, con un periodo di ritorno di 1000 anni si stima un valore di ritorno della marea pari 194 cm. Perciò per proteggere la città di Venezia da tutte le possibili maree da qui a 1000 anni si dovrebbe costruire delle dighe con unaltezza di circa 2 m. Terminiamo ricordando che abbiamo presentato un esempio illustrativo senza pretendere di fornire una soluzione completa del problema. Ricordiamo infine che la teoria dei valori estremi può aiutare a predire i fenomeni naturali avversi, ma per limitarne i danni serve unattenta valutazione del rischio e servono delle caute decisioni da parte delluomo. Per saperne di più Coles, S. G. (2001). An Introduction to Statistical Modeling of Extreme Values. London: Springer. Gumbel, E. J. (1941). The return period of flood flows, Ann. Math. Statist. 6 12, 163190 Leadbetter, M. R., Lindgren, G. e Rootzen, H. (1983). Extremes and Related Properties of Random Sequences and Series. New York: Springer. Pirazzoli, P.(1982). Maree estreme a Venezia (periodo 18721981). Acqua e Aria, 10, 10231039. Reiss, R. D. (1989). Approximate distributions of order statistics: With applications to nonparametric statistics. New York: SpringerVerlag. 7 L'autore S.A. Padoan, (simone.padoan __AT__ unibg.it) Department of Information Technology and Mathematical Methods, Viale Marconi 5, 24044, Dalmine, Bergamo, University of Bergamo. Copyright © Sis-Magazine Page 5/5