DEI PATTERNSPAZIALI DELLA MORTALITÀ
Transcript
DEI PATTERNSPAZIALI DELLA MORTALITÀ
L’USO DEL VARIOGRAMMA NELLO STUDIO DEI PATTERN SPAZIALI DELLA MORTALITÀ PER TUMORE DEL POLMONE NEI MASCHI IN PUGLIA. D’Agostino V*, Refaldi A*, Coviello E** *Ufficio Statistico Regione Puglia ** Unità di Epidemiologia e Statistica ASL BA OBIETTIVO DEL LAVORO È qui mostrato l’uso di un metodo geostatistico per lo studio delle variazioni nello spazio dell’insorgere della mortalità per tumore del polmone nei maschi in Puglia, il cui impiego rappresenta un ausilio nell’individuazione di fattori di esposizione e delle relazioni fra questi e l’incidenza della mortalità. IPOTESI DI BASE DELLA GEOSTATISTICA L’applicazione delle tecniche geostatistiche si poggia sul concetto di continuità spaziale dei fenomeni oggetto di studio. È necessario, cioè, che lo studioso confidi sul fatto che l’evoluzione spaziale attesa sia graduale e si sviluppi in modo che mediamente più due punti sono vicini fra loro e più i valori delle variabili in essi misurati si assomigliano. La vicinanza è un concetto relativo alla scala di osservazione. Essa è determinata sperimentalmente dalla distribuzione spaziale del campione: nel caso in cui la continuità non si manifesti si dovrebbe mettere in discussione l’incapacità del campionamento a farla scaturire piuttosto che accettare che il fenomeno sia puramente aleatorio nello spazio di riferimento. lo studio della continuità spaziale attraverso IL VARIOGRAMMA Il variogramma è la semivarianza degli incrementi che subisce una variabile z quando passa da un punto geografico xi ad un altro posto a distanza h. È generalmente riconducibile a modelli ben definiti in letteratura e in grado di cogliere a) le diverse tipologie di continuità, b) la presenza di effetti a diverse scale, c) l’esistenza di una massima distanza dopo la quale due punti diventano non correlati spazialmente (range). Nell’ambito della epidemiologia il supporto spaziale delle osservazioni non è basato sulla estensione dell’unità territoriale di riferimento (esempio confini amministrativi comunali) ma è proporzionale alla misura dei suoi residenti. Il tema del supporto delle misurazioni è stato affrontato e risolto in altri ambiti applicativi (Journel e Huijbregts 1978) attraverso l’introduzione del variogramma regolarizzato dalle funzioni peso: laddove N(h) è il numero di coppie di punti separati dalla distanza h all’intero di ciascun intervallo spaziale o lag. Le funzioni peso w(h) possono essere uguali alla somma oppure alla somma delle radici quadrate oppure alla somma dei logaritmi delle popolazioni della coppia di comuni xi ed xi +h in questione (Goovaerts e Jacquez, 2005). Dal variogramma sperimentale si passa al suo modello attraverso tecniche semi-automatiche di best fitting che fanno intervenire il ricercatore in molte decisioni, tra le quali quelle che riguardano l’esclusione di eventuali outliers. DATI Il numero di decessi per tumore del polmone rilevati dal 2000 al 2003 nei maschi residenti in Puglia (fonte ISTAT) rappresenta la variabile di riferimento. Ciascun valore è stato geograficamente associato al centroide del comune di appartenenza (sistema ED_1950_UTM zona 32). DISCUSSIONE DEI RISULTATI La prima fase consiste nel calcolare per ciascuna delle 33153 coppie i e j di comuni il vettore distanza euclidea (modulo hij, direzione) al quale viene associata la differenza al quadrato della variabile misurata e la funzione peso. Si assume che le variazioni si riproducono nello stesso modo nell’area oggetto di studio indipendentemente dalla direzione relativa ai due punti (isotropia spaziale). Il valore più piccolo delle hij rappresenta la distanza minima del campionamento dalla quale partire per scegliere il passo o lag che permette di calcolare la media di queste variazioni in ciascun intervallo. Nel caso in esame decisa l’ipotesi di isotropia si è assunto un passo di 8 km coerente con la minima distanza di campionamento. Il grafico dello stimatore del variogramma FIGURA 1 mostra l’esistenza di una continuità spaziale locale, riscontrabile dall’andamento crescente dei punti più prossimi all’origine. Sulle ordinate è rappresentata la variabilità della mortalità fra coppie di comuni intesa come differenza media al quadrato del numero di morti in esse rilevate. Sulle ascisse è rappresentata la distanza (in m) dei centroidi di due comuni. La linea tratteggiata riproduce la varianza presente nei dati di mortalità considerati in Puglia e rispetto ad essa si registra un andamento crescente del grafico ed un suo assestamento al punto di ascissa 70 km. Un picco di crescita in corrispondenza del punto di ascissa 100 km rileva una ulteriore continuità spaziale quale effetto di una evoluzione a media scala che si sovrappone a quella locale. Uno strumento di indagine molto utile è lo h-scatterplot che rappresenta FIGURA 2 Lecce il grafico di tutte le coppie di punti che sono all’interno del passo h. L’esplorazione di questi grafici consentono l’individuazione di gruppi di punti geografici con una diversa continuità spaziale. Considerando Surbo il primo intervallo 0-8 km FIGURA 2 si evidenzia la coppia isolata FIGURA 1 FIGURA 3 dal gruppo che è localizzata in rosso sul grafico di FIGURA 3 , rappresentata dai comuni di Lecce e Surbo. Questa è una situazione che sembra anomala rispetto a quelli che sono gli incrementi fra tutti gli altri comuni della Puglia e fornisce una indicazione di approfondimento nonostante il peso assunto per tener conto del differente supporto dovuto alla misura della popolazione fra questi due comuni. Nella figura 1 la linea continua mostra il modello di variogramma adattato a quello sperimentale ed ottenuto, coerentemente con i due effetti appena descritti, come somma di due esponenziali con parametri di range “pratico” (Journel e Huijbregts 1978) rispettivamente di 17km e 55km e di massima variabilità delle differenze di mortalità al quadrato (sill) di 2058 e 1260. CONCLUSIONI La mortalità per tumore del polmone nei maschi in Puglia sembra mostrare una continuità spaziale spiegabile con fattori locali di esposizione che hanno un raggio di influenza di 17km a cui se ne sovrappongono altri a media scala in grado di influenzare fino ad un raggio di 55km. La stima del modello di variogramma regolarizzato è preliminare all’applicazione di metodi geostatistici, quali il Poisson kriging (Goovaerts e Gebreab, 2008), che sembrano fornire interessanti risultati rispetto a quelli ottenibili con altri modelli di largo e più diffuso utilizzo in ambito epidemiologico. L’Ufficio statistico mette a disposizione nell’area download del proprio sito (http://www.regione.puglia.it/index.php?page= uffstat&id=22) una procedura di calcolo del variogramma sperimentale scritta in visual basic all’interno di un foglio elettronico. Chiunque fosse interessato può scaricarlo ed utilizzarlo liberamente, modificandone anche il codice che è open source. È possibile proporre delle modifiche agli autori che provvederanno ad introdurle con l’obiettivo di creare strumenti di calcolo aperti e condivisi, disponibili per tutti, in una logica di scambio della conoscenza. BIBLIOGRAFIA Goovaerts P (2009), Medical Geography: A Promising Field of Application, Math Geosci (2009) 41: 243–264 Journel AG, Huijbregts CJ (1978) Mining geostatistics. Academic Press, San Diego Goovaerts P, Gebreab S (2008) How does Poisson kriging compare to the popular BYM model for mapping disease risks? Int J Health Geogr 7(6). Goovaerts P, Jacquez G.M. (2005) Exploring Scale-Dependent Correlations Between Cancer Mortality Rates Using Factorial Kriging and Population-Weighted Semivariograms, Geographical Analysis n. 37, 152-182