DEI PATTERNSPAZIALI DELLA MORTALITÀ

Transcript

DEI PATTERNSPAZIALI DELLA MORTALITÀ
L’USO DEL VARIOGRAMMA NELLO STUDIO
DEI PATTERN SPAZIALI DELLA MORTALITÀ
PER TUMORE DEL POLMONE
NEI MASCHI IN PUGLIA.
D’Agostino V*, Refaldi A*, Coviello E**
*Ufficio Statistico Regione Puglia
** Unità di Epidemiologia e Statistica ASL BA
OBIETTIVO DEL LAVORO
È qui mostrato l’uso di un metodo geostatistico per lo studio delle variazioni nello spazio dell’insorgere della mortalità per tumore del polmone nei maschi in Puglia, il cui impiego rappresenta un ausilio
nell’individuazione di fattori di esposizione e delle relazioni fra questi e l’incidenza della mortalità.
IPOTESI DI BASE DELLA GEOSTATISTICA
L’applicazione delle tecniche geostatistiche si poggia sul concetto di continuità spaziale dei fenomeni oggetto di studio. È necessario, cioè, che lo studioso confidi sul fatto che l’evoluzione spaziale attesa
sia graduale e si sviluppi in modo che mediamente più due punti sono vicini fra loro e più i valori delle variabili in essi misurati si assomigliano. La vicinanza è un concetto relativo alla scala di osservazione.
Essa è determinata sperimentalmente dalla distribuzione spaziale del campione: nel caso in cui la continuità non si manifesti si dovrebbe mettere in discussione l’incapacità del campionamento a farla
scaturire piuttosto che accettare che il fenomeno sia puramente aleatorio nello spazio di riferimento.
lo studio della continuità spaziale attraverso IL VARIOGRAMMA
Il variogramma è la semivarianza degli incrementi che subisce una variabile z quando passa da un punto geografico xi ad un altro posto a distanza h.
È generalmente riconducibile a modelli ben definiti in letteratura e in grado di cogliere a) le diverse tipologie di continuità, b) la presenza di effetti a diverse scale, c) l’esistenza di una massima distanza dopo la quale due punti diventano
non correlati spazialmente (range).
Nell’ambito della epidemiologia il supporto spaziale delle osservazioni non è basato sulla estensione dell’unità territoriale di riferimento (esempio confini amministrativi comunali) ma è proporzionale alla misura dei suoi residenti. Il tema
del supporto delle misurazioni è stato affrontato e risolto in altri ambiti applicativi (Journel e Huijbregts 1978) attraverso l’introduzione del variogramma regolarizzato dalle funzioni peso:
laddove N(h) è il numero di coppie di punti separati dalla distanza h all’intero di ciascun intervallo spaziale o lag.
Le funzioni peso w(h) possono essere uguali alla somma oppure alla somma delle radici quadrate oppure alla somma dei logaritmi delle popolazioni della coppia di comuni xi ed xi +h in questione (Goovaerts e Jacquez, 2005).
Dal variogramma sperimentale si passa al suo modello attraverso tecniche semi-automatiche di best fitting che fanno intervenire il ricercatore in molte decisioni, tra le quali quelle che riguardano l’esclusione di eventuali outliers.
DATI
Il numero di decessi per tumore del polmone rilevati dal 2000 al 2003 nei maschi residenti in Puglia (fonte ISTAT) rappresenta la variabile di riferimento. Ciascun valore è stato geograficamente associato
al centroide del comune di appartenenza (sistema ED_1950_UTM zona 32).
DISCUSSIONE DEI RISULTATI
La prima fase consiste nel calcolare per ciascuna delle 33153 coppie i e j di comuni il vettore distanza euclidea (modulo hij, direzione) al
quale viene associata la differenza al quadrato della variabile misurata e la funzione peso. Si assume che le variazioni si riproducono nello
stesso modo nell’area oggetto di studio indipendentemente dalla direzione relativa ai due punti (isotropia spaziale). Il valore più piccolo
delle hij rappresenta la distanza minima del campionamento dalla quale partire per scegliere il passo o lag che permette di calcolare la
media di queste variazioni in ciascun intervallo. Nel caso in esame decisa l’ipotesi di isotropia si è assunto un passo di 8 km coerente
con la minima distanza di campionamento. Il grafico dello stimatore del variogramma FIGURA 1
mostra l’esistenza di una continuità
spaziale locale, riscontrabile dall’andamento crescente dei punti più prossimi all’origine. Sulle ordinate è rappresentata la variabilità della
mortalità fra coppie di comuni intesa come differenza media al quadrato del numero di morti in esse rilevate. Sulle ascisse è rappresentata
la distanza (in m) dei centroidi di due comuni. La linea tratteggiata
riproduce la varianza presente nei dati di mortalità considerati in Puglia
e rispetto ad essa si registra un andamento crescente del grafico ed
un suo assestamento al punto di ascissa 70 km. Un picco di crescita
in corrispondenza del punto di ascissa 100 km rileva una ulteriore
continuità spaziale quale effetto di una evoluzione a media scala che si
sovrappone a quella locale.
Uno strumento di indagine molto utile è lo h-scatterplot che rappresenta
FIGURA 2
Lecce
il grafico di tutte le coppie di punti che sono all’interno del passo h.
L’esplorazione di questi grafici consentono l’individuazione di gruppi
di punti geografici con una diversa continuità spaziale. Considerando
Surbo
il primo intervallo 0-8 km FIGURA 2
si evidenzia la coppia isolata
FIGURA 1
FIGURA 3
dal gruppo che è localizzata in rosso sul grafico di FIGURA 3
,
rappresentata dai comuni di Lecce e Surbo. Questa è una situazione
che sembra anomala rispetto a quelli che sono gli incrementi fra tutti
gli altri comuni della Puglia e fornisce una indicazione di approfondimento nonostante il peso assunto per tener conto del differente
supporto dovuto alla misura della popolazione fra questi due comuni.
Nella figura 1 la linea continua mostra il modello di variogramma adattato a quello sperimentale ed ottenuto, coerentemente con i due
effetti appena descritti, come somma di due esponenziali con parametri di range “pratico” (Journel e Huijbregts 1978) rispettivamente
di 17km e 55km e di massima variabilità delle differenze di mortalità al quadrato (sill) di 2058 e 1260.
CONCLUSIONI
La mortalità per tumore del polmone nei maschi in Puglia sembra mostrare una continuità spaziale spiegabile con fattori locali di esposizione che hanno un raggio di influenza di 17km a cui se ne
sovrappongono altri a media scala in grado di influenzare fino ad un raggio di 55km. La stima del modello di variogramma regolarizzato è preliminare all’applicazione di metodi geostatistici, quali il Poisson
kriging (Goovaerts e Gebreab, 2008), che sembrano fornire interessanti risultati rispetto a quelli ottenibili con altri modelli di largo e più diffuso utilizzo in ambito epidemiologico.
L’Ufficio statistico mette a disposizione nell’area download del proprio sito (http://www.regione.puglia.it/index.php?page= uffstat&id=22) una procedura di calcolo del variogramma sperimentale
scritta in visual basic all’interno di un foglio elettronico. Chiunque fosse interessato può scaricarlo ed utilizzarlo liberamente, modificandone anche il codice che è open source. È possibile proporre
delle modifiche agli autori che provvederanno ad introdurle con l’obiettivo di creare strumenti di calcolo aperti e condivisi, disponibili per tutti, in una logica di scambio della conoscenza.
BIBLIOGRAFIA
Goovaerts P (2009), Medical Geography: A Promising Field of Application, Math Geosci (2009) 41: 243–264
Journel AG, Huijbregts CJ (1978) Mining geostatistics. Academic Press, San Diego
Goovaerts P, Gebreab S (2008) How does Poisson kriging compare to the popular BYM model for mapping disease risks? Int J Health Geogr 7(6).
Goovaerts P, Jacquez G.M. (2005) Exploring Scale-Dependent Correlations Between Cancer Mortality Rates Using Factorial Kriging and Population-Weighted Semivariograms, Geographical Analysis n. 37, 152-182