GIS Georeferenziazione

Transcript

GIS Georeferenziazione
Paper: GIS Georeferenziazione
wwww.lvproject.com
Dott. Lotti Nevio
APPUNTI DI GIS
1.1 Con cosa c’entra il GIS?
Tutto ciò che avviene, avviene in un qualche luogo. Quindi tenere traccia di quello che avviene è
importante, come è importante sapere dove avviene. Le attività di tutti i giorni hanno questo tipo di
approccio: scegliere i percorsi da seguire in macchina, evitare i luoghi in cui sono avvenuti incidenti
ecc.
I problemi che coinvolgono l’aspetto della localizzazione, sono denominati problemi geografici.
Degli esempi possono essere:
-
dove ubicare nuove strutture ospedaliere nel caso di sanità pubblica
scegliere i percorsi da seguire, l’impiego ottimale dei veicoli nel caso di corrieri
scegliere i percorsi per nuove autostrade o ferrovie nel caso dei trasporti pubblici
gestire al meglio i patrimoni ambientali come le foreste, decidendo dove tagliare o piantare
alberi, o costruire strade di accesso
strategie di difesa: dove costruire nuove basi militari
problemi legati al turismo, scelta dei percorsi e utilizzo di strutture ricettive all’interno dei
percorsi
problemi legati all’agricoltura, per esempio legati all’utilizzo di pesticidi nei campi.
Questi sono tutti problemi geografici, ma cos’è che li contraddistingue? C’è una classificazione che
si basa su tre aspetti.
Il primo riguarda la scala o il livello di dettaglio geografico. Ad esempio, la costruzione di un
palazzo, è un problema geografico, ma ad una scala molto grande, oppure molto dettagliata. La
ripartizione di un territorio, come avvenne dopo la guerra dei Balcani per la Bosnia, è un problema
geografico ad una scala molto più piccola, che implica la considerazione di aspetti di natura molto
diversa, ad esempio la conoscenza della mappa delle etnie presenti, o dei confini storici, o ancora
della configurazione topografica. Quindi la scala o il livello di dettaglio geografico è una proprietà
essenziale di qualsiasi progetto GIS.
Il secondo è legato allo scopo, o all’intento che un problema si pone. Ad esempio un progetto GIS
può essere legato alla risoluzione di un problema pratico, che va risolto nel minor tempo possibile e
risparmiare risorse economiche. Un altro scopo è quello scientifico, guidato dalla curiosità umana di
scoprire come avvengono certi fenomeni. Un altro ancora potrebbe essere quello della
determinazione dei rischi, ambientali o antropici, per i quali gli strumenti GIS sono essenziali.
Il terzo è caratterizzato dalla scala temporale. Ad esempio i problemi legati alla pianificazione
economica possono riguardare obiettivi a breve, medio e lungo termine, mentre gli studi degli
archeologi o dei geologi riguardano scale temporali che sono molto al di là della durata della vita
umana.
L’aggettivo geografico si riferisce alla superficie (o vicino alla superficie) della terra, mentre
spaziale riguarda tutto ciò che si riferisce ad un qualsiasi spazio. La caratteristica delle tecniche GIS
è che possono essere utilizzate con profitto anche in ambiti che non riguardano propriamente la
geografia, ma invece si riferiscono a fenomeni che avvengono in altri ambiti. Ad esempio alcune
tecniche GIS sono state applicate all’analisi delle sequenze del genoma sul DNA.
1
Paper: GIS Georeferenziazione
wwww.lvproject.com
Dott. Lotti Nevio
1.2 Dati, informazione, prova, conoscenza, saggezza
I sistemi informativi, ci aiutano a gestire ciò che conosciamo, rendendolo facilmente accessibile e
organizzato. Ci sono diversi termini che descrivono i livelli di conoscenza, ognuno con un
significato particolare:
-
-
-
-
-
Dati. Sono fatti da numeri, testo, simboli che sono in un certo senso neutrali e quasi
indipendenti dal contesto. Nudi fatti geografici, come la temperatura, il tasso di umidità sono
esempi di dati. Sono rappresentati e trasmessi come sequenze di bit, e la loro natura non
influenza i metodi di trasmissione.
Informazione. Si differenzia dai dati per avere un certo livello di selezione, organizzazione
e preparazione per uno scopo specifico. Si potrebbe dire che l’informazione è un dato che
serve ad un certo scopo, o un dato che lascia libera una certa possibilità di interpretazione.
L’informazione è spesso difficile e costosa nella produzione, ma economica nella
riproduzione e nella distribuzione. Ad esempio i dataset geografici sono molto costosi da
ottenere, ma molto facilmente riproducibili e distribuibili.
Conoscenza. Potrebbe essere definita come informazione con una valore aggiunto di
un’interpretazione legata ad un particolare contesto, esperienza e scopo. Semplificando,
l’informazione diventa conoscenza una volta che è compresa. Chiaramente, la
“comprensione” dipende dal bagaglio culturale di chi accede all’informazione. Da cui si può
dire che la stessa informazione può portare a diversi tipi di conoscenza.
Prova (o evidenza). E’ considerata una via di mezzo tra informazione e conoscenza. Si può
vedere come una molteplicità di informazioni da fonti diverse, relativa a problemi specifici e
con una consistenza che è stata verificata.
Saggezza. Difficile da definire. E’ soprattutto usata nel contesto di decision-making o nel
dare suggerimenti ed è disinteressata, basata su tutte le prove e le conoscenze disponibili, ma
data con cognizione e con la consapevolezza delle possibili conseguenze.
1.3 La scienza del problem-solving
Nei confronti dei GIS, si pone la questione di come risolvere i problemi, e se i problemi geografici
siano risolti in maniera diversa da altri tipi di problemi.
Ci sono vari tipi di processi, che possono essere naturali (come terremoti, inondazioni ecc.) , oppure
che rispondono a leggi o regole imposte dall’uomo. Ad esempio le regole di zonazione influenzano
i modi in cui gli appezzamenti di terra possono essere usati. Conoscere i processi naturali può essere
molto più utile di rappresentare solamente le aree geografiche, perché una tale conoscenza può
essere utile per predire comportamenti futuri.
L’aspetto della superficie terrestre può cambiare di molto dal punto di vista geografico (ad esempio
una foto del Sahara o della foresta Amazzonica), ma ci sono dei processi che sono simili in tutte le
parti della terra. Ad esempio l’effetto inquinante per l’atmosfera dei combustibili fossili è
praticamente lo stesso sia in Cina che in Europa, nonostante abbiano paesaggi molto diversi.
La scienza ha la tendenza di considerare più importante una conoscenza generale rispetto a quella
particolare, e i processi piuttosto la conoscenza della forma. I geografi sono stati testimoni di un
lungo dibattito tra la geografia idiografica (che si focalizza sulla descrizione della forma e enfatizza
le caratteristiche uniche dei luoghi) e quella nomotetica (che tende a scoprire i processi di carattere
generale). Naturalmente sono entrambe essenziali, e uno dei meriti fondamentali di un GIS è
proprio la capacità di integrare il generale con il particolare. Il software di un GIS cattura e
implementa una conoscenza generale, mentre il database di in GIS rappresenta l’informazione
specifica. In questo senso il GIS risolve il dibattito cercando una sintesi tra le due visioni.
2
Paper: GIS Georeferenziazione
wwww.lvproject.com
Dott. Lotti Nevio
La conoscenza generale si presenta in diverse forme. Ad esempio la classificazione è probabilmente
la più rudimentale e semplice, ed è molto usata nella risoluzione dei problemi geografici.
Una più sofisticata forma di conoscenza include gli insiemi i regole (rule sets), ad esempio regole
su che uso è possibile fare delle zone paludose, o su quali zone possono essere definite desertiche
ecc. Gran parte della conoscenza raccolta dagli scienziati suggerisce il termine di legge.
Chiaramente ci possono essere leggi con diversa qualità predittiva. Ad esempio le leggi che
regolano il mercato in una certa zona non sono così precise come le leggi della dinamica di Newton.
Il problem-solving coinvolge diversi stadi e componenti. Per prima cosa è necessario avere un
obiettivo chiaro che si intende raggiungere. Il raggiungimento di questo obiettivo può essere
valutato in una forma tangibile (minor costo) o intangibile (senso di soddisfazione della clientela).
1.4 La tecnologia del problem-solving
Diverse definizioni di cos’è un GIS sono state date e ognuna di esse ha un significato particolare. E
l’etichetta GIS è stata applicata a tante cose. Ad esempio ad un software che può essere acquistato e
che adempie a funzioni ben precise (GIS software); la rappresentazione digitale di vari aspetti del
mondo geografico, nella forma di insiemi di dati (GIS data); una comunità di persone che usano e
sostengono l’uso di questi strumenti per vari scopi (GIS community); l’attività di usare i GIS per
risolvere problemi o per fare scienza (fare GIS). Chiaramente sono tutte cose vere, e l’uso della
terminologia dipende dal contesto.
Tuttavia ci sono delle definizioni particolarmente utili:
-
un GIS è un contenitore di mappe in forma digitale
uno strumento informatico per risolvere problemi di natura geografica
un sistema di supporto alle decisioni spaziali
un inventario meccanizzato di strutture e caratteristiche geografiche
uno strumento per rivelare ciò che sarebbe altrimenti invisibile nell’informazione
geografica
uno strumento per fare operazioni sui dati geografici che sarebbe troppo noioso o
complicato o in accurato fare a mano.
1.4.1 Storia del GIS
Il GIS nasce in Canada alla metà degli anni ’60 come un sistema computerizzato di misurazione di
mappe (CGIS: Canada GIS), che integra informazione di tipo tabulare con quella grafica per la
rappresentazione di mappe. Alla fine degli anni ’60 l’US Bureau of Census pianifica la
realizzazione di uno strumento utile alla realizzazione del censo della popolazione del 1970.
Viene data vita al progetto DIME (Dual Independent Map Encoding) che associa le informazioni
dettagliate su tutte le strade degli USA ai record del censo. I due progetti (CGIS e DIME) danno
quindi vita ad un programma unitario presso il laboratorio di Computer Graphics and Spatial
Analysis dell’università di Harvard, teso allo sviluppo di GIS general-purpose che potesse essere
utile ad entrambe le esigenze. Tale programma portò alla realizzazione di ODISSEY GIS alla fine
degli anni ’70.
D’altra parte, già dagli anni ’60 i cartografi e le agenzie che si occupavano di mappe avevano
cominciato a chiedersi come i computer potessero aiutare il loro lavoro, e alla fine degli anni ’70 la
maggior parte delle principali agenzie di cartografie erano in larga parte computerizzate.
Inoltre, un importante ruolo nello sviluppo dei GIS l’hanno avuto gli strumenti di misura remoti,
come i satelliti che si sono cominciati a diffondere già dagli anni 50 (ad opera dei militari). Molte
applicazioni e innovazioni sui GIS sono avvenute durante la guerra fredda, per opera dei militari (ad
esempio il GPS).
3
Paper: GIS Georeferenziazione
wwww.lvproject.com
Dott. Lotti Nevio
1.4.2 Anatomia di un GIS
-
Network
La rete per la distribuzione dei dati, la fruizione dei servizi, ecc. Dal 1993 si usa Internet,
Steve Putz dello Xerox PARC Center ha realizzato la prima mappa interattiva web-based
(http://mapweb.parc.xerox.com/map).
-
Hardware
L’insieme di tutti i dispositivi utilizzati dall’utente per fare delle operazione sul GIS.
-
Software
Gira sulle macchine degli utenti oppure accessibile via web con il browser.
Venditori:
Autodesk -> www.autodesk.com
ESRI (Environmental Systems Research Institute) -> www.esri.com
Intergraph Corp. -> www.ingr.com
MapInfo -> www.mapinfo.com
GE SmallWorld Systems Ltd. -> www.smallworld.co.uk
-
Database
Consiste di una rappresentazione digitale di alcuni aspetti selezionati della superficie della
terra. Le dimensioni variano da pochi MB a molti TB
-
Procedure
Sono tutti quei meccanismi che assicurano che le attività di GIS stiano nel budget
programmato, abbiano una buona qualità e intercettano i bisogni dell’organizzazione
-
Persone
Tutti coloro che sono coinvolti nella realizzazione, nel mantenimento e nella fruizione di un
GIS.
2.1 Rappresentare la geografia
C’è una gran quantità di modi in cui è possibile rappresentare la geografia. Nessuno di questi è
perfetto e nessuno è ideali per tutti i tipi di applicazione. Un parametro potrebbe essere
l’accuratezza.
2.2 Il problema fondamentale
I dati geografici collegano posto, tempo e attributi. Come ad esempio dire: “la temperatura nel
pomeriggio locale del 2 dicembre 1999 alla latitudine 34 gradi nord, longitudine 120 gradi ovest,
era di 18 gradi Celsius”.
Tipi di attributi:
- nominali: servono a distinguere un’entità da un’altra, ad esempio i nomi dei luoghi
- ordinali: si dicono così se i loro valori seguono un ordine naturale. Ad esempio la
suddivisione in classi
- intervalli: vengono detti così quando le differenze tra valori hanno importanza. Ad esempio
la scala delle temperature Celsius: dire 30 e 20 è differente da dire 20 e 10
4
Paper: GIS Georeferenziazione
-
wwww.lvproject.com
Dott. Lotti Nevio
frazioni: quando ha senso fare i rapporti. Una persona che pesa 100kg, pesa il doppio di una
persona che pesa 50kg, mentre se ci sono 40 gradi non fa il doppio caldo di quando ce ne
sono 20.
Ci sono casi in cui i dati variano sensibilmente con il tempo (per esempio la temperatura, il tasso di
umidità ecc.), mentre altri sono dal punto di vista temporale (e per una scala umana) statici, come il
livello di altitudine della terra.
Ci sono stati tentativi di rappresentare tutta la conoscenza geografica sul mondo in maniera digitale,
soprattutto per scopi didattici (Digital Earth). Ma fino a che dettaglio arrivare? Sembra che più si
guarda da vicino il mondo più dettagli si trovano, e questo processo sembra andare avanti
all’infinito. Quindi, nella pratica, ogni rappresentazione deve essere parziale, ignorando certi
attributi o semplificando in qualche modo.
Nelle immagini digitali si usa spesso una bassa risoluzione spaziale. Ad esempio 10km, dove un
oggetto più piccolo di questa misura non è visibile. Oppure un altro metodo è quello di considerare
le aree che hanno delle proprietà comuni, come l’altitudine (ad esempio il mare).
2.3 Oggetti e campi
2.3.1 Oggetti
Ci sono due schemi di natura concettuale per rappresentare i dati geografici. Dal punto di vista
umano, viene più intuitivo distinguere in maniera precisa e netta le cose. Questo punto di vista si
riflette nella schema a oggetti discreti. Secondo questo schema lo spazio è vuoto, a meno che non
sia occupato da oggetti ben definiti, che sono istanze di categorie riconosciute.
Gli oggetti geografici sono definiti attraverso la loro dimensione. Gli oggetti che occupano un’area
sono detti bi-dimensionali. Mentre altri oggetti come le strade, le ferrovie sono più simili a linee,
quindi ad oggetti uni-dimensionali. Altri oggetti ancora sono zero-dimensionali, e sono
rappresentati come punti nello spazio di riferimento. Ci sono tanti campi in cui questo schema è
utile, per esempio nella rappresentazione degli oggetti che fanno parte e compongono una città
(edifici, strade, ferrovie ecc.). Ma ci sono altri fenomeni geografici che non vengono bene
rappresentati da questo schema.
2.3.2 Campi
Un problema della object-view, è che per rappresentare degli oggetti, è necessario definire bene le
loro proprietà caratterizzanti. C’è invece un altro schema, detto field view, che descrive il mondo
geografico attraverso un insieme di variabili, ognuna delle quali misurabile all’interno della
superficie terrestre e i cui valori cambiano muovendosi nello spazio. Gli oggetti sono definiti dalla
loro dimensione, mentre i campi sono definiti da cosa varia e con quale rapidità. (…)
2.4 Raster e vettori
Sia la discrete object, sia la field view sono modelli concettuali, che non si riferiscono a come
l’informazione geografica possa essere rappresentata in maniera digitale.
Ci sono due metodi che invece riducono i fenomeni geografici in forme che possono essere
codificate in un database, i modelli raster e vettoriale.
Questi modelli si riferiscono agli schemi concettuali discussi sopra, in particolare il modello raster
si riferisce allo schema field view, mentre il modello vettoriale si riferisce allo schema discrete
object view.
2.4.1 Dati raster
5
Paper: GIS Georeferenziazione
wwww.lvproject.com
Dott. Lotti Nevio
In una rappresentazione raster, lo spazio geografico è suddiviso in celle che sono quadrate nella
maggior parte dei casi, oppure rettangolari. Ogni variazione geografica è quindi espressa
assegnando proprietà o attributi alle singole celle. Le celle vengono chiamate pixel, termine comune
quando si parla di visualizzazione. Una delle più comuni forme di dati raster viene dalle immagini
satellitari. Le immagini variano a seconda della risoluzione spaziale.
Chiaramente per rappresentare la superficie della terra in questa forma è necessario un processo di
proiezione o appiattimento, visto che si tratta di una superficie curva ridotta ad una piatta. Il valore
associato ad una data cella può essere assegnato in vari modi. Ad esempio usando la regola largest
share (in cui la cella assume un valore in base al valore più diffuso al suo interno) oppure quella
central point (in cui la cella assume il valore del suo punto centrale). Il primo metodo è preferito al
secondo ma spesso il secondo viene usato per la facilità di calcolo.
2.4.2 Dati vettoriali
In una rappresentazione vettoriale tutte le linee sono ottenute connettendo i punti con segmenti. Le
aree sono ottenute attraverso linee chiuse, e vengono quindi rappresentate come poligoni. Mentre le
spezzate vengono dette polyline. I punti, o vertici, hanno una precisa collocazione nello spazio.
Questo metodo può sembrare più preciso rispetto ai dati raster, ma spesso gli oggetti nello spazio
non possono essere localizzati con una grande accuratezza.
3.1 La Georeferenziazione
Abbiamo parlato dell’informazione spaziale come composta da una tripla: il luogo, il tempo e gli
attributi. E’ necessario poi poter assegnare un valore a ciascuno di questi elementi in modo da poter
essere comunemente accettati e compresi dalle persone che intendono usarli e comunicarli. Ad
esempio, sul tempo, è comunemente diffuso e accettato il modello del calendario. Ma mentre il
tempo è opzionale nei dati geografici, la localizzazione non lo è nel caso dei dati geografici, quindi
è necessario studiare delle tecniche e dei metodi per localizzare i dati e mettere insieme dati che si
riferiscono allo stesso luogo in modo da formare delle mappe. I dati che non posseggono una
localizzazione sono detti non-spaziali o a-spaziali.
Ci sono diversi termini che vengono usati per descrivere l’atto di assegnare una localizzazione ad
atomi di informazione. Possiamo usare i verbi georeferenziare, geolocalizzare e geocodificare, e
dire che i fatti sono stati georeferenziati o geocodificati. Possiamo dire di etichettare (tag) i record
con le località geografiche oppure che li abbiamo localizzati.
Il primo requisito della georeferenziazione è che deve essere unica, in modo che c’è un solo luogo
(geografico) associato ad una data georeferenziazione, e quindi non è possibile fare confusione su di
esso; inoltre il significato della georeferenziazione deve essere condiviso da tutte le persone che
avranno a che fare con quella informazione, inclusi i loro GIS.
Ad esempio l’indirizzo v.le S. Martino 50, 98100 Messina (ITALIA) è un indirizzo che punto ad un
solo edificio (non ci sono altri edifici con lo stesso indirizzo) ed è sufficientemente chiaro per
chiunque voglia spedire una lettera da ogni parte del mondo.
Per essere più utile possibile, una georeferenziazione deve essere persistente nel tempo, perché
sarebbe molto confusionario se cambiasse di frequente, e costoso se si dovessero cambiare tutti i
record associati alla georeferenziazione che cambia. Questo potrebbe essere un problema nel caso in
cui un sistema di georeferenziazione è condiviso da più agenzie con diverse priorità. Per esempio,
un comune potrebbe espandersi acquisendo nuovi terreni e creando problemi alle agenzie di
mappatura oppure a dei ricercatori che vogliono studiare il comune nel tempo. Inoltre spesso le vie
delle città cambiano e le agenzie postali a volte rivedono i codici di avviamento postale. Possono
inoltre cambiare i nomi delle città o la loro trascrizione convenzionale nell’alfabeto latino.
6
Paper: GIS Georeferenziazione
wwww.lvproject.com
Dott. Lotti Nevio
Ogni georeferenziazione è associata ad una risoluzione spaziale, uguale alle dimensioni dell’area
associata alla georeferenziazione.
Northing
852
100 km
Easting
624
SK624852
Figura 1. Vengono assegnate 3 cifre per l’Easting e 3 cifre per il Northing, avendo
quindi la precisione di 100m.
Ad esempio per un indirizzo di posta possiamo dire che ha una risoluzione pari alle dimensioni
dell’area dell’edificio al quale si riferisce.
Molti sistemi di georeferenziazione sono unici soltanto dentro un’area o un dominio della superficie
della Terra. Per esempio ci sono diverse città degli USA che si chiamano Springfield. Il nome della
città è quindi unico nel dominio di uno stato (o di una regione). Allo stesso modo le strade nei
confronti delle città.
Mentre alcuni sistemi di georeferenziazione sono basati su semplici nomi, altri sono basati su vari
tipi di misurazioni, e sono chiamati georeferenziazioni metriche. Ad esempio latitudine e
longitudine, e vari sistemi di coordinate. Un enorme vantaggio di questi sistemi è che garantiscono
una risoluzione potenzialmente fine all’infinito. Un altro è che dalle misurazioni di due o più
località è possibile calcolare le distanze, un requisito molto importante per i GIS.
Altri sistemi semplicemente ordinano le località. Ad esempio la numerazione delle strade.
3.2 Nomi
Dare nomi alle località è la forma più semplice di georeferenziare, e probabilmente è stata la prima
ad essere utilizzata. Ogni caratteristica distintiva di un paesaggio, come un albero particolare, o una
collina, può essere usato come punto di riferimento per due persone che vogliono scambiarsi
un’informazione. Le zone abitate poi sono state rapidamente riempite di targhe che servivano a chi
le vedeva di orientarsi. Inoltre, il linguaggio può estendere le potenzialità di questo sistema
attraverso parole come “tra” oppure “vicino”.
7
Paper: GIS Georeferenziazione
wwww.lvproject.com
Dott. Lotti Nevio
Ma questo metodo è molto limitativo. Ad esempio dire che qualcosa si trova in Asia è molto
generico, dato che l’Asia copre 43 milioni di km2. Inoltre ci sono molti nomi che sono conosciuti da
piccole comunità e che non possono essere condivisi con il resto del mondo.
3.3 Indirizzi e codici postali
Gli indirizzi postali sono stati introdotti con la diffusione della distribuzione della posta nel XIX
secolo.
Si basano su diverse considerazioni:
-
ogni casa o ufficio è un potenziale destinatario di posta
le case e gli uffici sono allineati in sentieri o strade e sono numerati secondo questa
disposizione
sentieri e strade hanno nomi che sono “localmente” unici
le aree locali hanno nomi che sono unici dentro regioni più ampie
le regioni hanno nomi che sono unici all’interno dei paesi
Se queste assunzioni sono vere, allora la posta fornisce un’unica identificazione per ogni casa nella
Terra.
E’ chiaro che questo sistema è molto legato alle attività umane. Ad esempio, il monte Everest non
ha un indirizzo di posta. Inoltre ci sono delle culture che non prevedono la numerazione
consequenziale delle strade (ad esempio in Giappone, dove la numerazione riflette la data di
costruzione, quindi è di tipi temporale e non spaziale). Molti GIS convertono le coordinate postali,
in altri tipi di coordinate, come latitudine e longitudine.
I codici postali sono stati introdotti nel XX secolo per semplificare l’ordinamento e la distribuzione
della posta.
3.4 Sistema di riferimento lineare
Il sistema di riferimento lineare definisce una posizione misurando la distanza da un punto di
riferimento iniziale e seguendo un percorso definito sulla rete.
via 1
via 3
via 2
Figura 2. Sistema di riferimento lineare
Ad esempio, si può localizzare l’incidente nella figura, misurando la distanza sulla via 2, a partire
da un punto di riferimento noto, che è l’intersezione della via 2 con la via 1.
Questo sistema è molto vicino a quello utilizzato nella numerazione delle strade, ma al contrario di
quest’ultimo è prevista una misurazione delle distanze.
8
Paper: GIS Georeferenziazione
wwww.lvproject.com
Dott. Lotti Nevio
Il sistema di riferimento lineare è molto usato in applicazioni che riguardano reti lineari, come ad
esempio le autostrade (16 km sulla A1), le ferrovie (100 Km sulla Messina-Palermo), le reti di
distribuzione dell’energia elettrica, oleodotti, canali ecc.
Tale sistema è usato dalle società autostradali per definire ad esempio la localizzazione dei ponti,
incidenti stradali ecc.
Per queste applicazioni è un sistema utile, ma per altre è molto importante avere la possibilità di
convertire le coordinate in latitudine e longitudine.
3.5 Catasto
Il catasto è definito come una mappa delle proprietà dei terreni in un’area, utilizzato allo scopo di
tassare quei terreni, o per creare un registro pubblico delle proprietà. Il processo di suddivisione
crea nuove particelle (catastali) suddividendo quelle esistenti.
Le particelle in un catasto sono univocamente determinate, attraverso un numero o un codice, e
sono anche ragionevolmente persistenti nel tempo, quindi soddisfano i requisiti di un sistema di
georeferenziazione. Tuttavia molto spesso i proprietari, o gli utenti in genere, non conoscono questa
numerazione, e quindi l’utilizzo di questo sistema è confinata ad una utenza tecnica.
3.6 Misurare la Terra: latitudine e longitudine
I più potenti sistemi di georeferenziazione sono quelli che forniscono la possibilità di avere una
risoluzione spaziale molto fine, che permette di calcolare le distanze fra coppie di punti, e supporta
altre forme di analisi spaziali. Questo sistema è per molti versi il più esaustivo, ed è spesso
chiamato sistema geografico di coordinate, basato sulla rotazione della Terra intorno al suo centro
di massa.
Per definire latitudine e longitudine dobbiamo per prima cosa identificare l’asse della rotazione
terrestre. Il centro di massa della Terra cade proprio in questo asse, e il piano passante dal centro di
massa e perpendicolare all’asse definisce l’Equatore. Le “fette” di Terra parallele all’asse e
perpendicolari all’Equatore definiscono le linee di uguale longitudine, come i segmenti degli
spicchi di arancia.
Una di queste linee, che convenzionalmente passa dal Royal Observatory di Grenwich (in
Inghilterra), definisce lo zero della longitudine, e l’angolo che questa linea forma con qualsiasi altra
nel globo è la misura della longitudine. Ognuno dei 360 gradi di longitudine è suddiviso in 60
minuti e ognuno di questi in 60 secondi. Ma è molto più convenzionale usare la misura della
longitudine con i gradi Est od Ovest, quindi la longitudine va da 180° ovest a 180° est. Inoltre,
poiché i dati numerici vengono suddivisi equamente nei computer tra positivi e negativi, i gradi
ovest vengono considerati negativi e quelli est positivi, usando i decimali piuttosto che i minuti e i
secondi. Una linea di costante longitudine viene detta meridiano.
La longitudine può essere definita in questo modo per qualsiasi solido di rotazione, aldilà della sua
forma, perché l’asse di rotazione e il centro di massa sono sempre definiti. Ma la definizione di
latitudine presuppone che sappiamo qualcosa sulla forma. La Terra ha una forma complessa che è
soltanto approssimativamente una sfera. Una rappresentazione più corretta è un ellissoide di
rotazione, cioè la figura che si ottiene prendendo un’ellisse e rotandola attorno all’asse minore.
La differenza tra un ellissoide e una sfera è misurata dal suo appiattimento, o la riduzione nell’asse
minore dell’asse maggiore.
L’appiattimento è definito da:
f = (a – b )/a
dove a e b sono le lunghezze dell’asse maggiore e minore rispettivamente. La Terra è leggermente
appiattita (1/300).
9
Paper: GIS Georeferenziazione
wwww.lvproject.com
Dott. Lotti Nevio
Negli ultimi 200 anni si sono fatti tanti sforzi per trovare degli ellissoidi che meglio
approssimassero la Terra in alcuni paesi in particolare, in maniera tal che le agenzie di mappatura
nazionali potessero fare mappe accurate. I primi ellissoidi variavano molto nei loro parametri
basilari e non erano centrati nel baricentro della Terra. Ma lo sviluppo di missili balistici
intercontinentali negli anni ’50 e la necessità di avere con precisione gli obiettivi, insieme a nuovi
dati disponibili attraverso i satelliti, hanno portato alla ricerca di uno standard internazionale. Senza
un unico standard, le mappe fatte dai singoli paesi su ellissoidi diversi non avrebbero mai potuto
combaciare nei loro confini, e correzioni si rendevano necessarie muovendosi da un paese all’altro
(ad esempio nelle rotte delle navi o degli aerei).
L’ellissoide conosciuto come WGS84 (World Geodetic System del 1984) è adesso largamente
accettato, e la mappatura del Nord America è stata fatta in conformità ad esso attraverso il
virtualmente identico North America Datum del 1983 (NAD83). Ma molti altri ellissoidi rimangono
in uso in altre parti del mondo, e molti vecchi dati ancora si riferiscono ai primi standard, come il
North American Datum del 1927 (NAD27).
Adesso possiamo definire la latitudine.
Figura 2. Definizione di latitudine del punto rosso, come
l'angolo tra l'Equatore e la linea perpendicolare
all'ellissoide.
La Figura 3 mostra una linea disegnata lungo un punto di interesse perpendicolare all’ellissoide in
quella posizione. L’angolo formato da questa linea con il piano dell’Equatore è definito come la
latitudine del punto, e varia da 90 sud a 90 nord. Anche qui le latitudini sud sono usualmente
memorizzate come numeri negativi e quelle nord come numeri positivi.
La latitudine è normalmente simbolizzata con la lettera greca fi (φ) e la longitudine con la lettera
greca lambda (λ), quindi i rispettivi range possono essere espressi matematicamente con:
-180 ≤ λ ≤ 180;
-90 ≤ φ ≤ 90.
Una linea di latitudine costante è detta parallelo.
E’ importante considerare che cosa significano latitudine e longitudine in termini di distanze sulla
superficie della terra. Due punti che si trovano sulla stessa linea nord-sud di longitudine, e separate
da un grado di latitudine sono distanti 1/360 della circonferenza della terra, o circa 111 km. Un
10
Paper: GIS Georeferenziazione
wwww.lvproject.com
Dott. Lotti Nevio
minuto di latitudine corrisponde a 1.86 km, che anche definisce un miglio nautico, un’unità di
misura largamente utilizzata in navigazione. Un secondo di latitudine corrisponde a circa 30 m. Ma
le cose sono più complicate nella direzione est-ovest, e queste cifre si applicano solo all’Equatore,
dove le linee di longitudine sono maggiormente distanti. Lontani dall’Equatore le linee di latitudine
diventano sempre più piccole, fin quando non svaniscono ai poli. Il grado di accorciamento è
approssimativamente uguale al coseno della latitudine, cos φ, che è 0.866 a 30 gradi Nord o Sud,
0.707 a 45 gradi, e 0.5 a 60 gradi. Quindi un grado di longitudine è soltanto 55 km lungo il confine
nord della provincia Canadese dell’Alberta (che è esattamente a 60 gradi Nord). Dati latitudine e
longitudine è possibile calcolare la distanza fra una qualsiasi coppia di punti. Supponendo che la
Terra sia sferica (per semplificare la formula), la distanza fra due punti sulla superficie è data dalla
lunghezza dell’arco che li congiunge, ottenuto disegnando un cerchio che taglia la sfera e passa per
i due punti e per il centro della sfera stessa.
La lunghezza di quest’arco su una Terra sferica di raggio R è data da:
R cos-1 [sinφ1 sinφ2 + cosφ1 cosφ2 cos(λ1 – λ2)]
Dove gli indici denotano i due punti. Per esempio, la distanza di un punto sull’Equatore alla
longitudine 90 Est (nell’Oceano Indiano tra lo Srilanka e l’isola indonesiana di Sumatra) e il Polo
Nord si trova calcolando la formula per φ1 = 0, λ 1 = 90, φ2 = 90 e λ 2 = 90. Spesso si usano i radianti
(1 radiante è 57.30 gradi e 90 gradi sono π/2 radianti).
3.7 Proiezioni e coordinate
Latitudine e longitudine definiscono il luoghi della terra in termini di angoli con riferimenti ben
definiti: il Royal Observatory di Greenwich (UK), il centro di massa e l’asse di rotazione. Per
questo costituiscono il sistema più completo di georeferenziazione, e supportano una certa quantità
di possibilità di analisi, inclusa la possibilità di calcolare la distanza tra due punti sulla superficie
curva della terra. Ma molte tecnologie per lavorare con i dati geografici si riferiscono a una
geometria piana, come per esempio la carta e le stampe, e si sono evolute secoli prima della nascita
dei GIS. Per varie ragioni, quindi, molto lavoro nei GIS ha a che vedere con una Terra piatta o
proiettata, nonostante il prezzo che si paga nella distorsione conseguente all’appiattimento.
Specificamente, la Terra è spesso appiattita perché:
-
la carta è piatta, ed è usata come mezzo di input e di output dei dati geografici
i dati raster sono intrinsecamente piatti, poiché è impossibile ricoprire una superficie curva
con quadrati eguali senza sovrapposizioni
la pellicola fotografica è piatta (ad es. le immagini aeree o da satellite)
quando la Terra viene vista dallo spazio, la parte nel centro dell’immagine ha il maggior
dettaglio, allontanandosi dal centro si perde dettagli, fino a perdere la possibilità di vedere la
parte posteriore; per vedere la Terra completa con approssimativamente lo stesso dettaglio,
deve essere distorta in un qualche modo, e il più conveniente è quello di appiattirla.
Le coordinate cartesiane assegnano due coordinate a tutto i punti di una superficie piana, misurando
la distanza da un’origine.
4.1 La natura dei dati geografici
Le nostre vite sono infinitesimali comparate con l’estensione geografica e con la storia del mondo,
ma sono comunque molto intricate nei dettagli. Il comportamento umano si esprime nello spazio
geografico, anche nelle attività quotidiane (dove andare, che fare, e quanto tempo spendere nel fare
11
Paper: GIS Georeferenziazione
wwww.lvproject.com
Dott. Lotti Nevio
qualcosa), e anche nelle attività a lungo termine, su dove vivere, che lavoro fare ecc. In termini
delle applicazioni GIS queste sono rispettivamente esempi di decisione operazionali (breve
termine) e strategiche (lungo termine). Un obiettivo principale dell’analisi geografica è capire come
entrambi questi tipi di decisioni sono strutturate in relazione allo spazio.
Insieme, lo spazio e il tempo costituiscono il contesto geografico, e ne definiscono anche i limiti.
Spesso i comportamenti ripetono un certo schema in maniera periodica, ad esempio le attività della
vita quotidiana (andare a scuola o al lavoro…). Abbiamo detto sopra che un problema dei GIS è
decidere cosa prendere e cosa lasciare nel processo di digitalizzazione dell’informazione spaziale.
Ci interesserà ricordare eventi spaziali o temporali rilevanti, senza essere deviati da dettagli
irrilevanti. Inoltre, determinati eventi appaiano come una ripetizione di eventi già verificatisi nel
passato (o in un altro luogo), e hanno una certa regolarità. Tuttavia il livello di dettaglio al quale noi
proviamo a rappresentare la realtà spesso determina se dei fenomeni spaziali o temporali appaiono
regolari o no. Ma anche molto incide il grado di eterogeneità dei dati spaziali, cioè la tendenza dei
luoghi geografici ad essere diversi tra loro. L’eterogeneità riguarda l’aspetto dei luoghi geografici,
ma anche il modo in cui i processi intervengono sull’aspetto.
La prima legge della geografia (Waldo Tobler) dice che tutto è correlato con qualsiasi altra cosa, ma
le cose più vicine lo sono di più di quelle distanti. Formalmente, questa proprietà è conosciuta come
autocorrelazione , che dà la misura di quanto le cose sono tra loro correlate. La relazione tra eventi
consecutivi nel tempo è formalizzata nell’analogo concetto di autocorrelazione temporale.
L’analisi delle serie temporali è in un certo senso più intuitiva, perché il tempo scorre in una sola
dimensione: gli eventi presenti sono consequenziali ai passati.
Nell’analisi dei dati spaziali, il processo che fa sorgere l’autocorrelazione spaziale può essere
bidimensionale e tridimensionale. Capire il processo dell’autocorrelazione può portare ad una
rappresentazione migliore dei dati spaziali. Si può ad esempio generalizzare a partire da un
campione. E’ comunque una proprietà che può essere sfruttata , poiché se noi riusciamo a misurare
e capire la natura dell’autocorrelazione, diventa più semplice costruire rappresentazioni
generalizzate di distribuzioni spaziali.
Un aspetto molto importante è quello della scala o del livello di dettaglio al quale rappresentare un
fenomeno. La scala e la struttura spaziale di una particolare applicazione suggeriscono i modi in cui
noi dovremmo campionare la realtà geografica e i modi in cui noi dovremmo interpolare i
campioni per costruire la nostra rappresentazione.
4.2 Autocorrelazione e scala
L’autocorrelazione spaziale misura il tentativo di mettere assieme simultaneamente le similarità
nella localizzazione degli oggetti spaziali e nei loro attributi. Se a una similarità spaziale
corrisponde una similarità negli attributi si parla di autocorrelazione positiva. Contrariamente, si
dice che c’è una autocorrelazione negativa quando oggetti molto vicini nello spazio tendono ad
essere molto distanti nei valori degli attributi. Un’autocorrelazione nulla c’è quando c’è
l’indipendenza dagli attributi dalla localizzazione.
Tuttavia spesso per apprezzare l’autocorrelazione è necessario avere un adeguato intervallo di
campionamento. Ad esempio è probabile che campionando le attività di qualcuno che va al lavoro
ogni mattina alle 8, si troverà che campionando ogni 24 ore egli è sempre intento a fare la stessa
cosa. Quindi c’è un alto livello di autocorrelazione tra gli eventi. Ma se l’intervallo di
campionamento non fosse 24, ma 17 ore non sarebbe così. Lo stesso può avvenire per fenomeni non
temporali, ma spaziali. In breve , le misure di autocorrelazione spaziale e temporale sono entrambe
dipendenti dalla scala.
4.3 Campionamento spaziale
12
Paper: GIS Georeferenziazione
wwww.lvproject.com
Dott. Lotti Nevio
A questo punto è chiaro che una selezione accurata e efficace di un campione è fondamentale per
rappresentare i fenomeni spaziali (o spazio-temporali in genere). Possiamo pensare al
campionamento come al processo di selezione di punti da un campo continuo oppure, se il campo è
rappresentato da un insieme di oggetti , selezionando alcuni di questi oggetti e tralasciando gli altri.
Un campionamento scientifico richiede che ognuno di questi elementi ha una specifica e conosciuta
probabilità di essere selezionato.
Possiamo dire che ogni rappresentazione spaziale viene fuori da un processo di campionamento. Ad
esempio nelle immagini da satellite, dove i pixel rappresentano porzioni di territorio con
un’altitudine media.
Se lo schema di campionamento è buono, i dati geografici saranno buoni, e sarà possibile inferire
(statisticamente) le proprietà geografiche complessive dal campione.
Spesso un metodo che si usa è quello dei campioni random, ma può risultare inefficace a volte per
una serie di numeri sfortunata.
Un altro metodo è quello di scegliere un intervallo di campionamento k che è l’inverso del rapporto
tra la popolazione totale N e la dimensione n del campione). In questo modo si crea una griglia
uniforme sullo spazio di riferimento.
Un metodo che mette assieme i due precedenti è quello di fare comunque una griglia, all’interno
della quale il campionamento viene fatto random.
Ancora un altro metodo è fare una griglia con intervalli di campionamento random, oppure
concentrarsi su alcune zone dove i dati formano dei cluster.
Questi metodi vanno adattati alle varie situazioni e comunque un campione più grande genera una
rappresentazione migliore della realtà in genere.
4.4 Interpolazione spaziale
Una volta ottenuto il campione, è necessario “riempire” i vuoti tra gli elementi del campione per
dare una rappresentazione più continua della realtà geografica. Questo richiede la conoscenza degli
effetti della distanza dai campioni. Cioè, abbiamo bisogno di una funzione di interpolazione. La
legge di Tobler implicherebbe un continuo, dolce effetto attenuante a causa della distanza sui valori
degli attributi di oggetti spaziali adiacenti o contigui. Ad esempio nella diffusione di un gas
inquinante da un impianto chimico che si espande in maniera circolare essendo il gas più rarefatto
man mano che ci si allontana dalla sorgente. Oppure la scia di una aereo a reazione si espande in
maniera ortogonale rispetto alla traiettoria dell’aereo.
La precisa natura delle funzioni usate a questo scopo può variare a seconda dell’applicazione. Ci
sono tuttavia alcune funzioni standard. In termini matematici, prendiamo b come parametro che
condiziona la velocità alla quale il peso wij decresce con la distanza. Una b piccola implica una
piccola crescita, una b grande implica una grande crescita. In molte applicazioni, la scelta di una
funzione rispetto a un’altra è frutto dell’esperienza, dell’adattamento a un particolare dataset, e di
una convenzione. Le funzioni più usate sono le seguenti.
Lineare: wij = -b dij
Potenza: wij = dij ^(-b)
Esponenziale: wij = exp(-b dij )
In questi modelli lo spazio si suppone isotropo (non ci sono dimensioni privilegiate rispetto ad
altre).
4.4 Misurare gli effetti della distanza come autocorrelazione spaziale
Possiamo confrontare i valori degli attributi spaziali definendo una matrice W in ogni elemento wij
misura la similarità delle localizzazioni i e j (righe e colonne della matrice). Inoltre wii = 0 per ogni
13
Paper: GIS Georeferenziazione
wwww.lvproject.com
Dott. Lotti Nevio
i. Com’è misurata la similarità? Per oggetti con un’area, la contiguità, o l’adiacenza, è spesso presa
come la più tangibile misura di prossimità spaziale. Su questa base la figura sotto può essere
riespressa come un grafo.
Codificando wij = 1 se le regioni i e j sono contigue e wij = 0 altrimenti, possiamo ottenere una
matrice di pesi (denotata in genere W).
L’autocorrelazione spaziale riguarda due tipi di informazione: la similarità tra gli attributi e la
similarità nella localizzazione. I modi in cui gli attributi possono essere misurati dipendono dai dati
presenti, mentre il calcolo della prossimità spaziale dipende dal tipo degli oggetti.
Per semplificare le cose, usiamo la seguente notazione:
1
1
2
2
4
3
3
5
4
5
n
i, j
zj
cij
wij
il numero di oggetti nel campione
due diversi oggetti
il valore dell’attributo di interesse per l’oggetto i
la similarità degli attributi di i e j
la similarità delle localizzazioni di i e j , con wii = 0 per ogni i.
In generale, ogni misura di autocorrelazione spaziale è stata creata per comparare l’insieme di
similarità degli attributi cij con l’insieme delle similarità posizionali wij , combinandole in un
singolo indice sotto forma di un prodotto in croce:
SOMMAi SOMMAj (cij wij )
In altre parole, il totale è ottenuto moltiplicando ogni cella della matrice W con la sua
corrispondente in C, e sommando.
5. Modellizzazione dei dati geografici
5.1 Introduzione
14
Paper: GIS Georeferenziazione
wwww.lvproject.com
Dott. Lotti Nevio
Il cuore di ogni GIS è il modello dei dati, che è una serie di costrutti per rappresentare gli oggetti e
i processi nell’ambiente digitale del computer. Gli utenti interagiscono con i GIS per fare delle
operazioni come la creazione e la visualizzazione di mappe, l’interrogazione delle basi di dati
spaziali, e l’analisi dei dati geografici. Poiché il tipo di analisi che è possibile fare dipende molto dal
modello di rappresentazione dei dati utilizzato, la decisione di quale modello utilizzare è un aspetto
critico nella determinazione del successo di un’applicazione GIS.
Ci sono diversi livelli di astrazione del modello, a partire dalla realtà, che è popolata da fenomeni
del mondo reale. Il primo livello è rappresentato dal modello concettuale, che è molto vicino al
modo di pensare umano e che aiuta a distinguere i concetti che poi andranno formalizzati. Il
modello logico è invece una rappresentazione della realtà più orientata alla implementazione, e che
fa uso spesso di diagrammi e liste. Per ultimo abbiamo il modello fisico, che implementa i modelli
più astratti attraverso file e database.
Nella modellazione dei dati, gli utenti e gli sviluppatori devono interagire durante il processo.
La prima fase comincia con la definizione dei tipi di oggetti che devono essere rappresentati nel
GIS e si conclude con la descrizione concettuale dei vari tipi di oggetti e correlazioni tra loro.
Completata questa fase, il lavoro successivo porta alla creazione di diagrammi e liste che
descrivono il nome degli oggetti, il loro comportamento, e il tipo di interazione tra loro. I modelli
logici sono indipendenti dalla implementazione (livello fisico). L’ultima fase riguarda la creazione
di un modello che mostra come gli oggetti sotto studio possono essere digitalizzati in un GIS. I
modelli fisici descrivono esattamente i file o le tabelle dei database usati per memorizzare i dati, le
relazioni tra i tipi di oggetti, e le precise operazioni che possono essere fatte.
Un modello dei dati consente agli sviluppatori e agli utenti di avere una comune comprensione di
ciò che si rappresenta.
5.2 Modelli dei dati
Tutti i modelli si basano principalmente sui modelli concettuali a oggetti e a campi. Spesso nella
modellazione si raggruppano le entità che hanno lo stesso tipo geometrico. In questo modo si
formano i layer, che rendono più efficiente la memorizzazione dei dati nel database. Questo termine
è però spesso usato anche per indicare uno specifico dataset.
5.2.1 Il modello raster
Tale modello usa un array di celle, o pixel, per rappresentare gli oggetti del mondo reale. Le celle
possono assumere dei valori numerici, interi o reali, in accordo con uno schema di codifica. Nel
caso più semplice il valore assunto da una cella può essere un bit, normalmente si preferisce un
numero reale. In alcuni casi per ogni cella è possibile avere più attributi.
I dati raster sono abitualmente memorizzati come array di valori di una griglia, con dei metadati
sull’array contenuti in un’intestazione. Tipicamente i metadati includono le coordinate geografiche
dell’angolo in alto a sinistra della griglia, la dimensione delle celle e il numero di righe e colonne.
L’array stesso è normalmente memorizzato in un file compresso o come record in un DBMS. Ci
sono varie tecniche di compressione, ad esempio la codifica run-length, la codifica a blocchi.
5.2.2 Il modello vettoriale
In questo modello, ogni oggetto del mondo reale è classificato in un tipo geometrico: punto, linea o
poligono. I punti sono memorizzati come coppie di coordinate, le linee come serie ordinate di punti,
e i poligoni come insiemi di linee che si chiudono a formare un’area. Le coordinate che definiscono
la geometria di un oggetto possono avere 2, 3 o 4 dimensioni (nel caso in cui ci sia anche la
variabile temporale). In alcuni casi le feature lineari possono essere rappresentate non soltanto con
delle linee ma anche attraverso curve matematiche (come le spline).
15
Paper: GIS Georeferenziazione
wwww.lvproject.com
Dott. Lotti Nevio
5.2.3 Feature semplici
Le entità geografiche che usano il modello vettoriale sono chiamate spesso feature. Le feature in un
database geografico sono raggruppate in classi, oppure, nel caso di memorizzazione in un database,
in una tabella, dove ogni riga si riferisce ad una singola feature, e le colonne rappresentano le
proprietà delle feature. In genere i GIS gestiscono due tipi di feature: semplici e topologiche. La
struttura dei dataset formati da linee e poligoni nel caso di feature semplici è a volte chiamata
spaghetti, perché proprio come gli spaghetti tutti gli oggetti possono sovrapporsi e incrociarsi e non
c’è alcun tipo di relazione tra di loro.
16