GIS Georeferenziazione
Transcript
GIS Georeferenziazione
Paper: GIS Georeferenziazione wwww.lvproject.com Dott. Lotti Nevio APPUNTI DI GIS 1.1 Con cosa c’entra il GIS? Tutto ciò che avviene, avviene in un qualche luogo. Quindi tenere traccia di quello che avviene è importante, come è importante sapere dove avviene. Le attività di tutti i giorni hanno questo tipo di approccio: scegliere i percorsi da seguire in macchina, evitare i luoghi in cui sono avvenuti incidenti ecc. I problemi che coinvolgono l’aspetto della localizzazione, sono denominati problemi geografici. Degli esempi possono essere: - dove ubicare nuove strutture ospedaliere nel caso di sanità pubblica scegliere i percorsi da seguire, l’impiego ottimale dei veicoli nel caso di corrieri scegliere i percorsi per nuove autostrade o ferrovie nel caso dei trasporti pubblici gestire al meglio i patrimoni ambientali come le foreste, decidendo dove tagliare o piantare alberi, o costruire strade di accesso strategie di difesa: dove costruire nuove basi militari problemi legati al turismo, scelta dei percorsi e utilizzo di strutture ricettive all’interno dei percorsi problemi legati all’agricoltura, per esempio legati all’utilizzo di pesticidi nei campi. Questi sono tutti problemi geografici, ma cos’è che li contraddistingue? C’è una classificazione che si basa su tre aspetti. Il primo riguarda la scala o il livello di dettaglio geografico. Ad esempio, la costruzione di un palazzo, è un problema geografico, ma ad una scala molto grande, oppure molto dettagliata. La ripartizione di un territorio, come avvenne dopo la guerra dei Balcani per la Bosnia, è un problema geografico ad una scala molto più piccola, che implica la considerazione di aspetti di natura molto diversa, ad esempio la conoscenza della mappa delle etnie presenti, o dei confini storici, o ancora della configurazione topografica. Quindi la scala o il livello di dettaglio geografico è una proprietà essenziale di qualsiasi progetto GIS. Il secondo è legato allo scopo, o all’intento che un problema si pone. Ad esempio un progetto GIS può essere legato alla risoluzione di un problema pratico, che va risolto nel minor tempo possibile e risparmiare risorse economiche. Un altro scopo è quello scientifico, guidato dalla curiosità umana di scoprire come avvengono certi fenomeni. Un altro ancora potrebbe essere quello della determinazione dei rischi, ambientali o antropici, per i quali gli strumenti GIS sono essenziali. Il terzo è caratterizzato dalla scala temporale. Ad esempio i problemi legati alla pianificazione economica possono riguardare obiettivi a breve, medio e lungo termine, mentre gli studi degli archeologi o dei geologi riguardano scale temporali che sono molto al di là della durata della vita umana. L’aggettivo geografico si riferisce alla superficie (o vicino alla superficie) della terra, mentre spaziale riguarda tutto ciò che si riferisce ad un qualsiasi spazio. La caratteristica delle tecniche GIS è che possono essere utilizzate con profitto anche in ambiti che non riguardano propriamente la geografia, ma invece si riferiscono a fenomeni che avvengono in altri ambiti. Ad esempio alcune tecniche GIS sono state applicate all’analisi delle sequenze del genoma sul DNA. 1 Paper: GIS Georeferenziazione wwww.lvproject.com Dott. Lotti Nevio 1.2 Dati, informazione, prova, conoscenza, saggezza I sistemi informativi, ci aiutano a gestire ciò che conosciamo, rendendolo facilmente accessibile e organizzato. Ci sono diversi termini che descrivono i livelli di conoscenza, ognuno con un significato particolare: - - - - - Dati. Sono fatti da numeri, testo, simboli che sono in un certo senso neutrali e quasi indipendenti dal contesto. Nudi fatti geografici, come la temperatura, il tasso di umidità sono esempi di dati. Sono rappresentati e trasmessi come sequenze di bit, e la loro natura non influenza i metodi di trasmissione. Informazione. Si differenzia dai dati per avere un certo livello di selezione, organizzazione e preparazione per uno scopo specifico. Si potrebbe dire che l’informazione è un dato che serve ad un certo scopo, o un dato che lascia libera una certa possibilità di interpretazione. L’informazione è spesso difficile e costosa nella produzione, ma economica nella riproduzione e nella distribuzione. Ad esempio i dataset geografici sono molto costosi da ottenere, ma molto facilmente riproducibili e distribuibili. Conoscenza. Potrebbe essere definita come informazione con una valore aggiunto di un’interpretazione legata ad un particolare contesto, esperienza e scopo. Semplificando, l’informazione diventa conoscenza una volta che è compresa. Chiaramente, la “comprensione” dipende dal bagaglio culturale di chi accede all’informazione. Da cui si può dire che la stessa informazione può portare a diversi tipi di conoscenza. Prova (o evidenza). E’ considerata una via di mezzo tra informazione e conoscenza. Si può vedere come una molteplicità di informazioni da fonti diverse, relativa a problemi specifici e con una consistenza che è stata verificata. Saggezza. Difficile da definire. E’ soprattutto usata nel contesto di decision-making o nel dare suggerimenti ed è disinteressata, basata su tutte le prove e le conoscenze disponibili, ma data con cognizione e con la consapevolezza delle possibili conseguenze. 1.3 La scienza del problem-solving Nei confronti dei GIS, si pone la questione di come risolvere i problemi, e se i problemi geografici siano risolti in maniera diversa da altri tipi di problemi. Ci sono vari tipi di processi, che possono essere naturali (come terremoti, inondazioni ecc.) , oppure che rispondono a leggi o regole imposte dall’uomo. Ad esempio le regole di zonazione influenzano i modi in cui gli appezzamenti di terra possono essere usati. Conoscere i processi naturali può essere molto più utile di rappresentare solamente le aree geografiche, perché una tale conoscenza può essere utile per predire comportamenti futuri. L’aspetto della superficie terrestre può cambiare di molto dal punto di vista geografico (ad esempio una foto del Sahara o della foresta Amazzonica), ma ci sono dei processi che sono simili in tutte le parti della terra. Ad esempio l’effetto inquinante per l’atmosfera dei combustibili fossili è praticamente lo stesso sia in Cina che in Europa, nonostante abbiano paesaggi molto diversi. La scienza ha la tendenza di considerare più importante una conoscenza generale rispetto a quella particolare, e i processi piuttosto la conoscenza della forma. I geografi sono stati testimoni di un lungo dibattito tra la geografia idiografica (che si focalizza sulla descrizione della forma e enfatizza le caratteristiche uniche dei luoghi) e quella nomotetica (che tende a scoprire i processi di carattere generale). Naturalmente sono entrambe essenziali, e uno dei meriti fondamentali di un GIS è proprio la capacità di integrare il generale con il particolare. Il software di un GIS cattura e implementa una conoscenza generale, mentre il database di in GIS rappresenta l’informazione specifica. In questo senso il GIS risolve il dibattito cercando una sintesi tra le due visioni. 2 Paper: GIS Georeferenziazione wwww.lvproject.com Dott. Lotti Nevio La conoscenza generale si presenta in diverse forme. Ad esempio la classificazione è probabilmente la più rudimentale e semplice, ed è molto usata nella risoluzione dei problemi geografici. Una più sofisticata forma di conoscenza include gli insiemi i regole (rule sets), ad esempio regole su che uso è possibile fare delle zone paludose, o su quali zone possono essere definite desertiche ecc. Gran parte della conoscenza raccolta dagli scienziati suggerisce il termine di legge. Chiaramente ci possono essere leggi con diversa qualità predittiva. Ad esempio le leggi che regolano il mercato in una certa zona non sono così precise come le leggi della dinamica di Newton. Il problem-solving coinvolge diversi stadi e componenti. Per prima cosa è necessario avere un obiettivo chiaro che si intende raggiungere. Il raggiungimento di questo obiettivo può essere valutato in una forma tangibile (minor costo) o intangibile (senso di soddisfazione della clientela). 1.4 La tecnologia del problem-solving Diverse definizioni di cos’è un GIS sono state date e ognuna di esse ha un significato particolare. E l’etichetta GIS è stata applicata a tante cose. Ad esempio ad un software che può essere acquistato e che adempie a funzioni ben precise (GIS software); la rappresentazione digitale di vari aspetti del mondo geografico, nella forma di insiemi di dati (GIS data); una comunità di persone che usano e sostengono l’uso di questi strumenti per vari scopi (GIS community); l’attività di usare i GIS per risolvere problemi o per fare scienza (fare GIS). Chiaramente sono tutte cose vere, e l’uso della terminologia dipende dal contesto. Tuttavia ci sono delle definizioni particolarmente utili: - un GIS è un contenitore di mappe in forma digitale uno strumento informatico per risolvere problemi di natura geografica un sistema di supporto alle decisioni spaziali un inventario meccanizzato di strutture e caratteristiche geografiche uno strumento per rivelare ciò che sarebbe altrimenti invisibile nell’informazione geografica uno strumento per fare operazioni sui dati geografici che sarebbe troppo noioso o complicato o in accurato fare a mano. 1.4.1 Storia del GIS Il GIS nasce in Canada alla metà degli anni ’60 come un sistema computerizzato di misurazione di mappe (CGIS: Canada GIS), che integra informazione di tipo tabulare con quella grafica per la rappresentazione di mappe. Alla fine degli anni ’60 l’US Bureau of Census pianifica la realizzazione di uno strumento utile alla realizzazione del censo della popolazione del 1970. Viene data vita al progetto DIME (Dual Independent Map Encoding) che associa le informazioni dettagliate su tutte le strade degli USA ai record del censo. I due progetti (CGIS e DIME) danno quindi vita ad un programma unitario presso il laboratorio di Computer Graphics and Spatial Analysis dell’università di Harvard, teso allo sviluppo di GIS general-purpose che potesse essere utile ad entrambe le esigenze. Tale programma portò alla realizzazione di ODISSEY GIS alla fine degli anni ’70. D’altra parte, già dagli anni ’60 i cartografi e le agenzie che si occupavano di mappe avevano cominciato a chiedersi come i computer potessero aiutare il loro lavoro, e alla fine degli anni ’70 la maggior parte delle principali agenzie di cartografie erano in larga parte computerizzate. Inoltre, un importante ruolo nello sviluppo dei GIS l’hanno avuto gli strumenti di misura remoti, come i satelliti che si sono cominciati a diffondere già dagli anni 50 (ad opera dei militari). Molte applicazioni e innovazioni sui GIS sono avvenute durante la guerra fredda, per opera dei militari (ad esempio il GPS). 3 Paper: GIS Georeferenziazione wwww.lvproject.com Dott. Lotti Nevio 1.4.2 Anatomia di un GIS - Network La rete per la distribuzione dei dati, la fruizione dei servizi, ecc. Dal 1993 si usa Internet, Steve Putz dello Xerox PARC Center ha realizzato la prima mappa interattiva web-based (http://mapweb.parc.xerox.com/map). - Hardware L’insieme di tutti i dispositivi utilizzati dall’utente per fare delle operazione sul GIS. - Software Gira sulle macchine degli utenti oppure accessibile via web con il browser. Venditori: Autodesk -> www.autodesk.com ESRI (Environmental Systems Research Institute) -> www.esri.com Intergraph Corp. -> www.ingr.com MapInfo -> www.mapinfo.com GE SmallWorld Systems Ltd. -> www.smallworld.co.uk - Database Consiste di una rappresentazione digitale di alcuni aspetti selezionati della superficie della terra. Le dimensioni variano da pochi MB a molti TB - Procedure Sono tutti quei meccanismi che assicurano che le attività di GIS stiano nel budget programmato, abbiano una buona qualità e intercettano i bisogni dell’organizzazione - Persone Tutti coloro che sono coinvolti nella realizzazione, nel mantenimento e nella fruizione di un GIS. 2.1 Rappresentare la geografia C’è una gran quantità di modi in cui è possibile rappresentare la geografia. Nessuno di questi è perfetto e nessuno è ideali per tutti i tipi di applicazione. Un parametro potrebbe essere l’accuratezza. 2.2 Il problema fondamentale I dati geografici collegano posto, tempo e attributi. Come ad esempio dire: “la temperatura nel pomeriggio locale del 2 dicembre 1999 alla latitudine 34 gradi nord, longitudine 120 gradi ovest, era di 18 gradi Celsius”. Tipi di attributi: - nominali: servono a distinguere un’entità da un’altra, ad esempio i nomi dei luoghi - ordinali: si dicono così se i loro valori seguono un ordine naturale. Ad esempio la suddivisione in classi - intervalli: vengono detti così quando le differenze tra valori hanno importanza. Ad esempio la scala delle temperature Celsius: dire 30 e 20 è differente da dire 20 e 10 4 Paper: GIS Georeferenziazione - wwww.lvproject.com Dott. Lotti Nevio frazioni: quando ha senso fare i rapporti. Una persona che pesa 100kg, pesa il doppio di una persona che pesa 50kg, mentre se ci sono 40 gradi non fa il doppio caldo di quando ce ne sono 20. Ci sono casi in cui i dati variano sensibilmente con il tempo (per esempio la temperatura, il tasso di umidità ecc.), mentre altri sono dal punto di vista temporale (e per una scala umana) statici, come il livello di altitudine della terra. Ci sono stati tentativi di rappresentare tutta la conoscenza geografica sul mondo in maniera digitale, soprattutto per scopi didattici (Digital Earth). Ma fino a che dettaglio arrivare? Sembra che più si guarda da vicino il mondo più dettagli si trovano, e questo processo sembra andare avanti all’infinito. Quindi, nella pratica, ogni rappresentazione deve essere parziale, ignorando certi attributi o semplificando in qualche modo. Nelle immagini digitali si usa spesso una bassa risoluzione spaziale. Ad esempio 10km, dove un oggetto più piccolo di questa misura non è visibile. Oppure un altro metodo è quello di considerare le aree che hanno delle proprietà comuni, come l’altitudine (ad esempio il mare). 2.3 Oggetti e campi 2.3.1 Oggetti Ci sono due schemi di natura concettuale per rappresentare i dati geografici. Dal punto di vista umano, viene più intuitivo distinguere in maniera precisa e netta le cose. Questo punto di vista si riflette nella schema a oggetti discreti. Secondo questo schema lo spazio è vuoto, a meno che non sia occupato da oggetti ben definiti, che sono istanze di categorie riconosciute. Gli oggetti geografici sono definiti attraverso la loro dimensione. Gli oggetti che occupano un’area sono detti bi-dimensionali. Mentre altri oggetti come le strade, le ferrovie sono più simili a linee, quindi ad oggetti uni-dimensionali. Altri oggetti ancora sono zero-dimensionali, e sono rappresentati come punti nello spazio di riferimento. Ci sono tanti campi in cui questo schema è utile, per esempio nella rappresentazione degli oggetti che fanno parte e compongono una città (edifici, strade, ferrovie ecc.). Ma ci sono altri fenomeni geografici che non vengono bene rappresentati da questo schema. 2.3.2 Campi Un problema della object-view, è che per rappresentare degli oggetti, è necessario definire bene le loro proprietà caratterizzanti. C’è invece un altro schema, detto field view, che descrive il mondo geografico attraverso un insieme di variabili, ognuna delle quali misurabile all’interno della superficie terrestre e i cui valori cambiano muovendosi nello spazio. Gli oggetti sono definiti dalla loro dimensione, mentre i campi sono definiti da cosa varia e con quale rapidità. (…) 2.4 Raster e vettori Sia la discrete object, sia la field view sono modelli concettuali, che non si riferiscono a come l’informazione geografica possa essere rappresentata in maniera digitale. Ci sono due metodi che invece riducono i fenomeni geografici in forme che possono essere codificate in un database, i modelli raster e vettoriale. Questi modelli si riferiscono agli schemi concettuali discussi sopra, in particolare il modello raster si riferisce allo schema field view, mentre il modello vettoriale si riferisce allo schema discrete object view. 2.4.1 Dati raster 5 Paper: GIS Georeferenziazione wwww.lvproject.com Dott. Lotti Nevio In una rappresentazione raster, lo spazio geografico è suddiviso in celle che sono quadrate nella maggior parte dei casi, oppure rettangolari. Ogni variazione geografica è quindi espressa assegnando proprietà o attributi alle singole celle. Le celle vengono chiamate pixel, termine comune quando si parla di visualizzazione. Una delle più comuni forme di dati raster viene dalle immagini satellitari. Le immagini variano a seconda della risoluzione spaziale. Chiaramente per rappresentare la superficie della terra in questa forma è necessario un processo di proiezione o appiattimento, visto che si tratta di una superficie curva ridotta ad una piatta. Il valore associato ad una data cella può essere assegnato in vari modi. Ad esempio usando la regola largest share (in cui la cella assume un valore in base al valore più diffuso al suo interno) oppure quella central point (in cui la cella assume il valore del suo punto centrale). Il primo metodo è preferito al secondo ma spesso il secondo viene usato per la facilità di calcolo. 2.4.2 Dati vettoriali In una rappresentazione vettoriale tutte le linee sono ottenute connettendo i punti con segmenti. Le aree sono ottenute attraverso linee chiuse, e vengono quindi rappresentate come poligoni. Mentre le spezzate vengono dette polyline. I punti, o vertici, hanno una precisa collocazione nello spazio. Questo metodo può sembrare più preciso rispetto ai dati raster, ma spesso gli oggetti nello spazio non possono essere localizzati con una grande accuratezza. 3.1 La Georeferenziazione Abbiamo parlato dell’informazione spaziale come composta da una tripla: il luogo, il tempo e gli attributi. E’ necessario poi poter assegnare un valore a ciascuno di questi elementi in modo da poter essere comunemente accettati e compresi dalle persone che intendono usarli e comunicarli. Ad esempio, sul tempo, è comunemente diffuso e accettato il modello del calendario. Ma mentre il tempo è opzionale nei dati geografici, la localizzazione non lo è nel caso dei dati geografici, quindi è necessario studiare delle tecniche e dei metodi per localizzare i dati e mettere insieme dati che si riferiscono allo stesso luogo in modo da formare delle mappe. I dati che non posseggono una localizzazione sono detti non-spaziali o a-spaziali. Ci sono diversi termini che vengono usati per descrivere l’atto di assegnare una localizzazione ad atomi di informazione. Possiamo usare i verbi georeferenziare, geolocalizzare e geocodificare, e dire che i fatti sono stati georeferenziati o geocodificati. Possiamo dire di etichettare (tag) i record con le località geografiche oppure che li abbiamo localizzati. Il primo requisito della georeferenziazione è che deve essere unica, in modo che c’è un solo luogo (geografico) associato ad una data georeferenziazione, e quindi non è possibile fare confusione su di esso; inoltre il significato della georeferenziazione deve essere condiviso da tutte le persone che avranno a che fare con quella informazione, inclusi i loro GIS. Ad esempio l’indirizzo v.le S. Martino 50, 98100 Messina (ITALIA) è un indirizzo che punto ad un solo edificio (non ci sono altri edifici con lo stesso indirizzo) ed è sufficientemente chiaro per chiunque voglia spedire una lettera da ogni parte del mondo. Per essere più utile possibile, una georeferenziazione deve essere persistente nel tempo, perché sarebbe molto confusionario se cambiasse di frequente, e costoso se si dovessero cambiare tutti i record associati alla georeferenziazione che cambia. Questo potrebbe essere un problema nel caso in cui un sistema di georeferenziazione è condiviso da più agenzie con diverse priorità. Per esempio, un comune potrebbe espandersi acquisendo nuovi terreni e creando problemi alle agenzie di mappatura oppure a dei ricercatori che vogliono studiare il comune nel tempo. Inoltre spesso le vie delle città cambiano e le agenzie postali a volte rivedono i codici di avviamento postale. Possono inoltre cambiare i nomi delle città o la loro trascrizione convenzionale nell’alfabeto latino. 6 Paper: GIS Georeferenziazione wwww.lvproject.com Dott. Lotti Nevio Ogni georeferenziazione è associata ad una risoluzione spaziale, uguale alle dimensioni dell’area associata alla georeferenziazione. Northing 852 100 km Easting 624 SK624852 Figura 1. Vengono assegnate 3 cifre per l’Easting e 3 cifre per il Northing, avendo quindi la precisione di 100m. Ad esempio per un indirizzo di posta possiamo dire che ha una risoluzione pari alle dimensioni dell’area dell’edificio al quale si riferisce. Molti sistemi di georeferenziazione sono unici soltanto dentro un’area o un dominio della superficie della Terra. Per esempio ci sono diverse città degli USA che si chiamano Springfield. Il nome della città è quindi unico nel dominio di uno stato (o di una regione). Allo stesso modo le strade nei confronti delle città. Mentre alcuni sistemi di georeferenziazione sono basati su semplici nomi, altri sono basati su vari tipi di misurazioni, e sono chiamati georeferenziazioni metriche. Ad esempio latitudine e longitudine, e vari sistemi di coordinate. Un enorme vantaggio di questi sistemi è che garantiscono una risoluzione potenzialmente fine all’infinito. Un altro è che dalle misurazioni di due o più località è possibile calcolare le distanze, un requisito molto importante per i GIS. Altri sistemi semplicemente ordinano le località. Ad esempio la numerazione delle strade. 3.2 Nomi Dare nomi alle località è la forma più semplice di georeferenziare, e probabilmente è stata la prima ad essere utilizzata. Ogni caratteristica distintiva di un paesaggio, come un albero particolare, o una collina, può essere usato come punto di riferimento per due persone che vogliono scambiarsi un’informazione. Le zone abitate poi sono state rapidamente riempite di targhe che servivano a chi le vedeva di orientarsi. Inoltre, il linguaggio può estendere le potenzialità di questo sistema attraverso parole come “tra” oppure “vicino”. 7 Paper: GIS Georeferenziazione wwww.lvproject.com Dott. Lotti Nevio Ma questo metodo è molto limitativo. Ad esempio dire che qualcosa si trova in Asia è molto generico, dato che l’Asia copre 43 milioni di km2. Inoltre ci sono molti nomi che sono conosciuti da piccole comunità e che non possono essere condivisi con il resto del mondo. 3.3 Indirizzi e codici postali Gli indirizzi postali sono stati introdotti con la diffusione della distribuzione della posta nel XIX secolo. Si basano su diverse considerazioni: - ogni casa o ufficio è un potenziale destinatario di posta le case e gli uffici sono allineati in sentieri o strade e sono numerati secondo questa disposizione sentieri e strade hanno nomi che sono “localmente” unici le aree locali hanno nomi che sono unici dentro regioni più ampie le regioni hanno nomi che sono unici all’interno dei paesi Se queste assunzioni sono vere, allora la posta fornisce un’unica identificazione per ogni casa nella Terra. E’ chiaro che questo sistema è molto legato alle attività umane. Ad esempio, il monte Everest non ha un indirizzo di posta. Inoltre ci sono delle culture che non prevedono la numerazione consequenziale delle strade (ad esempio in Giappone, dove la numerazione riflette la data di costruzione, quindi è di tipi temporale e non spaziale). Molti GIS convertono le coordinate postali, in altri tipi di coordinate, come latitudine e longitudine. I codici postali sono stati introdotti nel XX secolo per semplificare l’ordinamento e la distribuzione della posta. 3.4 Sistema di riferimento lineare Il sistema di riferimento lineare definisce una posizione misurando la distanza da un punto di riferimento iniziale e seguendo un percorso definito sulla rete. via 1 via 3 via 2 Figura 2. Sistema di riferimento lineare Ad esempio, si può localizzare l’incidente nella figura, misurando la distanza sulla via 2, a partire da un punto di riferimento noto, che è l’intersezione della via 2 con la via 1. Questo sistema è molto vicino a quello utilizzato nella numerazione delle strade, ma al contrario di quest’ultimo è prevista una misurazione delle distanze. 8 Paper: GIS Georeferenziazione wwww.lvproject.com Dott. Lotti Nevio Il sistema di riferimento lineare è molto usato in applicazioni che riguardano reti lineari, come ad esempio le autostrade (16 km sulla A1), le ferrovie (100 Km sulla Messina-Palermo), le reti di distribuzione dell’energia elettrica, oleodotti, canali ecc. Tale sistema è usato dalle società autostradali per definire ad esempio la localizzazione dei ponti, incidenti stradali ecc. Per queste applicazioni è un sistema utile, ma per altre è molto importante avere la possibilità di convertire le coordinate in latitudine e longitudine. 3.5 Catasto Il catasto è definito come una mappa delle proprietà dei terreni in un’area, utilizzato allo scopo di tassare quei terreni, o per creare un registro pubblico delle proprietà. Il processo di suddivisione crea nuove particelle (catastali) suddividendo quelle esistenti. Le particelle in un catasto sono univocamente determinate, attraverso un numero o un codice, e sono anche ragionevolmente persistenti nel tempo, quindi soddisfano i requisiti di un sistema di georeferenziazione. Tuttavia molto spesso i proprietari, o gli utenti in genere, non conoscono questa numerazione, e quindi l’utilizzo di questo sistema è confinata ad una utenza tecnica. 3.6 Misurare la Terra: latitudine e longitudine I più potenti sistemi di georeferenziazione sono quelli che forniscono la possibilità di avere una risoluzione spaziale molto fine, che permette di calcolare le distanze fra coppie di punti, e supporta altre forme di analisi spaziali. Questo sistema è per molti versi il più esaustivo, ed è spesso chiamato sistema geografico di coordinate, basato sulla rotazione della Terra intorno al suo centro di massa. Per definire latitudine e longitudine dobbiamo per prima cosa identificare l’asse della rotazione terrestre. Il centro di massa della Terra cade proprio in questo asse, e il piano passante dal centro di massa e perpendicolare all’asse definisce l’Equatore. Le “fette” di Terra parallele all’asse e perpendicolari all’Equatore definiscono le linee di uguale longitudine, come i segmenti degli spicchi di arancia. Una di queste linee, che convenzionalmente passa dal Royal Observatory di Grenwich (in Inghilterra), definisce lo zero della longitudine, e l’angolo che questa linea forma con qualsiasi altra nel globo è la misura della longitudine. Ognuno dei 360 gradi di longitudine è suddiviso in 60 minuti e ognuno di questi in 60 secondi. Ma è molto più convenzionale usare la misura della longitudine con i gradi Est od Ovest, quindi la longitudine va da 180° ovest a 180° est. Inoltre, poiché i dati numerici vengono suddivisi equamente nei computer tra positivi e negativi, i gradi ovest vengono considerati negativi e quelli est positivi, usando i decimali piuttosto che i minuti e i secondi. Una linea di costante longitudine viene detta meridiano. La longitudine può essere definita in questo modo per qualsiasi solido di rotazione, aldilà della sua forma, perché l’asse di rotazione e il centro di massa sono sempre definiti. Ma la definizione di latitudine presuppone che sappiamo qualcosa sulla forma. La Terra ha una forma complessa che è soltanto approssimativamente una sfera. Una rappresentazione più corretta è un ellissoide di rotazione, cioè la figura che si ottiene prendendo un’ellisse e rotandola attorno all’asse minore. La differenza tra un ellissoide e una sfera è misurata dal suo appiattimento, o la riduzione nell’asse minore dell’asse maggiore. L’appiattimento è definito da: f = (a – b )/a dove a e b sono le lunghezze dell’asse maggiore e minore rispettivamente. La Terra è leggermente appiattita (1/300). 9 Paper: GIS Georeferenziazione wwww.lvproject.com Dott. Lotti Nevio Negli ultimi 200 anni si sono fatti tanti sforzi per trovare degli ellissoidi che meglio approssimassero la Terra in alcuni paesi in particolare, in maniera tal che le agenzie di mappatura nazionali potessero fare mappe accurate. I primi ellissoidi variavano molto nei loro parametri basilari e non erano centrati nel baricentro della Terra. Ma lo sviluppo di missili balistici intercontinentali negli anni ’50 e la necessità di avere con precisione gli obiettivi, insieme a nuovi dati disponibili attraverso i satelliti, hanno portato alla ricerca di uno standard internazionale. Senza un unico standard, le mappe fatte dai singoli paesi su ellissoidi diversi non avrebbero mai potuto combaciare nei loro confini, e correzioni si rendevano necessarie muovendosi da un paese all’altro (ad esempio nelle rotte delle navi o degli aerei). L’ellissoide conosciuto come WGS84 (World Geodetic System del 1984) è adesso largamente accettato, e la mappatura del Nord America è stata fatta in conformità ad esso attraverso il virtualmente identico North America Datum del 1983 (NAD83). Ma molti altri ellissoidi rimangono in uso in altre parti del mondo, e molti vecchi dati ancora si riferiscono ai primi standard, come il North American Datum del 1927 (NAD27). Adesso possiamo definire la latitudine. Figura 2. Definizione di latitudine del punto rosso, come l'angolo tra l'Equatore e la linea perpendicolare all'ellissoide. La Figura 3 mostra una linea disegnata lungo un punto di interesse perpendicolare all’ellissoide in quella posizione. L’angolo formato da questa linea con il piano dell’Equatore è definito come la latitudine del punto, e varia da 90 sud a 90 nord. Anche qui le latitudini sud sono usualmente memorizzate come numeri negativi e quelle nord come numeri positivi. La latitudine è normalmente simbolizzata con la lettera greca fi (φ) e la longitudine con la lettera greca lambda (λ), quindi i rispettivi range possono essere espressi matematicamente con: -180 ≤ λ ≤ 180; -90 ≤ φ ≤ 90. Una linea di latitudine costante è detta parallelo. E’ importante considerare che cosa significano latitudine e longitudine in termini di distanze sulla superficie della terra. Due punti che si trovano sulla stessa linea nord-sud di longitudine, e separate da un grado di latitudine sono distanti 1/360 della circonferenza della terra, o circa 111 km. Un 10 Paper: GIS Georeferenziazione wwww.lvproject.com Dott. Lotti Nevio minuto di latitudine corrisponde a 1.86 km, che anche definisce un miglio nautico, un’unità di misura largamente utilizzata in navigazione. Un secondo di latitudine corrisponde a circa 30 m. Ma le cose sono più complicate nella direzione est-ovest, e queste cifre si applicano solo all’Equatore, dove le linee di longitudine sono maggiormente distanti. Lontani dall’Equatore le linee di latitudine diventano sempre più piccole, fin quando non svaniscono ai poli. Il grado di accorciamento è approssimativamente uguale al coseno della latitudine, cos φ, che è 0.866 a 30 gradi Nord o Sud, 0.707 a 45 gradi, e 0.5 a 60 gradi. Quindi un grado di longitudine è soltanto 55 km lungo il confine nord della provincia Canadese dell’Alberta (che è esattamente a 60 gradi Nord). Dati latitudine e longitudine è possibile calcolare la distanza fra una qualsiasi coppia di punti. Supponendo che la Terra sia sferica (per semplificare la formula), la distanza fra due punti sulla superficie è data dalla lunghezza dell’arco che li congiunge, ottenuto disegnando un cerchio che taglia la sfera e passa per i due punti e per il centro della sfera stessa. La lunghezza di quest’arco su una Terra sferica di raggio R è data da: R cos-1 [sinφ1 sinφ2 + cosφ1 cosφ2 cos(λ1 – λ2)] Dove gli indici denotano i due punti. Per esempio, la distanza di un punto sull’Equatore alla longitudine 90 Est (nell’Oceano Indiano tra lo Srilanka e l’isola indonesiana di Sumatra) e il Polo Nord si trova calcolando la formula per φ1 = 0, λ 1 = 90, φ2 = 90 e λ 2 = 90. Spesso si usano i radianti (1 radiante è 57.30 gradi e 90 gradi sono π/2 radianti). 3.7 Proiezioni e coordinate Latitudine e longitudine definiscono il luoghi della terra in termini di angoli con riferimenti ben definiti: il Royal Observatory di Greenwich (UK), il centro di massa e l’asse di rotazione. Per questo costituiscono il sistema più completo di georeferenziazione, e supportano una certa quantità di possibilità di analisi, inclusa la possibilità di calcolare la distanza tra due punti sulla superficie curva della terra. Ma molte tecnologie per lavorare con i dati geografici si riferiscono a una geometria piana, come per esempio la carta e le stampe, e si sono evolute secoli prima della nascita dei GIS. Per varie ragioni, quindi, molto lavoro nei GIS ha a che vedere con una Terra piatta o proiettata, nonostante il prezzo che si paga nella distorsione conseguente all’appiattimento. Specificamente, la Terra è spesso appiattita perché: - la carta è piatta, ed è usata come mezzo di input e di output dei dati geografici i dati raster sono intrinsecamente piatti, poiché è impossibile ricoprire una superficie curva con quadrati eguali senza sovrapposizioni la pellicola fotografica è piatta (ad es. le immagini aeree o da satellite) quando la Terra viene vista dallo spazio, la parte nel centro dell’immagine ha il maggior dettaglio, allontanandosi dal centro si perde dettagli, fino a perdere la possibilità di vedere la parte posteriore; per vedere la Terra completa con approssimativamente lo stesso dettaglio, deve essere distorta in un qualche modo, e il più conveniente è quello di appiattirla. Le coordinate cartesiane assegnano due coordinate a tutto i punti di una superficie piana, misurando la distanza da un’origine. 4.1 La natura dei dati geografici Le nostre vite sono infinitesimali comparate con l’estensione geografica e con la storia del mondo, ma sono comunque molto intricate nei dettagli. Il comportamento umano si esprime nello spazio geografico, anche nelle attività quotidiane (dove andare, che fare, e quanto tempo spendere nel fare 11 Paper: GIS Georeferenziazione wwww.lvproject.com Dott. Lotti Nevio qualcosa), e anche nelle attività a lungo termine, su dove vivere, che lavoro fare ecc. In termini delle applicazioni GIS queste sono rispettivamente esempi di decisione operazionali (breve termine) e strategiche (lungo termine). Un obiettivo principale dell’analisi geografica è capire come entrambi questi tipi di decisioni sono strutturate in relazione allo spazio. Insieme, lo spazio e il tempo costituiscono il contesto geografico, e ne definiscono anche i limiti. Spesso i comportamenti ripetono un certo schema in maniera periodica, ad esempio le attività della vita quotidiana (andare a scuola o al lavoro…). Abbiamo detto sopra che un problema dei GIS è decidere cosa prendere e cosa lasciare nel processo di digitalizzazione dell’informazione spaziale. Ci interesserà ricordare eventi spaziali o temporali rilevanti, senza essere deviati da dettagli irrilevanti. Inoltre, determinati eventi appaiano come una ripetizione di eventi già verificatisi nel passato (o in un altro luogo), e hanno una certa regolarità. Tuttavia il livello di dettaglio al quale noi proviamo a rappresentare la realtà spesso determina se dei fenomeni spaziali o temporali appaiono regolari o no. Ma anche molto incide il grado di eterogeneità dei dati spaziali, cioè la tendenza dei luoghi geografici ad essere diversi tra loro. L’eterogeneità riguarda l’aspetto dei luoghi geografici, ma anche il modo in cui i processi intervengono sull’aspetto. La prima legge della geografia (Waldo Tobler) dice che tutto è correlato con qualsiasi altra cosa, ma le cose più vicine lo sono di più di quelle distanti. Formalmente, questa proprietà è conosciuta come autocorrelazione , che dà la misura di quanto le cose sono tra loro correlate. La relazione tra eventi consecutivi nel tempo è formalizzata nell’analogo concetto di autocorrelazione temporale. L’analisi delle serie temporali è in un certo senso più intuitiva, perché il tempo scorre in una sola dimensione: gli eventi presenti sono consequenziali ai passati. Nell’analisi dei dati spaziali, il processo che fa sorgere l’autocorrelazione spaziale può essere bidimensionale e tridimensionale. Capire il processo dell’autocorrelazione può portare ad una rappresentazione migliore dei dati spaziali. Si può ad esempio generalizzare a partire da un campione. E’ comunque una proprietà che può essere sfruttata , poiché se noi riusciamo a misurare e capire la natura dell’autocorrelazione, diventa più semplice costruire rappresentazioni generalizzate di distribuzioni spaziali. Un aspetto molto importante è quello della scala o del livello di dettaglio al quale rappresentare un fenomeno. La scala e la struttura spaziale di una particolare applicazione suggeriscono i modi in cui noi dovremmo campionare la realtà geografica e i modi in cui noi dovremmo interpolare i campioni per costruire la nostra rappresentazione. 4.2 Autocorrelazione e scala L’autocorrelazione spaziale misura il tentativo di mettere assieme simultaneamente le similarità nella localizzazione degli oggetti spaziali e nei loro attributi. Se a una similarità spaziale corrisponde una similarità negli attributi si parla di autocorrelazione positiva. Contrariamente, si dice che c’è una autocorrelazione negativa quando oggetti molto vicini nello spazio tendono ad essere molto distanti nei valori degli attributi. Un’autocorrelazione nulla c’è quando c’è l’indipendenza dagli attributi dalla localizzazione. Tuttavia spesso per apprezzare l’autocorrelazione è necessario avere un adeguato intervallo di campionamento. Ad esempio è probabile che campionando le attività di qualcuno che va al lavoro ogni mattina alle 8, si troverà che campionando ogni 24 ore egli è sempre intento a fare la stessa cosa. Quindi c’è un alto livello di autocorrelazione tra gli eventi. Ma se l’intervallo di campionamento non fosse 24, ma 17 ore non sarebbe così. Lo stesso può avvenire per fenomeni non temporali, ma spaziali. In breve , le misure di autocorrelazione spaziale e temporale sono entrambe dipendenti dalla scala. 4.3 Campionamento spaziale 12 Paper: GIS Georeferenziazione wwww.lvproject.com Dott. Lotti Nevio A questo punto è chiaro che una selezione accurata e efficace di un campione è fondamentale per rappresentare i fenomeni spaziali (o spazio-temporali in genere). Possiamo pensare al campionamento come al processo di selezione di punti da un campo continuo oppure, se il campo è rappresentato da un insieme di oggetti , selezionando alcuni di questi oggetti e tralasciando gli altri. Un campionamento scientifico richiede che ognuno di questi elementi ha una specifica e conosciuta probabilità di essere selezionato. Possiamo dire che ogni rappresentazione spaziale viene fuori da un processo di campionamento. Ad esempio nelle immagini da satellite, dove i pixel rappresentano porzioni di territorio con un’altitudine media. Se lo schema di campionamento è buono, i dati geografici saranno buoni, e sarà possibile inferire (statisticamente) le proprietà geografiche complessive dal campione. Spesso un metodo che si usa è quello dei campioni random, ma può risultare inefficace a volte per una serie di numeri sfortunata. Un altro metodo è quello di scegliere un intervallo di campionamento k che è l’inverso del rapporto tra la popolazione totale N e la dimensione n del campione). In questo modo si crea una griglia uniforme sullo spazio di riferimento. Un metodo che mette assieme i due precedenti è quello di fare comunque una griglia, all’interno della quale il campionamento viene fatto random. Ancora un altro metodo è fare una griglia con intervalli di campionamento random, oppure concentrarsi su alcune zone dove i dati formano dei cluster. Questi metodi vanno adattati alle varie situazioni e comunque un campione più grande genera una rappresentazione migliore della realtà in genere. 4.4 Interpolazione spaziale Una volta ottenuto il campione, è necessario “riempire” i vuoti tra gli elementi del campione per dare una rappresentazione più continua della realtà geografica. Questo richiede la conoscenza degli effetti della distanza dai campioni. Cioè, abbiamo bisogno di una funzione di interpolazione. La legge di Tobler implicherebbe un continuo, dolce effetto attenuante a causa della distanza sui valori degli attributi di oggetti spaziali adiacenti o contigui. Ad esempio nella diffusione di un gas inquinante da un impianto chimico che si espande in maniera circolare essendo il gas più rarefatto man mano che ci si allontana dalla sorgente. Oppure la scia di una aereo a reazione si espande in maniera ortogonale rispetto alla traiettoria dell’aereo. La precisa natura delle funzioni usate a questo scopo può variare a seconda dell’applicazione. Ci sono tuttavia alcune funzioni standard. In termini matematici, prendiamo b come parametro che condiziona la velocità alla quale il peso wij decresce con la distanza. Una b piccola implica una piccola crescita, una b grande implica una grande crescita. In molte applicazioni, la scelta di una funzione rispetto a un’altra è frutto dell’esperienza, dell’adattamento a un particolare dataset, e di una convenzione. Le funzioni più usate sono le seguenti. Lineare: wij = -b dij Potenza: wij = dij ^(-b) Esponenziale: wij = exp(-b dij ) In questi modelli lo spazio si suppone isotropo (non ci sono dimensioni privilegiate rispetto ad altre). 4.4 Misurare gli effetti della distanza come autocorrelazione spaziale Possiamo confrontare i valori degli attributi spaziali definendo una matrice W in ogni elemento wij misura la similarità delle localizzazioni i e j (righe e colonne della matrice). Inoltre wii = 0 per ogni 13 Paper: GIS Georeferenziazione wwww.lvproject.com Dott. Lotti Nevio i. Com’è misurata la similarità? Per oggetti con un’area, la contiguità, o l’adiacenza, è spesso presa come la più tangibile misura di prossimità spaziale. Su questa base la figura sotto può essere riespressa come un grafo. Codificando wij = 1 se le regioni i e j sono contigue e wij = 0 altrimenti, possiamo ottenere una matrice di pesi (denotata in genere W). L’autocorrelazione spaziale riguarda due tipi di informazione: la similarità tra gli attributi e la similarità nella localizzazione. I modi in cui gli attributi possono essere misurati dipendono dai dati presenti, mentre il calcolo della prossimità spaziale dipende dal tipo degli oggetti. Per semplificare le cose, usiamo la seguente notazione: 1 1 2 2 4 3 3 5 4 5 n i, j zj cij wij il numero di oggetti nel campione due diversi oggetti il valore dell’attributo di interesse per l’oggetto i la similarità degli attributi di i e j la similarità delle localizzazioni di i e j , con wii = 0 per ogni i. In generale, ogni misura di autocorrelazione spaziale è stata creata per comparare l’insieme di similarità degli attributi cij con l’insieme delle similarità posizionali wij , combinandole in un singolo indice sotto forma di un prodotto in croce: SOMMAi SOMMAj (cij wij ) In altre parole, il totale è ottenuto moltiplicando ogni cella della matrice W con la sua corrispondente in C, e sommando. 5. Modellizzazione dei dati geografici 5.1 Introduzione 14 Paper: GIS Georeferenziazione wwww.lvproject.com Dott. Lotti Nevio Il cuore di ogni GIS è il modello dei dati, che è una serie di costrutti per rappresentare gli oggetti e i processi nell’ambiente digitale del computer. Gli utenti interagiscono con i GIS per fare delle operazioni come la creazione e la visualizzazione di mappe, l’interrogazione delle basi di dati spaziali, e l’analisi dei dati geografici. Poiché il tipo di analisi che è possibile fare dipende molto dal modello di rappresentazione dei dati utilizzato, la decisione di quale modello utilizzare è un aspetto critico nella determinazione del successo di un’applicazione GIS. Ci sono diversi livelli di astrazione del modello, a partire dalla realtà, che è popolata da fenomeni del mondo reale. Il primo livello è rappresentato dal modello concettuale, che è molto vicino al modo di pensare umano e che aiuta a distinguere i concetti che poi andranno formalizzati. Il modello logico è invece una rappresentazione della realtà più orientata alla implementazione, e che fa uso spesso di diagrammi e liste. Per ultimo abbiamo il modello fisico, che implementa i modelli più astratti attraverso file e database. Nella modellazione dei dati, gli utenti e gli sviluppatori devono interagire durante il processo. La prima fase comincia con la definizione dei tipi di oggetti che devono essere rappresentati nel GIS e si conclude con la descrizione concettuale dei vari tipi di oggetti e correlazioni tra loro. Completata questa fase, il lavoro successivo porta alla creazione di diagrammi e liste che descrivono il nome degli oggetti, il loro comportamento, e il tipo di interazione tra loro. I modelli logici sono indipendenti dalla implementazione (livello fisico). L’ultima fase riguarda la creazione di un modello che mostra come gli oggetti sotto studio possono essere digitalizzati in un GIS. I modelli fisici descrivono esattamente i file o le tabelle dei database usati per memorizzare i dati, le relazioni tra i tipi di oggetti, e le precise operazioni che possono essere fatte. Un modello dei dati consente agli sviluppatori e agli utenti di avere una comune comprensione di ciò che si rappresenta. 5.2 Modelli dei dati Tutti i modelli si basano principalmente sui modelli concettuali a oggetti e a campi. Spesso nella modellazione si raggruppano le entità che hanno lo stesso tipo geometrico. In questo modo si formano i layer, che rendono più efficiente la memorizzazione dei dati nel database. Questo termine è però spesso usato anche per indicare uno specifico dataset. 5.2.1 Il modello raster Tale modello usa un array di celle, o pixel, per rappresentare gli oggetti del mondo reale. Le celle possono assumere dei valori numerici, interi o reali, in accordo con uno schema di codifica. Nel caso più semplice il valore assunto da una cella può essere un bit, normalmente si preferisce un numero reale. In alcuni casi per ogni cella è possibile avere più attributi. I dati raster sono abitualmente memorizzati come array di valori di una griglia, con dei metadati sull’array contenuti in un’intestazione. Tipicamente i metadati includono le coordinate geografiche dell’angolo in alto a sinistra della griglia, la dimensione delle celle e il numero di righe e colonne. L’array stesso è normalmente memorizzato in un file compresso o come record in un DBMS. Ci sono varie tecniche di compressione, ad esempio la codifica run-length, la codifica a blocchi. 5.2.2 Il modello vettoriale In questo modello, ogni oggetto del mondo reale è classificato in un tipo geometrico: punto, linea o poligono. I punti sono memorizzati come coppie di coordinate, le linee come serie ordinate di punti, e i poligoni come insiemi di linee che si chiudono a formare un’area. Le coordinate che definiscono la geometria di un oggetto possono avere 2, 3 o 4 dimensioni (nel caso in cui ci sia anche la variabile temporale). In alcuni casi le feature lineari possono essere rappresentate non soltanto con delle linee ma anche attraverso curve matematiche (come le spline). 15 Paper: GIS Georeferenziazione wwww.lvproject.com Dott. Lotti Nevio 5.2.3 Feature semplici Le entità geografiche che usano il modello vettoriale sono chiamate spesso feature. Le feature in un database geografico sono raggruppate in classi, oppure, nel caso di memorizzazione in un database, in una tabella, dove ogni riga si riferisce ad una singola feature, e le colonne rappresentano le proprietà delle feature. In genere i GIS gestiscono due tipi di feature: semplici e topologiche. La struttura dei dataset formati da linee e poligoni nel caso di feature semplici è a volte chiamata spaghetti, perché proprio come gli spaghetti tutti gli oggetti possono sovrapporsi e incrociarsi e non c’è alcun tipo di relazione tra di loro. 16