Prima parte
Transcript
Prima parte
"Materiale ad esclusivo uso interno del corso. E' autorizzata la riproduzione da supporto informatico, ad uso personale. E' vietato qualsiasi utilizzo commerciale del presente materiale” La natura non si ripete: la variabilità è l’attitudine di una grandezza di assumere valori o modalità diverse in un campo di possibilità, detto campo di variabilità, che può essere finito o infinito E’ esperienza quotidiana avvertire la variabilità. La geografia osserva ed analizza un particolare aspetto della variabilità che è quello evidenziato nelle diverse manifestazioni territoriali e l’oggetto di studio è l’identificazione e la classificazione della REGIONE La Statistica offre strumenti che di ausilio per le misurazioni della variabilità in uno spazio teorico. Il corso mostra la possibilità di coniugare modelli teorici e realtà. La variabilità si osserva e, in particolare in ogni indagine scientifica volta allo studio di un qualsiasi fenomeno, si rileva sulla misura di una grandezza in esame, opportunamente definita e circoscritta: ad esempio la variabilità osservata nel reddito da lavoro personale su un gruppo di unità di riferimento, la variabilità osservata nel diverso peso di una sostanza chimica su una bilancia ad alta precisione, la variabilità riscontrata nella presenza di aree boschive in dati territori ecc, ecc….. Dall’osservazione ripetuta e misurata di un fenomeno si ottiene la DISTRIBUZIONE, come, ad esempio: Distribuzioni di caratteri fisici: fasce climatiche , acque e deserti… Distribuzioni caratteri sociali: religioni, etnie, culture,redditi, città.. Indicato con X qualsiasi fenomeno osservazionale, così detto perchè su di esso è possibile una qualche forma di misurazione (che implicitamente è anche una rilevazione), il problema scientifico collegato alla variabilità riscontrata in X, è quello di conoscere le qualità, i requisiti e i comportamenti strutturalmente o tendenzialmente stabili di X. Si tratta di realizzare una analisi scientifica che permetta di pervenire a conclusioni non soggettivamente ma oggettivamente valide in relazione allo stato delle conoscenza e degli strumenti di analisi utilizzati. Il processo di ricerca richiede una pluralità di misurazioni e la loro successiva elaborazione con metodi di analisi che ne garantiscano un oggettivo trattamento e, unitamente, forniscano l’informazione sul grado di attendibilità dei risultati. La fonte della variabilità nasce dal fatto che sulla manifestazione di un fenomeno influiscono moltissimi fattori, alcuni noti dei quali si conosce l’influenza esercitata sul fenomeno, e che sono detti “sistematici” ma moltissimi altri genericamente chiamati “fattori accidentali “ o “caso”. Anche questa è una distinzione che ha finalità di comodo o di “modello di riferimento” perché la rilevazione reale presenta modalità molto complesse. Ad esempio è un modello di comodo adottare la divisione delle ore del giorno secondo i fusi orari, mentre l’ora varia con continuità sul territorio. Attenzione: il fenomeno per essere oggetto di analisi deve poter essere misurato ma : - - se la scala di misura è alquanto grossolana il risultato delle misurazioni su X, al variare delle condizioni ambientali, di tempo di luogo o altro, nelle quali si realizza la misurazione, sembrerà rimanere costante da prova a prova e potrà essere sintetizzato da una sola misura; in questo caso e a questo livello di misurazione il carattere o fenomeno X, non mostra di poter variare e non ha rilevanza statistica mentre la dinamica osservata potrà essere espressa da una rigida “funzione matematica”; se si usa una scala di misura raffinata e adatta allo scopo della ricerca, al variare delle condizioni ambientali le misurazioni realizzate su X non saranno più costanti ma presenteranno una variazione, cioè il fenomeno si presenta come una “funzione statistica” caratterizzata, cioè da una incertezza sui valori che si osserveranno nelle singole rilevazioni. La funzione matematica possiamo dire che è una funzione statistica con variabilità nulla. Si chiama “unità statistica” il singolo elemento sul quale viene rilevato il carattere o fenomeno X in esame ed è il supporto, la base elementare che porta in se’ tutti i requisiti, spesso moltissimi, ma sulla quale verrà rilevato e misurato solo quell’aspetto di X che è operativamente definito e circoscritto nei termini delle finalità della ricerca in oggetto Il metodo quantitativo: contributo per la conoscenza Lord Kelvin: “quando si può misurare ciò di cui si discorre, e lo si può esprimere in termini numerici, allora si conosce qualcosa dell’oggetto in questione; ma quando non lo si può misurare, quando non risulta esprimibile in termini numerici allora la nostra conoscenza risulta lacunosa e di genere non soddisfacente”. I metodi classici della statistica descrittiva usati su fenomeni legati al territorio sono metodi di base finalizzati a creare sintesi informative che rendano oggettivamente evidenti quegli aspetti strutturali non percepibili o quantificabili con la semplice ispezione dell’eterogenea massa delle informazioni disponibili, ma che sono riconducibili a fattori legati alla localizzazione dei dati. Alcuni temi e procedure della Statistica descrittiva quali: le rappresentazioni grafiche; le misure della tendenza centrale; della variabilità e della concentrazione, saranno distintamente trattate in riferimento ai dati puntuali, areali e direzionali. Queste metodologie della statistica descrittiva forniscono indicazioni sintetiche e spesso incisive sugli aspetti d’interesse di quanto oggetto di studio Gli strumenti statistici di analisi, invece, come ad es. la correlazione, l’autoregressione spaziale, i modelli lineari, i test statistici,… sono un oggettivo ausilio per la verifica della consistenza e del grado di affidabilità di ipotesi di lavoro o di ricerca. La statistica è una scienza costituita da una serie di metodologie utilizzate per la raccolta, per l’analisi, per la presentazione, per l’interpretazione dei risultati ottenuti su dati osservazionali relativi a studi su problematiche di ricerca o per supporto per interventi in situazioni di incertezza. Gestione delle misurazioni= A)Raccolta e sistemazione dei dati B) applicazione di metodologie ad hoc per un analisi oggettiva , c) valutazione, D)utilizzazione dei risultati Il metodo scientifico: modo di apprendere-GALILEO Lo schema di analisi scientifica presentato nelle vignette è elementare ( è tratto da un libro di scuola media), ma risulta illuminante nella sua semplicità. In effetti una indagine statistica si svolge secondo una dinamica che generalmente segue il seguente iter: -si stabilisce il tema e la finalità della problematica di ricerca che viene operativamente e pragmaticamente molto definita e circoscritte per realizzare una corretta individuazione delle “unità statistiche” e una precisa rilevazione o misurazione del carattere X secondo criteri di scala predefiniti; ESEMPIO -si raccolgono le informazioni (rilevazione dei dati) e si procede al controllo e alla sistemazione delle stesse per la formulazione del “dato statistico”, ovvero della misura di X che sarà oggetto di elaborazione; - si elaborano i dato con metodologie opportune; - si analizzano i risultati. Le metodologie o modelli statistici sono rappresentazioni generalizzate o schematiche di particolari aspetti della realtà che fungono quasi da “scheletro” mentre la loro applicazione a casi concreti produce un “corpo”, ovvero un insieme di risultati, che conducono ad una approfondita e spesso risolutiva conoscenza dei fatti e del contesto da cui provengono. Interesse della Statistica anche per la Geografia. Si prende in esame il fattore spazio non solo come luogo di accadimento della realtà ma come fattore che interagisce, condiziona, determina i fenomeni d’interesse e, rispetto al quale si parlerà di Statistica spaziale o di Statistica territoriale, come vedremo. Nel corso verranno affrontati i seguenti argomenti 1)Tipologie dei dati spaziali: riguarda la particolare unità di analisi e la sua sistematizzazione. Nel corso si presenterà da distinzione tra i diversi tipi di dati spaziali: Punti, linee, aree e direzioni e si presenteranno le loro specificità. 2)Analisi descrittiva dei dati statistici che implica:l’osservazione e la raccolta dei dati sul fenomeno oggetto di ricerca, momento che riguarda l’individuazione delle unità su cui è rilevato il fenomeno e la scala di misura utilizzata =misurazione qualitativa e quantitativa delle unità informative: dove l’unità è l’elemento portatore del carattere es reddito regionale=l’unità territoriale è la regione e il carattere è il reddito . Mentre l’unità informativa è l’informazione qualitativa o quantitativa misurata sull’unità di riferimento e è il dato statistico; la sintesi delle osservazioni formazione di tabelle statistiche, e la loro elaborazione modulata in relazione alla tipologia dei dati spaziali 3) Metodologie di campionamento spaziale come si raccolgono le informazioni su un gruppo limitato di unità territoriali dove occorrono metodologie particolari 4) analisi shift e share : effetto dei fattori sullo sviluppo regionale e confronti tra regioni: cambiamenti e ripartizione territoriali di un fenomeno regionale. Es turismo nelle regioni rispetto a varie componenti (religioso, termale, … ) 5) Point Pattern Analysis descrizione e interpretazione della struttura distributiva dei dati puntuali di un pattern acquisire informazioni sulla struttura (casuale, clusterizzata, uniforme) della distribuzione spaziale dei punti 6)Autocorrelazione spaziale legge di tobler intensità correlazione per corretta interpretazione dei risultati poiché i dati spaziali non sono indipendenti 7) trend di superficie: tende a individuare l’esistenza di una regolarità nel movimento territoriale di un fenomeno (es iso pioggia isobare...oppure fenomeni economici rispetto alle distanze) Approfondimenti prof. Francesco Sanna Modulo Gis. Augusto Frascatani Esercitazione Federico Martellozzo Il dato spaziale 1.Definizione e tipologia dei dati spaziali La metodologia statistica introduce e applica strumenti per la raccolta e il trattamento di collezioni di dati relativi a fenomeni osservazionali e misurabili. La realtà fenomenica si svolge in un campo spazio-temporale, l’interesse sarà ora focalizzato sull’analisi della possibile relazione che la dimensione “spazio” può produrre su un fenomeno oggetto di analisi scientifica. In tal caso si tratta di valutare oggettivamente, nella variabilità riscontrata nelle ripetute osservazioni di un fenomeno collegato al territorio, quella parte attribuibile e giustificata dalla struttura territoriale o misurare l’effetto che lo spazio produce sul fenomeno stesso. Sono due approcci diversi: nel primo caso il territorio è semplicemente lo scenario nel quale si svolge la realtà fenomenica, nel secondo caso lo spazio è un fattore determinante la struttura del fenomeno. In effetti, come vedremo, si parla di statistica territoriale nel primo caso e di statistica spaziale nel secondo caso, in entrambe le situazioni si tratta dell’applicazione della statistica ad argomenti attinenti allo spazio e quindi alla Geografia, argomenti per i quali dalla seconda metà del secolo scorso, si assiste ad una continua crescita d’interesse sia applicativo che di ricerca teorica e metodologica. I dati legati allo spazio presentano caratteristiche importanti: 1) i dati non possono considerarsi indipendenti La prima legge di Tobler afferma che: “Tutto è correlato con tutto, ma le cose vicine sono più correlate delle cose lontane” Quindi i processi d’interrelazione, contagio, diffusione o repulsione condizionano la struttura distributiva del fenomeno territorialmente rilevato (spiegare: prossimità/distanza, spazio astratto e impedenza territorio) 2) hanno diverse caratteristiche le unità di riferimento sulle quali misurare il fenomeno. Le connotazioni differenti possono condizionare il tipo di analisi. Si parla di unità come il “singolo elemento o l’ente sul quale si rileva la modalità (àmodo di presentarsi) di un carattere”; nel caso in esame “l’unità statistica” va intesa come il supporto elementare di quella o quelle modalità relative al fenomeno oggetto di studio, pur se l’unità è portatrice di molteplici altre modalità o caratteristiche. Nel caso dei dati spaziali l’unità è anche il criterio di organizzazione dei dati in tabelle. Definito il fenomeno o carattere oggetto di analisi, verrà, conseguentemente, definita in modo più proprio l’unità sulla quale compiere la rilevazione: nel caso di analisi relative allo spazio si possono considerare diversi tipi di unità alcune oggettivamente preesistenti, come, ad esempio le aree amministrative di un territorio, altre predisposte ad hoc dall’operatore per specifici scopi. IL DATO SPAZIALE Si indichi con X una variabile casuale, ovvero una grandezza i cui valori non sono prevedibili aprioristicamente ma variano per moltissimi fattori, alcuni noti, altri costituiti da una infinità di cause non note chiamate genericamente “caso”; mentre s indica una unità di riferimento spaziale sulla quale è rilevato il fenomeno oggetto di studio, specificatamente indicato con X(s). In uno spazio bidimensionale R2, xij indica un generico dato spaziale risultato della ima misura di X(s) sulla jma unità s appartenente a R2. Il deponente i è l’indicatore della i.ma rilevazione delle n previste (i = 1,2,…,n), mentre il deponente j è l’indicatore della j.ma unità spaziale, delle s possibili, sulla quale è osservato il fenomeno(j= 1,2,…s) R spazio, s unità dello spazio, X variabile casuale la cui realizzazione generica xi(s) è il valore misurato di X sull’unità s. Il modello spaziale generale definisce il processo casuale X(s) nel campo di riferimento, come l’insieme dei possibili valori di X in s (X=numero di scuole medie statali nei Municipi di Roma variabile su scala ordinale), xij = numero genericamente i.mo di scuole medie (i= 1,2,…,n), (s= Municipi) nello j.mo (j =1-20) municipio di Roma. Nel caso di dati senza riferimento allo spazio, ad esempio, la variabile potrebbe essere il numero di studenti nelle diverse classi delle scuole medie in un Municipio di Roma, o in una scuola, ecc,ecc, ma la problematica è del tutto diversa. In questo caso la variabile X è il numero di studenti e l’unità statistica la classe e xij = numero i.mo generico di studenti nella j.ma classe. Le unità Spaziali e la georeferenziazione Le unità dei riferimenti spaziali sulle quali sono raccolti i dati costituenti il complesso informativo di base per l’analisi di X(2s), oggetto della ricerca, sono classificate in punti, aree, linee, direzioni. L’unità punto è una precisa localizzazione individuata e definita da due coordinate un punto viene identificato indicando le sue coordinate nella forma (x;y). Tale unità è spesso utilizzata anche per indicare aree o zone ampie di territorio come città, industrie, attività commerciali o altro e, in tal caso, le coordinate sono prese in corrispondenza del centro della zona di riferimento. Individuazione e localizzazione • Caratteristica principale per individuazione e georeferenziazione delle unità spaziali è la loro localizzazione • Questa è individuata dalle coordinate: • Punto àcoord latitudine longitudine • Direzioneàgradi • Area/lineeàcoordinate della spezzata che le delimita Le coordinate geografiche cosa sono e come possono essere trasferite su un piano cartesiano come coordinate, cenni. Sistemi cartografici La carta geografica è una rappresentazione ridotta, approssimata, simbolica della superficie terrestre . La caratteristica principale di una carta geografica è la scala (ossia il coefficiente di riduzione). La scala= rapporto tra la lunghezza misurata sulla carta e la corrispondente lunghezza sulla superficie terrestre Classificazione delle carte rispetto alla scala • Piante o mappe sono carte con scala maggiore o uguale a 1:10.000 (dettagliate, es mappe catastali; 1 mm sulla carta equivale a 10 metri dunque 10.000mm) • Carte topografiche- scala compresa tra 1:10.000 e 1:100.000. Molto particolareggiate e sono di base per la costruzione di carte a scala più piccola (es 1:25.000) • Carte Corografiche scale comprese tra 1:100.000 e 1: 100.000.000. Carte di maggiore ampiezza livello regionale, ma anche le carte stradali • Carta geografica es scala 1: 5.000.000 • Planisferi Per fare cartografia è necessario fissare: -sistema di riferimento (datum): scelta dell’ellissoide (superficie matematica che approssima la forma della terra) e orientamento -rete di punti e misure che realizzano il sistema di riferimento (meridiani e paralleli) Paralleli: sono originati dall’intersezione della superficie terrestre con piani perpendicolari all’asse terrestre I cerchi descritti dal paralleli hanno raggi via via minori dall’equatore ai poli Meridiani: intersezione della superficie terrestre con piani che passano per l’asse terrestre Insieme formano la “quadrettatura” di riferimento del reticolato geografico Le misure di longitudine e latitudine: La longitudine di un dato meridiano è la distanza angolare tra quel meridiano e il meridiano di riferimento. A partire dal meridiano di Greenwich (che ha longitudine 0°),un dato meridiano può essere misurato procedendo verso est o verso ovest e si fa seguire a tale valore angolare l’indicazione est (E) oppure ovest (W), a seconda che la misura sia fatta a est o a ovest del meridiano di Greenwich. Nel caso della figura, la longitudine del punto B, che giace sull’Equatore, e di 30° E ed e la stessa del punto A e di qualsiasi altro punto situato sullo stesso meridiano. La latitudine di un dato parallelo è la distanza angolare tra quel parallelo e l’Equatore. Il valore della latitudine è compreso tra 0° (Equatore) e 90° (Polo), seguito dall’indicazione nord (N) oppure sud (S), a seconda che la località si trovi nell’emisfero settentrionale oppure nell’emisfero meridionale. Individuazione di un punto sul reticolato: la longitudine del punto B, che giace sull’Equatore, e di 30° E ed e la stessa del punto A e di qualsiasi altro punto situato sullo stesso meridiano Nel caso della figura il punto A ha latitudine 40° N, la stessa del punto C e di qualsiasi altro punto situato sullo stesso parallelo. Fonte: Rappresentare la superficie terrestre - Zanichelli online per la scuola.(.online.scuola.zanichelli.it/dentrolescienzedellaterrablu/...content/.../Gaino..) A livello internazionale, e anche in Italia, per la realizzazione delle carte topografiche “ufficiali” viene utilizzata la proiezione cilindrica trasversa di Gauss, modificata, per l’Italia, da Boaga, che, estesa a tutta la Terra, costituisce il Sistema Cartografico U.T.M. (Universale Trasvera di Mercatore). Nel sistema U.T.M. la Terra è stata suddivisa in 60 fusi e 20 fasce parallele: ogni fuso comprende 6 meridiani ed è indicato con un numero (da 1 a 60, a partire dall’antimeridiano di Greenwich); le fasce, di 8 paralleli ciascuna, sono indicate con lettere dell’alfabeto. Non sono comprese nella carta le zone polari con latitudini superiori a 80° N e S. Fusi e fasce delimitano 1200 zone, indicate col numero del fuso e con la lettera della fascia corrispondente. Ogni zona viene suddivisa in quadrati di 100 Km di lato, contrassegnati da due lettere maiuscole; ogni quadrato è ulteriormente suddiviso in quadratini più piccoli, di 10 Km di lato. In questo modo è possibile localizzare ogni punto sulla carta con notevole precisione -Il tipo di rappresentazione cartografica (proiezione) ed i parametri di applicazione Le proiezioni cartografiche “trasportano” le coordinate tratte dal reticolato sull’ellissoide del sistema di riferimento (datum) al piano della carta. Le due superfici non sono topologicamente equivalenti, non è possibile passare dall’ellissoide alla carta senza deformazioni. Al variare dei principi usati per la loro realizzazione le proiezioni si dividono in VERE o Convenzionali Proiezioni vere : si basano su principi geometrici per il “trasporto” del reticolato geografico, su una superficie ausiliaria. Se questa superficie è un piano, si hanno le proiezioni prospettiche; se questa superficie corrisponde a quella di un cilindro o di un cono, cioè di un solido sviluppabile su un piano, si hanno le proiezioni per sviluppo. Proiezioni convenzionali: derivano dalle vere e attraverso “espedienti” matematici che minimizzano le deformazioni. Rispetto alle loro proprietà prevalenti, le proiezioni si distinguono in: EQUIDISTANTI- mantengono inalterate le distanze (proiezione equidistante: il rapporto tra due distanze sulla carta è uguale al rapporto tra le corrispondenti distanze nella realtà) ; EQUIVALENTI- mantengono inalterate le aree (due superfici sulla carta stanno nello stesso rapporto che intercorre tra le corrispondenti superfici nella realtà), CONFORMI- mantengono inalterati gli angoli (si conservano gli angoli tra due direzioni qualsiasi e quindi vengono mantenute le forme degli oggetti rappresentati.) Proiezioni vere: Proiezioni Prospettiche: ottenute mediante proiezione su un piano tangente alla sfera in un punto qualunque della stessa e al variare del punto di osservazione, si distinguono in: Centrografica; Stereografica; Ortografica a) centrografica (il punto di osservazione coincide con il centro della sfera e si proietta sul piano della carta gnomonica polare) La proiezione gnomonica mostra tutti i cerchi massimi come linee rette. Poiché i meridiani e l'equatore sono cerchi massimi, essi sono sempre mostrati come linee rette. Osservando dal centro della Terra, la proiezione della superficie della terra è effettuata su di un piano tangente. b) Stereografica: il punto di osservazione è sulla superficie della sfera opposta al piano di proiezione C) Ortografica (all’infinito e si proietta sul piano tangente al polo opposto) Proiezioni vere :Proiezioni Coniche: si proiettano i punti della sfera su un cono tangente ad un parallelo Proiezioni vere Proiezioni Cilindriche: avvolgo il globo in un cilindro tangente all’equatore Proiezioni modificate Tra le proiezioni modificate, la più nota è la proiezione cilindrica modificata di Mercatore (filosofo e teologo fiammingo 1512-1594): nella proiezione i meridiani rimangono equidistanti, e sono rappresentati da rette verticali parallele ortogonali ai paralleli, disposti orizzontalmente. I paralleli –spostandosi dall’equatore ai poli- si allontanano reciprocamente in proporzione a quanto la distanza dei meridiani è maggiorata dalla carta rispetto alla realtà Questa carta è conforme (isogona) ed è utile per realizzare le carte nautiche Le unità Spaziali L’ unità punto è una precisa localizzazione individuata e definita da due coordinate Tale unità è spesso utilizzata anche per indicare aree o zone ampie di territorio come città, industrie, attività commerciali o altro e, in tal caso, le coordinate sono prese in corrispondenza del centro della zona di riferimento. Le unita’ areali rappresentano zone o porzioni di territorio con tipologie varie per forma e dimensione e possono riferirsi sia alle ripartizioni amministrative esistenti in uno Stato come, ad esempio, le unità areali Comuni o Province in Italia (in tal caso la forma e dimensione delle singole unità spaziali sono diverse ed esistenti a priori e il fatto è tenuto presente nella conduzione dell’analisi e nell’interpretazione dei risultati ),oppure possono essere predefinite in vista di specifiche finalità e, spesso, possono essere rese strutturalmente omogenee per particolari esigenze di ricerca. ( Perché è interessante la proprietà della omogeneità- regione omogenea/uniforme) In ogni caso i risultati dell’analisi sono strettamente collegati alla struttura spaziale sulla quale sono rilevati i dati.ESEMPI -Nuts 2 EUROPA- amministrative Regioni e Province Comuni Campania Con riferimento ad un centro specifico le unità areali, per esigenze particolari, possono essere trattate come unità puntuali. In ogni caso deve essere tenuto presente il problema di scala al quale l’artificio è ricorso.(Galassie) Le unità spaziali per la raccolta di dati finalizzati allo studio del movimento di persone, merci, veicoli o altro, sono le linee o unita’ di rete quali strade, canali, fiumi o altri tipi di connessione (i grafi; flussi), mentre le direzioni o unita’ direzionali sono introdotte per l’analisi del movimento direzionale di un fenomeno e, in tal caso, sono espresse in gradi calcolati partendo generalmente da nord (grado zero). DAL DATO ALLA SUA ORGANIZZAZIONE Sistemazione e classificazione delle informazioni raccolte: esclusiva, esaustiva e soddisfacente; Una prima e basilare elencazione o distinzione dei dati è collegata all’unità topografica sulla quale si realizza la misurazione che darà luogo a quattro tipologie fondamentali di dati: 1-dati puntuali- riportano le osservazioni raccolte in corrispondenza delle coordinate di precise localizzazioni e possono essere dati semplici o dati pesati; 2-dati areali: sono dati aggregati per somma o per media d’informazioni individuali relative e raccolte in superfici areali; (e. n turisti nel Lazio è dato dalla somma dei turisti presenti nelle diverse località sotto osservazione in un dato periodo) 3-dati direzionali: sono il risultato di misure relative a unità direzionali e, come i dati puntuali, possono essere dati direzionali semplici o pesati; dato un centro di riferimento misuro l’angolo della posizione di ogni unità rispetto a quel centro. (direzione pesata es localizzazione alberghi rispetto al centro e posso pesarla col numero di turisti negli stessi alberghi per vedere se c’è una preferenza direzionale ) 4-dati di rete o lineari: sono dati per lo studio di flussi di movimento di uomini o di cose, legati all’esistenza di strade o di linee terrestri o aeree e possono essere anche spazialmente continui. ESEMPIO alberghi- Dati Puntuali coordinate NAME Via 12°29'31,7"E 41°55'5,823"N Villa Porpora Via Nicol├▓ Porpora civico 15 POSTCODE 00198 12°29'31,7"E 41°55'3,754"N Parco dei Principi Via Saverio Mercadante 15 00198 12°29'33,595"E 41°55'49,168"N Via Tommaso Salvini 18 00197 12°29'6,041"E 41°55'7,178"N Minotel delle Muse Aldrovandi Palace Hotel Via Ulisse Aldrovandi 15 00197 12°29'34,267"E 41°55'19,989"N Claridge Hotel Viale Liegi 62 00198 12°28'53,094"E 41°55'32,126"N Regent - Whr Via Filippo Civinini 46 00197 12°28'54,09"E 41°55'35,09"N Grand Hotel Ritz Via Domenico Chelini 41 00197 12°28'28,859"E 41°54'48,157"N River Via Flaminia 39 00196 12°29'6,041"E 41°55'32,62"N Degli Aranci Via Barnaba Oriani 11 00197 12°28'6,617"E 41°55'23,481"N Astrid Largo Antonio Sarti 4 00196 12°28'51,766"E 41°55'14,095"N Villa Mangili Via Giuseppe Mangili 31 00197 12°29'32,984"E 41°55'11,394"N Paisiello Parioli Via Giovanni Paisiello 47 00198 12°29'0,065"E 41°55'20,764"N Rivoli Via Torquato Taramelli 7 00197 12°28'54,09"E 41°55'10,637"N Lord Byron Via Giuseppe De Notaris 5 00197 12°28'9,937"E 41°55'27,68"N Villa Glori Viale del Vignola 28 00196 12°28'51,434"E 41°55'22,246"N Polo Piazza Bartolomeo Gastaldi 4 00197 12°29'28,615"E 41°55'3,72"N Via Gerolamo Frescobaldi 5 00198 12°29'18,656"E 41°55'47,686"N Parco dei Principi Hermitage Grand Hotel Via Eugenio Vajna 12 00197 12°29'38,331"E 41°54'51,657"N Hotel Villa Borghese Via Pinciana 31 00198 12°31'9,868"E 41°54'28,542"N Athena Via Ercole Pasquali 3 00161 12°30'53,44"E 41°54'29,918"N Raccuia Via Treviso 37 00161 12°30'50,77"E 41°54'33,891"N Ibiza Via Forl├¼ 14 00161 12°30'59,806"E 41°54'22,582"N Globus Viale Ippocrate 119 00161 12°30'52,208"E 41°53'48,345"N Laurentia Largo degli Osci 63 00185 12°30'42,351"E 41°53'48,956"N Via Tiburtina 10 00185 12°31'0,011"E 41°53'42,689"N Industriale Villa San Lorenzo Maria Via dei Liguri 7 00185 12°30'43,583"E 41°53'50,026"N Felice Via Tiburtina 30 00185 12°30'52,619"E 41°54'54,827"N Silva Via Antonio Bosio 20a 00161 12°31'4,529"E 41°55'14,845"N Santa Costanza Viale 21 Aprile 4 00162 12°29'58,439"E 41°54'37,967"N Versailles Corso d'Italia 92 00198 12°30'2,717"E 41°55'17,92"N Villa Grazioli Via Salaria 241 00198 12°30'18,333"E 41°54'38,922"N Galeno Via dei Villini 10 00161 12°29'56,3"E 41°54'46,404"N Silvestri Via Savoia 44 00198 12°29'54,589"E 41°54'55,636"N Albani Via Adda 45 00198 12°30'7,209"E 41°55'16,01"N Buenos Aires Via Clitunno 9 00198 12°31'13,565"E 41°54'51,16"N Laura Pension Viale 21 Aprile 109 00162 12°30'6,568"E 41°55'4,709"N Copped├¿ Via Chiana 88 00198 12°30'6,995"E 41°55'4,709"N La Panoramica Via Arno 33 00198 12°29'47,53"E 41°55'27,788"N Borromini Via Lisbona 7 00198 12°30'8,279"E 41°54'45,289"N Kent Via Reggio Emilia 71 00198 12°30'17,477"E 41°54'42,106"N Via Nomentana 28 00161 12°29'50,31"E 41°55'6,301"N Villa Florence Grand Hotel Beverly Hills Largo Benedetto Marcello 220 00198 12°30'10,418"E 41°54'43,061"N Lloyd Via Alessandria 110a 00198 12°31'16,851"E 41°54'50,854"N San Giusto Piazza Bologna 58 00162 12°29'50,096"E 41°54'41,946"N Executive Via Aniene 3 00198 12°30'17,614"E 41°54'41,787"N Turner Via Nomentana 27 00161 12°30'14,055"E 41°55'28,902"N Panama Via Salaria 336 00199 12°30'33,11"E 41°54'43,061"N Villa Torlonia Via Bartolomeo Eustachio 5 00161 12°30'27,565"E 41°55'0,023"N La Palma Via delle Alpi 15d 00198 12°31'42,725"E 41°54'36,642"N New Gemini Via Guido Mazzoni 24 00162 12°30'59,806"E 41°54'36,642"N Malaga Via Udine 12 00161 12°30'51,181"E 41°55'5,066"N Villa del Parco Via Nomentana 110 00161 ESEMPIO reddito per regione , Reddito medio familiare netto per regioni Anni 2003-2012 (in euro) Dati direzionali : angoli – Si potrebbero costruire a partire dalla cara sugli alberghi del secondo municipio. In una ricerca pubblicata su Nature, gli scienziati hanno presentato mappe globali che mostrano quanto velocemente e in quali direzioni stanno cambiando i climi locali. Lo studio ha analizzato 50 anni di dati della temperatura superficiale di terre e mari (dal 1960 al 2009) e ha proposto anche due scenari futuri per gli ambienti marini: in un caso, mantenendo le condizioni attuali, in un altro, ipotizzando un aumento delle temperature globali di 1,75 °C. Le nuove mappe mostrano così dove verrebbero a crearsi nuovi ambienti caldi e dove quelli esistenti potrebbero scomparire. «Le mappe ci mostrano quanto velocemente e in quale direzione le temperature stanno variando, e dove i migratori che le seguono potrebbero scontrarsi con barriere naturali come le linee di costa. Classi di probabilità di velocità del cambiamento climatico Dati di rete: grafi e Flussi -es Matrici origini destinazioni Sistemi Locali: gravitazione Le matrici Origine-Destinazione Matrici Origine-Destinazione (O-D) sono matrici che hanno un numero di righe e di colonne pari al numero di zone, il cui generico elemento dod fornisce il numero degli spostamenti che hanno origine nella zona “o” e destinazione nella zona “d” nel periodo di riferimento considerato (flusso O-D). Gli elementi di una matrice O-D possono essere classificati in relazione al tipo di zona di origine e destinazione: – Spostamenti interni – Spostamenti di scambio – Spostamenti di attraversamento Aggregazioni degli elementi della matrice O-D Flusso “emesso” o “generato” della zona o: Flusso “attratto” dalla zona d: Numero totale di spostamenti Sistemi locali – aree di pendolarismo “Gravitazione” I dati georeferenziati. Statistica spaziale e Statistica territoriale. GIS -Geographical information System- sistema informatizzato per la trattazione di tematiche ambientali ha portato ad una nuova classe di dati: i dati georeferenziati. DATO CHE SI OTTIENE SU UN OPPORTUNO SISTEMA DI RIFERIMENTO SPAZIALE. Dunque va costruito un opportuno sistema di riferimento spaziale che genera delle unità spaziali specifiche OTTENGO UN’INFORMAZIONE STRETTAMENTE COLLEGATA ALLO SPAZIO DI SUPPORTO Cosa è e come è nato il GIS. Il Geographic Information System (GIS) è uno strumento che permette di analizzare e rappresentare le informazioni che si verificano e riguardano un territorio. E’ composto da componenti tecnici rappresentati da una serie di software geografici questi vengono integrati alle comuni operazioni che si possono svolgere sui data base: ricerche e interrogazioni, analisi statistiche, grafici. La funzionalità propria del G.I.S. risiede nella memorizzazione di dati territoriali, il loro trattamento e soprattutto la loro rappresentazione sotto forma di cartogrammi o tabelle ritagliati su porzioni di territorio più o meno estese. I dati sono inseriti in un sistema di riferimento e la caratteristica dei GIS è quella di attribuire ad ogni elemento le coordinate spaziali reali e la dimensione reale e non di scala. La tecnologia GIS unisce i meccanismi e le operazioni dei comuni database con l’analisi geografica e la possibilità di visualizzazione sulla mappa (una base cartografica cartacea cui vengano sovrapposti dei lucidi tematici è un GIS analogico). Abbiamo visto come la rappresentazione cartografica sia una forma di descrizione del territorio basata sulla restituzione delle relazioni spaziali degli elementi geografici (lezioneII). Nella cartografia tradizionale l’elemento base è un disegno che contiene in forma implicita le coordinate dei punti che definiscono gli oggetti rappresentati attraverso il RETICOLATO del sistema di riferimento Nella CARTOGRAFIA NUMERICA l’elemento base è l’insieme di coordinate che contengono in forma implicita la visualizzazione analogica sotto forma di disegno Il Gis nasce nel 1963 come CGIS (Canada GIS) per l’analisi di dati raccolti nel territorio e per produrre statistiche utili per la loro gestione Tutte le informazioni immesse in un GIS sono accomunate da riferimenti spaziali. Altri database possono contenere informazioni riferite all’ubicazione (come gli indirizzi) ma un database GIS usa la georeferenziazione come principale dato di immagazzinamento e di gestione delle informazioni Un GIS contiene informazioni geografiche (e non, o meglio, georeferenziate) registrate secondo due diversi formati: spaziale (Oggetti) e tematico (fenomeni) Gli oggetti sono Entità fisiche (case, edifici, strade) e/o Giuridiche (regioni, Stati) con confini individuabili e possono essere considerate Grandezze Discrete I Fenomeni sono eventi con carattere continuo (altitudine, temperatura, pendenza) e non hanno limiti oggettivi (ma anche fenomeni socio-economici popolazione, reddito..) Il dato spaziale descrive il posizionamento di un oggetto nello spazio preso in considerazione. Il posizionamento può essere descritto con coordinate xy. Un processo automatizzato chiamato “geocoding” è utilizzato per creare esplicite referenze geografiche (coordinate x, y) da referenze implicite (indirizzi di posta, numeri civici, etc.).Questi riferimenti geografici permettono di posizionare gli oggetti sulla superficie terrestre per analizzarli successivamente. Tutti gli elementi geografici devono essere definiti attraverso dei MODELLi SPAZIALi: Dato collocato in un sistema di riferimento spaziale. Le unità sulle quali sono rilevati i dati sono punti o linee di una superficie, o pixel di telerilevamento (sensori sensibili al campo elettromagnetico-scomposizione prisma luminoso), o “celle” di forma costante o variabile, costruite dal ricercatore e ottenute sovrapponendo al territorio una griglia o reticolo artatamente predisposto. Proprio per sapere cosa accade in quello specifico punto- unità spaziale. Da www.mtcube.com-Introduzione al GIS: UN DATABASE GEOGRAFICO Può ESSERE CODIFICATO ATTRAVERSO DUE MODELLI : Modello vettoriale (punti, linee, poligoni) descrivo gli oggetti geograficiàUSO GPS, topografia Modello Raster (griglia): insieme di celle uniformi organizzate Pixel, descrivo intensitààuso foto satellite -Il modello raster (atto a descrivere un'immagine in formato digitale).è composto da una serie di celle della stessa dimensione, organizzate in righe e colonne (del tutto simili a quelle di un foglio elettronico ad espansione). Utilizzato preferibilmente per la rappresentazione di fenomeni continui ma usato anche per i discreti. Le celle sono organizzate come una matrice: righe e colonne e l’ORIENTAMENTO della griglia corrisponde a quello del sistema geografico di riferimento. Per la georeferenziazione mi serve l’informazione della dimensione della cella e la coordinata. A ciascuna cella è associato un valore (qualità, intensità) -Il modello vettoriale è il miglior modello progettato per rapportare oggetti con limiti distinti e ben definiti visto che utilizza le coordinate vettoriali per creare punti, linee e poligoni. Quindi per le grandezze discrete. I Puntinon hanno dimensione ma solo posizione. Grazie alla codifica della localizzazione rispetto al sistema di riferimento le entità vettoriali del database vengono restituite in forma analogica (disegno). In questo modello una stessa ENTITA’ GEOGRAFICA può essere rappresentata con diverse unità spaziali : una città può essere considerata come un punto ( es database geografico che descrive una rete ferroviaria : ogni punto rappresenta una stazione.) La stessa città può essere rappresentata con un poligono : database geografico che descrive i diversi usi del suolo . Alle unità così georeferenziate si “agganciano” i dati tematici L’immagine che appare da un GIS è in grado di aiutarci a analizzare le informazioni su una data regione o una città sotto forma di un gruppo di mappe sovrapposte, ognuna delle quali rappresenta una singolare caratteristica relativa alla stessa area considerata ESEMPIO INDIVIDUAZIONE del Sitema dei trasporti urbani: Necessito di un gruppo di carte tematiche sovrapposte come un layer, livello o copertura. Tutti i livelli sono giustamente sovrapposti agli altri, così che ogni punto combaci con il suo corrispondente su un altro livello Il livello più basso di un GIS è quello più importante, è rappresentato da una griglia sulla quale sono impostate le coordinate geografiche (come per esempio longitudine e latitudine) sul quale tutte le mappe sono georeferenziate Una volta che le mappe sono state georeferenziate, grazie ad un sistema di coordinate prestabilito (Gauss-Boaga, UTM), le informazioni visualizzate sui differenti livelli possono essere comparate e analizzate. Nel caso in figura le vie di traffico possono essere comparate con l’ubicazione dei centri commerciali, la densità demografica con le zone industriali. In più, località puntuali o aree possono essere separate dalle località circostanti, semplicemente tagliando tutti i livelli nella posizione desiderata dal resto della mappa. Inoltre non per tutte le analisi è necessario usare simultaneamente tutti i livelli. In alcuni casi, un ricercatore può utilizzare le informazioni selettivamente considerando le relazioni tra livelli specifici. Così anche informazioni ricavate da due o più livelli possono essere sommate e poi trasformate in un nuovo livello utilizzabile in una successiva analisi. Questo processo che permette di combinare e trasformare informazioni con differenti livelli viene chiamato map algebra dal momento che comporta l’addizione e la sottrazione di informazioni. Con l’introduzione della georeferenziazione sono state pertanto specificate due tipologie di dati: territoriali e spaziali, che si differenziano, in via principale, per la differenza nelle unità sulle quali il fenomeno è rilevato e per la diversa finalità dell’analisi. Nei dati georeferenziati, in effetti, il preciso riferimento ad un definito spazio, spesso costruito ad hoc, rende lo scopo dell’analisi principalmente quello di rilevare, nella struttura osservata del fenomeno spaziale, proprio l’incidenza, l’effetto, del fattore spazio. POTENZIALITA’ E CAMPI DI UTILIZZO del GIS Il potenziale del GIS è realmente vasto: le migliaia di mappe su livelli diversi sono sovrapposte per visualizzare informazioni di varia natura, quali, ad esempio informazioni sulla rete dei trasporti, idrografia, caratteristiche delle popolazioni, attività economiche, giurisdizione politica e altre caratteristiche dell’ambiente sociale e naturale. Utilizzabile in varie situazioni diverse tra loro: - pianificazione urbanistica, - gestione delle risorse ambientali, - previsione dei trasporti, - pianificazione in situazioni di emergenza ... La capacità di separare le informazioni su livelli e la possibilità di combinarle con quelle appartenenti ad altri livelli (layer) è la ragione per cui il GIS rivela un enorme potenziale sia nel campo della ricerca che nella programmazione di strategie decisionali. Una delle maggiori aree di applicazione è la gestione delle risorse naturali, ivi inclusi: Habitat naturale Fiumi Aree alluvionate Desertificazione Terreni agricoli Acquiferi Foreste Un'altra area importante per le applicazioni GIS è la gestione delle reti tecnologiche, per esempio per: Ubicazione in sotterraneo di tubature e cavi Bilanciamento dei carichi nelle linee elettriche Pianificazione della manutenzione delle attrezzature Tracciati di utilizzo energetico Province, Regioni e Stato hanno trovato il GIS particolarmente utile nella gestione e uso del suolo: Suddivisione catastale Compravendita di terreni Controllo e valutazione impatto ambientale Gestione della qualità delle acque Gestione delle proprietà Un utilizzo più recente e innovativo del GIS è basato sull’utilizzo di informazioni sulle rete viaria. Il GIS si è rivelato particolarmente utile per: "Mappare" la rete autostradale Progettare e sviluppare di piani di evacuazione Il range delle applicazioni del GIS continua ad espandersi in relazione al fatto che i sistemi diventano più efficienti, più diffusi e meno costosi. Le applicazioni sono inoltre collegate alla raccolta dei dati. • Da www.mtcube.com-Introduzione al GIS- fine La raccolta dei dati è un complesso di metodi statistici che partendo dalla definizione operativa dell’oggetto della ricerca in relazione alle finalità e all’ampiezza informativa che si vuole ottenere, porta alla individuazione del tipo di unità, del campo di rilevazione dei dati che può estendersi a tutte le unità o essere campionaria, alla effettiva raccolta controllo e sistemazione dei dati.(mette ordine nell’informazione) Attuale importanza degli strumenti informatici per la conservazione dei dati (censimenti). Per l’operatività e per la divulgazione delle informazioni occorre la sistemazione in tabelle. Queste sono il risultato di metodologie statistiche che permettono di collegare in modo ottimale la realtà della massa informativa iniziale con la finalità della ricerca, in una organizzazione dei dati che permette la loro sintesi per una prima conoscenza descrittiva di X. Le tabelle statistiche di dati collegati al territorio sono definite SERIE Statistiche o genericamente distribuzioni perchè : Nelle tabelle il criterio di ordinamento dei dati è rappresentato dalle unità spaziali (regioni es.) e non dai valori o classi di valore del carattere statistico in oggetto (reddito, come classicamente accade nelle seriazioni statistiche), e per tale ragione le tabelle sono definite “serie statistiche”. Serie di frequenze: presentano valore assoluto o relativo (1) o percentuale (100) del numero di casi osservati e (n° abitanti o abitazioni nelle unità analizzate, es) – Esempio Istat sistema di indicatori territoriali- Pop. residente al 31.12-anni 2005;2010 Territorio 2005 2010 Piemonte Valle D'Aosta 4341733 123978 4457335 128230 Lombardia Liguria 9475202 1610134 9917714 1616788 985128 482650 1037114 507657 Trento Veneto 502478 4738313 529457 4937854 Friuli Venezia Giulia Emilia Romagna 1208278 4187557 1235808 4432418 Toscana Umbria 3619872 867878 3749813 906486 Marche Lazio 1528809 5304778 1565335 5728688 Abruzzo Molise 1305307 320907 1342366 319780 5790929 4071518 594086 2004415 5017212 1655677 15551047 11119276 11321337 14087162 6672889 58751711 5834056 4091259 587517 2011395 5051075 1675411 16120067 11643194 11950322 14186373 6726486 60626442 Trentino Alto Adige Bolzano - Bozen Campania Puglia Basilicata Calabria Sicilia Sardegna Nord-Ovest Nord-Est Centro Sud Isole Italia Le serie di quantità riportano misure o ordini di grandezza di un fenomeno misurabile (es temperature. Valore delle import o export nelle unità di riferimento) Istat sistema di indicatori territoriali… valori Importazioni da Paesi UE (valori in migliaia di euro); Esportazioni verso Paesi UE (valori in migliaia di euro) anno 2005 Territorio Piemonte Valle D'Aosta Lombardia Liguria Trentino Alto Adige Bolzano - Bozen Trento Veneto Friuli Venezia Giulia Emilia Romagna Toscana Umbria Marche Lazio Abruzzo Molise Campania Puglia Basilicata Calabria Sicilia Sardegna Nord-Ovest Nord-Est Centro Sud Isole Italia 2005 16813214 158423,5 72358991 2630919 2005 21967323 283131,9 51288128 2080389 4132029 2680376 1451653 21229666 3852567 2056046 1796521 25050625 3386676 16611026 9252727 1325902 2495331 15039708 2321418 235355,7 3830455 2672227 614444,5 395179,9 1614664 1191429 91961548 45359397 28113668 10069080 2806093 1,84E+08 5939244 21702867 11561506 1532020 6236826 6424893 4672131 367715 4469193 4583763 934829,6 190083,6 3309972 2124724 75618972 56545303 25755244 15217716 5434696 1,84E+08 Il dato nazionale non corrisponde alla somma di quelli provinciali, regionali e ripartizionali per l'impossibilità di assegnare alcuni flussi commerciali alla provincia di competenza Con riferimento alla georeferenziazione, si parla propriamente di serie spaziali e di Statistica Spaziale per indicare il campo di metodi e di analisi relativo ai dati georeferenziati mentre la definizione di serie territoriali e Statistica territoriale è riferita alla trattazione dei dati di unità territoriali precostituite. Alcune precisazioni sulle unità per dati georeferenziati Come possono essere organizzate e predisposte le unità areali (le puntuali non presentano questo problema perché sono già esatte e definite e collegate ad uno specifico punto dello spazio in esame).(Abbiamo parlato di poligoni attraverso il modello vettoriale-limiti ben definiti: serve per rappresentare gli spazi reali, e di celle nel modello raster per quanto riguarda i GIS , sistemi che permettono la corrispondenza tra realtà e modello). Ma le unità areali devono/possono essere predisposte anche per le specifiche finalità di ricerca o per strutturare un campionamento spaziale. E possono essere aree di forma regolare o irregolare ma sempre predisposte dall’operatore. Si tratta di un possibile strumento ad hoc e i risultati ottenuti sono letti in aderenza alla struttura territoriale predefinita. Le aree di riferimento possono essere regolari (uniformi: omogenee nella forma) o irregolari (no stessa forma ma omogenee rispetto a certi requisiti) . L’omogeneità è un requisito importante perché mi permette di operare induzioni es l’omogeneità geometrica mi dice che i punti hanno tutti la stessa dimensione, una omogeneità chimica mi dice che una sostanza presenta sempre la stessa densità, o in fisica la stessa forza su uno spazio… Griglie regolari : Quadrate, circolari, esagonali: Quadrate Circolari Esagonali Queste tipologie saranno scelte in funzione della finalità della ricerca. Esempio campionamento per punti …studio rocce…sono forme spazialmente omogenee GRIGLIE IRREGOLARI Si ricorre a griglie con celle irregolari quando, rispetto al territorio, si dispone di alcune (poche) informazioni puntuali: queste vengono usate come vertici o baricentri per la costruzione di un reticolo irregolare. Attuo, quindi, una interpolazione territoriale (per interpolazione si intende un metodo per individuare nuovi punti del piano cartesiano a partire da un insieme finito di punti dati, nell'ipotesi che tutti i punti si possano riferire ad una funzione f(x) di una data famiglia di funzioni di una variabile reale) ottenendo aree ideali perché godono di caratteristiche di omogeneità rispetto a determinati requisiti, in aderenza ai quali sono state costruite. Mi consentono di attribuire all’area il valore di un punto Esempio Griglie Irregolari : Il Poligoni di Thiessen; non cerco maglie uguali ma partizioni per le quali viene accettata la omogeneità sull’area di un valore noto in un punto (omogenee: generate dalla stessa caratteristica: ad esempio punti che all’interno di uno stesso poligono, generato dalla griglia, siano più vicini al centro del poligono di appartenenza rispetto ai centri dei poligono vicini. Dato un insieme finito di punti S, il diagramma dei poligoni per S è la partizione del piano che associa una regione V(p) ad ogni punto in modo tale che tutti i punti di V(p) siano più vicini a p che ad ogni altro punto in S. Dunque l’area è il risultato dell’applicazione di specifiche metodologie che mi permettono in modo oggettivo di ripartire il territorio in modo da di attribuire a tutta l’estensione dell’area il valore del punto. La finalità che si vuole realizzare è quella di poter attribuire un identico e noto valore a tutti i punti interni della partizione ottenuta. INTERPOLAZIONE in questo caso: una distribuzione di luoghi puntiformi si trasforma in una distribuzione di aree; essa, a sua volta, può essere trasformata in una rete di linee di confine che esprimono relazioni di contiguità. - Problema della delimitazione di aree con criterio economico e metodo geometrico sfruttando la proprietà dell’asse di un segmento (luogo geometrico dei punti del piano di rappresentazione equidistanti dagli estremi del segmento dato). La figura propone due località di mercato, A e B, ubicate in uno spazio indifferenziato (si pensi come esempio ad una pianura del tutto uniforme) percorribile in tutte le direzioni con costi di spostamento proporzionali alla lunghezza delle distanze da percorrere e tariffe uguali per unità di distanza; se i prezzi praticati nei due mercati sono uguali, per un generico consumatore sarà indifferente servirsi del mercato A o del mercato B solo se le distanze da A e B risultano uguali. Questa condizione si verifica solo e soltanto per i punti che si allineano sull’asse del segmento AB; l’asse di AB è la perpendicolare al segmento tracciato e passa per il punto medio. Due possibili metodi di interpolazione: a)Costruzione centrata in A: cerco l’area di riferimento della localizzazione in A per la quale si verifichi che i punto dell’intorno di A siano più vicini ad A che agli altri centriMisuro le distanze tra A e gli altri centri: AB; AC; AD;AE; AF; AG;AH; AI…(blu) Prendo il punto medio dei segmenti blu (le distanze tra i centri) e traccio gli assi (rossi). Dall'incrocio di questi ultimi (assi-rossi) si ottengono dei poligoni: quello più interno risponde ai criteri di vicinato stabiliti. . A.. . B A I H . E . A C . . D . . F G . Rispetto ad un particolare luogo puntiforme A tutti i restanti sono bipartiti in due sottoinsiemi: i vicini diretti o immediati, rappresentati da quelli le cui tessere hanno un lato in comune con la tessera costruita su A; i vicini indiretti, tutti i restanti. Trovo aree disuguali ma omogenee rispetto al valore del centro ossia il valore del punto A (centro) che può essere oggettivamente esteso a tutta l’area di A . b)Ripartizione tra aree non gerarchiche esempio piovosità determinate su 4 punti—fino a che distanza dalla rilevazione posso dire che la piovosità assuma lo stesso valore? Dato lo spazio in cui si trovano i punti A,B,C.D,E Trovo i possibili percorsi Individuo gli assi a metà dei triangoli di tracciano le linee rette perpendicolari B . C . . E . A . D L’incontro delle perpendicolari crea un poligono attorno al centro Tutte le aree ritagliate rappresentano la divisione del territorio in modo che mi permette di attribuire il valore di A su tutto il suo intorno …etc AREE IRREGOLARI: UNITÀ DELLE SERIE TERRITORIALI Nelle serie territoriali le unità statistiche di rilevazione sono generalmente irregolari, predefinite e selezionate in relazione all’oggetto della ricerca. In Italia l’Istituto Nazionale di Statistica (Istat), fornisce i dati ufficiali sugli aspetti geo-socio-economici della realtà della Nazione spesso disaggregati a livello territoriale e principalmente riferiti alle regioni o ai comuni (per i dati censuari). Sempre l’Istat rende disponibili data-base comunali provenienti da fonti ufficiali territoriali, come i dati dell’Atlante Statistico dei Comuni ( ediz), o il Sistema di indicatori territoriali, contenente, quest’ultimo, informazioni di carattere demografico, sociale e ambientale disaggregate a livello regionale, provinciale e ai rispettivi capoluoghi. Le sezioni di censimento: Le Sezioni di Censimento costituiscono l'unità minima di rilevazione del Comune sulla cui base è organizzata la rilevazione censuaria. È costituita da un solo corpo delimitato da una linea spezzata chiusa. A partire dalle sezioni di censimento sono ricostruibili, per somma, le entità geografiche ed amministrative di livello superiore (località abitate quali centro, nucleo, case sparse; le aree subcomunali quali le circoscrizioni). Ciascuna sezione di censimento deve essere completamente contenuta all'interno di una ed una sola località. Il territorio comunale deve essere esaustivamente suddiviso in sezioni di censimento. Nei Comuni capoluoghi di provincia le sezioni di censimento devono essere individuate tenendo conto dell'unità ecografica isolato. In linea di massima ad ogni isolato deve corrispondere una sezione di censimento con delle eccezioni specificamente previste dalla procedura operativa per la suddivisione del territorio comunale in sezioni di censimento Il Comune individua l’area di circolazione : suolo pubblico o aperto al pubblico destinato alla viabilità. Ogni area di circolazione deve avere una propria denominazione. •All’interno delle aree di circolazione vengono individuate le singole sedi di dimora o di lavoro che si definiscono unità ecografiche. (vedi "Istruzioni per la formazione delle basi territoriali e per l'ordinamento ecografico" contenute negli allegati della Legge e regolamento anagrafico Legge 24.12.1954 n. 1228 e D.P.R. 30.05.1989 n. 23) I dati per sezione di censimento, nella versione oggi diffusa, hanno una quota residua e comunque non superiore al 4% di errori di geocodifica causati da disallineamenti fra la collocazione puntuale di numeri civici e le linee di confine fra sezioni contigue Il numero di variabili rese disponibili in occasione dell’aggiornamento delle basi territoriali per i censimenti 1991, 2001 e 2011 è riportato nella tabella 1 Tutti i file geografici diffusi, sono scaricabili dal sito Istat in formato compresso e sono resi disponibili sia nella proiezione geografica ED50 UTM , sia nella proiezione WGS84 UTM. La cartografia UTM (UTM (Universal Trasversal Mercator), utilizzata a livello mondiale si usa sia con sistema di riferimento geocentrico WGS84 che con sistema europeo ED50. WGS84=World Geodetic System 1984 è un sistema di coordinate geografiche geodetico, mondiale, basato su un ellissoide di riferimento elaborato nel1984. E’ un modello matematico della Terra da un punto di vista geometrico, geodetico e gravitazionale, costruito sulla base delle misure e delle conoscenze scientifiche e tecnologiche disponibili al 1984 ED50 sta per European Datum 1950, è un DATUM geodetico definito dopo nel 1950 allo scopo di uniformare le reti geodetiche di vari paesi del nord Europa che risultavano al tempo incompatibili e rendevano quindi complicata la definizione di confini concordemente riconosciuti. L’ellissoide di riferimento associato a questo sistema è l'ellissoide internazionale Hayford orientato a Potsdam ISTAT nel manuale della descrizione dei dati presenta le sezioni: Basi territoriali, sono scaricabili i dati geografici regionali in formato compresso riferiti a tutte le sezioni di censimento. Analogalmente nella sezione Confini amministrativi, è possibile scaricare i limiti amministrativi degli ultimi tre censimenti validi ai soli fini statistici. Nella terza parte, denominata Variabili censuarie, sono scaricabili le risultanze censuarie. Infine, nell’ultima parte sono disponibili i dati toponomastici di stradari e numeri civici, non definitivi, utilizzati nel corso del Censimento della popolazione e delle abitazioni del 2011. Esempio di proiezione di elaborazioni di dati censuari su sezioni di censimento (più di 11.000 sezioni) Tab. 1 - Un quadro generale di riferimento per le trasformazioni di dati spaziali Un processo realizza in Punti Punti Aree Flussi Superfici Superfici Si osserva/analizza in punti Superficie Punti Aree Punti Aree Esempi Campionamento per punti Interpolazione Centroidi, centro mediano Modelli di gravitazione Campionamento per punti Immagini telerilevate Fonte Tratto ed elaborato da: L’interpolazione areale: una soluzione al problema del confronto fra dati riferiti a sistemi spaziali differenti Maria Michela Dickson, Giuseppe Espa, Diego Giuliani e Emanuele Taufer La Superficie: regione bidimensionale di uno spazio ben definito. Regione bidimensionale del Piano Euclideo che a sua volta è parte dello Spazio Euclideo. L’Area : misura dell’estensione di una regione bidimensionale di uno spazio, ovvero la misura dell’estensione di una superficie. Come per le altre misure di natura geometrica, per la precisione si dovrebbe distinguere fra la regione bidimensionale (insieme di punti) e la sua area (valore numerico associato alla precedente). Lezione IV PARTICOLARITA’ dei dati spaziali : Diversità aree; Le scale di misura; (Errore della scelta delle unità spaziali e le loro irregolarità-->MAUP( modifiable areal unit problems) temi che riguardano l’applicabilità dei metodi (che richiedono es. indipendenza dei dati, e omogeneità area di riferimento= la regione omogenea/regioni omogenee; Zonizzazione e discretizzazione dello spazio (i centroidi)) Particolarità dei Dati Spaziali- presentazione dei problemi L’analisi quantitativa dei dati spaziali ha portato all’introduzione e all’applicazione di metodi ad hoc ma per la varia e particolare struttura dei dati comporta alcune limitazioni e specifiche di cui occorre tenere conto sia per l’uso dei metodi che dei risultati ottenuti. I dati areali, in particolare, nascono per aggregazione o accorpamento di dati individuali fatto che genera l’ERRORE ECOLOGICO (ecological fallacy problem)- termine introdotta da Robinson nel 1950. Si parla di unità ecologica quando un’unità corrisponde ad un aggregato a base territoriale (regione, provincia...). Per errore ecologico si intende l’errore che si commette nel trasferire sul piano individuale una relazione osservata sul piano aggregato. Si deve a Robinson (1950) un primo tentativo di distinguere tra correlazione individuale e correlazione ecologica, dove la prima si riferisce alla correlazione misurata su oggetti statistici indivisibili e la seconda si riferisce a gruppi di persone. La correlazione ecologica si dimostra spesso necessaria, data l’impossibilità di disporre delle informazioni individuali; l’obiettivo del ricercatore infatti è sempre quello di inferire sul piano individuale, anche se non sempre viene esplicitato. Lo studio di Robinson, 1950, guardava alla relazione tra due variabili: l’analfabetismo origine etnica e -La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a covariareVariabili con risposta (si/no) in alcune ripartizioni USA (Il coefficiente di correlazione esprime l’intensità della possibile relazione tra due variabili; la correlazione può essere lineare o di altro tipo). La relazione dà luogo ai seguenti valori del coefficiente di correlazione: r=0,203 livello individuale (censuario) r=0,946 livello ecologico 9 grandi ripartizioni r=0,773 livello ecologico 44 stati americani il coefficiente di correlazione è calcolato, nella correlazione ecologica, sulle frequenze di cella delle diverse unità territoriali. Come si vede, la relazione tra le due variabili è decisamente diversa, se valutata a livelli diversi. Esistono altri tipi di errore? Come superare l’impasse? Un secondo tipo di errore risiede nella possibilità della scelta soggettiva e non univocamente definita delle unità spaziali e della loro irregolarità: queste sono le ragioni implicite di quello che Openshaw e Taylor hanno indicato come “ Modifiable Areal Unit problem” (MAUP): dicitura che esprime i condizionamenti teorici riguardanti l’applicabilità di metodi e la limitazione per la generalizzazione dei risultati delle analisi sui dati spaziali. Particolare attenzione va posta nell’utilizzo di risultati derivanti da analisi svolte su configurazioni territoriali non standardizzate (ossia griglie non regolari) Effetti di disturbo nelle analisi statistiche dovute: alla dipendenza spaziale; alla mancanza di standardizzazione delle unità areali, alla distorsione che nasce dal riferirsi a dati aggregati per somma o per media. - LA DIPENDENZA TERRIORIALE La prima “legge” della Geografia, introdotta da W. R. Tobler nel 1970, afferma:“everithing is related to everithing else,but near things are more related tha distant things”. L’affermazione di Tobler introduce sia l’esistenza di una relazione di dipendenza nel valore dei fenomeni spaziali per effetto della vicinanza tra le unità, sia l’osservazione, sia l’intensità di tale dipendenza tende a ridursi e a sfumare con il crescere della distanza tra le stesse unità. Cause della dipendenza spaziale: tendenziale omogeneità geografica nelle aree circostanti l’unità in esame o, anche, alla presenza di particolari strutture e pertinenze comuni alle aree contigue, o, in finale, potrebbe derivare da comportamenti mimetici che spesso si riscontrano nella diffusione di tipicità nelle attività umane. Differenza tra dipendenza spaziale e dipendenza temporale: Si riscontra una dipendenza anche nei dati raccolti e relativi ad anni contigui e successivi delle serie statistiche temporali, trattasi, in questo caso, di una dipendenza unidirezionale in quanto è il passato che influisce sul futuro e non viceversa. Con riferimento ai dati spaziali, invece, si parla di dipendenza multidirezionale e reciproca o meglio d’interdipendenza, nel senso che il dato relativo a una unità territoriale e’ influenzato “da” e influisce “su” quanto accade nelle unità adiacenti. In tal caso si ha una violazione al principio dell’indipendenza di ciascun dato osservazionale conseguentemente diviene necessario misurare e tenere conto (in diversi modi), della “autocorrelazione spaziale” ovvero della tendenza nei dati territorialmente contigui di presentare valori simili (autocorrelazione positiva), o valori opposti(autocorrelazione negativa), attitudine che risulta più rara. La determinazione dell’esistenza e dell’entità dell’autocorrelazione nei dati, è statisticamente determinata con specifiche metodologie i cui risultati forniscono sia un contributo interpretativo sulla distribuzione territoriale dei valori sia la necessaria informazione per il ricorso ad appropriati strumenti di analisi quantitativa per dati dipendenti. La varietà dei riferimenti territoriali: il problema dei confini e della modificazione delle unita’ areali. Il tema è quello della varietà tipologica delle unità areali causata da: posizione dei confini interni e esterni. Posizionamento derivante dalle diverse possibili configurazioni geografiche o di riferimento selezionate per l’analisi, è un fattore che limita la generalizzazione dei risultati ottenuti -Il problema dei confini: Confini esterni/confini interni Con riferimento ai dati puntuali, il diverso posizionamento dei confini esterni può produrre un identico risultato nel calcolo di una sintesi statistica, ma la sua corretta utilizzazione richiede che il valore ottenuto sia collegato alla specifica situazione spaziale dei dati. Nel caso esemplificato nella fig.1, ad esempio, si verifica uno stesso valore nella misura della variabilità pur con il passaggio, nella figura, dai confini A ai confini B. Figura 1: A- Confini esterni suggeriscono una dispersione- modello regolare o disperso per il confine A B- Confini esterni suggeriscono una concentrazione- pattern raggruppato o cluster per il confine B l’aver ottenuto un identico risultato nella misura della variabilità non può sintetizzare sufficientemente e in modo appropriato lo stato delle informazioni iniziali. Nel caso delle unità areali la posizione dei confini interni produce differenti strutture territoriali, anche se i valori del carattere risultassero invariati, gli indici statistici di sintesi potrebbero portare diversi e non generalizzabili risultati Figura 2A- situazione di segregazione/concentrazione ? Figura 2B-situazione d’integrazione/equidistribuzione? i risultati di metodi statistici quali, ad esempio, la misura della concentrazione o dell’autocorrelazione saranno diversi, pur se i valori osservati nei due casi esemplificati non risultassero modificati. il valore sintetico delle elaborazioni deve essere sempre collegato alla struttura territoriale dalla quale provengono i dati per assicurare una corretta interpretazione delle risposte fornite dai metodi statistici applicati. Modificazione Aree Quanto osservato dagli autori Openshaw e Taylor, sinteticamente espresso con la sigla MAUP, genera due possibili conseguenze: 1-problema di aggregazione per media: se varia la forma delle unità areali, in uno stesso spazio, l’aggregazione per media può produrre dati capaci di generare risultati stabili per alcuni indici e variabili per altri; è quanto viene sinteticamente illustrato dalla lettura dei grafici delle fig.3 A e B Figura 3A; 3B Effetti di aggregazione Figura 4A- valori su dati individuali _ calcolo media e varianza Media - sommo tutti i valori della popolazione in oggetto e dividendo per il numero delle osservazioni M=(4+8+12+..+)/16 2 Varianza: Rappresenta la media aritmetica dei quadrati delle distanze dei dati dalla media M Var= ∑(x-M) /N Calcolo: la media è già calcolata (7,5); Calcolo i quadrati delle distanze dei dati dalla media: es (4-7,5)2; (8-7,5)2 ; (12 7,5)2… sommo dei quadrati ottenuti: 12,25+0,25+20,25+… = 153,8125 Calcolo la media dei quadrati e ottengo la Varianza: 153,8125/16 = 9,75 Fig 4B – modifico le aree e assumo il valore medio (I+II) colonna; (III+IV) colonna Fig . 4C Ulteriore raggruppamento: Figura 5 –Altro tipo di modificazione: modificazione delle aree e invarianza degli indici di sintesi 2-problemi di scala o di aggregazione per somma: al variare dell’estensione delle aree variano i dati areali ottenuti dal raggruppamento di valori unitari con la conseguenza di rendere non stabili e quindi non generalizzabili i risultati di alcune metodologie. Nel ricorso alla correlazione tra variabili l’errore ecologico segnala, infatti, come la misura dell’associazione tra variabili aggregate non rappresenti la misura dell’associazione a livello di dati individuali, a causa della riduzione della variabilità nei dati aggregati. Il “lavoro” geografico della classificazione dei territori è sensibile, dunque,: ai confini, alla scala, alle tipologie di misure e aggregazioni Esempio misure di disuguaglianza e povertà: variazione della classificazione dei paesi poveri Paesi in base al PIL (PPA) 2010 (IMF 2010): in base alla sola variabile economica Classificazione ISU/combinazione di Pil; speranza di vita ;alfabetizzazione Esempio il gerrymanderingElbridge Gerry, governatore del Massachusetts che in occasione delle elezioni del 1812, Ridefinisce i confini dei distretti in modo da predeterminare il risultato delle elezioni Gerry sapeva che il suo partito (i Democratici) era messo molto peggio degli avversari (i Repubblicani). In effetti i repubblicani vinsero agevolmente le elezioni, facendo fuori il governatore e conquistando la maggioranza alla Camera; ma al Senato i democratici mantennero nonostante tutto la maggioranza dei seggi. La cosa non passò certo inosservata, anche perché i collegi elettorali assunsero forme davvero sinuose… come le spire di una salamandra. I Repubblicani cominciarono a parlare di gerry-mander (salamandra), e in qualche decennio la parola divenne di uso comune Per capire come funziona il gerrymandering, basta pensare a una regione composta da una città circondata dalla campagna. Nella città abita circa metà della popolazione totale, es si vota a sinistra, nella campagna, dove abita l’altra metà, si vota destra. Se chi ha il potere di ridisegnare i collegi elettorali della regione volesse far vincere la destra, potrebbe disegnare i vari collegi in modo che ogni collegio cittadino comprendesse una fetta di campagna tanto grande da far sì che i cittadini di sinistra risultino inferiori in numero agli abitanti rurali di destra. Il gioco dei confini : ogni area stesso numero di individui (16) ma… Caso di sinistra 8 rossi/8 blu=equidistribuzione ; caso di destra no Caratteristiche dei dati Spaziali/territoriali I dati spaziali /territoriali hanno delle caratteristiche specifiche e diverse da quelli che non hanno uno specifico riferimento allo spazio. In effetti: 1- le unità di riferimento sono diverse: unità territoriali (preesistenti e scelte in relazione alla finalità della ricerca). Le unità spaziali, invece, (celle) sono costruite dal ricercatore 2- I dati spaziali sono dipendenti (legge di Tobler) 3- La dipendenza è multidirezionale 4- La forma della struttura territoriale da cui provengono (MAUP) 5- Le tecniche statistiche devono tenere esplicitamente conto della posizione dei dati nello spazio 6- I risultati non sono generalizzabili GLI AMBITI DELLA STATISTICA SPAZIALE/TERRITORIALE tutte le analisi in cui lo spazio è fondamentale Biologia- i sistemi viventi nel loro particolare Habitat Economia ed econometria- differenza tra spazio assoluto (cartesiano) e applicazione territoriali Geografia – cartografia e telerilevamento Medicina- epidemiologia Gestione del territorio (pianificazione.. Sulle varie tipologie di unità è possibile rilevare i caratteri, le modalità. I DATI OTTENUTI rispondono a varie tipologie sia rispetto all’unità (puntuale, areale, direzionale..) sia rispetto alla classificazione delle SCALE DI MISURA utilizzata. Le scale di misura. La rilevazione dell’informazione xij di X(s) sull’unità sj, richiede ed è, essenzialmente, una “misura”. Si distinguono quattro scale di misura: nominale, ordinale, intervallare, proporzionale. Si consideri un certo carattere o variabile X e, per semplicità due unità statistiche e sia x1 la rilevazione eseguita sulla prima unità e x2 quella eseguita sulla seconda. Si dice che il carattere è qualitativo e di tipo sconnesso se tra le due osservazioni è possibile porre soltanto le seguenti relazioni: x1 = x2 x1 ¹ x2 e la scala è di tipo nominale. Si tratta di variabili o caratteri definiti da oggettivi verbali e non ordinabili se non in modo arbitrario come nazionalità, professioni, religioni,…. La differenza tra le due rilevazioni si pone uguale a 0 se queste sono uguali e pari a 1 se sono diverse. Se le modalità o unità di misurazione sono definite con aggettivi Non arbitrariamente ordinabili, la scala è nominativa ordinale e sono possibili le seguenti relazioni tra le due misurazioni: x1 = x2 x1 ¹ x2 x1>x2 x1<x2 Le modalità possono essere rappresentate come punti su una retta ma a distanza arbitraria perché la differenza non è quantificabile in modo oggettivo ma solo con un ordinamento, esempio i voti presi da due studenti, uno con 20/30 e un altro 25/30 è solo possibile dire che il primo è stato valutato meno del secondo. Non è possibile quantificare le differenze tra le intensità delle osservazioni. La scala non è regolare e gli intervalli non sono costanti. Sono un esempio la scala Mercalli per misurare l’intensità dei terremoti, mediante gli effetti distruttivi che esso produce su persone, cose e manufatti. Due terremoti di identica magnitudo (energia) possono avere diverse intensità, se presentano ipocentri posti a differenti profondità, ma anche se si verificano in zone con una diversa antropizzazione. Un terremoto di altissima magnitudo che avviene in mezzo al deserto, dove non ci sono costruzioni potrà avere intensità minore (quindi un Grado Mercalli inferiore) rispetto ad un altro, di magnitudo inferiore, che avviene in una zona rurale densamente abitata, o dove le costruzioni non sono antisismiche. e la scala di Mohs per misurare la durezza dei minerali ( ci sono 10 minerali di r iferimento a ciascuno dei quali è stato assegnato un valore di durezza basato sulla capacità di un minerale di scalfire il minerale classificato nel grado precedente). scala di Mohs La scala si dice intervallare se la misura è quantitativa ma l’origine dell’unità di misura è arbitraria, in tal caso ha senso misurare l’intensità della differenza tra i due valori, ovvero sono possibili le relazioni: x1 = x2 x1 ¹ x2 x1>x2 x1<x2 x1 – x2 In tal caso è possibile valutare la differenza tra due coppie di valori : x1 - x2 = d1 e x3 – x4 = d2 e valutare se d1 >d2 o d1<d2 o d1=d2 ma non ha senso il rapporto tra le due quantità. Questo perché l’origine è arbitraria. La scala è tipica per la misura delle temperatura : scala centigrada lo zero è il punto di congelamento dell’acqua Mentre per la scala Kelvin, lo zero è quello assoluto (assenza di calore) a -273 gradi. Una temperatura di 30 gradi centigradi è di 303 gradi Kelvin; la differenza tra 50 e 30 gradi centigradi è 20 gradi e tra 323 e 303 gradi Kelvin è sempre di 20 gradi ma non è più possibile valutare il rapporto tra le due valutazioni che è assolutamente diverso: 50/30 ¹ 323/303. 1,6667¹ 1,0660066 La scala a intervalli ha la proprietà di poter misurare le differenze tra coppie di valori ma non il loro rapporto. Una temperatura di 40°C non è doppia di quella a 20°C. Se pongo la mano destra in una bacinella con acqua a 40°C e la sinistra in una con acqua a 10° non dirò che la prima scotta quattro volte più della seconda. Le caratteristiche della scala risultano evidenti nella datazione, nelle altezze topografiche che assumono come origine arbitraria il livello del mare o nelle longitudini geografiche che partono dal meridiano zero arbitrario che è il meridiano di Greenwich. I caratteri quantitativi sono misurabili in senso stretto su scala proporzionale o intervallare quando la scala di misura possiede lo zero ovvero un’origine oggettiva in termini di un modulo prefissato e la misura (intesa anche come conteggio o enumerazione) indica di quanto l’osservazione si discosta dallo zero oggettivo. I caratteri quantitativi possono essere discreti o continui. Nel primo caso la scala è proporzionale e lo zero indica che il carattere non è rilevato o rilevabile ed è riferita ai conteggi Su tale scala proporzionale possono essere effettuate tutte le operazioni (es confronto tra rapporti di due misurazioni) Conseguentemente il dato xij e l’insieme degli stessi, è l’informazione qualitativa o quantitativa sulla quale specifiche elaborazioni, per la ricerca in essere, verranno applicate Statistica descrittiva per dati legati al territorio. I dati puntuali sono informazioni su un fenomeno X, raccolte in una precisa localizzazione o unità territoriale, individuata da due coordinate Se l’interesse dell’analisi riguarda solo la localizzazione del fenomeno, es studio della distribuzione territoriale di una attività economica i punti o unità territoriali costituiscono di per sé il dato statistico e si parla in tal caso di dati semplici; in tutti gli altri casi alle coordinate è associata la misura del carattere e i dati si definiscono “pesati” e sono identificati da tre valori: la coppia delle coordinate e la misura di X. I dati puntuali SONO adattabili poichè con un’appropriata scelta di scala i dati possono essere riferiti anche a unità territoriali grandi come città o enormi come stelle o galassie In tale caso, sia nella trattazione dei dati come nell’utilizzo dei risultati è ovviamente necessario non disattendere il riferimento alla scala e quindi alla approssimazione che è stata realizzata. Nei dati puntuali semplici il campo di ricerca è prevalentemente orientato all’individuazione delle cause che hanno determinato la distribuzione territoriale risultante dalle osservazioni, fino a pervenire alla possibile definizione di un modello teorico che ne interpreti la struttura essenziale e la sintetizzi. L’ ordine o di una struttura in una mappa di punti, si basa, in effetti, sull’opinione che le distribuzioni geografiche riferibili a localizzazioni di unità, possano derivare da decisioni umane o da condizioni endogene di un fenomeno e quindi non siano solo il risultato di eventi casuali ma riflettano l’esistenza di un sistema espressione di un processo spaziale. Con riferimento ai dati puntuali pesati, l’analisi è tendenzialmente volta a studiare e interpretare quanto e se la variazione riscontrata nei valori sia imputabile all’effetto territorio, inteso come causa co-agente di quanto rilevato Le metodologie descrittive : una prima analisi dei dati Rappresentazione grafica dei dati puntuali. La rappresentazione grafica dei dati è uno strumento di sintesi visiva di notevole impatto informativo: l’esposizione simultanea e d’insieme del fenomeno risulta, in tal modo, molto più efficace della lettura di una tabella. rappresentazione grafica deve fornire una facile e chiara traduzione visiva delle informazioni raccolte unitamente all’indicazione del loro riferimento temporale e spaziale I grafici possono essere realizzati riportando i dati sulla carta geografica del territorio o, sullo spazio convenzionale di un piano cartesiano: il grafico risultante, detto propriamente “pattern”, è qualificato come semplice se riguarda la locazione dei punti semplici o pesato se ai punti sono associate le intensità dei valori osservati. Il pattern è una configurazione grafica nella quale la localizzazione di un insieme di punti è descritta in termini di distanza relativa di un punto dall’altro. Con riferimento ai dati non pesati, il pattern, geografico o cartesiano, ha anche lo scopo di facilitare la ricerca del loro adattamento ad un modello teorico che possa interpretare e giustificare, concettualmente ed operativamente, il possibile processo spaziale ad essi collegato pattern semplici schematicamente esemplificati nella figura : evidenziano forme distributive riconducibili a modelli di strutture predefinite: a) il pattern è il risultato di un processo casuale in quanto i dati non presentano alcun possibile ordinamento, mentre la fig. b riporta il grafico di una distribuzione uniforme o regolare con la presenza di un ordine nei punti, infine, nella fig.c il raggruppamento di unità rivela un modello distributivo detto “modello cluster”. Fig. Tipologie di Pattern :a) casuale: non vi è un ordine preciso àvi è uguale possibilità di occupare un punto nell’area individuo non influenza la posizione dell’individuo vicino. e la presenza di un Presenta sia individui raggruppati che isolati o regolarmente spaziati Di solito questa conformazione è propria di situazioni in cui la densità degli individui è bassa rispetto all’area o al volume disponibile La distribuzione uniforme o regolare si ha in situazione di competizione, esempio modelli di concorrenza perfetta, la competitività territoriale si manifesta in una suddivisione regolare dello spazio. Uso del suolo agricolo: lo spazio tra le piante. In qualsiasi situazione con una popolazione “affollata” si tende ad allontanarsi dagli altri vicini Fig. Tipologie di Pattern : b) regolare Ci si riferisce ad un Pattern raggruppato o cluster quando la distribuzione della localizzazione presenta gruppi ben definiti. E’ una distribuzione non uniforme in cui ci sono cause di aggregazione/dispersione Fig. Tipologie di Pattern c) cluster Rappresentazione grafica dati pesati. Per la rappresentazione grafica dei dati pesati, in corrispondenza dei punti vengono riportati i valori del carattere generalmente espressi dalla dimensione di figure geometriche come segmenti o rettangoli di uguale base. Esempio rappresentazione geografica provincie Piemonte Fig. a) non pesata La carta evidenzia la particolare localizzazione delle otto province: Novara, Vercelli, Alessandria ed Asti occupano la zona centro-orientale del Piemonte prossima alla Lombardia, mentre Verbania, Biella, Torino e Cuneo sono insediamenti che seguono la corona delle Prealpi. Le localizzazioni sono individuate dalle coordinate geografiche o da coordinate cartesiane Se aggiungo delle informazioni valoriali a ciascun punto considerato potrò agganciare il relativo valore rilevato. La tavola riporta alcune informazioni Istat, pubblicate nell’anno 2011, relative alle otto province del Piemonte: vi si leggono i dati puntuali semplici delle due coordinate ufficiali dei centri delle città capoluogo, colonne 2 e 3, unitamente ai dati pesati del tasso di tentato suicidio per 100.000 abitanti (valori medi 2007-2010), col.4, e alla percentuale della popolazione nel 2010,col.5, collegati alle stesse coordinate Tavola1 - Coordinate geografiche, tassi di tentato suicidio per 100.000 abitanti(media 2005-007) e percentuale della popolazione nel 2010 nelle province del Piemonte. Province Lat.N. Long.E. T.Suic. Aless. 44,9 8,6 2,2 10 6,04 3,3 Asti 44,9 8,2 8,3 5 4,06 3,4 Biella 45,6 8,1 16,7 4 4,07 6 Cuneo 44,4 7,5 11,2 13 3 1,5 Nova. 45,5 8,6 3,0 8 6,03 5,3 Torino 45,1 7,7 7,1 53 3,04 4,4 Ver. * 45,9 8,5 10,1 3 6,01 7,9 Verc. 45,3 8,3 8,5 4 5,04 5 7,5 100 Piem. *La provincia comprende Verbano, Cusso e Ossola. %Pop. Cartesiane X Cartesiane y Il pattern è disegnato su un piano cartesiano con le informazioni relative dell’intensità dei valori. Nel grafico è riportata la scala di misura dei valori . Da ciascun punto s’innalza un segmento di retta/rettangolo con lunghezza proporzionale ai singoli valori osservati secondo una scala di misura introdotta e indicata nel grafico. E’, evidente la forte attrazione alla urbanizzazione esercitata dalla città di Torino, che è la città più popolosa, seguita, a distanza, dalle città di Cuneo, Alessandria e Novara. Rispetto alla propensione al suicidio risulta elevata, per gli anni in oggetto, nelle province pedemontane e meno popolate di Biella e Verbania. Un passaggio importante avviene nel passaggio dalla descrizione del fenomeno alla sintesi dello stesso. 3. Misure della tendenza centrale L’espressione “tendenza centrale”, con riferimento ai dati puntuali, indica il risultato di un’elaborazione delle informazioni che individua le coordinate di un punto di tendenziale “attrazione” dei dati, ovvero un punto “medio” con proprie e singolari prerogative. Le misure statistiche più frequentemente utilizzate sono il centro medio, il centro mediano e i quartili. L’applicazione dell’uno o dell’altro metodo dipende dalle proprietà delle diverse misure, dalle condizioni derivanti dalla tipologia delle informazioni o, anche, da specifiche esigenze di ricerca. Il centro medio. Siano xi,yi con i=1,2,…,n le coordinate(xi di ascissa e yi di ordinata), di n dati puntuali semplici in uno spazio di riferimento bidimensionale. Si definisce centro medio il dato puntuale (`x,`y) ottenuto dalla media aritmetica delle rispettive coordinate: `x = (S xi)/ n e `y = (S yi)/ n Se si indicano con wi pesi collegati ai valori del carattere X per i dati puntuali pesati, il centro medio è detto “pesato” o “ponderato” ed è ottenuto dalle espressioni: `x = (S xi wi) / S wi `y = (S yi wi) / S wi e Si definiscono pesi relativi le quantità espresse dai rapporti: pi = wi / S wi con S pi = 1 e, conseguentemente, l’espressione del centro medio pesato diviene: `x = S xi pi e `y = S yi pi Il centro medio ha la proprietà di essere il baricentro della distribuzione dei punti ovvero il punto di equilibrio distributivo che annulla la somma algebrica dei segmenti di distanza da tale media, proprietà che risulta espressa dalla relazione: Si [( xi – `x ) + (yi –`y )] = 0 per dati non pesati, e dalla: S i [( xi – `x ) + (yi –`y ) ] wi = 0 per dati pesati. Rispetto alla tavola 1 per le coordinate cartesiane non pesate rirulta xmedio=4,66 ;y medio=4,6 Province Aless. Asti Biella Cuneo Novara Torino Verb. Verce. Coord. medie Coord X 6,04 4,06 4,07 3 6,03 3,04 6,01 5,04 4,66 Coord. Y 3,3 3,4 6 1,5 5,3 4,4 7,9 5 4,6 x-xm 6,04-4,66 4,06-4,66 4,07-4,66 3-4,66 6,03-4,66 3,04-4,66 6,01-4,66 5,04-4,66 S0 y-ym 3,3-4,6 3,4-4,6 6-4,6 1,5-4,6 5,3-4,6 4,4-4,6 7,9-4,6 5-4,6 S0 Risultato che si ottiene applicando la regola della distanza dei punti su una retta Se con di si indica la distanza euclidea di ciascun punto dal baricentro, ovvero la quantità: di = [( xi – `x )2 + (yi –`y )2] 1/2 si può introdurre la seconda proprietà del centro medio espressa dalla relazione: Sdi2= S[( xi – `x )2 + (yi –`y )2] = minimo per dati non pesati e dalla: Sdi2= S [( xi – `x )2 + (yi –`y )2 ]wi = minimo per dati pesati. Distanza tra due punti su una retta: proietto sugli assi cartesiani Distanza Euclidea: distanza su un piano Si ricorda che la radice di questa distanza è l’ipotenusa: dunque la distanza più breve tra due punti nello spazio data dall’ipotenusa è minima La seconda proprietà del centro medio è dunque quella di minimizzare la somma del quadrato delle distanze di ciascun punto dal baricentro. L’individuazione del centro medio (indicato alle volte con il termine “internalità”), permette di caratterizzare in molti modi la distribuzione osservata. In particolare la sua posizione può suggerire interpretazioni sulle ragioni geo-socio-economiche della struttura territoriale dei punti, mentre la determinazione del baricentro per successivi intervalli temporali evidenzia il “trend territoriale” ovvero la tendenziale evoluzione nella dislocazione territoriale del fenomeno; ancora il confronto fra i baricentri di due o più distribuzioni, relative a diverse aree, può fornire indicazioni e interpretazioni sulle ragioni e/o sulle cause di quanto territorialmente osservato. Nel calcolo del baricentro intervengono tutti i valori della distribuzione e ove siano presenti valori estremali o outliers, questi possono trascinare la stima del centro medio nella loro direzione e rendere la media un indicatore non “robusto” del punto di equilibrio dei dati. Esempio:Trend Territoriale-tracciato dei centri medi della popolazione dal 1790 al 1990 degli Stati Uniti ALTRI TIPI DI DISTANZE-La distanza di Manhattan A seconda delle situazioni posso misurare la distanza tra due punti o con la distanza Euclidea o con quella di Manhattan. In un sistema cartesiano scelti due punti sul piano, le coordinate relative permettono di costruire un triangolo rettangolo: la distanza di Manhattan è la misura della somma della lunghezza dei cateti mentre la distanza euclidea è l’ipotenusa del triangolo. Distanza di Manhattan e distanza euclidea. Nella figura fig. sono illustrate i due tipi di distanza. In un sistema cartesiano scelti due punti sul piano, le coordinate relative permettono di costruire un triangolo rettangolo: la distanza di Manhattan è la misura della somma della lunghezza dei cateti mentre la distanza euclidea è l’ipotenusa del triangolo. Esempio del Tassista Schematizzazione della mappa: Il problema del tassista a Manhattan Deve Contare Riporto le informazioni rispetto ad un primo percorso ( - - -) su di un piano cartesiano Formula distanza Manhattan dT (( x1 , y1 ), ( x2 , y2 ) ) =| x1 - x2 | + | y1 - y2 | Mettendo dei valori possiamo trovare sia la distanza euclidea sia quella di Manhattan Dati due punti, xi e xj, in uno spazio definito, s’indica con “distanza” la linea che li unisce e la cui dimensione è espressa in valore assoluto. Le distanze esprimono una diversità e si dicono distanze metriche se godono delle seguenti proprieta’: 1-d ( xi , xj ) = 0,se xi = xj : la distanza di un punto da se stesso è nulla; 2-d| xi , xj | > 0, se xi ¹ xj : la distanza tra due punti diversi fra loro è maggiore di zero e positiva; 3-d| xi , xj | = d| xj , xi | (simmetria) : dati due punti xi ¹ xj la distanza è invariante rispetto al punto di partenza; 4-d | xi , xj | £ d | xi , xh | + d | xh , xj | per qualsiasi xi , xj , xh (disuguaglianza triangolare) : la distanza tra due punti è minore o uguale alla somma delle distanze tra ciascun punto e un terzo preso di riferimento. L’espressione matematica più generale di “distanza” è data dalla “distanza di Minkowski”, indicata con dt,, la cui formula è: dt = {S r = 1,2,..k| xir – xjr|t }1/t La distanza di Minkowski per uno spazio a r = 1,2,…,k dimensioni, qualifica e quantifica la distanza di ordine t tra 2 punti xir e xjr, come la radice di ordine t della somma delle potenze t.me delle distanze assolute tra i due punti in ciascuna dimensione. La distanza di Minkowski per uno spazio bidimensionale, è pari a: d2 = {S r = 1,2| xir – xjr|t }1/t In particolare per t=1 si ottiene la così detta “distanza di Manhattan”, definita dalla relazione: d1 = S r = 1,2| xir – xjr| mentre per t = 2 si introduce la “distanza euclidea” espressa da: d2 = {Sr=1,2| xir – xjr|2}1/2 = [ (xi1 – xj1)2+ (xi2 – xj2)2]1/2 Formula che in uno spazio bidimensionale e per due punti è un’applicazione del teorema di Pitagora. Il centro mediano e i quartili Si è trattato dell’individuazione del centro medio indicato come “centro di attrazione”. Nel calcolo del baricentro intervengono tutti i valori della distribuzione e ove siano presenti valori estremali o outliers, questi possono trascinare la stima del centro medio nella loro direzione e rendere la media un indicatore non “robusto” del punto di equilibrio dei dati come già detto. In Statistica per annullare questo possibile effetto si usa la mediana, detta anche media di posizione, è il valore del carattere che occupa la posizione centrale in un ordinamento, generalmente crescente, dei dati. La mediana gode sia della proprietà a) di rendere minima la somma delle distanze assolute dalla mediana stessa, sia quella b) di ripartire il gruppo delle osservazioni in due sottoinsiemi ugualmente numerosi formati dal numero di valori inferiori o uguali alla mediana, l’uno, e dal numero dei valori superiori o uguali alla mediana, l’altro. In relazione al differente metodo usato nella misura delle distanze si distinguono due tipi di mediana: la mediana di Manhattan e la mediana euclidea. Mediana di Manhattan. Siano xi e yi le coordinate di i= 1,2,…,n dati puntuali semplici, per il calcolo della mediana di Manhattan si ordinano in senso non decrescente ciascuna delle coordinate xi e yi e si distingue se i dati puntuali sono in numero dispari o pari. Nel primo caso le coordinate xme e yme che corrispondono al rango di ordine (n+1)/2, definiscono al punto o centro mediano e ciascuna linea orizzontale e verticale tracciate dal punto separa i punti in due sottoinsiemi di uguale numerosità. Nel secondo caso in corrispondenza del rango di ordine n/2 si individuano le coordinate 1xme e 1 yme e, per il rango di ordine(n/2)+1, le coordinate 2xme e 2 yme ( e se ne fa la media aritmetica). Le parallele di ascissa e di ordinata tracciate dalle due mediane (1xme , 1 yme) e (2xme , 2 yme), selezionano una porzione di piano i cui punti sui confini e nell’area godono della proprietà di essere “centro mediano”, ovvero di soddisfare le proprietà della mediana ma questa non risulta univocamente definita. Data le seguente distribuzione in cui le coordinate degli 11 punti sono: X 1 Y 2 2 8 3 1,5 2,5 4 3,5 5 6 9,5 5,5 6 8 8 5,5 7,5 Distribuzioni ordino la X (stessa cosa per la y) X= 1 1,5 2 3 3 3,5 5,5 6 8 8 9,5 Y= 2 8 5,5 9 1,5 5 7,5 4 2,5 8 3 9 1,5 8 (11 valori) 6 Centro medio X: (1+1,5+2+3+3+3,5+5,5+6+8+8+9,5)/11= 4,6 Y: (2+8+5,5+9+1,5+5+7,5+4+2,5+2,5+6)/11= 5,4 Mediana di Manhattan xà ( n+1)/2= 3,5 yà Ordino 1,5 2 2,5 4 5 5,5 6 7,5 8 8 9 à (n+1)/2=5,5 Mediana, Quartili = centro medioà x=4,6; y=5,4 X0,5= 3,5 Y0,5= 5,5 Distribuzioni X= 1 1,5 2 3 3 3,5 5,5 6 8 Y= 2 8 5,5 9 1,5 5 8 7,5 4 2,5 8 9,5 (11 valori) 6 Centro medio X: (1+1,5+2+3+3+3,5+5,5+6+8+8+9,5)/11= 4,6 Y: (2+8+5,5+9+1,5+5+7,5+4+2,5+2,5+6)/11= 5,4 Mediana di Manhattan xà ( n+1)/2= 3,5 yà Ordino 1,5 2 2,5 4 5 5,5 6 7,5 8 8 9 à (n+1)/2=5,5 Il valore assunto dalla mediana ci dice il valore del carattere che occupa la posizione centrale in un ordinamento, generalmente crescente, dei dati. Collegati alla mediana di Manhattan, si definiscono quartili, indicati con Q1 e Q3, due punti le cui quattro coordinate, indicate con xovest e xest per le ascisse,e ynord e ysud per le ordinate, sono calcolate reiterando il procedimento visto per la mediana, relativamente al 50% dei dati inferiori o uguali alla mediana di Manhattan, per il primo quartile e al il 50% dei dati puntuali superiori o uguali alla stessa mediana per il terzo quartile. Le coordinate xovest e ysud del punto primo quartilico,Q1,selezionano, rispettivamente, il 25% dei punti con coordinate inferiori o uguali a quelle di Q1, dal 75% dei punti con coordinate ad esse superiori e, ancora, le coordinate xest e ynord, del terzo quartile, Q3, individuano, nell’ordinamento, quelle che hanno un valore maggiore o uguale a quello del 75% dei dati e, nello stesso tempo, inferiore o uguale a quello del restante 25% dei dati. Il secondo quartile Q2, coincide, ovviamente, con la mediana di Manhattan. La mediana e la posizione dei quartili rispetto ad essa, informano anche sulla forma distributiva dei dati: un primo quartile con valore molto prossimo a quello della mediana segnala una concentrazione di punti nell’area nell’intorno e a sinistra del centro mediano. Data una distribuzione di punti e ordinate le loro coordinate posso, quindi, individuare i punti che mi ripartiscono la distribuzione originaria in quattro parti di uguale numerosità:1/4 (Q1), 2/4=1/2 Mediana di Manhattan;3/4 Q3 75% e 4/4= 1 ossia la totalità dei punti. I quartili, come la mediana, sono indici di posizione Esempio rispetto al caso precedente. Quartile est rispetto alla dimensione x considero i valori più piccoli di quello mediano(3,5) Per la nostra distribuzione si ha 1 1,5 2 3 3 3,5 sono i valori< = a 3,5 Sono 6 valori allora per individuare il quartile dovrò applicare la formula n/2, (n/2)+1à 2 , 3à 2+3/2=2,5 Q est (insieme dei valori più piccoli e uguali della mediana in x) Q ovest: più grande( e uguale) della mediana in x valori : 3,5 5,5 6 8 n/2, (n/2)+1à 6 , 8à 6+8/2=7 Q ovest x=7 8 9,5 à Q Sud rispetto alla dimensione y considero i valori più piccoli e uguali di quello della mediana(5,5) QS: 1,5 2 2,5 4 5 5,5 à n/2, (n/2)+1à 2,5 , 4à(2,5+ 4)/2= 3,25 Q Nord va calcolato considerando tutti i valori più grandi ( e uguali) della mediana in y valori 5,5 6 7,5 8 8 9à n/2, (n/2)+1à 7,5 8à(7,5+ 8)/2=7,75 Esempio su coordinate per il calcolo della mediana di Manhattan e dei quartili si ricava dai i dati della Tavola 4 contenente le coordinate delle città della Dodecapoli etrusca, ovvero di 12 città o lucumonie che intorno al IV o V secolo a.C., si confederarono ed elessero il centro di Voltumna, presso Volsinii (Bolsena),come luogo d’incontro per le riunioni necessarie e indette per trattare le più importanti decisioni comuni. Non c’è consenso totale sull’elenco delle città della Dodecapoli, alcuni escludono Roselle e inseriscono subito Populonia, ma senza entrare in particolari tecnici dell’Archeologia, l’esempio è stato preso anche per sottolineare come il ricorso ad analisi territoriali sia diffuso in tutti i settori della ricerca. Carta della Dodecapoli Tavola 4. Coordinate delle città della Dodecapoli etrusca * Dodecapoli etrusche Caere(Cerveteri) Tarquinia Vulci Roselle Vetulonia Veio Volsini(Bolsena) Chiusi Perugia Cortona Arezzo Volterra Lat.N.(Y) 42,00(1) 42,25(3) 42,42(4) 42,81(6) 42,86(7) 42,02(2) 42,64(5) 43,01(8) 43,11(9) 43,28(10) 43,47(12) 43,40(11) Lon.E.(X) 12,15(9) 12,76(12) 11,63(4) 11,14(3) 10,97(2) 12,40(11) 11,98(7) 11.95(6) 12,39(10) 11,99(8) 11,87(5) 10,86(1) Baricentro: 42,77 ; 11,754 Centro mediano:42,81 ; 11,95 Il primo quartile ha coordinate xovest =11,14 e latitudine ysud = 42,25 il secondo longitudine xest = 12,15 e latitudine ynord = 43,11. *Sono le probabili città della Dodecapoli prima del 396 a.C. Il baricentro geografico delle lucumonie è individuato dalle coordinate di 42,77 gradi di latitudine nord e 11,754 gradi di longitudine est mentre il centro mediano, come si deduce dall’ordinamento delle coordinate della tavola, il cui rango è indicato nelle parentesi tonde, ha coordinate di gradi 42,835 nord e 11,95est. Il centro mediano è prossimo a Bolsena e (quindi al comune di Volsini ) ed ha la proprietà di minimizzare la somma delle distanze rispetto alle dodici città. L’ordinata del punto mediano isola le sei lucumonie più a ovest da quelle più ad est, mentre l’ascissa che passa per lo stesso punto mediano, divide le sei lucumonie a nord da quelle più a sud. Anche se la valutazione della mediana è basata sulle coordinate attuali, il risultato interroga sulla possibile intuizione dei nostri antenati etruschi, nella scelta della sede comune nel santuario di Volsini. I due punti quartilici della distribuzione territoriale delle lucumonie, sono indicati dalle coordinate che nell’ordinamento crescente delle coordinate di longitudine e di latitudine delle lucumonie della tavola 4, sono entrambe in corrispondenza del rango 12/4 = 3, per il primo quartile e del rango 3x12/4= 9 per il terzo quartile. Il primo quartile ha coordinate xovest =11,14 di longitudine e latitudine ysud = 42,25 e il secondo longitudine xest = 12,15 e latitudine ynord = 43,11. In modo analogo a quanto verificato per le coordinate della mediana, quelle dei quartili individuano, nel territorio, gruppi di punti di prefissata numerosità: ad esempio, per i dati sulle lucumonie, la coordinata ynord del primo quartile, separa tre delle dodici lucumonie situate a nord dalle restanti nove che sono a sud della stessa coordinata. Il pattern della Dodecapoli e i valori ottenuti dal calcolo della mediana di Manhattan e dei quartili sono riportati graficamente nella figura fig.12. FIG.12. Pattern della Dodecapoli etrusca e coordinate della mediana di Manhattan e dei quartili Ricorda. La latitudine di una località è la distanza di tale località dall'Equatore. Questa distanza viene misurata lungo ilmeridiano che passa per quel luogo. La longitudine di una località è la distanza di tale località dal meridiano di Greenwich. Questa distanza viene misurata lungo ilparallelo che passa per quel luogo. Nel caso di un numero di valori pari in statistica per trovare la determinazione della mediana e dei quartili si opera la media aritmetica dei valori individuati. Si sono, inoltre, già richiamate le due proprietà associate alla mediana statistica: a) di rendere minima la somma delle distanze assolute dalla mediana stessa, b) di ripartire il gruppo delle osservazioni in due sottoinsiemi ugualmente numerosi formati dal numero di valori inferiori o uguali alla mediana, l’uno, e dal numero dei valori superiori o uguali alla mediana, l’altro. Nella geostatistica e rispetto ai dati puntuali non sempre si realizzano queste due proprietà perché: Nei dati puntuali semplici non si incontrano ostacoli per un numero dispari di localizzazioni ma se ho un numero pari di coordinate la Mediana mi individua un’AREA e diviene arbitrario scegliere come localizzazione mediana la media aritmetica tra le due coordinate o analogo punto interno perché non sono in uno spazio indifferenziato. Nel caso dei dati pesati, per il calcolo della mediana di Manhattan si ricorre ancora all’ordinamento dei dati secondo le coordinate, alla successiva cumulazione dei pesi e all’individuazione del punto mediano corrispondente alla coordinata del termine n/2 e (n/2+1 )se il totale dei pesi è pari o (n+1)/2 se il totale è dispari. Il risultato, tuttavia, può fornire una stima che non realizza la seconda proprietà della mediana: quella di avere pesi uguali a sinistra e a destra e sopra e sotto la mediana stessa. E’ quanto si può riscontrare nell’esempio riportato nella tavola2: accettare le coordinate di Torino come punto mediano non è certo che soddisfi la simmetrica distribuzione dei pesi, come è richiesto per la stima della mediana. Per questa ragione si preferisce utilizzare, per i dati pesati, la mediana euclidea Tavola 2- Calcolo della mediana di Manhattan per la serie di frequenza della distribuzione percentuale della popolazione nelle province del Piemonte (tavola1). Province Latit.N Cuneo Asti Alessand. Torino Vercelli Novara Biella Verbano 44,4 44,9 44,9 45,1 45,3 45,5 45,6 45,9 % pop 13 5 10 53 4 8 4 3 % cum 13 18 28 81 85 93 97 100 Province Long.E %pop %cum Cuneo Torino Biella Asti Vercelli Verbano Alessand. Novara 7,5 7,7 8,1 8,2 8,3 8,5 8,6 8.6 13 53 4 5 4 3 10 8 13 66 70 75 79 82 92 100 Commento Mediana Manhattan punti pesati: l’ordinamento viene fatto sul carattere latitudine. In corrispondenza ci sono le frequenze (come nella tavola ad. es la popolazione%). Si calcola la cumulata delle frequenze (peso). La mediana è in corrispondenza delle frequenze (cumulate) (N+1)/2 se dispari o della media dei valori corrispondenti alle frequenze cumulate N/2 à (N/2)+1. Si vuole una ripartizione dei pesi al 50% sopra e sotto la mediana, ma con i dati pesati non sempre questo si verifica. Nell’esempio la coordinata mediana che supera le cumulate del 50% delle frequenze sia per la latitudine che per la longitudine corrisponderebbe con le coordinate di Torino (81% lat; 66% long) ma se si assume Torino come mediana di Manhattan i pesi non sarebbero ugualmente distribuiti sopra e sotto la mediana. In particolare sotto il 50% c’è lo 81% di pop e sopra il 19%... WEBER, infatti, calcola il baricentro e non la mediana. Mediana euclidea Le coordinate della mediana euclidea (xme ; yme) per n dati puntuali semplici, si ottengono dalla soluzione della condizione di minimo imposta nella seguente relazione: S[(xi- xme )2 + ( yi - yme )2]1/2 = minimo nella quale le coordinate sono le incognite da definire. Nei dati puntuali pesati la distanza di ciascun punto dalla mediana ha il peso, indicato con wi, delle corrispondenti coordinate, e la condizione di minimo diviene: Swi[(xi- xme )2 + ( yi - yme )2]1/2 = minimo La proprietà della mediana euclidea, di minimizzare la somma delle distanze euclidee, è, particolarmente per i dati puntuali pesati, la ragione del ricorso alla sua applicazione nella soluzione di problemi relativi alla individuazione di una centralità territoriale, com’è il caso della ottimizzazione nella allocazione di imprese, noto come problema allocazionale di Weber1. In queste problematiche, in effetti, il ricorso al centro medio avrebbe la proprietà di minimizzare la somma del quadrato delle distanze da tale centro e non la totale distanza com’è l’obiettivo del ricorso alla individuazione della mediana euclidea. Si ricorda: centro medio Sdi2= S[( xi – `x )2 + (yi –`y )2 ] = minimo per dati non pesati Sdi2= S [( xi – `x ) + (yi –`y ) ]wi = minimo per dati pesati 2 2 Mediana euclidea S[(xi- xme )2 + ( yi - yme )2 ]1/2 = minimo nella quale le coordinate sono le incognite da definire. Swi[(xi- xme )2 + ( yi - yme )2 ]1/2 = minimo dati pesati per Occorre tuttavia sottolineare che il complesso problema della localizzazione ottimale di un intero sistema di servizi, richiede l’uso di metodologie particolari e relative a misure di distanze diverse da quelle euclidee. La condizione di minimo, imposta per la determinazione della mediana euclidea, comporta non semplici problemi di calcolo che, ove necessario, sono risolvibili con il ricorso a calcolatori programmabili. Nelle situazioni più semplici si può ricorrere alla seguente proposta di soluzione introdotta da Kuhn e Kuenne nel 1962. Il calcolo si basa su un procedimento iterativo convergente verso un valore di tolleranza di errore, predefinito. In particolare, per n dati puntuali e con una tolleranza, ad esempio del 10%, si parte da una prima stima basata generalmente, sul centro medio o su un qualsiasi altro giustificato riferimento iniziale. Tale stima viene iterativamente sostituita da successivi valori mediani, fino a raggiungere il valore ritenuto soddisfacente rispetto alla tolleranza prevista. Con riferimento alla generica tma prova, il procedimento di stima e’ il seguente: 1-si calcolano le distanze euclidee tdi calcolate sugli scarti delle coordinate dei punti dal riferimento preso in considerazione (nel caso particolare dalla stima t.sima txme; tyme)si ottiene: t di = [( xi - txme )2 + ( yi - tyme )2]1/2 dove tdi è la distanza euclidea di ciascuna osservazione dalla tma stima delle coordinate mediane; 1 Il problema della organizzazione delle attività economiche sul territorio ha generato dei modelli di localizzazione e uno dei primi è stato quello di Alfred Weber nel 1909. L’Autore introdusse un modello di localizzazione di attività di due out-put produttivi rispetto al luogo di vendita o mercato finale del bene prodotto nell’ipotesi di domanda rigida rispetto al prezzo, concorrenza perfetta sul mercato dei beni e dei fattore, costi di produzione dati e costanti per ogni impresa 2- si calcolano successivamente i rapporti: t ki = wi / tdi per dati pesati t ki = 1/ tdi per dati semplici ovvero I rapporti così calcolati, sono i pesi necessari per la stima della mediana di ordine t+1 le cui coordinate si ottengono dalla media aritmetica ponderata dei dati iniziali: t+1 xme = (S xi tki )/ S( tki ) e t+1 yme = (S yi tki )/ S( tki ) ; 3- il procedimento si arresta se : | t+1xme - txme | e | t+1yme - tyme | ≤ tolleranza. Esempio La tavola xxx riporta le coordinate, xi e yi, di quattro dati puntuali semplici per il calcolo della mediana euclidea con l’approssimazione proposta da Kuhn e Kuenne. Tavola xxx valori coordinate punti A B C D A B C xi 2 3 5 yi 4 6 1 D 6 5 Dai dati si ricavano le coordinate del centro medio pari a: `x = 4 e `y = 4 e quelle della mediana di Manhattan: xme = 4 e yme = 4,5 Per il calcolo della mediana euclidea s’introduce un livello di tolleranza pari al 10% (0,1) Per evidenziare la differenza con la stima della mediana di Manhattan, si prende il valore di questa per l’inizio delle iterazioni Reciproci à 2,12à 0,485 1,80 0,55 3,64 0,275 2,06 0,485 S= 1,795 Dalla prima stima si otterranno le nuove coordinate della mediana euclidea Xt+1= (0,485 *2 + 0,55*3------)/1,795 =3,85 Yt+1=(0,485 *4 + 0,55*6+---)/1,795= 4,42 La differenza tra xme e xt+1me e tra yme e yt+1 me è rispettivamente |4-3,75| = 0,15 per la x , |4,5-4,42| 0,08 per la y. Poiché la tolleranza era stata posta al 10% questo valore è soddisfatto solo dalla coordinata di y di conseguenza si reitera il processo partendo dalle stime xt+1me , yt+1 me Nella tavola xxx1, sono riportati i risultati delle due iterazioni, Tavola xxx1. Calcolo della mediana euclidea. iterazioni inizio prima seconda x 4,00 3,85 3,75 Y 4,50 4,42 4,38 toll.x |xtme-xt+1me| |0,15| |0,10| toll.y|ytme-yt+1me| |0,08| |0,04| e la stima accettata della mediana euclidea corrispondente al dato puntuale con coordinate 2 pari a: xme = 3,75 e 2yme = 4,38 La fig.xxx2 è il grafico dei dati e dei risultati dell’esempio, mentre è possibile verificare, con risultati delle due iterazioni essi, le proprietà delle due mediane. Figxxx