Prima parte

Transcript

Prima parte
"Materiale ad esclusivo uso interno del corso. E' autorizzata la riproduzione da supporto
informatico, ad uso personale. E' vietato qualsiasi utilizzo commerciale del presente materiale”
La natura non si ripete: la variabilità è l’attitudine di una grandezza di assumere valori o modalità diverse in
un campo di possibilità, detto campo di variabilità, che può essere finito o infinito
E’ esperienza quotidiana avvertire la variabilità.
La geografia osserva ed analizza un particolare aspetto della variabilità che è quello evidenziato nelle
diverse manifestazioni territoriali e l’oggetto di studio è l’identificazione e la classificazione della REGIONE
La Statistica offre strumenti che di ausilio per le misurazioni della variabilità in uno spazio teorico.
Il corso mostra la possibilità di coniugare modelli teorici e realtà.
La variabilità si osserva e, in particolare in ogni indagine scientifica volta allo studio di un qualsiasi
fenomeno, si rileva sulla misura di una grandezza in esame, opportunamente definita e circoscritta: ad
esempio la variabilità osservata nel reddito da lavoro personale su un gruppo di unità di riferimento, la
variabilità osservata nel diverso peso di una sostanza chimica su una bilancia ad alta precisione, la
variabilità riscontrata nella presenza di aree boschive in dati territori ecc, ecc…..
Dall’osservazione ripetuta e misurata di un fenomeno si ottiene la DISTRIBUZIONE, come, ad esempio:
Distribuzioni di caratteri fisici: fasce climatiche , acque e deserti…
Distribuzioni caratteri sociali: religioni, etnie, culture,redditi, città..
Indicato con X qualsiasi fenomeno osservazionale, così detto perchè su di esso è possibile una qualche
forma di misurazione (che implicitamente è anche una rilevazione), il problema scientifico collegato alla
variabilità riscontrata in X, è quello di conoscere le qualità, i requisiti e i comportamenti strutturalmente o
tendenzialmente stabili di X. Si tratta di realizzare una analisi scientifica che permetta di pervenire a
conclusioni non soggettivamente ma oggettivamente valide in relazione allo stato delle conoscenza e degli
strumenti di analisi utilizzati.
Il processo di ricerca richiede una pluralità di misurazioni e la loro successiva elaborazione con metodi di
analisi che ne garantiscano un oggettivo trattamento e, unitamente, forniscano l’informazione sul grado di
attendibilità dei risultati.
La fonte della variabilità nasce dal fatto che sulla manifestazione di un fenomeno influiscono moltissimi
fattori, alcuni noti dei quali si conosce l’influenza esercitata sul fenomeno, e che sono detti “sistematici” ma
moltissimi altri genericamente chiamati “fattori accidentali “ o “caso”. Anche questa è una distinzione che
ha finalità di comodo o di “modello di riferimento” perché la rilevazione reale presenta modalità molto
complesse. Ad esempio è un modello di comodo adottare la divisione delle ore del giorno secondo i fusi
orari, mentre l’ora varia con continuità sul territorio.
Attenzione: il fenomeno per essere oggetto di analisi deve poter essere misurato ma :
-
-
se la scala di misura è alquanto grossolana il risultato delle misurazioni su X, al variare delle
condizioni ambientali, di tempo di luogo o altro, nelle quali si realizza la misurazione, sembrerà
rimanere costante da prova a prova e potrà essere sintetizzato da una sola misura; in questo caso e
a questo livello di misurazione il carattere o fenomeno X, non mostra di poter variare e non ha
rilevanza statistica mentre la dinamica osservata potrà essere espressa da una rigida “funzione
matematica”;
se si usa una scala di misura raffinata e adatta allo scopo della ricerca, al variare delle condizioni
ambientali le misurazioni realizzate su X non saranno più costanti ma presenteranno una
variazione, cioè il fenomeno si presenta come una “funzione statistica” caratterizzata, cioè da una
incertezza sui valori che si osserveranno nelle singole rilevazioni.
La funzione matematica possiamo dire che è una funzione statistica con variabilità nulla.
Si chiama “unità statistica” il singolo elemento sul quale viene rilevato il carattere o fenomeno X in esame
ed è il supporto, la base elementare che porta in se’ tutti i requisiti, spesso moltissimi, ma sulla quale verrà
rilevato e misurato solo quell’aspetto di X che è operativamente definito e circoscritto nei termini delle
finalità della ricerca in oggetto
Il metodo quantitativo: contributo per la conoscenza
Lord Kelvin: “quando si può misurare ciò di cui si discorre, e lo si può esprimere in termini numerici,
allora si conosce qualcosa dell’oggetto in questione; ma quando non lo si può misurare, quando non
risulta esprimibile in termini numerici allora la nostra conoscenza risulta lacunosa e di genere non
soddisfacente”.
I metodi classici della statistica descrittiva usati su fenomeni legati al territorio sono metodi di base
finalizzati a creare sintesi informative che rendano oggettivamente evidenti quegli aspetti strutturali non
percepibili o quantificabili con la semplice ispezione dell’eterogenea massa delle informazioni disponibili,
ma che sono riconducibili a fattori legati alla localizzazione dei dati.
Alcuni temi e procedure della Statistica descrittiva quali: le rappresentazioni grafiche; le misure della
tendenza centrale; della variabilità e della concentrazione, saranno distintamente trattate in riferimento
ai dati puntuali, areali e direzionali.
Queste metodologie della statistica descrittiva forniscono indicazioni sintetiche e spesso incisive sugli
aspetti d’interesse di quanto oggetto di studio
Gli strumenti statistici di analisi, invece, come ad es. la correlazione, l’autoregressione spaziale, i modelli
lineari, i test statistici,… sono un oggettivo ausilio per la verifica della consistenza e del grado di
affidabilità di ipotesi di lavoro o di ricerca.
La statistica è una scienza costituita da una serie di metodologie utilizzate per la raccolta, per l’analisi, per la
presentazione, per l’interpretazione dei risultati ottenuti su dati osservazionali relativi a studi su
problematiche di ricerca o per supporto per interventi in situazioni di incertezza.
Gestione delle misurazioni= A)Raccolta e sistemazione dei dati B) applicazione di metodologie ad hoc per
un analisi oggettiva , c) valutazione, D)utilizzazione dei risultati
Il metodo scientifico: modo di apprendere-GALILEO
Lo schema di analisi scientifica presentato nelle vignette è elementare ( è tratto da un libro di scuola
media), ma risulta illuminante nella sua semplicità.
In effetti una indagine statistica si svolge secondo una dinamica che generalmente segue il seguente iter:
-si stabilisce il tema e la finalità della problematica di ricerca che viene operativamente e pragmaticamente
molto definita e circoscritte per realizzare una corretta individuazione delle “unità statistiche” e una precisa
rilevazione o misurazione del carattere X secondo criteri di scala predefiniti; ESEMPIO
-si raccolgono le informazioni (rilevazione dei dati) e si procede al controllo e alla sistemazione delle stesse
per la formulazione del “dato statistico”, ovvero della misura di X che sarà oggetto di elaborazione;
- si elaborano i dato con metodologie opportune;
- si analizzano i risultati.
Le metodologie o modelli statistici sono rappresentazioni generalizzate o schematiche di particolari
aspetti della realtà che fungono quasi da “scheletro” mentre la loro applicazione a casi concreti produce
un “corpo”, ovvero un insieme di risultati, che conducono ad una approfondita e spesso risolutiva
conoscenza dei fatti e del contesto da cui provengono.
Interesse della Statistica anche per la Geografia. Si prende in esame il fattore spazio non solo come
luogo di accadimento della realtà ma come fattore che interagisce, condiziona, determina i fenomeni
d’interesse e, rispetto al quale si parlerà di Statistica spaziale o di Statistica territoriale, come vedremo.
Nel corso verranno affrontati i seguenti argomenti
1)Tipologie dei dati spaziali: riguarda la particolare unità di analisi e la sua sistematizzazione. Nel corso si
presenterà da distinzione tra i diversi tipi di dati spaziali: Punti, linee, aree e direzioni e si presenteranno le
loro specificità.
2)Analisi descrittiva dei dati statistici che implica:l’osservazione e la raccolta dei dati sul fenomeno oggetto
di ricerca, momento che riguarda l’individuazione delle unità su cui è rilevato il fenomeno e la scala di
misura utilizzata =misurazione qualitativa e quantitativa delle unità informative: dove l’unità è l’elemento
portatore del carattere es reddito regionale=l’unità territoriale è la regione e il carattere è il reddito .
Mentre l’unità informativa è l’informazione qualitativa o quantitativa misurata sull’unità di riferimento e è il
dato statistico; la sintesi delle osservazioni formazione di tabelle statistiche, e la loro elaborazione
modulata in relazione alla tipologia dei dati spaziali
3) Metodologie di campionamento spaziale come si raccolgono le informazioni su un gruppo limitato di
unità territoriali dove occorrono metodologie particolari
4) analisi shift e share : effetto dei fattori sullo sviluppo regionale e confronti tra regioni: cambiamenti e
ripartizione territoriali di un fenomeno regionale. Es turismo nelle regioni rispetto a varie componenti
(religioso, termale, … )
5) Point Pattern Analysis descrizione e interpretazione della struttura distributiva dei dati puntuali di un
pattern acquisire informazioni sulla struttura (casuale, clusterizzata, uniforme) della distribuzione spaziale
dei punti
6)Autocorrelazione spaziale legge di tobler intensità correlazione per corretta interpretazione dei risultati
poiché i dati spaziali non sono indipendenti
7) trend di superficie: tende a individuare l’esistenza di una regolarità nel movimento territoriale di un
fenomeno (es iso pioggia isobare...oppure fenomeni economici rispetto alle distanze)
Approfondimenti prof. Francesco Sanna
Modulo Gis. Augusto Frascatani Esercitazione Federico Martellozzo
Il dato spaziale 1.Definizione e tipologia dei dati spaziali
La metodologia statistica introduce e applica strumenti per la raccolta e il trattamento di
collezioni di dati relativi a fenomeni osservazionali e misurabili.
La realtà fenomenica si svolge in un campo spazio-temporale, l’interesse sarà ora
focalizzato sull’analisi della possibile relazione che la dimensione “spazio” può
produrre su un fenomeno oggetto di analisi scientifica.
In tal caso si tratta di valutare oggettivamente, nella variabilità riscontrata nelle ripetute
osservazioni di un fenomeno collegato al territorio, quella parte attribuibile e
giustificata dalla struttura territoriale o misurare l’effetto che lo spazio produce sul
fenomeno stesso.
Sono due approcci diversi: nel primo caso il territorio è semplicemente lo scenario nel
quale si svolge la realtà fenomenica, nel secondo caso lo spazio è un fattore determinante
la struttura del fenomeno.
In effetti, come vedremo, si parla di statistica territoriale nel primo caso e di statistica
spaziale nel secondo caso, in entrambe le situazioni si tratta dell’applicazione della
statistica ad argomenti attinenti allo spazio e quindi alla Geografia, argomenti per i quali
dalla seconda metà del secolo scorso, si assiste ad una continua crescita d’interesse sia
applicativo che di ricerca teorica e metodologica.
I dati legati allo spazio presentano caratteristiche importanti:
1) i dati non possono considerarsi indipendenti La prima legge di Tobler afferma che:
“Tutto è correlato con tutto, ma le cose vicine sono più correlate delle cose lontane”
Quindi i processi d’interrelazione, contagio, diffusione o repulsione condizionano la
struttura distributiva del fenomeno territorialmente rilevato (spiegare: prossimità/distanza,
spazio astratto e impedenza territorio)
2) hanno diverse caratteristiche le unità di riferimento sulle quali misurare il fenomeno. Le
connotazioni differenti possono condizionare il tipo di analisi.
Si parla di unità come il “singolo elemento o l’ente sul quale si rileva la modalità (àmodo
di presentarsi) di un carattere”; nel caso in esame “l’unità statistica” va intesa come il
supporto elementare di quella o quelle modalità relative al fenomeno oggetto di studio, pur
se l’unità è portatrice di molteplici altre modalità o caratteristiche. Nel caso dei dati spaziali
l’unità è anche il criterio di organizzazione dei dati in tabelle.
Definito il fenomeno o carattere oggetto di analisi, verrà, conseguentemente, definita in
modo più proprio l’unità sulla quale compiere la rilevazione: nel caso di analisi relative allo
spazio si possono considerare diversi tipi di unità alcune oggettivamente preesistenti,
come, ad esempio le aree amministrative di un territorio, altre predisposte ad hoc
dall’operatore per specifici scopi.
IL DATO SPAZIALE
Si indichi con X una variabile casuale, ovvero una grandezza i cui valori non sono
prevedibili aprioristicamente ma variano per moltissimi fattori, alcuni noti, altri costituiti da
una infinità di cause non note chiamate genericamente “caso”; mentre s indica una unità
di riferimento spaziale sulla quale è rilevato il fenomeno oggetto di studio,
specificatamente indicato con X(s).
In uno spazio bidimensionale R2, xij indica un generico dato spaziale risultato della ima
misura di X(s) sulla jma unità s appartenente a R2. Il deponente i è l’indicatore della i.ma
rilevazione delle n previste (i = 1,2,…,n), mentre il deponente j è l’indicatore della j.ma
unità spaziale, delle s possibili, sulla quale è osservato il fenomeno(j= 1,2,…s)
R spazio, s unità dello spazio, X variabile casuale la cui realizzazione generica xi(s) è il
valore misurato di X sull’unità s.
Il modello spaziale generale definisce il processo casuale X(s) nel campo di riferimento,
come l’insieme dei possibili valori di X in s (X=numero di scuole medie statali nei
Municipi di Roma variabile su scala ordinale), xij = numero genericamente i.mo di
scuole medie (i= 1,2,…,n), (s= Municipi) nello j.mo (j =1-20) municipio di Roma.
Nel caso di dati senza riferimento allo spazio, ad esempio, la variabile potrebbe essere il
numero di studenti nelle diverse classi delle scuole medie in un Municipio di Roma, o in
una scuola, ecc,ecc, ma la problematica è del tutto diversa.
In questo caso la variabile X è il numero di studenti e l’unità statistica la classe e xij =
numero i.mo generico di studenti nella j.ma classe.
Le unità Spaziali e la georeferenziazione
Le unità dei riferimenti spaziali sulle quali sono raccolti i dati costituenti il complesso
informativo di base per l’analisi di X(2s), oggetto della ricerca, sono classificate in punti,
aree, linee, direzioni.
L’unità punto è una precisa localizzazione individuata e definita da due coordinate un
punto viene identificato indicando le sue coordinate nella forma (x;y).
Tale unità è spesso utilizzata anche per indicare aree o zone ampie di territorio come città,
industrie, attività commerciali o altro e, in tal caso, le coordinate sono prese in
corrispondenza del centro della zona di riferimento.
Individuazione e localizzazione
•
Caratteristica principale per individuazione e georeferenziazione delle unità spaziali
è la loro localizzazione
•
Questa è individuata dalle coordinate:
•
Punto àcoord latitudine longitudine
•
Direzioneàgradi
•
Area/lineeàcoordinate della spezzata che le delimita
Le coordinate geografiche cosa sono e come possono essere trasferite su un piano
cartesiano come coordinate, cenni.
Sistemi cartografici
La carta geografica è una rappresentazione ridotta, approssimata, simbolica della
superficie terrestre .
La caratteristica principale di una carta geografica è la scala (ossia il coefficiente di
riduzione).
La scala= rapporto tra la lunghezza misurata sulla carta e la corrispondente lunghezza
sulla superficie terrestre
Classificazione delle carte rispetto alla scala
•
Piante o mappe sono carte con scala maggiore o uguale a 1:10.000 (dettagliate, es
mappe catastali; 1 mm sulla carta equivale a 10 metri dunque 10.000mm)
•
Carte topografiche- scala compresa tra 1:10.000 e 1:100.000. Molto
particolareggiate e sono di base per la costruzione di carte a scala più piccola (es
1:25.000)
•
Carte Corografiche scale comprese tra 1:100.000 e 1: 100.000.000. Carte di
maggiore ampiezza livello regionale, ma anche le carte stradali
•
Carta geografica es scala 1: 5.000.000
•
Planisferi
Per fare cartografia è necessario fissare:
-sistema di riferimento (datum): scelta dell’ellissoide (superficie matematica che
approssima la forma della terra) e orientamento
-rete di punti e misure che realizzano il sistema di riferimento (meridiani e paralleli)
Paralleli: sono originati dall’intersezione della superficie terrestre con piani perpendicolari
all’asse terrestre
I cerchi descritti dal paralleli hanno raggi via via minori dall’equatore ai poli
Meridiani: intersezione della superficie terrestre con piani che passano per l’asse terrestre
Insieme formano la “quadrettatura” di riferimento del reticolato geografico
Le misure di longitudine e latitudine:
La longitudine di un dato meridiano è la distanza angolare tra quel meridiano e il meridiano
di riferimento.
A partire dal meridiano di Greenwich (che ha longitudine 0°),un dato meridiano può essere
misurato procedendo verso est o verso ovest e si fa seguire a tale valore angolare
l’indicazione est (E) oppure ovest (W), a seconda che la misura sia fatta a est o a ovest
del meridiano di Greenwich.
Nel caso della figura, la longitudine del punto B, che giace sull’Equatore, e di 30° E ed e la
stessa del punto A e di qualsiasi altro punto situato sullo stesso meridiano.
La latitudine di un dato parallelo è la distanza angolare tra quel parallelo e l’Equatore. Il
valore della latitudine è compreso tra 0° (Equatore) e 90° (Polo), seguito dall’indicazione
nord (N) oppure sud (S), a seconda che la località si trovi nell’emisfero settentrionale
oppure nell’emisfero meridionale.
Individuazione di un punto sul reticolato:
la longitudine del punto B, che giace sull’Equatore, e di 30° E ed e la stessa del punto A e
di qualsiasi altro punto situato sullo stesso meridiano
Nel caso della figura il punto A ha latitudine 40° N, la stessa del punto C e di qualsiasi
altro punto situato sullo stesso parallelo.
Fonte: Rappresentare la superficie terrestre - Zanichelli online per la
scuola.(.online.scuola.zanichelli.it/dentrolescienzedellaterrablu/...content/.../Gaino..)
A livello internazionale, e anche in Italia, per la realizzazione delle carte topografiche
“ufficiali” viene utilizzata la proiezione cilindrica trasversa di Gauss, modificata, per l’Italia,
da Boaga, che, estesa a tutta la Terra, costituisce il Sistema Cartografico U.T.M.
(Universale Trasvera di Mercatore).
Nel sistema U.T.M. la Terra è stata suddivisa in 60 fusi e 20 fasce parallele: ogni fuso
comprende 6 meridiani ed è indicato con un numero (da 1 a 60, a partire dall’antimeridiano
di Greenwich); le fasce, di 8 paralleli ciascuna, sono indicate con lettere dell’alfabeto.
Non sono comprese nella carta le zone polari con latitudini superiori a 80° N e S.
Fusi e fasce delimitano 1200 zone, indicate col numero del fuso e con la lettera della
fascia corrispondente.
Ogni zona viene suddivisa in quadrati di 100 Km di lato, contrassegnati da due lettere
maiuscole; ogni quadrato è ulteriormente suddiviso in quadratini più piccoli, di 10 Km di
lato. In questo modo è possibile localizzare ogni punto sulla carta con notevole precisione
-Il tipo di rappresentazione cartografica (proiezione) ed i parametri di applicazione
Le proiezioni cartografiche “trasportano” le coordinate tratte dal reticolato sull’ellissoide del
sistema di riferimento (datum) al piano della carta.
Le due superfici non sono topologicamente equivalenti, non è possibile passare
dall’ellissoide alla carta senza deformazioni.
Al variare dei principi usati per la loro realizzazione le proiezioni si dividono in VERE o
Convenzionali
Proiezioni vere : si basano su principi geometrici per il “trasporto” del reticolato geografico,
su una superficie ausiliaria. Se questa superficie è un piano, si hanno le proiezioni
prospettiche; se questa superficie corrisponde a quella di un cilindro o di un cono, cioè di
un solido sviluppabile su un piano, si hanno le proiezioni per sviluppo.
Proiezioni convenzionali: derivano dalle vere e attraverso “espedienti” matematici che
minimizzano le deformazioni.
Rispetto alle loro proprietà prevalenti, le proiezioni si distinguono in:
EQUIDISTANTI- mantengono inalterate le distanze (proiezione equidistante: il rapporto tra
due distanze sulla carta è uguale al rapporto tra le corrispondenti distanze nella realtà) ;
EQUIVALENTI- mantengono inalterate le aree (due superfici sulla carta stanno nello
stesso rapporto che intercorre tra le corrispondenti superfici nella realtà),
CONFORMI- mantengono inalterati gli angoli (si conservano gli angoli tra due direzioni
qualsiasi e quindi vengono mantenute le forme degli oggetti rappresentati.)
Proiezioni vere: Proiezioni Prospettiche: ottenute mediante proiezione su un piano tangente
alla sfera in un punto qualunque della stessa e al variare del punto di osservazione, si
distinguono in: Centrografica; Stereografica; Ortografica
a) centrografica (il punto di osservazione coincide con il centro della sfera e si proietta
sul piano della carta gnomonica polare)
La proiezione gnomonica mostra tutti i cerchi massimi come linee rette. Poiché i meridiani e l'equatore sono
cerchi massimi, essi sono sempre mostrati come linee rette.
Osservando dal centro della Terra, la proiezione della superficie della terra è effettuata su di un piano
tangente.
b) Stereografica: il punto di osservazione è sulla superficie della sfera opposta al piano di proiezione
C) Ortografica (all’infinito e si proietta sul piano tangente al polo opposto)
Proiezioni vere :Proiezioni Coniche: si proiettano i punti della sfera su un cono tangente ad un parallelo
Proiezioni vere Proiezioni Cilindriche: avvolgo il globo in un cilindro tangente all’equatore
Proiezioni modificate
Tra le proiezioni modificate, la più nota è la proiezione cilindrica modificata di Mercatore (filosofo e teologo
fiammingo 1512-1594): nella proiezione i meridiani rimangono equidistanti, e sono rappresentati da rette
verticali parallele ortogonali ai paralleli, disposti orizzontalmente. I paralleli –spostandosi dall’equatore ai
poli- si allontanano reciprocamente in proporzione a quanto la distanza dei meridiani è maggiorata dalla carta
rispetto alla realtà
Questa carta è conforme (isogona) ed è utile per realizzare le carte nautiche
Le unità Spaziali
L’ unità punto è una precisa localizzazione individuata e definita da due coordinate
Tale unità è spesso utilizzata anche per indicare aree o zone ampie di territorio come città,
industrie, attività commerciali o altro e, in tal caso, le coordinate sono prese in
corrispondenza del centro della zona di riferimento.
Le unita’ areali rappresentano zone o porzioni di territorio con tipologie varie per forma e
dimensione e possono riferirsi sia alle ripartizioni amministrative esistenti in uno Stato
come, ad esempio, le unità areali Comuni o Province in Italia (in tal caso la forma e
dimensione delle singole unità spaziali sono diverse ed esistenti a priori e il fatto è tenuto
presente nella conduzione dell’analisi e nell’interpretazione dei risultati ),oppure possono
essere predefinite in vista di specifiche finalità e, spesso, possono essere rese
strutturalmente omogenee per particolari esigenze di ricerca.
( Perché è interessante la proprietà della omogeneità- regione omogenea/uniforme)
In ogni caso i risultati dell’analisi sono strettamente collegati alla struttura spaziale sulla
quale sono rilevati i dati.ESEMPI
-Nuts 2 EUROPA- amministrative
Regioni e Province
Comuni Campania
Con riferimento ad un centro specifico le unità areali, per esigenze particolari, possono
essere trattate come unità puntuali. In ogni caso deve essere tenuto presente il problema
di scala al quale l’artificio è ricorso.(Galassie)
Le unità spaziali per la raccolta di dati finalizzati allo studio del movimento di persone,
merci, veicoli o altro, sono le linee o unita’ di rete quali strade, canali, fiumi o altri tipi di
connessione (i grafi; flussi), mentre le direzioni o unita’ direzionali sono introdotte per
l’analisi del movimento direzionale di un fenomeno e, in tal caso, sono espresse in gradi
calcolati partendo generalmente da nord (grado zero).
DAL DATO ALLA SUA ORGANIZZAZIONE
Sistemazione e classificazione delle informazioni raccolte: esclusiva, esaustiva e soddisfacente;
Una prima e basilare elencazione o distinzione dei dati è collegata all’unità topografica sulla quale si
realizza la misurazione che darà luogo a quattro tipologie fondamentali di dati:
1-dati puntuali- riportano le osservazioni raccolte in corrispondenza delle coordinate di precise
localizzazioni e possono essere dati semplici o dati pesati;
2-dati areali: sono dati aggregati per somma o per media d’informazioni individuali relative e raccolte
in superfici areali; (e. n turisti nel Lazio è dato dalla somma dei turisti presenti nelle diverse località
sotto osservazione in un dato periodo)
3-dati direzionali: sono il risultato di misure relative a unità direzionali e, come i dati puntuali,
possono essere dati direzionali semplici o pesati; dato un centro di riferimento misuro l’angolo della
posizione di ogni unità rispetto a quel centro. (direzione pesata es localizzazione alberghi rispetto al
centro e posso pesarla col numero di turisti negli stessi alberghi per vedere se c’è una preferenza
direzionale )
4-dati di rete o lineari: sono dati per lo studio di flussi di movimento di uomini o di cose, legati
all’esistenza di strade o di linee terrestri o aeree e possono essere anche spazialmente continui.
ESEMPIO alberghi- Dati Puntuali
coordinate
NAME
Via
12°29'31,7"E 41°55'5,823"N
Villa Porpora
Via Nicol├▓ Porpora
civico
15
POSTCODE
00198
12°29'31,7"E 41°55'3,754"N
Parco dei Principi
Via Saverio Mercadante
15
00198
12°29'33,595"E 41°55'49,168"N
Via Tommaso Salvini
18
00197
12°29'6,041"E 41°55'7,178"N
Minotel delle Muse
Aldrovandi Palace
Hotel
Via Ulisse Aldrovandi
15
00197
12°29'34,267"E 41°55'19,989"N
Claridge Hotel
Viale Liegi
62
00198
12°28'53,094"E 41°55'32,126"N
Regent - Whr
Via Filippo Civinini
46
00197
12°28'54,09"E 41°55'35,09"N
Grand Hotel Ritz
Via Domenico Chelini
41
00197
12°28'28,859"E 41°54'48,157"N
River
Via Flaminia
39
00196
12°29'6,041"E 41°55'32,62"N
Degli Aranci
Via Barnaba Oriani
11
00197
12°28'6,617"E 41°55'23,481"N
Astrid
Largo Antonio Sarti
4
00196
12°28'51,766"E 41°55'14,095"N
Villa Mangili
Via Giuseppe Mangili
31
00197
12°29'32,984"E 41°55'11,394"N
Paisiello Parioli
Via Giovanni Paisiello
47
00198
12°29'0,065"E 41°55'20,764"N
Rivoli
Via Torquato Taramelli
7
00197
12°28'54,09"E 41°55'10,637"N
Lord Byron
Via Giuseppe De Notaris
5
00197
12°28'9,937"E 41°55'27,68"N
Villa Glori
Viale del Vignola
28
00196
12°28'51,434"E 41°55'22,246"N
Polo
Piazza Bartolomeo Gastaldi
4
00197
12°29'28,615"E 41°55'3,72"N
Via Gerolamo Frescobaldi
5
00198
12°29'18,656"E 41°55'47,686"N
Parco dei Principi
Hermitage Grand
Hotel
Via Eugenio Vajna
12
00197
12°29'38,331"E 41°54'51,657"N
Hotel Villa Borghese
Via Pinciana
31
00198
12°31'9,868"E 41°54'28,542"N
Athena
Via Ercole Pasquali
3
00161
12°30'53,44"E 41°54'29,918"N
Raccuia
Via Treviso
37
00161
12°30'50,77"E 41°54'33,891"N
Ibiza
Via Forlì
14
00161
12°30'59,806"E 41°54'22,582"N
Globus
Viale Ippocrate
119
00161
12°30'52,208"E 41°53'48,345"N
Laurentia
Largo degli Osci
63
00185
12°30'42,351"E 41°53'48,956"N
Via Tiburtina
10
00185
12°31'0,011"E 41°53'42,689"N
Industriale
Villa San Lorenzo
Maria
Via dei Liguri
7
00185
12°30'43,583"E 41°53'50,026"N
Felice
Via Tiburtina
30
00185
12°30'52,619"E 41°54'54,827"N
Silva
Via Antonio Bosio
20a
00161
12°31'4,529"E 41°55'14,845"N
Santa Costanza
Viale 21 Aprile
4
00162
12°29'58,439"E 41°54'37,967"N
Versailles
Corso d'Italia
92
00198
12°30'2,717"E 41°55'17,92"N
Villa Grazioli
Via Salaria
241
00198
12°30'18,333"E 41°54'38,922"N
Galeno
Via dei Villini
10
00161
12°29'56,3"E 41°54'46,404"N
Silvestri
Via Savoia
44
00198
12°29'54,589"E 41°54'55,636"N
Albani
Via Adda
45
00198
12°30'7,209"E 41°55'16,01"N
Buenos Aires
Via Clitunno
9
00198
12°31'13,565"E 41°54'51,16"N
Laura Pension
Viale 21 Aprile
109
00162
12°30'6,568"E 41°55'4,709"N
Coppedè
Via Chiana
88
00198
12°30'6,995"E 41°55'4,709"N
La Panoramica
Via Arno
33
00198
12°29'47,53"E 41°55'27,788"N
Borromini
Via Lisbona
7
00198
12°30'8,279"E 41°54'45,289"N
Kent
Via Reggio Emilia
71
00198
12°30'17,477"E 41°54'42,106"N
Via Nomentana
28
00161
12°29'50,31"E 41°55'6,301"N
Villa Florence
Grand Hotel Beverly
Hills
Largo Benedetto Marcello
220
00198
12°30'10,418"E 41°54'43,061"N
Lloyd
Via Alessandria
110a
00198
12°31'16,851"E 41°54'50,854"N
San Giusto
Piazza Bologna
58
00162
12°29'50,096"E 41°54'41,946"N
Executive
Via Aniene
3
00198
12°30'17,614"E 41°54'41,787"N
Turner
Via Nomentana
27
00161
12°30'14,055"E 41°55'28,902"N
Panama
Via Salaria
336
00199
12°30'33,11"E 41°54'43,061"N
Villa Torlonia
Via Bartolomeo Eustachio
5
00161
12°30'27,565"E 41°55'0,023"N
La Palma
Via delle Alpi
15d
00198
12°31'42,725"E 41°54'36,642"N
New Gemini
Via Guido Mazzoni
24
00162
12°30'59,806"E 41°54'36,642"N
Malaga
Via Udine
12
00161
12°30'51,181"E 41°55'5,066"N
Villa del Parco
Via Nomentana
110
00161
ESEMPIO reddito per regione , Reddito medio familiare netto per regioni Anni 2003-2012 (in euro)
Dati direzionali : angoli – Si potrebbero costruire a partire dalla cara sugli alberghi del secondo
municipio.
In una ricerca pubblicata su Nature, gli scienziati hanno presentato mappe globali che mostrano
quanto velocemente e in quali direzioni stanno cambiando i climi locali.
Lo studio ha analizzato 50 anni di dati della temperatura superficiale di terre e mari (dal 1960 al 2009) e
ha proposto anche due scenari futuri per gli ambienti marini: in un caso, mantenendo le condizioni
attuali, in un altro, ipotizzando un aumento delle temperature globali di 1,75 °C. Le nuove mappe
mostrano così dove verrebbero a crearsi nuovi ambienti caldi e dove quelli esistenti potrebbero
scomparire.
«Le mappe ci mostrano quanto velocemente e in quale direzione le temperature stanno variando, e
dove i migratori che le seguono potrebbero scontrarsi con barriere naturali come le linee di costa.
Classi di probabilità di velocità del cambiamento climatico
Dati di rete: grafi e Flussi -es Matrici origini destinazioni Sistemi Locali: gravitazione
Le matrici Origine-Destinazione
Matrici Origine-Destinazione (O-D) sono matrici che hanno un numero di righe e di colonne pari al numero
di zone, il cui generico elemento dod fornisce il numero degli spostamenti che hanno origine nella zona “o”
e destinazione nella zona “d” nel periodo di riferimento considerato (flusso O-D).
Gli elementi di una matrice O-D possono essere classificati in relazione al tipo di zona di origine e
destinazione:
– Spostamenti interni
– Spostamenti di scambio
– Spostamenti di attraversamento
Aggregazioni degli elementi della matrice O-D
Flusso “emesso” o “generato” della zona o:
Flusso “attratto” dalla zona d:
Numero totale di spostamenti
Sistemi locali – aree di pendolarismo “Gravitazione”
I dati georeferenziati. Statistica spaziale e Statistica territoriale.
GIS -Geographical information System- sistema informatizzato per la trattazione di tematiche
ambientali ha portato ad una nuova classe di dati: i dati georeferenziati.
DATO CHE SI OTTIENE SU UN OPPORTUNO SISTEMA DI RIFERIMENTO SPAZIALE. Dunque va
costruito un opportuno sistema di riferimento spaziale che genera delle unità spaziali specifiche
OTTENGO UN’INFORMAZIONE STRETTAMENTE COLLEGATA ALLO SPAZIO DI SUPPORTO
Cosa è e come è nato il GIS. Il Geographic Information System (GIS) è uno strumento che
permette di analizzare e rappresentare le informazioni che si verificano e riguardano un
territorio.
E’ composto da componenti tecnici rappresentati da una serie di software geografici questi
vengono integrati alle comuni operazioni che si possono svolgere sui data base: ricerche e
interrogazioni, analisi statistiche, grafici. La funzionalità propria del G.I.S. risiede nella
memorizzazione di dati territoriali, il loro trattamento e soprattutto la loro rappresentazione
sotto forma di cartogrammi o tabelle ritagliati su porzioni di territorio più o meno estese.
I dati sono inseriti in un sistema di riferimento e la caratteristica dei GIS è quella di attribuire
ad ogni elemento le coordinate spaziali reali e la dimensione reale e non di scala.
La tecnologia GIS unisce i meccanismi e le operazioni dei comuni database con l’analisi
geografica e la possibilità di visualizzazione sulla mappa (una base cartografica cartacea cui
vengano sovrapposti dei lucidi tematici è un GIS analogico).
Abbiamo visto come la rappresentazione cartografica sia una forma di descrizione del territorio basata
sulla restituzione delle relazioni spaziali degli elementi geografici (lezioneII).
Nella cartografia tradizionale l’elemento base è un disegno che contiene in forma implicita le
coordinate dei punti che definiscono gli oggetti rappresentati attraverso il RETICOLATO del
sistema di riferimento
Nella CARTOGRAFIA NUMERICA l’elemento base è l’insieme di coordinate che contengono in
forma implicita la visualizzazione analogica sotto forma di disegno
Il Gis nasce nel 1963 come CGIS (Canada GIS) per l’analisi di dati raccolti nel territorio e per
produrre statistiche utili per la loro gestione
Tutte le informazioni immesse in un GIS sono accomunate da riferimenti spaziali. Altri database
possono contenere informazioni riferite all’ubicazione (come gli indirizzi) ma un database GIS usa
la georeferenziazione come principale dato di immagazzinamento e di gestione delle informazioni
Un GIS contiene informazioni geografiche (e non, o meglio, georeferenziate) registrate
secondo due diversi formati: spaziale (Oggetti) e tematico (fenomeni)
Gli oggetti sono Entità fisiche (case, edifici, strade) e/o Giuridiche (regioni, Stati) con confini
individuabili e possono essere considerate Grandezze Discrete
I Fenomeni sono eventi con carattere continuo (altitudine, temperatura, pendenza) e non hanno limiti
oggettivi (ma anche fenomeni socio-economici popolazione, reddito..)
Il dato spaziale descrive il posizionamento di un oggetto nello spazio preso in considerazione. Il
posizionamento può essere descritto con coordinate xy. Un processo automatizzato chiamato
“geocoding” è utilizzato per creare esplicite referenze geografiche (coordinate x, y) da referenze
implicite (indirizzi di posta, numeri civici, etc.).Questi riferimenti geografici permettono di
posizionare gli oggetti sulla superficie terrestre per analizzarli successivamente.
Tutti gli elementi geografici devono essere definiti attraverso dei MODELLi SPAZIALi:
Dato collocato in un sistema di riferimento spaziale. Le unità sulle quali sono rilevati i dati sono
punti o linee di una superficie, o pixel di telerilevamento (sensori sensibili al campo
elettromagnetico-scomposizione prisma luminoso), o “celle” di forma costante o variabile, costruite
dal ricercatore e ottenute sovrapponendo al territorio una griglia o reticolo artatamente predisposto.
Proprio per sapere cosa accade in quello specifico punto- unità spaziale.
Da www.mtcube.com-Introduzione al GIS:
UN DATABASE GEOGRAFICO Può ESSERE CODIFICATO ATTRAVERSO DUE MODELLI :
Modello vettoriale (punti, linee, poligoni) descrivo gli oggetti geograficiàUSO GPS, topografia
Modello Raster (griglia): insieme di celle uniformi organizzate Pixel, descrivo intensitààuso
foto satellite
-Il modello raster (atto a descrivere un'immagine in formato digitale).è composto da una serie di
celle della stessa dimensione, organizzate in righe e colonne (del tutto simili a quelle di un foglio
elettronico ad espansione). Utilizzato preferibilmente per la rappresentazione di fenomeni continui
ma usato anche per i discreti.
Le celle sono organizzate come una matrice: righe e colonne e l’ORIENTAMENTO della griglia
corrisponde a quello del sistema geografico di riferimento. Per la georeferenziazione mi serve
l’informazione della dimensione della cella e la coordinata.
A ciascuna cella è associato un valore (qualità, intensità)
-Il modello vettoriale è il miglior modello progettato per rapportare oggetti con limiti distinti e ben
definiti visto che utilizza le coordinate vettoriali per creare punti, linee e poligoni. Quindi per le
grandezze discrete. I Puntinon hanno dimensione ma solo posizione. Grazie alla codifica della
localizzazione rispetto al sistema di riferimento le entità vettoriali del database vengono restituite in
forma analogica (disegno). In questo modello una stessa ENTITA’ GEOGRAFICA può essere
rappresentata con diverse unità spaziali : una città può essere considerata come un punto ( es
database geografico che descrive una rete ferroviaria : ogni punto rappresenta una stazione.)
La stessa città può essere rappresentata con un poligono : database geografico che descrive i diversi
usi del suolo .
Alle unità così georeferenziate si “agganciano” i dati tematici
L’immagine che appare da un GIS è in grado di aiutarci a analizzare le informazioni su una data regione
o una città sotto forma di un gruppo di mappe sovrapposte, ognuna delle quali rappresenta una singolare
caratteristica relativa alla stessa area considerata
ESEMPIO INDIVIDUAZIONE del Sitema dei trasporti urbani:
Necessito di un gruppo di carte tematiche sovrapposte come un layer, livello o copertura. Tutti i livelli
sono giustamente sovrapposti agli altri, così che ogni punto combaci con il suo corrispondente su un
altro livello
Il livello più basso di un GIS è quello più importante, è rappresentato da una griglia sulla quale sono
impostate le coordinate geografiche (come per esempio longitudine e latitudine) sul quale tutte le
mappe sono georeferenziate
Una volta che le mappe sono state georeferenziate, grazie ad un sistema di coordinate prestabilito
(Gauss-Boaga, UTM), le informazioni visualizzate sui differenti livelli possono essere comparate e
analizzate.
Nel caso in figura le vie di traffico possono essere comparate con l’ubicazione dei centri commerciali, la
densità demografica con le zone industriali.
In più, località puntuali o aree possono essere separate dalle località circostanti, semplicemente
tagliando tutti i livelli nella posizione desiderata dal resto della mappa.
Inoltre non per tutte le analisi è necessario usare simultaneamente tutti i livelli. In alcuni casi, un
ricercatore può utilizzare le informazioni selettivamente considerando le relazioni tra livelli specifici.
Così anche informazioni ricavate da due o più livelli possono essere sommate e poi trasformate in un
nuovo livello utilizzabile in una successiva analisi. Questo processo che permette di combinare e
trasformare informazioni con differenti livelli viene chiamato map algebra dal momento che comporta
l’addizione e la sottrazione di informazioni.
Con l’introduzione della georeferenziazione sono state pertanto specificate due tipologie di dati: territoriali
e spaziali, che si differenziano, in via principale, per la differenza nelle unità sulle quali il fenomeno è
rilevato e per la diversa finalità dell’analisi. Nei dati georeferenziati, in effetti, il preciso riferimento ad un
definito spazio, spesso costruito ad hoc, rende lo scopo dell’analisi principalmente quello di rilevare, nella
struttura osservata del fenomeno spaziale, proprio l’incidenza, l’effetto, del fattore spazio.
POTENZIALITA’ E CAMPI DI UTILIZZO del GIS
Il potenziale del GIS è realmente vasto: le migliaia di mappe su livelli diversi sono sovrapposte per
visualizzare informazioni di varia natura, quali, ad esempio informazioni sulla rete dei trasporti,
idrografia, caratteristiche delle popolazioni, attività economiche, giurisdizione politica e altre
caratteristiche dell’ambiente sociale e naturale.
Utilizzabile in varie situazioni diverse tra loro:
- pianificazione urbanistica,
- gestione delle risorse ambientali,
- previsione dei trasporti,
- pianificazione in situazioni di emergenza ...
La capacità di separare le informazioni su livelli e la possibilità di combinarle con quelle appartenenti ad
altri livelli (layer) è la ragione per cui il GIS rivela un enorme potenziale sia nel campo della ricerca che
nella programmazione di strategie decisionali.
Una delle maggiori aree di applicazione è la gestione delle risorse naturali, ivi inclusi:
 Habitat naturale
 Fiumi
 Aree alluvionate
 Desertificazione
 Terreni agricoli
 Acquiferi
 Foreste
Un'altra area importante per le applicazioni GIS è la gestione delle reti tecnologiche, per
esempio per:
 Ubicazione in sotterraneo di tubature e cavi
 Bilanciamento dei carichi nelle linee elettriche
 Pianificazione della manutenzione delle attrezzature
 Tracciati di utilizzo energetico
Province, Regioni e Stato hanno trovato il GIS particolarmente utile nella gestione e uso
del suolo:
 Suddivisione catastale
 Compravendita di terreni
 Controllo e valutazione impatto ambientale
 Gestione della qualità delle acque
 Gestione delle proprietà
Un utilizzo più recente e innovativo del GIS è basato sull’utilizzo di informazioni sulle rete
viaria. Il GIS si è rivelato particolarmente utile per:
 "Mappare" la rete autostradale
 Progettare e sviluppare di piani di evacuazione
Il range delle applicazioni del GIS continua ad espandersi in relazione al fatto che i sistemi diventano
più efficienti, più diffusi e meno costosi. Le applicazioni sono inoltre collegate alla raccolta dei dati.
•
Da www.mtcube.com-Introduzione al GIS- fine
La raccolta dei dati è un complesso di metodi statistici che partendo dalla definizione operativa dell’oggetto
della ricerca in relazione alle finalità e all’ampiezza informativa che si vuole ottenere, porta alla
individuazione del tipo di unità, del campo di rilevazione dei dati che può estendersi a tutte le unità o
essere campionaria,
alla effettiva raccolta controllo e sistemazione dei dati.(mette ordine
nell’informazione)
Attuale importanza degli strumenti informatici per la conservazione dei dati (censimenti).
Per l’operatività e per la divulgazione delle informazioni occorre la sistemazione in tabelle. Queste
sono il risultato di metodologie statistiche che permettono di collegare in modo ottimale la realtà
della massa informativa iniziale con la finalità della ricerca, in una organizzazione dei dati che
permette la loro sintesi per una prima conoscenza descrittiva di X.
Le tabelle statistiche di dati collegati al territorio sono definite SERIE Statistiche o genericamente
distribuzioni
perchè : Nelle tabelle il criterio di ordinamento dei dati è rappresentato dalle unità spaziali
(regioni es.) e non dai valori o classi di valore del carattere statistico in oggetto (reddito, come
classicamente accade nelle seriazioni statistiche), e per tale ragione le tabelle sono definite
“serie statistiche”.
Serie di frequenze: presentano valore assoluto o relativo (1) o percentuale (100) del numero di casi
osservati e (n° abitanti o abitazioni nelle unità analizzate, es) –
Esempio Istat sistema di indicatori territoriali- Pop. residente al 31.12-anni 2005;2010
Territorio
2005
2010
Piemonte
Valle D'Aosta
4341733
123978
4457335
128230
Lombardia
Liguria
9475202
1610134
9917714
1616788
985128
482650
1037114
507657
Trento
Veneto
502478
4738313
529457
4937854
Friuli Venezia Giulia
Emilia Romagna
1208278
4187557
1235808
4432418
Toscana
Umbria
3619872
867878
3749813
906486
Marche
Lazio
1528809
5304778
1565335
5728688
Abruzzo
Molise
1305307
320907
1342366
319780
5790929
4071518
594086
2004415
5017212
1655677
15551047
11119276
11321337
14087162
6672889
58751711
5834056
4091259
587517
2011395
5051075
1675411
16120067
11643194
11950322
14186373
6726486
60626442
Trentino Alto Adige
Bolzano - Bozen
Campania
Puglia
Basilicata
Calabria
Sicilia
Sardegna
Nord-Ovest
Nord-Est
Centro
Sud
Isole
Italia
Le serie di quantità riportano misure o ordini di grandezza di un fenomeno misurabile (es temperature.
Valore delle import o export nelle unità di riferimento) Istat sistema di indicatori territoriali… valori
Importazioni da Paesi UE (valori in migliaia di euro); Esportazioni verso Paesi UE (valori in migliaia di
euro) anno 2005
Territorio
Piemonte
Valle D'Aosta
Lombardia
Liguria
Trentino Alto
Adige
Bolzano - Bozen
Trento
Veneto
Friuli Venezia
Giulia
Emilia Romagna
Toscana
Umbria
Marche
Lazio
Abruzzo
Molise
Campania
Puglia
Basilicata
Calabria
Sicilia
Sardegna
Nord-Ovest
Nord-Est
Centro
Sud
Isole
Italia
2005
16813214
158423,5
72358991
2630919
2005
21967323
283131,9
51288128
2080389
4132029
2680376
1451653
21229666
3852567
2056046
1796521
25050625
3386676
16611026
9252727
1325902
2495331
15039708
2321418
235355,7
3830455
2672227
614444,5
395179,9
1614664
1191429
91961548
45359397
28113668
10069080
2806093
1,84E+08
5939244
21702867
11561506
1532020
6236826
6424893
4672131
367715
4469193
4583763
934829,6
190083,6
3309972
2124724
75618972
56545303
25755244
15217716
5434696
1,84E+08
Il dato nazionale non corrisponde alla somma di quelli provinciali, regionali e ripartizionali
per l'impossibilità di assegnare alcuni flussi commerciali alla provincia di competenza
Con riferimento alla georeferenziazione, si parla propriamente di serie spaziali e di Statistica Spaziale per
indicare il campo di metodi e di analisi relativo ai dati georeferenziati mentre la definizione di serie
territoriali e Statistica territoriale è riferita alla trattazione dei dati di unità territoriali precostituite.
Alcune precisazioni sulle unità per dati georeferenziati
Come possono essere organizzate e predisposte le unità areali (le puntuali non presentano questo
problema perché sono già esatte e definite e collegate ad uno specifico punto dello spazio in
esame).(Abbiamo parlato di poligoni attraverso il modello vettoriale-limiti ben definiti: serve per
rappresentare gli spazi reali, e di celle nel modello raster per quanto riguarda i GIS , sistemi che
permettono la corrispondenza tra realtà e modello).
Ma le unità areali devono/possono essere predisposte anche per le specifiche finalità di ricerca o per
strutturare un campionamento spaziale. E possono essere aree di forma regolare o irregolare ma sempre
predisposte dall’operatore. Si tratta di un possibile strumento ad hoc e i risultati ottenuti sono letti in
aderenza alla struttura territoriale predefinita.
Le aree di riferimento possono essere regolari (uniformi: omogenee nella forma) o irregolari (no stessa
forma ma omogenee rispetto a certi requisiti) .
L’omogeneità è un requisito importante perché mi permette di operare induzioni es l’omogeneità
geometrica mi dice che i punti hanno tutti la stessa dimensione, una omogeneità chimica mi dice che una
sostanza presenta sempre la stessa densità, o in fisica la stessa forza su uno spazio…
Griglie regolari : Quadrate, circolari, esagonali:
Quadrate
Circolari
Esagonali
Queste tipologie saranno scelte in funzione della finalità della ricerca.
Esempio campionamento per punti …studio rocce…sono forme spazialmente omogenee
GRIGLIE IRREGOLARI
Si ricorre a griglie con celle irregolari quando, rispetto al territorio, si dispone di alcune (poche)
informazioni puntuali: queste vengono usate come vertici o baricentri per la costruzione di un reticolo
irregolare. Attuo, quindi, una interpolazione territoriale (per interpolazione si intende un metodo per
individuare nuovi punti del piano cartesiano a partire da un insieme finito di punti dati, nell'ipotesi che
tutti i punti si possano riferire ad una funzione f(x) di una data famiglia di funzioni di una variabile reale)
ottenendo aree ideali perché godono di caratteristiche di omogeneità rispetto a determinati requisiti, in
aderenza ai quali sono state costruite.
Mi consentono di attribuire all’area il valore di un punto
Esempio Griglie Irregolari : Il Poligoni di Thiessen; non cerco maglie uguali ma partizioni per le
quali viene accettata la omogeneità sull’area di un valore noto in un punto (omogenee: generate
dalla stessa caratteristica: ad esempio punti che all’interno di uno stesso poligono, generato
dalla griglia, siano più vicini al centro del poligono di appartenenza rispetto ai centri dei poligono
vicini.
Dato un insieme finito di punti S, il diagramma dei poligoni per S è la partizione del piano che
associa una regione V(p) ad ogni punto
in modo tale che tutti i punti di V(p) siano più
vicini a p che ad ogni altro punto in S. Dunque l’area è il risultato dell’applicazione di specifiche
metodologie che mi permettono in modo oggettivo di ripartire il territorio in modo da di
attribuire a tutta l’estensione dell’area il valore del punto. La finalità che si vuole realizzare è
quella di poter attribuire un identico e noto valore a tutti i punti interni della partizione ottenuta.
INTERPOLAZIONE in questo caso: una distribuzione di luoghi puntiformi si trasforma in una distribuzione
di aree; essa, a sua volta, può essere trasformata in una rete di linee di confine che esprimono relazioni di
contiguità.
- Problema della delimitazione di aree con criterio economico e metodo geometrico sfruttando la
proprietà dell’asse di un segmento (luogo geometrico dei punti del piano di rappresentazione
equidistanti dagli estremi del segmento dato).
La figura propone due località di mercato, A e B, ubicate in uno spazio indifferenziato (si pensi
come esempio ad una pianura del tutto uniforme) percorribile in tutte le direzioni con costi di
spostamento proporzionali alla lunghezza delle distanze da percorrere e tariffe uguali per unità di
distanza; se i prezzi praticati nei due mercati sono uguali, per un generico consumatore sarà
indifferente servirsi del mercato A o del mercato B solo se le distanze da A e B risultano uguali.
Questa condizione si verifica solo e soltanto per i punti che si allineano sull’asse del segmento
AB; l’asse di AB è la perpendicolare al segmento tracciato e passa per il punto medio.
Due possibili metodi di interpolazione:
a)Costruzione centrata in A: cerco l’area di riferimento della localizzazione in A per la quale si
verifichi che i punto dell’intorno di A siano più vicini ad A che agli altri centriMisuro le distanze tra A e gli altri centri: AB; AC; AD;AE; AF; AG;AH; AI…(blu)
Prendo il punto medio dei segmenti blu (le distanze tra i centri) e traccio gli assi (rossi).
Dall'incrocio di questi ultimi (assi-rossi) si ottengono dei poligoni: quello più interno risponde ai
criteri di vicinato stabiliti.
. A..
.
B
A
I
H
.
E
.
A
C
.
.
D
.
.
F
G
.
Rispetto ad un particolare luogo puntiforme A tutti i restanti sono bipartiti in due sottoinsiemi: i
vicini diretti o immediati, rappresentati da quelli le cui tessere hanno un lato in comune con la
tessera costruita su A; i vicini indiretti, tutti i restanti.
Trovo aree disuguali ma omogenee rispetto al valore del centro ossia il valore del punto A (centro)
che può essere oggettivamente esteso a tutta l’area di A .
b)Ripartizione tra aree non gerarchiche
esempio piovosità determinate su 4 punti—fino a che distanza dalla rilevazione posso dire che la
piovosità assuma lo stesso valore?
Dato lo spazio in cui si trovano i punti A,B,C.D,E
Trovo i possibili percorsi
Individuo gli assi
a metà dei triangoli di tracciano le linee rette perpendicolari
B
.
C
.
.
E
.
A
.
D
L’incontro delle perpendicolari crea un poligono attorno al centro
Tutte le aree ritagliate rappresentano la divisione del territorio in modo che mi permette di attribuire il
valore di A su tutto il suo intorno …etc
AREE IRREGOLARI: UNITÀ DELLE SERIE TERRITORIALI
Nelle serie territoriali le unità statistiche di rilevazione sono generalmente irregolari, predefinite e selezionate
in relazione all’oggetto della ricerca.
In Italia l’Istituto Nazionale di Statistica (Istat), fornisce i dati ufficiali sugli aspetti geo-socio-economici
della realtà della Nazione spesso disaggregati a livello territoriale e principalmente riferiti alle regioni o ai
comuni (per i dati censuari). Sempre l’Istat rende disponibili data-base comunali provenienti da fonti
ufficiali territoriali, come i dati dell’Atlante Statistico dei Comuni ( ediz), o il Sistema di indicatori
territoriali, contenente, quest’ultimo, informazioni di carattere demografico, sociale e ambientale
disaggregate a livello regionale, provinciale e ai rispettivi capoluoghi.
Le sezioni di censimento: Le Sezioni di Censimento costituiscono l'unità minima di rilevazione del Comune
sulla cui base è organizzata la rilevazione censuaria. È costituita da un solo corpo delimitato da una linea
spezzata chiusa. A partire dalle sezioni di censimento sono ricostruibili, per somma, le entità geografiche
ed amministrative di livello superiore (località abitate quali centro, nucleo, case sparse; le aree subcomunali quali le circoscrizioni).
Ciascuna sezione di censimento deve essere completamente contenuta all'interno di una ed una sola
località. Il territorio comunale deve essere esaustivamente suddiviso in sezioni di censimento. Nei Comuni
capoluoghi di provincia le sezioni di censimento devono essere individuate tenendo conto dell'unità
ecografica isolato. In linea di massima ad ogni isolato deve corrispondere una sezione di censimento con
delle eccezioni specificamente previste dalla procedura operativa per la suddivisione del territorio
comunale in sezioni di censimento
Il Comune individua l’area di circolazione : suolo pubblico o aperto al pubblico destinato alla viabilità.
Ogni area di circolazione deve avere una propria denominazione.
•All’interno delle aree di circolazione vengono individuate le singole sedi di dimora o di lavoro che si
definiscono unità ecografiche.
(vedi "Istruzioni per la formazione delle basi territoriali e per l'ordinamento ecografico" contenute negli
allegati della Legge e regolamento anagrafico Legge 24.12.1954 n. 1228 e D.P.R. 30.05.1989 n. 23)
I dati per sezione di censimento, nella versione oggi diffusa, hanno una quota residua e comunque
non superiore al 4% di errori di geocodifica causati da disallineamenti fra la collocazione puntuale di
numeri civici e le linee di confine fra sezioni contigue
Il numero di variabili rese disponibili in occasione dell’aggiornamento delle basi territoriali per i
censimenti 1991, 2001 e 2011 è riportato nella tabella 1
Tutti i file geografici diffusi, sono scaricabili dal sito Istat in formato compresso e sono resi disponibili
sia nella proiezione geografica ED50 UTM , sia nella proiezione WGS84 UTM.
La cartografia UTM (UTM (Universal Trasversal Mercator), utilizzata a livello mondiale si usa sia con
sistema di riferimento geocentrico WGS84 che con sistema europeo ED50.
WGS84=World Geodetic System 1984 è un sistema di coordinate geografiche geodetico, mondiale,
basato su un ellissoide di riferimento elaborato nel1984. E’ un modello matematico della Terra da un
punto di vista geometrico, geodetico e gravitazionale, costruito sulla base delle misure e delle
conoscenze scientifiche e tecnologiche disponibili al 1984
ED50 sta per European Datum 1950, è un DATUM geodetico definito dopo nel 1950 allo scopo di
uniformare le reti geodetiche di vari paesi del nord Europa che risultavano al tempo incompatibili e
rendevano quindi complicata la definizione di confini concordemente riconosciuti.
L’ellissoide di riferimento associato a questo sistema è l'ellissoide internazionale Hayford orientato a
Potsdam
ISTAT nel manuale della descrizione dei dati presenta le sezioni: Basi territoriali, sono scaricabili i dati
geografici regionali in formato compresso riferiti a tutte le sezioni di censimento.
Analogalmente nella sezione Confini amministrativi, è possibile scaricare i limiti amministrativi degli
ultimi tre censimenti validi ai soli fini statistici. Nella terza parte, denominata Variabili censuarie, sono
scaricabili le risultanze censuarie. Infine, nell’ultima parte sono disponibili i dati toponomastici di
stradari e numeri civici, non definitivi, utilizzati nel corso del Censimento della popolazione e delle
abitazioni del 2011.
Esempio di proiezione di elaborazioni di dati censuari su sezioni di censimento (più di 11.000 sezioni)
Tab. 1 - Un quadro generale di riferimento per le trasformazioni di dati spaziali
Un processo realizza in
Punti
Punti
Aree
Flussi
Superfici
Superfici
Si osserva/analizza in
punti
Superficie
Punti
Aree
Punti
Aree
Esempi
Campionamento per punti
Interpolazione
Centroidi, centro mediano
Modelli di gravitazione
Campionamento per punti
Immagini telerilevate
Fonte Tratto ed elaborato da: L’interpolazione areale: una soluzione al problema del confronto fra dati riferiti a
sistemi spaziali differenti Maria Michela Dickson, Giuseppe Espa, Diego Giuliani e Emanuele Taufer
La Superficie: regione bidimensionale di uno spazio ben definito. Regione bidimensionale del Piano
Euclideo che a sua volta è parte dello Spazio Euclideo.
L’Area : misura dell’estensione di una regione bidimensionale di uno spazio, ovvero la misura
dell’estensione di una superficie. Come per le altre misure di natura geometrica, per la precisione si
dovrebbe distinguere fra la regione bidimensionale (insieme di punti) e la sua area (valore numerico
associato alla precedente).
Lezione IV PARTICOLARITA’ dei dati spaziali : Diversità aree; Le scale di misura;
(Errore della scelta delle unità spaziali e le loro irregolarità-->MAUP( modifiable areal unit problems) temi che riguardano
l’applicabilità dei metodi (che richiedono es. indipendenza dei dati, e omogeneità area di riferimento= la regione omogenea/regioni
omogenee; Zonizzazione e discretizzazione dello spazio (i centroidi))
Particolarità dei Dati Spaziali- presentazione dei problemi
L’analisi quantitativa dei dati spaziali ha portato all’introduzione e all’applicazione di metodi ad
hoc ma per la varia e particolare struttura dei dati comporta alcune limitazioni e specifiche di cui
occorre tenere conto sia per l’uso dei metodi che dei risultati ottenuti.
I dati areali, in particolare, nascono per aggregazione o accorpamento di dati individuali fatto che
genera l’ERRORE ECOLOGICO (ecological fallacy problem)- termine introdotta da Robinson nel
1950.
Si parla di unità ecologica quando un’unità corrisponde ad un aggregato a base territoriale
(regione, provincia...).
Per errore ecologico si intende l’errore che si commette nel trasferire sul piano individuale una
relazione osservata sul piano aggregato.
Si deve a Robinson (1950) un primo tentativo di distinguere tra correlazione individuale e
correlazione ecologica, dove la prima si riferisce alla correlazione misurata su oggetti statistici
indivisibili e la seconda si riferisce a gruppi di persone.
La correlazione ecologica si dimostra spesso necessaria, data l’impossibilità di disporre delle
informazioni individuali; l’obiettivo del ricercatore infatti è sempre quello di inferire sul piano
individuale, anche se non sempre viene esplicitato.
Lo studio di Robinson, 1950, guardava alla relazione tra due variabili:
l’analfabetismo
origine etnica e
-La correlazione indica la tendenza che hanno due variabili (X e Y) a variare insieme, ovvero, a
covariareVariabili con risposta (si/no) in alcune ripartizioni USA (Il coefficiente di correlazione esprime
l’intensità della possibile relazione tra due variabili; la correlazione può essere lineare o di altro
tipo). La relazione dà luogo ai seguenti valori del coefficiente di correlazione:
r=0,203 livello individuale (censuario)
r=0,946 livello ecologico 9 grandi ripartizioni
r=0,773 livello ecologico 44 stati americani
il coefficiente di correlazione è calcolato, nella correlazione ecologica, sulle frequenze di cella delle
diverse unità territoriali.
Come si vede, la relazione tra le due variabili è decisamente diversa, se valutata a livelli diversi.
Esistono altri tipi di errore? Come superare l’impasse?
Un secondo tipo di errore risiede nella possibilità della scelta soggettiva e non univocamente definita delle
unità spaziali e della loro irregolarità: queste sono le ragioni implicite di quello che Openshaw e Taylor
hanno indicato come “ Modifiable Areal Unit problem” (MAUP): dicitura che esprime i condizionamenti
teorici riguardanti l’applicabilità di metodi e la limitazione per la generalizzazione dei risultati delle analisi
sui dati spaziali.
Particolare attenzione va posta nell’utilizzo di risultati derivanti da analisi svolte su configurazioni territoriali
non standardizzate (ossia griglie non regolari)
Effetti di disturbo nelle analisi statistiche dovute: alla dipendenza spaziale; alla mancanza di
standardizzazione delle unità areali, alla distorsione che nasce dal riferirsi a dati aggregati per somma o per
media.
- LA DIPENDENZA TERRIORIALE
La prima “legge” della Geografia, introdotta da W. R. Tobler nel 1970, afferma:“everithing is related to
everithing else,but near things are more related tha distant things”.
L’affermazione di Tobler introduce sia l’esistenza di una relazione di dipendenza nel valore dei fenomeni
spaziali per effetto della vicinanza tra le unità, sia l’osservazione, sia l’intensità di tale dipendenza tende a
ridursi e a sfumare con il crescere della distanza tra le stesse unità.
Cause della dipendenza spaziale: tendenziale omogeneità geografica nelle aree circostanti l’unità in esame o,
anche, alla presenza di particolari strutture e pertinenze comuni alle aree contigue, o, in finale, potrebbe
derivare da comportamenti mimetici che spesso si riscontrano nella diffusione di tipicità nelle attività umane.
Differenza tra dipendenza spaziale e dipendenza temporale: Si riscontra una dipendenza anche nei dati
raccolti e relativi ad anni contigui e successivi delle serie statistiche temporali, trattasi, in questo caso, di una
dipendenza unidirezionale in quanto è il passato che influisce sul futuro e non viceversa. Con riferimento ai
dati spaziali, invece, si parla di dipendenza multidirezionale e reciproca o meglio d’interdipendenza, nel
senso che il dato relativo a una unità territoriale e’ influenzato “da” e influisce “su” quanto accade nelle unità
adiacenti.
In tal caso si ha una violazione al principio dell’indipendenza di ciascun dato osservazionale
conseguentemente diviene necessario misurare e tenere conto (in diversi modi), della “autocorrelazione
spaziale” ovvero della tendenza nei dati territorialmente contigui di presentare valori simili
(autocorrelazione positiva), o valori opposti(autocorrelazione negativa), attitudine che risulta più rara.
La determinazione dell’esistenza e dell’entità dell’autocorrelazione nei dati, è statisticamente
determinata con specifiche metodologie i cui risultati forniscono sia un contributo interpretativo sulla
distribuzione territoriale dei valori sia la necessaria informazione per il ricorso ad appropriati strumenti
di analisi quantitativa per dati dipendenti.
La varietà dei riferimenti territoriali: il problema dei confini e della modificazione delle unita’ areali.
Il tema è quello della varietà tipologica delle unità areali causata da: posizione dei confini interni e esterni.
Posizionamento derivante dalle diverse possibili configurazioni geografiche o di riferimento selezionate per
l’analisi, è un fattore che limita la generalizzazione dei risultati ottenuti
-Il problema dei confini: Confini esterni/confini interni
Con riferimento ai dati puntuali, il diverso posizionamento dei confini esterni può produrre un identico
risultato nel calcolo di una sintesi statistica, ma la sua corretta utilizzazione richiede che il valore
ottenuto sia collegato alla specifica situazione spaziale dei dati. Nel caso esemplificato nella fig.1, ad
esempio, si verifica uno stesso valore nella misura della variabilità pur con il passaggio, nella figura, dai
confini A ai confini B.
Figura 1:
A- Confini esterni suggeriscono una dispersione- modello regolare o disperso per il confine A
B- Confini esterni suggeriscono una concentrazione- pattern raggruppato o cluster per il confine B
l’aver ottenuto un identico risultato nella misura della variabilità non può sintetizzare sufficientemente e in
modo appropriato lo stato delle informazioni iniziali.
Nel caso delle unità areali la posizione dei confini interni produce differenti strutture territoriali, anche se i
valori del carattere risultassero invariati, gli indici statistici di sintesi potrebbero portare diversi e non
generalizzabili risultati
Figura 2A- situazione di segregazione/concentrazione ?
Figura 2B-situazione d’integrazione/equidistribuzione?
i risultati di metodi statistici quali, ad esempio, la misura della concentrazione o dell’autocorrelazione
saranno diversi, pur se i valori osservati nei due casi esemplificati non risultassero modificati.
il valore sintetico delle elaborazioni deve essere sempre collegato alla struttura territoriale dalla quale
provengono i dati per assicurare una corretta interpretazione delle risposte fornite dai metodi statistici
applicati.
Modificazione Aree
Quanto osservato dagli autori Openshaw e Taylor, sinteticamente espresso con la sigla MAUP, genera
due possibili conseguenze:
1-problema di aggregazione per media: se varia la forma delle unità areali, in uno stesso spazio,
l’aggregazione per media può produrre dati capaci di generare risultati stabili per alcuni indici e variabili
per altri; è quanto viene sinteticamente illustrato dalla lettura dei grafici delle fig.3 A e B
Figura 3A; 3B
Effetti di aggregazione
Figura 4A- valori su dati individuali _ calcolo media e varianza
Media - sommo tutti i valori della popolazione in oggetto e dividendo per il numero delle osservazioni M=(4+8+12+..+)/16
2
Varianza: Rappresenta la media aritmetica dei quadrati delle distanze dei dati dalla media M Var= ∑(x-M) /N
Calcolo: la media è già calcolata (7,5); Calcolo i quadrati delle distanze dei dati dalla media: es (4-7,5)2; (8-7,5)2 ; (12 7,5)2…
sommo dei quadrati ottenuti: 12,25+0,25+20,25+… = 153,8125
Calcolo la media dei quadrati e ottengo la Varianza: 153,8125/16 = 9,75
Fig 4B – modifico le aree e assumo il valore medio (I+II) colonna; (III+IV) colonna
Fig . 4C Ulteriore raggruppamento:
Figura 5 –Altro tipo di modificazione: modificazione delle aree e invarianza degli indici di sintesi
2-problemi di scala o di aggregazione per somma: al variare dell’estensione delle aree variano i dati
areali ottenuti dal raggruppamento di valori unitari con la conseguenza di rendere non stabili e quindi
non generalizzabili i risultati di alcune metodologie.
Nel ricorso alla correlazione tra variabili l’errore ecologico segnala, infatti, come la misura
dell’associazione tra variabili aggregate non rappresenti la misura dell’associazione a livello di dati
individuali, a causa della riduzione della variabilità nei dati aggregati.
Il “lavoro” geografico della classificazione dei territori è sensibile, dunque,: ai confini, alla scala, alle
tipologie di misure e aggregazioni
Esempio misure di disuguaglianza e povertà: variazione della classificazione dei paesi poveri
Paesi in base al PIL (PPA) 2010 (IMF 2010): in base alla sola variabile economica
Classificazione ISU/combinazione di Pil; speranza di vita ;alfabetizzazione
Esempio il gerrymanderingElbridge Gerry, governatore del Massachusetts che in occasione delle elezioni del 1812, Ridefinisce i
confini dei distretti in modo da predeterminare il risultato delle elezioni
Gerry sapeva che il suo partito (i Democratici) era messo molto peggio degli avversari (i Repubblicani).
In effetti i repubblicani vinsero agevolmente le elezioni, facendo fuori il governatore e conquistando la
maggioranza alla Camera; ma al Senato i democratici mantennero nonostante tutto la maggioranza dei
seggi. La cosa non passò certo inosservata, anche perché i collegi elettorali assunsero forme davvero
sinuose… come le spire di una salamandra. I Repubblicani cominciarono a parlare di gerry-mander
(salamandra), e in qualche decennio la parola divenne di uso comune
Per capire come funziona il gerrymandering, basta pensare a una regione composta da una città circondata
dalla campagna.
Nella città abita circa metà della popolazione totale, es si vota a sinistra, nella campagna, dove abita l’altra
metà, si vota destra.
Se chi ha il potere di ridisegnare i collegi elettorali della regione volesse far vincere la destra, potrebbe
disegnare i vari collegi in modo che ogni collegio cittadino comprendesse una fetta di campagna tanto
grande da far sì che i cittadini di sinistra risultino inferiori in numero agli abitanti rurali di destra.
Il gioco dei confini : ogni area stesso numero di individui (16) ma…
Caso di sinistra 8 rossi/8 blu=equidistribuzione ; caso di destra no
Caratteristiche dei dati Spaziali/territoriali
I dati spaziali /territoriali hanno delle caratteristiche specifiche e diverse da quelli che non hanno uno
specifico riferimento allo spazio. In effetti:
1- le unità di riferimento sono diverse: unità territoriali (preesistenti e scelte in relazione alla finalità
della ricerca). Le unità spaziali, invece, (celle) sono costruite dal ricercatore
2- I dati spaziali sono dipendenti (legge di Tobler)
3- La dipendenza è multidirezionale
4- La forma della struttura territoriale da cui provengono (MAUP)
5- Le tecniche statistiche devono tenere esplicitamente conto della posizione dei dati nello spazio
6- I risultati non sono generalizzabili
GLI AMBITI DELLA STATISTICA SPAZIALE/TERRITORIALE tutte le analisi in cui lo spazio è fondamentale
Biologia- i sistemi viventi nel loro particolare Habitat
Economia ed econometria- differenza tra spazio assoluto (cartesiano) e applicazione territoriali
Geografia – cartografia e telerilevamento
Medicina- epidemiologia
Gestione del territorio (pianificazione..
Sulle varie tipologie di unità è possibile rilevare i caratteri, le modalità. I DATI OTTENUTI rispondono a varie
tipologie sia rispetto all’unità (puntuale, areale, direzionale..) sia rispetto alla classificazione delle SCALE DI
MISURA utilizzata.
Le scale di misura.
La rilevazione dell’informazione xij di X(s) sull’unità sj, richiede ed è, essenzialmente, una
“misura”.
Si distinguono quattro scale di misura: nominale, ordinale, intervallare, proporzionale.
Si consideri un certo carattere o variabile X e, per semplicità due unità statistiche e sia x1
la rilevazione eseguita sulla prima unità e x2 quella eseguita sulla seconda.
Si dice che il carattere è qualitativo e di tipo sconnesso se tra le due osservazioni è
possibile porre soltanto le seguenti relazioni:
x1 = x2
x1 ¹ x2
e la scala è di tipo nominale. Si tratta di variabili o caratteri definiti da oggettivi verbali e
non ordinabili se non in modo arbitrario come nazionalità, professioni, religioni,….
La differenza tra le due rilevazioni si pone uguale a 0 se queste sono uguali e pari a 1 se
sono diverse.
Se le modalità o unità di misurazione sono definite con aggettivi Non arbitrariamente
ordinabili, la scala è nominativa ordinale e sono possibili le seguenti relazioni tra le due
misurazioni:
x1 = x2
x1 ¹ x2
x1>x2
x1<x2
Le modalità possono essere rappresentate come punti su una retta ma a distanza
arbitraria perché la differenza non è quantificabile in modo oggettivo ma solo con un
ordinamento, esempio i voti presi da due studenti, uno con 20/30 e un altro 25/30 è solo
possibile dire che il primo è stato valutato meno del secondo.
Non è possibile quantificare le differenze tra le intensità delle osservazioni.
La scala non è regolare e gli intervalli non sono costanti.
Sono un esempio la scala Mercalli per misurare l’intensità dei terremoti, mediante gli effetti
distruttivi che esso produce su persone, cose e manufatti.
Due terremoti di identica magnitudo (energia) possono avere diverse intensità, se
presentano ipocentri posti a differenti profondità, ma anche se si verificano in zone con
una diversa antropizzazione.
Un terremoto di altissima magnitudo che avviene in mezzo al deserto, dove non ci sono
costruzioni potrà avere intensità minore (quindi un Grado Mercalli inferiore) rispetto ad un
altro, di magnitudo inferiore, che avviene in una zona rurale densamente abitata, o dove le
costruzioni non sono antisismiche.
e la scala di Mohs per misurare la durezza dei minerali ( ci sono 10 minerali di r
iferimento a ciascuno dei quali è stato assegnato un valore di durezza basato sulla
capacità di un minerale di scalfire il minerale classificato nel grado precedente).
scala di Mohs
La scala si dice intervallare se la misura è quantitativa ma l’origine dell’unità di misura è
arbitraria, in tal caso ha senso misurare l’intensità della differenza tra i due valori, ovvero
sono possibili le relazioni:
x1 = x2
x1 ¹ x2
x1>x2
x1<x2
x1 – x2
In tal caso è possibile valutare la differenza tra due coppie di valori :
x1 - x2 = d1
e
x3 – x4 = d2
e valutare se d1 >d2 o d1<d2 o d1=d2 ma non ha senso il rapporto tra le due quantità.
Questo perché l’origine è arbitraria.
La scala è tipica per la misura delle temperatura : scala centigrada lo zero è il punto di
congelamento dell’acqua
Mentre per la scala Kelvin, lo zero è quello assoluto (assenza di calore) a -273 gradi.
Una temperatura di 30 gradi centigradi è di 303 gradi Kelvin; la differenza tra 50 e 30 gradi
centigradi è 20 gradi e tra 323 e 303 gradi Kelvin è sempre di 20 gradi ma non è più
possibile valutare il rapporto tra le due valutazioni che è assolutamente diverso:
50/30 ¹ 323/303.
1,6667¹ 1,0660066
La scala a intervalli ha la proprietà di poter misurare le differenze tra coppie di valori ma
non il loro rapporto.
Una temperatura di 40°C non è doppia di quella a 20°C.
Se pongo la mano destra in una bacinella con acqua a 40°C e la sinistra in una con acqua
a 10° non dirò che la prima scotta quattro volte più della seconda.
Le caratteristiche della scala risultano evidenti nella datazione, nelle altezze topografiche
che assumono come origine arbitraria il livello del mare o nelle longitudini geografiche
che partono dal meridiano zero arbitrario che è il meridiano di Greenwich.
I caratteri quantitativi sono misurabili in senso stretto su scala proporzionale o
intervallare quando la scala di misura possiede lo zero ovvero un’origine oggettiva in
termini di un modulo prefissato e la misura (intesa anche come conteggio o
enumerazione) indica di quanto l’osservazione si discosta dallo zero oggettivo.
I caratteri quantitativi possono essere discreti o continui. Nel primo caso la scala è
proporzionale e lo zero indica che il carattere non è rilevato o rilevabile ed è riferita ai
conteggi
Su tale scala proporzionale possono essere effettuate tutte le operazioni (es confronto tra
rapporti di due misurazioni)
Conseguentemente il dato xij e l’insieme degli stessi, è l’informazione qualitativa o
quantitativa sulla quale specifiche elaborazioni, per la ricerca in essere, verranno applicate
Statistica descrittiva per dati legati al territorio.
I dati puntuali sono informazioni su un fenomeno X, raccolte in una precisa localizzazione o unità
territoriale, individuata da due coordinate
Se l’interesse dell’analisi riguarda solo la localizzazione del fenomeno, es studio della distribuzione
territoriale di una attività economica i punti o unità territoriali costituiscono di per sé il dato statistico e si
parla in tal caso di dati semplici;
in tutti gli altri casi alle coordinate è associata la misura del carattere e i dati si definiscono “pesati” e sono
identificati da tre valori: la coppia delle coordinate e la misura di X.
I dati puntuali SONO adattabili poichè con un’appropriata scelta di scala i dati possono essere riferiti anche
a unità territoriali grandi come città o enormi come stelle o galassie
In tale caso, sia nella trattazione dei dati come nell’utilizzo dei risultati è ovviamente necessario non
disattendere il riferimento alla scala e quindi alla approssimazione che è stata realizzata.
Nei dati puntuali semplici il campo di ricerca è prevalentemente orientato all’individuazione delle cause
che hanno determinato la distribuzione territoriale risultante dalle osservazioni, fino a pervenire alla
possibile definizione di un modello teorico che ne interpreti la struttura essenziale e la sintetizzi.
L’ ordine o di una struttura in una mappa di punti, si basa, in effetti, sull’opinione che le distribuzioni
geografiche riferibili a localizzazioni di unità, possano derivare da decisioni umane o da condizioni
endogene di un fenomeno e quindi non siano solo il risultato di eventi casuali ma riflettano l’esistenza di
un sistema espressione di un processo spaziale.
Con riferimento ai dati puntuali pesati, l’analisi è tendenzialmente volta a studiare e interpretare quanto e
se la variazione riscontrata nei valori sia imputabile all’effetto territorio, inteso come causa co-agente di
quanto rilevato
Le metodologie descrittive : una prima analisi dei dati
Rappresentazione grafica dei dati puntuali.
La rappresentazione grafica dei dati è uno strumento di sintesi visiva di notevole impatto informativo:
l’esposizione simultanea e d’insieme del fenomeno risulta, in tal modo, molto più efficace della lettura di
una tabella.
rappresentazione grafica deve fornire una facile e chiara traduzione visiva delle informazioni raccolte
unitamente all’indicazione del loro riferimento temporale e spaziale
I grafici possono essere realizzati riportando i dati sulla carta geografica del territorio o, sullo spazio
convenzionale di un piano cartesiano: il grafico risultante, detto propriamente “pattern”, è qualificato come
semplice se riguarda la locazione dei punti semplici o pesato se ai punti sono associate le intensità dei valori
osservati.
Il pattern è una configurazione grafica nella quale la localizzazione di un insieme di punti è descritta in
termini di distanza relativa di un punto dall’altro.
Con riferimento ai dati non pesati, il pattern, geografico o cartesiano, ha anche lo scopo di facilitare la
ricerca del loro adattamento ad un modello teorico che possa interpretare e giustificare, concettualmente
ed operativamente, il possibile processo spaziale ad essi collegato
pattern semplici schematicamente esemplificati nella figura : evidenziano forme distributive riconducibili
a modelli di strutture predefinite: a) il pattern è il risultato di un processo casuale in quanto i dati non
presentano alcun possibile ordinamento, mentre la fig. b riporta il grafico di una distribuzione uniforme o
regolare con la presenza di un ordine nei punti, infine, nella fig.c il raggruppamento di unità rivela un
modello distributivo detto “modello cluster”.
Fig. Tipologie di Pattern :a) casuale:
non vi è un ordine preciso àvi è uguale possibilità di occupare un punto nell’area
individuo non influenza la posizione dell’individuo vicino.
e la presenza di un
Presenta sia individui raggruppati che isolati o regolarmente spaziati
Di solito questa conformazione è propria di situazioni in cui la densità degli individui è bassa rispetto
all’area o al volume disponibile
La distribuzione uniforme o regolare si ha in situazione di competizione, esempio modelli di concorrenza
perfetta, la competitività territoriale si manifesta in una suddivisione regolare dello spazio. Uso del suolo
agricolo: lo spazio tra le piante. In qualsiasi situazione con una popolazione “affollata” si tende ad
allontanarsi dagli altri vicini
Fig. Tipologie di Pattern : b) regolare
Ci si riferisce ad un Pattern raggruppato o cluster quando la distribuzione della localizzazione presenta
gruppi ben definiti. E’ una distribuzione non uniforme in cui ci sono cause di aggregazione/dispersione
Fig. Tipologie di Pattern c) cluster
Rappresentazione grafica dati pesati.
Per la rappresentazione grafica dei dati pesati, in corrispondenza dei punti vengono riportati i valori del
carattere generalmente espressi dalla dimensione di figure geometriche come segmenti o rettangoli di
uguale base.
Esempio rappresentazione geografica provincie Piemonte Fig. a) non pesata
La carta evidenzia la particolare localizzazione delle otto province: Novara, Vercelli, Alessandria ed Asti
occupano la zona centro-orientale del Piemonte prossima alla Lombardia, mentre Verbania, Biella, Torino
e Cuneo sono insediamenti che seguono la corona delle Prealpi. Le localizzazioni sono individuate dalle
coordinate geografiche o da coordinate cartesiane
Se aggiungo delle informazioni valoriali a ciascun punto considerato potrò agganciare il relativo valore
rilevato. La tavola riporta alcune informazioni Istat, pubblicate nell’anno 2011, relative alle otto province
del Piemonte: vi si leggono i dati puntuali semplici delle due coordinate ufficiali dei centri delle città
capoluogo, colonne 2 e 3, unitamente ai dati pesati del tasso di tentato suicidio per 100.000 abitanti (valori
medi 2007-2010), col.4, e alla percentuale della popolazione nel 2010,col.5, collegati alle stesse coordinate
Tavola1 - Coordinate geografiche, tassi di tentato suicidio per 100.000 abitanti(media 2005-007) e
percentuale della popolazione nel 2010 nelle province del Piemonte.
Province
Lat.N.
Long.E.
T.Suic.
Aless.
44,9
8,6
2,2
10
6,04
3,3
Asti
44,9
8,2
8,3
5
4,06
3,4
Biella
45,6
8,1
16,7
4
4,07
6
Cuneo
44,4
7,5
11,2
13
3
1,5
Nova.
45,5
8,6
3,0
8
6,03
5,3
Torino
45,1
7,7
7,1
53
3,04
4,4
Ver. *
45,9
8,5
10,1
3
6,01
7,9
Verc.
45,3
8,3
8,5
4
5,04
5
7,5
100
Piem.
*La provincia comprende Verbano, Cusso e Ossola.
%Pop.
Cartesiane X Cartesiane y
Il pattern è disegnato su un piano cartesiano con le informazioni relative dell’intensità dei valori.
Nel grafico è riportata la scala di misura dei valori . Da ciascun punto s’innalza un segmento di
retta/rettangolo con lunghezza proporzionale ai singoli valori osservati secondo una scala di misura
introdotta e indicata nel grafico.
E’, evidente la forte attrazione alla urbanizzazione esercitata dalla città di Torino, che è la città più
popolosa, seguita, a distanza, dalle città di Cuneo, Alessandria e Novara. Rispetto alla propensione al
suicidio risulta elevata, per gli anni in oggetto, nelle province pedemontane e meno popolate di Biella e
Verbania.
Un passaggio importante avviene nel passaggio dalla descrizione del fenomeno alla sintesi dello stesso.
3. Misure della tendenza centrale
L’espressione “tendenza centrale”, con riferimento ai dati puntuali, indica il risultato di un’elaborazione
delle informazioni che individua le coordinate di un punto di tendenziale “attrazione” dei dati, ovvero un
punto “medio” con proprie e singolari prerogative. Le misure statistiche più frequentemente utilizzate sono
il centro medio, il centro mediano e i quartili. L’applicazione dell’uno o dell’altro metodo dipende dalle
proprietà delle diverse misure, dalle condizioni derivanti dalla tipologia delle informazioni o, anche, da
specifiche esigenze di ricerca.
Il centro medio.
Siano xi,yi con i=1,2,…,n le coordinate(xi di ascissa e yi di ordinata), di n dati puntuali semplici
in uno spazio di riferimento bidimensionale.
Si definisce centro medio il dato puntuale (`x,`y) ottenuto dalla media aritmetica delle
rispettive coordinate:
`x = (S xi)/ n
e
`y = (S yi)/ n
Se si indicano con wi pesi collegati ai valori del carattere X per i dati puntuali pesati, il centro
medio è detto “pesato” o “ponderato” ed è ottenuto dalle espressioni:
`x = (S xi wi) / S wi
`y = (S yi wi) / S wi
e
Si definiscono pesi relativi le quantità espresse dai rapporti:
pi = wi / S wi
con S pi = 1
e, conseguentemente, l’espressione del centro medio pesato diviene:
`x = S xi pi
e
`y = S yi pi
Il centro medio ha la proprietà di essere il baricentro della distribuzione dei punti ovvero il punto
di equilibrio distributivo che annulla la somma algebrica dei segmenti di distanza da tale
media, proprietà che risulta espressa dalla relazione:
Si [( xi – `x ) + (yi –`y )] = 0
per dati non pesati, e dalla:
S i [( xi – `x ) + (yi –`y ) ] wi = 0
per dati pesati.
Rispetto alla tavola 1 per le coordinate cartesiane non pesate rirulta xmedio=4,66 ;y medio=4,6
Province
Aless.
Asti
Biella
Cuneo
Novara
Torino
Verb.
Verce.
Coord. medie
Coord X
6,04
4,06
4,07
3
6,03
3,04
6,01
5,04
4,66
Coord. Y
3,3
3,4
6
1,5
5,3
4,4
7,9
5
4,6
x-xm
6,04-4,66
4,06-4,66
4,07-4,66
3-4,66
6,03-4,66
3,04-4,66
6,01-4,66
5,04-4,66
S0
y-ym
3,3-4,6
3,4-4,6
6-4,6
1,5-4,6
5,3-4,6
4,4-4,6
7,9-4,6
5-4,6
S0
Risultato che si ottiene applicando la regola della distanza dei punti su una retta
Se con di si indica la distanza euclidea di ciascun punto dal baricentro, ovvero la quantità:
di = [( xi – `x )2 + (yi –`y )2] 1/2
si può introdurre la seconda proprietà del centro medio espressa dalla relazione:
Sdi2= S[( xi – `x )2 + (yi –`y )2] = minimo
per dati non pesati
e dalla:
Sdi2= S [( xi – `x )2 + (yi –`y )2 ]wi = minimo
per dati pesati.
Distanza tra due punti su una retta: proietto sugli assi cartesiani
Distanza Euclidea: distanza su un piano
Si ricorda che la radice di questa distanza è l’ipotenusa: dunque la distanza più breve tra
due punti nello spazio data dall’ipotenusa è minima
La seconda proprietà del centro medio è dunque quella di minimizzare la somma del quadrato delle
distanze di ciascun punto dal baricentro.
L’individuazione del centro medio (indicato alle volte con il termine “internalità”), permette di
caratterizzare in molti modi la distribuzione osservata.
In particolare la sua posizione può suggerire interpretazioni sulle ragioni geo-socio-economiche
della struttura territoriale dei punti, mentre la determinazione del baricentro per successivi intervalli
temporali evidenzia il “trend territoriale” ovvero la tendenziale evoluzione nella dislocazione
territoriale del fenomeno; ancora il confronto fra i baricentri di due o più distribuzioni, relative a
diverse aree, può fornire indicazioni e interpretazioni sulle ragioni e/o sulle cause di quanto
territorialmente osservato.
Nel calcolo del baricentro intervengono tutti i valori della distribuzione e ove siano presenti valori
estremali o outliers, questi possono trascinare la stima del centro medio nella loro direzione e
rendere la media un indicatore non “robusto” del punto di equilibrio dei dati.
Esempio:Trend Territoriale-tracciato dei centri medi della popolazione dal 1790 al 1990 degli Stati
Uniti
ALTRI TIPI DI DISTANZE-La distanza di Manhattan
A seconda delle situazioni posso misurare la distanza tra due punti o con la distanza Euclidea o
con quella di Manhattan. In un sistema cartesiano scelti due punti sul piano, le coordinate
relative permettono di costruire un triangolo rettangolo: la distanza di Manhattan è la misura
della somma della lunghezza dei cateti mentre la distanza euclidea è l’ipotenusa del triangolo.
Distanza di Manhattan e distanza euclidea.
Nella figura fig. sono illustrate i due tipi di distanza.
In un sistema cartesiano scelti due punti sul piano, le coordinate relative permettono di costruire
un triangolo rettangolo: la distanza di Manhattan è la misura della somma della lunghezza dei
cateti mentre la distanza euclidea è l’ipotenusa del triangolo.
Esempio del Tassista
Schematizzazione della mappa: Il problema del tassista a Manhattan
Deve Contare
Riporto le informazioni rispetto ad un primo percorso ( - - -) su di un piano cartesiano
Formula distanza Manhattan
dT (( x1 , y1 ), ( x2 , y2 ) ) =| x1 - x2 | + | y1 - y2 |
Mettendo dei valori possiamo trovare sia la distanza euclidea sia quella di Manhattan
Dati due punti, xi e xj, in uno spazio definito, s’indica con “distanza” la linea che li unisce e la
cui dimensione è espressa in valore assoluto.
Le distanze esprimono una diversità e si dicono distanze metriche se godono delle seguenti
proprieta’:
1-d ( xi , xj ) = 0,se xi = xj : la distanza di un punto da se stesso è nulla;
2-d| xi , xj | > 0, se xi ¹ xj : la distanza tra due punti diversi fra loro è maggiore di zero e positiva;
3-d| xi , xj | = d| xj , xi | (simmetria) : dati due punti xi ¹ xj la distanza è invariante rispetto al
punto di partenza;
4-d | xi , xj | £ d | xi , xh | + d | xh , xj | per qualsiasi xi , xj , xh (disuguaglianza triangolare) : la
distanza tra due punti è minore o uguale alla somma delle distanze tra ciascun punto e un terzo
preso di riferimento.
L’espressione matematica più generale di “distanza” è data dalla “distanza di Minkowski”,
indicata con dt,, la cui formula è:
dt = {S r = 1,2,..k| xir – xjr|t }1/t
La distanza di Minkowski per uno spazio a r = 1,2,…,k dimensioni, qualifica e quantifica la
distanza di ordine t tra 2 punti xir e xjr, come la radice di ordine t della somma delle potenze t.me
delle distanze assolute tra i due punti in ciascuna dimensione.
La distanza di Minkowski per uno spazio bidimensionale, è pari a:
d2 = {S r = 1,2| xir – xjr|t }1/t
In particolare per t=1 si ottiene la così detta “distanza di Manhattan”, definita dalla relazione:
d1 = S r = 1,2| xir – xjr|
mentre per t = 2 si introduce la “distanza euclidea” espressa da:
d2 = {Sr=1,2| xir – xjr|2}1/2 = [ (xi1 – xj1)2+ (xi2 – xj2)2]1/2
Formula che in uno spazio bidimensionale e per due punti è un’applicazione del teorema di
Pitagora.
Il centro mediano e i quartili
Si è trattato dell’individuazione del centro medio indicato come “centro di attrazione”.
Nel calcolo del baricentro intervengono tutti i valori della distribuzione e ove siano presenti
valori estremali o outliers, questi possono trascinare la stima del centro medio nella loro
direzione e rendere la media un indicatore non “robusto” del punto di equilibrio dei dati come
già detto.
In Statistica per annullare questo possibile effetto si usa la mediana, detta anche media di
posizione, è il valore del carattere che occupa la posizione centrale in un ordinamento,
generalmente crescente, dei dati. La mediana gode sia della proprietà a) di rendere minima la
somma delle distanze assolute dalla mediana stessa, sia quella b) di ripartire il gruppo delle
osservazioni in due sottoinsiemi ugualmente numerosi formati dal numero di valori inferiori o
uguali alla mediana, l’uno, e dal numero dei valori superiori o uguali alla mediana, l’altro.
In relazione al differente metodo usato nella misura delle distanze si distinguono due tipi di
mediana: la mediana di Manhattan e la mediana euclidea.
Mediana di Manhattan.
Siano xi e yi le coordinate di i= 1,2,…,n dati puntuali semplici, per il calcolo della mediana di
Manhattan si ordinano in senso non decrescente ciascuna delle coordinate xi e yi e si distingue se
i dati puntuali sono in numero dispari o pari.
Nel primo caso le coordinate xme e yme che corrispondono al rango di ordine (n+1)/2,
definiscono al punto o centro mediano e ciascuna linea orizzontale e verticale tracciate dal punto
separa i punti in due sottoinsiemi di uguale numerosità.
Nel secondo caso in corrispondenza del rango di ordine n/2 si individuano le coordinate 1xme e
1 yme e, per il rango di ordine(n/2)+1, le coordinate 2xme e 2 yme ( e se ne fa la media aritmetica). Le parallele
di ascissa e di ordinata tracciate dalle due mediane (1xme , 1 yme) e (2xme , 2 yme), selezionano una
porzione di piano i cui punti sui confini e nell’area godono della proprietà di essere “centro
mediano”, ovvero di soddisfare le proprietà della mediana ma questa non risulta univocamente
definita.
Data le seguente distribuzione in cui le coordinate degli 11 punti sono:
X 1
Y 2
2 8 3
1,5 2,5 4
3,5
5
6 9,5
5,5 6
8
8
5,5
7,5
Distribuzioni ordino la X (stessa cosa per la y)
X= 1 1,5 2 3 3 3,5 5,5 6 8 8 9,5
Y= 2
8 5,5 9 1,5 5
7,5 4 2,5 8
3
9
1,5
8
(11 valori)
6
Centro medio X: (1+1,5+2+3+3+3,5+5,5+6+8+8+9,5)/11= 4,6
Y: (2+8+5,5+9+1,5+5+7,5+4+2,5+2,5+6)/11= 5,4
Mediana di Manhattan
xà ( n+1)/2= 3,5
yà Ordino 1,5 2 2,5 4 5 5,5 6 7,5 8 8 9 à (n+1)/2=5,5
Mediana, Quartili
= centro medioà x=4,6; y=5,4
X0,5= 3,5
Y0,5= 5,5
Distribuzioni
X= 1 1,5 2 3 3 3,5 5,5 6 8
Y= 2
8 5,5 9 1,5 5
8
7,5 4 2,5 8
9,5
(11 valori)
6
Centro medio X: (1+1,5+2+3+3+3,5+5,5+6+8+8+9,5)/11= 4,6
Y: (2+8+5,5+9+1,5+5+7,5+4+2,5+2,5+6)/11= 5,4
Mediana di Manhattan
xà ( n+1)/2= 3,5
yà Ordino 1,5 2 2,5 4 5 5,5 6 7,5 8 8 9 à (n+1)/2=5,5
Il valore assunto dalla mediana ci dice il valore del carattere che occupa la posizione
centrale in un ordinamento, generalmente crescente, dei dati.
Collegati alla mediana di Manhattan, si definiscono quartili, indicati con Q1 e Q3, due punti le cui
quattro coordinate, indicate con xovest e xest per le ascisse,e ynord e ysud per le ordinate, sono calcolate
reiterando il procedimento visto per la mediana, relativamente al 50% dei dati inferiori o uguali alla
mediana di Manhattan, per il primo quartile e al il 50% dei dati puntuali superiori o uguali alla
stessa mediana per il terzo quartile.
Le coordinate xovest e ysud del punto primo quartilico,Q1,selezionano, rispettivamente, il 25% dei
punti con coordinate inferiori o uguali a quelle di Q1, dal 75% dei punti con coordinate ad esse
superiori e, ancora, le coordinate xest e ynord, del terzo quartile, Q3, individuano, nell’ordinamento,
quelle che hanno un valore maggiore o uguale a quello del 75% dei dati e, nello stesso tempo,
inferiore o uguale a quello del restante 25% dei dati. Il secondo quartile Q2, coincide, ovviamente,
con la mediana di Manhattan.
La mediana e la posizione dei quartili rispetto ad essa, informano anche sulla forma distributiva dei
dati: un primo quartile con valore molto prossimo a quello della mediana segnala una
concentrazione di punti nell’area nell’intorno e a sinistra del centro mediano.
Data una distribuzione di punti e ordinate le loro coordinate posso, quindi, individuare i
punti che mi ripartiscono la distribuzione originaria in quattro parti di uguale numerosità:1/4
(Q1), 2/4=1/2 Mediana di Manhattan;3/4 Q3 75% e 4/4= 1 ossia la totalità dei punti.
I quartili, come la mediana, sono indici di posizione
Esempio rispetto al caso precedente.
Quartile est rispetto alla dimensione x considero i valori più piccoli di quello mediano(3,5)
Per la nostra distribuzione si ha 1 1,5 2 3 3 3,5 sono i valori< = a 3,5
Sono 6 valori allora per individuare il quartile dovrò applicare la formula n/2, (n/2)+1à
2 , 3à 2+3/2=2,5 Q est (insieme dei valori più piccoli e uguali della mediana in x)
Q ovest: più grande( e uguale) della mediana in x valori : 3,5 5,5 6 8
n/2, (n/2)+1à 6 , 8à 6+8/2=7 Q ovest x=7
8
9,5 à
Q Sud rispetto alla dimensione y considero i valori più piccoli e uguali di quello della
mediana(5,5)
QS: 1,5 2 2,5 4 5 5,5 à n/2, (n/2)+1à 2,5 , 4à(2,5+ 4)/2= 3,25
Q Nord va calcolato considerando tutti i valori più grandi ( e uguali) della mediana in y
valori 5,5 6 7,5 8 8 9à n/2, (n/2)+1à 7,5 8à(7,5+ 8)/2=7,75
Esempio su coordinate per il calcolo della mediana di Manhattan e dei quartili si ricava dai i dati
della Tavola 4 contenente le coordinate delle città della Dodecapoli etrusca, ovvero di 12 città o
lucumonie che intorno al IV o V secolo a.C., si confederarono ed elessero il centro di Voltumna,
presso Volsinii (Bolsena),come luogo d’incontro per le riunioni necessarie e indette per trattare le
più importanti decisioni comuni.
Non c’è consenso totale sull’elenco delle città della Dodecapoli, alcuni escludono Roselle e
inseriscono subito Populonia, ma senza entrare in particolari tecnici dell’Archeologia, l’esempio è
stato preso anche per sottolineare come il ricorso ad analisi territoriali sia diffuso in tutti i settori
della ricerca.
Carta della Dodecapoli
Tavola 4. Coordinate delle città della Dodecapoli etrusca *
Dodecapoli etrusche
Caere(Cerveteri)
Tarquinia
Vulci
Roselle
Vetulonia
Veio
Volsini(Bolsena)
Chiusi
Perugia
Cortona
Arezzo
Volterra
Lat.N.(Y)
42,00(1)
42,25(3)
42,42(4)
42,81(6)
42,86(7)
42,02(2)
42,64(5)
43,01(8)
43,11(9)
43,28(10)
43,47(12)
43,40(11)
Lon.E.(X)
12,15(9)
12,76(12)
11,63(4)
11,14(3)
10,97(2)
12,40(11)
11,98(7)
11.95(6)
12,39(10)
11,99(8)
11,87(5)
10,86(1)
Baricentro: 42,77 ; 11,754
Centro mediano:42,81 ; 11,95
Il primo quartile ha coordinate xovest =11,14 e
latitudine ysud = 42,25
il secondo longitudine xest = 12,15 e latitudine
ynord = 43,11.
*Sono le probabili città della Dodecapoli prima del 396 a.C.
Il baricentro geografico delle lucumonie è individuato dalle coordinate di 42,77 gradi di latitudine nord e
11,754 gradi di longitudine est mentre il centro mediano, come si deduce dall’ordinamento delle
coordinate della tavola, il cui rango è indicato nelle parentesi tonde, ha coordinate di gradi 42,835 nord e
11,95est.
Il centro mediano è prossimo a Bolsena e (quindi al comune di Volsini ) ed ha la proprietà di minimizzare la
somma delle distanze rispetto alle dodici città. L’ordinata del punto mediano isola le sei lucumonie più a
ovest da quelle più ad est, mentre l’ascissa che passa per lo stesso punto mediano, divide le sei lucumonie a
nord da quelle più a sud. Anche se la valutazione della mediana è basata sulle coordinate attuali, il risultato
interroga sulla possibile intuizione dei nostri antenati etruschi, nella scelta della sede comune nel santuario
di Volsini.
I due punti quartilici della distribuzione territoriale delle lucumonie, sono indicati dalle coordinate che
nell’ordinamento crescente delle coordinate di longitudine e di latitudine delle lucumonie della tavola 4,
sono entrambe in corrispondenza del rango 12/4 = 3, per il primo quartile e del rango 3x12/4= 9 per il terzo
quartile.
Il primo quartile ha coordinate xovest =11,14 di longitudine e latitudine ysud = 42,25 e il secondo longitudine
xest = 12,15 e latitudine ynord = 43,11.
In modo analogo a quanto verificato per le coordinate della mediana, quelle dei quartili individuano, nel
territorio, gruppi di punti di prefissata numerosità: ad esempio, per i dati sulle lucumonie, la coordinata
ynord del primo quartile, separa tre delle dodici lucumonie situate a nord dalle restanti nove che sono a sud
della stessa coordinata.
Il pattern della Dodecapoli e i valori ottenuti dal calcolo della mediana di Manhattan e dei quartili sono
riportati graficamente nella figura fig.12.
FIG.12. Pattern della Dodecapoli etrusca e coordinate della mediana di Manhattan e dei quartili
Ricorda.
La latitudine di una località è la distanza di
tale località dall'Equatore.
Questa distanza viene misurata lungo
ilmeridiano che passa per quel luogo.
La longitudine di una località è la distanza di
tale località dal meridiano di Greenwich.
Questa distanza viene misurata lungo
ilparallelo che passa per quel luogo.
Nel caso di un numero di valori pari in statistica per trovare la determinazione della mediana
e dei quartili si opera la media aritmetica dei valori individuati.
Si sono, inoltre, già richiamate le due proprietà associate alla mediana statistica:
a) di rendere minima la somma delle distanze assolute dalla mediana stessa,
b) di ripartire il gruppo delle osservazioni in due sottoinsiemi ugualmente numerosi formati
dal numero di valori inferiori o uguali alla mediana, l’uno, e dal numero dei valori superiori
o uguali alla mediana, l’altro.
Nella geostatistica e rispetto ai dati puntuali non sempre si realizzano queste due proprietà
perché:
Nei dati puntuali semplici non si incontrano ostacoli per un numero dispari di localizzazioni
ma se ho un numero pari di coordinate la Mediana mi individua un’AREA e diviene
arbitrario scegliere come localizzazione mediana la media aritmetica tra le due coordinate o
analogo punto interno perché non sono in uno spazio indifferenziato.
Nel caso dei dati pesati, per il calcolo della mediana di Manhattan si ricorre ancora
all’ordinamento dei dati secondo le coordinate, alla successiva cumulazione dei pesi e
all’individuazione del punto mediano corrispondente alla coordinata del termine n/2 e (n/2+1 )se
il totale dei pesi è pari o (n+1)/2 se il totale è dispari.
Il risultato, tuttavia, può fornire una stima che non realizza la seconda proprietà della
mediana: quella di avere pesi uguali a sinistra e a destra e sopra e sotto la mediana stessa.
E’ quanto si può riscontrare nell’esempio riportato nella tavola2: accettare le coordinate di
Torino come punto mediano non è certo che soddisfi la simmetrica distribuzione dei pesi,
come è richiesto per la stima della mediana.
Per questa ragione si preferisce utilizzare, per i dati pesati, la mediana euclidea
Tavola 2- Calcolo della mediana di Manhattan per la serie di frequenza della distribuzione
percentuale della popolazione nelle province del Piemonte (tavola1).
Province
Latit.N
Cuneo
Asti
Alessand.
Torino
Vercelli
Novara
Biella
Verbano
44,4
44,9
44,9
45,1
45,3
45,5
45,6
45,9
%
pop
13
5
10
53
4
8
4
3
%
cum
13
18
28
81
85
93
97
100
Province
Long.E
%pop
%cum
Cuneo
Torino
Biella
Asti
Vercelli
Verbano
Alessand.
Novara
7,5
7,7
8,1
8,2
8,3
8,5
8,6
8.6
13
53
4
5
4
3
10
8
13
66
70
75
79
82
92
100
Commento Mediana Manhattan punti pesati: l’ordinamento viene fatto sul carattere latitudine. In
corrispondenza ci sono le frequenze (come nella tavola ad. es la popolazione%). Si calcola
la cumulata delle frequenze (peso). La mediana è in corrispondenza delle frequenze (cumulate)
(N+1)/2 se dispari o della media dei valori corrispondenti alle frequenze cumulate N/2 à
(N/2)+1.
Si vuole una ripartizione dei pesi al 50% sopra e sotto la mediana, ma con i dati pesati non
sempre questo si verifica. Nell’esempio la coordinata mediana che supera le cumulate del 50%
delle frequenze sia per la latitudine che per la longitudine corrisponderebbe con le coordinate di
Torino (81% lat; 66% long) ma se si assume Torino come mediana di Manhattan i pesi non
sarebbero ugualmente distribuiti sopra e sotto la mediana. In particolare sotto il 50% c’è lo 81%
di pop e sopra il 19%...
WEBER, infatti, calcola il baricentro e non la mediana.
Mediana euclidea
Le coordinate della mediana euclidea (xme ; yme) per n dati puntuali semplici, si ottengono dalla
soluzione della condizione di minimo imposta nella seguente relazione:
S[(xi- xme )2 + ( yi - yme )2]1/2 = minimo
nella quale le coordinate sono le incognite da definire.
Nei dati puntuali pesati la distanza di ciascun punto dalla mediana ha il peso, indicato con
wi, delle corrispondenti coordinate, e la condizione di minimo diviene:
Swi[(xi- xme )2 + ( yi - yme )2]1/2 = minimo
La proprietà della mediana euclidea, di minimizzare la somma delle distanze euclidee, è,
particolarmente per i dati puntuali pesati, la ragione del ricorso alla sua applicazione nella
soluzione di problemi relativi alla individuazione di una centralità territoriale, com’è il caso della
ottimizzazione nella allocazione di imprese, noto come problema allocazionale di Weber1.
In queste problematiche, in effetti, il ricorso al centro medio avrebbe la proprietà di minimizzare
la somma del quadrato delle distanze da tale centro e non la totale distanza com’è l’obiettivo
del ricorso alla individuazione della mediana euclidea.
Si ricorda: centro medio
Sdi2= S[( xi – `x )2 + (yi –`y )2 ] = minimo
per dati non pesati
Sdi2=
S [( xi – `x ) + (yi –`y ) ]wi = minimo
per dati pesati
2
2
Mediana euclidea
S[(xi- xme )2 + ( yi - yme )2 ]1/2 = minimo
nella quale le coordinate sono le incognite da
definire.
Swi[(xi- xme )2 + ( yi - yme )2 ]1/2 = minimo
dati pesati
per
Occorre tuttavia sottolineare che il complesso problema della localizzazione ottimale di un intero
sistema di servizi, richiede l’uso di metodologie particolari e relative a misure di distanze diverse
da quelle euclidee.
La condizione di minimo, imposta per la determinazione della mediana euclidea, comporta non
semplici problemi di calcolo che, ove necessario, sono risolvibili con il ricorso a calcolatori
programmabili.
Nelle situazioni più semplici si può ricorrere alla seguente proposta di soluzione introdotta da
Kuhn e Kuenne nel 1962.
Il calcolo si basa su un procedimento iterativo convergente verso un valore di tolleranza di
errore, predefinito.
In particolare, per n dati puntuali e con una tolleranza, ad esempio del 10%, si parte da una prima
stima basata generalmente, sul centro medio o su un qualsiasi altro giustificato riferimento
iniziale. Tale stima viene iterativamente sostituita da successivi valori mediani, fino a
raggiungere il valore ritenuto soddisfacente rispetto alla tolleranza prevista.
Con riferimento alla generica tma prova, il procedimento di stima e’ il seguente:
1-si calcolano le distanze euclidee tdi calcolate sugli scarti delle coordinate dei punti
dal riferimento preso in considerazione (nel caso particolare dalla stima t.sima txme; tyme)si
ottiene:
t
di = [( xi - txme )2 + ( yi - tyme )2]1/2
dove tdi è la distanza euclidea di ciascuna osservazione dalla tma stima delle coordinate mediane;
1
Il problema della organizzazione delle attività economiche sul territorio ha generato dei modelli di localizzazione e
uno dei primi è stato quello di Alfred Weber nel 1909. L’Autore introdusse un modello di localizzazione di attività di
due out-put produttivi rispetto al luogo di vendita o mercato finale del bene prodotto nell’ipotesi di domanda rigida
rispetto al prezzo, concorrenza perfetta sul mercato dei beni e dei fattore, costi di produzione dati e costanti per ogni
impresa
2- si calcolano successivamente i rapporti:
t
ki = wi / tdi
per dati pesati
t
ki = 1/ tdi per dati semplici
ovvero
I rapporti così calcolati, sono i pesi necessari per la stima della mediana di ordine t+1 le cui
coordinate si ottengono dalla media aritmetica ponderata dei dati iniziali:
t+1
xme = (S xi tki )/ S( tki ) e
t+1
yme = (S yi tki )/ S( tki ) ;
3- il procedimento si arresta se :
| t+1xme - txme | e | t+1yme - tyme | ≤ tolleranza.
Esempio
La tavola xxx riporta le coordinate, xi e yi, di quattro dati puntuali semplici per il calcolo
della mediana euclidea con l’approssimazione proposta da Kuhn e Kuenne.
Tavola xxx valori coordinate punti A B C D
A
B
C
xi
2
3
5
yi
4
6
1
D
6
5
Dai dati si ricavano le coordinate del centro medio pari a:
`x = 4 e `y = 4
e quelle della mediana di Manhattan:
xme = 4 e yme = 4,5
Per il calcolo della mediana euclidea s’introduce un livello di tolleranza pari al 10% (0,1)
Per evidenziare la differenza con la stima della mediana di Manhattan, si prende il valore di
questa per l’inizio delle iterazioni
Reciproci
à
2,12à
0,485
1,80
0,55
3,64
0,275
2,06
0,485
S= 1,795
Dalla prima stima si otterranno le nuove coordinate della mediana euclidea
Xt+1= (0,485 *2 + 0,55*3------)/1,795 =3,85
Yt+1=(0,485 *4 + 0,55*6+---)/1,795= 4,42
La differenza tra xme e xt+1me e tra yme e yt+1 me è rispettivamente
|4-3,75| = 0,15 per la x , |4,5-4,42| 0,08 per la y.
Poiché la tolleranza era stata posta al 10% questo valore è soddisfatto solo dalla coordinata
di y di conseguenza si reitera il processo partendo dalle stime xt+1me , yt+1 me
Nella tavola xxx1, sono riportati i risultati delle due iterazioni,
Tavola xxx1. Calcolo della mediana euclidea.
iterazioni
inizio
prima
seconda
x
4,00
3,85
3,75
Y
4,50
4,42
4,38
toll.x |xtme-xt+1me|
|0,15|
|0,10|
toll.y|ytme-yt+1me|
|0,08|
|0,04|
e la stima accettata della mediana euclidea corrispondente al dato puntuale con coordinate
2
pari a:
xme = 3,75 e 2yme = 4,38
La fig.xxx2 è il grafico dei dati e dei risultati dell’esempio, mentre è possibile verificare, con
risultati delle due iterazioni essi, le proprietà delle due mediane.
Figxxx