Rappresentazioni grafiche dei dati

Transcript

Rappresentazioni grafiche dei dati
Una volta raccolti i dati necessari per la propria analisi, si deve scegliere una o più modalità
efficaci per evidenziare il valore informativo contenuto nei dati stessi.
Una scelta potrebbe esser quella di arricchire il commento dei dati con una serie di tabelle
oppure, talvolta, si preferisce “trasformare” i numeri in rappresentazioni grafiche - più o meno
semplificate - per rendere più facile la lettura delle informazioni che si sono acquisite nella fase
di ricerca.
Se si opta per la rappresentazione grafica dei dati si può scegliere fra due casi:
rappresentazioni cartografiche
diagrammi statistici
Rappresentazione cartografica
Quando si ha a che fare con dei dati statistici primari o secondari, può essere mostrare la
distribuzione spaziale di questi valori. Per far questo si possono adottare le carte tematiche.
Ogni carta tematica è caratterizzata da una base cartografica (la rappresentazione ridotta o
simbolica di una porzione di superficie terreste, generalmente molto semplificata) e da un tema
(la o le variabili rappresentate spazialmente).
Per maggiori informazioni o esempi esplicativi si può leggere i seguenti documenti:
La rappresentazione cartografia ovvero il linguaggio grafico a cura di Arch. Giovanna Di
Meglio e Arch. Antonio Cittadino del LARTU, scaricabile dal sito
Estratto delle dispense del Dott. Franco Vico, scaricabile dal sito
Diagrammi statistici
Spesso, quando si effettua un’indagine i dati raccolti vengono organizzati in tabelle per
facilitarne la lettura. Un lettore esperto, osservando la sola tabella, riesce a cogliere tutte le
informazioni che si possono trarre da questi valori. Altri lettori, invece, riescono a capire meglio
i dati se questi sono rappresentati mediante un diagramma.
La rappresentazione grafica dei dati offre, infatti, numerosi vantaggi:
Permette di elaborare una sintesi delle informazioni (anche se per realizzarla si devono
operare alcune approssimazioni)
Il grafico è più facilmente leggibile
Si capisce in modo più immediato l’andamento del fenomeno
103
Esempio
Se ci si limitasse a leggere i dati nella tabella 1, potrebbe essere difficile comprendere quale sia
l’andamento nel tempo degli immigrati ed emigrati. Il semplice scorrere dei dati permetterebbe
di osservare che sia il numero di chi ha deciso di spostarsi a Torino sia di chi ha abbandonato la
città è diminuito dagli anni ’70 al 2000, ma – probabilmente - ad un occhio non esperto
sfuggirebbero altre indicazioni. Analizzando, invece, il diagramma a linee, in modo semplice e
veloce, si comprende subito che:
Nei primi anni ’70 il saldo migratorio era positivo per poi diminuire e rimanere nel corso
degli anni sempre negativo.
La “forbice” tra immigrati ed emigrati (che dà un’indicazione dell’entità, in valore
assoluto, del saldo migratorio) aumenta vistosamente negli anni ’80 per poi assottigliarsi
fino a diventare quasi pari a zero nel decennio successivo.
I trend negativi del numero di immigrati ed emigrati non è lineare, ma ci sono dei picchi
(ad esempio, i più significativi sembrano essere, per gli immigrati nel 1979 oppure nel
1996; per gli emigrati, nel 1980, nel 1983 e nel 1990).
Tabella 1: La serie storica degli immigrati ed emigrati nel comune di Torino, dagli anni ‘70
Fonte: Ufficio di statistica del Comune di Torino
anno
immigrati emigrati
45.858
47.487
1972
45.024
43.569
1973
35.341
44.957
1974
29.444
38.869
1975
26.361
38.633
1976
25.250
36.685
1977
25.860
35.634
1978
28.847
36.498
1979
23.279
39.711
1980
21.377
35.234
1981
21.202
37.082
1982
20.672
40.639
1983
20.120
35.661
1984
20.408
32.724
1985
19.237
29.577
1986
21.233
29.064
1987
18.826
27.901
1988
17.993
25.189
1989
20.730
28.943
1990
17.084
24.581
1991
15.836
21.881
1992
18.924
23.952
1993
18.208
26.133
1994
17.534
26.201
1995
23.621
24.523
1996
20.876
23.023
1997
20.672
23.176
1998
21.962
25.141
1999
23.343
24.005
2000
104
Grafico 1: La serie storica degli immigrati ed emigrati nel comune di Torino, dagli anni ‘70
50.000
45.000
40.000
35.000
30.000
25.000
20.000
15.000
10.000
5.000
immigrati
00
20
98
19
96
19
94
19
92
19
90
19
88
19
86
19
84
19
82
19
80
19
78
19
76
19
74
19
19
72
0
emigrati
Qui di seguito, vengono proposti alcuni esempi di diagrammi che, in un’analisi socioeconomica,
potrebbe essere utile conoscere ed utilizzare per rappresentare i risultati delle elaborazioni sui
dati.
Si ricordi che, indipendentemente dal tipo di diagramma scelto, si deve:
SEMPRE dare un titolo al grafico
SEMPRE riportare la fonte da cui si sono presi i valori
devono essere SEMPRE esplicitate le unità di misura o nel titolo o nel grafico stesso
(generalmente, lungo gli assi).
Se nel diagramma sono rappresentati gli andamenti di grandezze differenti non deve MAI
mancare la legenda, in modo che il lettore possa capire a cosa corrisponde quella linea, barra
o istogramma.
Diagramma a barre
I diagrammi a barre sono costituiti da rettangoli (o barre) aventi larghezza arbitraria, ma
costante, e altezza proporzionale alla caratteristica che si vuole rappresentare.
Normalmente un diagramma a barre presenta sull’asse orizzontale le etichette che identificano
le classi in cui è stata suddivisa la “popolazione” oggetto di studio e sull’asse verticale viene
conteggiata la caratteristica “contenuta” dalle varie classi.
Ad esempio, nel grafico 1, le altezze delle barre sono proporzionali alla densità demografica
(cioè al numero di abitanti per Kmq) di ogni circoscrizione del Comune di Torino. Grazie a
questa rappresentazione si capisce in modo veloce quale sia il distretto torinese con una
concentrazione maggiore o minore di residenti.
Si noti, inoltre, come il diagramma è stato costruito mettendo sull’asse orizzontale le classi
individuate (in questo caso le circoscrizioni) e sull’asse verticale il valore corrispondente alla
densità demografica registrata in ogni zona.
105
In generale, si utilizza questo tipo di diagramma quando si hanno grandezze relative ad entità
simili e confrontabili: in questo caso sono le circoscrizioni, ma possono anche essere città
differenti, nazioni, ecc. a seconda del tipo di fenomeni si vogliano analizzare.
Tabella 1: densità demografica per ogni circoscrizione (al 31 dicembre 2000)
Fonte : Elaborazione dati Ufficio di statistica del Comune di Torino
Superficie
(Kmq)
Circoscrizione
Popolazione
(n°)
Densità
(n°/Kmq)
1 - Centro, Crocetta
7,006
81.317
11.607
2 - Mirafiori nord, Santa Rita
7,327
106.332
14.512
3 - Pozzo strada, Cenisia, San Paolo
8,623
128.249
14.873
4 - Campidolgio, San Donato, Parella
9,183
94.985
10.344
5 - Le Vallette, Madonna di Campiglio, Borgata Vittoria
15,583
121.228
7.780
6 - Falchera, Regio Parco, Barriera di Milano
25,206
104.168
4.133
7 - Aurora, Vanchiglia, Madonna del Pilone
22,582
87.400
3.870
8 - San Salvario, Borgo Po, Cavoretto
16,597
58.355
3.516
9 - Nizza Millefonti, Mercati generali, Lingotto
6,568
77.304
11.770
10 - Mirafiori sud
11,491
40.478
3.523
Grafico 1: Densità demografica per ogni circoscrizione (al 31 dicembre 2000)
Numero di popolazione / Kmq
Fonte : Elaborazione dati Ufficio di statistica del Comune di Torino
16000
14000
12000
10000
8000
6000
4000
2000
0
Circ. 1
Circ. 2
Circ. 3
Circ. 4
Circ. 5
Circ. 6
Circ. 7
Circ. 8
Circ. 9 Circ. 10
A volte, per comodità o per scelta espositiva, si opta per diagrammi a barre orizzontali. In
questo caso è la base del rettangolo (o della barra) ad essere proporzionale alla grandezza che si
sta misurando, mentre sull’asse verticale vengono riportate i nominativi delle varie classi o
oggetti “pesati”.
Ad esempio, se si devono confrontare la lunghezza di alcuni fiumi (grafico 2), si può adottare
questo tipo di diagramma. Nulla vieta, comunque, di utilizzarlo anche in altri casi (grafico 3).
106
Grafico 2: Lunghezza dei maggiori fiumi italiani
Fonte: Enciclopedia Europea Garzanti
410 Km
Adige
220 Km
Piave
241 Km
Arno
405 Km
Tevere
652 Km
Po
0
100
200
300
400
500
600
700
Grafico 4: Valutazioni dei genitori sui servizi dei nidi e delle scuole materne comunali
(% di risposte “molto” e “abbastanza” soddisfatti)
Fonte: Assessorato sistema educativo, Comune di Torino, indagine 2000
personale coinvolgente
personale motivato
personale competente
personale aggiornato
personale interattivo
pulizia igiene locali
qualità dell'edificio
sicurezza locali
manutenzione
attrezzature esterne
parcheggi
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
In certi casi può essere utile rappresentare nello stesso grafico più serie di dati.
Nel grafico 5 si vuole evidenziare il confronto tra due diversi contesti territoriali per i quali si
hanno informazioni sulle stesse variabili.
Invece di costruire cinque diagrammi separati per ogni classe (1 componente, 2 componenti, 3
componenti, 4 componenti, oltre 4 componenti), si possono raggruppare i vari istogrammi in
due gruppi relativi uno al Comune di Torino e l’altro all’Italia.
In questo tipo di diagramma diventa indispensabile inserire la legenda per far comprendere al
lettore a cosa corrispondono i vari colori delle barre.
107
Tabella 5: Nuclei familiari, per numero di componenti nel 1999: confronto Torino-Italia
(Valori percentuali)
Fonte: Istat
Comune di Torino
Italia
1 componente
38,4%
21,7%
2 componenti
28,2%
26,1%
3 componenti
19,0%
23,4%
4 componenti
11,9%
21,1%
oltre 4 componenti
2,5%
7,9%
Grafico 5: Nuclei familiari, per numero di componenti nel 1999: confronto Torino-Italia
(Valori percentuali)
Fonte: Istat
45%
40%
35%
30%
1 componente
2 componenti
25%
3 componenti
20%
4 componenti
oltre 4 componenti
15%
10%
5%
0%
Comune di Torino
Italia
Si possono anche aggiungere ulteriori informazioni, inserendo, per esempio, una linea che
rappresenti il valore medio della grandezza in esame, come proposto nel grafico 6; oppure si
può scegliere di adottare un diagramma a ideogrammi (grafico 7). In quest’ultimo caso, al posto
dei rettangoli, compaiono delle immagini che occupano le stesse superfici e che richiamano
l’ambito tematico cui si riferiscono le informazioni.
108
Grafico 6: Numero di divorzi ogni 10.000 famiglie - Anno 1998
Fonte: elaborazione del Sole-24 Ore su dati Istat
30
25
20
15
10
5
0
Torino
Milano Venezia Genova Bologna Firenze
divorzi
Roma
Napoli
Bari
Palermo Catania Cagliari
media italiana
Grafico 7: Superficie media (in mq) di verde pubblico per ogni circoscrizione della città di Torino – 1995
Fonte Ufficio di Statistica del Comune di Torino
Circ. 1
Circ. 2
Circ. 3
Circ. 4
Circ. 5
Circ. 6
Circ. 7
Circ. 8
Circ. 9
Circ. 10
0
500000
1000000
1500000
2000000
2500000
pari a 100.000 mq di verde
Si possono costruire anche diagrammi a barre sovrapposte. In questo caso, l’altezza di ogni
sezione delle barre sarà proporzionare alle varie caratteristiche che si sono misurate per ogni
grandezza o classe.
Ad esempio, se si fa riferimento al grafico 8, l’accorgimento adottato permette di avere tre
informazioni, per ogni anno considerato:
1. la quantità di rifiuti pro capite che vengono differenziati
2. la quantità di rifiuti pro capite che finiscono direttamente in discarica
3. la quantità totale di rifiuti pro capite prodotta (si ottiene quest’ultima informazione
considerando il rettangolo complessivamente, come somma dello due figure parziali)
Si faccia però attenzione che i rettangoli gialli, cioè quelli posti in sommità, presentano le basi a
livelli differenti.
109
Grafico 8: Produzione di rifiuti a Torino (bacino Amiat)
Kg annui pro capite
Fonte: AMIAT
600
500
61
79
100
140
136
34
431
424
424
428
419
417
1996
1997
1998
1999
2000
2001
400
300
200
100
0
Kg in discarica annui pro capite
Kg differenziati annui pro capite
Istogramma
I diagrammi a barre rappresentano i dati mediante rettangoli le cui basi (o altezze, nel caso di
diagrammi orizzontali) hanno una dimensione costante e, comunque, irrilevante. Ciò dipende
dal fatto che essi rappresentano delle classi (ciascuna delle quali è contrassegnata da una
“etichetta”) che derivano da una catalogazione dei dati mediante una scala nominale o ordinale.
Nel caso in cui si operi una classificazione sulla base di una grandezza misurata con una scale
numeriche, le ampiezze delle classi (e quindi degli intervalli sull’asse orizzontale) assumono un
significato ben preciso e può essere conveniente considerare classi di ampiezze diverse.
In questo caso una rappresentazione della distribuzione di frequenze (n° di individui per
ciascuna classe) con un diagramma a barre potrebbe falsare la lettura dei dati. È meglio
utilizzare un istogramma che è basato sulle aree delle colonne anziché sulla loro altezza.
Per capire meglio, si faccia riferimento all’esempio.
Esempio
Si sono intervistate 750 persone con età compresa tra i 18 e i 40 anni. Nella tabella 1 vengono
riportati il numero di persone contattate suddivise per età (ossia la frequenza con cui si sono
intervistate gli individui con la stessa data anagrafica).
In questo caso l’età è una grandezza che è stata misurata utilizzando una scala metrica (discreta)
e quindi sull’asse orizzontale non potrà avere una collocazione arbitraria o convenzionale, ma
sarà rappresenta riportando tanti intervalli quante sono le età considerate e collocando ogni età
lungo l’asse nel punto corrispondente al valore. Sull’asse verticale, invece, verrà conteggiata la
frequenza.
A questo punto si possono adottare due strade:
110
1. l’età viene rappresentata considerando intervalli con ampiezze uguali pari ad 1 anno
2. l’età viene rappresentata con intervalli con ampiezze non uguali, ma come viene
richiesto nella tabella 2, ossia, il primo intervallo comprenderà due anni (dai 18 anni ai
19 compiuti), il secondo intervallo 11 anni (da chi ha 20 anni compiuti fino a chi ne ha
30 compiuti) e così via...
Se si opta per la prima strada, si costruirà un istogramma con classi uguali (grafico 1), se si
adotta la seconda strada si avrà un istogramma con classi di ampiezza diversa (grafico 2).
Si noti, però, come le altezze dei vari istogrammi nei due grafici siano cambiate. Ad esempio,
nel grafico 1 l’altezza dell’istogramma, corrispondente all’intervallo dei 18 anni, è 25 e quello
dei 19 anni di età è 41. Se si va a vedere il grafico 2 l’altezza dell’istogramma corrispondente
all’intervallo 18-19 anni di età è 33, cioè la media delle persone intervistate che hanno 18 e 19
anni. Infatti, a differenza dei diagrammi a barre, quando si va ad osservare un istogramma, non
si deve ragionare in termine di altezze, ma di aree. Se infatti si calcolano le superfici, queste
sono proprio uguali al numero di persone che ricadono in quell’intervallo.
Per capire meglio, si segua questa veloce verifica:
nel grafico 1 l’area del primo istogramma è 25 x 1= 25 che corrisponde proprio
al numero di persone intervistate che hanno 18 anni compiuti. L’area del
secondo istogramma è 41 x 1= 41, che corrisponde proprio al numero di
persone intervistate che hanno 19 anni compiuti.
Nel grafico 2, l’area del primo istogramma è 33 x 2= 66 che corrisponde al
numero totale di persone che hanno 18 o 19 anni compiuti.
Tabella 1: Numero di persone intervistate per età
Età
frequenza
18
25
19
41
20
23
21
45
22
52
23
35
24
16
25
24
26
49
27
27
28
40
29
35
30
24
31
31
32
45
33
39
34
32
35
34
36
24
37
25
38
31
39
27
40
26
totale
750
111
Tabella 2: Numero di persone intervistate per età
età
frequenza
18 - 19
66
20 - 30
370
31 - 35
181
36 - 40
133
totale
750
Grafico 1: Istogramma
N°di persone intervistate suddivisi per età
40
35
densità di frequenza
30
25
20
15
10
5
0
15
16
17
18
19
20
21 22 23 24
25 26
27 28
29 30
31 32
33 34
35 36
37 38 39 40
41 42
età
Grafico 2 Diagramma
N° di per s one inter vis tate s uddivis e per età
55
50
45
n° individui
40
35
30
25
20
15
10
5
0
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
età
112
Diagramma a linee
I diagrammi a linee si usano per rappresentare grandezze continue. Generalmente il caso più
frequente in cui si opta per questo tipo di rappresentazione è quando si deve raffigurare una
serie storica. Sull’asse orizzontale, quindi, si ritroveranno elencati i vari anni (o altre grandezze
temporali, come i giorni, le settimane, i mesi…) e su quello verticale i valori che rappresentano
la misura della grandezza oggetto di studio nei diversi anni.
Esempi classici di entità che si rappresentano con questo tipo di diagramma sono il numero di
popolazione residente in una data area, il numero di imprese operanti, ecc… cioè tutte quelle
grandezze per cui il valore al tempo tn+1 è dato dal valore al tempo tn più la variazione (positiva
o negativa) avvenuta nell’intervallo (tn+1 - tn).
Nel grafico 1 viene rappresentato l’andamento, dal 1984 al 1999, del numero di residenti che
hanno 65 o più anni di età.
Si noti che per comodità si è scelto di far coincidere l’origine con il valore di 100.000.
Grafico 1: Serie storica della popolazione residente a Torino di 65 anni e oltre
200000
190000
180000
170000
160000
150000
140000
130000
120000
110000
100000
1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
I diagrammi a linee sono molto utili per confrontare gli andamenti nel tempo di grandezze
simili. Ad esempio nel grafico 2, le linee rappresenta l’aumento del numero di supermercati,
ipermercati e grandi magazzini in Italia dal 1991 al 1998. Questo diagramma riassume il trend
evolutivo della distribuzione moderna e informa il lettore, in modo chiaro e veloce, che negli
anni ’90 c’è stata un’impennata dei supermercati e una lieve salita degli ipermercati e grandi
magazzini.
113
Grafico 2: Formati della distribuzione moderna in Italia: supermercati, ipermercati, grandi magazzini
(I dati si riferiscono al 31 dicembre di ciascun anno solare)
Fonti: FAID
7000
6000
5000
supermercati
4000
ipermercati
3000
grandi magazzini
2000
1000
0
1991
1992
1993
1994
1995
1996
1997
1998
Una variante al diagramma a linee è costituita dall’adottare una rappresentazione ad area, come
si vede nel grafico 1 bis. Si tratta, in questo caso di una scelta più espositiva che altro. Diventa,
invece, più interessante costruire un diagramma ad aree sovrapposte quando le grandezze
rappresentate possono essere sommate tra di loro e la loro addizione costituisce un’informazione
aggiuntiva. È questo il caso proposto nel grafico 3, dove oltre all’informazione dell’andamento
del numero di maschi e di femmine nella città di Torino si hanno anche informazioni sul trend
della popolazione totale.
Si faccia solo attenzione che la linea che rappresenta il numero di femmine è stata tracciata
sommando i dati di ogni anno a quelli relativi al numero di maschi.
Grafico 1 bis: Serie storica della popolazione residente a Torino di 65 anni e oltre
200000
190000
180000
170000
160000
150000
140000
130000
120000
110000
100000
1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
Grafico 3: Serie storica della popolazione residente a Torino suddivisa per sesso
114
Fonte: Ufficio di Statistica del Comune di Torino
1200
1000
800
600
400
200
0
1998
1996
1992
fem m ine
1994
1990
1988
1986
1984
m aschi
Diagrammi a dispersione
I diagrammi a dispersione vengono generalmente utilizzati per rappresentare due grandezze che
possono essere correlate fra di loro e per individuare eventuali relazioni tra due caratteristiche
diverse di una “popolazione”. Inoltre, si opta per questo tipo di diagramma se le grandezze sono
state misurate utilizzando delle scale metriche (discrete o continue). In questo caso, infatti, due
serie di numeri sono considerati come un’unica serie di coordinate (X,Y) in un sistema di assi
cartesiani.
Per capire meglio le potenzialità di un diagramma a dispersione si vedano gli esempi qui
riportati:
Esempio 1
Il grafico rappresenta un diagramma di dispersione in cui sono riportati l’altezza ed il peso di un
gruppo di 26 ragazzi, a ciascun ragazzo corrisponde un punto P (x,y) nel diagramma cartesiano
che ha come ascissa x l’altezza in cm e come ordinata y il peso in kg dell’individuo preso in
considerazione. Analizzando il grafico ci si può rendere conto di quale sia la relazione tra il
peso e l’altezza nel gruppo in esame. Ipotizzando che le linee rosse rappresentino il limite
inferiore e superiore corrispondente al peso di un individuo “normale” si può immediatamente
verificare quali siano gli individui sovrappeso o sottopeso.
115
Tabella: Peso ed altezza di un gruppo di 26 ragazzi
Fonte: dati inventati
altezza
peso
163
70
165
69
165
69
167
70
167
69
168
65
168
65
168
65
173
78
174
77
174
68
174
68
174
80
175
70
175
75
176
77
176
68
180
80
180
65
182
79
182
79
183
79
186
80
191
81
191
81
192
82
Grafico: Peso ed altezza di un gruppo di 26 ragazzi
Fonte: dati inventati
95
90
Peso(Kg)
85
80
75
70
65
60
55
50
160
165
170
175
180
185
190
195
Altezza (cm )
individui intervistati
limite inferiore normalità
limite superiore normalità
116
Esempio 2
Si vogliono rappresentare i saldi naturali e migratori relativi alle 8 province della tabella 1.
Grazie a questa scelta rappresentativa si nota che la maggior parte delle province si collocano
nel II e IV quadrante. Ciò significa che quasi tutti i territori presi in esame presentano dei saldi
con segni opposti.
Inoltre, grazie a questo tipo di rappresentazione, si possono facilmente individuare – con
riferimento all’esempio - le province che presentano situazioni simili.
Tabella 1: Confronto fra le maggiori province italiane sui dati demografici - anno 1998
I dati sono per 1000 abitanti
Fonte: banca dati Ancitel
Torino
Milano
Venezia
Genova
Bologna
Firenze
Roma
Napoli
Bari
Catania
Palermo
Cagliari
Saldo
Saldo
naturale/ migratorio/ Saldo tot./
tot. abitanti tot. abitanti tot. abitanti
-1,9
0,4
-1,5
-0,7
4,9
4,2
-1,5
0,5
-1
-7,1
-1
-8
-4,7
7,4
2,8
-3,7
2,7
-1
-0,5
2,3
1,8
5,2
-7,1
-2
2,8
-1,4
1,3
2,7
-3,2
-0,4
2,4
-4,5
-2,1
-0,1
-3,7
-3,8
117
Grafico 1: Confronto fra le maggiori province italiane sui dati demografici - anno 1998
9
8
BO
7
6
MI 5
saldo migratorio/tot abitant
4
3
FI
RM
VE
-8
-7
-6
-5
-4
-3
-2
2
1
0
-1 0
-1
1
2
-2
GE
3
4
5
6
BA
-3
-4
CA
CT
-5
-6
PA
-7
NA
-8
saldo naturale/tot. abitanti
Diagramma a torta
Quando si ha una grandezze di cui si conoscono i valori delle sue componenti, si può adottare
un diagramma a torta, per evidenziare le proporzioni tra le sue varie “parti”. In questo modo la
grandezza in questione viene rappresentata sottoforma di cerchio i cui spicchi hanno un angolo
(e di conseguenza, un arco) proporzionale alle varie componenti.
Il diagramma a torta presenta il vantaggio di visualizzare in modo semplice e diretto il peso
delle varie componenti sul fenomeno complessivo.
Per costruire questo tipo di diagramma si possono utilizzare vari programmi. Uno dei più diffusi
è quello Excel. Si faccia, però, attenzione che, in ambiente Excel, il raggio del cerchio della
torta è scelto arbitrariamente e non può assumere alcun significato.
118
Tabella 1: Suddivisione della popolazione della città di Torino per fasce d'età al 1999
N°
0 - 24 anni
183.399
25 - 44 anni
278.472
45 - 64 anni
251.904
oltre 64 anni
189.949
Tot.
903.724
Grafico 1: Suddivisione della popolazione della città di Torino per fasce d'età al 1999
(in valori assoluti)
189.949
183.399
0 - 24 anni
25 - 44 anni
45 - 64 anni
oltre 64 anni
251.904
278.472
Se si è deciso di costruire il diagramma a torta utilizzando Excel, questo tipo di
rappresentazione presenta uno svantaggio: essendo il raggio della torta scelto in modo arbitrario,
non si può effettuare un buon confronto fra grandezze, ad esempio, misurate in momenti diversi.
Se si ha la stessa composizione, in fasce di età, della popolazione torinese anche per il 1995
(tabella 2) la torta che rappresenterebbe questa nuova tabella sarebbe difficilmente paragonabile
con quella del grafico 1. In questo caso è possibile utilizzare il diagramma ad anello (grafico 2),
anche se la scelta migliore rimane quello degli diagrammi a barre sovrapposte. In quest’ultimo
caso, inoltre, si può scegliere se adottare diagrammi a barre che rappresentano i dati in valori
assoluti (grafico 2 bis) o in valori percentuali (grafico 2 tris).
Tabella 1: Suddivisione della popolazione della città di Torino per fasce d'età al 1995 al 1999
1995
1999
0 - 24 anni
209.378
183.399
25 - 44 anni 271.600
278.472
45 - 64 anni 265.195
251.904
oltre 64 anni 176.922
189.949
Tot.
923.095
903.724
119
Grafico 1: Suddivisione della popolazione della città di Torino per fasce d'età al 1995 al 1999
(Diagramma ad anello)
1999
0 - 24 anni
25 - 44 anni
1995
45 - 64 anni
oltre 64 anni
Grafico 1 bis: Suddivisione della popolazione della città di Torino per fasce d'età al 1995 al 1999
(Diagramma a istogrammi sovrapposti, valori assoluti)
1000000
900000
800000
700000
600000
500000
400000
300000
oltre 64 anni
45 - 64 anni
25 - 44 anni
0 - 24 anni
200000
100000
0
1995
1999
Grafico 1 tris: Suddivisione della popolazione della città di Torino per fasce d'età al 1995 al 1999
(Diagramma a barre sovrapposte, valori percentuali)
100%
90%
80%
70%
60%
oltre 64 anni
45 - 64 anni
50%
40%
30%
20%
25 - 44 anni
0 - 24 anni
10%
0%
1995
1999
120
Digrammi a radar
Il diagramma a radar, o più semplicemente, il radar può essere utilizzato quando si vogliono
confrontare più serie di dati relative, ad esempio, a varie classi, oppure se si vogliono
rappresentare la frequenza di risposte diverse, date in un questionario, alla stessa domanda.
Il radar non è altro che un poligono regolare con tanti vertici quante sono le classi.
Se si osserva la tabella 1 e il grafico allegato, il radar in questione è un ettagono perché sono 7
le classi, cioè le aree di provenienza prese in considerazione (Marocco, Perù, ecc.). Ogni raggio,
che collega il centro del poligono con ogni vertice, è da considerare come un asse su cui viene
riportato il valore corrispondente a quella variabile.
Unendo i vari punti sui raggi vengono individuate delle aree che permettono (in modo, a volte,
abbastanza chiaro) anche di effettuare dei confronti sul numero totale di stranieri provenienti
dalle 7 zone: come si può facilmente notare dal 1995 al 2000 questo numero è aumentato.
Tabella 1: Numero di stranieri in Torino suddivisi per alcune aree di provenienza
Fonte: elaborazione dati Ufficio di Statistica del Comune di Torino
1996
2000
Nazione
Tot.
% sul Tot
Nazione
Tot.
% sul Tot
Marocco
5.981
27,1
Marocco
9.148
24,6
Perù
1.212
5,5
Perù
2.727
7,3
Cina Pop.
1.176
5,3
Cina Pop.
1.900
5,1
Filippine
1.007
4,6
Filippine
1.575
4,2
Egitto
855
3,9
Egitto
1.287
3,5
Romania
709
3,2
Romania
4.106
11,0
10,3
U.E.
2.266
U.E.
2.698
7,3
Tot. parziale
13.206
59,9
Tot. parziale
23.441
63,0%
altre nazioni
8.859
40,1
altre nazioni
13.744
37,0%
Tot compl.
22.065
100
Tot compl.
37.185
100
121
Grafico 1: Numero di stranieri in Torino suddivisi per alcune aree di provenienza
Fonte: elaborazione dati Ufficio di Statistica del Comune di Torino
Mar occo
10.000
8.000
U.E.
Per ù
6.000
4.000
2.000
0
Rom ania
Cina Pop.
Egitto
Filippine
1995
2000
Tabella 2: «Rispetto a dieci anni fa, l’offerta di servizi nell’area torinese è…», 2001
Dati espressi in percentuale
Fonte: Indagine l’Eau Vive – Comitato Giorgio Rota
commercio
tempo libero
molto migliorata
20
20
abbastanza migliorata
53
57
invariata
20
19
abbastanza peggiorata
5
3
molto peggiorata
2
1
122
Grafico 2: «Rispetto a dieci anni fa, l’offerta di servizi nell’area torinese è…», 2001
Dati espressi in percentuale
Fonte: Indagine l’Eau Vive – Comitato Giorgio Rota
molto migliorata
60
40
20
molto peggiorata
abbastanza migliorata
0
abbastanza peggiorata
commercio
invariata
tempo libero
Differenze fra diagrammi a linee e a barre
Generalmente si adotta un diagramma a linee quando si vuole rappresentare una serie storica di
una data grandezza. Invece se i dati, di cui si dispone, sono in relazione ad aree o variabili
differenti, e relativi ad un solo anno, necessariamente, si deve adottare un diagramma a barre.
Come si può vedere dall’esempio, se si ha che fare con dei dati come quelli della tabella 1 è
sbagliato voler utilizzare un diagramma a linee. In questo modo si potrebbe indurre il lettore a
immaginare un qualche legame fra i vari indici relativi alle città. Insomma, è improbabile che il
rapporto tra il saldo naturale e il numero di abitanti di Roma sia, in qualche modo, connesso con
lo stesso rapporto della città di Napoli. È molto meglio utilizzare un diagramma a barre che
permette, ad esempio, di notare facilmente che sia Genova che Cagliari sono le uniche province
con tutti i saldi negativi.
123
Tabella 1: Confronto fra le maggiori province italiane sui dati demografici - anno 1998
Torino
Milano
Venezia
Genova
Bologna
Firenze
Roma
Napoli
Bari
Catania
Palermo
Cagliari
Saldo
Saldo
naturale/ migratorio/ Saldo tot./
tot. abitanti tot. abitanti tot. abitanti
-1,9
0,4
-1,5
-0,7
4,9
4,2
-1,5
0,5
-1
-7,1
-1
-8
-4,7
7,4
2,8
-3,7
2,7
-1
-0,5
2,3
1,8
5,2
-7,1
-2
2,8
-1,4
1,3
2,7
-3,2
-0,4
2,4
-4,5
-2,1
-0,1
-3,7
-3,8
SI
10
8
6
4
2
0
M ilano
V enezia
G eno va B o lo gna F irenze
R om a
N apo li
B ari
C atania P alerm o C agliari
-2
-4
-6
-8
-10
Saldo naturale/tot. abitanti
Saldo migratorio/tot. abitanti
Saldo tot./tot. abitanti
124
NO
10
8
6
4
2
0
-2
M ilano
V enezia
G eno va B o lo gna F irenze
R om a
N apo li
B ari
C atania P alerm o C agliari
-4
-6
-8
-10
Saldo naturale/tot. abitanti
Saldo migratorio/tot. abitanti
Saldo tot./tot. abitanti
Può succedere che a volte si abbia difficoltà a scegliere quale sia il diagramma migliore per far
trasparire nel modo più chiaro le informazioni che si vogliono dare. Ad esempio, se si ha dei
valori come quelli nella tabella 2 si possono avere dei problemi: è più giusto utilizzare un
diagramma a barre o uno a linea?
La risposta è: dipende da che cosa si vuole evidenziare.
Se è importante confrontare la quantità di rifiuti prodotti da ogni individuo per le diverse aree è
meglio scegliere un diagramma a barre (grafico 2). Ad esempio, osservando il grafico si può
“leggere” in modo facile e veloce che nel 1997, in media, un cittadino torinese ha prodotto più
rifiuti di tutti.
Se interessa di più individuare il trend di crescita della produzione di rifiuti pro capite, allora è
meglio adottare un diagramma a linee, dove nell’asse orizzontale ci saranno i vari anni e
sull’asse delle ordinate i vari ambiti territoriali (grafico 2 bis). In questo caso si vede come la
crescita dei produzione dei rifiuti pro capite nell’area torinese è in netta salita, mentre, nelle
altre aree, questo andamento è meno rapido.
Si faccia attenzione, inoltre, che nei due grafici gli assi sono stati invertiti!!
125
Tabella 2: Rifiuti solidi complessivi prodotti nell’area torinese, in Piemonte, in Italia, in Europa
(Kg. pro capite annui)
Fonte: Osservatorio provinciale rifiuti, Rapporto annuale
1996
1997
1998
Area torinese (bacino Amiat)
465
485
503
Provincia di TO
427
423
452
435
446
463
453
447
466
Piemonte
Italia
Grafico 2: Rifiuti solidi complessivi prodotti nell’area torinese, in Piemonte, in Italia, in Europa
520
Kg pro-capite annui
500
480
460
440
420
400
380
Area torinese (bacino
Amiat)
Provincia di TO
1996
Piemonte
1997
Italia
1998
Grafico 2 bis: Rifiuti solidi complessivi prodotti nell’area torinese, in Piemonte, in Italia, in Europa
520
500
480
460
440
420
400
380
1996
1997
1998
Area torinese (bacino Amiat)
Provincia di TO
Piemonte
Italia
126
Si ricordi però che quando si ha a che fare con serie storiche più lunghe (cioè comprendenti
parecchi anni) diventa complicato adottare un diagramma a barre: un lettore avrebbe difficoltà a
leggerlo a causa del numero troppo elevato di differenti “rettangolini”. In questo caso è sempre
meglio adottare un diagramma a linee.
Viceversa se la serie storica, ad esempio, è composta da due soli anni è inutile raffigurare i dati
tramite un diagramma a linee perché le rette non darebbero nessuna informazione sul trend. In
questo caso è meglio adottare un diagramma a barre.
127

Rappresentazioni grafiche dei dati

Transcript

Documenti analoghi

QUESTION TIME ALL`INS. AMBROSINI FRANCESCA

Curriculum Vitae

Conoscenze informatiche specializzate: CS5 MAC

Esercitazione sui diagrammi strutturali UML

m CARTOON IN TASCA DENTRO IL DISEGNO

MOUSE PAD - silky.it

Glossario del Project Manager

prova di competenza per la classe seconda valutare le competenze

template USB Amazon IT

I Guru della Qualità