Rappresentazioni grafiche dei dati
Transcript
Rappresentazioni grafiche dei dati
Rappresentazioni grafiche dei dati Una volta raccolti i dati necessari per la propria analisi, si deve scegliere una o più modalità efficaci per evidenziare il valore informativo contenuto nei dati stessi. Una scelta potrebbe esser quella di arricchire il commento dei dati con una serie di tabelle oppure, talvolta, si preferisce “trasformare” i numeri in rappresentazioni grafiche - più o meno semplificate - per rendere più facile la lettura delle informazioni che si sono acquisite nella fase di ricerca. Se si opta per la rappresentazione grafica dei dati si può scegliere fra due casi: rappresentazioni cartografiche diagrammi statistici Rappresentazione cartografica Quando si ha a che fare con dei dati statistici primari o secondari, può essere mostrare la distribuzione spaziale di questi valori. Per far questo si possono adottare le carte tematiche. Ogni carta tematica è caratterizzata da una base cartografica (la rappresentazione ridotta o simbolica di una porzione di superficie terreste, generalmente molto semplificata) e da un tema (la o le variabili rappresentate spazialmente). Per maggiori informazioni o esempi esplicativi si può leggere i seguenti documenti: La rappresentazione cartografia ovvero il linguaggio grafico a cura di Arch. Giovanna Di Meglio e Arch. Antonio Cittadino del LARTU, scaricabile dal sito Estratto delle dispense del Dott. Franco Vico, scaricabile dal sito Diagrammi statistici Spesso, quando si effettua un’indagine i dati raccolti vengono organizzati in tabelle per facilitarne la lettura. Un lettore esperto, osservando la sola tabella, riesce a cogliere tutte le informazioni che si possono trarre da questi valori. Altri lettori, invece, riescono a capire meglio i dati se questi sono rappresentati mediante un diagramma. La rappresentazione grafica dei dati offre, infatti, numerosi vantaggi: Permette di elaborare una sintesi delle informazioni (anche se per realizzarla si devono operare alcune approssimazioni) Il grafico è più facilmente leggibile Si capisce in modo più immediato l’andamento del fenomeno 103 Esempio Se ci si limitasse a leggere i dati nella tabella 1, potrebbe essere difficile comprendere quale sia l’andamento nel tempo degli immigrati ed emigrati. Il semplice scorrere dei dati permetterebbe di osservare che sia il numero di chi ha deciso di spostarsi a Torino sia di chi ha abbandonato la città è diminuito dagli anni ’70 al 2000, ma – probabilmente - ad un occhio non esperto sfuggirebbero altre indicazioni. Analizzando, invece, il diagramma a linee, in modo semplice e veloce, si comprende subito che: Nei primi anni ’70 il saldo migratorio era positivo per poi diminuire e rimanere nel corso degli anni sempre negativo. La “forbice” tra immigrati ed emigrati (che dà un’indicazione dell’entità, in valore assoluto, del saldo migratorio) aumenta vistosamente negli anni ’80 per poi assottigliarsi fino a diventare quasi pari a zero nel decennio successivo. I trend negativi del numero di immigrati ed emigrati non è lineare, ma ci sono dei picchi (ad esempio, i più significativi sembrano essere, per gli immigrati nel 1979 oppure nel 1996; per gli emigrati, nel 1980, nel 1983 e nel 1990). Tabella 1: La serie storica degli immigrati ed emigrati nel comune di Torino, dagli anni ‘70 Fonte: Ufficio di statistica del Comune di Torino anno immigrati emigrati 45.858 47.487 1972 45.024 43.569 1973 35.341 44.957 1974 29.444 38.869 1975 26.361 38.633 1976 25.250 36.685 1977 25.860 35.634 1978 28.847 36.498 1979 23.279 39.711 1980 21.377 35.234 1981 21.202 37.082 1982 20.672 40.639 1983 20.120 35.661 1984 20.408 32.724 1985 19.237 29.577 1986 21.233 29.064 1987 18.826 27.901 1988 17.993 25.189 1989 20.730 28.943 1990 17.084 24.581 1991 15.836 21.881 1992 18.924 23.952 1993 18.208 26.133 1994 17.534 26.201 1995 23.621 24.523 1996 20.876 23.023 1997 20.672 23.176 1998 21.962 25.141 1999 23.343 24.005 2000 104 Grafico 1: La serie storica degli immigrati ed emigrati nel comune di Torino, dagli anni ‘70 Fonte: Ufficio di statistica del Comune di Torino 50.000 45.000 40.000 35.000 30.000 25.000 20.000 15.000 10.000 5.000 immigrati 00 20 98 19 96 19 94 19 92 19 90 19 88 19 86 19 84 19 82 19 80 19 78 19 76 19 74 19 19 72 0 emigrati Qui di seguito, vengono proposti alcuni esempi di diagrammi che, in un’analisi socioeconomica, potrebbe essere utile conoscere ed utilizzare per rappresentare i risultati delle elaborazioni sui dati. Si ricordi che, indipendentemente dal tipo di diagramma scelto, si deve: SEMPRE dare un titolo al grafico SEMPRE riportare la fonte da cui si sono presi i valori devono essere SEMPRE esplicitate le unità di misura o nel titolo o nel grafico stesso (generalmente, lungo gli assi). Se nel diagramma sono rappresentati gli andamenti di grandezze differenti non deve MAI mancare la legenda, in modo che il lettore possa capire a cosa corrisponde quella linea, barra o istogramma. Diagramma a barre I diagrammi a barre sono costituiti da rettangoli (o barre) aventi larghezza arbitraria, ma costante, e altezza proporzionale alla caratteristica che si vuole rappresentare. Normalmente un diagramma a barre presenta sull’asse orizzontale le etichette che identificano le classi in cui è stata suddivisa la “popolazione” oggetto di studio e sull’asse verticale viene conteggiata la caratteristica “contenuta” dalle varie classi. Ad esempio, nel grafico 1, le altezze delle barre sono proporzionali alla densità demografica (cioè al numero di abitanti per Kmq) di ogni circoscrizione del Comune di Torino. Grazie a questa rappresentazione si capisce in modo veloce quale sia il distretto torinese con una concentrazione maggiore o minore di residenti. Si noti, inoltre, come il diagramma è stato costruito mettendo sull’asse orizzontale le classi individuate (in questo caso le circoscrizioni) e sull’asse verticale il valore corrispondente alla densità demografica registrata in ogni zona. 105 In generale, si utilizza questo tipo di diagramma quando si hanno grandezze relative ad entità simili e confrontabili: in questo caso sono le circoscrizioni, ma possono anche essere città differenti, nazioni, ecc. a seconda del tipo di fenomeni si vogliano analizzare. Tabella 1: densità demografica per ogni circoscrizione (al 31 dicembre 2000) Fonte : Elaborazione dati Ufficio di statistica del Comune di Torino Superficie (Kmq) Circoscrizione Popolazione (n°) Densità (n°/Kmq) 1 - Centro, Crocetta 7,006 81.317 11.607 2 - Mirafiori nord, Santa Rita 7,327 106.332 14.512 3 - Pozzo strada, Cenisia, San Paolo 8,623 128.249 14.873 4 - Campidolgio, San Donato, Parella 9,183 94.985 10.344 5 - Le Vallette, Madonna di Campiglio, Borgata Vittoria 15,583 121.228 7.780 6 - Falchera, Regio Parco, Barriera di Milano 25,206 104.168 4.133 7 - Aurora, Vanchiglia, Madonna del Pilone 22,582 87.400 3.870 8 - San Salvario, Borgo Po, Cavoretto 16,597 58.355 3.516 9 - Nizza Millefonti, Mercati generali, Lingotto 6,568 77.304 11.770 10 - Mirafiori sud 11,491 40.478 3.523 Grafico 1: Densità demografica per ogni circoscrizione (al 31 dicembre 2000) Numero di popolazione / Kmq Fonte : Elaborazione dati Ufficio di statistica del Comune di Torino 16000 14000 12000 10000 8000 6000 4000 2000 0 Circ. 1 Circ. 2 Circ. 3 Circ. 4 Circ. 5 Circ. 6 Circ. 7 Circ. 8 Circ. 9 Circ. 10 A volte, per comodità o per scelta espositiva, si opta per diagrammi a barre orizzontali. In questo caso è la base del rettangolo (o della barra) ad essere proporzionale alla grandezza che si sta misurando, mentre sull’asse verticale vengono riportate i nominativi delle varie classi o oggetti “pesati”. Ad esempio, se si devono confrontare la lunghezza di alcuni fiumi (grafico 2), si può adottare questo tipo di diagramma. Nulla vieta, comunque, di utilizzarlo anche in altri casi (grafico 3). 106 Grafico 2: Lunghezza dei maggiori fiumi italiani Fonte: Enciclopedia Europea Garzanti 410 Km Adige 220 Km Piave 241 Km Arno 405 Km Tevere 652 Km Po 0 100 200 300 400 500 600 700 Grafico 4: Valutazioni dei genitori sui servizi dei nidi e delle scuole materne comunali (% di risposte “molto” e “abbastanza” soddisfatti) Fonte: Assessorato sistema educativo, Comune di Torino, indagine 2000 personale coinvolgente personale motivato personale competente personale aggiornato personale interattivo pulizia igiene locali qualità dell'edificio sicurezza locali manutenzione attrezzature esterne parcheggi 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% In certi casi può essere utile rappresentare nello stesso grafico più serie di dati. Nel grafico 5 si vuole evidenziare il confronto tra due diversi contesti territoriali per i quali si hanno informazioni sulle stesse variabili. Invece di costruire cinque diagrammi separati per ogni classe (1 componente, 2 componenti, 3 componenti, 4 componenti, oltre 4 componenti), si possono raggruppare i vari istogrammi in due gruppi relativi uno al Comune di Torino e l’altro all’Italia. In questo tipo di diagramma diventa indispensabile inserire la legenda per far comprendere al lettore a cosa corrispondono i vari colori delle barre. 107 Tabella 5: Nuclei familiari, per numero di componenti nel 1999: confronto Torino-Italia (Valori percentuali) Fonte: Istat Comune di Torino Italia 1 componente 38,4% 21,7% 2 componenti 28,2% 26,1% 3 componenti 19,0% 23,4% 4 componenti 11,9% 21,1% oltre 4 componenti 2,5% 7,9% Grafico 5: Nuclei familiari, per numero di componenti nel 1999: confronto Torino-Italia (Valori percentuali) Fonte: Istat 45% 40% 35% 30% 1 componente 2 componenti 25% 3 componenti 20% 4 componenti oltre 4 componenti 15% 10% 5% 0% Comune di Torino Italia Si possono anche aggiungere ulteriori informazioni, inserendo, per esempio, una linea che rappresenti il valore medio della grandezza in esame, come proposto nel grafico 6; oppure si può scegliere di adottare un diagramma a ideogrammi (grafico 7). In quest’ultimo caso, al posto dei rettangoli, compaiono delle immagini che occupano le stesse superfici e che richiamano l’ambito tematico cui si riferiscono le informazioni. 108 Grafico 6: Numero di divorzi ogni 10.000 famiglie - Anno 1998 Fonte: elaborazione del Sole-24 Ore su dati Istat 30 25 20 15 10 5 0 Torino Milano Venezia Genova Bologna Firenze divorzi Roma Napoli Bari Palermo Catania Cagliari media italiana Grafico 7: Superficie media (in mq) di verde pubblico per ogni circoscrizione della città di Torino – 1995 Fonte Ufficio di Statistica del Comune di Torino Circ. 1 Circ. 2 Circ. 3 Circ. 4 Circ. 5 Circ. 6 Circ. 7 Circ. 8 Circ. 9 Circ. 10 0 500000 1000000 1500000 2000000 2500000 pari a 100.000 mq di verde Si possono costruire anche diagrammi a barre sovrapposte. In questo caso, l’altezza di ogni sezione delle barre sarà proporzionare alle varie caratteristiche che si sono misurate per ogni grandezza o classe. Ad esempio, se si fa riferimento al grafico 8, l’accorgimento adottato permette di avere tre informazioni, per ogni anno considerato: 1. la quantità di rifiuti pro capite che vengono differenziati 2. la quantità di rifiuti pro capite che finiscono direttamente in discarica 3. la quantità totale di rifiuti pro capite prodotta (si ottiene quest’ultima informazione considerando il rettangolo complessivamente, come somma dello due figure parziali) Si faccia però attenzione che i rettangoli gialli, cioè quelli posti in sommità, presentano le basi a livelli differenti. 109 Grafico 8: Produzione di rifiuti a Torino (bacino Amiat) Kg annui pro capite Fonte: AMIAT 600 500 61 79 100 140 136 34 431 424 424 428 419 417 1996 1997 1998 1999 2000 2001 400 300 200 100 0 Kg in discarica annui pro capite Kg differenziati annui pro capite Istogramma I diagrammi a barre rappresentano i dati mediante rettangoli le cui basi (o altezze, nel caso di diagrammi orizzontali) hanno una dimensione costante e, comunque, irrilevante. Ciò dipende dal fatto che essi rappresentano delle classi (ciascuna delle quali è contrassegnata da una “etichetta”) che derivano da una catalogazione dei dati mediante una scala nominale o ordinale. Nel caso in cui si operi una classificazione sulla base di una grandezza misurata con una scale numeriche, le ampiezze delle classi (e quindi degli intervalli sull’asse orizzontale) assumono un significato ben preciso e può essere conveniente considerare classi di ampiezze diverse. In questo caso una rappresentazione della distribuzione di frequenze (n° di individui per ciascuna classe) con un diagramma a barre potrebbe falsare la lettura dei dati. È meglio utilizzare un istogramma che è basato sulle aree delle colonne anziché sulla loro altezza. Per capire meglio, si faccia riferimento all’esempio. Esempio Si sono intervistate 750 persone con età compresa tra i 18 e i 40 anni. Nella tabella 1 vengono riportati il numero di persone contattate suddivise per età (ossia la frequenza con cui si sono intervistate gli individui con la stessa data anagrafica). In questo caso l’età è una grandezza che è stata misurata utilizzando una scala metrica (discreta) e quindi sull’asse orizzontale non potrà avere una collocazione arbitraria o convenzionale, ma sarà rappresenta riportando tanti intervalli quante sono le età considerate e collocando ogni età lungo l’asse nel punto corrispondente al valore. Sull’asse verticale, invece, verrà conteggiata la frequenza. A questo punto si possono adottare due strade: 110 1. l’età viene rappresentata considerando intervalli con ampiezze uguali pari ad 1 anno 2. l’età viene rappresentata con intervalli con ampiezze non uguali, ma come viene richiesto nella tabella 2, ossia, il primo intervallo comprenderà due anni (dai 18 anni ai 19 compiuti), il secondo intervallo 11 anni (da chi ha 20 anni compiuti fino a chi ne ha 30 compiuti) e così via... Se si opta per la prima strada, si costruirà un istogramma con classi uguali (grafico 1), se si adotta la seconda strada si avrà un istogramma con classi di ampiezza diversa (grafico 2). Si noti, però, come le altezze dei vari istogrammi nei due grafici siano cambiate. Ad esempio, nel grafico 1 l’altezza dell’istogramma, corrispondente all’intervallo dei 18 anni, è 25 e quello dei 19 anni di età è 41. Se si va a vedere il grafico 2 l’altezza dell’istogramma corrispondente all’intervallo 18-19 anni di età è 33, cioè la media delle persone intervistate che hanno 18 e 19 anni. Infatti, a differenza dei diagrammi a barre, quando si va ad osservare un istogramma, non si deve ragionare in termine di altezze, ma di aree. Se infatti si calcolano le superfici, queste sono proprio uguali al numero di persone che ricadono in quell’intervallo. Per capire meglio, si segua questa veloce verifica: nel grafico 1 l’area del primo istogramma è 25 x 1= 25 che corrisponde proprio al numero di persone intervistate che hanno 18 anni compiuti. L’area del secondo istogramma è 41 x 1= 41, che corrisponde proprio al numero di persone intervistate che hanno 19 anni compiuti. Nel grafico 2, l’area del primo istogramma è 33 x 2= 66 che corrisponde al numero totale di persone che hanno 18 o 19 anni compiuti. Tabella 1: Numero di persone intervistate per età Età frequenza 18 25 19 41 20 23 21 45 22 52 23 35 24 16 25 24 26 49 27 27 28 40 29 35 30 24 31 31 32 45 33 39 34 32 35 34 36 24 37 25 38 31 39 27 40 26 totale 750 111 Tabella 2: Numero di persone intervistate per età età frequenza 18 - 19 66 20 - 30 370 31 - 35 181 36 - 40 133 totale 750 Grafico 1: Istogramma N°di persone intervistate suddivisi per età 40 35 densità di frequenza 30 25 20 15 10 5 0 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 età Grafico 2 Diagramma N° di per s one inter vis tate s uddivis e per età 55 50 45 n° individui 40 35 30 25 20 15 10 5 0 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 età 112 Diagramma a linee I diagrammi a linee si usano per rappresentare grandezze continue. Generalmente il caso più frequente in cui si opta per questo tipo di rappresentazione è quando si deve raffigurare una serie storica. Sull’asse orizzontale, quindi, si ritroveranno elencati i vari anni (o altre grandezze temporali, come i giorni, le settimane, i mesi…) e su quello verticale i valori che rappresentano la misura della grandezza oggetto di studio nei diversi anni. Esempi classici di entità che si rappresentano con questo tipo di diagramma sono il numero di popolazione residente in una data area, il numero di imprese operanti, ecc… cioè tutte quelle grandezze per cui il valore al tempo tn+1 è dato dal valore al tempo tn più la variazione (positiva o negativa) avvenuta nell’intervallo (tn+1 - tn). Nel grafico 1 viene rappresentato l’andamento, dal 1984 al 1999, del numero di residenti che hanno 65 o più anni di età. Si noti che per comodità si è scelto di far coincidere l’origine con il valore di 100.000. Grafico 1: Serie storica della popolazione residente a Torino di 65 anni e oltre Fonte: Ufficio di statistica del Comune di Torino 200000 190000 180000 170000 160000 150000 140000 130000 120000 110000 100000 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 I diagrammi a linee sono molto utili per confrontare gli andamenti nel tempo di grandezze simili. Ad esempio nel grafico 2, le linee rappresenta l’aumento del numero di supermercati, ipermercati e grandi magazzini in Italia dal 1991 al 1998. Questo diagramma riassume il trend evolutivo della distribuzione moderna e informa il lettore, in modo chiaro e veloce, che negli anni ’90 c’è stata un’impennata dei supermercati e una lieve salita degli ipermercati e grandi magazzini. 113 Grafico 2: Formati della distribuzione moderna in Italia: supermercati, ipermercati, grandi magazzini (I dati si riferiscono al 31 dicembre di ciascun anno solare) Fonti: FAID 7000 6000 5000 supermercati 4000 ipermercati 3000 grandi magazzini 2000 1000 0 1991 1992 1993 1994 1995 1996 1997 1998 Una variante al diagramma a linee è costituita dall’adottare una rappresentazione ad area, come si vede nel grafico 1 bis. Si tratta, in questo caso di una scelta più espositiva che altro. Diventa, invece, più interessante costruire un diagramma ad aree sovrapposte quando le grandezze rappresentate possono essere sommate tra di loro e la loro addizione costituisce un’informazione aggiuntiva. È questo il caso proposto nel grafico 3, dove oltre all’informazione dell’andamento del numero di maschi e di femmine nella città di Torino si hanno anche informazioni sul trend della popolazione totale. Si faccia solo attenzione che la linea che rappresenta il numero di femmine è stata tracciata sommando i dati di ogni anno a quelli relativi al numero di maschi. Grafico 1 bis: Serie storica della popolazione residente a Torino di 65 anni e oltre Fonte: Ufficio di statistica del Comune di Torino 200000 190000 180000 170000 160000 150000 140000 130000 120000 110000 100000 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 Grafico 3: Serie storica della popolazione residente a Torino suddivisa per sesso 114 Fonte: Ufficio di Statistica del Comune di Torino 1200 1000 800 600 400 200 0 1998 1996 1992 fem m ine 1994 1990 1988 1986 1984 m aschi Diagrammi a dispersione I diagrammi a dispersione vengono generalmente utilizzati per rappresentare due grandezze che possono essere correlate fra di loro e per individuare eventuali relazioni tra due caratteristiche diverse di una “popolazione”. Inoltre, si opta per questo tipo di diagramma se le grandezze sono state misurate utilizzando delle scale metriche (discrete o continue). In questo caso, infatti, due serie di numeri sono considerati come un’unica serie di coordinate (X,Y) in un sistema di assi cartesiani. Per capire meglio le potenzialità di un diagramma a dispersione si vedano gli esempi qui riportati: Esempio 1 Il grafico rappresenta un diagramma di dispersione in cui sono riportati l’altezza ed il peso di un gruppo di 26 ragazzi, a ciascun ragazzo corrisponde un punto P (x,y) nel diagramma cartesiano che ha come ascissa x l’altezza in cm e come ordinata y il peso in kg dell’individuo preso in considerazione. Analizzando il grafico ci si può rendere conto di quale sia la relazione tra il peso e l’altezza nel gruppo in esame. Ipotizzando che le linee rosse rappresentino il limite inferiore e superiore corrispondente al peso di un individuo “normale” si può immediatamente verificare quali siano gli individui sovrappeso o sottopeso. 115 Tabella: Peso ed altezza di un gruppo di 26 ragazzi Fonte: dati inventati altezza peso 163 70 165 69 165 69 167 70 167 69 168 65 168 65 168 65 173 78 174 77 174 68 174 68 174 80 175 70 175 75 176 77 176 68 180 80 180 65 182 79 182 79 183 79 186 80 191 81 191 81 192 82 Grafico: Peso ed altezza di un gruppo di 26 ragazzi Fonte: dati inventati 95 90 Peso(Kg) 85 80 75 70 65 60 55 50 160 165 170 175 180 185 190 195 Altezza (cm ) individui intervistati limite inferiore normalità limite superiore normalità 116 Esempio 2 Si vogliono rappresentare i saldi naturali e migratori relativi alle 8 province della tabella 1. Grazie a questa scelta rappresentativa si nota che la maggior parte delle province si collocano nel II e IV quadrante. Ciò significa che quasi tutti i territori presi in esame presentano dei saldi con segni opposti. Inoltre, grazie a questo tipo di rappresentazione, si possono facilmente individuare – con riferimento all’esempio - le province che presentano situazioni simili. Tabella 1: Confronto fra le maggiori province italiane sui dati demografici - anno 1998 I dati sono per 1000 abitanti Fonte: banca dati Ancitel Torino Milano Venezia Genova Bologna Firenze Roma Napoli Bari Catania Palermo Cagliari Saldo Saldo naturale/ migratorio/ Saldo tot./ tot. abitanti tot. abitanti tot. abitanti -1,9 0,4 -1,5 -0,7 4,9 4,2 -1,5 0,5 -1 -7,1 -1 -8 -4,7 7,4 2,8 -3,7 2,7 -1 -0,5 2,3 1,8 5,2 -7,1 -2 2,8 -1,4 1,3 2,7 -3,2 -0,4 2,4 -4,5 -2,1 -0,1 -3,7 -3,8 117 Grafico 1: Confronto fra le maggiori province italiane sui dati demografici - anno 1998 I dati sono per 1000 abitanti Fonte: banca dati Ancitel 9 8 BO 7 6 MI 5 saldo migratorio/tot abitant 4 3 FI RM VE -8 -7 -6 -5 -4 -3 -2 2 1 0 -1 0 -1 1 2 -2 GE 3 4 5 6 BA -3 -4 CA CT -5 -6 PA -7 NA -8 saldo naturale/tot. abitanti Diagramma a torta Quando si ha una grandezze di cui si conoscono i valori delle sue componenti, si può adottare un diagramma a torta, per evidenziare le proporzioni tra le sue varie “parti”. In questo modo la grandezza in questione viene rappresentata sottoforma di cerchio i cui spicchi hanno un angolo (e di conseguenza, un arco) proporzionale alle varie componenti. Il diagramma a torta presenta il vantaggio di visualizzare in modo semplice e diretto il peso delle varie componenti sul fenomeno complessivo. Per costruire questo tipo di diagramma si possono utilizzare vari programmi. Uno dei più diffusi è quello Excel. Si faccia, però, attenzione che, in ambiente Excel, il raggio del cerchio della torta è scelto arbitrariamente e non può assumere alcun significato. 118 Tabella 1: Suddivisione della popolazione della città di Torino per fasce d'età al 1999 Fonte: Ufficio di Statistica del Comune di Torino N° 0 - 24 anni 183.399 25 - 44 anni 278.472 45 - 64 anni 251.904 oltre 64 anni 189.949 Tot. 903.724 Grafico 1: Suddivisione della popolazione della città di Torino per fasce d'età al 1999 (in valori assoluti) Fonte: Ufficio di Statistica del Comune di Torino 189.949 183.399 0 - 24 anni 25 - 44 anni 45 - 64 anni oltre 64 anni 251.904 278.472 Se si è deciso di costruire il diagramma a torta utilizzando Excel, questo tipo di rappresentazione presenta uno svantaggio: essendo il raggio della torta scelto in modo arbitrario, non si può effettuare un buon confronto fra grandezze, ad esempio, misurate in momenti diversi. Se si ha la stessa composizione, in fasce di età, della popolazione torinese anche per il 1995 (tabella 2) la torta che rappresenterebbe questa nuova tabella sarebbe difficilmente paragonabile con quella del grafico 1. In questo caso è possibile utilizzare il diagramma ad anello (grafico 2), anche se la scelta migliore rimane quello degli diagrammi a barre sovrapposte. In quest’ultimo caso, inoltre, si può scegliere se adottare diagrammi a barre che rappresentano i dati in valori assoluti (grafico 2 bis) o in valori percentuali (grafico 2 tris). Tabella 1: Suddivisione della popolazione della città di Torino per fasce d'età al 1995 al 1999 Fonte: Ufficio di Statistica del Comune di Torino 1995 1999 0 - 24 anni 209.378 183.399 25 - 44 anni 271.600 278.472 45 - 64 anni 265.195 251.904 oltre 64 anni 176.922 189.949 Tot. 923.095 903.724 119 Grafico 1: Suddivisione della popolazione della città di Torino per fasce d'età al 1995 al 1999 (Diagramma ad anello) Fonte: Ufficio di Statistica del Comune di Torino 1999 0 - 24 anni 25 - 44 anni 1995 45 - 64 anni oltre 64 anni Grafico 1 bis: Suddivisione della popolazione della città di Torino per fasce d'età al 1995 al 1999 (Diagramma a istogrammi sovrapposti, valori assoluti) Fonte: Ufficio di Statistica del Comune di Torino 1000000 900000 800000 700000 600000 500000 400000 300000 oltre 64 anni 45 - 64 anni 25 - 44 anni 0 - 24 anni 200000 100000 0 1995 1999 Grafico 1 tris: Suddivisione della popolazione della città di Torino per fasce d'età al 1995 al 1999 (Diagramma a barre sovrapposte, valori percentuali) Fonte: Ufficio di Statistica del Comune di Torino 100% 90% 80% 70% 60% oltre 64 anni 45 - 64 anni 50% 40% 30% 20% 25 - 44 anni 0 - 24 anni 10% 0% 1995 1999 120 Digrammi a radar Il diagramma a radar, o più semplicemente, il radar può essere utilizzato quando si vogliono confrontare più serie di dati relative, ad esempio, a varie classi, oppure se si vogliono rappresentare la frequenza di risposte diverse, date in un questionario, alla stessa domanda. Il radar non è altro che un poligono regolare con tanti vertici quante sono le classi. Se si osserva la tabella 1 e il grafico allegato, il radar in questione è un ettagono perché sono 7 le classi, cioè le aree di provenienza prese in considerazione (Marocco, Perù, ecc.). Ogni raggio, che collega il centro del poligono con ogni vertice, è da considerare come un asse su cui viene riportato il valore corrispondente a quella variabile. Unendo i vari punti sui raggi vengono individuate delle aree che permettono (in modo, a volte, abbastanza chiaro) anche di effettuare dei confronti sul numero totale di stranieri provenienti dalle 7 zone: come si può facilmente notare dal 1995 al 2000 questo numero è aumentato. Tabella 1: Numero di stranieri in Torino suddivisi per alcune aree di provenienza Fonte: elaborazione dati Ufficio di Statistica del Comune di Torino 1996 2000 Nazione Tot. % sul Tot Nazione Tot. % sul Tot Marocco 5.981 27,1 Marocco 9.148 24,6 Perù 1.212 5,5 Perù 2.727 7,3 Cina Pop. 1.176 5,3 Cina Pop. 1.900 5,1 Filippine 1.007 4,6 Filippine 1.575 4,2 Egitto 855 3,9 Egitto 1.287 3,5 Romania 709 3,2 Romania 4.106 11,0 10,3 U.E. 2.266 U.E. 2.698 7,3 Tot. parziale 13.206 59,9 Tot. parziale 23.441 63,0% altre nazioni 8.859 40,1 altre nazioni 13.744 37,0% Tot compl. 22.065 100 Tot compl. 37.185 100 121 Grafico 1: Numero di stranieri in Torino suddivisi per alcune aree di provenienza Fonte: elaborazione dati Ufficio di Statistica del Comune di Torino Mar occo 10.000 8.000 U.E. Per ù 6.000 4.000 2.000 0 Rom ania Cina Pop. Egitto Filippine 1995 2000 Tabella 2: «Rispetto a dieci anni fa, l’offerta di servizi nell’area torinese è…», 2001 Dati espressi in percentuale Fonte: Indagine l’Eau Vive – Comitato Giorgio Rota commercio tempo libero molto migliorata 20 20 abbastanza migliorata 53 57 invariata 20 19 abbastanza peggiorata 5 3 molto peggiorata 2 1 122 Grafico 2: «Rispetto a dieci anni fa, l’offerta di servizi nell’area torinese è…», 2001 Dati espressi in percentuale Fonte: Indagine l’Eau Vive – Comitato Giorgio Rota molto migliorata 60 40 20 molto peggiorata abbastanza migliorata 0 abbastanza peggiorata commercio invariata tempo libero Differenze fra diagrammi a linee e a barre Generalmente si adotta un diagramma a linee quando si vuole rappresentare una serie storica di una data grandezza. Invece se i dati, di cui si dispone, sono in relazione ad aree o variabili differenti, e relativi ad un solo anno, necessariamente, si deve adottare un diagramma a barre. Come si può vedere dall’esempio, se si ha che fare con dei dati come quelli della tabella 1 è sbagliato voler utilizzare un diagramma a linee. In questo modo si potrebbe indurre il lettore a immaginare un qualche legame fra i vari indici relativi alle città. Insomma, è improbabile che il rapporto tra il saldo naturale e il numero di abitanti di Roma sia, in qualche modo, connesso con lo stesso rapporto della città di Napoli. È molto meglio utilizzare un diagramma a barre che permette, ad esempio, di notare facilmente che sia Genova che Cagliari sono le uniche province con tutti i saldi negativi. 123 Tabella 1: Confronto fra le maggiori province italiane sui dati demografici - anno 1998 I dati sono per 1000 abitanti Fonte: banca dati Ancitel Torino Milano Venezia Genova Bologna Firenze Roma Napoli Bari Catania Palermo Cagliari Saldo Saldo naturale/ migratorio/ Saldo tot./ tot. abitanti tot. abitanti tot. abitanti -1,9 0,4 -1,5 -0,7 4,9 4,2 -1,5 0,5 -1 -7,1 -1 -8 -4,7 7,4 2,8 -3,7 2,7 -1 -0,5 2,3 1,8 5,2 -7,1 -2 2,8 -1,4 1,3 2,7 -3,2 -0,4 2,4 -4,5 -2,1 -0,1 -3,7 -3,8 SI Grafico 1: Confronto fra le maggiori province italiane sui dati demografici - anno 1998 I dati sono per 1000 abitanti Fonte: banca dati Ancitel 10 8 6 4 2 0 M ilano V enezia G eno va B o lo gna F irenze R om a N apo li B ari C atania P alerm o C agliari -2 -4 -6 -8 -10 Saldo naturale/tot. abitanti Saldo migratorio/tot. abitanti Saldo tot./tot. abitanti 124 NO Grafico 1: Confronto fra le maggiori province italiane sui dati demografici - anno 1998 I dati sono per 1000 abitanti Fonte: banca dati Ancitel 10 8 6 4 2 0 -2 M ilano V enezia G eno va B o lo gna F irenze R om a N apo li B ari C atania P alerm o C agliari -4 -6 -8 -10 Saldo naturale/tot. abitanti Saldo migratorio/tot. abitanti Saldo tot./tot. abitanti Può succedere che a volte si abbia difficoltà a scegliere quale sia il diagramma migliore per far trasparire nel modo più chiaro le informazioni che si vogliono dare. Ad esempio, se si ha dei valori come quelli nella tabella 2 si possono avere dei problemi: è più giusto utilizzare un diagramma a barre o uno a linea? La risposta è: dipende da che cosa si vuole evidenziare. Se è importante confrontare la quantità di rifiuti prodotti da ogni individuo per le diverse aree è meglio scegliere un diagramma a barre (grafico 2). Ad esempio, osservando il grafico si può “leggere” in modo facile e veloce che nel 1997, in media, un cittadino torinese ha prodotto più rifiuti di tutti. Se interessa di più individuare il trend di crescita della produzione di rifiuti pro capite, allora è meglio adottare un diagramma a linee, dove nell’asse orizzontale ci saranno i vari anni e sull’asse delle ordinate i vari ambiti territoriali (grafico 2 bis). In questo caso si vede come la crescita dei produzione dei rifiuti pro capite nell’area torinese è in netta salita, mentre, nelle altre aree, questo andamento è meno rapido. Si faccia attenzione, inoltre, che nei due grafici gli assi sono stati invertiti!! 125 Tabella 2: Rifiuti solidi complessivi prodotti nell’area torinese, in Piemonte, in Italia, in Europa (Kg. pro capite annui) Fonte: Osservatorio provinciale rifiuti, Rapporto annuale 1996 1997 1998 Area torinese (bacino Amiat) 465 485 503 Provincia di TO 427 423 452 435 446 463 453 447 466 Piemonte Italia Grafico 2: Rifiuti solidi complessivi prodotti nell’area torinese, in Piemonte, in Italia, in Europa (Kg. pro capite annui) Fonte: Osservatorio provinciale rifiuti, Rapporto annuale 520 Kg pro-capite annui 500 480 460 440 420 400 380 Area torinese (bacino Amiat) Provincia di TO 1996 Piemonte 1997 Italia 1998 Grafico 2 bis: Rifiuti solidi complessivi prodotti nell’area torinese, in Piemonte, in Italia, in Europa (Kg. pro capite annui) Fonte: Osservatorio provinciale rifiuti, Rapporto annuale 520 500 480 460 440 420 400 380 1996 1997 1998 Area torinese (bacino Amiat) Provincia di TO Piemonte Italia 126 Si ricordi però che quando si ha a che fare con serie storiche più lunghe (cioè comprendenti parecchi anni) diventa complicato adottare un diagramma a barre: un lettore avrebbe difficoltà a leggerlo a causa del numero troppo elevato di differenti “rettangolini”. In questo caso è sempre meglio adottare un diagramma a linee. Viceversa se la serie storica, ad esempio, è composta da due soli anni è inutile raffigurare i dati tramite un diagramma a linee perché le rette non darebbero nessuna informazione sul trend. In questo caso è meglio adottare un diagramma a barre. 127