Lezione 5

Transcript

Lezione 5
Statistica
Le rappresentazioni grafiche
Introduzione
Le rappresentazioni grafiche costituiscono uno dei
mezzi più efficaci, sia per descrivere in forma
visiva i risultati di numerose osservazioni
riguardanti una o più caratteristiche di un
collettivo statistico, sia per scoprire relazioni e
connessioni tra queste caratteristiche o tra le
variazioni nel tempo e nello spazio dei fenomeni
rilevati.
I vantaggi delle rappresentazioni grafiche sono
fornire una visione sintetica ed essere di
facilmente interpretabili.
Principali tipi di
rappresentazioni grafiche
Grafici a barre (caratteri qualitativi ordinati,caratteri quantitativi
discreti)
Grafici a nastri (caratteri qualitativi non ordinati)
Grafici ad aree (caratteri quantitativi continui nel Tempo)
Istogrammi (caratteri quantitativi continui) suddivisi in classi
Grafici a torta caratteri qualitativi non ordinati o ordinati ciclici)
Grafici radar (caratteri ciclici)
Cartogrammi (serie territoriali)
Ideogrammi (caratteri qualitativi e quantitativi)
Diagrammi cartesiani (serie temporali)
Grafici a barre
Nei diagrammi a barre e a nastri (ortogrammi) ogni frequenza o intensità della
distribuzione viene rappresentata da una barra o da un nastro in modo da ottenere
una successione di rettangoli con la stessa base (o altezza) e le altezza (o le basi)
proporzionali alle frequenze o quantità.
Quando il carattere è qualitativo ordinato o quantitativo, e preferibile utilizzare il grafico a
barre poiché le barre poste sull’asse orizzontale
permettono di cogliere meglio l’ordinamento delle modalità.
Esempio: distribuzione per titolo di studio di 59 clienti di un hotel
14
12
Maschi
Scuola media inferiore
Scuola media superiore
Laurea
Dottorato/master
5
12
11
9
Femmine
9
3
4
6
10
8
Maschi
6
Femmine
4
2
0
Scuola media
inferiore
Scuola media
superiore
Laurea
Dottorato/master
Diagrammi a torta
Si usano in presenza di distribuzioni delle freq. Relative percentuali di una variabile
suddivisa in classi.
Evidenziano come sono distribuite le singole parti, rispetto all’intero: la torta ( cerchio)
rappresenta l’intero fenomeno ed i
componenti (fette, spicchi) sono rappresentati dai settori.
Gli angoli (α) devono essere proporzionali alle percentuali (x)
α: 360 = x : 100
Frequenza assoluta
Località
Frequenza assoluta
Varadero
20
Pinar del Rio
16
Camaguey
18
Totale
54
19%
Varadero
Pinar del Rio
49%
15%
Camaguey
Totale
17%
Cartogrammi
Si utilizzano per rappresentare le serie
territoriali.
Hanno come base una mappa sulla quale
sono visibili i contorni delle aree
geografiche o territoriali rispetto alle
quali vengono analizzate le frequenze o
le intensità di un carattere ad es.
popolazione residente, i nati, l’età
media.
Diagrammi Cartesiani
Si utilizzano per rappresentare le serie storiche, soprattutto più serie congiuntamente.
È un grafico costituito da una serie di punti individuati su un piano cartesiano, in cui
sull’asse delle ascisse è posto il tempo e su quello delle
ordinate il carattere osservato. I punti tracciati sul piano vengono uniti da segmenti che
nel loro insieme costituiscono una spezzata che rappresenta
l’andamento del fenomeno.
Arrivi s trutture ric ettive: C ampania
3.000.000
2.500.000
2.000.000
TOTA L E Italiani A rrivi
1.500.000
TOTA L E S tranieri
1.000.000
500.000
0
2002
2003
2004
2005
2006
2007
Istogramma
È utilizzato quanto la distribuzione si riferisce ad un
carattere
quantitativo continuo. In un sistema di assi cartesiani
è composto da una serie di rettangoli che hanno
come base l’ampiezza delle varie classi in cui è
stata ripartita la variabile d’interesse, e come altezza
le frequenze (assolute, relative semplici o
percentuali).
Le basi dei rettangoli sono uguali; di conseguenza, le
altezze sono proporzionali alle frequenze. È
indifferente ragionare in termini di altezze o di aree
di ogni rettangolo.
Grafico radar
In un grafico a radar, detto anche grafico a ragnatela o a stella per via dell'aspetto, i
valori di ogni categoria vengono tracciati lungo un asse distinto che si dirama dal
centro del grafico verso l'anello esterno.
Grafici ad aree
In un grafico ad area le serie vengono visualizzate come un set di punti
collegati da una linea, con tutta l'area riempita sotto la linea.
Nella figura seguente è illustrato un esempio di grafico ad area in pila. I dati
sono particolarmente adatti per un grafico ad area in pila, in quanto è
possibile visualizzare i totali per tutte le serie oltre alla percentuale di ogni
serie rispetto al totale.
Diagramma di dispersione
Il diagramma di dispersione (scatter plot) è uno strumento basilare per lo studio delle distribuzioni numeriche bivariate.
Siano (x1, y1), ..., (xn, yn) le coppie di dati ottenute dalla rilevazione delle variabili numeriche X, Y. Il diagramma di
dispersione è un grafico cartesiano formato dai punti P1 = (x1, y1), ..., Pn = (xn, yn).
Le proprietà statistiche della distribuzione si deducono da caratteristiche della nuvola di punti quali posizione, coesione
interna, orientamento, presenza di punti isolati.
L’altezza dei figli è legata a quella del padre?
Altezza padre
220
210
200
190
Altezza padre
180
170
160
150
140
140
160
180
200
220
bibliografia
z
z
http://ww2.unime.it/chir_gen/master/didattica/statistica/3Rappresentazionigrafiche.pdf
http://technet.microsoft.com/it-it/library/ms159211.aspx