Lezione 5
Transcript
Lezione 5
Statistica Le rappresentazioni grafiche Introduzione Le rappresentazioni grafiche costituiscono uno dei mezzi più efficaci, sia per descrivere in forma visiva i risultati di numerose osservazioni riguardanti una o più caratteristiche di un collettivo statistico, sia per scoprire relazioni e connessioni tra queste caratteristiche o tra le variazioni nel tempo e nello spazio dei fenomeni rilevati. I vantaggi delle rappresentazioni grafiche sono fornire una visione sintetica ed essere di facilmente interpretabili. Principali tipi di rappresentazioni grafiche Grafici a barre (caratteri qualitativi ordinati,caratteri quantitativi discreti) Grafici a nastri (caratteri qualitativi non ordinati) Grafici ad aree (caratteri quantitativi continui nel Tempo) Istogrammi (caratteri quantitativi continui) suddivisi in classi Grafici a torta caratteri qualitativi non ordinati o ordinati ciclici) Grafici radar (caratteri ciclici) Cartogrammi (serie territoriali) Ideogrammi (caratteri qualitativi e quantitativi) Diagrammi cartesiani (serie temporali) Grafici a barre Nei diagrammi a barre e a nastri (ortogrammi) ogni frequenza o intensità della distribuzione viene rappresentata da una barra o da un nastro in modo da ottenere una successione di rettangoli con la stessa base (o altezza) e le altezza (o le basi) proporzionali alle frequenze o quantità. Quando il carattere è qualitativo ordinato o quantitativo, e preferibile utilizzare il grafico a barre poiché le barre poste sull’asse orizzontale permettono di cogliere meglio l’ordinamento delle modalità. Esempio: distribuzione per titolo di studio di 59 clienti di un hotel 14 12 Maschi Scuola media inferiore Scuola media superiore Laurea Dottorato/master 5 12 11 9 Femmine 9 3 4 6 10 8 Maschi 6 Femmine 4 2 0 Scuola media inferiore Scuola media superiore Laurea Dottorato/master Diagrammi a torta Si usano in presenza di distribuzioni delle freq. Relative percentuali di una variabile suddivisa in classi. Evidenziano come sono distribuite le singole parti, rispetto all’intero: la torta ( cerchio) rappresenta l’intero fenomeno ed i componenti (fette, spicchi) sono rappresentati dai settori. Gli angoli (α) devono essere proporzionali alle percentuali (x) α: 360 = x : 100 Frequenza assoluta Località Frequenza assoluta Varadero 20 Pinar del Rio 16 Camaguey 18 Totale 54 19% Varadero Pinar del Rio 49% 15% Camaguey Totale 17% Cartogrammi Si utilizzano per rappresentare le serie territoriali. Hanno come base una mappa sulla quale sono visibili i contorni delle aree geografiche o territoriali rispetto alle quali vengono analizzate le frequenze o le intensità di un carattere ad es. popolazione residente, i nati, l’età media. Diagrammi Cartesiani Si utilizzano per rappresentare le serie storiche, soprattutto più serie congiuntamente. È un grafico costituito da una serie di punti individuati su un piano cartesiano, in cui sull’asse delle ascisse è posto il tempo e su quello delle ordinate il carattere osservato. I punti tracciati sul piano vengono uniti da segmenti che nel loro insieme costituiscono una spezzata che rappresenta l’andamento del fenomeno. Arrivi s trutture ric ettive: C ampania 3.000.000 2.500.000 2.000.000 TOTA L E Italiani A rrivi 1.500.000 TOTA L E S tranieri 1.000.000 500.000 0 2002 2003 2004 2005 2006 2007 Istogramma È utilizzato quanto la distribuzione si riferisce ad un carattere quantitativo continuo. In un sistema di assi cartesiani è composto da una serie di rettangoli che hanno come base l’ampiezza delle varie classi in cui è stata ripartita la variabile d’interesse, e come altezza le frequenze (assolute, relative semplici o percentuali). Le basi dei rettangoli sono uguali; di conseguenza, le altezze sono proporzionali alle frequenze. È indifferente ragionare in termini di altezze o di aree di ogni rettangolo. Grafico radar In un grafico a radar, detto anche grafico a ragnatela o a stella per via dell'aspetto, i valori di ogni categoria vengono tracciati lungo un asse distinto che si dirama dal centro del grafico verso l'anello esterno. Grafici ad aree In un grafico ad area le serie vengono visualizzate come un set di punti collegati da una linea, con tutta l'area riempita sotto la linea. Nella figura seguente è illustrato un esempio di grafico ad area in pila. I dati sono particolarmente adatti per un grafico ad area in pila, in quanto è possibile visualizzare i totali per tutte le serie oltre alla percentuale di ogni serie rispetto al totale. Diagramma di dispersione Il diagramma di dispersione (scatter plot) è uno strumento basilare per lo studio delle distribuzioni numeriche bivariate. Siano (x1, y1), ..., (xn, yn) le coppie di dati ottenute dalla rilevazione delle variabili numeriche X, Y. Il diagramma di dispersione è un grafico cartesiano formato dai punti P1 = (x1, y1), ..., Pn = (xn, yn). Le proprietà statistiche della distribuzione si deducono da caratteristiche della nuvola di punti quali posizione, coesione interna, orientamento, presenza di punti isolati. L’altezza dei figli è legata a quella del padre? Altezza padre 220 210 200 190 Altezza padre 180 170 160 150 140 140 160 180 200 220 bibliografia z z http://ww2.unime.it/chir_gen/master/didattica/statistica/3Rappresentazionigrafiche.pdf http://technet.microsoft.com/it-it/library/ms159211.aspx