Corso di Laurea INTERFACOLTÀ - Esercitazione di Statistica n° 1
Transcript
Corso di Laurea INTERFACOLTÀ - Esercitazione di Statistica n° 1
Corso di Laurea INTERFACOLTÀ - Esercitazione di Statistica n° 1 ESERCIZIO 1: Con riferimento ai dati riportati nella seguente tabella, indicare la tipologia dei caratteri rilevati. ESERCIZIO 1 – Soluzione: 1. Carattere qualitativo sconnesso 2. Carattere qualitativo sconnesso 3. Carattere qualitativo ordinato o rettilineo 4. Carattere quantitativo discreto, scala rapporti 5. Carattere quantitativo continuo, scala rapporti 6. Carattere quantitativo continuo, scala rapporti ESERCIZIO 2: Stabilire a quale tipologia di carattere appartengono le seguenti variabili: 1. sesso di un individuo 2. colore degli occhi di un individuo 3. posizione in graduatoria del candidato 4. provincia di residenza 5. anno di nascita di un individuo 6. stato civile 7. numero vani di un’abitazione 8. superficie di un’abitazione ESERCIZIO 2 – Soluzione: 1. Carattere qualitativo sconnesso 2. Carattere qualitativo sconnesso 3. Carattere qualitativo ordinato o rettilineo 4. Carattere qualitativo sconnesso 5. Carattere qualitativo ordinato o rettilineo 6. Carattere qualitativo sconnesso 7. Carattere quantitativo discreto, scala rapporti 8. Carattere quantitativo continuo, scala rapporti ESERCIZIO 3: Con riferimento ai dati dell’Esercizio 1, predisporre le tabelle delle frequenze assolute, relative e percentuali di ogni carattere. ESERCIZIO 3 – Soluzione: Settore Freq. Assolute Freq. Relative Freq. Percentuali Agricoltura 4 0.20 20% Industria 11 0.55 55% Altro 5 0.25 25% 20 1 100% Tit. Godimento Freq. Assolute Freq. Relative Freq. Percentuali Affitto 8 0.40 40% Proprietà 10 0.50 50% Altro 2 0.10 10% 20 1 100% Tit. di Studio Freq. Assolute Freq. Relative Freq. Percentuali Senza Titolo 1 0.05 5% Lic. Elem. 1 0.05 5% Lic. Media 6 0.30 30% Diploma 5 0.25 25% Laurea 7 0.35 35% 20 1 100% N° Figli Freq. Assolute Freq. Relative Freq. Percentuali 0 3 0.15 15% 1 5 0.25 25% 2 5 0.25 25% 3 4 0.20 20% 4 1 0.05 5% 5 2 0.1 10% 20 1 100% Classe Reddito Freq. Assolute Freq. Relative Freq. Percentuali 15000 |- 20000 12 0.60 60% 20000 |- 25000 3 0.15 15% 25000 |- 30000 4 0.20 20% >30000 1 0.05 5% 20 1 100% Classe Età Freq. Assolute Freq. Relative Freq. Percentuali 25 -| 30 5 0.25 25% 30- | 45 2 0.10 10% 45 -| 50 4 0.20 20% 50 -| 60 7 0.35 35% 60 -| 70 2 0.10 10% 20 1 100% ESERCIZIO 4: Supponiamo di aver rilevato su 20 persone i seguenti caratteri: Sesso Età in anni compiuti, Reddito mensile in migliaia di euro Statura in cm Colore dei capelli ID 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Sesso M F F M F F M M F F F M F F M F F F M M Eta' 22 18 34 42 50 12 46 72 27 48 35 84 21 44 56 58 37 16 73 64 Reddito 0.7 0.2 1.6 2.5 3.2 0.1 3.8 1.3 1.2 1.7 1.9 0.8 0.4 1.8 1.9 3.2 2.1 0.1 1.6 2.2 Staura 173 168 165 180 163 160 177 164 158 170 167 159 174 164 177 172 166 160 170 184 Colore Capelli nero marrone marrone nero biondo grigio marrone biondo biondo nero grigio marrone biondo biondo nero nero marrone grigio biondo biondo 1. Classificare ciascuno dei caratteri rilevati mediante l’indagine statistica; 2. Predisporre le tabelle delle frequenze assolute, relative e percentuali di ogni carattere; cumulate per i fenomeni almeno rettilinei, e le specifiche se raggruppato in classi. 3. Produrre il grafico delle distribuzioni di frequenza ESERCIZIO 4 – Soluzione: 1. • Sesso: carattere qualitativo sconnesso • Età in anni compiuti: carattere quantitativo discreto • Reddito mensile in migliaia di euro: carattere quantitativo continuo • Statura in cm: carattere quantitativo continuo • Colore dei capelli: carattere qualitativo sconnesso 2. Sesso Freq. Assolute Freq. Relative Freq. Percentuali F 12 0.60 60% M 8 0.40 40% 20 1 100% Età Freq. Freq. Cumulate Cumulate Cumulate Freq. Freq. Assolute Relative Percentuali Ass. Rel. Perc. Ampiezza Specifiche 10 -| 30 30 -| 40 40 -| 50 50 -| 60 60 -| 90 6 3 5 2 4 0.30 0.15 0.25 0.10 0.20 30% 15% 25% 10% 20% 20 1.00 100% 6 9 14 16 20 6 8 3 3 0.30 0.40 0.15 0.15 30% 40% 15% 15% 20 1.00 100% Freq. Freq. Statura Assolute Relative 155 -| 165 165 -| 175 175 -| 185 biondo grigio marrone nero Freq. Percentuali 8 8 4 0.40 0.40 0.20 40% 40% 20% 20 1.00 100% Colore Capelli Freq. Assolute 30% 45% 70% 80% 100% 20 10 10 10 30 0.30 0.30 0.50 0.20 0.13 0% Freq. Freq. Reddito Assolute Freq. Relative Percentuali 0 -| 1 1 -| 2 2 -| 3 3 -| 4 0.30 0.45 0.70 0.80 1.00 Cumulate Cumulate Cumulate Ass. Rel. Perc. 6 14 17 20 0.30 0.70 0.85 1.00 Freq. Ampiezza Specifiche 30% 70% 85% 100% 1 1 1 1 6 8 3 3 Cumulate Cumulate Cumulate Freq. Rel. Perc. Ampiezza Specifiche Ass. 8 16 20 Freq. Relative 0.40 0.80 1.00 40% 80% 100% 10 10 10 0.80 0.80 0.40 Freq. Percentuali 7 3 5 5 0.35 0.15 0.25 0.25 35% 15% 25% 25% 20 1.00 100% Per maggiore chiarezza di seguito si spiega come sono state costruite tali tabelle. Le tabelle si frequenza si costruiscono individuando prima le modalità dei singoli caratteri e contando poi le frequenze assolute ni, cioè quante volte le singole modalità si presentano sulle unità statistiche rilevate. Per organizzare una variabile in classi bisogna, prima di tutto, decidere il numero di classi e la loro ampiezza. Queste due decisioni dipendono da: - numero di osservazioni o numerosità della popolazione N; - numero di modalità con le quali il carattere si manifesta; - caratteristiche particolari della variabile. Successivamente, è necessario costruire le classi in modo che: - ricoprano tutto lo spazio di valori osservati; - le classi siano contigue, cioè il valore successivo all’estremo superiore di una classe sia il primo della classe successiva. Gli estremi inferiori e superiori delle classi devono essere chiari ed univoci; - le classi non devono, possibilmente, presentare frequenza nulla. Infine è necessario collocare le osservazioni all’interno delle classi di appartenenza in modo che un osservazione appartenga ad una ed una sola classe. 3. Sesso: la rappresentazione grafica più indicata è un diagramma a settori circolari, ovvero una “torta”, poiché la mutabile è nominale e con poche modalità. Si è interessati a valutare la composizione della popolazione. Genere 40.00% 60.00% Femmine Maschi Si ricorda che per costruire il grafico a settori circolari o a torta, si procede ponendo: (360: N = αi : ni). Trattandosi di gradi, sarebbe necessario ricavare i “primi” ed i “secondi”, ma per semplificazione si può approssimare ai “gradi”. 360 : 20 = α F :12 α F = 216° 360 : 20 = α M : 8 α M = 144° Numero di benefit: la rappresentazione grafica più indicata è un grafico per ordinate o a bastoncini. Un diagramma a rettangoli o a canne d’organo non è accettabile in quanto la variabile è quantitativa discreta. Numero di benefit 8 7 6 Frequenze 5 4 3 2 1 0 0 1 2 3 4 5 6 7 Valori L’altezza dei bastoncini dipende dalle frequenze considerate: assolute o percentuali. Reddito mensile: la rappresentazione grafica più indicata è l’istogramma. Si compone di tanti rettangoli contigui quante sono le classi da rappresentare (4). La base del rettangolo coincide con l’ampiezza della classe, ai = xi +1 − xi , mentre l’area del rettangolo coincide con la frequenza ni. Per n costruire il rettangolo occorre definirne l’altezza d i = i dove il rapporto tra frequenze ed ampiezze ai è detta frequenza specifica o ridotta. Naturalmente la somma delle aree di tutti i rettangoli deve essere uguale alla somma delle frequenze assolute ovvero alla numerosità totale. Reddito mensile 9 8 7 Frequenze Specifiche 6 5 4 3 2 1 0 0-|1 1-|2 2-|3 3-|4 Classi Statura: la rappresentazione grafica più indicata è l’istogramma. Si compone di tanti rettangoli contigui quante sono le classi da rappresentare (3). Altezza in cm 0.9 0.8 0.7 Frequenze Specifiche 0.6 0.5 0.4 0.3 0.2 0.1 0 155 160 165 170 175 180 185 190 Classi Colore dei capelli: la rappresentazione grafica più indicata è una grafico a barre, avremmo potuto utilizzare anche un diagramma a settori circolari, ovvero una “torta”. Colore degli occhi 40.00% 35.00% 30.00% Frequenze 25.00% 20.00% 15.00% 10.00% 5.00% 0.00% biondo marrone nero grigio Modalità L’altezza dei rettangoli dipende dalle frequenze considerate: assolute o relative. La base delle “barre” è uguale e lo spazio tra le stesse, in presenza di mutabili con almeno tre modalità, resta costante, ovvero le “barre” sono equidistanti; l’area dei rettangoli non ha importanza. ESERCIZIO 5: Data la distribuzione per età degli individui visitati nel centro medico in una giornata:. ETA' ni 10 |- 30 30 |- 50 50 |- 70 70 |- 90 Totale 6 7 4 3 20 calcolare: 1. la distribuzione delle frequenze relative; 2. la distribuzione delle frequenze cumulate assolute e relative. ESERCIZIO 5 – Soluzione: ETA' ni 10 |- 30 30 |- 50 50 |- 70 70 |- 90 ESERCIZIO fi Ni 6 7 4 3 0.3 0.35 0.2 0.15 20 1 Fi 6 13 17 20 0.3 0.65 0.85 1 6: Rappresentare graficamente la distribuzione di frequenze relativa della popolazione italiana a gennaio 2008 suddivisa in NORD, CENTRO, SUD, ISOLE utilizzando un grafico a rettangoli: POPOLAZIONE (n ) i ZONE D'ITALIA Italia Nord-Occidentale Italia Nord-Orientale Italia Centrale Italia Meridionale Italia Insulare 15779473 11337470 11675578 14131469 6695300 Totale ESERCIZIO 59619290 6 – Soluzione: 0.30 0.26 0.24 0.25 0.19 0.20 0.20 0.15 0.11 0.10 0.05 0.00 Italia NordOccidentale Italia Nord-Orientale Italia Centrale Italia Meridionale Italia Insulare ESERCIZIO 7: Con riferimento ai dati dell’esercizio precedente, rappresentare graficamente la distribuzione di frequenze percentuali utilizzando un grafico a settori circolari: ESERCIZIO 7 – Soluzione: 11.23% 26.47% 23.70% 19.02% 19.58% Italia Nord-Occidentale ESERCIZIO Italia Nord-Orientale Italia Centrale Italia Meridionale Italia Insulare 8: Si dia un’opportuna rappresentazione grafica dei dati rappresentati nella seguente tabella riguardanti gli occupati in Italia per settore di attività economica nel 2004 e nel 2005: SETTORE DI ATTIVITA' ANNO 2004 agricoltura industria altre attività Totale ESERCIZIO 1034 6956 14640 22630 8 – Soluzione: 25000 20000 14640 14689 6956 6998 1034 999 15000 10000 5000 0 ANNO 2004 ANNO 2005 agricoltura industria altre attività ANNO 2005 999 6998 14689 22685 ESERCIZIO 9: Considerando i dati dell’esercizio precedente, dare una rappresentazione grafica dei dati mediante un grafico a barre multiple. ESERCIZIO 9 – Soluzione: 16000 14689 14640 14000 12000 10000 8000 6998 6956 6000 4000 2000 1034 999 0 ANNO 2004 ANNO 2005 agricoltura ESERCIZIO industria altre attività 10: Dall’esame di 20 dipendenti dell’azienda KKK emerge la seguente distribuzione del titolo di studio. 1. calcolare le frequenze cumulate e relative 2. rappresentare graficamente il fenomeno Titolo di studio Senza Titolo Lic. Elem. Lic. Media Diploma Laurea ESERCIZIO ni 1 1 6 5 7 10 – Soluzione: 1. Titolo di studio Senza Titolo Lic. Elem. Lic. Media Diploma Laurea ni 1 1 6 5 7 Ni 1 2 8 13 20 pi 0.05 0.05 0.30 0.25 0.35 2. 8 7 7 6 6 5 5 4 3 2 1 1 1 Senza Titolo Lic. Elem. 0 Lic. Media Diploma Laurea L’altezza dei rettangoli dipende dalle frequenze considerate: assolute o percentuali. La base delle “barre” è uguale e lo spazio tra le stesse, in presenza di mutabili con almeno tre modalità, resta costante, ovvero le “barre” sono equidistanti; l’area dei rettangoli non ha importanza. Ma ha importanza l’ordine dei rettangoli sul grafico perché la mutabile è qualitativa ordinale. ESERCIZIO 11: Rappresentare graficamente la distribuzione di frequenze assolute relativa agli incidenti stradali suddivisi per giorni della settimana in Italia nel 2004 utilizzando un grafico a rettangoli: Giorni N° incidenti lunedì martedì mercoledì giovedì venerdì sabato domenica ESERCIZIO 41.042 39.793 40.802 40.564 40.412 47.364 43.113 11 – Soluzione: 48 47.364 46 44 43.113 42 41.042 40.802 40.564 40.412 giovedì venerdì 39.793 40 38 36 lunedì ESERCIZIO martedì mercoledì sabato domenica 12: Si dia un’opportuna rappresentazione grafica dei dati rappresentati nella seguente tabella riguardanti le quotazioni di borsa dell’azione X. Giorni lunedì martedì mercoledì giovedì venerdì Quotazioni 2.01 2.14 2.11 2.12 2.16 ESERCIZIO 12 – Soluzione: 2.2 2.16 2.15 2.14 2.11 martedì mercoledì 2.12 2.1 2.05 2.01 2 1.95 1.9 lunedì ESERCIZIO giovedì venerdì 13: Rappresentare graficamente la seriazione che descrive il numero di vani nelle 100 abitazioni del quartiere. ESERCIZIO NUMERO ERRORI FREQUENZE 1 2 3 4 5 6 22 28 25 15 8 2 13 – Soluzione: 30 28 25 25 22 20 15 15 10 8 5 2 0 0 1 2 3 4 5 6 7 ESERCIZIO 14: Data la distribuzione di frequenza per il carattere “età del dipendente”, suddiviso in 5 classi di ampiezza diversa, valutata nell’azienda Y in cui lavorano 500 dipendenti, costruire il corrispondente istogramma: ETA' FREQUENZE 16 |- 20 20 |- 23 23 |- 28 28 |- 35 35 |- 45 Totale ESERCIZIO 13 156 223 75 33 500 14 – Soluzione: 60.00 50.00 Frequenze Specifiche 40.00 30.00 20.00 10.00 0.00 1 ESERCIZIO 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 15: Supponiamo di aver rilevato su 12 persone le seguenti caratteristiche: Sesso (1 = maschio, 2 = femmina) Livello di istruzione (1 = licenza media, 2 = diploma, 3 = laurea) Altezza in centimetri Sesso 1 2 1 1 2 1 1 2 2 1 1 2 Liv. Istruzione 1 2 2 2 3 3 1 2 3 2 3 2 Altezza in cm 172 171 175 180 165 179 179 166 168 175 169 175 1. Classificare ciascuno dei caratteri rilevati; 2. Predisporre le tabelle delle frequenze assolute e percentuali di ogni carattere; cumulate per i fenomeni almeno qualitativi ordinali; ESERCIZIO 15 – Soluzione: 1. “sesso”: mutabile statistica sconnessa “livello di istruzione”: mutabile statistica qualitativa ordinale “altezza in centimetri”: variabile quantitativa continua 2. Le tabelle di frequenza si costruiscono individuando prima le modalità dei singoli caratteri e contando poi le frequenze assolute ni, cioè quante volte le singole modalità si presentano sulle unità statistiche rilevate. Per organizzare una variabile in classi bisogna, prima di tutto, decidere il numero di classi e la loro ampiezza. Queste due decisioni dipendono da: - numero di osservazioni o numerosità della popolazione N; - numero di modalità con le quali il carattere si manifesta; - caratteristiche particolari della variabile. Successivamente, è necessario costruire le classi in modo che: - ricoprano tutto lo spazio di valori osservati; - le classi siano contigue, cioè il valore successivo all’estremo superiore di una classe sia il primo della classe successiva. Gli estremi inferiori e superiori delle classi devono essere chiari ed univoci; - le classi non devono, possibilmente, presentare frequenza nulla. Infine è necessario collocare le osservazioni all’interno delle classi di appartenenza in modo che un osservazione appartenga ad una ed una sola classe. Modalità F. Assolute ni F. Percentuali pi xi Maschio 7 58.33% Femmina 5 41.67% Modalità F. Assolute ni xi 165|-170 170|.175 175|-185 ESERCIZIO 4 2 6 Modalità xi F. Assolute F. Percentuali F. Cumulate ni pi Ni licenza 2 16.67% 2 media diploma 6 50.00% 8 laurea 4 33.33% 12 F. Percentuali pi F. Cumulate Ni 33.33% 16.67% 50.00% 4 6 12 16: L’ufficio job placement ha ricevuto nell’ultima settimana domanda di iscrizione al servizio di 45 neolaureati. Alcuni erano laureati in Ingegneria (ING), in Medicina (MED), in Economia (ECO) ed in Scienze Politiche (SPO). Una sintesi è riportata nella sottostante tabella. Laurea Numero Neolaureati 12 8 16 9 ING MED ECO SPO 1. Calcolare le frequenze relative 2. Rappresentare graficamente il carattere ESERCIZIO 16 – Soluzione: 1. Le frequenze relative sono date dal rapporto tra le frequenze assolute ni e la numerosità totale N. Laurea Numero Neolaureati F. Percentuali ING 12 8 16 9 26.67% 17.78% 35.56% 20.00% MED ECO SPO 2. Si tratta di un carattere qualitativo nominale, e si manifesta con un numero limitato di modalità. Si è interessati a valutare la composizione della popolazione. Possiamo rappresentarlo con un grafico “a torta”. Corso di Laurea Scienze Politiche 20% Ingegneria 27% Medicina 18% Economia 35% 360 : 45 = α ING :12 α ING = 96° 360 : 45 = α ECO :16 α ECO = 128° 360 : 45 = α MED : 8 α MED = 64° 360 : 45 = α SPO : 9 α SPO = 72° ESERCIZIO 17: Un’amministrazione di nuovo insediamento, per valutare eventuali politiche sociali, ha deciso di rilevare il numero di vani degli immobili ad uso abitativo presenti nell’area comunale. I risultati sono riportati nella tabella seguente. Numero vani Numero abitazioni 1 120 2 350 3 650 4 580 5 460 1. Costruire una distribuzione di frequenza per il carattere rilevato e calcolare le frequenze cumulate 2. Rappresentare graficamente il carattere ESERCIZIO 17 – Soluzione: 1. Le tabelle si frequenza si costruiscono individuando prima le modalità dei singoli caratteri e contando poi le frequenze assolute ni, cioè quante volte le singole modalità si presentano sulle unità statistiche rilevate. Per organizzare una variabile in classi bisogna, prima di tutto, decidere il numero di classi e la loro ampiezza. Queste due decisioni dipendono da: - numero di osservazioni o numerosità della popolazione N; - numero di modalità con le quali il carattere si manifesta; - caratteristiche particolari della variabile. Per calcolare le frequenze cumulate si utilizza la seguente formula: i Ni = ∑ n j j =1 cioè per ogni modalità i-esima è necessario sommare, alle frequenze assolute della modalità ni, tutte le frequenze delle modalità o classi precedenti. N° Vani 1 2 3 4 5 F.Assolute 120 350 650 580 460 F. Cumulate 120 470 1120 1700 2160 2. Il fenomeno è quantitativo discreto è quindi necessario rappresentarlo con un grafico “a bastoncini”: sull’asse orizzontale ci sono le modalità, i “numeri”, con cui si manifesta il fenomeno, mentre l’altezza dei bastoncini è data dalle frequenze assolute oppure dalle frequenze relative. Numero dei Vani 700 650 600 580 500 frequenze assolute 460 400 350 300 200 120 100 0 0 1 2 3 n° vani 4 5 6 ESERCIZIO 18: Gli iscritti ai corsi di nuoto della piscina comunale negli ultimi sei anni sono riportati nella seguente tabella. 2003 130 2004 145 2005 169 2006 171 2007 144 2008 176 1. Di che tipo di carattere si tratta ? 2. Rappresentare graficamente il carattere rilevato ESERCIZIO 18 – Soluzione: 1. il carattere è qualitativo ordinale, la serie dei dati viene detta serie storica o temporale. 2. La rappresentazione più idonea per le serie storiche è la spezzata. Sull’asse orizzontale c’è il tempo, su quello verticale le frequenze assolute, le coppie di valori sono rappresentate sul piano cartesiano da punti che vengono uniti da segmenti. Iscritti ai Corsi di Nuoto 200 180 160 140 120 100 80 60 40 20 0 2003 2004 2005 2006 2007 2008