Corso di Laurea INTERFACOLTÀ - Esercitazione di Statistica n° 1

Transcript

Corso di Laurea INTERFACOLTÀ - Esercitazione di Statistica n° 1
Corso di Laurea INTERFACOLTÀ - Esercitazione di Statistica n° 1
ESERCIZIO
1:
Con riferimento ai dati riportati nella seguente tabella, indicare la tipologia dei caratteri rilevati.
ESERCIZIO
1 – Soluzione:
1. Carattere qualitativo sconnesso
2. Carattere qualitativo sconnesso
3. Carattere qualitativo ordinato o rettilineo
4. Carattere quantitativo discreto, scala rapporti
5. Carattere quantitativo continuo, scala rapporti
6. Carattere quantitativo continuo, scala rapporti
ESERCIZIO
2:
Stabilire a quale tipologia di carattere appartengono le seguenti variabili:
1. sesso di un individuo
2. colore degli occhi di un individuo
3. posizione in graduatoria del candidato
4. provincia di residenza
5. anno di nascita di un individuo
6. stato civile
7. numero vani di un’abitazione
8. superficie di un’abitazione
ESERCIZIO
2 – Soluzione:
1. Carattere qualitativo sconnesso
2. Carattere qualitativo sconnesso
3. Carattere qualitativo ordinato o rettilineo
4. Carattere qualitativo sconnesso
5. Carattere qualitativo ordinato o rettilineo
6. Carattere qualitativo sconnesso
7. Carattere quantitativo discreto, scala rapporti
8. Carattere quantitativo continuo, scala rapporti
ESERCIZIO
3:
Con riferimento ai dati dell’Esercizio 1, predisporre le tabelle delle frequenze assolute, relative e
percentuali di ogni carattere.
ESERCIZIO
3 – Soluzione:
Settore
Freq. Assolute
Freq. Relative
Freq. Percentuali
Agricoltura
4
0.20
20%
Industria
11
0.55
55%
Altro
5
0.25
25%
20
1
100%
Tit. Godimento
Freq. Assolute
Freq. Relative
Freq. Percentuali
Affitto
8
0.40
40%
Proprietà
10
0.50
50%
Altro
2
0.10
10%
20
1
100%
Tit. di Studio
Freq. Assolute
Freq. Relative
Freq. Percentuali
Senza Titolo
1
0.05
5%
Lic. Elem.
1
0.05
5%
Lic. Media
6
0.30
30%
Diploma
5
0.25
25%
Laurea
7
0.35
35%
20
1
100%
N° Figli
Freq. Assolute
Freq. Relative
Freq. Percentuali
0
3
0.15
15%
1
5
0.25
25%
2
5
0.25
25%
3
4
0.20
20%
4
1
0.05
5%
5
2
0.1
10%
20
1
100%
Classe Reddito
Freq. Assolute
Freq. Relative
Freq. Percentuali
15000 |- 20000
12
0.60
60%
20000 |- 25000
3
0.15
15%
25000 |- 30000
4
0.20
20%
>30000
1
0.05
5%
20
1
100%
Classe Età
Freq. Assolute
Freq. Relative
Freq. Percentuali
25 -| 30
5
0.25
25%
30- | 45
2
0.10
10%
45 -| 50
4
0.20
20%
50 -| 60
7
0.35
35%
60 -| 70
2
0.10
10%
20
1
100%
ESERCIZIO
4:
Supponiamo di aver rilevato su 20 persone i seguenti caratteri:
Sesso
Età in anni compiuti,
Reddito mensile in migliaia di euro
Statura in cm
Colore dei capelli
ID
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Sesso
M
F
F
M
F
F
M
M
F
F
F
M
F
F
M
F
F
F
M
M
Eta'
22
18
34
42
50
12
46
72
27
48
35
84
21
44
56
58
37
16
73
64
Reddito
0.7
0.2
1.6
2.5
3.2
0.1
3.8
1.3
1.2
1.7
1.9
0.8
0.4
1.8
1.9
3.2
2.1
0.1
1.6
2.2
Staura
173
168
165
180
163
160
177
164
158
170
167
159
174
164
177
172
166
160
170
184
Colore Capelli
nero
marrone
marrone
nero
biondo
grigio
marrone
biondo
biondo
nero
grigio
marrone
biondo
biondo
nero
nero
marrone
grigio
biondo
biondo
1. Classificare ciascuno dei caratteri rilevati mediante l’indagine statistica;
2. Predisporre le tabelle delle frequenze assolute, relative e percentuali di ogni
carattere; cumulate per i fenomeni almeno rettilinei, e le specifiche se raggruppato in
classi.
3. Produrre il grafico delle distribuzioni di frequenza
ESERCIZIO
4 – Soluzione:
1.
•
Sesso: carattere qualitativo sconnesso
•
Età in anni compiuti: carattere quantitativo discreto
•
Reddito mensile in migliaia di euro: carattere quantitativo continuo
•
Statura in cm: carattere quantitativo continuo
•
Colore dei capelli: carattere qualitativo sconnesso
2.
Sesso Freq. Assolute Freq. Relative Freq. Percentuali
F
12
0.60
60%
M
8
0.40
40%
20
1
100%
Età
Freq.
Freq.
Cumulate Cumulate Cumulate
Freq.
Freq.
Assolute Relative Percentuali
Ass.
Rel.
Perc. Ampiezza Specifiche
10 -| 30
30 -| 40
40 -| 50
50 -| 60
60 -| 90
6
3
5
2
4
0.30
0.15
0.25
0.10
0.20
30%
15%
25%
10%
20%
20
1.00
100%
6
9
14
16
20
6
8
3
3
0.30
0.40
0.15
0.15
30%
40%
15%
15%
20
1.00
100%
Freq.
Freq.
Statura Assolute Relative
155 -| 165
165 -| 175
175 -| 185
biondo
grigio
marrone
nero
Freq.
Percentuali
8
8
4
0.40
0.40
0.20
40%
40%
20%
20
1.00
100%
Colore Capelli
Freq. Assolute
30%
45%
70%
80%
100%
20
10
10
10
30
0.30
0.30
0.50
0.20
0.13
0%
Freq.
Freq.
Reddito Assolute Freq. Relative Percentuali
0 -| 1
1 -| 2
2 -| 3
3 -| 4
0.30
0.45
0.70
0.80
1.00
Cumulate Cumulate Cumulate
Ass.
Rel.
Perc.
6
14
17
20
0.30
0.70
0.85
1.00
Freq.
Ampiezza Specifiche
30%
70%
85%
100%
1
1
1
1
6
8
3
3
Cumulate Cumulate Cumulate
Freq.
Rel.
Perc. Ampiezza Specifiche
Ass.
8
16
20
Freq. Relative
0.40
0.80
1.00
40%
80%
100%
10
10
10
0.80
0.80
0.40
Freq. Percentuali
7
3
5
5
0.35
0.15
0.25
0.25
35%
15%
25%
25%
20
1.00
100%
Per maggiore chiarezza di seguito si spiega come sono state costruite tali tabelle.
Le tabelle si frequenza si costruiscono individuando prima le modalità dei singoli caratteri e
contando poi le frequenze assolute ni, cioè quante volte le singole modalità si presentano sulle unità
statistiche rilevate. Per organizzare una variabile in classi bisogna, prima di tutto, decidere il
numero di classi e la loro ampiezza. Queste due decisioni dipendono da:
- numero di osservazioni o numerosità della popolazione N;
- numero di modalità con le quali il carattere si manifesta;
- caratteristiche particolari della variabile.
Successivamente, è necessario costruire le classi in modo che:
- ricoprano tutto lo spazio di valori osservati;
- le classi siano contigue, cioè il valore successivo all’estremo superiore di una classe sia il primo
della classe successiva. Gli estremi inferiori e superiori delle classi devono essere chiari ed univoci;
- le classi non devono, possibilmente, presentare frequenza nulla.
Infine è necessario collocare le osservazioni all’interno delle classi di appartenenza in modo che un
osservazione appartenga ad una ed una sola classe.
3.
Sesso: la rappresentazione grafica più indicata è un diagramma a settori circolari, ovvero una
“torta”, poiché la mutabile è nominale e con poche modalità. Si è interessati a valutare la
composizione della popolazione.
Genere
40.00%
60.00%
Femmine
Maschi
Si ricorda che per costruire il grafico a settori circolari o a torta, si procede ponendo: (360: N = αi :
ni). Trattandosi di gradi, sarebbe necessario ricavare i “primi” ed i “secondi”, ma per
semplificazione si può approssimare ai “gradi”.
360 : 20 = α F :12
α F = 216°
360 : 20 = α M : 8
α M = 144°
Numero di benefit: la rappresentazione grafica più indicata è un grafico per ordinate o a bastoncini.
Un diagramma a rettangoli o a canne d’organo non è accettabile in quanto la variabile è quantitativa
discreta.
Numero di benefit
8
7
6
Frequenze
5
4
3
2
1
0
0
1
2
3
4
5
6
7
Valori
L’altezza dei bastoncini dipende dalle frequenze considerate: assolute o percentuali.
Reddito mensile: la rappresentazione grafica più indicata è l’istogramma. Si compone di tanti
rettangoli contigui quante sono le classi da rappresentare (4). La base del rettangolo coincide con
l’ampiezza della classe, ai = xi +1 − xi , mentre l’area del rettangolo coincide con la frequenza ni. Per
n
costruire il rettangolo occorre definirne l’altezza d i = i dove il rapporto tra frequenze ed ampiezze
ai
è detta frequenza specifica o ridotta. Naturalmente la somma delle aree di tutti i rettangoli deve
essere uguale alla somma delle frequenze assolute ovvero alla numerosità totale.
Reddito mensile
9
8
7
Frequenze Specifiche
6
5
4
3
2
1
0
0-|1
1-|2
2-|3
3-|4
Classi
Statura: la rappresentazione grafica più indicata è l’istogramma. Si compone di tanti rettangoli
contigui quante sono le classi da rappresentare (3).
Altezza in cm
0.9
0.8
0.7
Frequenze Specifiche
0.6
0.5
0.4
0.3
0.2
0.1
0
155
160
165
170
175
180
185
190
Classi
Colore dei capelli: la rappresentazione grafica più indicata è una grafico a barre, avremmo potuto
utilizzare anche un diagramma a settori circolari, ovvero una “torta”.
Colore degli occhi
40.00%
35.00%
30.00%
Frequenze
25.00%
20.00%
15.00%
10.00%
5.00%
0.00%
biondo
marrone
nero
grigio
Modalità
L’altezza dei rettangoli dipende dalle frequenze considerate: assolute o relative. La base delle
“barre” è uguale e lo spazio tra le stesse, in presenza di mutabili con almeno tre modalità, resta
costante, ovvero le “barre” sono equidistanti; l’area dei rettangoli non ha importanza.
ESERCIZIO
5:
Data la distribuzione per età degli individui visitati nel centro medico in una giornata:.
ETA'
ni
10 |- 30
30 |- 50
50 |- 70
70 |- 90
Totale
6
7
4
3
20
calcolare:
1. la distribuzione delle frequenze relative;
2. la distribuzione delle frequenze cumulate assolute e relative.
ESERCIZIO
5 – Soluzione:
ETA'
ni
10 |- 30
30 |- 50
50 |- 70
70 |- 90
ESERCIZIO
fi
Ni
6
7
4
3
0.3
0.35
0.2
0.15
20
1
Fi
6
13
17
20
0.3
0.65
0.85
1
6:
Rappresentare graficamente la distribuzione di frequenze relativa della popolazione italiana a
gennaio 2008 suddivisa in NORD, CENTRO, SUD, ISOLE utilizzando un grafico a rettangoli:
POPOLAZIONE (n )
i
ZONE D'ITALIA
Italia Nord-Occidentale
Italia Nord-Orientale
Italia Centrale
Italia Meridionale
Italia Insulare
15779473
11337470
11675578
14131469
6695300
Totale
ESERCIZIO
59619290
6 – Soluzione:
0.30
0.26
0.24
0.25
0.19
0.20
0.20
0.15
0.11
0.10
0.05
0.00
Italia NordOccidentale
Italia Nord-Orientale
Italia Centrale
Italia Meridionale
Italia Insulare
ESERCIZIO
7:
Con riferimento ai dati dell’esercizio precedente, rappresentare graficamente la distribuzione di
frequenze percentuali utilizzando un grafico a settori circolari:
ESERCIZIO
7 – Soluzione:
11.23%
26.47%
23.70%
19.02%
19.58%
Italia Nord-Occidentale
ESERCIZIO
Italia Nord-Orientale
Italia Centrale
Italia Meridionale
Italia Insulare
8:
Si dia un’opportuna rappresentazione grafica dei dati rappresentati nella seguente tabella riguardanti
gli occupati in Italia per settore di attività economica nel 2004 e nel 2005:
SETTORE DI ATTIVITA'
ANNO 2004
agricoltura
industria
altre attività
Totale
ESERCIZIO
1034
6956
14640
22630
8 – Soluzione:
25000
20000
14640
14689
6956
6998
1034
999
15000
10000
5000
0
ANNO 2004
ANNO 2005
agricoltura
industria
altre attività
ANNO 2005
999
6998
14689
22685
ESERCIZIO
9:
Considerando i dati dell’esercizio precedente, dare una rappresentazione grafica dei dati mediante
un grafico a barre multiple.
ESERCIZIO
9 – Soluzione:
16000
14689
14640
14000
12000
10000
8000
6998
6956
6000
4000
2000
1034
999
0
ANNO 2004
ANNO 2005
agricoltura
ESERCIZIO
industria
altre attività
10:
Dall’esame di 20 dipendenti dell’azienda KKK emerge la seguente distribuzione del titolo di studio.
1. calcolare le frequenze cumulate e relative
2. rappresentare graficamente il fenomeno
Titolo di studio
Senza Titolo
Lic. Elem.
Lic. Media
Diploma
Laurea
ESERCIZIO
ni
1
1
6
5
7
10 – Soluzione:
1.
Titolo di studio
Senza Titolo
Lic. Elem.
Lic. Media
Diploma
Laurea
ni
1
1
6
5
7
Ni
1
2
8
13
20
pi
0.05
0.05
0.30
0.25
0.35
2.
8
7
7
6
6
5
5
4
3
2
1
1
1
Senza Titolo
Lic. Elem.
0
Lic. Media
Diploma
Laurea
L’altezza dei rettangoli dipende dalle frequenze considerate: assolute o percentuali.
La base delle “barre” è uguale e lo spazio tra le stesse, in presenza di mutabili con almeno tre
modalità, resta costante, ovvero le “barre” sono equidistanti; l’area dei rettangoli non ha
importanza. Ma ha importanza l’ordine dei rettangoli sul grafico perché la mutabile è qualitativa
ordinale.
ESERCIZIO
11:
Rappresentare graficamente la distribuzione di frequenze assolute relativa agli incidenti stradali
suddivisi per giorni della settimana in Italia nel 2004 utilizzando un grafico a rettangoli:
Giorni
N° incidenti
lunedì
martedì
mercoledì
giovedì
venerdì
sabato
domenica
ESERCIZIO
41.042
39.793
40.802
40.564
40.412
47.364
43.113
11 – Soluzione:
48
47.364
46
44
43.113
42
41.042
40.802
40.564
40.412
giovedì
venerdì
39.793
40
38
36
lunedì
ESERCIZIO
martedì
mercoledì
sabato
domenica
12:
Si dia un’opportuna rappresentazione grafica dei dati rappresentati nella seguente tabella riguardanti
le quotazioni di borsa dell’azione X.
Giorni
lunedì
martedì
mercoledì
giovedì
venerdì
Quotazioni
2.01
2.14
2.11
2.12
2.16
ESERCIZIO
12 – Soluzione:
2.2
2.16
2.15
2.14
2.11
martedì
mercoledì
2.12
2.1
2.05
2.01
2
1.95
1.9
lunedì
ESERCIZIO
giovedì
venerdì
13:
Rappresentare graficamente la seriazione che descrive il numero di vani nelle 100 abitazioni del
quartiere.
ESERCIZIO
NUMERO
ERRORI
FREQUENZE
1
2
3
4
5
6
22
28
25
15
8
2
13 – Soluzione:
30
28
25
25
22
20
15
15
10
8
5
2
0
0
1
2
3
4
5
6
7
ESERCIZIO
14:
Data la distribuzione di frequenza per il carattere “età del dipendente”, suddiviso in 5 classi di
ampiezza diversa, valutata nell’azienda Y in cui lavorano 500 dipendenti, costruire il corrispondente
istogramma:
ETA'
FREQUENZE
16 |- 20
20 |- 23
23 |- 28
28 |- 35
35 |- 45
Totale
ESERCIZIO
13
156
223
75
33
500
14 – Soluzione:
60.00
50.00
Frequenze Specifiche
40.00
30.00
20.00
10.00
0.00
1
ESERCIZIO
3
5
7
9
11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45
15:
Supponiamo di aver rilevato su 12 persone le seguenti caratteristiche:
Sesso (1 = maschio, 2 = femmina)
Livello di istruzione (1 = licenza media, 2 = diploma, 3 = laurea)
Altezza in centimetri
Sesso
1
2
1
1
2
1
1
2
2
1
1
2
Liv. Istruzione 1
2
2
2
3
3
1
2
3
2
3
2
Altezza in cm 172 171 175 180 165 179 179 166 168 175 169 175
1. Classificare ciascuno dei caratteri rilevati;
2. Predisporre le tabelle delle frequenze assolute e percentuali di ogni carattere;
cumulate per i fenomeni almeno qualitativi ordinali;
ESERCIZIO
15 – Soluzione:
1.
“sesso”: mutabile statistica sconnessa
“livello di istruzione”: mutabile statistica qualitativa ordinale
“altezza in centimetri”: variabile quantitativa continua
2.
Le tabelle di frequenza si costruiscono individuando prima le modalità dei singoli caratteri e
contando poi le frequenze assolute ni, cioè quante volte le singole modalità si presentano sulle unità
statistiche rilevate. Per organizzare una variabile in classi bisogna, prima di tutto, decidere il
numero di classi e la loro ampiezza. Queste due decisioni dipendono da:
- numero di osservazioni o numerosità della popolazione N;
- numero di modalità con le quali il carattere si manifesta;
- caratteristiche particolari della variabile.
Successivamente, è necessario costruire le classi in modo che:
- ricoprano tutto lo spazio di valori osservati;
- le classi siano contigue, cioè il valore successivo all’estremo superiore di una classe sia il
primo della classe successiva. Gli estremi inferiori e superiori delle classi devono essere
chiari ed univoci;
- le classi non devono, possibilmente, presentare frequenza nulla.
Infine è necessario collocare le osservazioni all’interno delle classi di appartenenza in modo che un
osservazione appartenga ad una ed una sola classe.
Modalità F. Assolute ni F. Percentuali pi
xi
Maschio
7
58.33%
Femmina
5
41.67%
Modalità F. Assolute ni
xi
165|-170
170|.175
175|-185
ESERCIZIO
4
2
6
Modalità xi F. Assolute F. Percentuali F. Cumulate
ni
pi
Ni
licenza
2
16.67%
2
media
diploma
6
50.00%
8
laurea
4
33.33%
12
F. Percentuali pi
F. Cumulate Ni
33.33%
16.67%
50.00%
4
6
12
16:
L’ufficio job placement ha ricevuto nell’ultima settimana domanda di iscrizione al servizio di 45
neolaureati. Alcuni erano laureati in Ingegneria (ING), in Medicina (MED), in Economia (ECO) ed in
Scienze Politiche (SPO). Una sintesi è riportata nella sottostante tabella.
Laurea
Numero Neolaureati
12
8
16
9
ING
MED
ECO
SPO
1. Calcolare le frequenze relative
2. Rappresentare graficamente il carattere
ESERCIZIO
16 – Soluzione:
1.
Le frequenze relative sono date dal rapporto tra le frequenze assolute ni e la numerosità totale N.
Laurea
Numero Neolaureati
F. Percentuali
ING
12
8
16
9
26.67%
17.78%
35.56%
20.00%
MED
ECO
SPO
2.
Si tratta di un carattere qualitativo nominale, e si manifesta con un numero limitato di modalità. Si è interessati a
valutare la composizione della popolazione. Possiamo rappresentarlo con un grafico “a torta”.
Corso di Laurea
Scienze Politiche
20%
Ingegneria
27%
Medicina
18%
Economia
35%
360 : 45 = α ING :12
α ING = 96°
360 : 45 = α ECO :16
α ECO = 128°
360 : 45 = α MED : 8
α MED = 64°
360 : 45 = α SPO : 9
α SPO = 72°
ESERCIZIO
17:
Un’amministrazione di nuovo insediamento, per valutare eventuali politiche sociali, ha deciso di
rilevare il numero di vani degli immobili ad uso abitativo presenti nell’area comunale. I risultati
sono riportati nella tabella seguente.
Numero vani
Numero abitazioni
1
120
2
350
3
650
4
580
5
460
1. Costruire una distribuzione di frequenza per il carattere rilevato e calcolare le frequenze
cumulate
2. Rappresentare graficamente il carattere
ESERCIZIO
17 – Soluzione:
1.
Le tabelle si frequenza si costruiscono individuando prima le modalità dei singoli caratteri e
contando poi le frequenze assolute ni, cioè quante volte le singole modalità si presentano sulle unità
statistiche rilevate. Per organizzare una variabile in classi bisogna, prima di tutto, decidere il
numero di classi e la loro ampiezza. Queste due decisioni dipendono da:
- numero di osservazioni o numerosità della popolazione N;
- numero di modalità con le quali il carattere si manifesta;
- caratteristiche particolari della variabile.
Per calcolare le frequenze cumulate si utilizza la seguente formula:
i
Ni = ∑ n j
j =1
cioè per ogni modalità i-esima è necessario sommare, alle frequenze assolute della modalità ni, tutte
le frequenze delle modalità o classi precedenti.
N° Vani
1
2
3
4
5
F.Assolute
120
350
650
580
460
F. Cumulate
120
470
1120
1700
2160
2.
Il fenomeno è quantitativo discreto è quindi necessario rappresentarlo con un grafico “a bastoncini”:
sull’asse orizzontale ci sono le modalità, i “numeri”, con cui si manifesta il fenomeno, mentre
l’altezza dei bastoncini è data dalle frequenze assolute oppure dalle frequenze relative.
Numero dei Vani
700
650
600
580
500
frequenze assolute
460
400
350
300
200
120
100
0
0
1
2
3
n° vani
4
5
6
ESERCIZIO
18:
Gli iscritti ai corsi di nuoto della piscina comunale negli ultimi sei anni sono riportati nella seguente
tabella.
2003
130
2004
145
2005
169
2006
171
2007
144
2008
176
1. Di che tipo di carattere si tratta ?
2. Rappresentare graficamente il carattere rilevato
ESERCIZIO
18 – Soluzione:
1. il carattere è qualitativo ordinale, la serie dei dati viene detta serie storica o temporale.
2.
La rappresentazione più idonea per le serie storiche è la spezzata. Sull’asse orizzontale c’è il tempo,
su quello verticale le frequenze assolute, le coppie di valori sono rappresentate sul piano cartesiano
da punti che vengono uniti da segmenti.
Iscritti ai Corsi di Nuoto
200
180
160
140
120
100
80
60
40
20
0
2003
2004
2005
2006
2007
2008