Esercitazione 1: soluzioni

Transcript

Esercitazione 1: soluzioni
Esercitazione I
Serena Arima
[email protected]
In questa esercitazione:
⊲ Popolazione, campione e variabili;
⊲ Distribuzioni di frequenza: frequenza assoluta, relativa, percentuale;
⊲ Rappresentazioni grafiche per caratteri qualitativi;
⊲ Rappresentazioni grafiche per caratteri quantitativi: l’istogramma.
1
Popolazione, campione e variabili
1.1
Esercizio 1
Secondo un’indagine della Goldman Sachs, soltanto il 4% delle famiglie statunitensi ha un conto online. In un sondaggio della Cyber Dialogue riportato su
USA Today si è cercato di indagare sui motivi per la gente ha chiuso il proprio conto online dopo un periodo di prova. Di seguito trovate le risposte degli
intervistati alla domanda Perché hai chiuso il tuo conto online?
Perché hai chiuso il tuo conto online?
Troppo complicato o richiede troppo tempo
Insoddisfatto dal servizio clienti
Non mi necessario o non mi interessa
Preoccupato per la sicurezza del conto
Troppo costoso
Sono preoccupato per la privacy
27%
25%
20%
11%
11%
5%
a. Descrivere la popolazione per l’indagine della Goldman Sachs;
b. Descrivere la popolazione per l’indagine della Cyber Dialogue;
c. La risposta alla domanda considerata qualitativa o quantitativa?
•••
1
Soluzione.
a. La popolazione di riferimento per l’indagine della Goldman Sachs è costituita da tutte le famiglie statunitensi.
b. La popolazione di riferimento per l’indagine della Cyber Dialogue è costituita dalle famiglie statunitensi che avevano un conto online e hanno deciso
di chiuderlo.
c. La risposta alla domanda considerata è qualitativa.
•••
1.2
Esercizio 2
Supponente che in un fast-food siano venduti 3 diversi tipi di bevande: bibite,
tè e caffè.
a. Spiegate perché il tipo di bevanda venduta è un esempio di carattere qualitativo sconnesso.
b. Supponete, poi, che le bibite siano vendute in 3 dimensioni diverse: piccola,
media e grande. Di che carattere si tratta?
•••
Soluzione.
a. Il tipo di bevanda è un carattere qualitativo sconnesso perchè le sue modalità sono definite mediante sostantivi e non ammettono un ordinamento tra
loro (infatti date due bevande è possibile affermare soltanto se esse sono
uguali o diverse tra loro).
b. La dimensione della bibita è un carattere qualitativo ordinato perchè le sue
modalità sono attributi non numerici, ma logicamente ordinabili (infatti
una bevanda ‘piccola’ è di dimensione inferiore ad una ‘media’, che a sua
volte è di dimensione inferiore ad una ‘grande’).
•••
2
1.3
Esercizio 3
Per ognuna delle seguenti variabili dite di che tipo di variabile si tratta e la scala
di misura di riferimento:
• Numero di telefoni per famiglia;
• Tipo di telefono usato principalmente;
• Numero di telefonate al mese;
• Numero medio di telefonate al mese;
• Durata (in minuti) delle chiamate;
• Costo mensile delle telefonate;
• Esistenza di una linea telefonica collegata ad un modem;
•••
Soluzione.
• Numero di telefoni per famiglia;
→ quantitativo discreto
• Tipo di telefono usato principalmente;
→ qualitativo sconnesso
• Numero di telefonate al mese;
→ quantitativo discreto
• Numero medio di telefonate al mese;
→ quantitativo continuo
• Durata (in minuti) delle chiamate;
→ quantitativo continuo
• Costo mensile delle telefonate;
→ quantitativo continuo
• Esistenza di una linea telefonica collegata ad un modem;
→ qualitativo sconnesso
•••
3
2
Distribuzioni di frequenza
2.1
Esercizio 1
I dati seguenti indicano il gruppo sanguigno di 49 donatori in un centro di raccolta
del sangue.
0 A 0 AB A A 0 0 BA 0 A AB B 0 0 0 A B A A 0 A A 0
B A 0 AB A 0 0 A B A A A 0 B 0 0 A 0 A B 0 AB A 0 B
a. Di che carattere si tratta? di che tipo di distribuzione si tratta?
b. Rappresentare questi dati in una tabella di frequenze.
c. Rappresentare i dati in una tabella di frequenze relative.
d. Calcolare inoltre le frequenze percentuali.
•••
Soluzione. Il carattere è qualitativo sconnesso ed è rappresentato mediante
distribuzione unitaria.
Lo si può rappresentare mediante tabella di frequenza nel seguente modo:
gruppo
0
A
AB
B
BA
totale
(a)
frequenze assolute
19
18
4
7
1
49
(b)
frequenze relative
0.39
0.37
0.08
0.14
0.02
1
(c)
frequenze percentuali
39%
37%
8%
14%
2%
100
•••
2.2
Esercizio 2
I seguenti numeri indicano la concentrazione di ozono nell’aria del centro di Los
Angeles durante 25 giorni consecutivi nell’estate del 1984:
6.2 9.1 2.4 3.6 1.9 1.7 4.5 4.2 3.3 5.1 6.0 1.8 2.3
4.9 3.7 3.8 5.5 6.4 8.6 9.3 7.7 5.4 7.2 4.9 6.2
4
Costruire la distribuzione in classi utilizzando le seguenti classi:
(0 − 2],(2, 4],(4, 7], (7, 10].
•••
Soluzione.
concentrazione frequenze assolute
(0,2]
3
(2,4]
6
(4,7]
11
(7,10]
5
•••
2.3
Esercizio 3
Considerate la distribuzione delle frequenze del costo di un pasto (espresso in
euro):
Costo di un pasto
[10, 15)
[15, 20)
[20, 25)
[25, 30)
[30, 35)
[25, 40)
[40, 45)
> 45
Frequenza assoluta
1
0
2
15
5
1
3
15
a. Di che tipo di carattere si tratta? e di che rappresentazione tabellare si
tratta?
b. Che differenza c’è con quella dell’esercizio precedente?
c. Costruire le frequenze relative, percentuali.
d. E’ possibile ricostruire la corrispondente distribuzione unitaria?
•••
Soluzione.
5
a. Il carattere costo di un pasto è quantitativo continuo. La tabella precedente
rappresenta la distribuzione in classi delle frequenze assolute.
b. La distribuzione data nell’esercizio precente è una distribuzione unitaria,
quella che viene richiesto di ricavare è invece una distribuzione in classi: in
questo caso possiamo notare che le classi sono chiuse a sinistra e aperte a
destra e che l’ultima classe è aperta.
c. Costruire le frequenze relative, percentuali.
Costo di un pasto
classi
[10, 15)
[15, 20)
[20, 25)
[25, 30)
[30, 35)
[25, 40)
[40, 45)
> 45
totale
Frequenze
assolute
1
0
2
15
5
1
3
15
42
Frequenze
relative
0.02
0
0.05
0.36
0.12
0.02
0.07
0.36
1
Frequenze
percentuali
2%
0%
5%
36%
12%
2%
7%
36%
100%
d. A partire dalla distribuzione in classi non è possibile ricostruire quella unitaria, mentre è possibile il viceversa come abbiamo visto nell’esercizio precedente.
•••
6
3
Rappresentazioni grafiche
per caratteri qualitativi
3.1
Esercizio 1
Riprendendo l’Esercizio 2.1, rappresentare la distribuzione mediante un diagramma
a barre.
•••
0
5
10
15
20
Soluzione.
0
A
AB
B
BA
•••
3.2
Esercizio 2
Un articolo del Wall Stree Journal del luglio 2003 discute l’influenza che Google
ha avuto sul web. La tabella seguente mostra come si sono suddivise le ricerche
sul web condotte nel maggio 2003 dagli utenti americani di Internet (valori percentuale).
7
Fonte
Ask Jeeves
AOL Time Warner
Google
MSN-Microsoft
Yahoo
Altro
Percentuale
3
19
32
???
25
6
a. Completare la tabella inserendo il valore mancante.
b. Di che tipo di carattere si tratta? Chi sono le unità statistiche di riferimento?
c. Rappresentare graficamente la distribuzione mediante un diagramma a
barre.
•••
Soluzione.
a. Poichè si tratta di frequenze percentuali sappiamo che esse devono sommare a 100, quindi il valore mancante è 15.
b. Il carattere considerato è qualitativo sconnesso. Le unità statistiche di
riferimento sono le ricerche sul web condotte nel maggio 2003 dagli utenti
americani di Internet.
8
0
5
10
15
20
25
30
35
c.
Ask Jeeves
AOL
Google
•••
9
MSN
Yahoo
Altro
4
Rappresentazioni grafiche e numeriche
per caratteri quantitativi
4.1
Esercizio 1
Con riferimento all’Esercizio 2.2:
a. Costruire l’istogramma della distribuzione.
b. Calcolare la media (ovvero la concentrazione media di ozono a Los Angeles
nei 25 giorni considerati).
•••
Soluzione.
a.
densità di frequenza
0.00
0.05
0.10
0.15
Istogramma
0
2
4
7
10
a
b. Utilizzando la formula della media
x1 + x2 + · · · + xi + · · · + xn
=
n
125.7
6.2 + 9.1 + 2.4 + 3.6 + 1.9 + · · · + 6.2
=
= 5.028
=
25
25
x̄ =
•••
10
4.2
Esercizio 2
Nella seguente tabella sono riportati i tempi di funzionamento, in mesi prima
dell’esaurimento, di un campione di batterie.
Durata (mesi)
1 |- 3
3 |- 6
6 |- 12
12 |- 24
Frequenza
10
42
38
8
a. Rappresentare graficamente la distribuzione.
b. Definire e individuare la classe modale.
•••
Soluzione.
a.
0.08
0.06
0.00
0.02
0.04
densità di frequenza
0.10
0.12
0.14
Istogramma
1
3
6
12
24
b
b. La classe modale è la classe alla quale risulta associata la massima densità
di frequenza: in questo caso è la classe [3,6).
•••
11
4.3
Esercizio 3
In un’indagine sui consumi delle auto a benzina nei percorsi urbani è stata osservata la distribuzione del numero di litri consumati per 100 Km riportata nella
seguente tabella.
Consumo (litri) Frequenza
5 |- 10
15
10 |- 15
45
15 |- 25
38
25 |- 35
2
a. Rappresentare graficamente la distribuzione.
b. Definire e individuare la classe modale.
•••
Soluzione.
a.
0.04
0.00
0.02
densità di frequenza
0.06
0.08
Istogramma
5
10
15
25
35
d
b. La classe modale è la classe alla quale risulta associata la massima densità
di frequenza: in questo caso è la classe [10,15).
•••
12