Analisi dei Dati – Prof. Marozzi

Transcript

Analisi dei Dati – Prof. Marozzi
Analisi dei Dati – Prof. Marozzi
Esercitazione 2
Un agenzia immobiliare di Bologna ha venduto nel 2005 79 appartamenti.
Nella seguente tabella è riportato il risultato della classificazione degli
appartamenti secondo il prezzo di vendita (migliaia di euro).
Prezzo
Appartamenti
50 |- 70
9
70 |- 100
20
100 |- 120
19
120 |- 150
25
6*
≥ 150
* Prezzo complessivo dei 6 appartamenti pari a 990.
i) Definire la moda e determinarla.
ii) Definire la mediana e determinare la classe mediana.
iii) Definire e calcolare la media aritmetica. Interpretarne il risultato.
iv) Definire e calcolare lo scarto quadratico medio. Interpretarne il
risultato.
Analisi dei Dati – Prof. Marozzi
Svolgimento dell’esercitazione
i) La moda è la modalità più frequente del carattere. Se, come nel nostro
caso, il carattere è rappresentato in classi di ampiezza non costante, la
classe modale è la classe avente la maggior densità di frequenza.
xi-1
xi
ni
50
70
70
100
100
120
120
150
≥ 150
totale
fi=ni/n ai=xi-xi-1
9
20
19
25
6
79
0,114
0,253
0,241
0,316
0,076
1
20
30
20
30
-
hi=fi/ai
0,0057
0,0084
0,0120
0,0105
-
La classe modale è quindi 100 |- 120. Nell’ipotesi di omogeneità del
carattere all’interno delle classi si può assumere quale valore modale
(100+120)/2=110 migliaia di euro.
ii) La mediana rappresenta la modalità portata dall’unità che occupa il
posto centrale (n+1)/2 nella graduatoria delle unità secondo il carattere
considerato quando n è dispari; quando n è pari dalla semisomma dei valori
portati dalle due unità che occupano i posti centrali n/2 e (n/2+1). La classe
mediana, ovvero la classe in cui cade la mediana, di determina
considerando i posti occupati dalle modalità nella graduatoria crescente del
carattere.
xi-1
xi
50 70
70 100
100 120
120 150
≥ 150
posti
1 |–| 9
10 |–| 29
30 |–| 48
49 |–| 73
74 |–| 79
Essendo n dispari vi è un solo posto centrale il (79+1)/2=40esimo. L’unità
al posto 40 della graduatoria cade nella classe 100 |- 120 migliaia di euro
che è quindi la classe mediana.
Analisi dei Dati – Prof. Marozzi
(iii) La media aritmetica è quel valore che sostituito a ognuna delle n unità
considerate non altera l’ammontare totale del carattere.
Essendo la distribuzione in classi intervallari è necessario (nell’ipotesi di
omogeneità del carattere all’interno di ogni classe) prima determinare i
valori centrali facendo la semisomma degli estremi dell’intervallo
ci = (xi + xi −1 ) 2 .
Per l’ultima classe aperta va considerato come centrale 165: se nel
complesso i 6 appartamenti venduti a un prezzo non inferiore a 150 sono
costati 990 migliaia di euro, singolarmente, nell’ipotesi si carattere
omogeneo sono costati 990/6=165 migliaia di euro.
(50+70)/2=
(70+100/2=
(100+120)/2=
(120+150)/2=
990/6=
1
x=
n
5
i =1
ci ni =
ci
60
85
110
135
165
ni
9
20
19
25
6
totale
ci ni
540
1700
2090
3375
990
8695
1
(540 + 1700 + 2090 + 3375 + 990) = 8695 = 110,063 .
79
79
La media aritmetica di 110,063 migliaia di euro (110063 euro) sta ad
indicare il prezzo dei 79 appartamenti venduti nel 2005 dall’agenzia
nell’ipotesi che tutti gli appartamenti siano stati venduti allo stesso prezzo.
Analisi dei Dati – Prof. Marozzi
iv) Lo scarto quadratico medio, come dice il nome, è la media quadratica
degli scarti delle osservazioni dalla loro media aritmetica.
La media aritmetica può essere arrotondata a 110 nel calcolo degli scarti.
ci
ni
60
85
110
135
165
9
20
19
25
6
1
SQM =
n
5
i =1
(ci − x )
(ci − x )2 (ci − x )2 ni
-50
-25
0
25
55
(ci − x )2 ni
=
2500
625
0
625
3025
totale
22500
12500
0
15625
18150
68775
68775
= 871 = 29,5 .
79
Mediamente (secondo la media quadratica) il prezzo degli appartamenti
venduti si è discostato dal prezzo medio (110 mila euro) di circa 29,5
migliaia di euro.