Esame-0910-2

Transcript

Esame-0910-2
Analisi dei Dati
Prova del 22 giugno 2010
Il file Homedata.XLS contiene dati su un insieme di case in vendita. I campi del file hanno il
seguente significato (unità di misura americane):
1.
2.
3.
4.
5.
6.
7.
8.
1.
2.
3.
4.
5.
Price: prezzo di vendita
Square feet: superficie della casa in square feet
Age: età della casa in anni
Feature: numero di accessori (garage, lavanderia ecc.)
NE Sector: quartiere specifico
Corner Lot: libera su tre lati
Offer pending: presenza o meno di una offerta di acquisto
Annual Tax: tassa di proprietà annuale
Procedura
Si copi il file Homedata.XLS sul desktop dalla pagina
http://www.di.unipi.it/~turini/Analisi%20dei%20dati/dati/
Si ridenomini il file con il vostro nome-cognome
Per ciascuna delle seguenti domande si aggiunga al workbook uno o più fogli con la risposta
più adeguata (es. una pivot table, una correlazione, una tabella filtrata, un grafico, un
intervallo di confidenza ecc.). Si aggiunga anche un commento con una breve
spiegazione del processo seguito per trovare la risposta.
Si invii il file in attachment a una mail con subject “Analisi di Dati Nome Cognome” a
[email protected]
Si cancelli il file dal desktop e si svuoti il cestino
Domande
1. Qual’è la differenza di prezzo medio tra le case del NE Sector e le case di altri quarieri che
hanno superficie maggiore di 1.500 square feet?
2. Si calcoli il coefficiente di correlazione tra superficie e prezzo, considerando solo le case più
ampie di 1.200 square feet. Si verifichi di quanto il coefficiente di correlazione aumenta con
l’eliminazione dei due maggiori outliers.
3. Si ottenga l’istogramma che rappresenta la distribuzione delle tasse raggruppate in gruppi di
$100 evidenziando la posizione (corner lot o meno). La distribuzione globale ha buone
proprietà di simmetria?
4. Una previsione di mercato affermava che il prezzo medio delle case con più di 10 anni e di
superficie compresa tra 1.200 e 2.200 si sarebbe assestato a $100.000. Considerando i dati
che abbiamo come un campione significativo, possiamo affermare che la previsione era
corretta con una confidenza del 99%?