Esame-0910-2
Transcript
Esame-0910-2
Analisi dei Dati Prova del 22 giugno 2010 Il file Homedata.XLS contiene dati su un insieme di case in vendita. I campi del file hanno il seguente significato (unità di misura americane): 1. 2. 3. 4. 5. 6. 7. 8. 1. 2. 3. 4. 5. Price: prezzo di vendita Square feet: superficie della casa in square feet Age: età della casa in anni Feature: numero di accessori (garage, lavanderia ecc.) NE Sector: quartiere specifico Corner Lot: libera su tre lati Offer pending: presenza o meno di una offerta di acquisto Annual Tax: tassa di proprietà annuale Procedura Si copi il file Homedata.XLS sul desktop dalla pagina http://www.di.unipi.it/~turini/Analisi%20dei%20dati/dati/ Si ridenomini il file con il vostro nome-cognome Per ciascuna delle seguenti domande si aggiunga al workbook uno o più fogli con la risposta più adeguata (es. una pivot table, una correlazione, una tabella filtrata, un grafico, un intervallo di confidenza ecc.). Si aggiunga anche un commento con una breve spiegazione del processo seguito per trovare la risposta. Si invii il file in attachment a una mail con subject “Analisi di Dati Nome Cognome” a [email protected] Si cancelli il file dal desktop e si svuoti il cestino Domande 1. Qual’è la differenza di prezzo medio tra le case del NE Sector e le case di altri quarieri che hanno superficie maggiore di 1.500 square feet? 2. Si calcoli il coefficiente di correlazione tra superficie e prezzo, considerando solo le case più ampie di 1.200 square feet. Si verifichi di quanto il coefficiente di correlazione aumenta con l’eliminazione dei due maggiori outliers. 3. Si ottenga l’istogramma che rappresenta la distribuzione delle tasse raggruppate in gruppi di $100 evidenziando la posizione (corner lot o meno). La distribuzione globale ha buone proprietà di simmetria? 4. Una previsione di mercato affermava che il prezzo medio delle case con più di 10 anni e di superficie compresa tra 1.200 e 2.200 si sarebbe assestato a $100.000. Considerando i dati che abbiamo come un campione significativo, possiamo affermare che la previsione era corretta con una confidenza del 99%?