Esame-0506-1

Transcript

Esame-0506-1
Analisi dei Dati
Prova dell’ 8 maggio 2006
Il file CARS.XLS contiene i seguenti dati relativi a modelli di automobile prodotti tra il 1970 e il
1982.
I campi hanno il seguente significato (mi scuso per le unità di misura, tutte americane):
1. MPG (miglia per gallone) indica quante miglia percorre l’auto in media con un gallone di
benzina.
2. Cylinders indica il numero di cilindri del motore.
3. Engine Disp indica la cilindrata in pollici cubici.
4. Horsepower indica la potenza misurata in cavalli vapore.
5. Weight indica il peso della macchina, naturalmente in libbre.
6. Accelleration indica il tempo in secondi necessario per percorrere un miglio da fermo.
7. Year è l’anno di lancio del modello.
8. Origin indica dove viene costruito il modello.
Per ciascuna delle seguenti domande si aggiunga al workbook un foglio con la risposta piu`
adeguata (es. una pivot table, una correlazione, una tabella filtrata, un grafico ecc.). Si aggiunga
anche un commento con una breve spiegazione del processo seguito per trovare la risposta.
Per consegnare il compito, si invii in attachment in una mail con
Destinatario: [email protected]
Subject: AD 8-5-06 nome cognome
Attachment: il file excel con la soluzione.
Domande
1. Si crei una pivot table che abbia come dimensioni il numero di cilindri e la cilindrata e come
dati la potenza. Si aggiunga una gerarchia per la cilindrata con gruppi di 50 pollici cubici e
una gerarchia per il numero di cilindri che presenti il gruppo con numero di cilindri <=4 e
quello con numero di cilindri >4
2. È vero che le macchine con una bassa cilindrata unitaria (valore del rapporto tra Engine
Disp e Cylinders) consumano di meno? (sugg. vedere se c’è una correlazione significativa
tra cilindrata unitaria e MGP)
3. C’è una correlazione forte tra potenza e peso?
4. Si trovi il valor medio della potenza e della cilindrata per area di produzione (Origin)
5. Per ciascuna area di produzione (Origin) si raggruppino le cilindrate (Engine Disp) a gruppi
di 30 e si costruiscano le rispettive distribuzioni di frequenza. Quali di queste è la più
simmetrica?
6. Si costruisca una lista di tutti i modelli europei e giapponesi con 4 cilindri e una potenza
superiore a 70HP.
7. La colonna Accellerate presenta alcuni dati mancanti. Ipotizzando che il tempo di
accellerazione sia correlato sia alla potenza (Horsepower) che al peso (Weight) si trovi la
relazione lineare (equazione della linea di tendenza) tra rapporto tra potenza e peso e tempo
di accellerazione e si usi per calcolare il dato mancante. (sugg. si copino le colonne
Horsepower, Weight e Accelleration su un nuovo foglio, si eliminino i record in cui il campo
accelleration è mancante, si aggiunga una colonna (chiamatela RPP, rapporto potenza
peso) con il valore Horsepower/Weight, si costruisca un diagramma XY tra il valore RPP e
l’accellerazione, si trovi la linea di tendenza e la sua equazione, si usi quest’ultima per
calcolare il valore mancante nei dati originali)