Esercizi del 20/2/2009 1) Memorizzare nella variabile v 100 valori

Transcript

Esercizi del 20/2/2009 1) Memorizzare nella variabile v 100 valori
Esercizi del 20/2/2009
1) Memorizzare nella variabile v 100 valori che vanno da "# a " con passo costante. Visualizzare
sullo schermo i primi 10 valori di v.
1 . Calcolare la somma di
2) Memorizzare nella variabile s1 i primi 50 valori
! della
! successione
tali termini.
n2
3) Memorizzare nella variabile nomi i nomi di battesimo di tutti i frequentanti del corso [o
! alfabetico.
inventateli, se non li conoscete]. Farli mettere da R in ordine
4) Memorizzare nella variabile w prima i numeri interi da -2 a 11, poi 5 volte il numero 0, infine i
multipli di 9 da 45 all’indietro fino a 9. Fatevi calcolare quanti elementi ha il vettore w.
5) Memorizzare nella variabile altezza le altezze di un campione di persone: 1.54, 1.66, 1.88,
1.73, 1.75, 1.64, 1.77, 1.47. Utilizzando un’unica istruzione, fate visualizzare l’altezza della
quarta e settima persona.
6) Memorizzare nel vettore sesso il sesso degli 8 soggetti di cui nell’esercizio precedente è stata
mostrata l’altezza: M, F, M, F, F, M, M, F. Fate calcolare a R il numero di donne, la loro altezza
massima e la somma delle loro altezze.
Per gli esercizi successivi scaricare la directory (compressa) “dati” dalla pagina Web del corso
http://www.science.unitn.it/AnalisiInfoTLC/LAED metterla nel proprio account e decomprimerla
tar -xvf dati.tar sostituendo la directory “dati” creata finora.
7) Caricate (con il comando “load”) il file BBBClub.rda. Se tutto ha funzionato, troverete fra le
variabili di R [potete controllare con il comando ls()] il data.frame BBBClub.
i) Fate elencare le variabili contenute nel data.frame;
ii) Fate preparare una tabella riassuntiva delle variabili del data.frame;
iii) Per ognuna delle due variabili numeriche amount e first, costruire un istogramma ed un
grafico della funzione densità [stimata], poi sovrapponete questi due grafici; infine,
costruite la rappresentazione box-and-whiskers. Cosa potreste dire delle due
distribuzioni, in particolare della loro simmetria e dell’esistenza di outlier.
iv) Costruite, per ognuna delle due variabili, il confronto dei quantili con quelli della
distribuzione normale. Vi sembra di poter dire che le distribuzioni si possono
approssimare con una normale?
v) Costruite una variabile x in cui siano memorizzati i valori di BBBClub$amount per le
osservazioni che corrispondono ad una donna (ossia gender: female). Confrontate,
calcolando opportuni indicatori riassuntivi, se la distribuzione di x sia diversa da quella
di BBBClub$amount
8) Leggere il file studenti.txt (si tratta di un file di testo) dalla sottodirectory
Crivellari_data e inserire i risultati in una variabile di R. Calcolare la mediana e la media
dei voti per il campione complessivo, e per maschi e femmine separatamente. Costruite un
istogramma dei voti, separatamente per maschi e femmine.
Si può notare che alcuni studenti hanno voto 0, il ché presumibilmente è una codifica per non
aver superato l’esame. Può essere opportuno contare quanti studenti non hanno superato
l’esame, e calcolare la media e la mediana sui restanti.
9) Leggere il file Tests.txt (si tratta di un file in formato CSV che va letto con iopportune
istruzioni) dalla sottodirectory Crivellari_data e inserire i risultati in una variabile di R.
Fare un grafico bivariato di Peso ed Età (alcuni dati fanno domandare che razza di campione
sia...). Aggiungere un’ulteriore variabile LivelloScolT che rende esplicito il codice usato
(1= licenza elementare; 2 = licenza media; 3 = diploma superiore; 4 = laurea)
10) Date una definizione di quantili per una distribuzione teorica continua, ed un campionamento
empirico.