esempio rapporto - biotec.uniba.it

Transcript

esempio rapporto - biotec.uniba.it
Rapporto di esempio: conoscere gli studenti della classe di
statistica per Biotecnologie
Introduzione
E' necessario valutare il numero di studenti frequentati il corso che abbiano a disposizione un
portatile per definire le modalità delle esercitazioni e dell'esame finale. Inoltre sono interessato a
conoscere meglio la classe dai dati disponibili.
Descrizione dei dati
Origine:
I dati sono stati presi da un foglio manoscritto compilato dagli studenti con informazioni relative al
nome e cognome, al loro contatto per posta elettronica, della loro disponibilità di un portatile.
Modalità di importazione:
I dati sono stati trascritti in un foglio elettronico e inseguito importati un file di testo semplice
tabulato per essere infine importati in R
Contenuti:
La tabella di dati si compone di 126 righe e 4 colonne, ogni riga corrisponde ad uno studente.
I nomi colonna sono "Nome"
"Cognome" "email"
"Portatile"
I dati sono stati tutti interpretati come fattori da R anche se la colonna Portatile dovrebbe essere
interpretata come Logico
Risultati:
Importo i dati
>studenti<-read.table('studenti2.txt',sep='\t', header=TRUE, quote='', strip.white=TRUE)
Ottengo un riassunto dei dati con la funzione summary
>summary( studenti)
Nome
alessia : 3
annamaria: 3
antonella: 3
domenica : 3
michele : 3
roberta : 3
(Other) :108
Cognome
amodio
: 2
calo'
: 2
dibenedetto: 2
gadaleta
: 2
milella
: 2
alba
: 1
(Other)
:115
email
Portatile
[email protected] : 1
no :49
[email protected]: 1
si :70
[email protected]
: 1
NA's: 7
[email protected]
: 1
[email protected]
: 1
(Other)
:120
NA's
: 1
Pur avendo ottenuto la mia risposta continuo ad esplorare i dati per conoscere gli studenti
Metto tutti i cognomi con lettera miniscula
>levels(studenti$Cognome)<-tolower(levels(studenti$Cognome))
Modifico il nome della riga 73 in modo da essere letto correttamente da R
>levels(studenti$Nome)[73]<-"nicolo’”
Metto tutti i nomi in minusculo
>levels(studenti$Nome)<-tolower(levels(studenti$Nome))
>table(table(studenti$C))
1
2
116
5
> table(table(studenti$N))
1
2
3
76 13
8
Nomi piu comuni
>sort(table(studenti$N), decreasing=TRUE)[1:8]
alessia annamaria antonella
3
3
domenica
michele
roberta
valeria
3
3
3
3
3
vincenzo
3
Cognomi più comuni
>sort(table(studenti$C), decreasing=TRUE)[1:5]
amodio
calo' dibenedetto
2
2
gadaleta
milella
2
2
2
Domini di posta piu comuni
>studenti$Dominio<-studenti$email
>levels(studenti$Dominio)<-sub(".+@",'',levels(studenti$Dominio))
>100*sort(table(studenti$Dominio))/sum(table(studenti$Dominio))
yahoo.it
tiscali.it
yahoot.it
msn.com
virgilio.it
0.8
0.8
0.8
0.8
0.8
aliceposta.it
gmail.it
hotmail.com
gmail.com
alice.it
0.8
0.8
1.6
4.0
4.8
live.it
libero.it
hotmail.it
11.2
13.6
59.2
Interpretazioni dei risultati ed eventuali commenti
Gli studenti con portatile sono 70 mentre 49+7=56 probabilmente non hanno portatile.
Dunque e' possibile immaginare esercitazioni in aula 1 con due persone per portatile ed e' possibile
immagine un esame fatto al computer con una sessione per i senza portatile ed una sezione con
quelli con il portatile.
I rischi di confondere uno studente per un altro chiamandoli per nome o cognome e' limitato ma
possibile. Come atteso dalla logica c'è' più variabilità di cognomi che di nome ( misurata come
numero di persone con stesso cognome o stesso nome), anche se la differenza e' poca, sulla base di
una mia aspettativa personale non formalizzata.
Usando lo stesso metro di misura la variabilità dei domini di posta utilizzata e' molto più bassa con
59% degli studenti che usano hotmail
Conclusioni:
E' possibile effettuare gli esami al computer ed e' possibile in effettuare le esercitazioni in aula 1.