esempio rapporto - biotec.uniba.it
Transcript
esempio rapporto - biotec.uniba.it
Rapporto di esempio: conoscere gli studenti della classe di statistica per Biotecnologie Introduzione E' necessario valutare il numero di studenti frequentati il corso che abbiano a disposizione un portatile per definire le modalità delle esercitazioni e dell'esame finale. Inoltre sono interessato a conoscere meglio la classe dai dati disponibili. Descrizione dei dati Origine: I dati sono stati presi da un foglio manoscritto compilato dagli studenti con informazioni relative al nome e cognome, al loro contatto per posta elettronica, della loro disponibilità di un portatile. Modalità di importazione: I dati sono stati trascritti in un foglio elettronico e inseguito importati un file di testo semplice tabulato per essere infine importati in R Contenuti: La tabella di dati si compone di 126 righe e 4 colonne, ogni riga corrisponde ad uno studente. I nomi colonna sono "Nome" "Cognome" "email" "Portatile" I dati sono stati tutti interpretati come fattori da R anche se la colonna Portatile dovrebbe essere interpretata come Logico Risultati: Importo i dati >studenti<-read.table('studenti2.txt',sep='\t', header=TRUE, quote='', strip.white=TRUE) Ottengo un riassunto dei dati con la funzione summary >summary( studenti) Nome alessia : 3 annamaria: 3 antonella: 3 domenica : 3 michele : 3 roberta : 3 (Other) :108 Cognome amodio : 2 calo' : 2 dibenedetto: 2 gadaleta : 2 milella : 2 alba : 1 (Other) :115 email Portatile [email protected] : 1 no :49 [email protected]: 1 si :70 [email protected] : 1 NA's: 7 [email protected] : 1 [email protected] : 1 (Other) :120 NA's : 1 Pur avendo ottenuto la mia risposta continuo ad esplorare i dati per conoscere gli studenti Metto tutti i cognomi con lettera miniscula >levels(studenti$Cognome)<-tolower(levels(studenti$Cognome)) Modifico il nome della riga 73 in modo da essere letto correttamente da R >levels(studenti$Nome)[73]<-"nicolo’” Metto tutti i nomi in minusculo >levels(studenti$Nome)<-tolower(levels(studenti$Nome)) >table(table(studenti$C)) 1 2 116 5 > table(table(studenti$N)) 1 2 3 76 13 8 Nomi piu comuni >sort(table(studenti$N), decreasing=TRUE)[1:8] alessia annamaria antonella 3 3 domenica michele roberta valeria 3 3 3 3 3 vincenzo 3 Cognomi più comuni >sort(table(studenti$C), decreasing=TRUE)[1:5] amodio calo' dibenedetto 2 2 gadaleta milella 2 2 2 Domini di posta piu comuni >studenti$Dominio<-studenti$email >levels(studenti$Dominio)<-sub(".+@",'',levels(studenti$Dominio)) >100*sort(table(studenti$Dominio))/sum(table(studenti$Dominio)) yahoo.it tiscali.it yahoot.it msn.com virgilio.it 0.8 0.8 0.8 0.8 0.8 aliceposta.it gmail.it hotmail.com gmail.com alice.it 0.8 0.8 1.6 4.0 4.8 live.it libero.it hotmail.it 11.2 13.6 59.2 Interpretazioni dei risultati ed eventuali commenti Gli studenti con portatile sono 70 mentre 49+7=56 probabilmente non hanno portatile. Dunque e' possibile immaginare esercitazioni in aula 1 con due persone per portatile ed e' possibile immagine un esame fatto al computer con una sessione per i senza portatile ed una sezione con quelli con il portatile. I rischi di confondere uno studente per un altro chiamandoli per nome o cognome e' limitato ma possibile. Come atteso dalla logica c'è' più variabilità di cognomi che di nome ( misurata come numero di persone con stesso cognome o stesso nome), anche se la differenza e' poca, sulla base di una mia aspettativa personale non formalizzata. Usando lo stesso metro di misura la variabilità dei domini di posta utilizzata e' molto più bassa con 59% degli studenti che usano hotmail Conclusioni: E' possibile effettuare gli esami al computer ed e' possibile in effettuare le esercitazioni in aula 1.