Come gestire le directory con R Indice
Transcript
Come gestire le directory con R Indice
Come gestire le directory con R Stefano F. Tonellato Dipartimento di Statistica Indice 1 Perché è importante saper gestire le directory 1 2 Come scegliere la directory su cui R deve lavorare 1 2.1 Windows . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 2.2 Linux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2.2.1 Un primo modo . . . . . . . . . . . . . . . . . . . . . . . . 4 2.2.2 Un secondo modo 4 . . . . . . . . . . . . . . . . . . . . . . 1 Perché è importante saper gestire le directory I dati sono disponibili su supporto magnetico (hard disk, cd, dvd, penn drive, ecc.). Al fine di acquisirli ed elaborarli dobbiamo quindi sapere dove questi dati siano e come possano essere importati in una sessione di lavoro di R. I file nei supporti sopra menzionati sono collocati in directory (o cartelle, se vogliamo usare la terminologia di Windows), le quali sono raggiungibili seguendo determinati percorsi. Per leggere e importare un file, quindi dobbiamo conoscere ed essere in grado di attaraversare il percorso che conduce ad esso. Analogmente, se vogliamo salvare le nostre elaborazioni su determinati file, dovremo essere in grado di decidere dove (su quale cartella o directory) quei file debbano essere scritti. Un problema del tutto simile è quello di far funzionare dei programmi che abbiamo scritto e che vogliamo che R elabori: anche in questo caso dovremo collocarci nella directory ove si trovano i file contenenti i codici dei programmi e quindi dare a R le istruzioni adeguate a consentirgli l’elaborazione. 2 Come scegliere la directory su cui R deve lavorare Supponiamo che l’utente abbia lo username guest. Nel seguito utilizzeremo questo username. Ad esso lo studente dovrà sostituire il proprio usename quando lavorerà sul suo computer o sui computer di un’aula informatica. 2.1 Windows Comunemente, in ambiente Windows, la directory principale dell’utente guest è: C:\Documents and Settings\guest Supponiamo di avere creato, nella directory guest, la directory chiamata dati dove vogliamo salvare tutti i file di dati a nostra disposizione (la creazione di tale cartella è banale con l’utilizzo di Risorse del computer). 1 Avviamo R clickando sull’icona che troviamo sul desktop. Automaticamente R definisce una directory su cui può lavorare (sulla quale può cioè leggere o scrivere dei file). Generalmente, per la versione R-2.5.1, la directory di lavoro definita automaticamente, sarà: C:\Programmi\R\R-2.5.1 Per sapere quale sia la directory su cui R sta lavorando, dalla console di R digitiamo: > getwd() e l’output risultante dovrebbe essere > getwd() [1] "C:/Programmi/R/R-2.5.1" Per cambiare la directory di lavoro in: C:\Documents and Settings\guest\dati digitiamo il comando: > setwd("C:/Documents and Settings/guest/dati") Osservazione: mentre in Windows generalmente il simbolo che separa le cartelle successive entro un percorso è “\”, in R esso è sostituito da “/”. Ora, digitando nuovamente il comando > getwd() dovremmo ottenere l’output > getwd() [1] "C:/Documents and Settings/guest/dati" Ora R è pronto a leggere dati dalla directory C:\Documents and Settings\guest\dati e a scriverne sulla medesima cartella. 2 2.2 Linux In ambiente Linux le cose funzionano in modo un po’ diverso. Supponiamo sempre di essere l’utente guest. Accediamo innanzitutto a Linux inserendo nel menu di accesso il nostro username e la nostra password. Dopo di ciò si aprirà sullo schermo il desktop di Linux. Avviamo ora una sessione di terminale clickando sul rettangolino nero che si trova sul bordo superiore del desktop. Una sessione di terminale è una finestra sulla quale possiamo digitare dei comandi che vengono recepiti dal sistema operativo Linux. Nella sessione di terminale, l’inizio della riga di comando è rappresentato dal simbolo $. Nel seguito illustreremo alcuni comandi di Linux che saranno preceduti da $: questo simbolo rappresenta semplicemente l’inizio della riga di comando e non deve mai essere digitato. I comandi che indicheremo nel seguito dovranno essere sempre seguiti da enter. All’avvio di una sessione di terminale, l’utente guest si trova nella directory /home/guest. Per verificarlo, digitare il comando: $ pwd a cui dovrebbe seguire l’output /home/guest. Osservazione: mentre in Windows generalmente il simbolo che separa le car- telle successive entro un percorso è “\”, in Linux, cosı̀ come avviene in R, esso è sostituito da “/”. A questo punto creiamo la directory dati digitando il comando: $ mkdir dati Ora, se digitiamo il comando $ ls otterremo come output una lista di nomi di file e directory tra i quali dovrebe comparire dati. Il percorso completo a questa directory sarà: /home/guest/dati. Per spostarci nella directory dati a partire dalla directory /home/stone dobbiamo digitare il comando: 3 $ cd dati Per spostarci nella medesima directory a partire da qualsiasi punto digitiamo $ cd /home/stone/dati 2.2.1 Un primo modo Supponiamo di avere aperto una sessione di terminale e di trovarci nella directory /home/stone/dati. Digitando il comando $ R avviamo R il quale opererà già nella directory di lavoro /home/stone/dati e quindi non dobbiamo fare nient’altro. 2.2.2 Un secondo modo In alcune configurazioni, nel desktop di Linux compare un’icona attraverso la quale si può avviare R. Con questo metodo di avvio, R si troverà generalmente nella directory di lavoro /home/guest o in una qualche directory definita automaticamente, ma non in quella che noi vogliamo utilzzare per la gestione dei dati. Per spostarci, dall’interno di R, nella directory di lavoro /home/guest/dati, digitiamo, come in Windows: > setwd("/home/guest/dati") Ora dovremmo trovarci nella directory desiderata. Per accertarcene digitiamo: > getwd() e dovrebbe comparire l’output > getwd() [1] "/home/guest" 4