Come gestire le directory con R Indice

Transcript

Come gestire le directory con R Indice
Come gestire le directory con R
Stefano F. Tonellato
Dipartimento di Statistica
Indice
1 Perché è importante saper gestire le directory
1
2 Come scegliere la directory su cui R deve lavorare
1
2.1
Windows
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
2.2
Linux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2.2.1
Un primo modo . . . . . . . . . . . . . . . . . . . . . . . .
4
2.2.2
Un secondo modo
4
. . . . . . . . . . . . . . . . . . . . . .
1
Perché è importante saper gestire le directory
I dati sono disponibili su supporto magnetico (hard disk, cd, dvd, penn drive,
ecc.). Al fine di acquisirli ed elaborarli dobbiamo quindi sapere dove questi
dati siano e come possano essere importati in una sessione di lavoro di R.
I file nei supporti sopra menzionati sono collocati in directory (o cartelle, se
vogliamo usare la terminologia di Windows), le quali sono raggiungibili seguendo
determinati percorsi. Per leggere e importare un file, quindi dobbiamo conoscere
ed essere in grado di attaraversare il percorso che conduce ad esso. Analogmente,
se vogliamo salvare le nostre elaborazioni su determinati file, dovremo essere in
grado di decidere dove (su quale cartella o directory) quei file debbano essere
scritti.
Un problema del tutto simile è quello di far funzionare dei programmi che
abbiamo scritto e che vogliamo che R elabori: anche in questo caso dovremo
collocarci nella directory ove si trovano i file contenenti i codici dei programmi
e quindi dare a R le istruzioni adeguate a consentirgli l’elaborazione.
2
Come scegliere la directory su cui R deve lavorare
Supponiamo che l’utente abbia lo username guest. Nel seguito utilizzeremo
questo username. Ad esso lo studente dovrà sostituire il proprio usename quando
lavorerà sul suo computer o sui computer di un’aula informatica.
2.1
Windows
Comunemente, in ambiente Windows, la directory principale dell’utente guest
è:
C:\Documents and Settings\guest
Supponiamo di avere creato, nella directory guest, la directory chiamata dati
dove vogliamo salvare tutti i file di dati a nostra disposizione (la creazione di
tale cartella è banale con l’utilizzo di Risorse del computer).
1
Avviamo R clickando sull’icona che troviamo sul desktop. Automaticamente
R definisce una directory su cui può lavorare (sulla quale può cioè leggere o
scrivere dei file). Generalmente, per la versione R-2.5.1, la directory di lavoro
definita automaticamente, sarà:
C:\Programmi\R\R-2.5.1
Per sapere quale sia la directory su cui R sta lavorando, dalla console di R
digitiamo:
> getwd()
e l’output risultante dovrebbe essere
> getwd()
[1] "C:/Programmi/R/R-2.5.1"
Per cambiare la directory di lavoro in:
C:\Documents and Settings\guest\dati
digitiamo il comando:
> setwd("C:/Documents and Settings/guest/dati")
Osservazione:
mentre in Windows generalmente il simbolo che separa le
cartelle successive entro un percorso è “\”, in R esso è sostituito da “/”.
Ora, digitando nuovamente il comando
> getwd()
dovremmo ottenere l’output
> getwd()
[1] "C:/Documents and Settings/guest/dati"
Ora R è pronto a leggere dati dalla directory
C:\Documents and Settings\guest\dati
e a scriverne sulla medesima cartella.
2
2.2
Linux
In ambiente Linux le cose funzionano in modo un po’ diverso. Supponiamo
sempre di essere l’utente guest.
Accediamo innanzitutto a Linux inserendo nel menu di accesso il nostro
username e la nostra password. Dopo di ciò si aprirà sullo schermo il desktop
di Linux. Avviamo ora una sessione di terminale clickando sul rettangolino
nero che si trova sul bordo superiore del desktop. Una sessione di terminale
è una finestra sulla quale possiamo digitare dei comandi che vengono recepiti
dal sistema operativo Linux. Nella sessione di terminale, l’inizio della riga di
comando è rappresentato dal simbolo $. Nel seguito illustreremo alcuni comandi
di Linux che saranno preceduti da $: questo simbolo rappresenta semplicemente
l’inizio della riga di comando e non deve mai essere digitato. I comandi che
indicheremo nel seguito dovranno essere sempre seguiti da enter.
All’avvio di una sessione di terminale, l’utente guest si trova nella directory
/home/guest. Per verificarlo, digitare il comando:
$ pwd
a cui dovrebbe seguire l’output /home/guest.
Osservazione:
mentre in Windows generalmente il simbolo che separa le car-
telle successive entro un percorso è “\”, in Linux, cosı̀ come avviene in R, esso
è sostituito da “/”.
A questo punto creiamo la directory dati digitando il comando:
$ mkdir dati
Ora, se digitiamo il comando
$ ls
otterremo come output una lista di nomi di file e directory tra i quali dovrebe
comparire dati. Il percorso completo a questa directory sarà: /home/guest/dati.
Per spostarci nella directory dati a partire dalla directory /home/stone
dobbiamo digitare il comando:
3
$ cd dati
Per spostarci nella medesima directory a partire da qualsiasi punto digitiamo
$ cd /home/stone/dati
2.2.1
Un primo modo
Supponiamo di avere aperto una sessione di terminale e di trovarci nella directory /home/stone/dati. Digitando il comando
$ R
avviamo R il quale opererà già nella directory di lavoro /home/stone/dati e
quindi non dobbiamo fare nient’altro.
2.2.2
Un secondo modo
In alcune configurazioni, nel desktop di Linux compare un’icona attraverso la
quale si può avviare R. Con questo metodo di avvio, R si troverà generalmente
nella directory di lavoro /home/guest o in una qualche directory definita automaticamente, ma non in quella che noi vogliamo utilzzare per la gestione dei dati.
Per spostarci, dall’interno di R, nella directory di lavoro /home/guest/dati,
digitiamo, come in Windows:
> setwd("/home/guest/dati")
Ora dovremmo trovarci nella directory desiderata. Per accertarcene digitiamo:
> getwd()
e dovrebbe comparire l’output
> getwd()
[1] "/home/guest"
4