Glossario e

Transcript

Glossario e
Dipartimento federale dell'interno DFI
Ufficio federale della cultura UFC
Biblioteca nazionale svizzera BN
Glossario e-Helvetica
Versione:
Versione 1.3
Data:
05.02.2016
Indice
Access
Administration
Archiviazione di lunga durata
Archival Storage
Backup incrementale
Basi di dati (database)
Board (bacheca)
Cache
Data Management
Digitalizzazione
Disponibilità a lungo termine
DOI (Digital Object Identifier)
Domain
e-Helvetica
e-Helvetica Access
e-Helvetica Deposit
E-mail
Emulazione
Formato di file
Formato proprietario
FTP (File Transfer Protocol)
Harvesting
Helvetica
Helveticat
Homepage
HTTP (Hypertext Transfer Protocol)
Hyperlink
Ingest
Internet
Intranet
JDBC
MARC
Metadati
METS (Metadata Encoding & Transmission Standard)
Migrazione
MODS (Metadata Object Description Schema)
NAS (Network Attached Storage)
NFS (Network File System)
Ninive
OAI (Open Archives Initiative)
OAI-PMH (Open Archives Initiative – Protocol for Metadata Harvesting)
OAIS (Open Archival Information System)
Pagina web
PDF
Persistent identifier
Preservation planning
Pubblicazioni elettroniche
Pubblicazioni in linea
Pubblicazioni digitali (born-digital)
Pubblicazioni digitalizzate (digitized)
Pubblicazioni ufficiali
Pubblicazioni universitarie
robots.txt
Server d’archivio
Server di documenti
SFTP (Secure File Transfer Protocol)
Sito web (website)
Siti web dinamici
Siti web statici
Supporto (di) dati
Tarball
URN (Uniform Resource Name)
Usenet (Newsgroup)
Web Harvesting
WebDAV
Weblogs (Blogs)
wget
World Wide Web (WWW)
XML (Extensible Markup Language)
2
3
3
3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4
4
5
5
5
5
5
5
5
5
5
5
6
6
6
6
6
6
6
6
7
7
7
7
7
7
7
7
7
8
8
8
8
8
8
8
8
8
8
8
9
9
9
9
9
9
9
9
9
10
10
10
Access
Processo del modello OAIS: messa a disposizione dei dati d'archivio per l'utilizzo.
Administration
Processo del modello OAIS: sorveglianza dei processi di lavoro nel sistema di archiviazione.
Archiviazione di lunga durata
Per archiviazione di lunga durata s'intendono la registrazione e la conservazione di informazioni a lungo
termine. A porre nuovi problemi è soprattutto la cosiddetta digital preservation, cioè l'archiviazione di
lunga durata di informazioni digitali.
Archival Storage
Processo del modello OAIS: stoccaggio degli oggetti digitali nel sistema di archiviazione.
Backup incrementale
Per backup incrementale si intende un backup completo del sistema di base. I nuovi dati aggiunti vengono provvisoriamente salvati. Per recuperare i dati va adottato un primo backup completo. Su questa
base i backup incrementali sono in seguito memorizzati nel sistema in ordine cronologico ascendente.
Basi di dati (database)
Le basi di dati sono dei sistemi che permettono di stoccare e gestire grandi quantità d'informazioni. Esse
contengono dei dati depositati secondo una struttura definita e dei programmi di gestione necessari allo
stoccaggio, alla ricerca e ad altre operazioni con i dati. Vengono comunemente chiamati database anche i programmi d'applicazione per l'organizzazione e la gestione strutturate di dati. I contenuti delle
basi dati vengono repertoriati mediante interfacce-utente interattive (per lo più proprietarie). L'utente
trasmette delle richieste individuali di ricerca, per le quali vengono elaborati dei risultati individuali.
Board (bacheca)
I board sono delle pagine definite in una mailbox (Bulletin Board System) o in un newsgroup nei quali
gli utenti possono scambiarsi informazioni, un po' come gli annunci affissi ad un albo.
Cache
La cache è una memoria tampone rapida, vale a dire una memoria che permette un accesso particolarmente rapido ai dati in essa contenuti. Vi vengono stoccati i dati utilizzati ripetutamente.
Data Management
Processo del modello OAIS: gestione e manutenzione dei dati d'archivio mediante metadati bibliografici,
tecnici ed amministrativi.
Digitalizzazione
La digitalizzazione di oggetti analogici richiede importanti investimenti. Gli obiettivi principali sono di
facilitare l'accesso ai contenuti da parte degli utenti e di conservare il contenuto degli oggetti minacciati
di degradazione. Per garantire il futuro degli interventi realizzati sono necessarie delle misure per l'archiviazione di lunga durata degli oggetti digitali.
Disponibilità a lungo termine
Il mantenimento della disponibilità a lungo termine di oggetti digitali comprende tutte le misure atte a far
sì che gli oggetti digitali possano ancora essere utilizzati dalle generazioni future. Con generazioni future
ci si riferisce ad un periodo di tempo illimitato nel futuro; ci si devono dunque aspettare:
- profondi cambiamenti tecnologici nei campi dello stoccaggio e dell'acceso agli oggetti digitali
- lo sviluppo di nuovi formati e supporti di dati, nonché la scomparsa dal mercato di quelli vecchi
- dei cambiamenti radicali nel comportamento dell'utenza e l'apparizione di nuovi generi di contenuti
d'informazione.
Si possono distinguere due tipi di misure di mantenimento della disponibilità a lungo termine:
3
-
le misure per la conservazione della sostanza del flusso di dati degli oggetti digitali (ad esempio il
refreshing)
le misure per la conservazione dell'utilizzabilità (ad esempio l'emulazione o la migrazione)
DOI (Digital Object Identifier)
Il Digital Object Identifier (DOI) permette l'identificazione univoca degli oggetti digitali. Il sistema DOI è
paragonabile a quelli dell'ISBN e dell'ISSN, ma si spinge oltre grazie alla sua funzione integrata di localizzazione.
Domain
Un domain è un dominio definito da caratteristiche comuni; ci si riferisce generalmente a un gruppo di
computer con degli elementi in comune nel nome (host name). Il più piccolo elemento comune del nome
viene denominato top-level-domain (ad esempio la sigla del paese, come ".ch", o l'abbreviazione
".com"). I dominî possono venir suddivisi in sotto-dominî (subdomain), i quali vengono chiamati secondlevel-domain, third-level-domain ecc.
e-Helvetica
L'espressione e-Helvetica è composta da «e», che sta per elettronici, e da «Helvetica», che indica le
pubblicazioni in relazione con la Svizzera.
e-Helvetica è anche la designazione di un servizio della BN addetto all'ampliamento costante della collezione digitale e alla sua catalogazione, archiviazione e messa a disposizione a lungo termine.
e-Helvetica Access
e-Helvetica Access è l'interfaccia di consultazione delle collezioni digitali della Biblioteca nazionale svizzera (BN), che permette la ricerca integrale nelle pubblicazioni digitali (ricerca a tutto testo).
In e-Helvetica Access trovate le pubblicazioni digitali conservate alla BN. Attualmente si tratta di libri,
riviste, pubblicazioni universitarie e pubblicazioni ufficiali originariamente digitali nonché siti web in relazione con la Svizzera. Oltre alla BN partecipano alla costituzione della collezione istituzioni partner.
In e-Helvetica Access potete trovare inoltre pubblicazioni digitalizzate successivamente dalla BN.
e-Helvetica Deposit
e-Helvetica Deposit è una piattaforma per permette agli editori di consegnare libri digitali unici.
E-mail
Un e-mail è un messaggio (testo, dati) che viene trasferito all'interno di una rete da un mittente ad un
destinatario grazie al servizio SMTP (Simple Mail Transfer Protocol).
Emulazione
Strategia tesa al mantenimento della disponibilità a lungo termine degli oggetti digitali, la quale prevede
di riprodurre (emulare) mediante degli appositi software in grado di funzionare sui sistemi operativi attuali le condizioni necessarie al sistema per poter utilizzare degli oggetti digitali più vecchi. Gli oggetti
digitali in quanto stessi vengono, se possibile, conservati nel loro formato originale. Le diverse strategie
di emulazione esistenti ed in parte concorrenti (emulazione dell'hardware contro emulazione del software) sono oggetto di discussioni.
Formato di file
Per riunire i dati in un file (cioè un insieme di informazioni digitali con un inizio ed una fine e contraddistinte da un nome) sono necessarie delle regole ben definite; un gruppo di queste regole costituisce ciò
che viene chiamato il formato del file. In alcuni casi i formati di file possono essere molto semplici, ad
esempio quando si limitano a definire la pure e semplice sequenza delle informazioni. In altri casi essi
richiedono lo stoccaggio di precise informazioni complementari in punti definiti nel file. Possono inoltre
richiedere la codificazione secondo precise regole dei dati e delle informazioni complementari. Fino alla
creazione di un formato d'archivio adeguato, la scelta del formato dei file è cruciale per l'archiviazione
di lunga durata dei dati. E' giudizioso scegliere dei formati largamente diffusi ed utilizzati da numerosi
programmi d'applicazione (ad esempio il formato TIF per le immagini) poiché si può ragionevolmente
supporre che nel futuro prossimo esisteranno dei programmi in grado leggere tali formati. Anche la
4
scelta di formati semplici (ad esempio TXT per i file di testo) è doverosa l'archiviazione di lunga durata;
in caso di bisogno sarebbe infatti possibile ricostruire ulteriormente le regole che ne definiscono il formato. Sono invece inadeguati i formati cosiddetti proprietari (come ad esempio il formato DOC di Microsoft) poiché il produttore può modificarli o limitarne l'uso a piacimento. Il formato di un file è spesso
desumibile dalla cosiddetta estensione del nome (la quale veniva in passato chiamata suffisso).
Formato proprietario
Un formato proprietario è una struttura di dati, un formato di file o di dati le cui specifiche non sono
disponibili o accessibili apertamente. Esempi: «.wma» o «.doc».
FTP (File Transfer Protocol)
Il File Transfer Protocol è un protocollo per il trasferimento di dati attraverso Internet. La sigla FTP
designa pure il servizio Internet sul quale questo protocollo è basato.
Harvesting
L'harvesting (o webharvesting), che in inglese significa mietitura, è un sistema per la raccolta automatizzata di pagine web mediante l'uso di un cosiddetto harvester (o robot).
Helvetica
Gli Helvetica sono costituiti dalle pubblicazioni apparse in Svizzera, da quelle che concernono la Svizzera, i suoi cittadini od i suoi abitanti e da quelle realizzate da o con il concorso di autori aventi un
legame con la Svizzera. Collezionare gli Helvetica è compito della Biblioteca nazionale svizzera.
Helveticat
Helveticat è il nome del catalogo della Biblioteca nazionale svizzera.
Homepage
Nel World Wide Web la homepage è la pagina d'accesso dei fornitori di pagine web. Essa viene altresì
chiamata pagina iniziale (più raramente pagina di benvenuto). Vengono però chiamati homepage anche
i siti web personali dei singoli internauti. La parola homepage viene dunque oggigiorno usata non più
solo per definire la pagina d'accesso di un sito, ma anche per definire l'insieme delle informazioni presenti su un sito.
HTTP (Hypertext Transfer Protocol)
L'Hypertext Transfer Protocol è un protocollo per il trasferimento di dati nel World Wide Web. Esso è
basato sul protocollo TCP/IP.
Hyperlink
L'hyperlink, o più comunemente link, è un legame tra un elemento di un ipertesto o di una pagina web
con un altro elemento sulla stessa pagina o con un'altra pagina. Il termine da cui parte il link è sottolineato ed evidenziato mediante un colore. I link sono pure frequentemente rappresentati da grafici (simboli).
Ingest
Processo del modello OAIS: presa a carico dei dati del produttore, preparazione per l'archiviazione ed
integrazione nel sistema di stoccaggio per l'archiviazione di lunga durata.
Internet
Internet è la più grande rete di computer esistente al mondo. Essa è composta da molteplici reti collegate
fra di loro e mette a disposizione un'infrastruttura di comunicazione assai variegata. Le prestazioni di
Internet - più comunemente chiamate servizi - comprendono fra l'altro l'e-mail (la posta elettronica), il
World Wide Web (o www, un sistema di documenti basato sull'ipertesto), Usenet (un forum di discussione), FTP (un sistema per il trasferimento di ogni genere di dati), IRC (cioè la chat), Gopher, Telnet,
Wais, Archie ed altri vecchi servizi la cui importanza va oggi scemando. Oggigiorno la parte più consistente di Internet è costituita dal World Wide Web; è per questa ragione che molti utenti tendono a
confondere quest'ultimo con l'Internet stessa.
5
Intranet
Una Intranet è una rete privata (ad esempio di un'azienda) funzionante con la stessa tecnologia di Internet. Contrariamente ad Internet però, una Intranet è accessibile solo ad una cerchia ristretta di utenti.
JDBC
Per Java Database Connectivity (JDBC) si intende un’interfaccia di banche dati della piattaforma Java
che propone un’interfaccia omogenea tra le banche dati di vari produttori e che è specialmente adeguata
alle banche dati relazionali. Interfaccia universale tra le banche dati, JDBC è comparabile a ODBC
(Windows) o DBI (Perl). Tra i compiti di JDBC figurano i seguenti: stabilire e amministrare le connessioni
alle banche dati, trasferire le richieste SQL alle banche dati, convertire i risultati in una forma utilizzabile
da Java e metterli a disposizione del programma.
MARC
Il formato MARC (Machine Readable Cataloging) è una norma ampiamente diffusa per la rappresentazione e lo scambio di dati bibliografici, notizie d'autorità, dati relativi ai fondi ed alla classificazione e di
altre informazioni leggibili dalla macchina.
Metadati
I metadati sono i dati sui dati. In altre parole, i metadati sono i dati che descrivono altri dati o oggetti. Si
tratta dunque di informazioni aventi lo scopo di agevolare quanto più possibile l'accesso ai dati stessi,
nonché la loro gestione ed il loro interscambio. I metadati contengono ad esempio informazioni sull'autore del documento o sulla data della sua pubblicazione, rinvii ad altri documenti sul medesimo tema
ecc. Le notizie bibliografiche sono dunque dei metadati. In ambito digitale, i metadati contengono, oltre
ai dati bibliografici, delle informazioni tecniche ed amministrative (formato del file, dimensione, data di
ripresa dei dati ecc.).
METS (Metadata Encoding & Transmission Standard)
METS è uno standard basato su XML ed utilizzato per la descrizione delle collezioni digitali di oggetti
descritti da metadati. Il formato dei metadati (MAB, MARC, Dublin Core ecc.) non viene definito da
METS e può dunque variare. METS definisce invece gli elementi utili al raggruppamento degli oggetti
ed alla loro messa in relazione con i metadati descrittivi ed amministrativi. Esso permette ad esempio
la codifica di opere strutturate gerarchicamente o altrimenti; un'opera può essere una collezione di libri,
un libro strutturato in capitoli e pagine o un film strutturato in scene. Per legare i file METS agli oggetti
digitali dai quali si vuol estrarre le informazioni viene utilizzato un sottoinsieme dello schema XLink.
Migrazione
Strategia tesa al mantenimento della disponibilità a lungo termine degli oggetti digitali. In risposta ai
cambiamenti tecnici dettati dall'evoluzione degli ambienti gli oggetti vengono sottoposti a procedure
aventi lo scopo di garantire la loro utilizzabilità nelle nuove condizioni.
MODS (Metadata Object Description Schema)
Per MODS (Metadata Object Description Schema) si intende uno standard di metadati della Library of
Congress basato sullo schema XML, utilizzato per descrivere i dati bibliografici.
NAS (Network Attached Storage)
Per Network Attached Storage (NAS) si intendono server di file semplici da amministrare. Vengono
utilizzati per mettere a disposizione, senza l’impiego di ingenti risorse, un’indipendente capacità di memoria su una rete di computer. Contrariamente al Direct Attached Storage, NAS funge da host autonomo
con un proprio sistema operativo. Visto che le funzioni sono specificamente adeguate alla loro utilizzazione, gli errori legati a possibilità di configurazioni svariate e superflue possono essere evitati dall’inizio.
I servizi legati a file come per esempio NFS oppure SMB/CIFS rappresentano la funzione principale.
Per questo motivo spesso i sistemi NAS vengono chiamati filer. Un disco rigido corrente integrato a una
cassetta esterna con presa di rete RJ-45, del rispettivo firmware e con altre opzioni di connessione,
corrisponde a un NAS.
6
NFS (Network File System)
Il Network File System – NFS – anche chiamato Network File Service, è un protocollo elaborato da Sun
Microsystems che permette di accedere ai file tramite rete. Le modalità di trasmissione dei file divergono
da quelle utilizzate per esempio nell’ambito di FTP. L’utenza ha la possibilità di accedere ai file conservati su un computer a distanza come se fossero salvati sul suo disco rigido locale.
Ninive
Ninive è il sistema di stoccaggio della Biblioteca nazionale svizzera per l’archiviazione a lungo termine.
OAI (Open Archives Initiative)
Interfaccia standardizzata per lo scambio dei metadati basata sull'Open Archive Initiative Protocol for
Metadata Harvesting, la quale permette, grazie ai metadati, la ricerca in rinomati archivi documentari.
OAI-PMH (Open Archives Initiative – Protocol for Metadata Harvesting)
OAI-PMH è un protocollo per lo scambio di metadati. Esso permette ai server di documenti compatibili
OAI-PMH di raccogliere ed indicizzare i metadati di altri server compatibili OAI-PMH. Le ricerche lanciate
nel motore di ricerca di uno di questi server restituiscono così anche i documenti appartenenti agli altri.
Un server compatibile OAI-PMH può svolgere contemporaneamente le funzioni di fornitore e di mietitore
(harvester) di metadati.
OAIS (Open Archival Information System)
OAIS è un modello di riferimento certificato ISO 14721, il quale descrive un archivio come un'organizzazione all'interno della quale uomini e sistemi operano insieme nell'intento di conservare determinati
documenti per metterli a disposizione di una cerchia definita di utenti. La conformità al modello OAIS
presuppone l'impegno a rispettare le condizioni quadro da esso definite. Il modello OAIS non regola il
design né l'implementazione di un archivio conforme ad OAIS.
Pagina web
Una pagina web è una pagina messa a disposizione nel World Wide Web da un fornitore d'informazioni.
Non si deve confondere la pagina web con il sito web. Un sito web è di solito composto da un gruppo di
pagine web ordinate gerarchicamente. La pagina web che consente l'accesso ad un sito web è chiamata
homepage o pagina iniziale (più raramente pagina di benvenuto).
PDF
PDF è un formato di file basato su Postscript e creato dall'azienda Adobe per la rappresentazione dei
documenti con la loro impaginazione originale (ad esempio interruzioni di pagina fisse, posizione delle
illustrazioni ecc.). Il formato PDF è dunque interessante non solo per l'editoria commerciale, ma anche
per le pubblicazioni scientifiche, soprattutto nell'ottica del problema della citazione nei documenti elettronici. Nonostante una certa apertura, il formato PDF è un formato cosiddetto proprietario; la sua idoneità quale formato per l'archiviazione di lunga durata è dunque assai contestata. Alfine di favorire una
maggiore diffusione del formato PDF per l'archiviazione di lunga durata è stato introdotto, limitatamente
ad un sottoinsieme del formato (PDF/A = Archive), un processo di standardizzazione (ISO 19005-1.
Document management - Electronic document file format for long-term preservation - Part 1: Use of
PDF (PDF/A)).
Persistent identifier
I persistent identifier sono degli identificatori univoci di oggetti digitali che allo stesso tempo permettono
un accesso durevole alle risorse elettroniche, indipendentemente dalla loro collocazione. La Biblioteca
nazionale svizzera attribuisce i persistent identifier sulla base del National Bibliography Number (NBN).
Preservation planning
Processo del modello OAIS: pianificazione ed attuazione delle misure di conservazione di lunga durata
sugli oggetti digitali nel sistema di archiviazione.
7
Pubblicazioni elettroniche
Per pubblicazioni elettroniche si intendono sia le pubblicazioni online che quelle offline. Esse vengono
anche chiamate pubblicazioni digitali.
Pubblicazioni in linea
Le pubblicazioni in linea (o online) rappresentano un sottoinsieme delle pubblicazioni elettroniche. Esse
vengono pubblicate e diffuse in Internet senza supporto fisico e si presentano sotto ogni sorta di formato
di dati ed in molteplici forme. Alcuni esempi: rivista elettronica, banca dati, newsletter per e-mail ecc.
Altre espressioni utilizzate: pubblicazioni in rete, pubblicazioni elettroniche non fisiche e pubblicazioni
non fisiche.
Pubblicazioni digitali (born-digital)
Le pubblicazioni digitali sono pubblicazioni realizzate originariamente in digitale. Esse sono memorizzate su supporto digitale ed esistono solo in questa forma.
Pubblicazioni digitalizzate (digitized)
Si parla di pubblicazioni digitalizzate in presenza di pubblicazioni convertite dalla forma analogica (ad
esempio su supporto cartaceo) a quella digitale.
Pubblicazioni ufficiali
Le pubblicazioni ufficiali sono informazioni pubblicate su qualsiasi supporto (cartaceo o altro) da un'unità
dell'Amministrazione federale centrale.
Pubblicazioni universitarie
Con pubblicazioni universitarie si intendono le tesi e le tesi di abilitazione pubblicate dalle università.
robots.txt
Dopo l’approvazione del protocollo di Robot Exclusion Standard, quando il webcrawler (robot) trova una
pagina web legge in primo luogo il file robots.txt (scritto in minuscolo) nel directory principale (root) di
un dominio. In questo file si può specificare se la pagina web può essere visitata da un webcrawler e le
modalità di questo procedimento. L’utenza dei siti web ha la possibilità di sospendere la presenza web
di domini scelti per alcuni motori di ricerca. Il protocollo, di carattere puramente indicativo, dipende dalla
collaborazione con il webcrawler. In questi casi si parla di webcrawler «amichevoli». L’esclusione dalla
presenza web di certe parti tramite protocollo non ne garantisce la dissimulazione. A questo scopo i file
.htaccess consentono di proteggere le pagine e le sottorubriche di un server. Tuttavia alcuni motori di
ricerca riportano sulle loro pagine dei risultati gli URL individuati da un webcrawler, ma non riportano
alcuna descrizione delle pagine.
Server d’archivio
Con server d'archivio viene designata un'infrastruttura tecnica ed organizzativa i cui compiti principali
sono lo stoccaggio, la gestione e l'archiviazione di lunga durata di oggetti digitali. Nel campo dell'archiviazione di lunga durata si separano i server del tipo server d'archivio dai server del tipo server di documenti alfine di distinguere ciascuno degli assi fondamentali del sistema.
Server di documenti
Un server di documenti è un sistema tecnico ed organizzativo il cui compito principale è la messa a
disposizione di oggetti digitali all'utente finale. Questo tipo di server collabora con un server d'archivio
alfine di garantire la disponibilità a lungo termine degli oggetti messi a disposizione.
SFTP (Secure File Transfer Protocol)
SFTP, chiamato anche Secure FTP, è un protocollo di rete che permette di trasferire dati tramite reti
TCP/IP. La particolarità consiste nella possibilità di canalizzare parzialmente le connessioni File Transfer Protocol (FTP) non salvate utilizzando Secure Shell (SSH).
Sito web (website)
Un sito web è generalmente costituito da un gruppo di pagine web ordinate gerarchicamente.
8
Siti web dinamici
Nel contesto biblioteconomico i siti web dinamici sono delle pubblicazioni non terminate al momento
della loro prima apparizione, ma soggette a cambiamenti e complementi in misura e con frequenza
variabili (si parla in questo caso di risorse integratrici).
Siti web statici
Nel contesto biblioteconomico i siti web statici sono delle pubblicazioni terminate al momento della loro
prima apparizione e che in seguito non subiranno più alcuna modifica (risorse monografiche). Le "versioni" dei siti web statici vengono considerate come nuove pubblicazioni in linea.
Supporto (di) dati
Vengono chiamati supporti dati i media di stoccaggio meccanici od elettronici sui quali vengono memorizzati durevolmente dei dati digitali in seguito riestraibili. Si possono citare ad esempio i supporti dati
magnetici (dischetti, bande magnetiche) ed ottici (CD-ROM, DVD).
Tarball
Per «Tar» si intende un programma di archiviazione molto sfruttato in ambito Unix nonché il formato
del file ottenuto (con desinenza «tar»). Il nome si fonda su una nastroteca (Tape Archive). Infatti, originariamente il programma serviva a salvare dati su dispositivi di trascinamento del nastro magnetico.
Tar consente di convertire sequenzialmente vari file in un unico file, ovvero di ristabilire dati. Il file
creato viene anche denominato tarball. Il tipo MIME per file in tar è l’application/x-tar.
URN (Uniform Resource Name)
Un URN è un persistent identifier. Esso può sostituire un URL (Uniform Resource Locator, in altre parole
un link) nel catalogo o in altri repertori oppure ancora venir utilizzato all'interno dei documenti come
riferimento stabile. L'aggiornamento dei riferimenti richiede meno tempo poiché gli URL vengono aggiornati automaticamente in modo centralizzato. I link possono venir integrati a più repertori. Con l'URN
le pubblicazioni elettroniche ricevono un identificatore univoco riconosciuto a livello mondiale e possono
dunque venir citate in modo affidabile. L'URN garantisce inoltre un accesso durevole agli oggetti. L'accesso durevole è assicurato dall'archiviazione di lunga durata (o almeno dall'archiviazione) così come
dall'alta disponibilità tecnica del servizio URN. Un URN rimanda almeno ad un URL attraverso cui accedere all'oggetto. Gli URN possono gestire più copie del medesimo oggetto (dunque più URL) come
pure diversi formati di presentazione degli oggetti.
Usenet (Newsgroup)
Usenet è una rete di forum o gruppi di discussione, la quale di principio è indipendente da Internet.
Usenet viene anche chiamata Newsgroup, termine che può però creare confusione: un newsgroup è
infatti solo una piccola parte di Usenet che tratta di un tema preciso. Esistono dei newsgroup anche al
di fuori di Usenet, ad esempio nelle intranet di imprese, scuole ed università.
Web Harvesting
Vedi Harvesting.
WebDAV
WebDAV (Web-based Distributed Authoring and Versioning) è uno standard aperto che rende disponibili file in Internet. Gli utenti possono accedere ai loro dati come su un disco rigido online. Esempi noti
sono l’iDisk, il disco rigido virtuale su Internet di Apple, il GMX MediaCenter o il disco rigido online aon
di Telekom Austria. Da un punto di vista tecnico WebDAV è un’estensione del protocollo HTTP/1.1 che
annulla alcune restrizioni di HTTP. Finora moduli online permettevano di caricare solo singoli file (HTTPPOST). Con WebDAV è possibile trasmettere interi indirizzari. Inoltre il controllo delle versioni è specificato.
Weblogs (Blogs)
Un weblog, più comunemente chiamato semplicemente blog, è una pagina web che viene periodicamente aggiornata con nuove iscrizioni, una specie di diario virtuale nel quale l'autore (detto blogger)
annota i suoi pensieri nonché dei link commentati a risorse Internet visitate.
9
wget
Per GNU Wget si intende un programma libero di linea di comando che permette lo scaricamento di
risorse (file, pagine web, ecc.) tramite rete. Tra i protocolli sostenuti figurano ftp, http e https. La prima
versione, elaborata da Hrvoje Niksic, risale al 1995. Questo programma può essere utilizzato con UNIX,
GNU/Linux, OS/2, Windows e SkyOS. Fa parte della GNU General Public License e del progetto GNU.
Il protocollo è stato elaborato da un gruppo indipendente nel 1994, ma nel frattempo è riconosciuto
all’unanimità e può essere considerato un quasi standard. Pubblicato il 30 novembre 2007, ACAP 1.0
(Automated Content Access Protocol) è un possibile ampliamento del Robot Exclusion Standard. Agli
inizi di giugno 2008 Google, Microsoft e Yahoo si sono accordati su alcuni punti comuni.
World Wide Web (WWW)
Il World Wide Web è un sistema ipermediale per Internet sviluppato nel 1989 presso il CERN, il Centro
europeo di ricerca nucleare. Il sistema WWW permette l'accesso ad ogni genere di documento memorizzato in formato digitale su qualsiasi computer del mondo collegato al sistema. I documenti sono testi
ed ipertesti, come pure file audio, immagini e film. Il World Wide Web e Internet non sono la stessa
cosa, il WWW si basa su Internet. Tuttavia oggigiorno la maggior parte degli internauti utilizza per le
sue attività quasi esclusivamente il World Wide Web; è per questa ragione che molti utenti tendono a
confondere quest'ultimo con l'Internet stessa. Il World Wide Web utilizza il protocollo HTTP, il quale non
è l'unico ad essere utilizzato in Internet (esiste anche, ad esempio, il protocollo FTP). La maggior parte
dei documenti testuali presenti nel WWW è oggi realizzata mediante il linguaggio di descrizione HTML
(Hypertext Markup Language), del quale gli hyperlink sono la caratteristica principale. Questi ultimi consentono di chiamare, a partire da un documento, un qualsiasi altro documento accessibile nel WWW
grazie ad una procedura standardizzata ed utilizzando il protocollo HTTP. Accanto al diffusissimo HTML,
esiste una moltitudine di altri formati di dati per i testi e per altri tipi di documenti.
XML (Extensible Markup Language)
L'Extensible Markup Language, abbreviato XML, è uno standard per la creazione di documenti leggibili
da macchine ed uomini. XML definisce le regole per la realizzazione di questi documenti. Per ogni caso
concreto d'applicazione (applicazione XML) si tratta di specificare i dettagli dei documenti in questione.
XML è dunque un metalinguaggio utilizzabile per creare nuovi (seppure molto simili nella loro struttura
di base) linguaggi atti a descrivere documenti strutturati. Le strutture XML sono particolarmente adatte
per la disponibilità di lunga durata, poiché si tratta di uno standard aperto a molteplici possibilità di
strutturazione per i tipi più disparati di oggetti. Esse sono interpretabili dalle macchine poiché seguono
regole formali.
10