Magazzini Digitali, NBN, BNCF in Google Books Seminario

Transcript

Magazzini Digitali, NBN, BNCF in Google Books Seminario
Magazzini Digitali, NBN, BNCF in Google Books
Seminario
Conservare il digitale: gestione e salvaguardia, verso nuove frontiere di servizi
27 aprile 2010
Biblioteca Nazionale Braidense
Giovanni Bergamin
Biblioteca Nazionale Centrale Firenze
Magazzini Digitali
dal prototipo al servizio
Non più un prototipo, ma la realizzazione di una infrastruttura
 Si tratta ora di realizzare una infrastruttura per il servizio
nazionale di deposito legale delle pubblicazioni digitali (approvata e
finanziata dalla Direzione Generale Beni Librari )
 Lettera d’intenti firmata il 19 gennaio 2010 tra:
 Nazionale di Firenze e Nazionale di Roma soggetti depositari
(previsti dalla Legge 106/2004 -- Deposito legale)
 Biblioteca Marciana per il “dark archive”
 Fondazione Rinascimento Digitale (promotore e finanziatore del
progetto Magazzini Digitali)
 Comprende l’avvio del servizio e mantenimento per 3 anni
Il prototipo realizzato a partire dal 2006
dal 2009 ospita le tesi di dottorato digitali inviate alle Biblioteche
nazionali centrali
Indici generati
automaticamente
Accesso
utente
Indici generati
automaticamente
Nodo = Un insieme di
computer (unità di
mememorizzazione)
autonomi dal punto
di vista della
acquisizione dei dati
Visto unitariamente da
chi deposita
e da chi accede
htttp://depositolegale.it
Perché depositolegale.it ?
http://www.depositolegale.it
 http://memoria.depositolegale.it/http://td.unibo.it/ar/tesi234.ht
m
 http://memoria.depositolegale.it/doi:10.1045/789
 http://memoria.depositolegale.it/urn:nbn:it:34-6789
Le applicazioni e i supporti passano,
i dati e i metadati restano (o possono restare)
 I dati (i file contenenti dati) sono ospitati in file-contenitore
conformi a ISO 28500:2009 -- WARC
 I metadati (i file contenenti metadati) sono ospitati in filecontenitore conformi a MPEG21-DIDL (ISO 21000-2:2003)
 In questo momento tutti i file sono ospitati su hard disk
gestiti da “normalissimi” computer
La sicurezza si può comprare, la responsabilità invece no
Roma
Firenze
Le apparecchiature sono in housing
presso 3 differenti data center
certificati ISO 27001 -- gestiti da 3
soggetti differenti
2x3 repliche dello
stesso file (dati e
metadati)
Tutti i servizi sono
erogati direttamente
dalle istituzioni
responsabili
Dark Archive -- Venezia
Alcuni punti di partenza
 In un sistema informatico il malfunzionamento è la regola non
l’eccezione
 La ridondanza di oggetti poco costosi, ben conosciuti perché usati
quotidianamente garantisce la continuità del servizio
 La semplicità del disegno e la totale apertura dei componenti hardware e
software garantisce costi ragionevoli:
 di manutenzione
 di ’aggiornamento verso altri “oggetti d’uso quotidiano”
 Il controllo costante, l’individuazione rapida dell’errore e la possibilità di
garantire livelli accettabili di servizio mentre si rimuovono i
malfunzionamenti sono gli ingredienti fondamentali di un buon sistema
informatico
La nostra definizione di riferimento per
servizio di conservazione a lungo termine
A
 servizio pubblico fornito da depositi digitali accreditati o
affidabili (trusted o trustworthy digital repositories).
 per servizio pubblico = un servizio ritenuto essenziale e
strategico da una determinata comunità e accessibile
senza barriere di tipo economico, tecnologico ecc
 depositi digitali accreditati = standard per la certificazione
Trustworthy Repositories Audit & Certification (TRAC)
./.
La nostra definizione di riferimento per
servizio di conservazione a lungo termine
B
Il servizio assicura a lungo termine per una
comunità di riferimento la :
Vitalità
Traducibilità (da parte di un elaboratore)
Autenticità (Identità + Integrità)
Fruibilità (da parte di un essere umano)
Delle risorse depositate
Tre direzioni
 Tesi di dottorato digitali
 Sperimentazione art 37 DPR 252 2006
 periodici elettronici italiani (editoria commerciale)  modello di accordo
con l’editore che definisce le modalità di deposito, di trattamento e di
accesso)
 estensione del modello tesi (su base volontaria) agli altri archivi ad accesso
aperto
 Sostenibilità:
 servizi per il perpetual access?
 servizi per il persistent storage?
nbn
Abbiamo davvero bisogno di un
“Numero di Bibliografia Nazionale” per le
risorse digitali?
Come nasce l’NBN
dalla metà degli anni 90 sono stati proposti sistemi
di citazione della risorsa digitale basati sul nome
della risorsa (URN – Uniform Resource Name).
Obiettivi:
applicare il principio della “rubrica telefonica”:
mettere in relazione i numeri di telefono -- che come
gli indirizzi internet possono cambiare -- con i nomi
che invece rimangono stabili nel tempo (si parla in
questo caso anche di identificatori persistenti)
RFC 3188
Grazie al lavoro delle biblioteche nazionali
europee (in particolare della biblioteca
nazionale finlandese)
 nel 2001 è stata accolta in ambito
internazionale la proposta di un identificatore
persistente basato sul numero di bibliografia
nazionale
Qualche esempio
urn:nbn:hu-6982
urn:nbn:de:101:1-2010012009
3 obiettivi
 Come registrare l’associazione URN-URL (come
gestire la “rubrica”)
 Come “risolvere” un URN
 Come garantire la persistenza (… non è un
problema tecnologico ma di impegno istituzionale):
 Del nome
 Dell’associazione
 Della risorsa
L’accordo CNR MiBAC
Dal dire (la presentazione sulla stampa)
Al fare … sperimentazione per un anno
BNCF, BNCR e ICCU (SBN) come nodo
centrale
Biblioteca del CNR come “nodo delegato”
Quello che NBN non può essere
un catalogo centralizzato
 un archivio centralizzato
un’alternativa al DOI
Uno dei tanti servizi
che dovrà essere in grado di interoperare con:
altre infrastrutture di registrazione e risoluzione (es.
DOI);
SBN (Servizio Bibliotecario Nazionale);
Repository istituzionali
servizi di conservazione e di accesso nel lungo
periodo
motori di ricerca
...
BNCF in Google Books
... ma non solo
L’annuncio
1 milione di libri in pubblico dominio (fino al
1870)
Firenze, Roma (ma non solo)
Completamento della conversione del
retrospettivo
L’uso dei libri digitalizzati
dovranno restare in pubblico dominio
le bibioteche avranno la possibilità di
trasferire da Google in un proprio archivio:
i “master” ad alta risoluzione
l’ocr
i metadati tecnici (anche strutturali)
le biblioteche non hanno limitazioni nell’uso
grazie