LA CONSERVAZIONE DIGITALE

Transcript

LA CONSERVAZIONE DIGITALE
LA CONSERVAZIONE DIGITALE:
PROBLEMATICHE E STRATEGIE
di Stefano Allegrezza
(estratto dal libro “Informatica di base. Conoscere e comprendere le risorse digitali nella società
dell’informazione”, Edizioni SIMPLE, Macerata, 2009)
1
2
3
4
1
2.1
2.2
2.3
3.1
3.2
3.3
3.4
3.5
Introduzione ...................................................................................................................................... 1
Le problematiche della conservazione digitale ........................................................................ 2
L’obsolescenza dell’hardware e del software ....................................................................... 3
L’obsolescenza dei supporti ..................................................................................................... 3
L’obsolescenza dei formati........................................................................................................ 4
Le strategie di conservazione digitale......................................................................................... 4
Trasferimento su supporti analogici ...................................................................................... 4
Conservazione tecnologica....................................................................................................... 6
Riversamento diretto e sostitutivo ..........................................................................................7
Emulazione ................................................................................................................................... 8
Archeologia digitale.................................................................................................................... 9
Conclusioni ......................................................................................................................................10
Introduzione
Oggi buona parte delle informazioni che vengono quotidianamente prodotte sono in formato
digitale: se dobbiamo scrivere un documento di testo utilizziamo un word processor;
utilizziamo una macchina fotografica digitale per immortalare i nostri ricordi più cari e una
videocamera digitale per riprendere le scene che vogliamo rivedere nel tempo; ascoltiamo
musica in formato digitale utilizzando i lettori per i CD Audio o i lettori MP3; effettuiamo le
nostre ricerche navigando nel web, anch’esso costituito da una mole incredibilmente vasta di
informazioni digitali. Quasi più nessuno scrive lettere utilizzando carta e penna, perchè ormai
le comunicazioni avvengono tramite posta elettronica, brevi messaggio di testo (SMS) o
telefonate effettuate tramite VoIP1. Anche il nostro conto corrente non è altro che una
informazione digitale memorizzata in un database della banca.
Tutti questi contenuti digitali danno origine ad un vero e proprio paradosso: pur trattandosi
di “materiale” fondamentalmente semplice (dal momento che è costituito da sequenze di bit
che possono assumere solamente i valori di “0” ed “1”), esso risulta estremamente “fragile” ed a
rischio di scomparsa se non vengono messe in atto le opportune strategie per assicurarne la
conservazione nel lungo periodo. Ormai da quasi un ventennio questa è una delle domande
che assilla in maniera sempre più preoccupante la comunità scientifica internazionale, la
quale si chiede se è in grado di assicurare la sopravvivenza nel tempo di tutta l’enorme
quantità di contenuti digitali che la società attuale produce. Per rispondere a questa domanda
occorre comprendere la motivazione per cui è così difficile conservare le informazioni digitali
rispetto a quelle analogiche. Semplificando le cose in maniera molto drastica, si può osservare
come per la fruizione di contenuti analogici (si pensi, ad esempio, ad una lettera tradizionale)
sia necessaria (e sufficiente) solamente una buona vista2, mentre per la fruizione di tutti i
contenuti digitali è necessaria, oltre ad una buona vista, anche un'apposita infrastruttura
1
Il VoIP (Voice over IP) è la tecnologia che consente di utilizzare la rete Internet per effettuare telefonate a
basso costo. Anche in questo caso le informazioni che viaggiano sono di tipo digitale. Uno dei più noti
programmi che consentono di effettuare telefonate VoIP è Skype.
2
In realtà alcuni contenuti analogici necessitano anch’essi di strumenti tecnologici per la loro fruizione: si pensi
ai vecchi dischi in vinile o alle tradizionali cassette audio musicali (compact cassette), ma in generale si tratta di
strumenti tecnologici che accompagnano l’intera vita del supporto su cui tali contenuti sono memorizzati.
1
hardware e software (si veda la Figura 1.1). È proprio l’evoluzione tecnologica continua e
costante che questa infrastruttura subisce che rende difficile la conservazione degli oggetti
digitali.
Infatti, un oggetto digitale è prodotto utilizzando una particolare infrastruttura hardware e
software ed è memorizzato in un file, ovvero una sequenza di bit (“0” ed “1”) che non sono in
alcuna maniera intelligibili da un essere umano. Quando si vuole accedere al contenuto
digitale racchiuso nel file, questa sequenza deve essere letta di nuovo mediante l’infrastruttura
hardware e software ed interpretata in una maniera che è spesso unica per quella data
infrastruttura. Il risultato dell’interpretazione è mostrato su schermo e ciò che si vede è una
rappresentazione dell’oggetto digitale. In parecchi casi il file non può essere correttamente
interpretato se non con una particolare combinazione di hardware e software: se l’oggetto
digitale è riprodotto in un ambiente diverso rispetto a quello in cui era stato creato, potrebbe
essere visualizzato ed avere un comportamento anche completamente diverso rispetto
all'originale.
Figura 1.1: La fruizione dei contenuti analogici e digitali a confronto: nel secondo caso è sempre
necessario uno strato di intermediazione sia hardware che software
2
Le problematiche della conservazione digitale
Esistono fondamentalmente tre grosse problematiche che rendono difficile la conservazione
dei contenuti digitali: l’obsolescenza delle tecnologie hardware e software, l’obsolescenza dei
supporti e l’obsolescenza dei formati (si veda la Figura 2.1).
Figura 2.1: Le principali problematiche della conservazione digitale
2
2.1
L’obsolescenza dell’hardware e del software
La prima e più immediata questione riguarda l’obsolescenza della piattaforma tecnologica
(hardware e software) necessaria per la fruizione dei contenuti digitali. Da diversi decenni si
assiste ad una continua evoluzione di tali infrastrutture: il computer appena acquistato dopo
soli due anni è già obsoleto e va sostituito con uno più moderno e potente; il sistema
operativo va anch’esso aggiornato alla nuova versione e parallelamente i programmi con cui
creiamo e gestiamo i contenuti digitali devono essere anch’essi aggiornati o rimpiazzati da
altri. Nel giro di pochi anni l’evoluzione tecnologica rende del tutto obsoleta l’infrastruttura
hardware e software costringendoci a cambiarla: in questo continuo processo cambiano i drive
per leggere i supporti di memorizzazione (si pensi al lettore di floppy disk da 3 pollici e ½ che è
scomparso dai computer attuali), cambiano le porte di input/output (oggi si utilizzano le porte
USB tramite le quali è possibile accedere, ad esempio, ai contenuti memorizzati su una
pendrive, ma fra dieci anni ci saranno ancora?), cambiano i programmi (oggi per scrivere un
documento di testo si utilizza Microsoft Word, ma chi può dire quale programma si
utilizzerà fra dieci anni?). L’obsolescenza dell’hardware e del software costituisce una seria
minaccia alla possibilità di conservare nel tempo i contenuti digitali.
2.2
L’obsolescenza dei supporti
Un secondo problema è costituito dall’obsolescenza dei supporti. Esiste una grande varietà di
supporti su cui il materiale digitale può essere memorizzato, dalle schede e ai nastri perforati
di storica memoria, che rappresentavano i bit attraverso una serie di fori, alla vasta gamma di
supporti di memorizzazione oggi disponibili basati sulle tecnologie magnetiche, ottiche ed
elettroniche (floppy disk, dischi fissi, nastri magnetici, CD, DVD, HD-DVD, BB, memorie flash,
etc.). Nel corso di questi anni abbiamo assistito ad un rapidissimo evolversi dei supporti di
memorizzazione utilizzati (si veda la Figura 2.2): basti pensare che solamente una ventina di
anni fa si utilizzava il floppy disk da 5 pollici e ¼, supporto che attualmente è solo un reperto
storico e risulta praticamente impossibile da leggere. La produzione a livello mondiale del suo
successore, il floppy disk da 3 pollici e ½, è terminata all’inizio del 2007 ed anch’esso è diventato
ormai un supporto obsoleto.
Figura 2.2: Alcune generazioni di supporti che si sono succeduti nel tempo
Quando, agli inizi degli anni ’80, vennero prodotti i primi Compact Disc (CD) si era convinti
che si trattasse di supporti con una capacità di memorizzazione talmente elevata che sarebbe
stata sufficiente per soddisfare le necessità di memorizzazione dei dati per diversi decenni.
Invece, dopo solo una quindicina di anni i CD sono stati soppiantati dai DVD, i quali a loro
volta sono stati soppiantati dai nuovi supporti con capacità ancora maggiore (quali gli HDDVD e i Blu-ray Disc); anche questi non avranno una vita eccessivamente lunga perché
saranno sostituiti dai nuovi supporti che attualmente sono in fase di sviluppo (ad esempio, i
dischi olografici) e che consentiranno capacità di archiviazione finora impensabili, e così via.
Il problema dell’obsolescenza dei supporti viene alla luce quando una tecnologia comincia
d'essere obsoleta, dal momento che i dati memorizzati sui supporti che si basano su quella
3
tecnologia diventano in breve inaccessibili. Riprendendo l’esempio proposto poco fa, i dati
memorizzati su un floppy disk da 5 pollici e ¼ sono ormai inaccessibili se non si è provveduto a
suo tempo a riversare il contenuto da quel supporto ad un altro supporto più recente.
2.3
L’obsolescenza dei formati
Un problema spesso sottovalutato ma in realtà forse più complesso di quello rappresentato
dai supporti è costituito dall’obsolescenza dei formati. Molti ricorderanno che solamente una
ventina di anni fa il software di elaborazione testi più utilizzato era Wordstar, un programma
con interfaccia a carattere (nulla a che vedere con l’interfaccia grafica dei moderni programmi
di elaborazione testi) che produceva documenti di testo in un formato proprietario
identificato dall’estensione .ws. Se avessimo ancor oggi dei documenti di testo in quel formato,
memorizzati magari sui floppy disk in uso all’epoca (floppy disk da 5 pollici e ¼ o da 3 pollici e
½), saremmo in grado di visualizzarne il contenuto? Anche ipotizzando che i supporti siano
ancora in buone condizioni di conservazione, sicuramente avremo difficoltà ad accedere a tali
contenuti dal momento che il formato .ws utilizzato dal programma Wordstar non è più
gestito dagli attuali programmi di elaborazione testi (ad esempio, Microsoft Word) ed è
difficile trovare strumenti di conversione che consentano di trasformare quei file in formati
oggi accessibili. La strada per risolvere questo genere di problema passa sicuramente
attraverso l’adozione, fin dal momento della formazione dei contenuti digitali, di formati che
abbiano le caratteristiche per fornire le maggiori garanzie in termini di conservazione a lungo
termine.
Figura 2.3: Le principali strategie di conservazione digitale
3
Le strategie di conservazione digitale.
Nel corso degli ultimi quindici - venti anni le problematiche connesse con la conservazione
digitale sono state affrontate sotto molteplici punti di vista e sono state proposte diverse
strategie di conservazione al fine di giungere ad una loro soluzione. Le principali sono (si veda
la Figura 2.3): trasferimento su supporti analogici (output to analogue media); conservazione
tecnologica (technology preservation); emulazione (emulation); riversamento diretto (refreshing) e
sostitutivo (migration); archeologia digitale (digital archaelogy). Nel seguito sarà brevemente
esaminata ciascuna di queste strategie.
3.1
Trasferimento su supporti analogici
La prima e più banale strategia di conservazione si basa sulla seguente considerazione: se i
supporti analogici (carta, pergamena, microfilm, etc.) sono stati finora in grado di conservare
4
nel tempo le informazioni, perché non continuare ad utilizzarli anche in quest’epoca digitale?
Si tratta della strategia denominata trasferimento su supporto analogico e che è stata proposta
soprattutto nel caso dei documenti adatti ad essere trasferiti su supporto cartaceo (si veda la
Figura 3.1); in tal caso prende il nome di “stampa su carta” (printing to paper). Essa parte
dall’assunto che stampare tutti i documenti su carta, un supporto che conosciamo bene e che
siamo abituati a maneggiare ormai con una certa dimestichezza, sia il modo migliore per
conservarli3. Seppure a prima vista possa sembrare incredibile, si tratta di una strategia
tuttora ampiamente implementata, anche presso organizzazioni di una certa complessità (ad
esempio grosse aziende o Pubbliche Amministrazioni).
Figura 3.1: La strategia printing to paper
Questa strategia è stata ampiamente utilizzata nel passato durante il processo di
conservazione di materiali analogici fragili, quando, durante la fase di riparazione o
restaurazione del materiale stesso, ne veniva creata una copia di alta qualità. Ciò consentiva la
creazione di “surrogati” (fotografie, microfilm, fotocopie di alta qualità, etc.) capaci di
soddisfare le necessità di accesso della maggior parte degli utenti e che avrebbe in questo
modo aiutato a conservare e preservare gli originali. Tuttavia, oggi che gli originali nascono
direttamente in formato digitale, c'è ancora la necessità di produrre un loro “surrogato”
analogico? Ancora: la produzione di una versione analogica dell’oggetto digitale è una
appropriata strategia di conservazione?
Ovviamente questa è una strategia assolutamente non percorribile, e questo per almeno due
ordini di motivi. Innanzitutto, nel caso della stampa su carta, questa elimina l’intelligenza del
documento: le capacità di ricerca e recupero delle informazioni, l’utilizzo simultaneo da parte
di più utenti, etc. Si pensi ad un foglio elettronico che, nel momento in cui viene stampato su
carta, non è più utilizzabile, ad esempio, per ricalcolare i totali; oppure ad una e-mail che, nel
momento in cui viene stampata, non consente più la possibilità di effettuare ricerche
automatiche sul corpo del messaggio. In secondo luogo, i contenuti digitali di oggi non sono
solo costituiti da documenti di testo o da immagini (per i quali sarebbe ipotizzabile come
strategia la stampa su carta), ma anche da contenuti audio e video: come è possibile
“stampare” tali contenuti su carta? Nel caso dei messaggi di posta elettronica, come è
possibile trasferire su supporto cartaceo gli eventuali allegati, costituiti ad esempio da fogli
elettronici, database, programmi? Infine, nel trasferimento su supporto analogico possono
essere persi, in tutto o in parte, i metadati necessari per determinare il contesto del
messaggio, eliminando in questo modo le informazioni che possono garantire l’autenticità del
documento. Non bisogna poi dimenticare che la tenuta di archivi per la conservazione dei
documenti cartacei richiede spazi e costi notevoli.
3
I propugnatori di questa strategia forniscono anche alcuni preziosi consigli per risparmiare sul consumo di
carta, come stampare fronte retro, utilizzare un carattere molto piccolo, etc. Una delle caratteristiche migliori
della carta è che essa si conserva per un periodo di tempo estremamente lungo e non c'è bisogno di preoccuparsi
del fatto che sia o meno compatibile con i cambiamenti dell'hardware e del software del proprio computer.
5
In definitiva, il trasferimento su supporti analogici non è una strategia di conservazione
digitale percorribile: un contenuto che nasce digitale va conservato nel formato digitale.
3.2
Conservazione tecnologica
Un’altra strategia che a prima vista potrebbe sembrare applicabile è costituita dalla
conservazione dell’ambiente tecnologico necessario per riprodurre i contenuti digitali nella loro
forma originaria. Questa strategia implica ovviamente la conservazione sia dell’hardware (il
computer e le periferiche ad esso collegate) che del software (il sistema operativo, i programmi
con cui sono stati creati i contenuti digitali, i driver per i lettori dei supporti, etc.). Questo tipo
di soluzione viene anche denominata “archeologia informatica”4 e porta inesorabilmente alla
costituzione di veri e propri musei del computer (si veda la Figura 3.2) nei quali conservare in
buona efficienza tutti i computer con i relativi programmi e le relative periferiche necessari
per la fruizione dei contenuti digitali che si intendono conservare.
Figura 3.2: Un esempio di computer museum
Questo tipo di strategia può estendere la finestra temporale di accesso ai supporti ed ai
formati di file obsoleti ma non è ovviamente una soluzione definitiva dal momento che nessun
tipo di infrastruttura hardware e software può essere mantenuta in funzione all’infinito. Inoltre,
essa offre la potenzialità di contrastare l’obsolescenza dei supporti ma solo nell'ipotesi che
essi non abbiano subito un decadimento per quanto riguarda la leggibilità, altrimenti deve
essere necessariamente accompagnata da cicli regolari di aggiornamento dei supporti. Infine,
occorre considerare che, qualora possibile, mantenere in funzione una tecnologia obsoleta
richiede investimenti finanziari davvero notevoli. Si tratta, pertanto, di una strategia che
potrebbe essere considerata valida solamente per garantire la conservazione di risorse
estremamente importanti e rare. Occorre, tuttavia, essere coscienti del fatto che può essere
mantenuta per un periodo di tempo limitato, in attesa di adottare una strategia di
conservazione a lungo termine migliore.
4
Da non confondere con l'archeologia digitale, che consiste nell’applicazione di metodi e procedure per recuperare
il contenuto informativo da supporti danneggiati, da ambienti hardware e software obsoleti od anche da file
codificati secondo formati obsoleti. Essa viene utilizzata per recuperare gli oggetti digitali che non sono stati
sottoposti ad una appropriata strategia di conservazione digitale. Si veda il paragrafo 3.5.
6
3.3
Riversamento diretto e sostitutivo
I supporti per la memorizzazione digitale diventano rapidamente obsoleti sia perché i
materiali su cui si basa la memorizzazione perdono progressivamente le loro caratteristiche di
ritenzione dei dati, sia perché nel tempo vengono introdotte nuove tecnologie che rendono
obsoleti i drive per i vecchi supporti di memorizzazione (per cui il supporto potrebbe
continuare ad essere “leggibile” ma non esiste più il drive che ne consente la lettura). Di
conseguenza, per assicurarne la sopravvivenza, i contenuti digitali devono essere
periodicamente riversati su supporti nuovi e non obsoleti. Il riversamento diretto (refreshing)
consiste nel trasferire un contenuto digitale da un supporto di memorizzazione obsoleto ad
un nuovo supporto senza modificare la sequenza di bit di cui è costituito. Il nuovo supporto
può essere dello stesso tipo (ad esempio da un CD-R verso un altro CD-R) o di tipo diverso
(ad esempio, da un CD-R ad un DVD-R). Si tratta di un processo che è sempre necessario,
indipendentemente da qualunque altra strategia di conservazione che venga adottata. Dal
punto di vista tecnico è relativamente semplice, con un bassissimo rischio di perdita di dati se
viene eseguito e documentato nella maniera corretta.
Figura 3.3: Schema di funzionamento della strategia di conservazione digitale
basata sul riversamento sostitutivo
Accanto al riversamento diretto occorre sempre adottare la strategia di conservazione digitale
denominata riversamento sostitutivo (migration), che consiste nella conversione di un contenuto
digitale da un formato fruibile in un determinato ambiente hardware e software in un formato
fruibile in un altro ambiente (di solito temporalmente successivo) mantenendone le
caratteristiche importanti (si veda la Figura 3.3). Ciò significa che i contenuti codificati
secondo vecchi formati sono convertiti in nuovi formati che potranno essere utilizzati su
computer più moderni5. Si tratta di una strategia che è necessario mettere in atto quando i
cambiamenti nell’hardware e nel software cominciano a minacciare la possibilità di fruizione di
un contenuto digitale perché il formato secondo cui tale contenuto è codificato comincia a
diventare obsoleto. Dal momento che il riversamento sostitutivo comporta una modifica nella
sequenza di bit che costituisce il contenuto digitale, il formato di destinazione deve essere
compatibile con il formato d’origine in maniera tale che il contenuto informativo e tutte le più
importanti proprietà del contenuto digitale siano mantenute salvaguardandone nel contempo
l’autenticità e l’integrità6.
Il riversamento sostitutivo è un processo critico nei confronti del tempo: non ammette alcuna
dilazione e necessita di essere eseguito non appena vengono definiti nuovi formati e prima che
5
Per fare un semplice esempio, un documento di testo realizzato nel formato di Microsoft Word 6.0 può essere
convertito nel formato di Microsoft Word 2003.
6
È evidente che più la struttura dei dati insita nel formato è semplice e più alte sono le probabilità che il
contenuto informativo e le proprietà importanti vengano preservate.
7
il corrente formato divenga obsoleto. Se viene persa una generazione di nuovi formati, i dati
potrebbero essere difficili da recuperare; se più generazioni vengono perse, i dati potrebbero
essere completamente perduti. I cicli di migrazione necessitano di essere relativamente
frequenti, dal momento che pochi contenuti digitali sono oggi in grado di sopravvivere più di
5-7 anni senza alcun riversamento sostitutivo.
3.4
Emulazione
La considerazione del fatto che a seguito dei processi di riversamento sostitutivo possono
verificarsi delle perdite nel contenuto informativo (tanto più probabili quanto più il
contenuto informativo è complesso), ha condotto alcuni ricercatori a suggerire la strategia di
conservazione denominata emulazione che consiste nel ricreare un ambiente hardware e software
obsoleto su un nuovo e più moderno computer (si veda la Figura 3.4).
Formato 1
software di
emulazione
software di
emulazione
software 1
software 2
software 3
hardware 1
hardware 2
hardware 3
generazione 1
generazione 2
generazione 3
Figura 3.4: Schema di funzionamento della strategia di conservazione digitale
basata sull’emulazione
È una strategia che permette di mantenere inalterata la sequenza di bit che costituisce il
contenuto digitale, ma è più complessa, dal punto di vista tecnico, rispetto al riversamento
diretto e sostitutivo. La teoria che è alla base dell’emulazione si basa sulla convinzione che
l’autenticità di un contenuto digitale può essere garantita solo mantenendo quell’oggetto
accessibile nella forma e nell’ambiente originali (ovvero con il computer, il sistema operativo e
il programma con cui è stato creato o gestito). In questo modo il contenuto digitale non viene
modificato da successive conversioni di formato ed il comportamento e l’aspetto originali
(look and feel) dell’oggetto rimangono invariati. Tuttavia per fare questo occorre realizzare un
emulatore che emuli il vecchio ambiente hardware e software su un nuovo e moderno computer.
A differenza della strategia basata sul riversamento sostitutivo, in questo caso non c'è
nessuna conversione di formato e quindi nessun cambiamento nella sequenza di bit che
costituisce il file. Questo significa che il contenuto potrà essere riprodotto, in linea di
principio, sempre nello stesso modo indipendentemente dal tempo che è trascorso e dalla
piattaforma sulla quale il software di emulazione sarà eseguito nel futuro.
Nel corso degli anni sono state sviluppate diverse strategie di emulazione di diversa
complessità, tra cui l’emulazione hardware, l’emulazione software e l’emulazione basata
sull’UVC (Universal Virtual Computer). Nell’emulazione hardware un ambiente hardware obsoleto
viene ricreato in un computer moderno; a tale scopo viene scritto un programma che imita le
strutture del vecchio computer su una nuova piattaforma. In questo modo è possibile operare
nel nuovo ambiente come se ci si trovasse nel vecchio: i vecchi file sono riprodotti esattamente
alla stessa maniera di quando sono stati creati nell'ambiente originale. Il vantaggio principale
dell’emulazione hardware è costituito dal fatto che il file originale non necessita di essere
convertito. Come rovescio della medaglia l’emulazione hardware non è assolutamente semplice
da realizzare e richiede competenze informatiche di alto livello. Nell’emulazione software il
8
problema è affrontato in un modo simile ma ad un più alto livello di astrazione: viene ricreato
solamente l’ambiente software che “girava” sul vecchio computer e non l’ambiente hardware
completo. Grazie a questo software che “emula” l’ambiente software originale è possibile avere
accesso ai contenuti digitali creati per quel determinato ambiente anche su un computer
moderno7. Come nell’emulazione hardware, anche nell’emulazione software il principale
vantaggio è costituito dal fatto che l’oggetto digitale originale non necessita di alcuna
conversione e rimane nel tempo esattamente identico all’originale, mantenendo di
conseguenza l’esatto look and feel. Lo svantaggio è, anche in questo caso, costituito dal fatto
che l’emulazione è una strategia di conservazione piuttosto laboriosa e quindi costosa.
L’emulazione basata sull’UVC (Universal Virtual Computer) costituisce un’ulteriore variante: anche
in questo caso deve essere scritto un emulatore software, ma non per un computer reale bensì
per un computer virtuale, non esistente, denominato appunto Universal Virtual Computer
(UVC)8.
3.5
Archeologia digitale
A volte si rende necessario recuperare un contenuto digitale che non è stato sottoposto in
tempo ad un processo di conservazione digitale e che contiene informazioni digitali di vitale
importanza, oppure che, pur essendo stato sottoposto correttamente ad uno dei processi di
conservazione, risulta improvvisamente inaccessibile a causa di un disastro imprevisto9 o del
deterioramento del supporto su sui è memorizzato. In altri casi si rinvengono dei vecchi
supporti (ad esempio, floppy disk da 8 pollici o 5 pollici ed ¼ o vecchi nastri) che sono stati
casualmente conservati e a cui si desidera accedere ma non si dispone più né dell’hardware né
del software necessari. In tutti questi casi viene in aiuto l’archeologia digitale, una strategia di
conservazione digitale che si pone l’obiettivo di recuperare i contenuti da supporti obsoleti o
difettosi o non più leggibili o codificati secondo formati obsoleti e di restituirli in una forma
accessibile10. L’archeologia digitale rappresenta una sorta di “ultima spiaggia”, una strategia a
cui ricorrere quando non si è adottata nessun’altra valida strategia di conservazione digitale.
Presuppone un’approfondita conoscenza dei supporti di memorizzazione e dei formati di file
per mettere in atto la tecnica di recupero dei dati di volta in volta più opportuna11 e spesso
7
Per fare un esempio, in un computer con un sistema operativo come Linux può “girare” un programma
progettato per emulare un altro sistema operativo, per esempio Windows. Le applicazioni che “girano” sotto
Windows possono essere così utilizzate attraverso l’emulatore Windows anche su un computer che ha come
sistema operativo Linux.
8
L’UVC è un computer con una architettura ed un insieme di istruzioni talmente semplici che ogni sviluppatore
di software nel futuro sarà in grado di scrivere un emulatore per esso. Gli oggetti digitali debbono essere
convertiti attraverso un programma scritto nel linguaggio di programmazione dell’UVC, in un formato
denominato Logical Data Description (LDD). Il Logical Data Desciption è un formato indipendente, auto-descrittivo e
chiaramente strutturato, che contiene tutte le informazioni che permetteranno di “riassemblare” l’oggetto
digitale. Infatti tali informazioni sono realizzate in maniera tale che, nel futuro, sarà possibile realizzare un
visualizzatore (viewer) che interpreterà il formato LDD e visualizzerà a schermo l’oggetto digitale originale.
Come si può notare, si tratta di una strategia di conservazione che si basa sull’emulazione ma contiene anche
aspetti che riconducono alla migrazione.
9
Si ricorda che un oggetto digitale è costituito da un insieme di bit, e, per alcuni formati, è sufficiente la perdita
anche di un solo bit per rendere inaccessibile l’intero oggetto.
10
Ciò implica generalmente sia l’esecuzione del riversamento diretto che sostitutivo. Per fare un esempio assai
semplice, si pensi ad un documento di testo realizzato diversi anni fa nel formato .ws di Wordstar e memorizzato
su un floppy disk da 5 pollici ed ¼. Se oggi si volesse accedere a quel documento, occorrerebbe convertirlo in un
formato attuale (ad esempio il formato .odt di Open Office) e salvarlo su un supporto di memorizzazione
corrente (ad esempio un CD-R o una pendrive).
11
Si veda a questo proposito l’interessantissimo lavoro di ROSS, S. e GOW, A. (1999) Digital Archaeology: rescuing
neglected and damaged data resources, London: South Bank University, Library Information Technology Centre
<www.ukoln.ac.uk/services/elib/papers/supporting/pdf/p2.pdf>.
9
richiede il ricorso a società altamente specializzate. Una delle argomentazioni che vengono
portate a favore di questa strategia è che non è necessario garantire la conservazione di tutti i
contenuti digitali che oggi si producono perché si presume che gli archeologi digitali del
futuro avranno a disposizione delle tecniche così efficaci da riuscire a recuperare i contenuti
che saranno considerati di sufficiente valore. Si tratta quindi di una strategia che demanda
agli archeologi digitali del futuro, piuttosto che ai produttori attuali di contenuti, la decisione
circa quali contenuti considerare importanti, in una maniera molto simile ai metodi
attualmente utilizzati dagli storici e dagli archeologi per recuperare ed interpretare i dati del
passato.
4
Conclusioni
Le problematiche connesse alla conservazione digitale sono estremamente complesse e
coinvolgono diversi ambiti scientifici e settori di ricerca. Quello che è ormai chiaro è che i
contenuti digitali non si conservano “da soli” ed occorre trovare una soluzione ragionevole a
questo problema. Allo stato attuale non è ancora chiara quali siano le migliori strategie di
conservazione digitale; tuttavia è possibile affermare che quelle che sembrano fornire ad oggi
le maggiori garanzie sono il riversamento (diretto e sostitutivo) e l’emulazione.
Comincia, inoltre, ad essere evidente che spesso una singola strategia non è in grado di fornire
una soluzione a tutte le problematiche che possono presentarsi, ed è, quindi, importante
adottare una strategia integrata che inizi con la corretta scelta del formato in fase di
produzione dei contenuti digitali e prosegua mantenendo una cura ed una attenzione
continua sui contenuti che si desiderano conservare.
10