LA CONSERVAZIONE DIGITALE
Transcript
LA CONSERVAZIONE DIGITALE
LA CONSERVAZIONE DIGITALE: PROBLEMATICHE E STRATEGIE di Stefano Allegrezza (estratto dal libro “Informatica di base. Conoscere e comprendere le risorse digitali nella società dell’informazione”, Edizioni SIMPLE, Macerata, 2009) 1 2 3 4 1 2.1 2.2 2.3 3.1 3.2 3.3 3.4 3.5 Introduzione ...................................................................................................................................... 1 Le problematiche della conservazione digitale ........................................................................ 2 L’obsolescenza dell’hardware e del software ....................................................................... 3 L’obsolescenza dei supporti ..................................................................................................... 3 L’obsolescenza dei formati........................................................................................................ 4 Le strategie di conservazione digitale......................................................................................... 4 Trasferimento su supporti analogici ...................................................................................... 4 Conservazione tecnologica....................................................................................................... 6 Riversamento diretto e sostitutivo ..........................................................................................7 Emulazione ................................................................................................................................... 8 Archeologia digitale.................................................................................................................... 9 Conclusioni ......................................................................................................................................10 Introduzione Oggi buona parte delle informazioni che vengono quotidianamente prodotte sono in formato digitale: se dobbiamo scrivere un documento di testo utilizziamo un word processor; utilizziamo una macchina fotografica digitale per immortalare i nostri ricordi più cari e una videocamera digitale per riprendere le scene che vogliamo rivedere nel tempo; ascoltiamo musica in formato digitale utilizzando i lettori per i CD Audio o i lettori MP3; effettuiamo le nostre ricerche navigando nel web, anch’esso costituito da una mole incredibilmente vasta di informazioni digitali. Quasi più nessuno scrive lettere utilizzando carta e penna, perchè ormai le comunicazioni avvengono tramite posta elettronica, brevi messaggio di testo (SMS) o telefonate effettuate tramite VoIP1. Anche il nostro conto corrente non è altro che una informazione digitale memorizzata in un database della banca. Tutti questi contenuti digitali danno origine ad un vero e proprio paradosso: pur trattandosi di “materiale” fondamentalmente semplice (dal momento che è costituito da sequenze di bit che possono assumere solamente i valori di “0” ed “1”), esso risulta estremamente “fragile” ed a rischio di scomparsa se non vengono messe in atto le opportune strategie per assicurarne la conservazione nel lungo periodo. Ormai da quasi un ventennio questa è una delle domande che assilla in maniera sempre più preoccupante la comunità scientifica internazionale, la quale si chiede se è in grado di assicurare la sopravvivenza nel tempo di tutta l’enorme quantità di contenuti digitali che la società attuale produce. Per rispondere a questa domanda occorre comprendere la motivazione per cui è così difficile conservare le informazioni digitali rispetto a quelle analogiche. Semplificando le cose in maniera molto drastica, si può osservare come per la fruizione di contenuti analogici (si pensi, ad esempio, ad una lettera tradizionale) sia necessaria (e sufficiente) solamente una buona vista2, mentre per la fruizione di tutti i contenuti digitali è necessaria, oltre ad una buona vista, anche un'apposita infrastruttura 1 Il VoIP (Voice over IP) è la tecnologia che consente di utilizzare la rete Internet per effettuare telefonate a basso costo. Anche in questo caso le informazioni che viaggiano sono di tipo digitale. Uno dei più noti programmi che consentono di effettuare telefonate VoIP è Skype. 2 In realtà alcuni contenuti analogici necessitano anch’essi di strumenti tecnologici per la loro fruizione: si pensi ai vecchi dischi in vinile o alle tradizionali cassette audio musicali (compact cassette), ma in generale si tratta di strumenti tecnologici che accompagnano l’intera vita del supporto su cui tali contenuti sono memorizzati. 1 hardware e software (si veda la Figura 1.1). È proprio l’evoluzione tecnologica continua e costante che questa infrastruttura subisce che rende difficile la conservazione degli oggetti digitali. Infatti, un oggetto digitale è prodotto utilizzando una particolare infrastruttura hardware e software ed è memorizzato in un file, ovvero una sequenza di bit (“0” ed “1”) che non sono in alcuna maniera intelligibili da un essere umano. Quando si vuole accedere al contenuto digitale racchiuso nel file, questa sequenza deve essere letta di nuovo mediante l’infrastruttura hardware e software ed interpretata in una maniera che è spesso unica per quella data infrastruttura. Il risultato dell’interpretazione è mostrato su schermo e ciò che si vede è una rappresentazione dell’oggetto digitale. In parecchi casi il file non può essere correttamente interpretato se non con una particolare combinazione di hardware e software: se l’oggetto digitale è riprodotto in un ambiente diverso rispetto a quello in cui era stato creato, potrebbe essere visualizzato ed avere un comportamento anche completamente diverso rispetto all'originale. Figura 1.1: La fruizione dei contenuti analogici e digitali a confronto: nel secondo caso è sempre necessario uno strato di intermediazione sia hardware che software 2 Le problematiche della conservazione digitale Esistono fondamentalmente tre grosse problematiche che rendono difficile la conservazione dei contenuti digitali: l’obsolescenza delle tecnologie hardware e software, l’obsolescenza dei supporti e l’obsolescenza dei formati (si veda la Figura 2.1). Figura 2.1: Le principali problematiche della conservazione digitale 2 2.1 L’obsolescenza dell’hardware e del software La prima e più immediata questione riguarda l’obsolescenza della piattaforma tecnologica (hardware e software) necessaria per la fruizione dei contenuti digitali. Da diversi decenni si assiste ad una continua evoluzione di tali infrastrutture: il computer appena acquistato dopo soli due anni è già obsoleto e va sostituito con uno più moderno e potente; il sistema operativo va anch’esso aggiornato alla nuova versione e parallelamente i programmi con cui creiamo e gestiamo i contenuti digitali devono essere anch’essi aggiornati o rimpiazzati da altri. Nel giro di pochi anni l’evoluzione tecnologica rende del tutto obsoleta l’infrastruttura hardware e software costringendoci a cambiarla: in questo continuo processo cambiano i drive per leggere i supporti di memorizzazione (si pensi al lettore di floppy disk da 3 pollici e ½ che è scomparso dai computer attuali), cambiano le porte di input/output (oggi si utilizzano le porte USB tramite le quali è possibile accedere, ad esempio, ai contenuti memorizzati su una pendrive, ma fra dieci anni ci saranno ancora?), cambiano i programmi (oggi per scrivere un documento di testo si utilizza Microsoft Word, ma chi può dire quale programma si utilizzerà fra dieci anni?). L’obsolescenza dell’hardware e del software costituisce una seria minaccia alla possibilità di conservare nel tempo i contenuti digitali. 2.2 L’obsolescenza dei supporti Un secondo problema è costituito dall’obsolescenza dei supporti. Esiste una grande varietà di supporti su cui il materiale digitale può essere memorizzato, dalle schede e ai nastri perforati di storica memoria, che rappresentavano i bit attraverso una serie di fori, alla vasta gamma di supporti di memorizzazione oggi disponibili basati sulle tecnologie magnetiche, ottiche ed elettroniche (floppy disk, dischi fissi, nastri magnetici, CD, DVD, HD-DVD, BB, memorie flash, etc.). Nel corso di questi anni abbiamo assistito ad un rapidissimo evolversi dei supporti di memorizzazione utilizzati (si veda la Figura 2.2): basti pensare che solamente una ventina di anni fa si utilizzava il floppy disk da 5 pollici e ¼, supporto che attualmente è solo un reperto storico e risulta praticamente impossibile da leggere. La produzione a livello mondiale del suo successore, il floppy disk da 3 pollici e ½, è terminata all’inizio del 2007 ed anch’esso è diventato ormai un supporto obsoleto. Figura 2.2: Alcune generazioni di supporti che si sono succeduti nel tempo Quando, agli inizi degli anni ’80, vennero prodotti i primi Compact Disc (CD) si era convinti che si trattasse di supporti con una capacità di memorizzazione talmente elevata che sarebbe stata sufficiente per soddisfare le necessità di memorizzazione dei dati per diversi decenni. Invece, dopo solo una quindicina di anni i CD sono stati soppiantati dai DVD, i quali a loro volta sono stati soppiantati dai nuovi supporti con capacità ancora maggiore (quali gli HDDVD e i Blu-ray Disc); anche questi non avranno una vita eccessivamente lunga perché saranno sostituiti dai nuovi supporti che attualmente sono in fase di sviluppo (ad esempio, i dischi olografici) e che consentiranno capacità di archiviazione finora impensabili, e così via. Il problema dell’obsolescenza dei supporti viene alla luce quando una tecnologia comincia d'essere obsoleta, dal momento che i dati memorizzati sui supporti che si basano su quella 3 tecnologia diventano in breve inaccessibili. Riprendendo l’esempio proposto poco fa, i dati memorizzati su un floppy disk da 5 pollici e ¼ sono ormai inaccessibili se non si è provveduto a suo tempo a riversare il contenuto da quel supporto ad un altro supporto più recente. 2.3 L’obsolescenza dei formati Un problema spesso sottovalutato ma in realtà forse più complesso di quello rappresentato dai supporti è costituito dall’obsolescenza dei formati. Molti ricorderanno che solamente una ventina di anni fa il software di elaborazione testi più utilizzato era Wordstar, un programma con interfaccia a carattere (nulla a che vedere con l’interfaccia grafica dei moderni programmi di elaborazione testi) che produceva documenti di testo in un formato proprietario identificato dall’estensione .ws. Se avessimo ancor oggi dei documenti di testo in quel formato, memorizzati magari sui floppy disk in uso all’epoca (floppy disk da 5 pollici e ¼ o da 3 pollici e ½), saremmo in grado di visualizzarne il contenuto? Anche ipotizzando che i supporti siano ancora in buone condizioni di conservazione, sicuramente avremo difficoltà ad accedere a tali contenuti dal momento che il formato .ws utilizzato dal programma Wordstar non è più gestito dagli attuali programmi di elaborazione testi (ad esempio, Microsoft Word) ed è difficile trovare strumenti di conversione che consentano di trasformare quei file in formati oggi accessibili. La strada per risolvere questo genere di problema passa sicuramente attraverso l’adozione, fin dal momento della formazione dei contenuti digitali, di formati che abbiano le caratteristiche per fornire le maggiori garanzie in termini di conservazione a lungo termine. Figura 2.3: Le principali strategie di conservazione digitale 3 Le strategie di conservazione digitale. Nel corso degli ultimi quindici - venti anni le problematiche connesse con la conservazione digitale sono state affrontate sotto molteplici punti di vista e sono state proposte diverse strategie di conservazione al fine di giungere ad una loro soluzione. Le principali sono (si veda la Figura 2.3): trasferimento su supporti analogici (output to analogue media); conservazione tecnologica (technology preservation); emulazione (emulation); riversamento diretto (refreshing) e sostitutivo (migration); archeologia digitale (digital archaelogy). Nel seguito sarà brevemente esaminata ciascuna di queste strategie. 3.1 Trasferimento su supporti analogici La prima e più banale strategia di conservazione si basa sulla seguente considerazione: se i supporti analogici (carta, pergamena, microfilm, etc.) sono stati finora in grado di conservare 4 nel tempo le informazioni, perché non continuare ad utilizzarli anche in quest’epoca digitale? Si tratta della strategia denominata trasferimento su supporto analogico e che è stata proposta soprattutto nel caso dei documenti adatti ad essere trasferiti su supporto cartaceo (si veda la Figura 3.1); in tal caso prende il nome di “stampa su carta” (printing to paper). Essa parte dall’assunto che stampare tutti i documenti su carta, un supporto che conosciamo bene e che siamo abituati a maneggiare ormai con una certa dimestichezza, sia il modo migliore per conservarli3. Seppure a prima vista possa sembrare incredibile, si tratta di una strategia tuttora ampiamente implementata, anche presso organizzazioni di una certa complessità (ad esempio grosse aziende o Pubbliche Amministrazioni). Figura 3.1: La strategia printing to paper Questa strategia è stata ampiamente utilizzata nel passato durante il processo di conservazione di materiali analogici fragili, quando, durante la fase di riparazione o restaurazione del materiale stesso, ne veniva creata una copia di alta qualità. Ciò consentiva la creazione di “surrogati” (fotografie, microfilm, fotocopie di alta qualità, etc.) capaci di soddisfare le necessità di accesso della maggior parte degli utenti e che avrebbe in questo modo aiutato a conservare e preservare gli originali. Tuttavia, oggi che gli originali nascono direttamente in formato digitale, c'è ancora la necessità di produrre un loro “surrogato” analogico? Ancora: la produzione di una versione analogica dell’oggetto digitale è una appropriata strategia di conservazione? Ovviamente questa è una strategia assolutamente non percorribile, e questo per almeno due ordini di motivi. Innanzitutto, nel caso della stampa su carta, questa elimina l’intelligenza del documento: le capacità di ricerca e recupero delle informazioni, l’utilizzo simultaneo da parte di più utenti, etc. Si pensi ad un foglio elettronico che, nel momento in cui viene stampato su carta, non è più utilizzabile, ad esempio, per ricalcolare i totali; oppure ad una e-mail che, nel momento in cui viene stampata, non consente più la possibilità di effettuare ricerche automatiche sul corpo del messaggio. In secondo luogo, i contenuti digitali di oggi non sono solo costituiti da documenti di testo o da immagini (per i quali sarebbe ipotizzabile come strategia la stampa su carta), ma anche da contenuti audio e video: come è possibile “stampare” tali contenuti su carta? Nel caso dei messaggi di posta elettronica, come è possibile trasferire su supporto cartaceo gli eventuali allegati, costituiti ad esempio da fogli elettronici, database, programmi? Infine, nel trasferimento su supporto analogico possono essere persi, in tutto o in parte, i metadati necessari per determinare il contesto del messaggio, eliminando in questo modo le informazioni che possono garantire l’autenticità del documento. Non bisogna poi dimenticare che la tenuta di archivi per la conservazione dei documenti cartacei richiede spazi e costi notevoli. 3 I propugnatori di questa strategia forniscono anche alcuni preziosi consigli per risparmiare sul consumo di carta, come stampare fronte retro, utilizzare un carattere molto piccolo, etc. Una delle caratteristiche migliori della carta è che essa si conserva per un periodo di tempo estremamente lungo e non c'è bisogno di preoccuparsi del fatto che sia o meno compatibile con i cambiamenti dell'hardware e del software del proprio computer. 5 In definitiva, il trasferimento su supporti analogici non è una strategia di conservazione digitale percorribile: un contenuto che nasce digitale va conservato nel formato digitale. 3.2 Conservazione tecnologica Un’altra strategia che a prima vista potrebbe sembrare applicabile è costituita dalla conservazione dell’ambiente tecnologico necessario per riprodurre i contenuti digitali nella loro forma originaria. Questa strategia implica ovviamente la conservazione sia dell’hardware (il computer e le periferiche ad esso collegate) che del software (il sistema operativo, i programmi con cui sono stati creati i contenuti digitali, i driver per i lettori dei supporti, etc.). Questo tipo di soluzione viene anche denominata “archeologia informatica”4 e porta inesorabilmente alla costituzione di veri e propri musei del computer (si veda la Figura 3.2) nei quali conservare in buona efficienza tutti i computer con i relativi programmi e le relative periferiche necessari per la fruizione dei contenuti digitali che si intendono conservare. Figura 3.2: Un esempio di computer museum Questo tipo di strategia può estendere la finestra temporale di accesso ai supporti ed ai formati di file obsoleti ma non è ovviamente una soluzione definitiva dal momento che nessun tipo di infrastruttura hardware e software può essere mantenuta in funzione all’infinito. Inoltre, essa offre la potenzialità di contrastare l’obsolescenza dei supporti ma solo nell'ipotesi che essi non abbiano subito un decadimento per quanto riguarda la leggibilità, altrimenti deve essere necessariamente accompagnata da cicli regolari di aggiornamento dei supporti. Infine, occorre considerare che, qualora possibile, mantenere in funzione una tecnologia obsoleta richiede investimenti finanziari davvero notevoli. Si tratta, pertanto, di una strategia che potrebbe essere considerata valida solamente per garantire la conservazione di risorse estremamente importanti e rare. Occorre, tuttavia, essere coscienti del fatto che può essere mantenuta per un periodo di tempo limitato, in attesa di adottare una strategia di conservazione a lungo termine migliore. 4 Da non confondere con l'archeologia digitale, che consiste nell’applicazione di metodi e procedure per recuperare il contenuto informativo da supporti danneggiati, da ambienti hardware e software obsoleti od anche da file codificati secondo formati obsoleti. Essa viene utilizzata per recuperare gli oggetti digitali che non sono stati sottoposti ad una appropriata strategia di conservazione digitale. Si veda il paragrafo 3.5. 6 3.3 Riversamento diretto e sostitutivo I supporti per la memorizzazione digitale diventano rapidamente obsoleti sia perché i materiali su cui si basa la memorizzazione perdono progressivamente le loro caratteristiche di ritenzione dei dati, sia perché nel tempo vengono introdotte nuove tecnologie che rendono obsoleti i drive per i vecchi supporti di memorizzazione (per cui il supporto potrebbe continuare ad essere “leggibile” ma non esiste più il drive che ne consente la lettura). Di conseguenza, per assicurarne la sopravvivenza, i contenuti digitali devono essere periodicamente riversati su supporti nuovi e non obsoleti. Il riversamento diretto (refreshing) consiste nel trasferire un contenuto digitale da un supporto di memorizzazione obsoleto ad un nuovo supporto senza modificare la sequenza di bit di cui è costituito. Il nuovo supporto può essere dello stesso tipo (ad esempio da un CD-R verso un altro CD-R) o di tipo diverso (ad esempio, da un CD-R ad un DVD-R). Si tratta di un processo che è sempre necessario, indipendentemente da qualunque altra strategia di conservazione che venga adottata. Dal punto di vista tecnico è relativamente semplice, con un bassissimo rischio di perdita di dati se viene eseguito e documentato nella maniera corretta. Figura 3.3: Schema di funzionamento della strategia di conservazione digitale basata sul riversamento sostitutivo Accanto al riversamento diretto occorre sempre adottare la strategia di conservazione digitale denominata riversamento sostitutivo (migration), che consiste nella conversione di un contenuto digitale da un formato fruibile in un determinato ambiente hardware e software in un formato fruibile in un altro ambiente (di solito temporalmente successivo) mantenendone le caratteristiche importanti (si veda la Figura 3.3). Ciò significa che i contenuti codificati secondo vecchi formati sono convertiti in nuovi formati che potranno essere utilizzati su computer più moderni5. Si tratta di una strategia che è necessario mettere in atto quando i cambiamenti nell’hardware e nel software cominciano a minacciare la possibilità di fruizione di un contenuto digitale perché il formato secondo cui tale contenuto è codificato comincia a diventare obsoleto. Dal momento che il riversamento sostitutivo comporta una modifica nella sequenza di bit che costituisce il contenuto digitale, il formato di destinazione deve essere compatibile con il formato d’origine in maniera tale che il contenuto informativo e tutte le più importanti proprietà del contenuto digitale siano mantenute salvaguardandone nel contempo l’autenticità e l’integrità6. Il riversamento sostitutivo è un processo critico nei confronti del tempo: non ammette alcuna dilazione e necessita di essere eseguito non appena vengono definiti nuovi formati e prima che 5 Per fare un semplice esempio, un documento di testo realizzato nel formato di Microsoft Word 6.0 può essere convertito nel formato di Microsoft Word 2003. 6 È evidente che più la struttura dei dati insita nel formato è semplice e più alte sono le probabilità che il contenuto informativo e le proprietà importanti vengano preservate. 7 il corrente formato divenga obsoleto. Se viene persa una generazione di nuovi formati, i dati potrebbero essere difficili da recuperare; se più generazioni vengono perse, i dati potrebbero essere completamente perduti. I cicli di migrazione necessitano di essere relativamente frequenti, dal momento che pochi contenuti digitali sono oggi in grado di sopravvivere più di 5-7 anni senza alcun riversamento sostitutivo. 3.4 Emulazione La considerazione del fatto che a seguito dei processi di riversamento sostitutivo possono verificarsi delle perdite nel contenuto informativo (tanto più probabili quanto più il contenuto informativo è complesso), ha condotto alcuni ricercatori a suggerire la strategia di conservazione denominata emulazione che consiste nel ricreare un ambiente hardware e software obsoleto su un nuovo e più moderno computer (si veda la Figura 3.4). Formato 1 software di emulazione software di emulazione software 1 software 2 software 3 hardware 1 hardware 2 hardware 3 generazione 1 generazione 2 generazione 3 Figura 3.4: Schema di funzionamento della strategia di conservazione digitale basata sull’emulazione È una strategia che permette di mantenere inalterata la sequenza di bit che costituisce il contenuto digitale, ma è più complessa, dal punto di vista tecnico, rispetto al riversamento diretto e sostitutivo. La teoria che è alla base dell’emulazione si basa sulla convinzione che l’autenticità di un contenuto digitale può essere garantita solo mantenendo quell’oggetto accessibile nella forma e nell’ambiente originali (ovvero con il computer, il sistema operativo e il programma con cui è stato creato o gestito). In questo modo il contenuto digitale non viene modificato da successive conversioni di formato ed il comportamento e l’aspetto originali (look and feel) dell’oggetto rimangono invariati. Tuttavia per fare questo occorre realizzare un emulatore che emuli il vecchio ambiente hardware e software su un nuovo e moderno computer. A differenza della strategia basata sul riversamento sostitutivo, in questo caso non c'è nessuna conversione di formato e quindi nessun cambiamento nella sequenza di bit che costituisce il file. Questo significa che il contenuto potrà essere riprodotto, in linea di principio, sempre nello stesso modo indipendentemente dal tempo che è trascorso e dalla piattaforma sulla quale il software di emulazione sarà eseguito nel futuro. Nel corso degli anni sono state sviluppate diverse strategie di emulazione di diversa complessità, tra cui l’emulazione hardware, l’emulazione software e l’emulazione basata sull’UVC (Universal Virtual Computer). Nell’emulazione hardware un ambiente hardware obsoleto viene ricreato in un computer moderno; a tale scopo viene scritto un programma che imita le strutture del vecchio computer su una nuova piattaforma. In questo modo è possibile operare nel nuovo ambiente come se ci si trovasse nel vecchio: i vecchi file sono riprodotti esattamente alla stessa maniera di quando sono stati creati nell'ambiente originale. Il vantaggio principale dell’emulazione hardware è costituito dal fatto che il file originale non necessita di essere convertito. Come rovescio della medaglia l’emulazione hardware non è assolutamente semplice da realizzare e richiede competenze informatiche di alto livello. Nell’emulazione software il 8 problema è affrontato in un modo simile ma ad un più alto livello di astrazione: viene ricreato solamente l’ambiente software che “girava” sul vecchio computer e non l’ambiente hardware completo. Grazie a questo software che “emula” l’ambiente software originale è possibile avere accesso ai contenuti digitali creati per quel determinato ambiente anche su un computer moderno7. Come nell’emulazione hardware, anche nell’emulazione software il principale vantaggio è costituito dal fatto che l’oggetto digitale originale non necessita di alcuna conversione e rimane nel tempo esattamente identico all’originale, mantenendo di conseguenza l’esatto look and feel. Lo svantaggio è, anche in questo caso, costituito dal fatto che l’emulazione è una strategia di conservazione piuttosto laboriosa e quindi costosa. L’emulazione basata sull’UVC (Universal Virtual Computer) costituisce un’ulteriore variante: anche in questo caso deve essere scritto un emulatore software, ma non per un computer reale bensì per un computer virtuale, non esistente, denominato appunto Universal Virtual Computer (UVC)8. 3.5 Archeologia digitale A volte si rende necessario recuperare un contenuto digitale che non è stato sottoposto in tempo ad un processo di conservazione digitale e che contiene informazioni digitali di vitale importanza, oppure che, pur essendo stato sottoposto correttamente ad uno dei processi di conservazione, risulta improvvisamente inaccessibile a causa di un disastro imprevisto9 o del deterioramento del supporto su sui è memorizzato. In altri casi si rinvengono dei vecchi supporti (ad esempio, floppy disk da 8 pollici o 5 pollici ed ¼ o vecchi nastri) che sono stati casualmente conservati e a cui si desidera accedere ma non si dispone più né dell’hardware né del software necessari. In tutti questi casi viene in aiuto l’archeologia digitale, una strategia di conservazione digitale che si pone l’obiettivo di recuperare i contenuti da supporti obsoleti o difettosi o non più leggibili o codificati secondo formati obsoleti e di restituirli in una forma accessibile10. L’archeologia digitale rappresenta una sorta di “ultima spiaggia”, una strategia a cui ricorrere quando non si è adottata nessun’altra valida strategia di conservazione digitale. Presuppone un’approfondita conoscenza dei supporti di memorizzazione e dei formati di file per mettere in atto la tecnica di recupero dei dati di volta in volta più opportuna11 e spesso 7 Per fare un esempio, in un computer con un sistema operativo come Linux può “girare” un programma progettato per emulare un altro sistema operativo, per esempio Windows. Le applicazioni che “girano” sotto Windows possono essere così utilizzate attraverso l’emulatore Windows anche su un computer che ha come sistema operativo Linux. 8 L’UVC è un computer con una architettura ed un insieme di istruzioni talmente semplici che ogni sviluppatore di software nel futuro sarà in grado di scrivere un emulatore per esso. Gli oggetti digitali debbono essere convertiti attraverso un programma scritto nel linguaggio di programmazione dell’UVC, in un formato denominato Logical Data Description (LDD). Il Logical Data Desciption è un formato indipendente, auto-descrittivo e chiaramente strutturato, che contiene tutte le informazioni che permetteranno di “riassemblare” l’oggetto digitale. Infatti tali informazioni sono realizzate in maniera tale che, nel futuro, sarà possibile realizzare un visualizzatore (viewer) che interpreterà il formato LDD e visualizzerà a schermo l’oggetto digitale originale. Come si può notare, si tratta di una strategia di conservazione che si basa sull’emulazione ma contiene anche aspetti che riconducono alla migrazione. 9 Si ricorda che un oggetto digitale è costituito da un insieme di bit, e, per alcuni formati, è sufficiente la perdita anche di un solo bit per rendere inaccessibile l’intero oggetto. 10 Ciò implica generalmente sia l’esecuzione del riversamento diretto che sostitutivo. Per fare un esempio assai semplice, si pensi ad un documento di testo realizzato diversi anni fa nel formato .ws di Wordstar e memorizzato su un floppy disk da 5 pollici ed ¼. Se oggi si volesse accedere a quel documento, occorrerebbe convertirlo in un formato attuale (ad esempio il formato .odt di Open Office) e salvarlo su un supporto di memorizzazione corrente (ad esempio un CD-R o una pendrive). 11 Si veda a questo proposito l’interessantissimo lavoro di ROSS, S. e GOW, A. (1999) Digital Archaeology: rescuing neglected and damaged data resources, London: South Bank University, Library Information Technology Centre <www.ukoln.ac.uk/services/elib/papers/supporting/pdf/p2.pdf>. 9 richiede il ricorso a società altamente specializzate. Una delle argomentazioni che vengono portate a favore di questa strategia è che non è necessario garantire la conservazione di tutti i contenuti digitali che oggi si producono perché si presume che gli archeologi digitali del futuro avranno a disposizione delle tecniche così efficaci da riuscire a recuperare i contenuti che saranno considerati di sufficiente valore. Si tratta quindi di una strategia che demanda agli archeologi digitali del futuro, piuttosto che ai produttori attuali di contenuti, la decisione circa quali contenuti considerare importanti, in una maniera molto simile ai metodi attualmente utilizzati dagli storici e dagli archeologi per recuperare ed interpretare i dati del passato. 4 Conclusioni Le problematiche connesse alla conservazione digitale sono estremamente complesse e coinvolgono diversi ambiti scientifici e settori di ricerca. Quello che è ormai chiaro è che i contenuti digitali non si conservano “da soli” ed occorre trovare una soluzione ragionevole a questo problema. Allo stato attuale non è ancora chiara quali siano le migliori strategie di conservazione digitale; tuttavia è possibile affermare che quelle che sembrano fornire ad oggi le maggiori garanzie sono il riversamento (diretto e sostitutivo) e l’emulazione. Comincia, inoltre, ad essere evidente che spesso una singola strategia non è in grado di fornire una soluzione a tutte le problematiche che possono presentarsi, ed è, quindi, importante adottare una strategia integrata che inizi con la corretta scelta del formato in fase di produzione dei contenuti digitali e prosegua mantenendo una cura ed una attenzione continua sui contenuti che si desiderano conservare. 10