La conservazione digitale

Transcript

La conservazione digitale
La conservazione digitale
Mariella Guercio
Università degli studi di Urbino
2011
i temi
• La conservazione digitale : modelli e quadro concettuale
–
–
–
–
I nodi concettuali
I formati
I metodi per la conservazione
I depositi d’archivio e custodia delle memorie digitali
• Il quadro normativo aggiornato sulla conservazione a norma
(a medio e a lungo termine)
– … e le sue criticità
la conservazione digitale: modelli e quadro
concettuale
i nodi concettuali
che cosa si intende per conservazione di
documenti digitali
• La funzione in grado di assicurare che gli utenti del futuro
possano:
– identificare, ricercare, trattare, interpretare, utilizzare documenti
digitali in un ambiente caratterizzato dalla modifica costante della
tecnologia e in condizioni che assicurino la presunzione di autenticità
dei documenti medesimi
• Si caratterizza più decisamente rispetto al passato in termini
di gestione del rischio
• Richiede un continuo aggiornamento delle policy, delle
attrezzature, degli standard di rappresentazione
• Si configura come una funzione diffusa e condivisa di cura del
digitale (digital curation)
che cosa implica la conservazione di documenti
digitali
• interventi di mantenimento dei documenti e delle loro
caratteristiche significative (significant properties e/o
informazioni di rappresentazione?) con specifica attenzione
– alla completezza, coerenza e accuratezza degli elementi
descrittivi delle entità documentarie e delle relazioni di
contesto che danno al documento significato
– all’adozione di corrette e precoci politiche per gestire il
trasferimento di custodia e la selezione
– alla documentazione nel tempo dei processi e delle
attività di gestione e tenuta in tutte le fasi di vita
– alla definizione e gestione di architetture sostenibili
il ruolo di OAIS: un modello dinamico e
funzionale
il modello OAIS: i vantaggi - 1
• capacità di rispondere alle esigenze di qualunque tipo di
ambiente,
• adattabilità alle esigenze di un’archiviazione complessa,
• supporto agli interventi pianificati,
• possibilità di applicare lo standard anche retroattivamente,
• sviluppo di un linguaggio comune e di comunicazione per
una sempre più ampia e diversificata comunità di riferimento
(utenti interessati ai contenuti, personale addetto alla
gestione amministrativa e informatica dei depositi, sistemisti
e sviluppatori, responsabili per la definizione di policy,
auditor e finanziatori)
il modello OAIS: i vantaggi - 2
• possibilità di gestire - oltre alle componenti descrittive requisiti gestionali e attività rilevanti per il servizio di
conservazione: avvisi di gestione, controllo terminologico e
di coerenza, registrazione di schemi di metadati,
autorizzazioni. Ogni servizio è adeguatamente documentato
• capacità di rispondere alla necessità crescente di strumenti
in grado di tracciare l’evoluzione della prassi e gestire
problemi complessi e imprevisti di conservazione
(identificazione e tenuta di nuove tipologie di oggetti anche
complessi, impacchettamento, federazione, identificatori,
integrazione tra depositi e altri sistemi)
vincoli documentari
• Per l’automazione avanzata dei sistemi documentari servono
standard per la conservazione degli archivi informatici che
garantiscano due obiettivi contrastanti:
– autenticità (identificazione e integrità) e
– accessibilità generalizzata e di lungo periodo dei sistemi
documentari (dei documenti e delle relazioni di contesto
mediante la corretta gestione dei metadati)
la conservazione digitale in particolare: i
passaggi critici all’interno di un’organizzazione 1
• policy interne a ciascuna organizzazione utilizzando nel caso
dei sistemi documentari attivi l’opportunità di predisporre
manuali di gestione del sistema documentario (dpr 445/2000
per le pp.aa, ma il nuovo CAD si applica in parte ai privati),
con crescente attenzione alle parti, già previste, dedicate alla
tenuta dei documenti
• adozione di formati standard nella fase di formazione dei
documenti
• individuazione di responsabilità certe, diffuse e riconosciute
interne all’ente
la conservazione digitale in particolare: i
passaggi critici all’interno di un’organizzazione 2
• definizione di regole e procedure stringenti soprattutto nel
caso di esternalizzazione dei servizi per la p.a.: la funzione
documentaria è una funzione pubblica e non può essere
gestita da terzi senza garanzie; la responsabilità è sempre
dell’amministrazione
• valutazione, analisi e contenimento dei costi in relazione agli
obiettivi e ai metodi possibili o necessari
• riqualificazione delle componenti professionali tecniche
(archivisti e informatici) e di tutto il personale con specifico
riferimento ai dirigenti responsabili mediante programmi di
formazione: la conservazione è possibile nella misura in cui si
gestisce adeguatamente la formazione dei documenti
concetti chiave: autenticità
• “la capacità del documento di essere ciò che dichiara, senza
falsificazioni e manipolazioni”: implica identità e integrità
• È a rischio nei processi di trasmissione e di conservazione
• L’autenticità in ambito digitale non è verificabile in termini di
bit nel caso della conservazione a lungo termine, ma può
essere presunta sulla base dei requisiti cumulativamente
rispettati da un sistema di conservazione: più alto è il numero
dei requisiti previsti e rispettato, più alto è il grado di
presunzione dell’autenticità
concetti chiave: definizione di conservazione
digitale
• “L’insieme dei principi, delle politiche, delle disposizioni e
delle strategie finalizzate a prolungare l’esistenza di un
documento o di una risorsa digitale grazie alla sua tenuta in
condizioni adatte all’uso nella forma originale e/o in un
formato persistente che garantisca l’integrità della
configurazione logica e del contenuto” (Standard ISO 14721 –
Open Archive Information System)
concetti chiave: validazione
• La dichiarazione dell’autenticità di un documento da parte di
chi sia autorizzato in un determinato sistema giuridico a
produrre tale dichiarazione (pubblico ufficiale, notaio,
autorità di certificazione)
• può essere inclusa nel documento
• in ambiente digitale si traduce in un metodo per provare
l’autenticità del documento in un momento dato (firma
digitale, sigillo informatico, timbro elettronico, ecc.)
concetti chiave: validazione nel tempo del
documento digitale
• Tema centrale e di non facile trattamento
• Firme digitali e sigilli informatici sono strumenti cruciali per la
validità giuridica dei documenti, sono utilizzabili nella
gestione dei processi conservativi, ma non sono oggetto di
conservazione (almeno nel caso della conservazione a lungo
termine) e non sono sufficienti a garantire la persistenza delle
memorie digitali:
– gli istituti di conservazione in Nord America non accettano in
versamento documenti cifrati o firmati digitalmente
il nodo dell’autenticità e degli strumenti di
verifica nel progetto InterPARES
• Centralità del concetto di provenienza, della sua
documentazione e del custode fidato
• Inutilità della firma digitale a fini di conservazione a lungo
termine: difficoltà di valutare – a distanza di tempo – la
semantica delle firme utilizzate (per funzioni e fini diversi
da persone diverse), rischi nella durata delle Public Key
Infrastructure; il documento perduto non può essere
ricostituito e non ci sono garanzie sul fatto che anche il
valore dell’impronta non sia stato manipolato: la firma
digitale è un meccanismo molto fragile
• Nel deposito digitale sono necessari numerosi sistemi di
garanzia e sicurezza anche con riferimento alla
conservazione dei metadati
la garanzia dell’accessibilità nel progetto
InterPARES)
• Mantenere, a costi accettabili, la possibilità di accesso e la fruizione
efficiente implica la definizione di metodi per affrontare l’evoluzione delle
tecnologie
• Non ci sono metodi oggi accettati e fattibili che non implichino (sia pure
con frequenza diversificata) modifiche al flusso di bit dei documenti
• Diversi approcci sono possibili e spesso complementari nelle diverse fasi
di tenuta di una risorsa digitale: emulazione, incapsulamento, virtual
machine software, migrazione evolutiva o in formati standard persistenti
(es. XML)
• La fattibilità della tenuta delle fonti digitali nel tempo costituisce un
parametro molto significativo e di difficile valutazione (in tempi utili). E’
indispensabile;
– preparare per tempo la transizione
– utilizzare gli standard per gestire formati dei dati compatibili con
l’interoperabilità e la conservazione, escludendo formati binari,
formati proprietari, formati orientati all’applicazione
concetti chiave: le condizioni per la
conservazione ‘sostenibile’
• l’autenticità è assicurata da un sistema documentario
affidabile integrato da un sistema di conservazione
• la “smaterializzazione” finalizzata alla conservazione implica il
controllo sul processo di formazione del documento, ma anche
il governo dell’intero sistema di gestione, tenuta e
conservazione dei documenti in tutte le loro fasi
• E’ necessario definire linee direttive interne che descrivano un
modello di smaterializzazione sostenibile, stabiliscano priorità
e parametri
un nodo giuridico è la prova documentale
informatica
• Le prove informatiche sono quelle più delicate che le scienze
forensi abbiano forse mai trattato proprio per la loro
intangibilità che le rende volatili e facilmente alterabili.
• In ambito giudiziario i nodi centrali riguardano:
– l’affidabilità dei documenti nella fase di formazione la gestione (e
documentazione) della catena di custodia e
– l’adozione di strumenti e comportamenti atti a preservare la prova
gli strumenti di smaterializzazione e i processi di
conservazione a norma e a lungo termine
• La firma elettronica e la definizione di tipologie e procedure
adatte ai processi di lavoro aziendali (ad esempio firma
digitale o firma elettronica avanzata per i documenti a
rilevanza esterna)
• I riferimenti temporali: valutazione dei termini di opponibilità
a terzi (marche temporali, casella PEC, registro di protocollo
per la p.a., costituzione di lotti-volumi d conservazione)
• La documentazione dei processi documentali interni è uno
strumento di supporto essenziale (manuale di gestione,
manuale della conservazione)
i problemi aperti
• Tempistica nella smaterializzazione a norma:
– Al momento della formazione del documento?
– Quando si chiude la pratica e il relativo fascicolo?
• Modalità di riconoscimento della validità giuridica a lungo
termine del documento digitale
le strategie di Adobe per la validità giuridica a
lungo termine del documento digitale
•
Le strategie individuate da Adobe includono l’incorporazione delle risposte di verifica e
controllo da parte di chi deve verificare la validità del documento
1. incorporazione nel pdf delle risposte sul controllo delle revoche (server OCSP) con
indicazione di data e ora dal server che le crea: es. un consorzio di produttori
farmaceutici richiede il controllo incorporato come requisito per una soluzione
‘leggera’
2. incorporazione nel pdf del controllo affidabile di data e ora in connessione con la
produzione dell’impronta del documento
3. convalida di archivio: “internalizzazione del processo di autenticazione” mediante la
registrazione dei processi di verifica e controlli di validità, revoca e indicatori di data e
ora: i metadati sono conservati insieme ai documenti nel sistema di gestione dei
documenti (es. il tribunale che accetta documenti legali, moduli e prove “non può
contare sul fatto che i certificati siano validi di per sé o sul fatto che una …CA continui
ad esistere … Il risultato dei controlli viene documentato e memorizzato nei db e può
essere referenziato nel sistema di gestione dei contenuti che ospita i documenti … Il
documento può essere considerato valido per un periodo indefinito, coincidente con
l’esistenza dei sistemi di archiviazione”
documento digitale e componenti digitali
•
•
Un documento digitale viene riprodotto da un sistema informatico, tipicamente
su uno schermo, in relazione alla richiesta di un utente o nell’ambito di
interrelazioni tra sistemi. In ogni caso non può essere memorizzato nella forma
in cui è visualizzato e utilizzato.
Il documento digitale è conservabile non come originale, ma solo in quanto
capacità di riprodurre il documento (una sua copia autentica) mediante la
conservazione delle componenti digitali costitutive: il sistema deve perciò essere
in grado di identificare e localizzare tutti le componenti digitali di ciascun
documento e utilizzare il software appropriato per ciascuna componente.
Esempi:
– E-Mail = 1. testo del messaggio, 2. una fotografia, 3. una firma digitale, 4.
dati di intestazione (4 componenti)
– Rapporto: file pdf unico (1 componente) oppure n file per ciascuna pagina (n
componenti): n componenti possono essere incorporate in un’unica
componente senza produrre significativi cambiamenti
alcuni punti fermi negli standard
internazionali - 1
•
•
•
Il problema della conservazione non è riducibile alla gestione del
supporto
E’ necessario distinguere due classi di documenti digitali: i documenti
memorizzati (stored record) e i documenti resi accessibili/esibiti
temporaneamente, ogni volta che sia necessario, in quanto copie autentiche
(manifested record)
Con riferimento ai dati digitali memorizzati (componenti digitali) da
conservare per riprodurre i documenti conservati si distinguono tre
tipologie: content data, form data, composition data
alcuni punti fermi negli standard
internazionali - 2
•
•
•
Il processo di conservazione richiede un numero crescente e
impegnativo di informazioni (metadati) da acquisire: è
destinato ad avere peso e successo se gestito
automaticamente, strettamente correlato ai processi di
formazione dei documenti e alla gestione delle informazioni
di contesto, utilizzato come componente specifica di una
catena della conservazione
I metadati resi disponibili nei processi di formazione dei
documenti e rilevanti a fini conservativi sono finalizzati ad
acquisire informazioni significative in relazione agli aspetti
gestionali e alle transazioni che hanno per oggetto i
documenti, la cui principale funzione è quella di
testimonianza di attività giuridicamente rilevanti e non di
contenitore di informazioni
E’ necessaria una mediazione “descrittiva” da parte
dell’archivista.
metadati e conservazione digitale: una funzione
essenziale
• Per quanto riguarda le finalità conservative, i metadati sono
necessari:
– alla identificazione certa e univoca della risorsa (ad esempio i dati di
protocollazione/classificazione, ecc.)
– a documentarne l’integrità in fase di trasmissione nello spazio e nel
tempo:
• dati di contesto in relazione al processo di lavoro
• documentazione sulle attività per la tenuta dei documenti
(selezione, collocazione fisica, protezione, migrazione…)
i formati per la formazione e conservazione
di documenti informatici
i formati dei file
• Ogni oggetto digitale (non ogni documento digitale)
è memorizzato come una sequenza di bit identificata
e memorizzata come entità unica nell’unità di
memoria (un file word di 30 kb equivale a una
sequenza di 245760 bit costituiti di 0 e 1 espressi
secondo uno specifico ordine)
• La sequenza di bit è intelligibile e riproducibile come
contenuto e forma se interpretata da un sistema
informatico sulla base dei medesimi codici e delle
stesse regole con cui è stata originariamente creata
i requisiti dei formati per la conservazione:
requisiti generali di I livello
• non proprietà (formato libero): le specifiche non sono
prerogativa di organizzazioni private, ma dipendono dalla
comunità degli sviluppatori (ODF)
• apertura (completa documentazione pubblica e liberamente
accessibile, ad esempio sul web) (DOCX, PDF)
• standardizzazione (specifiche definite o approvate da un
organismo di normalizzazione: ISO, ECMA, W3C):
riconoscimento ufficiale possibilmente de jure; ampia
adozione
• trasparenza: semplicità nell’analisi diretta del file anche
mediante editor (TXT): sono trasparenti i formati non binari
espressi direttamente con codifiche
ASCII o UNICODE
(TXT, XML, HTML). Sono formati facilmente interpretabili e
quindi da privilegiare per la conservazione
i requisiti dei formati per la conservazione:
requisiti generali di I livello: esemplificazioni
• DOC: proprietario, aperto, non trasparente,
standard de facto
• RTF: proprietario, aperto, trasparente,
standard de facto
• DOCX: non proprietario in quanto approvato
dall’ISO nel 2008, aperto, trasparente (basato
su XML), standard de jure
i requisiti dei formati per la conservazione:
requisiti generali di II livello
•
•
•
•
•
•
•
•
•
•
•
robustezza: in caso di corruzione consente il recupero anche parziale dei contenuti
(è un problema di gradi: i formati compressi sono meno robusti): TIFF vs JPEG
stabilità (compatibilità retroattiva e prospettica): modifiche limitate nel tempo
(TIFF vs DOC): è quasi sempre solo retroattiva
auto-contenimento o auto-inclusione: permette di includere tutte le risorse
necessarie per la sua rappresentazione (risorse interne vs link)
auto-documentazione: possibilità di includere metadati nel file
indipendenza dal dispositivo o portabilità rispetto alla piattaforma
assenza di meccanismi tecnici di protezione (possibilità di riproduzione vs
password o crittografia)
assenza di limitazioni sull’utilizzo
accessibilità: facile fruizione anche da persone diversamente abili
non modificabilità
sicurezza: rispetto ad attacchi da parte di codici maligni
efficienza: contenimento delle dimensioni del file
lo stato dell’arte per i principali formati
• ODF (OpenOffice): soddisfa tutti i requisiti
purché non contengano contenuti
multimediali (binari)
• OOXML (Microsoft): c.s. dal 2008 anche se
l’efficienza è limitata
• PDF e PDF/A (Adobe): non proprietario,
aperto, non trasparente (compresso),
standard de jure
PDF/A
• Corrisponde alla versione 1.4 del PDF
• Assicura la produzione di rappresentazioni stabili
(testo e immagini)
• Comprende regole in grado di sostenere la leggibilità
(ad es. assenza di cifratura, font incorporati e
standard, metadati standard)
• Esistono prodotti per la verifica del rispetto di tali
regole
un’analisi dei formati più diffusi
Formato
Valido
Motivo
HTML
NO
Formato non standard, può essere interpretato diversamente
a seconda del tipo di browser e può contenere codice che ne
altera il contenuto
PDF
SI
Formato standard nelle versioni approvate dall’ISO
TIFF
SI
Formato immagine standard non modificabile che non
richiede software proprietario per la visualizzazione
WORD
NO
Formato proprietario che può contenere codice che ne altera
il contenuto
XML
SI
Formato standard non proprietario utilizzato per i metadati
XML
(Extensible Markup Language)
<?xml version="1.0"?>
<rubrica>
<persona>
<nome>Mario</nome>
<cognome>Rossi</cognome>
<indirizzo>
<via>via bianchi 1</via>
<cap>00000</cap>
<citta>Roma</citta>
</indirizzo>
<telefono>
<telefono_fisso>123456</telefono_fisso>
<telefono_cellulare>987656412</telefono_cellulare>
</telefono>
</persona>
</rubrica>
rubrica.xml
Lo stesso file Rubrica.xml è rappresentato
diversamente da due applicativi diversi
TIFF
(Tagged Image File Format)
E’ un formato grafico consentito per la formazione dei documenti
informatici.
A differenza del formato JPEG non ha fattori di compressione e
gestisce la funzione multipagina,
multipagina, cioè
cioè la capacità
capacità di salvare più
più
pagine all’
all’interno dello stesso file.
file
E’ più
più versatile del pdf:
pdf si possono ad esempio ruotare le pagine, o
“spostarle” all’interno del documento, o copiare singole pagine in
un altro documento. Il file pdf una volta creato consente modifiche
solo con Acrobat Writer.
TIFF & PDF
Il file tiff di solito è il risultato di
un’acquisizione di immagini tramite
scanner: il contenuto testuale del
file non è disponibile. Abbiamo
una “fotografia” del documento,
ma non possiamo gestire il testo ivi
contenuto a meno che non
sottoponiamo il file ad un processo
di riconoscimento ortografico
(OCR).
La stessa cosa vale per un file pdf ottenuto da una scansione di
documento: non è possibile gestire il testo su una foto! Distinguiamo
quindi un pdf creato da un documento informatico (testo gestibile)
da quello ottenuto da scansione del cartaceo (non gestibile)
PDF/A
(Portable Document Format / Archive) - 1
E’ un’evoluzione del formato pdf, specificatamente realizzato per
l’archiviazione a lungo termine dei documenti elettronici.
elettronici Risponde
agli standard ISO 19005-1 e presenta proprietà di indipendenza
dalle periferiche che lo utilizzano e autoreferenzialità
autoreferenzialità, cioè la
capacità di avere al suo interno tutti gli elementi necessari per la
rappresentazione. Per queste sue proprietà:
- Contenuti multimediali audio e video sono proibiti.
- Javascript e file eseguibili sono proibiti.
- Tutti i font devono essere incorporati e legalmente incorporabili
senza limiti e universalmente utilizzabili.
Un documento salvato in formato pdf/a fornisce la garanzia di
leggibilità
leggibilità nel tempo
PDF/A
(Portable Document Format / Archive) - 2
Non sempre si possono convertire i file PDF in PDF/A: dipende dal
file originale anche se le nuove versioni di Acrobat offrono la
possibilità di verificare il processo e gestirlo.
A.Conversione in PDF/X
B. Verifica di PDF/X
C. PDF/X non valido
D. PDF/X valido
Pulsanti PDF/X (i pulsanti PDF/A sono simili)
i formati compressi: il caso del formato ZIP: un
esempio
Il Ministero degli Esteri e il Ministero dell’Interno
hanno concordato delle linee guida per la
trasmissione telematica degli atti di stato civile tra
Ambasciate (e Consolati) e gli uffici di stati civile
dei Comuni Italiani.
Le linee guida prevedono che i tutti documenti
relativi a una pratica possano essere raccolti in un
file zip firmato digitalmente dall’
dall’ufficiale incaricato.
incaricato
Anche se la firma digitale consente l’identificazione
del firmatario, il formato “zip”
zip” non è un formato
adatto alla conservazione dei documenti.
documenti
i formati specifici accettati dagli Archivi francesi
-1
Type de données
Images fixes
Documents structurées et
non structurés
Format accepté en entrée
PNG
GIF
JPEG 2000 (jp2)
JPEG (jfif, jpg)
TIFF
BMP
PCX
HTML
XHTML
OpenDocument
MSoffice DOC
Msoffice XLS
Msoffice PPT
Msoffice DOC
Msoffice XLS
Msoffice PPT
PDF/A
PDF
RTF
CSV
TXT
Version(s) supportée(s)
1.0/1.1/1.2
GIF89a
ISO/IEC 15444:2000
ISO 10918
6.X
N/A
N/A
2/3.2/4.0/4.1
1.0/1.1
ISO 26300:2006
97/2000/XP ; 95 ; 6.0
97/2000/XP ; 95 ; 5.0
97/2000/XP
97/2000/XP ; 95 ; 6.0
97/2000/XP ; 95 ; 5.0
97/2000/XP
PDF 1.4
1.3 ; 1.4 ; 1.5 ; 1.6
1.5 ; 1.7 ; 1.8
N/A
N/A
Format cible d'archivage
PNG
PNG
JPEG 2000
JPEG
TIFF
JPEG 2000
JPEG 2000
HTML
XHTML
OpenDocument
OpenDocument
OpenDocument
OpenDocument
PDF/A (ISO 19005)
PDF/A (ISO 19005)
PDF/A (ISO 19005)
PDF/A (ISO 19005)
PDF/A (ISO 19005)
PDF/A (ISO 19005)
CSV
TXT
i formati specifici accettati dagli Archivi francesi
-2
Type de données
Son et Vidéo
Formats composites
Documents structurés
Format accepté en entrée
MPEG-2 Layer III (MP3)
WAV
MPEG-2
MPEG-4
ZIP
WinRAR
Sit
E-mail
XML
XSD
XML validé par XSD
SGBD
SVG
DWG
DXF
Données graphiques
CGM
STEP
Version(s) supportée(s)
ISO/CEI 13818
ISO/CEI 14496
10.X
3.X
RFC 2822 + RFC 2045
1.0
1.0 XSD
XML 1.0
Format cible d'archivage
MPEG-2 Layer III (MP3)
MPEG-2 Layer III (MP3)
MPEG-2
MPEG-4
Format Original
Format Original
Format Original
E-mail + pièces jointes
XML
XML
TXT
N/A
SVG
1.1
R2007/R2004/R2000/R14 SVG
/R13/R12/R11/R10/R9
v.u.21.1.01/v.u.20.1.01/v. SVG
u19.1.01/v.u18.1.01/v.u16
.1.01/v.u15.0.02/v.u14.1.0
4/v.u13.1.0
CGM
ISO 8632:1992
ISO/10303
STEP
i metodi per la conservazione
considerazioni preliminari alla definizione di un
metodo ( 1)
• Non è possibile conservare l’originale di documento
elettronico, ma solo la capacità di riprodurlo
• La relazione tra un documento archivistico e un “file” può
essere uno-a-uno, uno-a-tanti, tanti-a-uno, tanti-a-tanti
• La stessa presentazione di un documento può essere creata
da una varietà di presentazioni digitali, e viceversa, da una
presentazione digitale si può generare una varietà di
presentazioni documentarie
• E’ possibile cambiare il modo in cui un documento è
contenuto in un “file” senza cambiare il documento
• La conservazione digitale riguarda sia i documenti nati digitali
che i patrimoni digitalizzati a fini culturali di varia natura
considerazioni preliminari alla definizione di un
metodo (2): riproduzione
• Il primo passo nel riprodurre un documento elettronico è
ricostruirlo associando tutte le sue componenti digitali
nell’ordine giusto
• Il secondo passo è rendere le componenti, individualmente e
collettivamente, nella forma documentaria giusta
• Il terzo passo è ristabilire le relazioni tra il documento in
questione e tutti gli altri documenti che appartengono alla
stessa unità.
considerazioni preliminari alla definizione di un
metodo (3): catena di conservazione
• In considerazione del fatto che i processi di
immagazzinamento e reperimento comportano
trasformazioni fisiche e di rappresentazione, il concetto
tradizionale di catena ininterrotta di custodia deve essere
ampliato e includere i processi necessari ad assicurare la
trasmissione inalterata nel tempo del documento
• La catena ininterrotta di conservazione comincia quando i
documenti sono prodotti col rispetto dei requisiti per
autenticità/benchmark e continua con la documentazione di
tutti i cambiamenti subiti dai documenti e dei processi di
selezione, trasferimento, riproduzione e conservazione
considerazioni preliminari alla definizione di un
metodo (4)
• I controlli possono essere realizzati tecnologicamente, ma devono essere
determinati sulla base di principi e criteri definiti in base alla natura dei
documenti medesimi
• E’ impossibile mantenere letteralmente inalterato un documento
elettronico
• L’unico modo di provare che un documento elettronico è autentico è
riprodurre una copia autentica
• La tecnologia non può determinare la soluzione al problema della
conservazione permanente dei documenti elettronici:
– Le esigenze determinate dalla natura degli oggetti digitali trattati (funzioni e
caratteristiche) definiscono il problema e i principi per valutare la correttezza
e adeguatezza di ogni soluzione tecnica
• Le soluzioni al problema della conservazione sono dinamiche
i metodi per la conservazione dei documenti
informatici: requisiti
• Conservare una copia dell’oggetto digitale (con il livello di dettaglio
sufficiente: non sempre è necessaria una copia esatta dell’originale)
• Restituire forma e contenuto dell’oggetto grazie a un sistema accurato di
riproduzione delle caratteristiche ritenute essenziali
• Verificare (e assicurarne la verificabilità nel tempo) l’accuratezza
dell’intero processo
• Disporre della necessaria consapevolezza per la complessità della
gestione della funzione conservativa di lungo periodo
i metodi per la conservazione dei documenti
informatici: proprietà significative
•
La complessità dell’intervento dipende anche dalla necessità di definire criteri su
base soggettiva (almeno parzialmente) generali di comportamento per tipologie
documentarie e procedure definite:
– La decisione impegnativa di conservare i colori di una mappa richiede la valutazione del
significato dei colori (essenziali in una mappa catastale), rilevanti a fini estetici in una
mappa architetturale.
– La decisione conservativa deve avvenire a livello di archivio
– E’ necessario disporre degli elementi per valutare il grado di funzionalità e il loro
possibile sviluppo soprattutto in termini di ragionevole riuso.
– E’ di grande utilità disporre dei dati che ci consentono di valutare il livello di
documentazione accessibile e necessario per le diverse classi di oggetti: per i
documenti testuali si possono richiedere la presentazione e il layout di stampa al fine di
non perdere la fluidità e il contesto del testo; nel caso di un db relazionale la perdita dei
metodi di presentazione può rendere del tutto incomprensibile il risultato finale del
processo conservativo.
i metodi per la conservazione dei documenti
informatici: contro la dipendenza dal software
• Contro i rischi di bitstream privi di significato è necessaria
documentazione ricca finalizzata anche ad estrarre
informazioni dai dati conservati
• Nonostante gli sforzi delle organizzazioni internazionali a
proposito dei formati, i venditori elaborano nuove versioni
senza rilasciare le specifiche tecniche (tuttavia i formati
proprietari più diffusi sono sempre più ‘conservabili’)
• La specifica dei formati è in crescita ed è destinata a svolgere
un ruolo rilevante in alcuni contesti (ambiti scientifici e tecnici
evoluti, performing arts)
i metodi per la conservazione dei documenti
informatici
•
•
•
•
Conservazione delle tecnologie
Stampare su carta
Imitazione/Emulazione
Migrazione
conservazione di tecnologia
• Conservazione di tecnologia: consiste nel conservare o riprodurre
l’hardware e il software originari insieme al loro ambiente operativo.
Prevede due opzioni:
– Mantenimento del vecchio ambiente tecnologico
– Riproduzione del vecchio ambiente
• E’ un metodo ritenuto da tempo non perseguibile per l’enorme quantità
(in crescita esponenziale) di tecnologia diversa da mantenere. Esistono
poi limiti fisici invalicabili. Ha il vantaggio di “sembrare” facile e di
semplificare le procedure di verifica dell’autenticità dei documenti.
• E’ utilizzabile per fasi transitorie e per soluzioni di emergenza
• Le capacità di utilizzare i vecchi ambiente diminuisce molto rapidamente
• Gli oggetti fisici conservati rischiano di non poter più essere riparati
riprodurre su carta
– E’ una soluzione sempre meno utilizzabile (solo per gli
oggetti statici: documenti testuali, immagini, ma non i
database che sono ancora in attesa di soluzioni
inadeguate).
imitazione/emulazione
• Prevede più opzioni:
•
•
•
– emulazione
– creazione di macchine virtuali
– ingegnerizzazione del software
Consiste nel produzione di software specifico per la creazione di un nuovo
ambiente informatico che consenta di utilizzare i documenti a fronte di una
evoluzione o di una perdita dell’hardware o del software nativi. E’ una sorta di
“strato” tra il sistema operativo e i programmi applicativi che “simula” le proprietà
originarie del precedente ambiente.
Si basa sul presupposto che l’hardware esistente (ad esempio il computer Intel) sia
perfettamente (o adeguatamente) documentato.
E’ in ogni caso indispensabile operare al momento giusto: non troppo presto né
troppo tardi in modo da evitare sia tecnologie troppo complesse sia soluzioni non
ancora mature e sperimentate
imitazione/emulazione: condizioni
• E’ necessario conservare:
– la documentazione dell’hardware
– il sistema operativo nella forma di un flusso di bit (Windows 2000)
– il programma applicativo (ad esempio word 2000) nella forma di un
flusso di bit
– l’oggetto digitale (il documento) nella forma di un flusso di bit
– tutti i metadati necessari (descrittivi, gestionali, ecc.)
imitazione/emulazione: le fasi successive
• Le fasi successive della conservazione comprendono:
– la costruzione di un software che emuli l’hardware originario (ad es.
Pentium Intel)
– l’utilizzo del sistema operativo conservato come flusso di bit (ad es.
Windows 2000)
– la ricostruzione e l’uso del programma originario conservato come
flusso di bit (ad es. word 2000) per leggere l’oggetto digitale
conservato (recuperato e interpretabile grazie alla presenza di
metadati)
imitazione/emulazione: svantaggi
• Non è un metodo molto usato per fini di conservazione a lungo termine: è
molto costoso e impegnativo e l’’evoluzione tecnologica rende sempre
più difficile la scrittura di emulatori di software sempre più numerosi,
sofisticati e complessi (centinaia di migliaia di combinazioni possibili di
software applicativi), di cui non si hanno generalmente conoscenze
sufficienti. Ripropone, inoltre, i difetti delle tecnologie originarie.
• Crea problemi notevoli per lo sviluppo di funzioni di help desk necessari a
sostenere l’accesso futuro: ad esempio nei sistemi in rete sono necessari
sistemi di aiuto alla ricerca molto complessi e diversificati
• Implica la rinuncia alla possibilità di utilizzare tecniche e prodotti migliori.
• Il progetto più noto è CAMiLEON (che si è tra l’altro basato anche sulla
gestione dei metadati secondo il modello standard OAIS)
migrazione
• Consiste nel trasferimento di oggetti da un ambiente hardware/software
a un altro. Può implicare modifiche anche rilevanti nel flusso di bit che
costituiscono il documento.
• E’ costosa e presenta molti rischi di perdita di informazioni rilevanti
all’adeguato accesso archivistico ai documenti.
• Richiede un livello dettagliato di metadati
• Prevede più opzioni per la gestione dei formati:
– il mantenimento dei formati originari compatibili (ad esempio il
mantenimento dei vecchi formati word della Microsoft)
– la migrazione dei formati in modalità evolutiva
– la migrazione in formati standard per la creazione di persistent object , a sua
volta distinguibile in:
• utilizzo di formati standard in fase di formazione
• utilizzo in formati standard in fase di trasferimento a fini di
tenuta/conservazione
mantenimento dei formati originari
• Il mantenimento dei formati originari consente la capacità
diffusa di manipolazione e, quindi, accresce i rischi per
l’integrità dei documenti
• Non sono garantite le funzioni di archiviazione permanente
migrazione dei formati in modalità evolutiva
• Non risolve il problema dell’obsolescenza, perché è basata su soluzioni
ad hoc e a termine
• Non è certa l’esistenza di formati di archiviazione
• Non elimina la difficoltà di gestire una molteplicità eccessiva di formati
• Non sono sotto controllo i cambiamenti dei formati medesimi: rischia di
introdurre errori
• E’ costosa e impegnativa
• Dopo un certo numero di anni e una catena di conversioni può essere
impossibile e troppo costoso gestire le necessarie verifiche in relazione
all’integrità degli oggetti
• La comunità archivistica ha sempre più consapevolezza della necessità di
conservare (anche) il bitstream originario
• Si utilizza talvolta la “migrazione on demand” per la quale è tuttavia
necessaria una struttura intermedia di gestione (modulo di input, di
conversione e di output)
migrazione in formati standard
• Consiste nella trasformazione/produzione di qualunque oggetto
informatico utilizzando strumenti standard non proprietari, indipendenti
dalla specifica applicazione.
• Nel caso di documenti office (testi, presentazioni, fogli elettronici)
consiste nell’utilizzo di un linguaggio standard (ASCII o UNICODE),
incapsulato in un insieme di metadati espressi con marcatori
• Ha tra l’altro il vantaggio di presumere una durata maggiore del formato e
richiedere quindi un numero inferiore di migrazioni
• Nel caso di utilizzo di tali formati per la produzione di oggetti digitali, si
riducono notevolmente i rischi di perdite dovute al processo di migrazione
e si aumentano le potenzialità dell’interazione
migrazione in formati standard: vantaggi e limiti
• Poiché implica un numero minore di interventi di migrazione, si riducono i
rischi di autenticità e si minimizzano i cambiamenti
• Consente controlli specifici e procedure predefinite per la verifica
dell’autenticità
• E’ una tecnica coerente con la natura dei documenti (stabilità dei
contenuti e della struttura di rappresentazione)
• Consente l’utilizzo di tecnologie più avanzate che migliorano l’accesso e la
gestione del sistema
• Ha il limite (temporaneo) di non disporre di applicazioni di mercato
evolute
depositi d’archivio e custodia delle
memorie digitali
deposito digitale: una definizione - 1
• E’ definito come “un luogo” dove memorizzare, consentire
l’accesso e conservare oggetti digitali di diversa natura e
complessità insieme ai metadati necessari per descrivere e
gestire gli oggetti medesimi.
deposito digitale: una definizione - 2
• I requisiti fondamentali previsti dal rapporto riguardano:
• Il deposito e le relative politiche, standard e infrastrutture
tecnologiche
• Il deposito in quanto sistema accreditato (ovvero un
sistema di sw e hw fondato su regole certe)
• E’ implicito il principio di assunzione di responsabilità per la
conservazione e tutte le attività correlate inclusa la
definizione di metodologie di valutazione e monitoraggio
• La prima sfida è quella di trasformare i servizi e i depositi
tradizionali in servizi e depositi digitali accreditati
il nodo cruciale non è tecnologico
Da JISC, Infokit Digital Repository, 2010
http://www.jiscinfonet.ac.uk/infokits/repositories//index_html
• "What goes into a repository is currently less an issue of
technological or software ability, and more a policy decision
made by each institution or administrator”
• .
criteri di creazione (TRAC e NESTOR)
•
Le raccomandazioni del documento RLG-NARA, Task Force on digital repository
certification, Audit checklist for certifying digital repositories
(www.rlg.org/en/pdfs/rlgnara-repositorieschecklist.pdf) individuano 4 aree di
riferimento:
– organizzazione interna: policy per la conservazione, documentazione delle finalità,
responsabilità, procedure e risorse, gestione della qualità (ISO 9000), pianificazione
delle risorse
– cooperazione con i produttori e gli utenti finali: definizione della comunità di
riferimento, criteri di selezione, linee guida per l’acquisizione, accordi e cooperazione
con i produttori, politiche per l’accesso, servizi di consultazione
– gestione tecnica del sistema: conformità agli standard (es. ISO 15489:2001 sul RM, ISO
17799:2005 sulla sicurezza dell’informazione, ISO OAIS 14721), documentazione dei
processi tecnici (disegno di sistema delle funzioni conservative della DL), garanzie di
autenticità e integrità del sistema, ambiente HW e SW adeguato, fattibilità della
migrazione, flessibilità e modularità)
– gestione tecnica degli oggetti digitali (metadati descrittivi, digestione, di conservazione
e accesso, vocabolari controllati, codici di identificazione persistenti, autenticità e
integrità degli oggetti, formati di archiviazione controllati, disponibilità a lungo termine
degli oggetti)
requisiti essenziali negli standard internazionali
– conformità allo standard OAIS in quanto capace di fornire un modello
funzionale (per l’archiviazione e l’accesso) e informativo (per la
gestione dei metadati descrittivi e conservativi) adeguato
– chiara responsabilità amministrativa
– adeguatezza organizzativa e procedurale del deposito
– sostenibilità finanziaria dell’intervento nel lungo periodo
– idoneità della infrastruttura tecnologica
– sicurezza del sistema
La finalità è quella di assicurare il grado necessario di affidabilità del
sistema mediante il riconoscimento di procedure esplicite e
formalizzate
le responsabilità
• amministratore generale e amministratori di settore;
• record manager e archivisti;
• specialisti ICT (sia nel disegno che
nell’implementazione dei sistemi);
• personale per la gestione dei servizi di base e per la
sicurezza
• esperti di gestione del rischio;
gli elementi di valutazione per la certificazione
(ISO 16363 - draft) - 1
– mandato istituzionale coerente con le finalità anche in termini di garanzia di
continuità in caso di trasformazioni istituzionali
– personale competente ed esperto per tutti i compiti affidati (tecnologici,
organizzativi, archivistici) adeguato in numero e riconosciuto nelle
responsabilità
– strumenti e meccanismi per garantire l’aggiornamento professionale del
personale
– procedure e linee d’azione coerenti inclusive di meccanismi di verifica e
aggiornamento sul piano tecnologico e organizzativo
– strumenti di verifica e monitoraggio interni finalizzati a sostenere la continuità
della funzione conservativa
– valutazione esterna periodica sulle funzionalità del deposito
– documentazione dei cambiamenti intervenuti nel deposito con riferimento
alle procedure, al software, all’hardware e in relazione alle strategie di
conservazione adottate
– strumenti per la verifica dell’integrità delle risorse digitali conservate
– pianificazione delle attività al fine di garantire la sostenibilità del deposito
gli elementi di valutazione per la certificazione
(ISO 16363 - draft)- 2
– accordi di deposito con eventuali altri depositi federati
– funzioni, attività e procedure di acquisizione degli oggetti digitali che
includano:
• elementi e attributi per ciascuna tipologia di oggetti (identificati secondo
standard internazionali)
• definizione sulla base di accordi scritti con i soggetti produttori che
depositano/versano i documenti/archivi delle procedure e delle modalità
di gestione e di accesso
• linee guida per l’acquisizione
• requisiti per un controllo fisico degli oggetti depositati
• verifica della completezza e accuratezza degli elementi informativi
• disponibili (secondo i parametri indicati dal modello OAIS)
• documentazione delle responsabilità per la conservazione
• utilizzo di sistemi che garantiscano la identificazione univoca degli oggetti
e i legami con le informazioni di rappresentazione
• utilizzo di meccanismi indipendenti di verifica dell’integrità dei contenuti
del deposito
gli elementi di valutazione per la certificazione
(ISO 16363 - draft) - 3
– esistenza e documentazione di strategie di pianificazione della funzione
conservativa e di migrazione/gestione che includano i riferimenti ai registri dei
formati secondo gli standard internazionali
– gestione dei metadati descrittivi e gestionali/amministrativi
– politiche per l’accesso in grado di garantire risposte certe e documentate
– sistemi di tracciamento dei file di log in grado di testimoniare le criticità degli
accessi
– strumenti in grado di garantire l’esibizione di documenti autentici
– infrastruttura tecnologica adeguata in termini di sistemi operativi, funzioni di
backup, ridondanza (almeno 3 copie) e collocazione sicura delle copie,
garanzie per il loro allineamento, meccanismi di verifica delle perdite e delle
manipolazioni, processi di migrazione, di documentazione dei processi di
gestione del ciclo di vita e del loro impatto sulla conservazione
gli elementi di valutazione per la certificazione
(ISO 16363 - draft)- 4
– sistemi di sicurezza di alta qualità che includano:
• l’analisi sistematica dell’ambiente, dei dati, del personale, degli
impianti e delle attrezzature, delle esigenze
• meccanismi di implementazione
• un sistema chiaro di ruoli, responsabilità e autorizzazioni
• piani scritti di disaster recovery regolarmente verificati
• processi per la continuità del servizio
Il quadro normativo aggiornato sulla
conservazione a norma (a medio e a lungo
termine)
le norme di riferimento principali
• Decreto del Ministro dell’economia e delle finanze 23 gennaio
2004: Modalità di assolvimento degli obblighi fiscali relativi ai
documenti informatici ed alla loro riproduzione in diversi tipi
di supporto
• Deliberazione CNIPA 19 febbraio 2004 n. 11: conservazione
‘sostitutiva’
• CAD 82/2005 e successive modifiche, in particolare dlgs
235/2010
• Regole tecniche ai sensi dell’articolo 71 CAD in corso di
elaborazione (bozza in via di ridefinizione presso i gruppi di
lavoro coordinati da DigitPa)
• Percorso lungo e complesso con riferimento sia alla normativa
sulla validità giuridica del documento sia alle disposizioni
specifiche sulla conservazione ‘a norma’
• Complessità delle disposizioni sulle copie nel nuovo CAD
• Difficoltà del giurista in assenza di un quadro consolidato e di
esperienze: inevitabile tendenza a rapportare problemi e
soluzioni alla dimensione analogica
considerazioni introduttive
• Il problema della conservazione digitale è stato
trattato dal legislatore italiano inizialmente in
termini di conservazione a breve-medio termine e si
è a lungo concentrato sulla questione della
‘riproduzione sostitutiva dei documenti analogici e
della loro archiviazione/tenuta nel tempo a fini
legali/fiscali’.
• La legislazione esistente offre comunque indicazioni
operative utili anche a un processo di conservazione
a lungo termine
il documento come rappresentazione e gli
obblighi della conservazione
• Il concetto di documento implica una serie di conseguenze in termini di
gestione dei controlli e presenza di informazioni necessarie a garantire
• certezza nell’imputabilità dei contenuti del documento all’autore
(integrità, data certa, provenienza) (metadati?)
• definizione della posizione logica che il documento occupa nell’archivio o
nel sistema di tenuta e identificazione delle relazioni di contesto
(documentarie e amministrative in particolare) (metadati?)
• stabilità dei contenuti e delle componenti del documento nel tempo e
delle relazioni tra i documenti (condizioni adeguate di verifica, gestione
persistente delle informazioni rilevanti) (metadati?)
le esigenze principali della normativa
• fornire indicazioni e procedure che assicurino l’autenticità, l’integrità, la
non modificabilità dei dati e dei singoli documenti conservati anche da un
ente terzo per ragioni giuridiche e per un arco temporale limitato (senza
quindi considerare in alcun modo i nodi tecnologici e organizzativi della
conservazione a lungo termine di archivi digitali): non si affrontano i
problemi archivistici
• l’esigenza di stabilire modalità che assicurino la conformità all’originale
di documenti digitali nativi non più conservabili nella stessa forma e nello
stesso formato: affidamento a strumenti crittografici
• di documenti digitali che costituiscono la riproduzione di documenti
analogici che si vorrebbe destinare successivamente alla distruzione
i principi generali - 1
• distinzione tra archiviazione informatica (intesa come semplice attività di
memorizzazione su supporti digitali senza ulteriori prescrizioni) e
conservazione (definita nel dlgs 235/2010 come conservazione senza
ulteriori attributi), finalizzata a rendere il documento non modificabile né
deteriorabile e, quindi, capace di mantenere nel tempo le sue
caratteristiche originarie di autenticità e integrità,
• libertà dell’utente nel definire le modalità operative del processo (anche
in risposta all’eccesso di dettagli tecnici delle disposizioni precedenti,
ovvero delle deliberazioni Aipa 15/1994 e 24/1998) e assenza di
autorizzazioni preventive
i principi generali - 2
• definizione di regole tecniche per la conservazione mediante l’utilizzo
dell’impronta del documento e l’apposizione all’insieme dei documenti da
conservare del relativo riferimento temporale e della firma digitale da
parte del responsabile della conservazione (che in alcuni casi deve avere
la veste del pubblico ufficiale), con funzioni di file di chiusura del lotto di
conservazione: si ipotizza (anche se in modo esplicito) la creazione di
lotti/vokumi di conservazione (ma non se ne definiscono le
caratteristiche)
• distinzione tra riversamento diretto o indiretto dei documenti a seconda
che si tratti o meno di modificare la rappresentazione informatica del
contenuto e della forma del documento per ragioni di obsolescenza
tecnologica (migrazione) o semplicemente per evitare la perdita di
efficienza dei supporti (copiatura): nel nuovo CAD si distinguono copia
informatica per immagine e duplicato
I principi generali - 3
• definizione del concetto di riferimento temporale opponibile a terzi
utilizzando strumenti diversi: marcatura temporale, segnatura di
protocollo, posta certificata, predisposizione di lotti per la conservazione,
• individuazione delle modalità per l’esibizione dei documenti,
identificazione dei compiti e delle responsabilità del responsabile della
conservazione che includono la realizzazione secondo principi di sicurezza
documentati di un sistema informativo relativo ai documenti digitali e la
definizione e gestione dell’ambiente applicativo, con specifica attenzione
alla tipologia dei documenti da conservare, alle copie di sicurezza e
all’eventuale delega di funzioni a terzi. Il nuovo CAD prevede il
coordinamento con il responsabile del sistema di gestione dei documenti
circoscrivere le responsabilità per la
conservazione
• La responsabilità per la funzione conservativa ha bisogno di
specifiche indicazioni sulle forme e sui limiti del suo esercizio,
stabilendo ad esempio che
– la delega sia assicurata mediante un atto formale di designazione
– le procedure specifiche di conservazione (ottenute ad esempio
mediante la stesura e approvazione congiunta di un manuale di
conservazione) non siano riducibili alle sole procedure di sicurezza,
ma siano capaci di collegare la conservazione alla gestione (il manuale
di gestione) con attenzione alle informazioni della fase attiva quali le
specifiche modalità di organizzazione e tracciamento dei flussi o la
gestione dei fascicoli ibridi
le modalità di verifica temporale della validità giuridica
del documento digitale: la marca temporale - 1
• Il servizio di marcatura temporale: (fornito dal certificatore
accreditato tramite server accessibili via Internet:
– si trasmette una richiesta contenente l’impronta e si ottiene in
risposta la marca temporale, ovvero un documento firmato dal
certificatore contenente un insieme formato dall’impronta del
documento per il quale si richiede la marcatura e da una
informazione di data ed ora precisa e affidabile (dato che è affidabile
il certificatore accreditato)
le modalità di verifica temporale della validità giuridica
del documento digitale: la marca temporale – 2
(da una slide di Roberto Baudizzone)
i tempi e la gestione delle marche temporali - 1
• A seguito del dpcm 30 marzo 2009 e della delibera Cnipa 45/2009:
– la validità delle marche temporali è di 20 anni (prima 5 anni) e le
chiavi di marcatura temporale sono sostituite ogni 3 mesi (prima era
30 giorni)
– i certificatori devono mantenere nelle CRL informazioni sui certificati
revocati e sui certificati rilasciati anche dopo la loro scadenza
naturale per un periodo di 20 anni i certificatori devono
indicare/fornire software di verifica in grado di eseguire “verifica alla
data”
– l’annullamento di una sospensione temporanea non implica la
scadenza del certificato ma equivale all’assenza di sospensione
– In sostanza, la CRL presente sul sito dovrebbe essere sufficiente a
garantire le verifiche senza richiedere la conservazione delle diverse
CRL modificate.
i tempi e la gestione delle marche temporali
• Restava in sospeso (fino al nuovo CAD) il nodo della scadenza
del certificato della CA o della cessazione di attività: ai sensi
dell’articolo 37 comma 4bis si prevede il deposito presso
DigitPA delle liste di revoca in caso di cessazione delle
attività del certifcatore
• La normativa ha di fatto affidato alle società di archiviazione e
in prospettiva a quelle certificate funzioni privilegiate di
acquisizione e tenuta dei documenti (soprattutto dei
documenti firmati digitalmente nella forma di una
conservazione anticipata
la conservazione nel CAD: articolo 44
• Le indicazioni si limitano a considerazioni generiche ma
corrette (anche se apparentemente riferite ai singoli
documenti più che ai contesti archivistici di produzione e
tenuta):
– identificazione certa del soggetto che ha formato il
documento o che lo ha acquisito
– Integrità
– leggibilità e agevole reperibilità dei documenti e delle
informazioni identificative inclusi i dati di registrazione e
classificazione originari
– rispetto delle misure di sicurezza
nodi organizzativi: deleghe e limiti del
responsabile: articolo 44, comma 1ter
• 1-ter. Il responsabile della conservazione può chiedere la
conservazione dei documenti informatici o la certificazione
della conformità del relativo processo di conservazione a
quanto stabilito dall’articolo 43 e dalle regole tecniche ivi
previste, nonché dal comma 1 del presente articolo, ad altri
soggetti, pubblici o privati, che offrono idonee garanzie
organizzative e tecnologiche
i conservatori accreditati: articolo 44 bis
• I soggetti pubblici e privati che svolgono attività di
conservazione dei documenti informatici e di certificazione
dei relativi processi per conto di terzi ed intendono
conseguire il riconoscimento del possesso dei requisiti del
livello più elevato, in termini di qualità e sicurezza, chiedono
l’accreditamento presso DigitPA
• Si applicano, in quanto compatibili, gli articoli 26 (requisiti dei
certificatori), 27 (certificatori qualificati), 29 (accreditamento,
ad eccezione del comma 3, lettera a) e 31 (vigilanza)
• I soggetti privati di cui al comma 1 sono costituiti in società di
capitali con capitale sociale non inferiore a euro 200.000
i conservatori accreditati: il riferimento
all’articolo 29 sulla qualificazione
• La qualificazione deve implicare la capacità di:
– dimostrare l’affidabilità organizzativa, tecnica e finanziaria necessaria,
– utilizzare personale dotato delle conoscenze specifiche, dell’esperienza e
delle competenze necessarie per i servizi forniti, in particolare della
competenza archivistica a livello gestionale, della conoscenza specifica nel
settore tecnologico, della dimestichezza con procedure di sicurezza
appropriate ed essere in grado di rispettare le norme previste
– applicare procedure e metodi amministrativi e di gestione adeguati e
conformi a tecniche consolidate (standard internazionali tra cui UNI
11386:2010 SInCRO, norme di sicurezza ETSI, ISO 14721 OAIS, ISO 16363 sui
depositi certificati)
– utilizzare sistemi affidabili e che garantiscono la sicurezza tecnica e
crittografica dei procedimenti in conformità a criteri di sicurezza riconosciuti
in ambito europeo e internazionale
continuità operativa: articolo 50 bis - 1
• In relazione ai nuovi scenari di rischio, alla crescente
complessità dell’attività istituzionale caratterizzata da un
intenso utilizzo della tecnologia dell’informazione, le
pubbliche amministrazioni predispongono i piani di
emergenza in grado di assicurare la continuità delle
operazioni indispensabili per il servizio e il ritorno alla
normale operatività.
• Il Ministro per la pubblica amministrazione e l’innovazione
assicura l’omogeneità delle soluzioni di continuità operativa
definite dalle diverse Amministrazioni e ne informa con
cadenza almeno annuale il Parlamento.
continuità operativa: articolo 50 bis - 2
• A tali fini, le pubbliche amministrazioni definiscono (sulla base di studi di
fattibilità valutati da DigitPA):
– a) il piano di continuità operativa, che fissa gli obiettivi e i principi da
perseguire, descrive le procedure per la gestione della continuità operativa,
anche affidate a soggetti esterni. Il piano tiene conto delle potenziali criticità
relative a risorse umane, strutturali, tecnologiche e contiene idonee misure
preventive. Le amministrazioni pubbliche verificano la funzionalità del piano
di continuità operativa con cadenza biennale
– b) il piano di disaster recovery, che costituisce parte integrante di quello di
continuità operativa di cui alla lettera a) e stabilisce le misure tecniche e
organizzative per garantire il funzionamento dei centri di elaborazione dati e
delle procedure informatiche rilevanti in siti alternativi a quelli di produzione.
DigitPA, sentito il Garante per la protezione dei dati personali, definisce le
linee guida per le soluzioni tecniche idonee a garantire la salvaguardia dei dati
e delle applicazioni nformatiche, verifica annualmente il costante
aggiornamento dei piani di disaster recovery delle amministrazioni interessate
e ne informa annualmente il Ministro per la pubblica amministrazione e
l’innovazione.
sicurezza dei dati, dei sistemi, delle
infrastrutture delle pp.aa.: articolo 51
• 1. Le norme di sicurezza definite nelle regole tecniche di cui all’articolo 71
garantiscono l’esattezza, la disponibilità, l’accessibilità, l’integrità e la
riservatezza dei dati. Con le regole tecniche adottate ai sensi dell’articolo
71 sono individuate le modalità che garantiscono l’esattezza, la
disponibilità, l’accessibilità, l’integrità e la riservatezza dei dati, dei sistemi
e delle infrastrutture.
• 1-bis. DigitPA, ai fini dell’attuazione del comma 1:
– a) raccorda le iniziative di prevenzione e gestione degli incidenti di
sicurezza informatici;
– b) promuove intese con le analoghe strutture internazionali;
– c) segnala al Ministro per la pubblica amministrazione e l’innovazione
il mancato rispetto delle regole tecniche di cui al comma 1 da parte
delle pubbliche amministrazioni.
• 2-bis. Le Amministrazioni hanno l’obbligo di aggiornare tempestivamente i
dati nei propri archivi, non appena vengano a conoscenza dell’inesattezza
degli stessi.
sicurezza dei dati, dei sistemi, delle
infrastrutture delle pp.aa.: articolo 51
• 1. Le norme di sicurezza definite nelle regole tecniche di cui all’articolo 71
garantiscono l’esattezza, la disponibilità, l’accessibilità, l’integrità e la
riservatezza dei dati. Con le regole tecniche adottate ai sensi dell’articolo
71 sono individuate le modalità che garantiscono l’esattezza, la
disponibilità, l’accessibilità, l’integrità e la riservatezza dei dati, dei sistemi
e delle infrastrutture.
• 1-bis. DigitPA, ai fini dell’attuazione del comma 1:
– a) raccorda le iniziative di prevenzione e gestione degli incidenti di
sicurezza informatici;
– b) promuove intese con le analoghe strutture internazionali;
– c) segnala al Ministro per la pubblica amministrazione e l’innovazione
il mancato rispetto delle regole tecniche di cui al comma 1 da parte
delle pubbliche amministrazioni.
• 2-bis. Le Amministrazioni hanno l’obbligo di aggiornare tempestivamente i
dati nei propri archivi, non appena vengano a conoscenza dell’inesattezza
degli stessi.
valutazioni complessive
• Il ritardo nel riconoscimento della centralità del problema
lascia margini ampi alla scelta delle singole amministrazioni
• E’ indispensabile definire linee d’azione nazionali, approvare
policy interne adeguate e adottare infrastrutture
commisurate alle dimensioni e ai mezzi dei singoli enti di
conservazione e delle diverse aree della produzione
documentaria (depositi digitali e manuali per la produzione di
documenti digitali e per la loro conservazione, nonché per la
gestione delle responsabilità specifiche)
• Il CAD ha una impostazione generica che tende a ricondurre
la conservazione a problemi di sicurezza, ma lascia aperti
spazi di approfondimento con le regole tecniche
le potenzialità del nuovo CAD
• il riconoscimento della necessità di discipline particolari (da
approvare con dpcm ad hoc ) per la conservazione sostitutiva
di particolari tipologie di documenti analogici originali
(garanzie di controllo nel processo di formazione);
• l’ancoraggio al protocollo informatico delle caselle di pec
• la norma stabilisce uno stretto collegamento tra il
responsabile del servizio di protocollo e archivio e il
responsabile della conservazione (garanzie di continuità nella
catena delle responsabilità);
• le norme sull’obbligo dei piani di continuità operativa e di
disaster recovery e di sicurezza (garanzie di protezione dei
contenuti digitali)
i nodi da affrontare nelle regole tecniche
• Definizione dei livelli e delle modalità di cooperazione tra
responsabile degli archivi correnti e conservazione digitale
• Definire l’obbligo e la struttura minima del manuale di
conservazione e della sua integrazione con il manuale di
gestione
• Sviluppare regole per l’interoperabilità nella trasmissione
(come nel caso della segnatura XML) e sostenere processi di
cooperazione applicativa finalizzati a favorire l’automazione
nei processi di trasmissione nello spazio e nel tempo
il manuale di conservazione
• Il manuale operativo della conservazione non è indicato in
modo esplicito nella normativa (anche se è citato come
strumento di supporto dal dpcm 30 marzo 2009 che approva
le nuove regole tecniche in materia di firme digitali)
• E’ possibile (opportuno) integrarlo nel manuale di gestione
(che include procedure rilevanti a fini di conservazione) dei
documenti nella forma di un allegato
la conservazione nel manuale di gestione
• regole di selezione, versamento e conservazione
• sicurezza (diritti di accesso, protocollo di emergenza, gestione dei
supporti)
• conservazione del registro di protocollo informatico (periodicità coerenti
con le esigenze della sicurezza, responsabilità distinte)
• uso e validità giuridica nel tempo della firma digitale (natura e titolarità,
procedure di sicurezza soprattutto con riferimento al controllo degli
accessi: identificabilità degli utenti, mantenimento dei file di log, verifica
della firma,ecc.)
• procedure per la conservazione a norma (anticipata? sostitutiva?)
• uso di formati per i documenti in grado di garantire leggibilità nel tempo,
interscambiabilità, immutabilità e persistenza e compatibilità con i
meccanismi di firma (html, xml, pdf-a.tiff, txt)
qualche suggerimento per il manuale di
conservazione
• Il manuale operativo della conservazione può assumere la finalità di
definire un intervento di pianificazione delle procedure necessarie per la
conservazione (vedi anche articoli 50 bis e 51 del CAD)
• Riferimento utile: le misure operative per la conservazione e la sicurezza
previste per i certificatori accreditati che gestiscono le firme elettroniche
ai sensi del CAD (dpcm 30 marzo 2009 - Regole tecniche in materia di
generazione, apposizione e verifica delle firme digitali e validazione
temporale dei documenti informatici): articoli 31 (piano della sicurezza),
32 (sistema di controllo), 33 (sistema di qualità del certificatore), 34
(organizzazione del personale addetto alla certificazione), 35 (requisiti di
competenza ed esperienza del personale) e 36 (manuale operativo).
le criticità della cosiddetta conservazione
anticipata
• La normativa nazionale non risolve il nodo di una
sedimentazione archivistica governata e razionale, ma si
limita a stabilire obblighi di interoperabilità dei servizi di
firma e di marcatura
• E’ necessario definire le modalità per la creazione dei
volumi/lotti di conservazione con particolare (ma non
esclusivo) riferimento ai documenti firmati digitalmente a
cura del responsabile della conservazione (lotti o volumi di
conservazione gestiti con indici di conservazione riferiti alla
procedura di chiusura dei documenti memorizzati a fini di
conservazione sostitutiva e alla creazione e gestione di file di
chiusura previsti dalle delibere Cnipa)
volumi o lotti di conservazione
• Nei sistemi di conservazione sostitutiva un volume o un lotto di
conservazione è costituito dall’insieme dei file oggetto di conservazione e
da un file ausiliario (indice o file di chiusura) che contiene informazioni
identificative per ogni file conservato (almeno un codice identificativo e
l’impronta). A fini di integrità l’indice deve essere firmato digitalmente dal
responsabile della conservazione e corredato di un riferimento temporale
opponibile ai terzi, che può essere una marca temporale.
• L’indice, con firma e riferimento temporale, è finalizzato ad assicurare
l’inalterabilità di ogni file memorizzato nel sistema di conservazione
(grazie all’impronta), la sua identificazione mediante un codice univoco e
la data certa di memorizzazione nel sistema mediante la marcatura
temporale. Si tratta di uno strumento definito dalla delibera Cnipa del
2004 e sviluppato dai fornitori dei servizi di conservazione sostitutiva al
fine di assicurare garanzie di controllo al processo di acquisizione e tenuta
di file digitali firmati.
consolidamento di documenti sottoscritti e
conservazione
• Poiché un volume o un lotto di conservazione è
obbligatoriamente corredato di un riferimento temporale
opponibile ai terzi (marcatura temporale), tale procedura
viene utilizzata non solo al fine di digitalizzare documenti
analogici ma anche per risolvere il problema del
consolidamento (processo di apposizione di una marca
temporale a un documento dopo averne verificato la validità
in termini di certificato non scaduto, non revocato o sospeso
e integrità del contenuto) dei documenti informatici
sottoscritti (considerata la difficoltà organizzativa e
tecnologica delle amministrazioni e dei privati).
i limiti della procedura
• “Tuttavia, poiché in un volume si accumulano un certo
numero di documenti e solo al termine dell’accumulo si
applicano la firma del RdC ed il riferimento temporale, può
trascorrere un tempo significativo tra la sottoscrizione del
documento ed il riferimento temporale. Se una revoca o una
scadenza di certificato capita in quell’intervallo, si perde il
valore probatorio” (Baudizzone)
l’indice di conservazione o file di chiusura:
contenuti e formato
• Le disposizioni regolamentari (dpcm 31 marzo 2009) non
danno indicazioni specifiche sulle modalità operative di tale
processo né sul formato del cosiddetto “file di chiusura” (il
termine indice è citato in forme scarsamente comprensibili
tra i compiti del responsabile della conservazione ed è frutto
della inconsapevolezza di chi ha scritto quelle norme).
• L’interoperabilità è quindi a rischio sia in relazione a servizi
forniti da fornitori diversi per quanto riguarda l’apposizione di
firme e di marcature temporali sia con riferimento a sistemi di
indicizzazione utilizzati nel tempo anche da parte dello stesso
fornitore.
standard e raccomandazioni: lo standard UNI
SINCRO
• Lo standard SInCRO è stato elaborato dalla Commissione UNI-DIAM e in
particolare dal comitato sulla gestione dei documenti e degli archivi per
iniziativa di fornitori preoccupati per la qualità nel tempo dei servizi offerti
(Ferri e Baudizzone)
• Ha la finalità di definire una struttura di dati in XML che consenta di
predisporre sia le informazioni identificative minime (previste dal
legislatore) che una infrastruttura generale in grado di gestire tutte le
informazioni archivistiche necessarie al processo di formazione e tenuta
dei documenti digitali in modo da assicurare l’interoperabilità tra sistemi
e la conservazione a lungo termine
• Presuppone un corretto processo a monte di analisi archivistica dei
documenti da digitalizzare e conservare e un adeguato sistema di tenuta
dei documenti negli archivi correnti
le procedure del governo federale degli Stati Uniti per
la dematerializzazione ‘sostitutiva’ (scan and destroy
policies): FAR 4.7
•
I documenti originali non devono essere esibiti a fini di
verifica (audit) se chi ha prodotto la copia sostitutiva
(contractor) fornisce le immagini elettroniche del documento
e risponde ai seguenti requisiti:
1. L’adozione di procedure in grado di assicurare che il processo di
imaging conservi immagini accurate inclusive delle firme e che il
processo sia affidabile e sicuro in grado di mantenere l’integrità dei
documenti
2. L’adozione di un sistema efficace di indicizzazione in grado di
consentire un accesso opportuno e tempestivo ai documenti
riprodotti
3. La tenuta dei documenti originali riprodotti per almeno un anno
dopo la digitalizzazione in forma di immagine al fine di permettere la
validazione periodica dei sistemi di imaging (4.703(c))
indicazioni di approfondimento
http://www.interpares.org (progetto InterPARES)
http://www.casparpreserves.eu (progetto Caspar)
http://[email protected] (lista per i depositi digitali)
http://www.ukoln.ac.uk/repositories/digirep/index/JISC_Digital_Repository_Wiki (rete per depositi
digitali)
http://www.si.umich.edu/CAMILEON/ (Creative archiving at Michigan and Leeds emulating the old on the new)
http://www.sdsc.edu/NARA (progetto del National Archives di Washington
http://www.erpanet.org (Erpanet)
http ://www.dpconline.org (Digital preservation coalition, UK)
http://www.digitaleduurwaamheid.nl (Digital preservation testbed, NL)
http://www.pro.gov.uk/about/preservation/digital/pronom/default.htm (TNA: PRONOM File Format
Database) e http://droid.sourceforge.net/wiki/index.php/Introduction (DROID)
RLG-OCLC. Attributes of a Trusted Digital Repository. Meeting the Needs of Research Resources, Aug. 2001;
Audit Checklist, February 2007
http://www.digitalpreservation.gov/formats/intro/format_eval_rel.shtml (sui formati secondo la Library of
Congress)
http://ec.europa.eu/idabc/en/document/3428/556 (The IDABC PEGSCO Recommendations on Open Document
Formats can be found on the IDABC website - as well as further information on related IDABC activities)
http://www.jisc.ac.uk/whatwedo/programmes/programme_preservation/2008sigprops.aspx (Progetto
INSPECT)
http://repinf.pbworks.com (REPINF: interoperabilità tra depositi digitali)
http://www.jiscinfonet.ac.uk/infokits/repositories//index_html (JISC, Infokit Digital Repository, 2010)