Tesi di dottorato: buone pratiche di archiviazione - eCUM

Transcript

Tesi di dottorato: buone pratiche di archiviazione - eCUM
UNIVERSITA' DEGLI STUDI DI MACERATA
Facoltà di Lettere e Filosofia
Facoltà di Economia
Facoltà di Beni Culturali
Master in
"Formazione, gestione e conservazione di archivi digitali
in ambito pubblico e privato"
IVª edizione Anno Accademico 2010-11
Tesi di dottorato
Buone pratiche di archiviazione digitale
Corsista : Clementina Fraticelli
Relatore: Chiar.mo prof. Giovanni Bergamin
“Open Access literature is digital,
online, free of charge,
and mostly free of copyright
and licensing restrictions.”
Peter Suber, 2004
Indice
1.
1.1
1.2
1.3
2.
3.
3.1
3.2
3.3
4.
4.1
4.2
4.3
4.4
4.5
5.
5.1
5.2
Introduzione
Che cosa sono le tesi di dottorato elettroniche
Perché archiviare elettronicamente le tesi di dottorato: obiettivi e vantaggi
Il ruolo degli archivi istituzionali ad accesso aperto
Scopo e obiettivi dello studio
Il ruolo delle università e dei portatori di interesse coinvolti
Sviluppo di un programma di archiviazione elettronica delle tesi di dottorato
Questioni da affrontare e soluzioni possibili
Valutazione e misurazione
Infrastruttura tecnologica
Accesso aperto: OAI e la ricerca federata
Requisiti tecnici per la produzione e la disseminazione delle tesi di dottorato
elettroniche
Modelli di metadati
Catalogazione: rimodulazione dei flussi di lavoro
La conservazione nel lungo periodo
Archiviazione delle tesi di dottorato elettroniche: lo scenario italiano
Le Linee guida CRUI: una policy comune per gli Atenei italiani
Deposito legale via harvesting automatico e riversamento dei dati nell’Indice
SBN
5.3 Uno standard nazionale per la raccolta e l’esposizione dei dati
5.4 CamEprints: l’archivio istituzionale delle tesi di dottorato presso l’Università
di Camerino
6.
Conclusioni
7.
Bibliografia
2
2
3
5
6
7
7
9
11
13
13
15
17
20
22
24
24
26
27
29
30
31
1
1. Introduzione
1.1 Che cosa sono le tesi di dottorato elettroniche
Il Dottorato di Ricerca in Italia è un titolo accademico post lauream, corrispondente al
terzo ciclo dell'istruzione universitaria in molti paesi del mondo, come dettato dal Processo di
Bologna 1 . È stato introdotto nel sistema universitario italiano nel 1980 (L. 21 febbraio 1980,
n. 28, D.P.R. 11 luglio 1980, n. 382) 2 , e rappresenta il più alto grado di istruzione
universitaria nel nostro paese: “I corsi per il conseguimento del dottorato di ricerca forniscono
le competenze necessarie per esercitare, presso università, enti pubblici o soggetti privati,
attività di ricerca di alta qualificazione” 3 . Il titolo di dottore di ricerca si consegue al termine
di un ciclo di studi della durata di tre anni e si chiude con la stesura e la presentazione di un
elaborato scritto: la tesi di dottorato, tradizionalmente formattato e rilegato in forma di libro.
La tesi di dottorato ha una duplice natura. E’ un documento amministrativo 4 con
valore certificativo del regolare percorso di studi, pertanto di interesse archivistico, ma anche
un documento bibliografico attestante l’attività scientifica svolta dal dottore di ricerca, quindi,
non solo pubblicamente accessibile 5 , ma anche destinato alla conservazione nel lungo periodo.
Una tesi di dottorato è opera dell’ingegno la cui validità scientifica non può essere
messa in discussione (Arabito, S. et al., 2008). Lo stato di validazione di questi documenti è
simile ad un preprint, in quanto non passa attraverso il peer-reviewing, ma il lavoro di
supervisione del docente di riferimento è certamente molto intenso, accurato e protratto nel
tempo, così l’autorevolezza della commissione giudicatrice esterna, che valuterà l’attività di
ricerca risultante dall’elaborato, non può essere sottostimata.
Purtroppo, fino ad ora le tesi di dottorato non hanno trovato un giusto canale di
diffusione in Italia, dove, al contrario di altri paesi europei, l’elaborazione e la discussione del
lavoro non sfocia automaticamente nella pubblicazione presso un editore, pur restando valido
1
“Il Processo di Bologna è un processo di riforma del sistema di istruzione superiore a carattere internazionale.
Costituito nel 1999 presso l'Università di Bologna, si prefigge di realizzare uno Spazio Europeo dell'Istruzione
Superiore (SEIS). Il Processo di Bologna non è vincolante per i Governi dei Paesi che vi aderiscono. Ogni Stato,
infatti, decide di volta in volta se e quale procedimento adottare. Le politiche di indirizzo del Processo di
Bologna sono volte esclusivamente ad un obiettivo comune e definito”. […] L'obiettivo perseguito è che nel
2010 i sistemi di istruzione superiore dei paesi partecipanti e le singole istituzioni siano organizzati in maniera
tale da garantire: la trasparenza e leggibilità dei percorsi formativi e dei titoli di studio; la possibilità concreta per
studenti e laureati di proseguire agevolmente gli studi o trovare un'occupazione in un altro paese europeo; una
maggiore capacità di attrazione dell'istruzione superiore europea nei confronti di cittadini di paesi extra-europei;
l'offerta di un'ampia base di conoscenze di alta qualità per assicurare lo sviluppo economico e sociale dell'Europa.
<http://www.bolognaprocess.it/>.
2
Riferimenti normativi: i corsi di dottorato di ricerca sono disciplinati in Italia dalle seguenti normative: L.
341/1990; L. 210/1998, art. 4 (Dottorato di ricerca); Decreto MURST 30/4/99 n. 224; L. 240/2010, art. 19,
(Disposizioni in materia di dottorato di ricerca).
3
L. 210/1998, art. 4, comma 1.
4
Le tesi di dottorato costituiscono per i soggetti produttori (le Università) documenti giuridicamente rilevanti in
quanto “contenuti di atti e fatti prodotti nell’esercizio dell’attività amministrativa” (DPR 445/2000, art. 1). Nei
processi di informatizzazione e conservazione digitale sono sottoposti alle disposizioni dello stesso decreto sul
documento amministrativo, al Codice dell’amministrazione digitale e successiva regolamentazione tecnica.
5
Opportunità ribadita dalla Dichiarazione di Berlino, ovvero Berlin Declaration on Open Access to Knowledge
in the Sciences and Humanities del 22 ottobre 2003, <http://oa.mpg.de/berlin-prozess/berliner-erklarung/>.
2
il deposito obbligatorio presso le Biblioteche nazionali centrali di Firenze e Roma (D.M. 30
aprile 1999, n. 224, art. 6, comma 11), dove la consultazione è pubblica, ma soggetta ad
alcune limitazioni.
Lasciando inalterati gli scopi ed i contenuti dei documenti, l’esplosione delle
tecnologie informatiche ha reso semplice la produzione in formato elettronico delle tesi di
dottorato, interattiva la loro consultazione, più veloce la loro diffusione e riproduzione.
Pertanto, la tesi di dottorato elettronica 6 è un documento (o un set di documenti) elettronici,
facilmente producibile con un comune software di scrittura o, solitamente, nel formato .pdf,
oppure con un software più sofisticato in grado di gestire diagrammi, immagini, fogli di
lavoro, forme interattive come animazioni e la multimedialità di suoni e video e in formati
come html o xml. Non a caso si parla di TDE come un nuovo genere di documenti (Edminster
& Moxley, 2002; ETD Guide, 2010), la cui complessità può andare dal semplice elaborato
elettronico, molto simile nella resa visiva all’elaborato cartaceo a documenti più complessi
come gli ipertesti. La disseminazione e la conservazione nel tempo, in questo caso, può
risultare più complessa e richiedere un’organizzazione del documento “a più strati”. Ad es.,
ad un livello più profondo trovare il testo scritto (stampabile) e come corollario, appendici
con contenuti multimediali, files supplementari con dati, collegamenti dinamici, programmi,
ambienti virtuali, simulazioni che possono costituire utili forme di scambio di contenuti tra
ricercatori, anche se difficili da migrare nel tempo.
Le TDE costituiscono un nuovo genere di documento in continua evoluzione, di pari
passo con il trasformarsi delle tecnologie e delle conoscenze di studenti e ricercatori.
1.2 Perché archiviare elettronicamente le tesi di dottorato: obiettivi e vantaggi
Se lo scopo di una istituzione universitaria è quello di promuovere lo sviluppo della
ricerca e della cultura, attraverso l’alta formazione e l’apprendimento permanente, tra i suoi
obiettivi insiste certamente quello di favorire nei suoi studenti l’apprendimento attraverso il
fare e di facilitare l’attività di ricerca attraverso le tecnologie disponibili al fine di migliorare
la comunicazione scientifica e la propria reputazione accademica.
Le tesi di dottorato, oltre ad essere un adempimento curricolare e amministrativo
obbligatorio, costituiscono il risultato dell’attività intellettuale di uno studente e la qualità
stessa di una università si riflette nella qualità di questi prodotti. E’ importante che essi non
restino confinati sugli scaffali di una biblioteca, ma che possano circolare liberamente nella
comunità scientifica, che risultino visibili e facilmente accessibili.
Il progetto di implementare un archivio elettronico istituzionale delle tesi di dottorato e
renderlo parte di un progetto più ampio di biblioteca digitale rappresenta un salto di qualità sia
per gli autori sia per le istituzioni che li sostengono (Fyffe & Welburn, 2008).
A fronte delle scelte di governance di un ateneo, dello sforzo congiunto e del lavoro
cooperativo di studenti, professori, tutor, bibliotecari e informatici, i benefici raggiungili
6
Da questo momento in poi TDE.
3
attraverso un progetto TDE sono molteplici e si sommano con le funzioni degli archivi digitali
istituzionali che li ospitano 7 :
- migliora l’accesso al mondo della ricerca accademica e del lavoro;
- garantendo l’accesso libero al proprio lavoro, lo studente lo pubblicizza e può diffonderlo
più facilmente;
- si migliorano le possibilità di essere citati da altri ricercatori;
- si accresce la reputazione dell’autore nel mondo accademico, ma anche della propria
istituzione;
- si evitano inutili duplicazioni nella scelta dei settori di ricerca e di investigazione;
- si hanno a disposizione velocemente, e nella maggior parte dei casi gratuitamente, gli
studi di altri colleghi da ogni parte del mondo;
- migliora la collaborazione tra studiosi e si dà visibilità al proprio lavoro;
- si rimodellano i processi di lavoro nel senso del risparmio di tempo, non solo per gli autori
che vedono ridursi i tempi di presentazione, discussione e pubblicità della propria tesi
attraverso l’archivio digitale istituzionale e i collettori di servizi a livello nazionale e
internazionale 8 , ma anche di chi si occupa di registrazione, catalogazione ed esposizione
-
di questi documenti;
si abbattono i costi di preparazione e di pubblicazione del proprio lavoro;
si acquisiscono nuove abilità tecniche di elaborazione che risulteranno utili per futuri
lavori di ricerca o professionali;
ci si prepara a diventare lavoratori della conoscenza e ad entrare nel processo della
comunicazione scientifica accademica;
si migliora l’accesso globale alla ricerca universitaria;
le università sviluppano servizi e infrastrutture digitali, mentre gli studenti apprendono
come contribuire ed usare le biblioteche digitali (ETD Guide, 2010).
7
“Digital repositories have a number of functions or foci: to open up and offer the outputs of the institution or
community to the world; to impact on and influence developments by maximising the visibility of outputs and
providing the greatest possible chance of enhanced impact as a result; to showcase and sell the institution to
interested constituencies – prospective staff, prospective students and other stakeholders; to collect and curate
digital outputs (or inputs, in the case of special collections); to manage and measure research and teaching
activities; to provide and promote a workspace for work-in-progress, and for collaborative or large-scale
projects; to facilitate and further the development and sharing of digital teaching materials and aids; to support
and sustain student endeavours, including providing access to theses and dissertations and providing a location
for the development of e-portfolios.” (Weenink,Waaijers & van Godtsenhoven, 2008, p. 15).
8
Si pensi al ruolo svolto in questo senso da servizi come NDLTD. Networked Digital Library of Theses and
Dissertations <http://www.ndltd.org/>, DART-Europe <http://www.dart-europe.eu/basic-search.php>, EthOS
<http://www.ethos.ac.uk/>, o servizi più generalisti come OAIster <http://www.oclc.org/oaister/>, ROAR.
Registry of Open Access Repositories <http://roar.eprints.org/>, OpenDOAR. Directory of Open Access
Repositories <http://www.opendoar.org/>, oppure in Italia, PLEIADI. Portale per la letteratura scientifica
elettronica italiana su archivi aperti e depositi istituzionali <http://www.openarchives.it/pleiadi/>, solo per
citarne alcuni.
4
1.3 Il ruolo degli archivi istituzionali ad accesso aperto
E’ nel 2002 che si comincia a parlare in modo concreto di depositi o archivi
istituzionali, perché la tecnologia è ormai matura e accessibile, anche se già nel decennio
precedente si fa strada ciò che Stevan Harnad (1995) chiama “proposta sovversiva”, ovvero
l’idea di condividere le proprie ricerche tramite l’auto-archiviazione di documenti e contributi
in Internet, in modo da rendere più efficace la loro diffusione.
Nel vasto panorama della tecnologia a disposizione dei sistemi di biblioteche digitali,
gli archivi istituzionali si pongono come strumenti rivoluzionari e innovativi per l’impatto che,
sin dal loro apparire, si riconobbe potessero avere sull’attività di ricerca scientifica e sulla
condivisione e comunicazione accademica (Lynch, 2003). Non a caso quelli sono gli anni in
cui i due più diffusi software open source per la gestione dei depositi istituzionali vengono
rilasciati: Dspace 9 del Massachusetts Institute of Technology e Eprints 10 della University of
Southampton.
Un archivio istituzionale è innanzitutto un servizio alla comunità scientifica, uno
strumento di supporto al deposito, disseminazione, archiviazione e conservazione nel tempo
della ricerca prodotta in formato digitale (Cassella, 2008). Crow (2002) ritiene che l’archivio
istituzionale sia una collezione digitale che raccoglie e conserva la produzione scientifica di
una singola università o di una più ampia comunità accademica (multi-university community)
con l’obiettivo di accrescerne la qualità e la visibilità, contribuendo al prestigio e allo sviluppo
di quella comunità. Lynch (2003, p. 2-3) ne collega la definizione all’idea di servizio per una
comunità universitaria, quindi all’organizzazione, conservazione e diffusione delle risorse
digitali prodotte da quella comunità,
“… a university-based institutional repository is a set of services that a university offers to the members
of its community for the management and dissemination of digital materials created by the institution
and its community members”.
intendendo per “digital materials” tutta l’opera intellettuale di docenti e studenti,
documentazione delle attività, degli eventi, insomma un archivio, non una biblioteca, in grado
di fotografare e registrare la vita di una data comunità.
Grazie al servizio svolto dall’archivi istituzionali, la comunità scientifica, in senso lato,
può riconquistare il controllo sulla diffusione e conservazione della propria attività di ricerca e
speculativa ad ampio raggio, sganciarsi da logiche commerciali e perseguire lo scopo della
condivisione delle idee e della conoscenza attraverso la loro libera circolazione 11 , in
particolare per tutto quanto attiene a quel materiale solitamente ignorato dagli editori
tradizionali e che può trovare nell’archivio istituzionale il giusto luogo di disseminazione.
9
<http://www.dspace.org/>.
<http://www.eprints.org/>.
11
Si veda il sito Open Archives Initiative <http://www.openarchives.org/>; la voce Open access in Wikipedia
<http://it.wikipedia.org/wiki/Open_access>; Suber, P. (2004) Open access overview. Focusing on open access to
peer reviewed research articles an their preprints. <http://www.earlham.edu/~peters/fos/overview.htm> [ultima
modifica: 6 novembre 2010].
10
5
Da un punto di vista tecnico, i software a disposizione hanno permesso lo sviluppo di
modelli di archivi accentrati come arXiv12 o distribuiti come RePEc 13 , definiti anche da un
punto di vista organizzativo archivi disciplinari. Un archivio disciplinare (accentrato o
distribuito) rappresenta una comunità scientifica a livello internazionale. Gli archivi
istituzionali, invece, rappresentano una comunità più piccola, contenuti eterogenei, ma
sottendono una consapevolezza forte degli obblighi di deposito, del controllo dei diritti, della
valutazione dei prodotti della ricerca. Per queste caratteristiche essi rappresentano lo
strumento e il servizio più efficace per la raccolta e l’esposizione delle TDE. I contenuti di un
archivio istituzionale sono istituzionalmente definiti, accademici, cumulativi e a lungo
termine, aperti ed interoperabili (Crow, 2002).
Una definizione onnicomprensiva di archivio istituzionale, che sembra raccogliere le
esperienze e le soluzioni di varie realtà, è quella proposta da Guerrini (2010),
“L’archivio istituzionale è una collezione di risorse digitali full-text realizzata e gestita da una o più
università (o da altri istituti) che contiene i risultati di ricerche originali […] prodotte nell’ambito
dell’attività istituzionale da docenti, ricercatori, dottori di ricerca e altri soggetti. La raccolta è
liberamente accessibile in rete dalla comunità degli studiosi e dei lettori e viene costituita tramite la
volontaria autoarchiviazione (o autorizzazione al deposito) da parte dell’autore o tramite regolamenti
che prevedono l’obbligo di deposito. […] L’IR è realizzato secondo standard definiti nell’ambito
dell’Open Archive Initiative (OAI) e comprende diverse tipologie di risorse, talora organizzate in
un’unica sequenza nel medesimo archivio, talora in sequenze o liste distinte.”
Infatti, nelle “diverse tipologie di risorse” naturalmente rientrano le TDE, che, finalmente
hanno trovato negli archivi istituzionali lo strumento adatto per uscire dalla zona d’ombra in
cui erano tradizionalmente relegate, perché poco visibili e spesso addirittura confuse con la
letteratura grigia (Galimberti, 2008).
2. Scopo e obiettivi dello studio
Questo studio, pur nella brevità della trattazione, nasce dall’esigenza di investigare la
situazione presente della gestione, diffusione e conservazione delle TDE in Italia, attraverso
un’analisi della natura di questo nuovo genere di documenti, la diffusione del movimento
internazionale di idee sulla libera circolazione della conoscenza e della ricerca accademica,
meglio noto come Open Access, l’influenza dell’attività della Open Archives Initiative a
favore dell’interoperabilità degli standard, la gestione dei protocolli e la disseminazione dei
contenuti digitali, il recepimento di dichiarazioni internazionali sull’accesso aperto alla
12
Storico archivio disciplinare per la fisica e scienze affini arXiv è stato sviluppato da Paul Ginsparg nel 1991
come un archivio di preprint, ed oggi contenente più di 600 mila articoli e basato su un unico grande server,
<http://arxiv.org/>.
13
Archivio disciplinare per l’economia, RePEc nasce nel 1997 dallo sforzo collaborativo di volontari sparsi in
circa 60 paesi del mondo. Contiene working paper, articoli, preprint ecc., <http://repec.org/>.
6
conoscenza e le iniziative nazionali a supporto dell’attività di raccolta, deposito,
conservazione ed esposizione da parte degli Atenei italiani delle TDE.
Lo scopo di questo studio è:
- raccogliere buone pratiche di archiviazione digitale delle TDE.
Al fine di perseguire questo scopo, lo studio intende raggiungere i seguenti obiettivi:
- analizzare brevemente la letteratura nazionale ed internazionale sull’argomento;
- capire i ruoli degli attori coinvolti in un programma di archiviazione di TDE;
- evidenziare i requisiti tecnici indispensabili di un archivio istituzionale di TDE;
- fare una verifica della situazione italiana.
3. Il ruolo delle università e dei portatori di interesse coinvolti
3.1 Sviluppo di un programma di archiviazione elettronica delle tesi di dottorato
Sono già stati individuati ed elencati molti benefici per gli studenti che producono la
propria tesi di dottorato in formato elettronico. Altrettanti sono per le Università i benefici
derivanti dallo sviluppo di un programma di archiviazione elettronica delle tesi di dottorato,
soprattutto nei casi in cui, come in Italia, è previsto il deposito legale presso le Biblioteche
nazionali e la pubblicità degli elaborati. Infatti, una larga diffusione di tesi di dottorato di
buona qualità prodotte all’interno di un’università rafforzano e danno lustro al corso di studi,
che può essere valutato in base al numero di TDE accessibili, prestigio alla facoltà,
all’università stessa. La loro pubblicazione elettronica contribuisce a rendere noti i risultati di
questi lavori a livello nazionale e internazionale, a mettere in contatto gruppi di ricerca da
ogni parte del mondo, a far conoscere i corsi di studio.
Secondo il principio del “learning by doing” le università sono spronate ad
intraprendere la strada dello sviluppo di infrastrutture e servizi digitali per i propri utenti
garantendosi ulteriori benefici come:
- eliminare degli spazi fisici di conservazione delle copie nelle biblioteche;
- venire incontro alle esigenze degli studenti a distanza;
- abbattere i tempi di pubblicazione, ridurre i tempi di trattamento amministrativo;
- ottimizzare il lavoro di descrizione e catalogazione delle tesi nel catalogo in linea di
Ateneo.
L’implementazione di un programma di archiviazione di TDE coinvolge numerosi
attori all’interno di una università (Reeves, 2010). E’ uno sforzo cooperativo che coinvolge il
personale amministrativo, bibliotecario, informatico, la scuola di alta formazione e gli
studenti stessi. Al di sopra di tutto è indispensabile il sostegno della direzione amministrativa
e degli organi accademici (Rettore, Senato accademico, Direttore della scuola di dottorato). Il
gruppo che si occuperà di sviluppare il progetto dovrà essere composto da rappresentanti di
7
questi diversi settori, se si vuole che l’iniziativa risulti equilibrata e con buone possibilità di
successo.
Il primo passo è la stesura di un progetto pilota da esporre alla propria
amministrazione, tenendo presenti le politiche interne e gli obiettivi perseguiti dal proprio
ateneo, oppure, come in Italia, in ottemperanza e in adesione ad una politica nazionale di
implementazione e raccolta delle TDE (cfr. CRUI, Linee guida per il deposito delle tesi di
dottorato negli archivi aperti, 2007). A questo stadio dovrebbe essere posto l’accento almeno
su questi temi, perché il proprio progetto possa riscuotere attenzione ed essere approvato:
- aumentata visibilità dei risultati della ricerca di dottorandi e università tutta;
- esposizione e pubblicazione online;
- gestione dei diritti d’autore e protezione dell’opera dell’ingegno;
- contrasto ai pericoli di plagio;
- istruzione all’uso di nuovi strumenti di lavoro;
- standard e protocolli;
- costi;
- archiviazione e conservazione del materiale;
- accesso e restrizioni.
Un successivo passo molto importante è la scelta dell’infrastruttura tecnologica da
usare al fine di ospitare la collezione di TDE. Sono attualmente disponibili software open
source e commerciali. La scelta va ponderata in base ad una valutazione comparativa dei
prodotti disponibili 14 , la loro performance in termini di strategie di ricerca possibili, rapidità e
risultati restituiti in base alle ricerche condotte, personalizzazioni, semplicità d’uso,
interoperabilità, supporto di formati adatti alla conservazione nel lungo periodo (Open Society
Institute, 2004; Kim, 2005), costi e risorse umane. Lo schema di metadati da utilizzare va
ugualmente scelto con cura, privilegiando gli schemi più adatti a rappresentare le TDE, più
diffusi e in grado di assicurare l’interoperabilità dei sistemi senza perdita di informazioni. I
più utilizzati sono: ETD-MS 15 , Dublin Core e MARCXML.
Un buon progetto per avere successo deve essere comunicato in modo semplice,
trasparente ed efficace. La costruzione di un sito web dedicato alle TDE può essere la
soluzione, al fine di dare informazioni sul programma, istruzioni sul corretto deposito
nell’archivio istituzionale, procedure di preparazione dell’elaborato elettronico, (uso corretto
dei formati, degli stili ecc.), diritti degli autori, tutorial e supporto.
Si stabilisce così un nuovo flusso di lavoro che prevede varie fasi: dal deposito
all’approvazione, dalle procedure di conservazione all’accesso, in cui sono coinvolti i
bibliotecari, gli informatici e il personale amministrativo. Di solito sono operazioni che, nella
prima fase interessano l’ufficio amministrativo della Scuola di alta formazione e poi l’ufficio
14
Alcuni esempi di sistemi open source: Archimede, DSpace, Eprints e Fedora. Esempi di sistemi proprietari:
Digital Commons, Ex Libris DigiTool, Open Repository e VLTS Vital. Esistono anche opzioni di remote hosting
per piccole istituzioni non in grado di sostenere i costi di implementazione e gestione in-house.
15
ETD-MS è raccomandato da NDLTD. Networked Digital Library of Theses and Dissertations. Si basa sul
lavoro della Dublin Core Metadata Initiative. <http://dublincore.org/>.
8
informatico e la biblioteca per le attività di conservazione e accesso. Alla fine del processo,
solitamente, i metadati prodotti sono messi a disposizione di un collettore di servizi per
l’harvesting, a livello nazionale 16 o anche internazionale (ETD Guide, 2010).
Prima di avviare definitivamente il programma, è opportuno un periodo di prova per
verificare il corretto funzionamento con una parte ristretta di utenti. Alla fine di questo
periodo si passerà alla fase attiva, che solitamente prevede il deposito obbligatorio delle TDE
(CRUI, 2007; Cassella, 2008; Harnad, 2009; Harnad, & McGovern, 2009). Il deposito legale
di questo tipo di documenti semplifica l’operazione di popolamento di un archivio
istituzionale, perché fatto secondo regole precise e evidenti per gli autori.
L’ultimo passo è verificare che il proprio archivio sia in grado di supportare il
protocollo OAI-PMH, affinché sia aperto verso collettori di servizi esterni e si possano
esporre i propri contenuti globalmente. La manutenzione e l’aggiornamento del progetto e di
tutto il sistema sono da prevedere fin dalla progettazione e implementazione e riguardano sia
le infrastrutture tecnologiche, sia i cambiamenti nelle politiche di deposito e nel diritto
d’autore, sia l’automatizzazione dei processi di catalogazione (importazione ed esportazione
dei record), sia l’aggiornamento dei formati e la migrazione dei dati.
3.2 Questioni da affrontare e soluzioni possibili
Le questioni da affrontare e le criticità da risolvere in seguito alla scelta di avviare un
programma di archiviazione delle TDE nascono da una parte dalla necessità di gestire il
cambiamento culturale e dall’altra dalla soluzione di problemi pratici, quali il diritto d’autore,
il rapporto con gli editori, le risorse umane e le competenze utili alla gestione del programma,
le risorse finanziarie, i costi, il budget da impegnare, il plagio.
Molti sono gli attori coinvolti all’interno di una istituzione nella definizione di un
programma TDE. Il suo successo dipende dalla loro capacità di cooperare e di ben
rappresentarne i vantaggi e i potenziali benefici per l’intera comunità accademica presso gli
organi di governo dell’Ateneo.
Il cambiamento culturale investe innanzitutto gli autori di quella che in termini di
legge è riconosciuta opera dell’ingegno. E’ bene che i dottorandi chiamati a depositare il
proprio lavoro intellettuale in un archivio istituzionale siano consapevoli dei propri diritti,
tutelati in Italia dalla legge sulla protezione del diritto d’autore e di altri diritti connessi al suo
esercizio, L. 22 aprile 1941, n. 633 e successive modificazioni 17 .
16
CRUI. Conferenza dei rettori delle Università italiane, Tesi di dottorato di ricerca: deposito legale via
harvesting automatico e riversamento dei dati nell’Indice SBN. <http://www.crui.it/HomePage.aspx?ref=1891#>.
17
“Due sono le tipologie di diritti: 1) I diritti morali (paternità, integrità, ritiro dell’opera dal commercio) che
restano sempre in capo all’autore e non sono trasmissibili; 2) I diritti di utilizzazione economica o patrimoniali
(distribuzione, comunicazione, riproduzione, traduzione ecc.) che possono essere ceduti in parte o in esclusiva.
La cessione dei diritti di utilizzazione economica o patrimoniali può avvenire gratuitamente o dietro compenso e
deve essere provata per iscritto. I diritti di rielaborazione o di modifica al fine di creare opere derivate sono diritti
sia di tipo morale sia di tipo economico. È bene quindi fare grande attenzione alla cessione indiscriminata di
diritti a soggetti esterni all’ateneo. Ricordiamo a questo proposito che un editore non necessita della cessione
integrale di tutti i diritti di utilizzazione economica per la pubblicazione di un’opera. Gli autori, invece, devono
9
La consapevolezza dell’autore di avere la facoltà di ritenere presso di sé gran parte dei
propri diritti non è peregrina, nel momento in cui sorge l’opportunità di pubblicare il proprio
lavoro intellettuale presso un editore. La questione delle “pubblicazioni pregresse” è
argomento continuo di discussione da parte degli addetti ai lavori, ovvero se gli editori
ritengono le TDE, disponibili in Internet, come lavori già pubblicati oppure no. Indagini
svolte presso i dottorandi e presso gli stessi editori non sembrano evidenziare preoccupazioni
evidenti riguardo la possibilità di pubblicare ad. es. articoli derivanti da tesi di dottorato già
archiviate elettronicamente (Brown, 2010; Conner, 2009). La quasi totalità degli editori è
concorde nel ritenere una TDE come un lavoro scientifico degno di essere preso in
considerazione ai fini della pubblicazione, fermo restando il fattore qualità. E’ vero anche che
la prassi editoriale richiede solitamente un adattamento ed una revisione dei contenuti per il
nuovo pubblico a cui l’elaborato sarà destinato. Il fatto che una TDE sia accessibile online
non è, quindi, una forte preoccupazione per gli editori (McMillan et al. 2011). Mentre, da un
lato gli editori confidano nella grande capacità di validazione accademica offerta dalle loro
testate, dall’altro gli autori confidano nella protezione delle regole del deposito obbligatorio,
nell’accesso aperto e restrizioni ad esso eventualmente applicabili.
Una istituzione impegnata nella implementazione di un progetto di TDE deve essere
consapevole delle risorse umane e competenze professionali necessarie alla sua gestione e
funzionamento: almeno un informatico e un bibliotecario devono essere attivamente
impegnati nel progetto. Quest’ultimo con compiti di:
- raccordo tra la facoltà e lo studente e il personale amministrativo coinvolto;
- di formazione del budget;
- collaborazione con il personale informatico per la gestione del software;
- ideazione e aggiornamento delle pagine web;
- formazione degli studenti ed efficace comunicazione del programma.
Al fine di sviluppare efficacemente il progetto e per una definizione complessiva dei
costi, sarebbe auspicabile prevedere una ripartizione delle voci di budget che rispecchino
queste fasi o macroattività: avvio, implementazione, comunicazione e istruzione degli utenti
(ETD Guide, 2010). Nella prima fase le voci coinvolte potranno essere: le risorse umane, le
infrastrutture e la formazione. Nella seconda: i servizi di produzione e distribuzione,
riguardanti principalmente la scelta del software, dell’interfaccia web per l’accesso. Nella
terza: le risorse umane e gli strumenti di comunicazione e di promozione del progetto.
Nell’ultima fase saranno da prevedere voci come la pianificazione dei moduli di istruzione,
l’organizzazione di workshop, corsi in presenza e tutorial online.
Uno dei soliti motivi addotti contro la scelta di percorrere la strada del cambiamento
verso lo sviluppo di un progetto di TDE è il pericolo di plagio. Certamente, questo è un
mirare al mantenimento di più diritti possibili in quanto essi necessitano dei loro diritti per: depositare l’opera in
archivi ad accesso aperto; acconsentire l’uso dell’opera a terze parti; pubblicare l’opera in altre sedi (saggi,
raccolte, antologie, convegni…); effettuare un uso didattici (dispense, lezioni…); rielaborare successivamente la
propria produzione per scopi scientifici e di ricerca.” (De Robbio & Galimberti, 2011).
10
fenomeno possibile, soprattutto nei casi in cui le tesi online sono scarsamente protette da
sistemi di archiviazione sicuri, se l’archivio non è inserito, secondo standard determinati, in
progetti più ampi a livello nazionale ed internazionale, se i record che le rappresentano sono
poco descrittivi e poveri di metadati. In realtà, se una tesi di dottorato viene esposta a testo
pieno online, può essere maggiormente protetta, perché un testo uguale o simile può essere
più facilmente confrontato con essa che in passato. Vero è, dunque, che maggiore è il numero
di tesi che appare online, minore è la possibilità di plagio (ETD Guide, 2010). Nello stesso
tempo, docenti, studenti, bibliotecari sono coscienti della necessità di contrastare il fenomeno.
Molte le possibili azioni come un codice di condotta da pubblicizzare attraverso diversi
canali: lezioni frontali, web tutorial, uso di software per scoprire il plagio 18 (Greenberg &
McLean, 2011).
3.3 Valutazione e misurazione
Fino a poco tempo fa la valutazione e la misurazione dei servizi erano ritenute attività
opzionali o addirittura superflue per una istituzione. In realtà, un servizio di archiviazione
elettronica delle tesi di dottorato deve prevedere già dalla fase di stesura preliminare del
progetto entrambe queste attività.
La valutazione è un processo continuo che aiuta a comprendere se gli scopi e gli
obiettivi del progetto sono in fase di realizzazione, o sono stati raggiunti. Pertanto, è un
supporto inestimabile per gli amministratori per capire l’efficacia di un programma, per
allocare risorse, per sviluppare maggiormente una parte del progetto piuttosto che un’altra,
mentre la misurazione aiuta ad analizzare quantitativamente l’uso e l’utilità delle TDE.
Quante TDE sono prodotte in un anno, o quante ne sono state visualizzate, scaricate o citate
sono indicazioni d’uso utili a capire il successo del progetto (Bevan & Needham, 2009).
Valutazione e misurazione sono processi continui, che possono prendere la forma di:
- valutazione formativa, ovvero, controlli sulle attività in corso di svolgimento:
apprendimento dei meccanismi di presentazione del lavoro di tesi, requisiti tecnici degli
elaborati, funzionamento della comunicazione accademica, loro utilità per il futuro.
- valutazione sommativa per analizzare il progetto nel lungo periodo, ad es. su base annuale,
raccogliendo statistiche d’uso, facendo indagini sulla soddisfazione degli utenti.
Ben si applicano a questo tipo di rilevazioni i metodi quantitativo e qualitativo della
ricerca sociale 19 , partendo da scopi e obiettivi già ben definiti, che ben riassume la EDT
Guide (2010):
18
Questa pratica sembra essere abbastanza diffusa nelle Università americane, in cui a volte si richiede anche
obbligatoriamente la sottomissione dei lavori degli studenti ai così chiamati “plagiarism detection softwares”
prima della presentazione di una tesina o di una tesi. Nella rete esistono molti prodotti di questo tipo,
commerciali e non, con lo scopo di garantire il controllo della originalità degli elaborati. Plagiarism detection,
Wikipedia [voce]. <http://en.wikipedia.org/wiki/Plagiarism_detection>.
19
Il primo è un metodo deduttivo, strutturato in fasi logiche e sequenziali, parte dalla teoria per approdare alla
ricerca, il soggetto studiato è passivo, l’interazione è nulla, la ricerca è strutturata, i dati oggettivi e i risultati
generalizzati. E’ un approccio che predilige le tecniche delle rilevazioni statistiche d’uso e i questionari chiusi. Il
11
- l’impatto che il progetto ha sulla reputazione dell’istituzione accademica;
- il ruolo del progetto nel contesto della biblioteca digitale istituzionale;
- i benefici e le criticità per studenti e altri utenti.
Tutto questo al fine di contribuire a migliorare l’alta formazione, aumentare la disponibilità
dei risultati della ricerca degli studenti, diminuire i costi di gestione delle tesi di dottorato,
investire nelle biblioteche digitali.
Fermo restando che i parametri di misurazione per monitorare le attività e il
raggiungimento degli obiettivi possono essere diversi da istituzione a istituzione, è importante
comunque indirizzare le verifiche verso l’efficienza e l’efficacia, la soddisfazione dell’utente,
quindi la qualità e l’impatto del servizio 20 . A seconda delle esigenze, gli strumenti vanno
dall’analisi dei file di log dei server, all’estrazione di informazioni statistiche dal set di
metadati usati per l’archiviazione ai questionari online, all’osservazione diretta e indiretta del
comportamento degli utenti, interviste e focus group.
Molti sono gli studi e i progetti che in questi anni sono stati condotti al fine di
sviluppare dei programmi di valutazione e misurazione dei servizi digitali resi dalle
università e dalle loro biblioteche. Una buon punto di partenza per analizzarli e capirne
l’adattabilità agli archivi di TDE è la raccolta presso la Statistics and Evaluation Section
dell’IFLA 21 .
I dati raccolti e analizzati contro gli scopi e gli obiettivi che si intendono perseguire
saranno utili per pianificare le attività future, come il miglioramento e la comunicazione del
servizio, l’aggiornamento delle infrastrutture tecnologiche e i programmi di istruzione.
Manca tuttora uno standard per la misurazione e la compilazione di statistiche d’uso
relativo alle TDE che sia conforme a COUNTER 22 . Se non è difficile la produzione locale di
statistiche d’uso, poiché i software oggi disponibili hanno queste funzionalità, ciò rende
difficile produrre statistiche affidabili e comparabili tra archivi (Bevan & Needham, 2009).
secondo è un metodo induttivo, aperto e interattivo, il soggetto studiato è attivo, l’interazione è forte, la ricerca si
modella nel corso della rilevazione, i dati sono riconducibili al singolo caso e le generalizzazioni impossibili. E’
un metodo che usa tecniche come questionari aperti, interviste e focus group. (Patton, 1990; Palumbo &
Garbarino, 2006).
20
Un esempio di misura di efficacia: verificare le conoscenze negli studenti relative ai meccanismi della
pubblicazione elettronica, prima e dopo la pubblicazione della tesi. Un indicatore di impatto può riguardare
l’abbattimento dei tempi e dei costi di redazione e presentazione della tesi, oppure la diffusione dei risultati della
ricerca e le ricadute per la carriera accademica o professionale.
21
IFLA. Statistics and evaluation section. Useful links. <http://archive.ifla.org/VII/s22/statlinks.htm>.
22
COUNTER. Counting Online Usage of Networked Electronic Resources.
<http://www.projectcounter.org/index.html>.
12
4.
Infrastruttura tecnologica
4.1 Accesso aperto: OAI e la ricerca federata
Nella sua accezione più ampia con Open Access si intende il libero accesso, in quanto
libera disponibilità in rete, di contenuti digitali 23 . La dichiarazione della Budapest Open
Access Initiative precisa, “La sola restrizione sulla riproduzione e distribuzione […] dovrebbe
essere quella di mantenere agli autori il controllo sull’integrità del proprio lavoro e il diritto di
essere riconosciuti e citati in maniera appropriata” 24 . Una delle strategie raccomandate dal
BOAI, perché la letteratura scientifica, si può aggiungere “nel senso più ampio del termine”,
sia accessibile online è l’auto-archiviazione dei propri lavori in archivi digitali aperti,
conformi agli standard della Open Archives Initiative 25 , standard per l’interoperabilità dei
contenuti digitali. Nella missione di OAI c’è, infatti, la dichiarazione che lo scopo
dell’iniziativa è di facilitare la disseminazione dei contenuti digitali, in accordo con il
movimento Open Access e degli archivi istituzionali, supporto che ne costituisce la testata
d’angolo. OAI ha sviluppato un protocollo 26 per la raccolta dei metadati (OAI-PMH), che si
presenta come infrastruttura di comunicazione, indipendente dalle applicazioni.
Entrano in gioco due partecipanti in questa infrastruttura:
- i fornitori di dati, che amministrano sistemi che supportano OAI-PMH al fine di esporre i
propri metadati;
- i fornitori di servizi, che usano i metadati raccolti via OAI-PMH per costruire servizi di
valore aggiunto (Lagoze & Van de Sompel, 2008).
L’archivio (o repository) è un server accessibile in rete e gestito dal fornitore di dati in grado
di processare richieste OAI-PMH ed esporre i metadati ad una applicazione client (harvester)
che invia le richieste.
Fig. 1. Modello e struttura di OAI-PMH
23
27
Open access, Wikipedia [voce]. <http://it.wikipedia.org/wiki/Open_access>.
24
Budapest Open Access Initiative (2002). <http://www.soros.org/openaccess/read>.
Open Archives Initiative. <http://www.openarchives.org/>.
26
Si ricordi che questo protocollo è semplicemente un’interfaccia che permette ad un server in rete di esporre i
metadati degli oggetti digitali che conserva ad applicazioni esterne che li raccoglie. Quindi, le applicazioni
potenziali possono essere molteplici, commerciali e non. Lynch (2001) fa notare come il termine OAI sia
ambiguo, intendendo popolarmente, sia il protocollo (che si può definire aperto da un punto di vista
architetturale), sia il movimento di promozione degli archivi digitali aperti (archivio come deposito di articoli
scientifici e per analogia deposito di informazioni).
27
Immagine da Open Archives Forum. <http://www.oaforum.org/tutorial/image/structure-model.gif>.
25
13
L’idea nasce 28 dalla necessità di superare le difficoltà della ricerca distribuita (come
fornita ad es. dal protocollo Z39.50 non in grado di fornire elevata omogeneità dei dati
recuperati 29 ). Ora l’implementazione e il data processing si spostano dai fornitori di dati ai
fornitori di sevizi. Da un modello distribuito si passa a un modello federato in cui
l’esportazione dei dati avviene su richiesta e a cura dei fornitori di servizi, che avranno anche
il compito di manipolare i dati al fine di normalizzarli e renderli disponibili all’utente in modo
uniforme. L’utente di un servizio di ricerca federata non avrà un contatto diretto con
l’archivio, ma con un database già costruito con i metadati raccolti dagli archivi partecipanti
(Lynch, 2001).
L’informazione digitale viene vista come: risorsa, ovvero, l’oggetto contenuto nel
repository; item, ovvero, l’elemento del repository dal quale i metadata possono essere
disseminati. Un identificatore univoco (deve corrispondere a uno URI 30 ) identifica un item
all’interno del repository e raccoglie tutti i possibili record di cui un item può essere
costituito; record, ovvero, i metadata in un determinato formato (espressi in sintassi XML
secondo lo schema Dublin Core Simple a garanzia dell’interoperabilità). L’operazione di
harvesting può essere selettiva, prelevando dal repository una porzione limitata (set) di
record 31 , più i loro identificatori. Il protocollo usa il modello domanda/risposta http per la
comunicazione tra harvester e repository. Per la risposta diversi sistemi di metadati, codificati
XML, sono supportati. Il protocollo richiede almeno il set Dublin Core non esteso, ma è
importante che anche schemi di metadati propri ad una piccola comunità possano essere
sviluppati ed utilizzati e che ricerche federate molto ampie possano essere assicurate grazie ad
un livello minimo di interoperabilità.
Oltre alla semplificazione della ricerca federata, un’altra importante applicazione dei
OAI-PMH è la possibilità per i motori di ricerca di agganciare in maniera non indiscriminata e
incontrollata i metadati di contenuti offerti attraverso gli archivi digitali.
Per sua natura il protocollo non si occupa di definire la gestione dell’autenticazione e
dell’accesso, che resta pertinenza esclusiva del repository. Inoltre, quali repository possano
essere target di raccolta per gli harvester, quale uso si possa fare dei metadati raccolti sono
questioni di accordi tra le parti, di politiche istituzionali di cui il protocollo ugualmente non si
occupa.
28
The Santa Fe Convention of the Open Archives Initiative, October 1999.
Il protocollo di comunicazione Z39.50 può essere utilizzato come strumento per facilitare l’interoperabilità tra
sistemi in rete, in cui un client, sfruttando un linguaggio di interrogazione condiviso e utilizzando un’unica
interfaccia, invia in parallelo una richiesta di informazioni a un dato numero di server, raggruppa i risultati,
elimina i duplicati e presenta i record all’utente. Nominalmente, anche la ricerca federata è possibile utilizzando
questo protocollo, ma molto difficile. Le richieste, infatti, possono essere interpretate in modi diversi dai server,
a causa di mancanza di specificità nello standard che ingenera difformità semantiche. Si verificano problemi di
scalabilità, quando il numero di server interrogati sono molti. Ci si deve preoccupare della non disponibilità
momentanea di certi server o della lentezza di altri che rallentano la risposta finale.
30
Uno Uniform Resource Identifier è una stringa che identifica univocamente una risorsa generica che può
essere un indirizzo web, un documento, un'immagine, un file, un servizio, un indirizzo di posta elettronica, ecc.
31
I set possono identificare anche una collezione con determinate caratteristiche.
29
14
4.2 Requisiti tecnici per la produzione e la disseminazione delle tesi di dottorato
elettroniche
La preparazione di una TDE, da un punto di vista operativo, si può paragonare alla
pubblicazione di un libro presso un editore. Diversi sono gli strumenti tecnici utili: un
personal computer, innanzitutto, ma nel caso di contenuti multimediali, si potrebbe aver
bisogno anche di uno scanner, una macchina fotografica digitale, un microfono, una
videocamera ecc. Anche dal lato software, per l’editing è indispensabile un word processor,
ma possono essere necessari anche editors di contenuti multimediali per la creazione di file
audio, video o immagine ed eventuali software per l’integrazione di questi contenuti diversi.
Per la rappresentazione ci si dovrà preoccupare di stili, font, grandezza dei caratteri, ma anche
eventualmente di compressione, risoluzione ecc.
Solitamente vengono date raccomandazioni dalle istituzioni circa i formati da
utilizzare per la produzione degli elaborati, consigliabili sia in vista di una ottimale
disseminazione, sia della conservazione nel lungo periodo. Un formato quasi unanimemente
consigliato, per le sue caratteristiche preferibile ad altri, è il PDF/A 32 . Accettabile è ogni
formato aperto, la cui la sintassi, la semantica, il contesto operativo e le modalità di utilizzo
vengono rese pubbliche mediante esaustiva documentazione.
Una tesi di dottorato si compone di una introduzione, una parte centrale e una finale
(opzionale) costituita da parti aggiuntive come appendici ecc. I formati raccomandati 33 :
Introduzione
Parte centrale
Formato pdf
Formato pdf (preferito)
(File testo supplementari) ASCII (.txt) SGML
HTML (paginazione, formattazione e archiviazione più difficili). Un
file pdf equivalente può accompagnarlo. E’ importante che il formato
fornisca una riproduzione, indipendente dalla piattaforma, fedele a
video o a stampa. HTML non può assicurare questo.
32 Allegrezza, S. (2008) “Il formato PDF/A (PDF for Archiving)”, in Pigliapoco S. & S. Allegrezza (2008)
Produzione e conservazione del documento digitale. Requisiti e standard per i formati elettronici, vol. 1, cap. 10,
Macerata: EUM. “Il PDF/A, o PDF/Archiving per l’archiviazione a lungo termine è un formato non proprietario,
aperto e standard de jure. E’ basato sul formato PDF di Adobe Systems e di questo utilizza solamente quelle
caratteristiche che permettono di produrre file in grado di conservare nel tempo la loro rappresentazione (sia su
schermo che a stampa, o attraverso altri sistemi di output, indipendentemente dagli strumenti tecnologici
utilizzati).” Dal suo canto, il PDF è “un formato di file basato su un linguaggio di descrizione di pagina
sviluppato da Adobe Systems nel 1993 per rappresentare documenti in modo indipendente dall'hardware e dal
software utilizzati per generarli o per visualizzarli”. Wikipedia, Portable Document Format [Voce].
<http://it.wikipedia.org/wiki/Portable_Document_Format>. E’ un formato aperto, documentato, standard e di
ampia adozione, auto-documentato ed indipendente dal dispositivo su cui viene visualizzato. I meccanismi
tecnici di protezione sono opzionali, non ci sono limitazioni nell’utilizzo, permette vari livelli di accessibilità,
non è modificabile, se si adottano meccanismi tecnici di protezione, fornisce ottime garanzie di sicurezza ed
efficienza. Tra i requisiti di sostenibilità meno evidenti si collocano la trasparenza, la robustezza e la stabilità.
D'altra parte il limite del PDF è quello di emulare il mondo della stampa su carta.
33
West Virginia University, Electronic Format Requirements (2011).
<http://www.libraries.wvu.edu/theses/electronic.htm>.
15
Materiale aggiuntivo
Formato ASCII. File speciali, dipendenti dalla piattaforma.
Immagini: PDF (.pdf) JPEG (.jpg) CompuServe GIF (.gif) CGM
Computer Graphics Metafile (.cgm) Adobe Photoshop (.ppd) Post
Script (.eps) PowerPoint (.ppt, .pptx)
Video: MPEG QuickTime - Apple (.mov) Audio Video Interleaved Microsoft (.avi) Windows Format (.wmv) Applicazioni streaming per
video (.swf, .flv)
Audio: MPEG-2 MP3 AIF (.aif) SND (.snd) WAV (.wav) MIDI
(.midi)
Speciali: Fogli di lavoro - Excel (.xls, .xlsx), (.csv)
Word Processing (se non è possible il pdf) (.doc, .docx. .pub)
AutoCAD (.dxf) Notepad (.txt)
File compressi (.zip, .tar, java)
Le TDE si possono produrre anche utilizzando dei linguaggi di marcatura, ovvero
metalinguaggi, che nel caso di XML permette di utilizzare uno schema che contiene delle
specifiche per il tipo di documento che si vuole rappresentare 34 . Poiché XML è indipendente
dalle piattaforme, molti sono i software disponibili per la produzione di TDE in XML 35 . Al
fine di controllare se un documento è stato creato con la giusta sintassi XML, si utilizzano i
parser XML. Molti sono facilmente disponibili e anche incorporati negli editor.
Un documento XML non può essere letto direttamente dagli utenti attraverso gli
attuali browser. Ci sono due strade: o si incorporano le informazioni di layout nel foglio di
stile, o lo si trasforma in una versione accessibile a video o a stampa. Le università hanno due
possibilità, ovvero, investire l’autore dell’elaborato della necessità di produrre un foglio di
stile per conservare tutte le informazioni e renderle disponibili, oppure, sviluppare dei fogli di
stile standard per le TDE, utili anche per il riconoscimento e la promozione dell’istituzione.
Altro punto importante è la nomenclatura dei file TDE e degli identificatori univoci.
La scelta del nome può essere lasciata alla discrezionalità dell’autore, ma non così per gli
identificatori. La tecnologia OAI richiede che ogni archivio abbia un identificatore e così ogni
record al suo interno. La combinazione dei due determinerà, senza possibilità di errore, quel
record. Allo stesso tempo, l’uso di uno URN, come handle 36 o PURL 37 , permetterà di
identificare sempre e univocamente un dato documento, evitandone la perdita, se nel tempo
viene spostato da un server ad un altro.
A livello hardware, una raccolta di TDE avrebbe bisogno di una infrastruttura
tecnologica in grado di contemplare:
34
Esistono già schemi di marcatura codificati, come MathML per la matematica o XBRL per l’economia che
possono essere usati nelle TDE per esprimere particolari tipi di contenuti.
35
Per citarne i due più diffusi, OpenOffice.org. <http://www.openoffice.org> e MS Word and Office 2007.
<http://www.microsoft.com>.
36
<http://www.handle.net/>.
37
<http://www.purl.org/docs/index.html>.
16
-
un server di produzione per il caricamento dei dati, a cui anche gli autori hanno accesso
per l’auto-archiviazione;
- un server di archiviazione per i backup, controllo accessi, gestione della sicurezza,
autenticazione e integrità dei contenuti conservati;
- un server per l’accesso pubblico con un interfaccia utente amichevole per la consultazione,
scarico dei dati ecc.;
- un server mirror in un luogo geograficamente diverso, che replichi l’archivio originale per
prevenire la perdita di dati per motivi ambientali.
Infine, un software per la gestione delle TDE deve rispondere a dei requisiti e
soddisfare dei criteri utili a trattare questi specifici contenuti digitali. Studi di comparazione
sono stati condotti in questi anni da più parti (Open Archives Forum, 2003; Open Society
Institute, 2004; Fay, 2010). Si evidenziano alcuni criteri (Copeland, Penman & Milne, 2005)
come:
- la disponibilità attraverso una licenza Open Source e la sostenibilità di una comunità di
sviluppatori (gratuità, modificabilità, aggiornamento, redistribuzione);
- l’interoperabilità, ovvero la conformità con il protocollo OAI-PMH, quindi l’accesso e la
comunicazione tra archivi;
- l’adattabilità, ovvero la capacità di lavorare con diversi sistemi operativi e di fornire
un’interaccia utente intuitiva ed efficiente 38 .
4.3 Modelli di metadati
La produzione e la disseminazione delle TDE passa anche attraverso un uso ponderato
e l’applicazione puntuale di modelli di metadati, i cui set di elementi sono stati studiati, testati
ed applicati a questi specifici contenuti.
I metadati sono informazioni strutturare che descrivono, spiegano, localizzano,
facilitano il recupero, l’uso e la gestione di una risorsa informativa. Spesso sono chiamati dati
sui dati o informazioni sulle informazioni (NISO, 2004) 39 . Il significato del termine cambia a
seconda della comunità che lo utilizza. Nelle biblioteche, di solito, il termine identifica uno
schema formalizzato 40 per la descrizione di una risorsa, o oggetto, sia digitale, sia non. La
definizione o significato degli elementi è conosciuta come semantica dello schema. I valori
attribuiti agli elementi costituiscono il contenuto.
38
Per una esaustiva trattazione della questione si veda il lavoro svolto dal Gruppo OA presso la CRUI che nel
2009 ha portato all’elaborazione di Linee guida per gli archivi istituzionali con una particolare attenzione alla
realtà italiana.
39
Feliciati, P. (2009) ne dà la seguente definizione, che pone l’accento anche sulla gestione conservativa delle
risorse digitali: “Dati che descrivono il contesto, il contenuto e la struttura dei documenti e la loro gestione nel
tempo […] Informazioni strutturate o semistrutturate che permettono la creazione, la gestione e l’uso di record
nel tempo, e all’interno e attraverso i domini in cui vengono creati.”
40
Gli schemi di metadati sono set di elementi destinati ad uno scopo preciso, come descrivere un tipo particolare
di risorsa informativa. Gli schemi presentano generalmente specifici nomi degli elementi e la loro semantica.
Possono anche specificare, ad es., regole di formulazione del contenuto, oppure regole di rappresentazione del
contenuto, oppure valori di contenuto accettati e non, secondo un vocabolario controllato.
17
I vari tipi di metadati vengono, per praticità, solitamente classificati in tre categorie:
metadati descritti, strutturali e amministrativi.
- i metadati descrittivi sono utili a identificare e descrivere una risorsa. Sono descrizioni
normalizzate dei documenti fonte e risiedono generalmente nelle basi dati dei sistemi di
information retrieval, all’esterno dei depositi degli oggetti digitali e sono collegati a questi
ultimi tramite appositi link (Progetto Minerva, 2007).
- i metadati strutturali servono a descrivere la struttura interna dei documenti e gestiscono
le relazioni tra le diverse componenti (pagine, capitoli ecc.).
- i metadati amministrativi o gestionali forniscono informazioni sulla gestione della risorsa
e sono particolarmente utili nel mantenimento e accessibilità a lungo termine (gestione dei
diritti di accesso, conservazione).
Ai nostri fini, è utile concentrarsi sui metadati descrittivi per evidenziare quale set di
elementi o descrittori può risultare efficace ed appropriato ai contenuti delle TDE.
Naturalmente anche le altre categorie di metadati sono molti importanti per la gestione
amministrativa di questi documenti, ma sono più facilmente applicabili ed applicati
automaticamente dal sistema. A titolo esemplificativo, alcuni set di descrittori già sviluppati e
disponibili, non con intento restrittivo, per le TDE, ed utilizzabili come modelli, sono, a
livello internazionale: Dublin Core (DCMES) 41 , ETD-MS della Networked Digital Library of
Theses and Dissertations e UK EDT Metadata Core Set 42 . Gli ultimi due sono stati studiati
proprio per le TDE. Dublin Core è un set più ampio e generale a cui è possibile aggiungere
altri elementi (Copeland, Penman & Milne, 2005) propri del mondo accademico e di interesse
per l’università (ETD Guide, 2010) come:
- informazioni amministrative: facoltà, dipartimento, scuola, data di presentazione, data di
accettazione e discussione, borse di studio;
- informazioni accademiche: commissione esaminatrice, relatore, tutor;
- informazioni biblioteconomiche: università, sistema bibliotecario, inventario, collocazione.
Si propone di seguito una tavola comparativa e riepilogativa di questi tre set di
elementi, partendo da Dublin Core, per verificare dove e come si producono degli scostamenti
dal set generico per allocare elementi necessari ad una descrizione esaustiva delle TDE.
DCMES
dc.title
ETD-MS
dc.title
dc.title.alternative
dc.creator
dc.creator
UK ETD Set
title
title.alternative
creator
Descrizione DC
Nome: Titolo
Identificatore: Title
Definizione: Un nome dato alla
risorsa
Nome: Creatore
Identificatore: Creator
Definizione: Un’entità che ha la
responsabilità principale della
41
The Dublin Core Metadata Element Set, version 1.1. <http://dublincore.org/documents/dces/>.
La tabella descrittiva è disponibile presso la Robert Gordon University Library Service.
<http://www2.rgu.ac.uk/library/guidelines/metadata.html>.
42
18
produzione del contenuto della
risorsa
dc.subject
dc.subject
dc.description
dc.description
dc.description.abstract
dc.description.note
dc.description.release
dc.publisher
dc.publisher
contributor.advisor
subject
description.abstract
subject.DDC
subject.LCC
subject.LCSH
subject.MESH
subject.UDC
publisher
dc.publisher.country
dc. contributor
dc.contributor
dc.contributor.role
contributor.sponsor
(refinement)
dc.date
dc.date
date.issued
(refinement)
dc.type
dc.type
type
dc.format
dc.format
format.IMT
(encoding scheme)
dc.identifier
dc.identifier
identifer.URL
(encoding scheme)
dc.language
language.ISO639-2
(encoding scheme)
dc.source
dc.language
Nome: Soggetto e Parole chiave
Identificatore: Subject
Definizione: L’argomento della
risorsa.
Nome: Descrizione
Identificatore: Description
Definizione: Una spiegazione del
contenuto della risorsa
Nome: Editore
Identificatore: Publisher
Definizione: Un’entità
responsabile della produzione
della risorsa, disponibile nella sua
forma presente
Nome: Autore di contributo
subordinato
Identificatore: Contributor
Definizione: Un’entità
responsabile della produzione di
un contributo al contenuto della
risorsa
Nome: Data
Identificatore: Date
Definizione: Una data associata a
un evento del ciclo di vita della
risorsa
Nome: Tipo di risorsa
Identificatore: Type
Definizione: La natura o il genere
del contenuto della risorsa
Nome: Formato
Identificatore: Format
Definizione: La manifestazione
fisica o digitale della risorsa
Nome: Identificatore della risorsa
Identificatore: Identifier
Definizione: Un riferimento
univoco alla risorsa nell’ambito di
un dato contesto
Nome: Fonte
Identificatore: Source
Definizione: Un riferimento a una
risorsa dalla quale è derivata la
risorsa in oggetto
Nome: Lingua
Identificatore: Language
Definizione: La lingua del
contenuto intellettuale della
risorsa
relation.hasVersion
(refinement)
19
dc.relation
relation.references
(refinement)
dc.coverage
dc.coverage
dc. rights
dc.rights
rights
Nome: Relazione
Identificatore: Relation
Definizione: Un riferimento alla
risorsa correlata
Nome: Copertura
Identificatore: Coverage
Definizione: L’estensione o scopo
del contenuto della risorsa
Nome: Gestione dei diritti
Identificatore: Rights
Definizione: Informazione sui
diritti esercitati sulla risorsa
thesis.degree
thesis.degree.level
thesis.degree.discipline
thesis.degree.grantor
format.extent
(refinement)
Il confronto proposto attraverso la tabella è naturalmente molto selettivo, ma
esplicativo di un modus operandi e dell’adattabilità dello schema Dublin Core, che fornisce
requisiti minimi e regole semplici per la pubblicazione online, di fatto dando la possibilità di
costruire schemi più complessi, o comunque più articolati e più confacenti ad una data
comunità di utilizzatori. Si nota scorrendo la tabella come il set di 15 elementi DCMES
rappresenti uno schema base dal quale lo standard ETD-MS sottrae gli elementi dc.source e
dc.relation per specificarne meglio alcuni: dc.title  dc.title.alternative; dc.publisher 
dc.publisher.country; dc.contributor  dc.contributor.role e per aggiungere thesis.degree con
dei livelli di specificazione pertinenti al materiale da descrivere: (thesis.degree.level,
thesis.degree.discipline, thesis.degree.grantor).
La scelta britannica, proposta non come set obbligatorio e restrittivo, ma come punto
di sviluppo (Copeland, Penman & Milne, 2005), tende a coinvolgere non soltanto l’autore
dell’elaborato per l’auto-archiviazione, segnalando quali sono gli elementi (o campi da
valorizzare di sua pertinenza), ma anche il bibliotecario, già a questo stadio, inserendo i campi
subject.DDC, LCC, MESH, UDC. Si estende l’elemento dc.relation a contemplare relazioni
con parti del lavoro stesso già pubblicate o a lavori di altri. Né in ETD-MS, né in UK EDT
Metadata Core Set si prende in considerazione l’elemento dc.source, “riferimento a una
risorsa dalla quale è derivata la risorsa in oggetto”, che in effetti non ha senso di essere in
questo caso.
4.4 Catalogazione: rimodulazione dei flussi di lavoro
Codificare set di metadati per la descrizione di documenti elettronici contenuti negli
archivi digitali verso lo standard MARC è una questione che si è subito posta alla comunità
dei bibliotecari, ovvero, esplorare la possibilità di creare dati in un formato con l’intento di
produrre automaticamente record in un altro formato. Le TDE sono di certo i documenti
elettronici che con più facilità e regolarità i catalogatori trovano sul loro tavolo di lavoro,
20
quindi un tipo di materiale adatto alla sperimentazione. E’ vero che si incoraggia, anzi si
richiede obbligatoriamente all’autore di auto-archiviare il proprio lavoro, ma è anche vero che
i record prodotti in questo modo risultano spesso poveri e non controllati.
Da qui la necessità di confrontare i dati Dublin Core e lo standard MARC per costruire
una mappa di equivalenze, non sempre facile, ma possibile (UKOLN, 2002). Dato che lo
standard MARC è piuttosto rigido e povero di soluzioni per la catalogazione delle tesi, un set
di metadati studiati per le TDE può facilitare l’adozione di campi MARC utili alla
catalogazione di questo materiale e lo sviluppo di campi locali dove allocare informazioni,
altrimenti non disponibili. Se si prendono in considerazione le tavole di mappatura
UNIMARC/Dublin Core (Day, 1999; ICCU, 2011) di dieci anni fa e di oggi si possono notare
notevoli differenze ed uno sforzo verso l’avvicinamento tra i due codici. Basti pensare, ad es.
all’introduzione dei campi:
856$q Tipo di formato elettronico
dc.format
856$g URN
dc.identifier
856$u URL
dc.identifier
856$u URL
dc.rights
135 Dati codificati: risorse elettroniche
dc.type
230 Caratteristiche delle risorse elettroniche
dc.type
336$a Tipo di risorsa elettronica
dc.format
Grazie all’interoperabilità tra sistemi e una mappatura tra codici di descrizione, un
sistema MARC può raccogliere dati codificati DC ed estensioni e tradurli automaticamente in
dati MARC e viceversa. In una prospettiva OAI standard XML, un fornitore di dati può
esportare sia dati codificati XML DC ed estensioni, sia dati MARC XML (ETD-MS, 2010),
che, in una prospettiva di creazione di record bibliografici per le TDE da inserire nel catalogo,
saranno transcodificati in MARC. Un record MARC contenente valori condivisi per la
rappresentazione e la descrizione di una TDE può essere un record valido per un set di
codifica basato su Dublin Core. Lo stesso vale per quelle istituzioni che creano record Dublin
Core ed estensioni conformi a MARC. Lo scambio dei dati è in entrambi i casi possibile
(ETD-MS, 2008).
Le possibilità prospettate di interscambio dei dati aprono nuovi scenari nei processi di
lavoro per la gestione delle TDE, in biblioteca, ma anche negli uffici amministrativi e
nell’archivio di un’istituzione accademica, anche se i cambiamenti di quella che sempre di più
si evidenzia come catalogazione automatica e auto-archiviazione dei contenuti sono percepiti
dai bibliotecari come una realtà da non accettare come soluzione per abbreviare i tempi di
lavoro, ma da gestire con le giuste cautele di controllo e supervisione.
Uno scenario possibile di rimodulazione dei flussi di lavoro mette in gioco il
contributo dell’autore dell’elaborato, la Scuola di alta formazione, la biblioteca e in una
prospettiva di conservazione nel lungo periodo, laddove già sviluppata, l’archivio.
21
In ottemperanza delle disposizioni amministrative, dietro presentazione della domanda
di diploma, lo studente, attraverso un login e una password di Ateneo, oppure creando il
proprio profilo direttamente dall’interfaccia dell’archivio digitale, sottopone il suo file al
sistema. Oltre ai metadati descrittivi ed eventualmente amministrativi, relativi ai diritti di
accesso e uso e riuso, che lo studente valorizza, una serie di metadati amministrativi vengono
generati automaticamente dal sistema, come la provenienza (nome, data e ora), diritti di
accesso (se previsto), informazioni tecniche come il numero di byte e dati di gestione del file.
L’operazione viene convalidata da un addetto della Scuola di alta formazione ed una notifica
viene inviata alla biblioteca per la revisione del lavoro fatto dallo studente e per il
completamento della descrizione del record con le appropriate informazioni di autorità
attraverso un vocabolario controllato. Opportunamente, a volte grazie a un plug-in, una utilità,
anche sviluppata internamente, conforme al software di gestione del catalogo bibliografico, è
possibile mappare automaticamente i metadati provenienti dell’archivio digitale in MARC,
esportarli e dopo gli opportuni controlli salvarli nel catalogo. I controlli possono essere di
varia natura: riguardare i tag (indicatori e sottocampi), regole ortografiche (maiuscolo o
minuscolo, diacritici, caratteri speciali), spaziatura, controllo delle date di presentazione e
discussione della tesi.
I tempi di lavoro saranno drasticamente abbattuti, evitando duplicazioni e assorbendo
molta parte del tradizionale lavoro di catalogazione. Potrebbe portare anche alle estreme
conseguenze di delegare tutta l’operazione all’auto-archiviazione (ulteriore standardizzazione
del processo nelle prime fasi) ed a un set minimo di metadati richiesti.
Una delle sfide è, forse, di bilanciare la puntualità nell’accesso a queste risorse e
l’efficienza del flusso di lavoro, la capacità di gestire diversi formati (XML, MARCXML,
MARC, ecc.) e la capacità di conciliare i metadati per scopi diversi, o database diversi (il
gestionale della biblioteca, il catalogo nazionale, l’archivio istituzionale). Soluzione
quest’ultima a cui si sta mettendo mano, con alterne fortune, attraverso i discovery tools di
ultima generazione.
4.5 La conservazione nel lungo periodo
Mentre continua il lavoro sul miglioramento della qualità dei metadati, il confronto tra
quelli generati dagli autori e le procedure di controllo dei catalogatori, l’esposizione dei dati
degli archivi istituzionali di TDE in servizi di raccolta nazionali e internazionali (Guy, Powell
& Day 2004; Jackson, et al. 2008; Lubas, 2009), resta ancora poco percepita e affrontata la
questione della conservazione di questo materiale e della stabilità che i depositi istituzionali
possono offrire nel lungo periodo 43 . Si evidenzia da più parti che le tesi di dottorato sono
43
La Digital Preservation Coalition definisce la conservazione digitale come, “Digital Preservation refers to the
series of managed activities necessary to ensure continued access to digital materials for as long as necessary.
Digital preservation is defined very broadly for the purposes of this study and refers to all of the actions required
to maintain access to digital materials beyond the limits of media failure or technological change”.
<http://www.dpconline.org/advice/preservationhandbook/introduction/definitions-and-concepts>.
22
ormai materiale che nasce digitale. Tutte o quasi le università richiedono, insieme al formato
cartaceo quello elettronico, oppure solo quello elettronico. La conservazione di queste nuove
risorse digitali per le future generazioni è un dovere morale che giustamente si configura
come obbligo legale.
Come per altri materiali, la conservazione nel lungo periodo delle TDE non può essere
lasciata alla volontà di singole istituzioni, ma deve nascere dallo sforzo congiunto di più
soggetti. Nel tempo gli stessi progetti nazionali di raccolta delle TDE hanno sviluppato, o
stanno sviluppando strategie per la conservazione del materiale che viene man mano raccolto
per la disseminazione presso singoli archivi istituzionali.
Negli Stati Uniti, insieme alla MetaArchive Cooperative, la Networked Digital Library
of Theses and Dissertations ha sviluppato dal 2008 un piano strategico 44 per la conservazione
delle TDE nel lungo periodo. Possono usufruirne tutte le istituzioni che implementano
l’archivio delle TDE, depositando i loro documenti in un archivio di storage che funziona con
una tecnologia di rete distribuita con server in almeno sei istituzioni facenti parte della rete.
Non solo è assicurato il back-up dei file, ma anche il controllo programmato e la sostituzione
dove necessario.
In Gran Bretagna EthOS 45 (Electronic Theses Online System), il programma che
permette l’archiviazione delle tesi prodotte nel Regno Unito e che ha il suo “hub” presso la
British Library, sta congiuntamente sviluppando un programma di conservazione che va sotto
il nome di Digital Preservation Statement for UK Theses Digitisation Project / EthOS. Il
documento prodotto spiega le strategie e le tecniche 46 messe in campo dalla British Library
per la conservazione delle tesi digitalizzate e native digitali.
In Germania il progetto nazionale Dissonline47 , oltre a raccogliere le tesi di dottorato e
lavori post-dottorato prodotti nelle Università tedesche e permetterne la ricerca online,
fornisce anche tutta una serie di servizi di supporto per gli autori ed è agganciata a progetti di
conservazione nel lungo periodo, che nascono dalla cooperazione tra biblioteche nazionali,
universitarie, musei e archivi e si raccolgono intorno a Nestor 48 , rete di competenze e
istituzioni fattivamente impegnate nella questione della conservazione dei documenti digitali
a livello nazionale ed europeo.
Il progetto europeo Planets 49 , finanziato per vincere la sfida della conservazione
digitale, si pone l’obiettivo di produrre servizi e strumenti utili ad assicurare la conservazione
a lungo termine. Collaborano al progetto diverse biblioteche nazionali europee e proprio la
Biblioteca nazionale austriaca si è fatta promotrice di un progetto locale di conservazione
delle tesi attraverso uno studio approfondito dei formati e la loro reazione a processi di
migrazione (Becker et al., 2007).
44
<http://www.ndltd.org/Members/gail/etd-preservation-network>.
<http://www.ethos.ac.uk/>.
46
La strategia si basa sulla cosiddetta “gestione del ciclo di vita”. In ogni stadio del ciclo di vita dei documenti i
contenuti digitali vengono trattati opportunamente per le peculiarità e necessità proprie di quello stadio.
47
<http://www.dissonline.de/eng/index.htm>.
48
<http://www.langzeitarchivierung.de/eng/index.htm>.
49
<http://www.planets-project.eu/>.
45
23
DART 50 , partner europeo di NDLTD, nasce come un semplice servizio di TDE ed
ancora oggi che è cresciuto tende a mantenere un basso profilo nell’approccio ai metadati ed
es., ma è fortemente impegnato nelle tematiche della conservazione ed anche in progetti di
retro-digitazione.
Da questi pochi esempi è facile capire che la conservazione dei contenuti digitali in
generale è un terreno ancora nuovo da esplorare. Le buone pratiche sono ancora da costruire e
si aspettano significativi passi avanti della tecnologia.
5. Archiviazione delle tesi di dottorato elettroniche: lo scenario italiano
5.1 Le Linee guida CRUI: una policy comune per gli Atenei italiani
Sulla scia del movimento internazionale Open Access, nel 2006 viene istituito presso
la Commissione biblioteche della Conferenza dei Rettori delle Università Italiane 51 un
Gruppo di lavoro con il compito di promuovere iniziative capaci di favorire la libera
circolazione e la diffusione della ricerca scientifica in Italia. Uno dei sottogruppi viene
incaricato di studiare ed elaborare indicazioni per l’accesso aperto alle tesi di dottorato in
formato elettronico (Galimberti, 2008).
Il lavoro del Gruppo ha portato alla stesura delle Linee guida per il deposito delle tesi
di dottorato negli archivi aperti, approvate il 23 novembre 2007, il cui scopo principale è di
rispondere alla necessità di stabilire uno standard nazionale per la raccolta e l’esposizione di
questi prodotti della ricerca. Le Linee guida si presentano sottoforma di raccomandazioni di
conformità nelle procedure da adottare da parte degli Atenei italiani per il deposito delle TDE
negli archivi istituzionali e la successiva cattura automatica delle informazioni da parte delle
due Biblioteche nazionali di Firenze e Roma, in funzione di fornitori di servizi.
Si è inteso in questo modo mettere ordine in una situazione eterogenea e frammentata,
in cui alcuni Atenei procedevano già autonomamente a raccogliere gli elaborati, oltre che in
formato cartaceo, anche in formato elettronico nei propri archivi istituzionali, altri che ne
lasciavano il deposito alla volontà del singolo autore, altri che lo rendevano obbligatorio, pur
chiedendo una liberatoria, altri ancora che continuavano a raccoglierli solo in formato
cartaceo o su CD-Rom.
50
51
<http://www.dart-europe.eu/basic-search.php>.
Da ora in poi CRUI.
24
La natura scientifica 52 e amministrativa 53 di questi documenti ha permesso di
intervenire con decisione e di stabilire dei punti fermi nella trattazione di una materia che non
si presta a fraintendimenti. Innanzitutto attraverso una modifica dei regolamenti dei bandi di
dottorato con la clausola del deposito obbligatorio nell’archivio istituzionale e presso le
Biblioteche nazionali. Quest’ultima diventerà una presa d’atto da parte dell’autore. Nessuna
autorizzazione sarà più necessaria e nessuna volontà individuale potrà disconoscere l’obbligo
del deposito legale. Il dottorando dovrà essere consapevole che la sua tesi di dottorato è un
documento pubblico, già dalla sua discussione e che sarà inserita in un archivio digitale e resa
pubblica anche per via telematica.
Il dottorando mantiene presso di sé il diritto d’autore sul testo della tesi, ovvero i diritti
morali (paternità, integrità, ritiro dell’opera dal commercio), che non sono trasmissibili e i
diritti di utilizzazione economica o patrimoniali (distribuzione, comunicazione, riproduzione,
traduzione ecc.), che possono essere ceduti in parte o in esclusiva 54 .
Il libero accesso alle TDE può subire delle restrizioni solo in alcuni motivati casi,
circoscritti nel tempo, di cui i dottorandi devono essere a conoscenza:
- brevetti;
- alcune parti dell’elaborato sono state sottoposte ad un editore, sono in attesa di
pubblicazione e l’editore non ne accetta una precedente pubblicazione ad accesso aperto;
- la tesi è frutto di un progetto di ricerca finanziato da un ente esterno, che vanta per questo
dei diritti su di essa e sulla sua pubblicazione;
- temi sensibili da un punto di vista politico, commerciale o industriale;
- sicurezza pubblica;
- dati sensibili;
- uso di materiale altrui non autorizzato: testi, foto, immagini;
- materiale che comprenda informazioni ottenute sotto la promessa di riservatezza
confidenzialità.
In questi casi è possibile prevedere un periodo di secretazione (embargo) dai sei ai dodici
mesi, trascorsi i quali la tesi diventa liberamente consultabile.
52
La tesi di dottorato si può definire una pubblicazione scientifica per la natura dei suoi contenuti, per la
discussione pubblica alla fine del ciclo di studi, per il deposito obbligatorio presso le Biblioteche nazionali, che
di fatto ne sanciscono la pubblicità. Allo stesso tempo, la sua produzione non è finanziata da editori, né il
processo di validazione è affidato a loro. Difficilmente su di essa insistono diritti di terzi, né è necessario
ottenere autorizzazioni per il deposito negli archivi istituzionali, in quanto già documento pubblico al momento
della discussione (CRUI, 2007).
53
Il D.M. 224/1999, art. 6, comma 11 (Regolamento in materia di dottorato di ricerca) recita” Il titolo è rilasciato
dal rettore dell’università che, a richiesta dell’interessato, ne certifica il conseguimento. Successivamente al
rilascio del titolo, l’università medesima cura il deposito di copia della tesi finale presso le biblioteche nazionali
di Roma e Firenze.” La legge 15 aprile 2004, n. 106 sul deposito legale non cita le tesi di dottorato, ma di fatto le
fa ricadere fra i “documenti diffusi tramite rete informatica”, quindi oggetto di deposito legale. Nel Regolamento
di attuazione DPR 252/2006, art. 37, tra le tipologie di documenti diffusi tramite rete informatica per i quali vale
il deposito legale, al comma 3, legge testualmente “documenti concernenti la produzione scientifica delle
università, dei centri di ricerca e delle istituzioni culturali”.
54
Per una esaustiva trattazione dell’argomento si rimanda all’addenda alle Linee guida, CRUI. Gruppo OA, Tesi
di dottorato e diritto d’autore. Indicazioni per l’applicazione delle Linee guida per l’accesso aperto alle tesi di
dottorato. <http://www.crui.it/download.aspx?catalogo=&folder=allegati&file=AddendaLineeGuidaTesi.pdf>.
25
Molto utili a fini pratici sono le raccomandazioni proposte infine dalle Linee guida,
che mirano a regolamentare i comportamenti degli Atenei a riguardo. Oltre alla rettifica dei
bandi di concorso, viene proposto l’uso di una declaratoria per i corsi già avviati, da
mantenere anche in seguito come certificazione dell’integrità, l’autenticità e la conformità del
documento depositato 55 . La declaratoria e l’auto-archiviazione sono due pratiche consigliate,
perché sollevano l’Università da ogni responsabilità circa la natura del materiale depositato.
E’ bene, inoltre, che per il deposito e il formato dei file ci si conformi ai requisiti richiesti
dalle Biblioteche nazionali, che si adotti lo stesso schema di metadati, che si coinvolgano nel
progetto tutti i soggetti interessati all’interno dell’Ateneo, che si integri l’archivio con il
sistema di autenticazione di Ateneo, che si rendano esplicite le regole di funzionamento
attraverso la massima pubblicità e coinvolgimento. Ad oggi sono 34 le Università italiane che
applicano le Linee guida.
5.2 Deposito legale via harvesting automatico e riversamento dei dati nell’Indice SBN
Le Linee guida prevedono anche la consegna per il deposito legale delle TDE alle
Biblioteche nazionali di Firenze e Roma. In collaborazione con il Gruppo OA CRUI e
nell’ambito del progetto Magazzini digitali 56 , le due BNC hanno implementato una procedura
che permette di adempiere all’obbligo del deposito legale tramite raccolta automatica
(harvesting) dei dati e dei metadati delle TDE. La procedura è stata autorizzata dalla Circolare
n. 1746/2007 del MIUR e può essere adottata da tutti gli Atenei che raccolgono le tesi in un
archivio istituzionale aperto, conforme al protocollo OAI-PMH e in raccordo con le
raccomandazioni (formato dei file, metadati) contenute nelle Linee guida. I benefici di questa
procedura sono evidenti: snellimento delle pratiche amministrative per gli Atenei, riduzione
dei tempi di trattamento catalografico e bibliografico a carico della Bibliografia Nazionale
Italiana e realizzazione di un servizio nazionale di raccolta e accesso alle TDE.
Da una parte gli Atenei devono assolvere il compito di realizzare degli archivi
istituzionali ad accesso aperto, predisposti per generare strutturalmente i metadati MPEG21DIDL ed esporli tramite il protocollo OAI-PMH. Questo formato è stato scelto in quanto
permette di rappresentare risorse digitali anche composte da più file. Dall’altra tutte le fasi di
deposito legale sono a carico delle due Biblioteche nazionali e si possono sintetizzare in
questo modo (Bergamin, 2008):
55
Problema non di poco conto: la tesi di dottorato è un documento amministrativo, che ha valore giuridico. A
rigore una TDE, essendo un documento informatico a conservazione illimitata, secondo il Dlgs. 235/2010, o
nuovo Codice dell’amministrazione digitale, dovrebbe essere corredato da una firma elettronica qualificata o da
una firma digitale. I costi di gestione di firme digitali per ogni studente sarebbero molto elevati e al momento
sarebbe molto difficile da parte delle Università gestire una tale evenienza da un punto di vista archivistico
(ICT4University. Tavolo tecnico Università digitale, 2011).
56
Il progetto Magazzini digitali, avviato nel 2006 dalla Fondazione Rinascimento Digitale, dalla Biblioteca
Nazionale Centrale di Firenze e dalla Biblioteca Nazionale Centrale di Roma, si propone di realizzare depositi
digitali accreditati e affidabili per la conservazione nel lungo periodo dei documenti elettronici pubblicati in
Italia e diffusi attraverso la rete, in attuazione della normativa sul deposito legale. Si vedano in proposito:
<http://www.rinascimento-digitale.it/magazzinidigitali.phtml>, <http://www.depositolegale.it>,
<http://www.bncf.firenze.sbn.it/pagina.php?id=212>.
26
-
-
-
-
raccolta dei metadati secondo il protocollo OAI-PMH;
raccolta del full-text a partire dall’identifier, lo URL che identifica univocamente la
risorsa in rete mediante un crawler che registra anche i metadati di cattura e raccolta. Il
crawler genera file di tipo WARC in grado di aggregare più risorse con relativi metadati in
un unico file;
verifica dei formati, in particolare se sono conformi ad alcuni requisiti come la
traducibilità, che consente di mantenere nel tempo il controllo della risorsa. Il formato
richiesto è il PDF/A. Se i file raccolti sono solo pdf vengono accettati con riserva e
l’archivio istituzionale di partenza viene investito del problema 57 .
acquisizione dei full-text e dei metadati nel servizio Magazzini digitali;
invio delle ricevute di avvenuto deposito tramite e-mail all’amministratore dell’archivio
istituzionale di partenza con l’impronta digitale della TDE in formato SHA-1 base 32 58 a
garanzia dell’autenticità della risorsa depositata;
l’accesso in rete delle TDE è per il momento consentito solo dalle postazioni interne delle
Biblioteche nazionali. Questo almeno fino a quando non si saranno risolte con i fornitori
dei dati le questioni riguardanti i metadati relativi ai diritti di accesso.
Il riversamento dei dati nell’Indice SBN e negli opac delle due Biblioteche nazionali,
fornitori del servizio di harvesting, non è ancora una realtà visibile per l’utente. In accordo
con l’ICCU esse stanno lavorando al progetto di trattamento dei metadati delle TDE con
interventi di normalizzazione, al fine di permettere il dialogo con l’Indice per le operazioni di
import. Finora le tesi di dottorato, come tipologia di materiale propria, sono state escluse
dall’inserimento in Indice, perché considerate letteratura grigia (Vignocchi, Bergamin,
Messuti, 2010).
5.3 Uno standard nazionale per la raccolta e l’esposizione dei dati
Dal 2007 le Linee guida assolvono il compito meritorio di aver aggregato numerose
Università italiane intorno al progetto dell’accesso aperto alla letteratura scientifica. Oltre al
richiamo verso comportamenti omogenei, ciò ha portato inevitabilmente all’elaborazione di
uno standard nazionale per la raccolta e l’esposizione dei dati e dei metadati. Lo standard
prevede:
Formato del file
PDF/A preferibile. I formati aperti sono accettati.
Protocollo di scambio dei metadati
I dati e i metadati delle TDE devono essere esposti attraverso il protocollo OAI-PMH.
Formato dei metadati
57
Lo strumento di validazione utilizzato è Jhove (JSTOR/Harvard Object Validation Environment).
Le funzioni hash per creare un’impronta digitale, a partire da un testo di lunghezza arbitraria, generano una
stringa di lunghezza fissa. La trasformazione funziona in un solo senso: non è quindi possibile, dalla stringa
generata, risalire al testo iniziale. L’hash è usata per attestare che il file non è stato alterato da virus o
dall’intervento di un malintenzionato.
58
27
Il formato dei metadati supportato è MPEG21-DIDL 59 .
Uso di oai_dc
Ai fini dell’interoperabilità sintattica e semantica si richiede l’uso del seguente schema di
metadati, definito sullo schema base Dublin Core.
Dataset
title
creator
Dublin Core
dc:title
dc:creator
description dc:description
language
dc:language
identifier
dc:identifier
type
dc:type
contributor dc:contributor
date
dc:date
publisher
dc:publisher
format
subjects
rights
dc:format
dc:subject
dc:rights
Note
Titolo della tesi
Autore dell’opera (nel formato cognome, nome); non
obbligatorio, ma raccomandato è l’indicazione dell’anno di
nascita dell’Autore inserito con la seguente sintassi cognome,
nome <anno>
Abstract (meglio se in inglese)
Lingua (nel formato ISO639-1)
URL a cui raggiungere il full-text della tesi o a una pagina
intermedia
Tipologia di materiale, da impostare di default come Doctoral
Thesis è importante per il recupero dei dati usare la forma
inglese
Nome del tutor (nella forma cognome, nome)
Data di discussione della tesi (min. anno)
Nome dell’università (è importante perché l’università di
provenienza rende esplicito il valore della tesi)
Opzionale (mime type, size)
Settore Scientifico Disciplinare MIUR
Va espresso secondo il vocabolario info:eu-repo. Vedi tesi in
embargo
Identificatore OAI univoco
I record esposti via oai-pmh devono avere un identificatore univoco, comunemente legato alla
base URL dell’archivio.
Evidenza dell’avvenuto deposito
A riprova dell’avvenuto deposito, una e-mail viene inviata all’amministratore dell’archivio
con allegato un file .xml con l’elenco degli URI delle tesi depositate e la relativa impronta
digitale in formato SHA-1 base32.
59
Dal sito depositolegale.it <http://www.depositolegale.it/tesi-di-dottorato/#configurazione>, “La scelta di tale
formato è dettata dalla necessità di poter identificare risorse digitali (tesi) composte da più file. MPEG21-DIDL
permette di identificare con precisione i componenti (didl:Component) della risorsa (didl:Item) e la cosiddetta
JOP (jump off page), url della pagina web che riporta informazioni sulla risorsa utili alla consultazione mediante
un browser. L’uso del solo Dublin Core (oai_dc) permette di identificare, attraverso dc:identifier, solo la jump
off page, senza ulteriori informazioni sui componenti. In casi di eccezione, quali l’utilizzo di software
autoprodotti o non supportanti DIDL, l’harvesting può essere effettuato usando oai_dc, esclusivamente se le tesi
sono composte da un solo file riportato in dc:identifier.”
28
5.4 CamEprints: l’archivio istituzionale delle tesi di dottorato presso l’Università di
Camerino
L’archivio istituzionale di Ateneo dell’Università di Camerino, CamEprint 60 , è stato
implementato nel 2006 e le prime TDE inserite risalgono proprio quell’anno. L’Università si è
fatta carico di seguire da vicino fin dal suo esordio gli sviluppi del lavoro che il Gruppo Open
Access della Commissione Biblioteche stava svolgendo presso la CRUI. Sulla scia delle
novità intervenute a seguito della pubblicazione delle Linee guida nel 2007, si è provveduto
ad adeguare, secondo le nuove regole, sia le norme riguardanti il deposito con un nuovo
articolo inserito del Regolamento della Scuola di Alta Formazione 61 , sia il deposito legale
presso le Biblioteche Nazionali attraverso la procedura di harvesting automatico per la quale
una apposita convenzione è stata stipulata con il fornitore del servizio.
L’archivio non nasce come unicamente destinato alle TDE. Nelle intenzioni dei
promotori ed implementatori (bibliotecari e dipartimento ITC) del progetto, esso è destinato
ad ospitare materiali misti. Vero è che ad oggi il deposito è obbligatorio solo per le TDE e
non per altre pubblicazioni prodotte in seno all’Ateneo 62 . Attualmente l’archivio ospita 189
TDE e 22 tra articoli, recensioni, materiali didattici. E’ inserito nel circuito Pleiadi ed i suoi
contenuti sono ricercabili anche attraverso questo portale. I dati relativi alla reperibilità in rete
di CamEprints e le sue politiche mandatarie sono disponibili anche in ROARMAP 63 .
Il deposito delle TDE in CamEprints è affidato al dottorando attraverso la procedura di
auto-archiviazione, ovvero si incoraggiano gli utenti a registrarsi nel sistema e a provvedere
all’upload del proprio elaborato. Non si è però abbandonata la pratica di provvedere al loro
inserimento ad opera di un bibliotecario, laddove necessario. Dopo l’espletamento delle
pratiche amministrative e burocratiche e il deposito contestuale nella segreteria della Scuola
di Alta Formazione di una copia della tesi su CD o DVD, questa viene inviata all’addetto per
la catalogazione ed l’inserimento. Nel primo caso, invece, si provvede soltanto al
completamento e controllo del record prodotto, al controllo del formato e alla validazione
finale. Le TDE non sono inserite contestualmente nell’Opac di Ateneo. L’archivio non è al
momento integrato con il sistema di gestione dei dati amministrativi e con l’anagrafe iscritti e
neanche con l’ILS Aleph in dotazione delle biblioteche per la catalogazione semiautomatica
in UNIMARC.
60
<http://cameprints.unicam.it/>.
"Art. 13:5 (Conseguimento del titolo). L'Università archivierà e renderà consultabile in rete il testo completo
della tesi di dottorato attraverso l'archivio istituzionale ad accesso aperto dell’Ateneo, che ne garantirà la
conservazione e la pubblica consultabilità. All'atto della consegna il dottorando dovrà firmare una declaratoria
relativa alla pubblica accessibilità della tesi. Potrà essere concesso, su motivata richiesta del Dottorando, un
periodo, comunque non superiore ai 3 anni, in cui la tesi non sia consultabile da parte di terzi, ai fini della tutela
e sfruttamento economico delle opere dell’ingegno e/o delle proprietà industriali. Sarà cura dell'Università
effettuare il deposito a norma di legge presso le Biblioteche Nazionali di Roma e Firenze."
62
Per il prossimo futuro nell’ambito di un progetto di digitalizzazione di libri antichi in possesso delle
Biblioteche di Ateneo si sta studiando la possibilità di utilizzare CamEprints anche per ospitare questa tipologia
di materiale.
63
<http://roarmap.eprints.org/>.
61
29
La scelta del software è caduta su EPrints 64 per le sue caratteristiche di gratuità e
flessibilità. EPrints è stato sviluppato dalla University of Southampton ed è fra i più diffusi in
Italia e a livello internazionale. CamEprints sta utilizzando la release 3.1.
I formati di metadati supportati sono: oai_dc, uketd_dc, mpeg21-didl, mets,
context_object. Il sistema utilizza tutti i dodici campi Dublin Core richiesti dallo standard
nazionale, ma non ne ha sviluppati ulteriori a livello locale, che possano insistere soltanto
sull’archivio istituzionale e non essere utilizzati per l’esportazione verso i service provider.
Da parte degli amministratori del sistema è stato fatto uno sforzo notevole di dare, in modo
semplice, attraverso l’interfaccia web tutte le istruzioni su come utilizzare la funzione di autoarchiviazione, prevedendo tutte le possibili opzioni: caricamento in locale, da un sito web, file
singolo, file multipli.
6. Conclusioni
Le Linee guida CRUI rappresentano un traguardo molto importante. Hanno stabilito
uno standard, hanno dato norme di comportamento in un settore ancora tutto da esplorare
quale l’accesso aperto alla conoscenza e alla ricerca scientifica. Molto è ancora da fare, anche
nel settore delle TDE, soprattutto se si parla di disseminazione e conservazione nel lungo
periodo. Sullo scenario internazionale sembra che molti problemi riguardanti la visibilità di
questi materiali siano stati risolti grazie a progetti nazionali dedicati, con procedure standard e
pressoché completamente automatizzate, che a volte passano anche attraverso le biblioteche
nazionali, come in Gran Bretagna e in Germania. Quando si parla invece di conservazione,
l’impressione è che si tratti comunque di lavoro in corso di svolgimento sul quale non
esistono che risultati parziali.
Per quel che riguarda la situazione italiana, su fronte della disseminazione molto
lavoro di comunicazione e advocacy deve essere fatto per far in modo che anche l’altra metà
delle Università italiane riescano ad entrare nel circuito di harvesting per il deposito delle
TDE. Ci sono Atenei che non dispongono di archivi istituzionali. Ancora a settembre 2010,
trentuno Università italiane continuano a consegnare alle Biblioteche nazionali le tesi prodotte
nel proprio Ateneo su CDRom, tanto da indurre la Nazionale di Firenze ad investire del
problema il MIBAC e la CRUI per la difficoltà di trattamento catalografico e messa in
disponibilità che questa mole di materiale (18mila tesi in tre anni) comporta. Si auspica che
questa situazione difforme venga superata nel prossimo futuro e che tutte le Università
italiane vadano verso la raccolta delle TDE in archivi istituzionali in grado di esporre i dati
64
EPrints è un software gratuito e con il codice sorgente disponibile, è interamente basato su standard (XML,
HTML, CSS, SQL) e su strumenti open-source (Web server Apache, linguaggio Perl e database MySql); è ricco
di funzionalità; l’interfaccia grafica è personalizzabile e l’insieme dei metadati estensibile; è basato sull’autoarchiviazione, ma con la possibilità da parte dello staff-editoriale di intervenire sui metadati; gli utenti possono
consultare il contenuto avvalendosi delle funzioni di ricerca base e avanzata; possiede un sistema di alerting; è
predisposto per supportare il protocollo per l’harvesting dei metadati definito da OAI (Pasqui, 2003?).
30
verso le Biblioteche nazionali e che possa entrare a regime il riversamento dei metadati
nell’Indice SBN. Questi potrebbero essere i due punti fermi verso altri significativi passi
successivi, ovvero un archivio nazionale delle TDE in grado di dialogare per interoperabilità
sintattica e semantica, grazie a standard comuni, con partner a livello europeo e internazionale
e non lasciare alla volontà della singola istituzione la richiesta di vedere indicizzati i propri
archivi, anche se questa è sempre una strada percorribile 65 .
Tutto questo ha forti ripercussioni anche sul trattamento conservativo. In generale, si
può dire che nessun Ateneo ha previsto un piano di conservazione dei propri documenti
digitali, perché troppo oneroso. Non dimentichiamo che una tesi di dottorato è un documento
scientifico prodotto in seno ad una comunità e la rappresenta. Nello stesso tempo è un
documento amministrativo che va conservato con fini giuridici e in quanto documento
informatico, secondo la normativa vigente, va conservato secondo precise regole 66 . Solo
progetti cooperativi e condivisi possono essere validi in questo contesto, per una suddivisione
dei costi e per una condivisione delle procedure.
7. Bibliografia
Alemneh, D.G. (2011) “Assessing the Usage of Electronic Theses and Dissertations: An
Overview of ETD Statistics and Metrics in the UNT Libraries”. Proceedings of the 14th
International Symposium on Electronic Theses and Dissertations, Cape Town, South
Africa, 13-17 September 2011. UNT Digital Library.[Online]
http://digital.library.unt.edu/ark:/67531/metadc32969/.
Arabito, S. et al. (2008) “Le linee guida per l’accesso aperto alle tesi di dottorato”, AIDA
informazioni, 26, n. 3-4, pp. 73-89. [Online]
http://eprints.rclis.org/bitstream/10760/12459/1/arabito-etal342008.pdf.
Bailey, C.W. Jr. (2011) The Institutional Repository and ETD Bibliography. [Online]
http://digital-scholarship.org/iretd/iretd2011.htm.
Bertot, J.C. (2001) “Measuring service quality in the networked environment: approaches and
considerations”, Library trends, 49(4), p. 758-75, Infotrac [Online]
http://pdfserve.galegroup.com/pdfserve/get_item/1/S589960w4_1/SB432_01.pdf
Beazley, M.R. (2010) “Eprints Institutional Repository Software: A Review”, Partnership:
The Canadian Journal of Library and Information Practice and Research, 5(2).
[Online] http://journal.lib.uoguelph.ca/index.php/perj/article/viewArticle/1234.
Becker, C. et al. (2007) “Long-term Preservation of Electronic Theses and Dissertations: a
Case Study in Preservation Planning”, Proceedings of the 9th Russian Conference on
65
Ad es. ad oggi le istituzioni universitarie italiane che contribuiscono a Dart-Europe sono soltanto otto.
Il DPR 513/1997 recita: "Il documento informatico da chiunque formato, l’archiviazione su supporto
informatico e la trasmissione con strumenti telematici, sono validi e rilevanti a tutti gli effetti di legge se
conformi alle disposizioni del presente regolamento". Conservare un documento informatico significa mantenere
nel tempo la capacità di riprodurlo con il contenuto e la forma originaria.
66
31
Digital Libraries RCDL’2007, Pereslavl, Russia. [Online]
http://rcdl2007.pereslavl.ru/papers/paper_22_v2.pdf.
Bevan, S.J. & P. Needham (2009) “Statistics – can we count on them?”, ETD 2009. 12th
Symposium on Electronic Theses and Dissertations, University of Pittsburgh, June 1013, 2009. [Online] http://conferences.library.pitt.edu/ocs/viewpaper.php?id=713&cf=7.
Bergamin, G. (2008) “Il deposito per il lungo periodo delle tesi di dottorato in formato
digitale: molti problemi si possono risolvere”, in Cristalli di esperienza: Nuove
prospettive e scenari per le tesi di dottorato: conservazione, accessibilità, certificazione,
formati, integrazione con Open Access, Convegno CNBA, Torino, 23 maggio 2008, p.
21-25.
Bergamin, G. & M. Messina (2010) “Magazzini digitali: dal prototipo al servizio”, Digitalia,
(5)2, pp. 144-153. [Online]
http://www.bncf.firenze.sbn.it/documenti/MagazziniDigitali_Digitalia_2010.pdf.
Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities, 22 ottobre
2003. [Online] http://oa.mpg.de/berlin-prozess/berliner-erklarung/.
Bollini, A. & N. De Paoli (2010) Harvesting delle tesi di dottorato delle Biblioteche
Nazionali tramite Dspace. Milano, Cilea, 14 settembre. [Online]
http://www.aepic.it/docs/dspace/DocumentazioneHarvestingBNCF.pdf.
Boock, M. & S. Kunda (2009) "Electronic Thesis and Dissertation Metadata Workflow at
Oregon State University Libraries" Cataloging & Classification Quarterly, (47)3/4, pp.
297-308. [Online] http://ir.library.oregonstate.edu/jspui/handle/1957/11396.
Brown, J. & K. Sadler (2010) Vision, Impact, Success: Mandating Electronic Theses. Case
Studies of E-theses Mandates in Practice in the UK Higher Education Sector. London:
University College London. [Online] http://eprints.ucl.ac.uk/116947/.
Brown, J. (2010) Literature Review of Research into Attitudes towards Electronic Theses and
Dissertations (ETDs). UCL Eprints. [Online] http://eprints.ucl.ac.uk/20424/.
Budapest Open Access Initiative (2002). [Online] http://www.soros.org/openaccess/read.
Calvi, L. & Geudens, A. (2008) Expert evaluation of an institutional repository. In: Third
International Conference on Open Repositories 2008, 1-4 April 2008, Southampton,
United Kingdom. [Online] http://pubs.or08.ecs.soton.ac.uk/47/
Casilio, G. (2006) “Gli open archives delle università italiane”, Bibliotime, 9(3). [Online]
http://didattica.spbo.unibo.it/bibliotime/num-ix-3/casilio.htm.
Cassella, M. (2006) “Statistiche d’uso delle risorse elettroniche remote”, Biblioteche oggi, 1,
pp. 48-61.
Cassella, M. (2008) “I depositi istituzionali tra politiche mandatarie e strategie a sostegno
dell’auto-archiviazione”, AIDA informazioni, 26(3-4), pp. 13-28.
32
Copeland, S., A. Penman, & R. Milne (2005), “Electronic theses: the turning point”,
Program: electronic library and information systems, 39(3), pp. 185-197. [Online]
https://openair.rgu.ac.uk/handle/10059/40.
Crow, R. (2002) The Case for Institutional Repositories: A SPARC Position Paper,
Washington: SPARC. [Online] http://scholarship.utm.edu/20/1/SPARC_102.pdf.
Crow, R. (2004) A Guide to Institutional Repository Software. 2nd ed. New York: Open
Society Institute. [Online]
http://www.soros.org/openaccess/pdf/OSI_Guide_to_Institutional_Repository_Softwar
e_v2.pdf.
CRUI. Conferenza dei rettori delle Università italiane, Tesi di dottorato di ricerca: deposito
legale via harvesting automatico e riversamento dei dati nell’Indice SBN. [Online]
http://www.crui.it/HomePage.aspx?ref=1891#.
CRUI. Conferenza dei rettori delle Università italiane, (2007) Linee guida per il deposito
delle tesi di dottorato negli archivi aperti. [Online]
http://www.crui.it/homepage.aspx?ref=1149.
CRUI. Gruppo OA, Tesi di dottorato e diritto d’autore. Indicazioni per l’applicazione delle
Linee guida per l’accesso aperto alle tesi di dottorato. [Online]
http://www.crui.it/HomePage.aspx?ref=1891#.
CRUI. Gruppo OA (2009) Linee guida per gli archivi istituzionali. [Online]
http://www.crui.it/HomePage.aspx?ref=1781#.
Day, M. (1999) “Dublin Core to UNIMARC: Mapping Dublin Core to UNIMARC”, UKOLN.
[Online] http://www.ukoln.ac.uk/metadata/interoperability/dc_unimarc.html.
De Robbio, A. & P. Galimberti (2011) Dottorandi e diritti: linee guida sulle tesi di dottorato
ad accesso aperto. [Online]
http://paduaresearch.cab.unipd.it/dottorato/dottorandi_e_diritti.pdf.
Dichiarazione di Messina, (2004) Gli atenei italiani per l'Open Access: verso l'accesso aperto
alla letteratura di ricerca. Documento italiano a sostegno della Dichiarazione di
Berlino sull’accesso aperto alla letteratura accademica, Messina, 4 novembre 2004.
[Online] http://www.aepic.it/conf/Messina041/viewpaper5af5.pdf?id=49&cf=1
Dolan, M. (2011) “Assessing Awareness of Repositories and the Open Access Movement
Among ETD Faculty Advisors”, International Symposium on Electronic Theses and
Dissertations, Cape Town, South Africa, 13-17 September 2011. [Online]
http://dl.cs.uct.ac.za/conferences/etd2011/papers/etd2011_dolan.pdf
Dublin Core Metadata Element Set, ver. 1.1. [Online] http://dublincore.org/documents/dces/.
Edminster, J. & J. Moxley (2002) “Graduate Education and the Evolving Genre of Electronic
Theses and Dissertations”, Computers and Composition, 19, pp. 89-104. [Online]
http://scholar.lib.vt.edu/presentations/ETDgenreALL.pdf.
D.M. 30 aprile 1999, n. 224 (Regolamento in materia di dottorato di ricerca).
33
D.M. 22 ottobre 2004, n. 270 (Modifiche al regolamento recante norme concernenti
l'autonomia didattica degli atenei).
Dublin Core Metadata Element Set, Version 1.1 (2010). [Online]
http://dublincore.org/documents/dces/.
Dublin Core Metadata Initiative. [Online] http://dublincore.org/.
ETD Guide. The Guide for Electronic Theses and Dissertations. [Online]
http://en.wikibooks.org/wiki/ETD_Guide. [Ultima modifica: 19 agosto 2010].
ETD-MS: an Interoperability Metadata Standard for Electronic Theses and Dissertations
Ver. 1.00, rev. 2. [Online] http://www.ndltd.org/standards/metadata/etd-ms-v1.00rev2.html. [Ultima modifica: 25 giugno 2008].
EUA Working Group on Open Access (2008) Recommendations adopted by the EUA Council
on 26th of March 2008 (University of Barcelona, Spain). [Online]
http://www.eua.be/eua-work-and-policy-area/research-and-innovation/OpenAccess.aspx.
Fay, E. (2010) “Repository Software Comparison: Building Digital Library Infrastructure at
LSE”, Ariadne, 64. [Online] http://www.ariadne.ac.uk/issue64/fay/.
Feliciati, P. (2009) “Gestione e conservazione di dati e metadati: quali standard?”, Conservare
il digitale, Macerata, 7-8 maggio 2009. [Online]
http://www.task.sinp.net/convegni/070509/materiale/Feliciati_rela01.pdf.
Fyffe, R. & W.C. Welburn (2008) “ETDs, scholarly communication, and campus
collaboration”, C&RL News, March, pp. 152-155.
Galimberti, P. (2008) “Le Linee guida per l'accesso aperto alle tesi di dottorato”, in Cristalli
di esperienza: Nuove prospettive e scenari per le tesi di dottorato: conservazione,
accessibilità, certificazione, formati, integrazione con Open Access, Convegno CNBA,
Torino, 23 maggio 2008. [Online]
http://eprints.rclis.org/bitstream/10760/11722/1/relazione_Torino_23052008.pdf .
Greenberg, C. & C.A. McLean (2011) “Where Sharing Should Not Go: An Environmental
Scan of Originality Assurance Awareness and Efforts to Discourage or Prevent
Plagiarism”, International Symposium on Electronic Theses and Dissertations, Cape
Town, South Africa, 13-17 September 2011. [Online]
http://dl.cs.uct.ac.za/conferences/etd2011/papers/etd2011_greenberg.pdf
Guerrini, M. (2010) Gli archivi istituzionali. Milano: Editrice bibliografica.
Guy, M., A. Powell, & M. Day (2004) “Improving the Quality of Metadata in Eprint
Archives”, Ariadne, no. 38. [Online] http://www.ariadne.ac.uk/issue38/guy/.
Harnad, S. (1995) “A Subversive Proposal”. In: Ann Okerson & James O'Donnell (Eds.)
Scholarly Journals at the Crossroads; A Subversive Proposal for Electronic Publishing.
Washington, DC., Association of Research Libraries, June 1995. [Online]
http://www.ecs.soton.ac.uk/~harnad/subvert.html.
34
Harnad, S. (2009) “Integrating Universities' Thesis and Research Deposit Mandates”, ECS
EPrints Repository. [Online] http://eprints.ecs.soton.ac.uk/18032/.
Harnad, S. & N. McGovern (2009) "Topic 4: Institutional Repository Success Is Dependent
upon Mandates”, Bulletin of the American Society for Information Science and
Technology, 35(4), 27-31. [Online] http://www.asis.org/Bulletin/Apr09/AprMay09_Harnad-McGovern.pdf.
ICCU. Istituto Centrale per il Catalogo Unico, Mapping Dublin Core / UNIMARC. [Online]
http://www.iccu.sbn.it/opencms/opencms/en/main/standard/metadati/pagina_118.html.[
Ultima modifica: 28 aprile 2011].
ICT4University. Tavolo tecnico Università digitale (2011) Tesi di laurea, tesi di dottorato e
dissertazioni elettroniche. Linee guida per la digitalizzazione e conservazione
archivistica a norma. Linee guida in elaborazione [Online]
http://www.ict4university.gov.it/media/59653/lineeguidadissertazionielettroniche.pdf
Jackson, A.S. et al. (2008) “Dublin Core Metadata Harvested through OAI-PMH”, Journal of
Library Metadata, 8(1). [Online] http://www.ideals.illinois.edu/handle/2142/9091.
Johnson, R.K. (2002) “Institutional repositories. Partnering with Faculty to Enhance Scholarly
Communication”, D-Lib Magazine, November, 8(11). [Online]
http://www.dlib.org/dlib/november02/johnson/11johnson.html.
Kim, J. (2005) “Finding Documents in a Digital Institutional Repository: DSpace and
Eprints”, 68th Annual Meeting of the American Society for Information Science and
Technology (ASIST), Charlotte (US), 2 8 October - 2 November 2005. [Online]
http://hdl.handle.net/10760/6964.
Lagoze, C. & H. Van de Sompel (2008) The Open Archives Initiative Protocol for Metadata
Harvesting, Protocol Version 2.0, 2002. Document Version 2008. Open Archives
Initiative. [Online] http://www.openarchives.org/OAI/openarchivesprotocol.htm.
L. 341/1990 (Riforma degli ordinamenti didattici universitari).
L. 210/1998 (Norme per il reclutamento dei ricercatori e dei professori universitari di ruolo).
L. 240/2010, art. 19 (Disposizioni in materia di dottorato di ricerca).
L. 633/1941(Protezione del diritto d'autore e di altri diritti connessi al suo esercizio).
Lynch, C.A. (2003) “Institutional Repositories: Essential Infrastructure for Scholarship in the
Digital Age”, ARL: A Bimonthly Report, no. 226, pp. 1-7. [Online]
http://scholarship.utm.edu/21/1/Lynch,_IRs.pdf.
Lynch, C.A. (2001) “Metadata Harvesting and the Open Archives Initiative”, ARL: A
Bimonthly Report, no. 217 (August 2001). [Online]
http://www.arl.org/resources/pubs/br/br217/br217mhp.shtml.
Lubas, R.L. (2009) “Defining best practices in electronic thesis and dissertation metadata”,
Journal of library metadata, 9(3), pp. 252-263. [Online]
http://repository.unm.edu/handle/1928/12350.
35
McMillan, G. (2001) “Do ETDs Deter Publishers? Coverage from the 4th International
Symposium on ETDs”, College and Research Libraries News, 62(6), pp. 620-621.
McMillan, G. et al. (2011) “An investigation of ETDs as prior publications. Findings from the
2011 NDLTD Publishers’ Survey”, presented at International Symposium on Electronic
Theses and Dissertations, Cape Town, South Africa, 13-17 September 2011, in
University Library Faculty Publications. Paper 53. [Online]
http://digitalarchive.gsu.edu/univ_lib_facpub/53.
Magazzini Digitali. Servizio nazionale coordinato di conservazione e di accesso a lungo
termine per le risorse digitali, http://www.depositolegale.it/.
MIBAC. Circolare sul deposito legale delle tesi di dottorato, 29 settembre 2010.
MIUR. Circolare n. 1746 del 20 luglio 2007.
Moxley, J.M. (2001) “American Universities Should Require Electronic Theses and
Dissertations”, Educause Quarterly, 3, pp. 61-63.
NDLTD. Networked Digital Library of Theses and Dissertations. [Online]
http://www.ndltd.org/.
NISO (2004) Understanding metadata. Bethesda: NISO. [Online]
http://www.niso.org/publications/press/UnderstandingMetadata.pdf.
OA CRUI. Tesi di dottorato e diritto d’autore. Indicazioni per l’applicazione delle Linee
guida per l’accesso aperto alle tesi di dottorato. [Online]
http://www.openstarts.units.it/AddendaLineeGuidaTesi.pdf.
Open Archives Initiative. [Online] http://www.openarchives.org/.
Open Archives Forum. [Online] http://www.oaforum.org.
Open Archives Forum (2003) Inventory of Open Archive Software Tools. [Online]
http://www.oaforum.org/resources/tvtools.php.
OpenDOAR. Directory of Open Access Repositories. [Online] http://www.opendoar.org/.
Open Society Institute (2004) A Guide to Institutional Repository Software. 3rd ed. New York:
Open Society Institute. [Online]
http://www.soros.org/openaccess/pdf/OSI_Guide_to_IR_Software_v3.pdf.
Palombo, M. & E. Garbarino (2006) Ricerca sociale: metodo e tecniche. Milano: Angeli.
Pasqui, V. (2003?) Archivi e-prints & Open Archives Initiative [Online]
http://eprints.unifi.it/archive/00000462/01/1_multipart_xF8FF_2_Relazione_ValdoPasqui.pdf.
Patton, M.Q. (1990) Qualitative evaluation and research methods. 2nd edn. Newbury Park,
CA: Sage.
36
Pigliapoco S. & S. Allegrezza (2008) Produzione e conservazione del documento digitale.
Requisiti e standard per i formati elettronici, vol. 1 (a cura di S. Pigliapoco), Macerata:
EUM.
Pleiadi. Portale per la letteratura scientifica elettronica italiana su archivi aperti e depositi istituzionali.
[Online] http://www.openarchives.it/pleiadi/.
Polfreman, M. & S. Rajbhandari (2009) MetaTools. Investigating Metadata Generation
Tools: Final Report. London: JISC. [Online]
http://www.jisc.ac.uk/publications/documents/metatools.aspx.
Poll, R. (2001) “Performance Indicators for the Digital Library”, Liber Quarterly, 11, pp.
244-258. [Online] http://liber.library.uu.nl/publish/articles/000423/article.pdf.
Progetto Minerva (2007) Linee guida tecniche per i programmi di creazione di contenuti
culturali digitali. Edizione italiana 2.0. [Online]
http://www.minervaeurope.org/publications/lineeguidatecnicheita/metadati.html.
Reeves, S. (2010) How to Set Up an ETD Submission Program. [Online]
http://www.ndltd.org/resources/how-to-set-up-an-etd-submission-program.
[Ultima modifica: 4 giugno 2010]
Suber, P. (2004) Open access overview. Focusing on open access to peer reviewed research
articles an their preprints. http://www.earlham.edu/~peters/fos/overview.htm [Ultima
modifica: 6 novembre 2010].
UK ETD Metadata Core Set. [Online]
http://www2.rgu.ac.uk/library/guidelines/metadata.html.
UKOLN, (2002) Mapping between metadata formats. [Online]
http://www.ukoln.ac.uk/metadata/interoperability/. [Ultima modifica: 22 maggio 2002].
Unimarc Committee, (2004) UNIMARC/Dublin Core Mapping. Version 1.0. [online]
http://www.unimarc.net/dubin-core-map.html.
Vignocchi, M.L. (2007) “Un futuro migliore per le tesi di dottorato”, Bibliotime, 10(2).
[Online] http://didattica.spbo.unibo.it/bibliotime/num-x-2/vignocch.htm
Vignocchi, M.L., Bergamin, G., Messuti, R. (2010) “Tesi di dottorato: stato dell’arte,
iniziative in corso, scenari possibili”, Bibliotime, 13(3). [Online]
http://spbo.unibo.it/bibliotime/num-xiii-3/vignocchi.htm
Weenink, K., L. Waaijers & K. van Godtsenhoven (2008) A DRIVER’s Guide to European
Repositories, Amsterdam: Amsterdam University Press.
Wikipedia, Open access [voce]. [Online] http://it.wikipedia.org/wiki/Open_access.
37