Tesi di dottorato: buone pratiche di archiviazione - eCUM
Transcript
Tesi di dottorato: buone pratiche di archiviazione - eCUM
UNIVERSITA' DEGLI STUDI DI MACERATA Facoltà di Lettere e Filosofia Facoltà di Economia Facoltà di Beni Culturali Master in "Formazione, gestione e conservazione di archivi digitali in ambito pubblico e privato" IVª edizione Anno Accademico 2010-11 Tesi di dottorato Buone pratiche di archiviazione digitale Corsista : Clementina Fraticelli Relatore: Chiar.mo prof. Giovanni Bergamin “Open Access literature is digital, online, free of charge, and mostly free of copyright and licensing restrictions.” Peter Suber, 2004 Indice 1. 1.1 1.2 1.3 2. 3. 3.1 3.2 3.3 4. 4.1 4.2 4.3 4.4 4.5 5. 5.1 5.2 Introduzione Che cosa sono le tesi di dottorato elettroniche Perché archiviare elettronicamente le tesi di dottorato: obiettivi e vantaggi Il ruolo degli archivi istituzionali ad accesso aperto Scopo e obiettivi dello studio Il ruolo delle università e dei portatori di interesse coinvolti Sviluppo di un programma di archiviazione elettronica delle tesi di dottorato Questioni da affrontare e soluzioni possibili Valutazione e misurazione Infrastruttura tecnologica Accesso aperto: OAI e la ricerca federata Requisiti tecnici per la produzione e la disseminazione delle tesi di dottorato elettroniche Modelli di metadati Catalogazione: rimodulazione dei flussi di lavoro La conservazione nel lungo periodo Archiviazione delle tesi di dottorato elettroniche: lo scenario italiano Le Linee guida CRUI: una policy comune per gli Atenei italiani Deposito legale via harvesting automatico e riversamento dei dati nell’Indice SBN 5.3 Uno standard nazionale per la raccolta e l’esposizione dei dati 5.4 CamEprints: l’archivio istituzionale delle tesi di dottorato presso l’Università di Camerino 6. Conclusioni 7. Bibliografia 2 2 3 5 6 7 7 9 11 13 13 15 17 20 22 24 24 26 27 29 30 31 1 1. Introduzione 1.1 Che cosa sono le tesi di dottorato elettroniche Il Dottorato di Ricerca in Italia è un titolo accademico post lauream, corrispondente al terzo ciclo dell'istruzione universitaria in molti paesi del mondo, come dettato dal Processo di Bologna 1 . È stato introdotto nel sistema universitario italiano nel 1980 (L. 21 febbraio 1980, n. 28, D.P.R. 11 luglio 1980, n. 382) 2 , e rappresenta il più alto grado di istruzione universitaria nel nostro paese: “I corsi per il conseguimento del dottorato di ricerca forniscono le competenze necessarie per esercitare, presso università, enti pubblici o soggetti privati, attività di ricerca di alta qualificazione” 3 . Il titolo di dottore di ricerca si consegue al termine di un ciclo di studi della durata di tre anni e si chiude con la stesura e la presentazione di un elaborato scritto: la tesi di dottorato, tradizionalmente formattato e rilegato in forma di libro. La tesi di dottorato ha una duplice natura. E’ un documento amministrativo 4 con valore certificativo del regolare percorso di studi, pertanto di interesse archivistico, ma anche un documento bibliografico attestante l’attività scientifica svolta dal dottore di ricerca, quindi, non solo pubblicamente accessibile 5 , ma anche destinato alla conservazione nel lungo periodo. Una tesi di dottorato è opera dell’ingegno la cui validità scientifica non può essere messa in discussione (Arabito, S. et al., 2008). Lo stato di validazione di questi documenti è simile ad un preprint, in quanto non passa attraverso il peer-reviewing, ma il lavoro di supervisione del docente di riferimento è certamente molto intenso, accurato e protratto nel tempo, così l’autorevolezza della commissione giudicatrice esterna, che valuterà l’attività di ricerca risultante dall’elaborato, non può essere sottostimata. Purtroppo, fino ad ora le tesi di dottorato non hanno trovato un giusto canale di diffusione in Italia, dove, al contrario di altri paesi europei, l’elaborazione e la discussione del lavoro non sfocia automaticamente nella pubblicazione presso un editore, pur restando valido 1 “Il Processo di Bologna è un processo di riforma del sistema di istruzione superiore a carattere internazionale. Costituito nel 1999 presso l'Università di Bologna, si prefigge di realizzare uno Spazio Europeo dell'Istruzione Superiore (SEIS). Il Processo di Bologna non è vincolante per i Governi dei Paesi che vi aderiscono. Ogni Stato, infatti, decide di volta in volta se e quale procedimento adottare. Le politiche di indirizzo del Processo di Bologna sono volte esclusivamente ad un obiettivo comune e definito”. […] L'obiettivo perseguito è che nel 2010 i sistemi di istruzione superiore dei paesi partecipanti e le singole istituzioni siano organizzati in maniera tale da garantire: la trasparenza e leggibilità dei percorsi formativi e dei titoli di studio; la possibilità concreta per studenti e laureati di proseguire agevolmente gli studi o trovare un'occupazione in un altro paese europeo; una maggiore capacità di attrazione dell'istruzione superiore europea nei confronti di cittadini di paesi extra-europei; l'offerta di un'ampia base di conoscenze di alta qualità per assicurare lo sviluppo economico e sociale dell'Europa. <http://www.bolognaprocess.it/>. 2 Riferimenti normativi: i corsi di dottorato di ricerca sono disciplinati in Italia dalle seguenti normative: L. 341/1990; L. 210/1998, art. 4 (Dottorato di ricerca); Decreto MURST 30/4/99 n. 224; L. 240/2010, art. 19, (Disposizioni in materia di dottorato di ricerca). 3 L. 210/1998, art. 4, comma 1. 4 Le tesi di dottorato costituiscono per i soggetti produttori (le Università) documenti giuridicamente rilevanti in quanto “contenuti di atti e fatti prodotti nell’esercizio dell’attività amministrativa” (DPR 445/2000, art. 1). Nei processi di informatizzazione e conservazione digitale sono sottoposti alle disposizioni dello stesso decreto sul documento amministrativo, al Codice dell’amministrazione digitale e successiva regolamentazione tecnica. 5 Opportunità ribadita dalla Dichiarazione di Berlino, ovvero Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities del 22 ottobre 2003, <http://oa.mpg.de/berlin-prozess/berliner-erklarung/>. 2 il deposito obbligatorio presso le Biblioteche nazionali centrali di Firenze e Roma (D.M. 30 aprile 1999, n. 224, art. 6, comma 11), dove la consultazione è pubblica, ma soggetta ad alcune limitazioni. Lasciando inalterati gli scopi ed i contenuti dei documenti, l’esplosione delle tecnologie informatiche ha reso semplice la produzione in formato elettronico delle tesi di dottorato, interattiva la loro consultazione, più veloce la loro diffusione e riproduzione. Pertanto, la tesi di dottorato elettronica 6 è un documento (o un set di documenti) elettronici, facilmente producibile con un comune software di scrittura o, solitamente, nel formato .pdf, oppure con un software più sofisticato in grado di gestire diagrammi, immagini, fogli di lavoro, forme interattive come animazioni e la multimedialità di suoni e video e in formati come html o xml. Non a caso si parla di TDE come un nuovo genere di documenti (Edminster & Moxley, 2002; ETD Guide, 2010), la cui complessità può andare dal semplice elaborato elettronico, molto simile nella resa visiva all’elaborato cartaceo a documenti più complessi come gli ipertesti. La disseminazione e la conservazione nel tempo, in questo caso, può risultare più complessa e richiedere un’organizzazione del documento “a più strati”. Ad es., ad un livello più profondo trovare il testo scritto (stampabile) e come corollario, appendici con contenuti multimediali, files supplementari con dati, collegamenti dinamici, programmi, ambienti virtuali, simulazioni che possono costituire utili forme di scambio di contenuti tra ricercatori, anche se difficili da migrare nel tempo. Le TDE costituiscono un nuovo genere di documento in continua evoluzione, di pari passo con il trasformarsi delle tecnologie e delle conoscenze di studenti e ricercatori. 1.2 Perché archiviare elettronicamente le tesi di dottorato: obiettivi e vantaggi Se lo scopo di una istituzione universitaria è quello di promuovere lo sviluppo della ricerca e della cultura, attraverso l’alta formazione e l’apprendimento permanente, tra i suoi obiettivi insiste certamente quello di favorire nei suoi studenti l’apprendimento attraverso il fare e di facilitare l’attività di ricerca attraverso le tecnologie disponibili al fine di migliorare la comunicazione scientifica e la propria reputazione accademica. Le tesi di dottorato, oltre ad essere un adempimento curricolare e amministrativo obbligatorio, costituiscono il risultato dell’attività intellettuale di uno studente e la qualità stessa di una università si riflette nella qualità di questi prodotti. E’ importante che essi non restino confinati sugli scaffali di una biblioteca, ma che possano circolare liberamente nella comunità scientifica, che risultino visibili e facilmente accessibili. Il progetto di implementare un archivio elettronico istituzionale delle tesi di dottorato e renderlo parte di un progetto più ampio di biblioteca digitale rappresenta un salto di qualità sia per gli autori sia per le istituzioni che li sostengono (Fyffe & Welburn, 2008). A fronte delle scelte di governance di un ateneo, dello sforzo congiunto e del lavoro cooperativo di studenti, professori, tutor, bibliotecari e informatici, i benefici raggiungili 6 Da questo momento in poi TDE. 3 attraverso un progetto TDE sono molteplici e si sommano con le funzioni degli archivi digitali istituzionali che li ospitano 7 : - migliora l’accesso al mondo della ricerca accademica e del lavoro; - garantendo l’accesso libero al proprio lavoro, lo studente lo pubblicizza e può diffonderlo più facilmente; - si migliorano le possibilità di essere citati da altri ricercatori; - si accresce la reputazione dell’autore nel mondo accademico, ma anche della propria istituzione; - si evitano inutili duplicazioni nella scelta dei settori di ricerca e di investigazione; - si hanno a disposizione velocemente, e nella maggior parte dei casi gratuitamente, gli studi di altri colleghi da ogni parte del mondo; - migliora la collaborazione tra studiosi e si dà visibilità al proprio lavoro; - si rimodellano i processi di lavoro nel senso del risparmio di tempo, non solo per gli autori che vedono ridursi i tempi di presentazione, discussione e pubblicità della propria tesi attraverso l’archivio digitale istituzionale e i collettori di servizi a livello nazionale e internazionale 8 , ma anche di chi si occupa di registrazione, catalogazione ed esposizione - di questi documenti; si abbattono i costi di preparazione e di pubblicazione del proprio lavoro; si acquisiscono nuove abilità tecniche di elaborazione che risulteranno utili per futuri lavori di ricerca o professionali; ci si prepara a diventare lavoratori della conoscenza e ad entrare nel processo della comunicazione scientifica accademica; si migliora l’accesso globale alla ricerca universitaria; le università sviluppano servizi e infrastrutture digitali, mentre gli studenti apprendono come contribuire ed usare le biblioteche digitali (ETD Guide, 2010). 7 “Digital repositories have a number of functions or foci: to open up and offer the outputs of the institution or community to the world; to impact on and influence developments by maximising the visibility of outputs and providing the greatest possible chance of enhanced impact as a result; to showcase and sell the institution to interested constituencies – prospective staff, prospective students and other stakeholders; to collect and curate digital outputs (or inputs, in the case of special collections); to manage and measure research and teaching activities; to provide and promote a workspace for work-in-progress, and for collaborative or large-scale projects; to facilitate and further the development and sharing of digital teaching materials and aids; to support and sustain student endeavours, including providing access to theses and dissertations and providing a location for the development of e-portfolios.” (Weenink,Waaijers & van Godtsenhoven, 2008, p. 15). 8 Si pensi al ruolo svolto in questo senso da servizi come NDLTD. Networked Digital Library of Theses and Dissertations <http://www.ndltd.org/>, DART-Europe <http://www.dart-europe.eu/basic-search.php>, EthOS <http://www.ethos.ac.uk/>, o servizi più generalisti come OAIster <http://www.oclc.org/oaister/>, ROAR. Registry of Open Access Repositories <http://roar.eprints.org/>, OpenDOAR. Directory of Open Access Repositories <http://www.opendoar.org/>, oppure in Italia, PLEIADI. Portale per la letteratura scientifica elettronica italiana su archivi aperti e depositi istituzionali <http://www.openarchives.it/pleiadi/>, solo per citarne alcuni. 4 1.3 Il ruolo degli archivi istituzionali ad accesso aperto E’ nel 2002 che si comincia a parlare in modo concreto di depositi o archivi istituzionali, perché la tecnologia è ormai matura e accessibile, anche se già nel decennio precedente si fa strada ciò che Stevan Harnad (1995) chiama “proposta sovversiva”, ovvero l’idea di condividere le proprie ricerche tramite l’auto-archiviazione di documenti e contributi in Internet, in modo da rendere più efficace la loro diffusione. Nel vasto panorama della tecnologia a disposizione dei sistemi di biblioteche digitali, gli archivi istituzionali si pongono come strumenti rivoluzionari e innovativi per l’impatto che, sin dal loro apparire, si riconobbe potessero avere sull’attività di ricerca scientifica e sulla condivisione e comunicazione accademica (Lynch, 2003). Non a caso quelli sono gli anni in cui i due più diffusi software open source per la gestione dei depositi istituzionali vengono rilasciati: Dspace 9 del Massachusetts Institute of Technology e Eprints 10 della University of Southampton. Un archivio istituzionale è innanzitutto un servizio alla comunità scientifica, uno strumento di supporto al deposito, disseminazione, archiviazione e conservazione nel tempo della ricerca prodotta in formato digitale (Cassella, 2008). Crow (2002) ritiene che l’archivio istituzionale sia una collezione digitale che raccoglie e conserva la produzione scientifica di una singola università o di una più ampia comunità accademica (multi-university community) con l’obiettivo di accrescerne la qualità e la visibilità, contribuendo al prestigio e allo sviluppo di quella comunità. Lynch (2003, p. 2-3) ne collega la definizione all’idea di servizio per una comunità universitaria, quindi all’organizzazione, conservazione e diffusione delle risorse digitali prodotte da quella comunità, “… a university-based institutional repository is a set of services that a university offers to the members of its community for the management and dissemination of digital materials created by the institution and its community members”. intendendo per “digital materials” tutta l’opera intellettuale di docenti e studenti, documentazione delle attività, degli eventi, insomma un archivio, non una biblioteca, in grado di fotografare e registrare la vita di una data comunità. Grazie al servizio svolto dall’archivi istituzionali, la comunità scientifica, in senso lato, può riconquistare il controllo sulla diffusione e conservazione della propria attività di ricerca e speculativa ad ampio raggio, sganciarsi da logiche commerciali e perseguire lo scopo della condivisione delle idee e della conoscenza attraverso la loro libera circolazione 11 , in particolare per tutto quanto attiene a quel materiale solitamente ignorato dagli editori tradizionali e che può trovare nell’archivio istituzionale il giusto luogo di disseminazione. 9 <http://www.dspace.org/>. <http://www.eprints.org/>. 11 Si veda il sito Open Archives Initiative <http://www.openarchives.org/>; la voce Open access in Wikipedia <http://it.wikipedia.org/wiki/Open_access>; Suber, P. (2004) Open access overview. Focusing on open access to peer reviewed research articles an their preprints. <http://www.earlham.edu/~peters/fos/overview.htm> [ultima modifica: 6 novembre 2010]. 10 5 Da un punto di vista tecnico, i software a disposizione hanno permesso lo sviluppo di modelli di archivi accentrati come arXiv12 o distribuiti come RePEc 13 , definiti anche da un punto di vista organizzativo archivi disciplinari. Un archivio disciplinare (accentrato o distribuito) rappresenta una comunità scientifica a livello internazionale. Gli archivi istituzionali, invece, rappresentano una comunità più piccola, contenuti eterogenei, ma sottendono una consapevolezza forte degli obblighi di deposito, del controllo dei diritti, della valutazione dei prodotti della ricerca. Per queste caratteristiche essi rappresentano lo strumento e il servizio più efficace per la raccolta e l’esposizione delle TDE. I contenuti di un archivio istituzionale sono istituzionalmente definiti, accademici, cumulativi e a lungo termine, aperti ed interoperabili (Crow, 2002). Una definizione onnicomprensiva di archivio istituzionale, che sembra raccogliere le esperienze e le soluzioni di varie realtà, è quella proposta da Guerrini (2010), “L’archivio istituzionale è una collezione di risorse digitali full-text realizzata e gestita da una o più università (o da altri istituti) che contiene i risultati di ricerche originali […] prodotte nell’ambito dell’attività istituzionale da docenti, ricercatori, dottori di ricerca e altri soggetti. La raccolta è liberamente accessibile in rete dalla comunità degli studiosi e dei lettori e viene costituita tramite la volontaria autoarchiviazione (o autorizzazione al deposito) da parte dell’autore o tramite regolamenti che prevedono l’obbligo di deposito. […] L’IR è realizzato secondo standard definiti nell’ambito dell’Open Archive Initiative (OAI) e comprende diverse tipologie di risorse, talora organizzate in un’unica sequenza nel medesimo archivio, talora in sequenze o liste distinte.” Infatti, nelle “diverse tipologie di risorse” naturalmente rientrano le TDE, che, finalmente hanno trovato negli archivi istituzionali lo strumento adatto per uscire dalla zona d’ombra in cui erano tradizionalmente relegate, perché poco visibili e spesso addirittura confuse con la letteratura grigia (Galimberti, 2008). 2. Scopo e obiettivi dello studio Questo studio, pur nella brevità della trattazione, nasce dall’esigenza di investigare la situazione presente della gestione, diffusione e conservazione delle TDE in Italia, attraverso un’analisi della natura di questo nuovo genere di documenti, la diffusione del movimento internazionale di idee sulla libera circolazione della conoscenza e della ricerca accademica, meglio noto come Open Access, l’influenza dell’attività della Open Archives Initiative a favore dell’interoperabilità degli standard, la gestione dei protocolli e la disseminazione dei contenuti digitali, il recepimento di dichiarazioni internazionali sull’accesso aperto alla 12 Storico archivio disciplinare per la fisica e scienze affini arXiv è stato sviluppato da Paul Ginsparg nel 1991 come un archivio di preprint, ed oggi contenente più di 600 mila articoli e basato su un unico grande server, <http://arxiv.org/>. 13 Archivio disciplinare per l’economia, RePEc nasce nel 1997 dallo sforzo collaborativo di volontari sparsi in circa 60 paesi del mondo. Contiene working paper, articoli, preprint ecc., <http://repec.org/>. 6 conoscenza e le iniziative nazionali a supporto dell’attività di raccolta, deposito, conservazione ed esposizione da parte degli Atenei italiani delle TDE. Lo scopo di questo studio è: - raccogliere buone pratiche di archiviazione digitale delle TDE. Al fine di perseguire questo scopo, lo studio intende raggiungere i seguenti obiettivi: - analizzare brevemente la letteratura nazionale ed internazionale sull’argomento; - capire i ruoli degli attori coinvolti in un programma di archiviazione di TDE; - evidenziare i requisiti tecnici indispensabili di un archivio istituzionale di TDE; - fare una verifica della situazione italiana. 3. Il ruolo delle università e dei portatori di interesse coinvolti 3.1 Sviluppo di un programma di archiviazione elettronica delle tesi di dottorato Sono già stati individuati ed elencati molti benefici per gli studenti che producono la propria tesi di dottorato in formato elettronico. Altrettanti sono per le Università i benefici derivanti dallo sviluppo di un programma di archiviazione elettronica delle tesi di dottorato, soprattutto nei casi in cui, come in Italia, è previsto il deposito legale presso le Biblioteche nazionali e la pubblicità degli elaborati. Infatti, una larga diffusione di tesi di dottorato di buona qualità prodotte all’interno di un’università rafforzano e danno lustro al corso di studi, che può essere valutato in base al numero di TDE accessibili, prestigio alla facoltà, all’università stessa. La loro pubblicazione elettronica contribuisce a rendere noti i risultati di questi lavori a livello nazionale e internazionale, a mettere in contatto gruppi di ricerca da ogni parte del mondo, a far conoscere i corsi di studio. Secondo il principio del “learning by doing” le università sono spronate ad intraprendere la strada dello sviluppo di infrastrutture e servizi digitali per i propri utenti garantendosi ulteriori benefici come: - eliminare degli spazi fisici di conservazione delle copie nelle biblioteche; - venire incontro alle esigenze degli studenti a distanza; - abbattere i tempi di pubblicazione, ridurre i tempi di trattamento amministrativo; - ottimizzare il lavoro di descrizione e catalogazione delle tesi nel catalogo in linea di Ateneo. L’implementazione di un programma di archiviazione di TDE coinvolge numerosi attori all’interno di una università (Reeves, 2010). E’ uno sforzo cooperativo che coinvolge il personale amministrativo, bibliotecario, informatico, la scuola di alta formazione e gli studenti stessi. Al di sopra di tutto è indispensabile il sostegno della direzione amministrativa e degli organi accademici (Rettore, Senato accademico, Direttore della scuola di dottorato). Il gruppo che si occuperà di sviluppare il progetto dovrà essere composto da rappresentanti di 7 questi diversi settori, se si vuole che l’iniziativa risulti equilibrata e con buone possibilità di successo. Il primo passo è la stesura di un progetto pilota da esporre alla propria amministrazione, tenendo presenti le politiche interne e gli obiettivi perseguiti dal proprio ateneo, oppure, come in Italia, in ottemperanza e in adesione ad una politica nazionale di implementazione e raccolta delle TDE (cfr. CRUI, Linee guida per il deposito delle tesi di dottorato negli archivi aperti, 2007). A questo stadio dovrebbe essere posto l’accento almeno su questi temi, perché il proprio progetto possa riscuotere attenzione ed essere approvato: - aumentata visibilità dei risultati della ricerca di dottorandi e università tutta; - esposizione e pubblicazione online; - gestione dei diritti d’autore e protezione dell’opera dell’ingegno; - contrasto ai pericoli di plagio; - istruzione all’uso di nuovi strumenti di lavoro; - standard e protocolli; - costi; - archiviazione e conservazione del materiale; - accesso e restrizioni. Un successivo passo molto importante è la scelta dell’infrastruttura tecnologica da usare al fine di ospitare la collezione di TDE. Sono attualmente disponibili software open source e commerciali. La scelta va ponderata in base ad una valutazione comparativa dei prodotti disponibili 14 , la loro performance in termini di strategie di ricerca possibili, rapidità e risultati restituiti in base alle ricerche condotte, personalizzazioni, semplicità d’uso, interoperabilità, supporto di formati adatti alla conservazione nel lungo periodo (Open Society Institute, 2004; Kim, 2005), costi e risorse umane. Lo schema di metadati da utilizzare va ugualmente scelto con cura, privilegiando gli schemi più adatti a rappresentare le TDE, più diffusi e in grado di assicurare l’interoperabilità dei sistemi senza perdita di informazioni. I più utilizzati sono: ETD-MS 15 , Dublin Core e MARCXML. Un buon progetto per avere successo deve essere comunicato in modo semplice, trasparente ed efficace. La costruzione di un sito web dedicato alle TDE può essere la soluzione, al fine di dare informazioni sul programma, istruzioni sul corretto deposito nell’archivio istituzionale, procedure di preparazione dell’elaborato elettronico, (uso corretto dei formati, degli stili ecc.), diritti degli autori, tutorial e supporto. Si stabilisce così un nuovo flusso di lavoro che prevede varie fasi: dal deposito all’approvazione, dalle procedure di conservazione all’accesso, in cui sono coinvolti i bibliotecari, gli informatici e il personale amministrativo. Di solito sono operazioni che, nella prima fase interessano l’ufficio amministrativo della Scuola di alta formazione e poi l’ufficio 14 Alcuni esempi di sistemi open source: Archimede, DSpace, Eprints e Fedora. Esempi di sistemi proprietari: Digital Commons, Ex Libris DigiTool, Open Repository e VLTS Vital. Esistono anche opzioni di remote hosting per piccole istituzioni non in grado di sostenere i costi di implementazione e gestione in-house. 15 ETD-MS è raccomandato da NDLTD. Networked Digital Library of Theses and Dissertations. Si basa sul lavoro della Dublin Core Metadata Initiative. <http://dublincore.org/>. 8 informatico e la biblioteca per le attività di conservazione e accesso. Alla fine del processo, solitamente, i metadati prodotti sono messi a disposizione di un collettore di servizi per l’harvesting, a livello nazionale 16 o anche internazionale (ETD Guide, 2010). Prima di avviare definitivamente il programma, è opportuno un periodo di prova per verificare il corretto funzionamento con una parte ristretta di utenti. Alla fine di questo periodo si passerà alla fase attiva, che solitamente prevede il deposito obbligatorio delle TDE (CRUI, 2007; Cassella, 2008; Harnad, 2009; Harnad, & McGovern, 2009). Il deposito legale di questo tipo di documenti semplifica l’operazione di popolamento di un archivio istituzionale, perché fatto secondo regole precise e evidenti per gli autori. L’ultimo passo è verificare che il proprio archivio sia in grado di supportare il protocollo OAI-PMH, affinché sia aperto verso collettori di servizi esterni e si possano esporre i propri contenuti globalmente. La manutenzione e l’aggiornamento del progetto e di tutto il sistema sono da prevedere fin dalla progettazione e implementazione e riguardano sia le infrastrutture tecnologiche, sia i cambiamenti nelle politiche di deposito e nel diritto d’autore, sia l’automatizzazione dei processi di catalogazione (importazione ed esportazione dei record), sia l’aggiornamento dei formati e la migrazione dei dati. 3.2 Questioni da affrontare e soluzioni possibili Le questioni da affrontare e le criticità da risolvere in seguito alla scelta di avviare un programma di archiviazione delle TDE nascono da una parte dalla necessità di gestire il cambiamento culturale e dall’altra dalla soluzione di problemi pratici, quali il diritto d’autore, il rapporto con gli editori, le risorse umane e le competenze utili alla gestione del programma, le risorse finanziarie, i costi, il budget da impegnare, il plagio. Molti sono gli attori coinvolti all’interno di una istituzione nella definizione di un programma TDE. Il suo successo dipende dalla loro capacità di cooperare e di ben rappresentarne i vantaggi e i potenziali benefici per l’intera comunità accademica presso gli organi di governo dell’Ateneo. Il cambiamento culturale investe innanzitutto gli autori di quella che in termini di legge è riconosciuta opera dell’ingegno. E’ bene che i dottorandi chiamati a depositare il proprio lavoro intellettuale in un archivio istituzionale siano consapevoli dei propri diritti, tutelati in Italia dalla legge sulla protezione del diritto d’autore e di altri diritti connessi al suo esercizio, L. 22 aprile 1941, n. 633 e successive modificazioni 17 . 16 CRUI. Conferenza dei rettori delle Università italiane, Tesi di dottorato di ricerca: deposito legale via harvesting automatico e riversamento dei dati nell’Indice SBN. <http://www.crui.it/HomePage.aspx?ref=1891#>. 17 “Due sono le tipologie di diritti: 1) I diritti morali (paternità, integrità, ritiro dell’opera dal commercio) che restano sempre in capo all’autore e non sono trasmissibili; 2) I diritti di utilizzazione economica o patrimoniali (distribuzione, comunicazione, riproduzione, traduzione ecc.) che possono essere ceduti in parte o in esclusiva. La cessione dei diritti di utilizzazione economica o patrimoniali può avvenire gratuitamente o dietro compenso e deve essere provata per iscritto. I diritti di rielaborazione o di modifica al fine di creare opere derivate sono diritti sia di tipo morale sia di tipo economico. È bene quindi fare grande attenzione alla cessione indiscriminata di diritti a soggetti esterni all’ateneo. Ricordiamo a questo proposito che un editore non necessita della cessione integrale di tutti i diritti di utilizzazione economica per la pubblicazione di un’opera. Gli autori, invece, devono 9 La consapevolezza dell’autore di avere la facoltà di ritenere presso di sé gran parte dei propri diritti non è peregrina, nel momento in cui sorge l’opportunità di pubblicare il proprio lavoro intellettuale presso un editore. La questione delle “pubblicazioni pregresse” è argomento continuo di discussione da parte degli addetti ai lavori, ovvero se gli editori ritengono le TDE, disponibili in Internet, come lavori già pubblicati oppure no. Indagini svolte presso i dottorandi e presso gli stessi editori non sembrano evidenziare preoccupazioni evidenti riguardo la possibilità di pubblicare ad. es. articoli derivanti da tesi di dottorato già archiviate elettronicamente (Brown, 2010; Conner, 2009). La quasi totalità degli editori è concorde nel ritenere una TDE come un lavoro scientifico degno di essere preso in considerazione ai fini della pubblicazione, fermo restando il fattore qualità. E’ vero anche che la prassi editoriale richiede solitamente un adattamento ed una revisione dei contenuti per il nuovo pubblico a cui l’elaborato sarà destinato. Il fatto che una TDE sia accessibile online non è, quindi, una forte preoccupazione per gli editori (McMillan et al. 2011). Mentre, da un lato gli editori confidano nella grande capacità di validazione accademica offerta dalle loro testate, dall’altro gli autori confidano nella protezione delle regole del deposito obbligatorio, nell’accesso aperto e restrizioni ad esso eventualmente applicabili. Una istituzione impegnata nella implementazione di un progetto di TDE deve essere consapevole delle risorse umane e competenze professionali necessarie alla sua gestione e funzionamento: almeno un informatico e un bibliotecario devono essere attivamente impegnati nel progetto. Quest’ultimo con compiti di: - raccordo tra la facoltà e lo studente e il personale amministrativo coinvolto; - di formazione del budget; - collaborazione con il personale informatico per la gestione del software; - ideazione e aggiornamento delle pagine web; - formazione degli studenti ed efficace comunicazione del programma. Al fine di sviluppare efficacemente il progetto e per una definizione complessiva dei costi, sarebbe auspicabile prevedere una ripartizione delle voci di budget che rispecchino queste fasi o macroattività: avvio, implementazione, comunicazione e istruzione degli utenti (ETD Guide, 2010). Nella prima fase le voci coinvolte potranno essere: le risorse umane, le infrastrutture e la formazione. Nella seconda: i servizi di produzione e distribuzione, riguardanti principalmente la scelta del software, dell’interfaccia web per l’accesso. Nella terza: le risorse umane e gli strumenti di comunicazione e di promozione del progetto. Nell’ultima fase saranno da prevedere voci come la pianificazione dei moduli di istruzione, l’organizzazione di workshop, corsi in presenza e tutorial online. Uno dei soliti motivi addotti contro la scelta di percorrere la strada del cambiamento verso lo sviluppo di un progetto di TDE è il pericolo di plagio. Certamente, questo è un mirare al mantenimento di più diritti possibili in quanto essi necessitano dei loro diritti per: depositare l’opera in archivi ad accesso aperto; acconsentire l’uso dell’opera a terze parti; pubblicare l’opera in altre sedi (saggi, raccolte, antologie, convegni…); effettuare un uso didattici (dispense, lezioni…); rielaborare successivamente la propria produzione per scopi scientifici e di ricerca.” (De Robbio & Galimberti, 2011). 10 fenomeno possibile, soprattutto nei casi in cui le tesi online sono scarsamente protette da sistemi di archiviazione sicuri, se l’archivio non è inserito, secondo standard determinati, in progetti più ampi a livello nazionale ed internazionale, se i record che le rappresentano sono poco descrittivi e poveri di metadati. In realtà, se una tesi di dottorato viene esposta a testo pieno online, può essere maggiormente protetta, perché un testo uguale o simile può essere più facilmente confrontato con essa che in passato. Vero è, dunque, che maggiore è il numero di tesi che appare online, minore è la possibilità di plagio (ETD Guide, 2010). Nello stesso tempo, docenti, studenti, bibliotecari sono coscienti della necessità di contrastare il fenomeno. Molte le possibili azioni come un codice di condotta da pubblicizzare attraverso diversi canali: lezioni frontali, web tutorial, uso di software per scoprire il plagio 18 (Greenberg & McLean, 2011). 3.3 Valutazione e misurazione Fino a poco tempo fa la valutazione e la misurazione dei servizi erano ritenute attività opzionali o addirittura superflue per una istituzione. In realtà, un servizio di archiviazione elettronica delle tesi di dottorato deve prevedere già dalla fase di stesura preliminare del progetto entrambe queste attività. La valutazione è un processo continuo che aiuta a comprendere se gli scopi e gli obiettivi del progetto sono in fase di realizzazione, o sono stati raggiunti. Pertanto, è un supporto inestimabile per gli amministratori per capire l’efficacia di un programma, per allocare risorse, per sviluppare maggiormente una parte del progetto piuttosto che un’altra, mentre la misurazione aiuta ad analizzare quantitativamente l’uso e l’utilità delle TDE. Quante TDE sono prodotte in un anno, o quante ne sono state visualizzate, scaricate o citate sono indicazioni d’uso utili a capire il successo del progetto (Bevan & Needham, 2009). Valutazione e misurazione sono processi continui, che possono prendere la forma di: - valutazione formativa, ovvero, controlli sulle attività in corso di svolgimento: apprendimento dei meccanismi di presentazione del lavoro di tesi, requisiti tecnici degli elaborati, funzionamento della comunicazione accademica, loro utilità per il futuro. - valutazione sommativa per analizzare il progetto nel lungo periodo, ad es. su base annuale, raccogliendo statistiche d’uso, facendo indagini sulla soddisfazione degli utenti. Ben si applicano a questo tipo di rilevazioni i metodi quantitativo e qualitativo della ricerca sociale 19 , partendo da scopi e obiettivi già ben definiti, che ben riassume la EDT Guide (2010): 18 Questa pratica sembra essere abbastanza diffusa nelle Università americane, in cui a volte si richiede anche obbligatoriamente la sottomissione dei lavori degli studenti ai così chiamati “plagiarism detection softwares” prima della presentazione di una tesina o di una tesi. Nella rete esistono molti prodotti di questo tipo, commerciali e non, con lo scopo di garantire il controllo della originalità degli elaborati. Plagiarism detection, Wikipedia [voce]. <http://en.wikipedia.org/wiki/Plagiarism_detection>. 19 Il primo è un metodo deduttivo, strutturato in fasi logiche e sequenziali, parte dalla teoria per approdare alla ricerca, il soggetto studiato è passivo, l’interazione è nulla, la ricerca è strutturata, i dati oggettivi e i risultati generalizzati. E’ un approccio che predilige le tecniche delle rilevazioni statistiche d’uso e i questionari chiusi. Il 11 - l’impatto che il progetto ha sulla reputazione dell’istituzione accademica; - il ruolo del progetto nel contesto della biblioteca digitale istituzionale; - i benefici e le criticità per studenti e altri utenti. Tutto questo al fine di contribuire a migliorare l’alta formazione, aumentare la disponibilità dei risultati della ricerca degli studenti, diminuire i costi di gestione delle tesi di dottorato, investire nelle biblioteche digitali. Fermo restando che i parametri di misurazione per monitorare le attività e il raggiungimento degli obiettivi possono essere diversi da istituzione a istituzione, è importante comunque indirizzare le verifiche verso l’efficienza e l’efficacia, la soddisfazione dell’utente, quindi la qualità e l’impatto del servizio 20 . A seconda delle esigenze, gli strumenti vanno dall’analisi dei file di log dei server, all’estrazione di informazioni statistiche dal set di metadati usati per l’archiviazione ai questionari online, all’osservazione diretta e indiretta del comportamento degli utenti, interviste e focus group. Molti sono gli studi e i progetti che in questi anni sono stati condotti al fine di sviluppare dei programmi di valutazione e misurazione dei servizi digitali resi dalle università e dalle loro biblioteche. Una buon punto di partenza per analizzarli e capirne l’adattabilità agli archivi di TDE è la raccolta presso la Statistics and Evaluation Section dell’IFLA 21 . I dati raccolti e analizzati contro gli scopi e gli obiettivi che si intendono perseguire saranno utili per pianificare le attività future, come il miglioramento e la comunicazione del servizio, l’aggiornamento delle infrastrutture tecnologiche e i programmi di istruzione. Manca tuttora uno standard per la misurazione e la compilazione di statistiche d’uso relativo alle TDE che sia conforme a COUNTER 22 . Se non è difficile la produzione locale di statistiche d’uso, poiché i software oggi disponibili hanno queste funzionalità, ciò rende difficile produrre statistiche affidabili e comparabili tra archivi (Bevan & Needham, 2009). secondo è un metodo induttivo, aperto e interattivo, il soggetto studiato è attivo, l’interazione è forte, la ricerca si modella nel corso della rilevazione, i dati sono riconducibili al singolo caso e le generalizzazioni impossibili. E’ un metodo che usa tecniche come questionari aperti, interviste e focus group. (Patton, 1990; Palumbo & Garbarino, 2006). 20 Un esempio di misura di efficacia: verificare le conoscenze negli studenti relative ai meccanismi della pubblicazione elettronica, prima e dopo la pubblicazione della tesi. Un indicatore di impatto può riguardare l’abbattimento dei tempi e dei costi di redazione e presentazione della tesi, oppure la diffusione dei risultati della ricerca e le ricadute per la carriera accademica o professionale. 21 IFLA. Statistics and evaluation section. Useful links. <http://archive.ifla.org/VII/s22/statlinks.htm>. 22 COUNTER. Counting Online Usage of Networked Electronic Resources. <http://www.projectcounter.org/index.html>. 12 4. Infrastruttura tecnologica 4.1 Accesso aperto: OAI e la ricerca federata Nella sua accezione più ampia con Open Access si intende il libero accesso, in quanto libera disponibilità in rete, di contenuti digitali 23 . La dichiarazione della Budapest Open Access Initiative precisa, “La sola restrizione sulla riproduzione e distribuzione […] dovrebbe essere quella di mantenere agli autori il controllo sull’integrità del proprio lavoro e il diritto di essere riconosciuti e citati in maniera appropriata” 24 . Una delle strategie raccomandate dal BOAI, perché la letteratura scientifica, si può aggiungere “nel senso più ampio del termine”, sia accessibile online è l’auto-archiviazione dei propri lavori in archivi digitali aperti, conformi agli standard della Open Archives Initiative 25 , standard per l’interoperabilità dei contenuti digitali. Nella missione di OAI c’è, infatti, la dichiarazione che lo scopo dell’iniziativa è di facilitare la disseminazione dei contenuti digitali, in accordo con il movimento Open Access e degli archivi istituzionali, supporto che ne costituisce la testata d’angolo. OAI ha sviluppato un protocollo 26 per la raccolta dei metadati (OAI-PMH), che si presenta come infrastruttura di comunicazione, indipendente dalle applicazioni. Entrano in gioco due partecipanti in questa infrastruttura: - i fornitori di dati, che amministrano sistemi che supportano OAI-PMH al fine di esporre i propri metadati; - i fornitori di servizi, che usano i metadati raccolti via OAI-PMH per costruire servizi di valore aggiunto (Lagoze & Van de Sompel, 2008). L’archivio (o repository) è un server accessibile in rete e gestito dal fornitore di dati in grado di processare richieste OAI-PMH ed esporre i metadati ad una applicazione client (harvester) che invia le richieste. Fig. 1. Modello e struttura di OAI-PMH 23 27 Open access, Wikipedia [voce]. <http://it.wikipedia.org/wiki/Open_access>. 24 Budapest Open Access Initiative (2002). <http://www.soros.org/openaccess/read>. Open Archives Initiative. <http://www.openarchives.org/>. 26 Si ricordi che questo protocollo è semplicemente un’interfaccia che permette ad un server in rete di esporre i metadati degli oggetti digitali che conserva ad applicazioni esterne che li raccoglie. Quindi, le applicazioni potenziali possono essere molteplici, commerciali e non. Lynch (2001) fa notare come il termine OAI sia ambiguo, intendendo popolarmente, sia il protocollo (che si può definire aperto da un punto di vista architetturale), sia il movimento di promozione degli archivi digitali aperti (archivio come deposito di articoli scientifici e per analogia deposito di informazioni). 27 Immagine da Open Archives Forum. <http://www.oaforum.org/tutorial/image/structure-model.gif>. 25 13 L’idea nasce 28 dalla necessità di superare le difficoltà della ricerca distribuita (come fornita ad es. dal protocollo Z39.50 non in grado di fornire elevata omogeneità dei dati recuperati 29 ). Ora l’implementazione e il data processing si spostano dai fornitori di dati ai fornitori di sevizi. Da un modello distribuito si passa a un modello federato in cui l’esportazione dei dati avviene su richiesta e a cura dei fornitori di servizi, che avranno anche il compito di manipolare i dati al fine di normalizzarli e renderli disponibili all’utente in modo uniforme. L’utente di un servizio di ricerca federata non avrà un contatto diretto con l’archivio, ma con un database già costruito con i metadati raccolti dagli archivi partecipanti (Lynch, 2001). L’informazione digitale viene vista come: risorsa, ovvero, l’oggetto contenuto nel repository; item, ovvero, l’elemento del repository dal quale i metadata possono essere disseminati. Un identificatore univoco (deve corrispondere a uno URI 30 ) identifica un item all’interno del repository e raccoglie tutti i possibili record di cui un item può essere costituito; record, ovvero, i metadata in un determinato formato (espressi in sintassi XML secondo lo schema Dublin Core Simple a garanzia dell’interoperabilità). L’operazione di harvesting può essere selettiva, prelevando dal repository una porzione limitata (set) di record 31 , più i loro identificatori. Il protocollo usa il modello domanda/risposta http per la comunicazione tra harvester e repository. Per la risposta diversi sistemi di metadati, codificati XML, sono supportati. Il protocollo richiede almeno il set Dublin Core non esteso, ma è importante che anche schemi di metadati propri ad una piccola comunità possano essere sviluppati ed utilizzati e che ricerche federate molto ampie possano essere assicurate grazie ad un livello minimo di interoperabilità. Oltre alla semplificazione della ricerca federata, un’altra importante applicazione dei OAI-PMH è la possibilità per i motori di ricerca di agganciare in maniera non indiscriminata e incontrollata i metadati di contenuti offerti attraverso gli archivi digitali. Per sua natura il protocollo non si occupa di definire la gestione dell’autenticazione e dell’accesso, che resta pertinenza esclusiva del repository. Inoltre, quali repository possano essere target di raccolta per gli harvester, quale uso si possa fare dei metadati raccolti sono questioni di accordi tra le parti, di politiche istituzionali di cui il protocollo ugualmente non si occupa. 28 The Santa Fe Convention of the Open Archives Initiative, October 1999. Il protocollo di comunicazione Z39.50 può essere utilizzato come strumento per facilitare l’interoperabilità tra sistemi in rete, in cui un client, sfruttando un linguaggio di interrogazione condiviso e utilizzando un’unica interfaccia, invia in parallelo una richiesta di informazioni a un dato numero di server, raggruppa i risultati, elimina i duplicati e presenta i record all’utente. Nominalmente, anche la ricerca federata è possibile utilizzando questo protocollo, ma molto difficile. Le richieste, infatti, possono essere interpretate in modi diversi dai server, a causa di mancanza di specificità nello standard che ingenera difformità semantiche. Si verificano problemi di scalabilità, quando il numero di server interrogati sono molti. Ci si deve preoccupare della non disponibilità momentanea di certi server o della lentezza di altri che rallentano la risposta finale. 30 Uno Uniform Resource Identifier è una stringa che identifica univocamente una risorsa generica che può essere un indirizzo web, un documento, un'immagine, un file, un servizio, un indirizzo di posta elettronica, ecc. 31 I set possono identificare anche una collezione con determinate caratteristiche. 29 14 4.2 Requisiti tecnici per la produzione e la disseminazione delle tesi di dottorato elettroniche La preparazione di una TDE, da un punto di vista operativo, si può paragonare alla pubblicazione di un libro presso un editore. Diversi sono gli strumenti tecnici utili: un personal computer, innanzitutto, ma nel caso di contenuti multimediali, si potrebbe aver bisogno anche di uno scanner, una macchina fotografica digitale, un microfono, una videocamera ecc. Anche dal lato software, per l’editing è indispensabile un word processor, ma possono essere necessari anche editors di contenuti multimediali per la creazione di file audio, video o immagine ed eventuali software per l’integrazione di questi contenuti diversi. Per la rappresentazione ci si dovrà preoccupare di stili, font, grandezza dei caratteri, ma anche eventualmente di compressione, risoluzione ecc. Solitamente vengono date raccomandazioni dalle istituzioni circa i formati da utilizzare per la produzione degli elaborati, consigliabili sia in vista di una ottimale disseminazione, sia della conservazione nel lungo periodo. Un formato quasi unanimemente consigliato, per le sue caratteristiche preferibile ad altri, è il PDF/A 32 . Accettabile è ogni formato aperto, la cui la sintassi, la semantica, il contesto operativo e le modalità di utilizzo vengono rese pubbliche mediante esaustiva documentazione. Una tesi di dottorato si compone di una introduzione, una parte centrale e una finale (opzionale) costituita da parti aggiuntive come appendici ecc. I formati raccomandati 33 : Introduzione Parte centrale Formato pdf Formato pdf (preferito) (File testo supplementari) ASCII (.txt) SGML HTML (paginazione, formattazione e archiviazione più difficili). Un file pdf equivalente può accompagnarlo. E’ importante che il formato fornisca una riproduzione, indipendente dalla piattaforma, fedele a video o a stampa. HTML non può assicurare questo. 32 Allegrezza, S. (2008) “Il formato PDF/A (PDF for Archiving)”, in Pigliapoco S. & S. Allegrezza (2008) Produzione e conservazione del documento digitale. Requisiti e standard per i formati elettronici, vol. 1, cap. 10, Macerata: EUM. “Il PDF/A, o PDF/Archiving per l’archiviazione a lungo termine è un formato non proprietario, aperto e standard de jure. E’ basato sul formato PDF di Adobe Systems e di questo utilizza solamente quelle caratteristiche che permettono di produrre file in grado di conservare nel tempo la loro rappresentazione (sia su schermo che a stampa, o attraverso altri sistemi di output, indipendentemente dagli strumenti tecnologici utilizzati).” Dal suo canto, il PDF è “un formato di file basato su un linguaggio di descrizione di pagina sviluppato da Adobe Systems nel 1993 per rappresentare documenti in modo indipendente dall'hardware e dal software utilizzati per generarli o per visualizzarli”. Wikipedia, Portable Document Format [Voce]. <http://it.wikipedia.org/wiki/Portable_Document_Format>. E’ un formato aperto, documentato, standard e di ampia adozione, auto-documentato ed indipendente dal dispositivo su cui viene visualizzato. I meccanismi tecnici di protezione sono opzionali, non ci sono limitazioni nell’utilizzo, permette vari livelli di accessibilità, non è modificabile, se si adottano meccanismi tecnici di protezione, fornisce ottime garanzie di sicurezza ed efficienza. Tra i requisiti di sostenibilità meno evidenti si collocano la trasparenza, la robustezza e la stabilità. D'altra parte il limite del PDF è quello di emulare il mondo della stampa su carta. 33 West Virginia University, Electronic Format Requirements (2011). <http://www.libraries.wvu.edu/theses/electronic.htm>. 15 Materiale aggiuntivo Formato ASCII. File speciali, dipendenti dalla piattaforma. Immagini: PDF (.pdf) JPEG (.jpg) CompuServe GIF (.gif) CGM Computer Graphics Metafile (.cgm) Adobe Photoshop (.ppd) Post Script (.eps) PowerPoint (.ppt, .pptx) Video: MPEG QuickTime - Apple (.mov) Audio Video Interleaved Microsoft (.avi) Windows Format (.wmv) Applicazioni streaming per video (.swf, .flv) Audio: MPEG-2 MP3 AIF (.aif) SND (.snd) WAV (.wav) MIDI (.midi) Speciali: Fogli di lavoro - Excel (.xls, .xlsx), (.csv) Word Processing (se non è possible il pdf) (.doc, .docx. .pub) AutoCAD (.dxf) Notepad (.txt) File compressi (.zip, .tar, java) Le TDE si possono produrre anche utilizzando dei linguaggi di marcatura, ovvero metalinguaggi, che nel caso di XML permette di utilizzare uno schema che contiene delle specifiche per il tipo di documento che si vuole rappresentare 34 . Poiché XML è indipendente dalle piattaforme, molti sono i software disponibili per la produzione di TDE in XML 35 . Al fine di controllare se un documento è stato creato con la giusta sintassi XML, si utilizzano i parser XML. Molti sono facilmente disponibili e anche incorporati negli editor. Un documento XML non può essere letto direttamente dagli utenti attraverso gli attuali browser. Ci sono due strade: o si incorporano le informazioni di layout nel foglio di stile, o lo si trasforma in una versione accessibile a video o a stampa. Le università hanno due possibilità, ovvero, investire l’autore dell’elaborato della necessità di produrre un foglio di stile per conservare tutte le informazioni e renderle disponibili, oppure, sviluppare dei fogli di stile standard per le TDE, utili anche per il riconoscimento e la promozione dell’istituzione. Altro punto importante è la nomenclatura dei file TDE e degli identificatori univoci. La scelta del nome può essere lasciata alla discrezionalità dell’autore, ma non così per gli identificatori. La tecnologia OAI richiede che ogni archivio abbia un identificatore e così ogni record al suo interno. La combinazione dei due determinerà, senza possibilità di errore, quel record. Allo stesso tempo, l’uso di uno URN, come handle 36 o PURL 37 , permetterà di identificare sempre e univocamente un dato documento, evitandone la perdita, se nel tempo viene spostato da un server ad un altro. A livello hardware, una raccolta di TDE avrebbe bisogno di una infrastruttura tecnologica in grado di contemplare: 34 Esistono già schemi di marcatura codificati, come MathML per la matematica o XBRL per l’economia che possono essere usati nelle TDE per esprimere particolari tipi di contenuti. 35 Per citarne i due più diffusi, OpenOffice.org. <http://www.openoffice.org> e MS Word and Office 2007. <http://www.microsoft.com>. 36 <http://www.handle.net/>. 37 <http://www.purl.org/docs/index.html>. 16 - un server di produzione per il caricamento dei dati, a cui anche gli autori hanno accesso per l’auto-archiviazione; - un server di archiviazione per i backup, controllo accessi, gestione della sicurezza, autenticazione e integrità dei contenuti conservati; - un server per l’accesso pubblico con un interfaccia utente amichevole per la consultazione, scarico dei dati ecc.; - un server mirror in un luogo geograficamente diverso, che replichi l’archivio originale per prevenire la perdita di dati per motivi ambientali. Infine, un software per la gestione delle TDE deve rispondere a dei requisiti e soddisfare dei criteri utili a trattare questi specifici contenuti digitali. Studi di comparazione sono stati condotti in questi anni da più parti (Open Archives Forum, 2003; Open Society Institute, 2004; Fay, 2010). Si evidenziano alcuni criteri (Copeland, Penman & Milne, 2005) come: - la disponibilità attraverso una licenza Open Source e la sostenibilità di una comunità di sviluppatori (gratuità, modificabilità, aggiornamento, redistribuzione); - l’interoperabilità, ovvero la conformità con il protocollo OAI-PMH, quindi l’accesso e la comunicazione tra archivi; - l’adattabilità, ovvero la capacità di lavorare con diversi sistemi operativi e di fornire un’interaccia utente intuitiva ed efficiente 38 . 4.3 Modelli di metadati La produzione e la disseminazione delle TDE passa anche attraverso un uso ponderato e l’applicazione puntuale di modelli di metadati, i cui set di elementi sono stati studiati, testati ed applicati a questi specifici contenuti. I metadati sono informazioni strutturare che descrivono, spiegano, localizzano, facilitano il recupero, l’uso e la gestione di una risorsa informativa. Spesso sono chiamati dati sui dati o informazioni sulle informazioni (NISO, 2004) 39 . Il significato del termine cambia a seconda della comunità che lo utilizza. Nelle biblioteche, di solito, il termine identifica uno schema formalizzato 40 per la descrizione di una risorsa, o oggetto, sia digitale, sia non. La definizione o significato degli elementi è conosciuta come semantica dello schema. I valori attribuiti agli elementi costituiscono il contenuto. 38 Per una esaustiva trattazione della questione si veda il lavoro svolto dal Gruppo OA presso la CRUI che nel 2009 ha portato all’elaborazione di Linee guida per gli archivi istituzionali con una particolare attenzione alla realtà italiana. 39 Feliciati, P. (2009) ne dà la seguente definizione, che pone l’accento anche sulla gestione conservativa delle risorse digitali: “Dati che descrivono il contesto, il contenuto e la struttura dei documenti e la loro gestione nel tempo […] Informazioni strutturate o semistrutturate che permettono la creazione, la gestione e l’uso di record nel tempo, e all’interno e attraverso i domini in cui vengono creati.” 40 Gli schemi di metadati sono set di elementi destinati ad uno scopo preciso, come descrivere un tipo particolare di risorsa informativa. Gli schemi presentano generalmente specifici nomi degli elementi e la loro semantica. Possono anche specificare, ad es., regole di formulazione del contenuto, oppure regole di rappresentazione del contenuto, oppure valori di contenuto accettati e non, secondo un vocabolario controllato. 17 I vari tipi di metadati vengono, per praticità, solitamente classificati in tre categorie: metadati descritti, strutturali e amministrativi. - i metadati descrittivi sono utili a identificare e descrivere una risorsa. Sono descrizioni normalizzate dei documenti fonte e risiedono generalmente nelle basi dati dei sistemi di information retrieval, all’esterno dei depositi degli oggetti digitali e sono collegati a questi ultimi tramite appositi link (Progetto Minerva, 2007). - i metadati strutturali servono a descrivere la struttura interna dei documenti e gestiscono le relazioni tra le diverse componenti (pagine, capitoli ecc.). - i metadati amministrativi o gestionali forniscono informazioni sulla gestione della risorsa e sono particolarmente utili nel mantenimento e accessibilità a lungo termine (gestione dei diritti di accesso, conservazione). Ai nostri fini, è utile concentrarsi sui metadati descrittivi per evidenziare quale set di elementi o descrittori può risultare efficace ed appropriato ai contenuti delle TDE. Naturalmente anche le altre categorie di metadati sono molti importanti per la gestione amministrativa di questi documenti, ma sono più facilmente applicabili ed applicati automaticamente dal sistema. A titolo esemplificativo, alcuni set di descrittori già sviluppati e disponibili, non con intento restrittivo, per le TDE, ed utilizzabili come modelli, sono, a livello internazionale: Dublin Core (DCMES) 41 , ETD-MS della Networked Digital Library of Theses and Dissertations e UK EDT Metadata Core Set 42 . Gli ultimi due sono stati studiati proprio per le TDE. Dublin Core è un set più ampio e generale a cui è possibile aggiungere altri elementi (Copeland, Penman & Milne, 2005) propri del mondo accademico e di interesse per l’università (ETD Guide, 2010) come: - informazioni amministrative: facoltà, dipartimento, scuola, data di presentazione, data di accettazione e discussione, borse di studio; - informazioni accademiche: commissione esaminatrice, relatore, tutor; - informazioni biblioteconomiche: università, sistema bibliotecario, inventario, collocazione. Si propone di seguito una tavola comparativa e riepilogativa di questi tre set di elementi, partendo da Dublin Core, per verificare dove e come si producono degli scostamenti dal set generico per allocare elementi necessari ad una descrizione esaustiva delle TDE. DCMES dc.title ETD-MS dc.title dc.title.alternative dc.creator dc.creator UK ETD Set title title.alternative creator Descrizione DC Nome: Titolo Identificatore: Title Definizione: Un nome dato alla risorsa Nome: Creatore Identificatore: Creator Definizione: Un’entità che ha la responsabilità principale della 41 The Dublin Core Metadata Element Set, version 1.1. <http://dublincore.org/documents/dces/>. La tabella descrittiva è disponibile presso la Robert Gordon University Library Service. <http://www2.rgu.ac.uk/library/guidelines/metadata.html>. 42 18 produzione del contenuto della risorsa dc.subject dc.subject dc.description dc.description dc.description.abstract dc.description.note dc.description.release dc.publisher dc.publisher contributor.advisor subject description.abstract subject.DDC subject.LCC subject.LCSH subject.MESH subject.UDC publisher dc.publisher.country dc. contributor dc.contributor dc.contributor.role contributor.sponsor (refinement) dc.date dc.date date.issued (refinement) dc.type dc.type type dc.format dc.format format.IMT (encoding scheme) dc.identifier dc.identifier identifer.URL (encoding scheme) dc.language language.ISO639-2 (encoding scheme) dc.source dc.language Nome: Soggetto e Parole chiave Identificatore: Subject Definizione: L’argomento della risorsa. Nome: Descrizione Identificatore: Description Definizione: Una spiegazione del contenuto della risorsa Nome: Editore Identificatore: Publisher Definizione: Un’entità responsabile della produzione della risorsa, disponibile nella sua forma presente Nome: Autore di contributo subordinato Identificatore: Contributor Definizione: Un’entità responsabile della produzione di un contributo al contenuto della risorsa Nome: Data Identificatore: Date Definizione: Una data associata a un evento del ciclo di vita della risorsa Nome: Tipo di risorsa Identificatore: Type Definizione: La natura o il genere del contenuto della risorsa Nome: Formato Identificatore: Format Definizione: La manifestazione fisica o digitale della risorsa Nome: Identificatore della risorsa Identificatore: Identifier Definizione: Un riferimento univoco alla risorsa nell’ambito di un dato contesto Nome: Fonte Identificatore: Source Definizione: Un riferimento a una risorsa dalla quale è derivata la risorsa in oggetto Nome: Lingua Identificatore: Language Definizione: La lingua del contenuto intellettuale della risorsa relation.hasVersion (refinement) 19 dc.relation relation.references (refinement) dc.coverage dc.coverage dc. rights dc.rights rights Nome: Relazione Identificatore: Relation Definizione: Un riferimento alla risorsa correlata Nome: Copertura Identificatore: Coverage Definizione: L’estensione o scopo del contenuto della risorsa Nome: Gestione dei diritti Identificatore: Rights Definizione: Informazione sui diritti esercitati sulla risorsa thesis.degree thesis.degree.level thesis.degree.discipline thesis.degree.grantor format.extent (refinement) Il confronto proposto attraverso la tabella è naturalmente molto selettivo, ma esplicativo di un modus operandi e dell’adattabilità dello schema Dublin Core, che fornisce requisiti minimi e regole semplici per la pubblicazione online, di fatto dando la possibilità di costruire schemi più complessi, o comunque più articolati e più confacenti ad una data comunità di utilizzatori. Si nota scorrendo la tabella come il set di 15 elementi DCMES rappresenti uno schema base dal quale lo standard ETD-MS sottrae gli elementi dc.source e dc.relation per specificarne meglio alcuni: dc.title dc.title.alternative; dc.publisher dc.publisher.country; dc.contributor dc.contributor.role e per aggiungere thesis.degree con dei livelli di specificazione pertinenti al materiale da descrivere: (thesis.degree.level, thesis.degree.discipline, thesis.degree.grantor). La scelta britannica, proposta non come set obbligatorio e restrittivo, ma come punto di sviluppo (Copeland, Penman & Milne, 2005), tende a coinvolgere non soltanto l’autore dell’elaborato per l’auto-archiviazione, segnalando quali sono gli elementi (o campi da valorizzare di sua pertinenza), ma anche il bibliotecario, già a questo stadio, inserendo i campi subject.DDC, LCC, MESH, UDC. Si estende l’elemento dc.relation a contemplare relazioni con parti del lavoro stesso già pubblicate o a lavori di altri. Né in ETD-MS, né in UK EDT Metadata Core Set si prende in considerazione l’elemento dc.source, “riferimento a una risorsa dalla quale è derivata la risorsa in oggetto”, che in effetti non ha senso di essere in questo caso. 4.4 Catalogazione: rimodulazione dei flussi di lavoro Codificare set di metadati per la descrizione di documenti elettronici contenuti negli archivi digitali verso lo standard MARC è una questione che si è subito posta alla comunità dei bibliotecari, ovvero, esplorare la possibilità di creare dati in un formato con l’intento di produrre automaticamente record in un altro formato. Le TDE sono di certo i documenti elettronici che con più facilità e regolarità i catalogatori trovano sul loro tavolo di lavoro, 20 quindi un tipo di materiale adatto alla sperimentazione. E’ vero che si incoraggia, anzi si richiede obbligatoriamente all’autore di auto-archiviare il proprio lavoro, ma è anche vero che i record prodotti in questo modo risultano spesso poveri e non controllati. Da qui la necessità di confrontare i dati Dublin Core e lo standard MARC per costruire una mappa di equivalenze, non sempre facile, ma possibile (UKOLN, 2002). Dato che lo standard MARC è piuttosto rigido e povero di soluzioni per la catalogazione delle tesi, un set di metadati studiati per le TDE può facilitare l’adozione di campi MARC utili alla catalogazione di questo materiale e lo sviluppo di campi locali dove allocare informazioni, altrimenti non disponibili. Se si prendono in considerazione le tavole di mappatura UNIMARC/Dublin Core (Day, 1999; ICCU, 2011) di dieci anni fa e di oggi si possono notare notevoli differenze ed uno sforzo verso l’avvicinamento tra i due codici. Basti pensare, ad es. all’introduzione dei campi: 856$q Tipo di formato elettronico dc.format 856$g URN dc.identifier 856$u URL dc.identifier 856$u URL dc.rights 135 Dati codificati: risorse elettroniche dc.type 230 Caratteristiche delle risorse elettroniche dc.type 336$a Tipo di risorsa elettronica dc.format Grazie all’interoperabilità tra sistemi e una mappatura tra codici di descrizione, un sistema MARC può raccogliere dati codificati DC ed estensioni e tradurli automaticamente in dati MARC e viceversa. In una prospettiva OAI standard XML, un fornitore di dati può esportare sia dati codificati XML DC ed estensioni, sia dati MARC XML (ETD-MS, 2010), che, in una prospettiva di creazione di record bibliografici per le TDE da inserire nel catalogo, saranno transcodificati in MARC. Un record MARC contenente valori condivisi per la rappresentazione e la descrizione di una TDE può essere un record valido per un set di codifica basato su Dublin Core. Lo stesso vale per quelle istituzioni che creano record Dublin Core ed estensioni conformi a MARC. Lo scambio dei dati è in entrambi i casi possibile (ETD-MS, 2008). Le possibilità prospettate di interscambio dei dati aprono nuovi scenari nei processi di lavoro per la gestione delle TDE, in biblioteca, ma anche negli uffici amministrativi e nell’archivio di un’istituzione accademica, anche se i cambiamenti di quella che sempre di più si evidenzia come catalogazione automatica e auto-archiviazione dei contenuti sono percepiti dai bibliotecari come una realtà da non accettare come soluzione per abbreviare i tempi di lavoro, ma da gestire con le giuste cautele di controllo e supervisione. Uno scenario possibile di rimodulazione dei flussi di lavoro mette in gioco il contributo dell’autore dell’elaborato, la Scuola di alta formazione, la biblioteca e in una prospettiva di conservazione nel lungo periodo, laddove già sviluppata, l’archivio. 21 In ottemperanza delle disposizioni amministrative, dietro presentazione della domanda di diploma, lo studente, attraverso un login e una password di Ateneo, oppure creando il proprio profilo direttamente dall’interfaccia dell’archivio digitale, sottopone il suo file al sistema. Oltre ai metadati descrittivi ed eventualmente amministrativi, relativi ai diritti di accesso e uso e riuso, che lo studente valorizza, una serie di metadati amministrativi vengono generati automaticamente dal sistema, come la provenienza (nome, data e ora), diritti di accesso (se previsto), informazioni tecniche come il numero di byte e dati di gestione del file. L’operazione viene convalidata da un addetto della Scuola di alta formazione ed una notifica viene inviata alla biblioteca per la revisione del lavoro fatto dallo studente e per il completamento della descrizione del record con le appropriate informazioni di autorità attraverso un vocabolario controllato. Opportunamente, a volte grazie a un plug-in, una utilità, anche sviluppata internamente, conforme al software di gestione del catalogo bibliografico, è possibile mappare automaticamente i metadati provenienti dell’archivio digitale in MARC, esportarli e dopo gli opportuni controlli salvarli nel catalogo. I controlli possono essere di varia natura: riguardare i tag (indicatori e sottocampi), regole ortografiche (maiuscolo o minuscolo, diacritici, caratteri speciali), spaziatura, controllo delle date di presentazione e discussione della tesi. I tempi di lavoro saranno drasticamente abbattuti, evitando duplicazioni e assorbendo molta parte del tradizionale lavoro di catalogazione. Potrebbe portare anche alle estreme conseguenze di delegare tutta l’operazione all’auto-archiviazione (ulteriore standardizzazione del processo nelle prime fasi) ed a un set minimo di metadati richiesti. Una delle sfide è, forse, di bilanciare la puntualità nell’accesso a queste risorse e l’efficienza del flusso di lavoro, la capacità di gestire diversi formati (XML, MARCXML, MARC, ecc.) e la capacità di conciliare i metadati per scopi diversi, o database diversi (il gestionale della biblioteca, il catalogo nazionale, l’archivio istituzionale). Soluzione quest’ultima a cui si sta mettendo mano, con alterne fortune, attraverso i discovery tools di ultima generazione. 4.5 La conservazione nel lungo periodo Mentre continua il lavoro sul miglioramento della qualità dei metadati, il confronto tra quelli generati dagli autori e le procedure di controllo dei catalogatori, l’esposizione dei dati degli archivi istituzionali di TDE in servizi di raccolta nazionali e internazionali (Guy, Powell & Day 2004; Jackson, et al. 2008; Lubas, 2009), resta ancora poco percepita e affrontata la questione della conservazione di questo materiale e della stabilità che i depositi istituzionali possono offrire nel lungo periodo 43 . Si evidenzia da più parti che le tesi di dottorato sono 43 La Digital Preservation Coalition definisce la conservazione digitale come, “Digital Preservation refers to the series of managed activities necessary to ensure continued access to digital materials for as long as necessary. Digital preservation is defined very broadly for the purposes of this study and refers to all of the actions required to maintain access to digital materials beyond the limits of media failure or technological change”. <http://www.dpconline.org/advice/preservationhandbook/introduction/definitions-and-concepts>. 22 ormai materiale che nasce digitale. Tutte o quasi le università richiedono, insieme al formato cartaceo quello elettronico, oppure solo quello elettronico. La conservazione di queste nuove risorse digitali per le future generazioni è un dovere morale che giustamente si configura come obbligo legale. Come per altri materiali, la conservazione nel lungo periodo delle TDE non può essere lasciata alla volontà di singole istituzioni, ma deve nascere dallo sforzo congiunto di più soggetti. Nel tempo gli stessi progetti nazionali di raccolta delle TDE hanno sviluppato, o stanno sviluppando strategie per la conservazione del materiale che viene man mano raccolto per la disseminazione presso singoli archivi istituzionali. Negli Stati Uniti, insieme alla MetaArchive Cooperative, la Networked Digital Library of Theses and Dissertations ha sviluppato dal 2008 un piano strategico 44 per la conservazione delle TDE nel lungo periodo. Possono usufruirne tutte le istituzioni che implementano l’archivio delle TDE, depositando i loro documenti in un archivio di storage che funziona con una tecnologia di rete distribuita con server in almeno sei istituzioni facenti parte della rete. Non solo è assicurato il back-up dei file, ma anche il controllo programmato e la sostituzione dove necessario. In Gran Bretagna EthOS 45 (Electronic Theses Online System), il programma che permette l’archiviazione delle tesi prodotte nel Regno Unito e che ha il suo “hub” presso la British Library, sta congiuntamente sviluppando un programma di conservazione che va sotto il nome di Digital Preservation Statement for UK Theses Digitisation Project / EthOS. Il documento prodotto spiega le strategie e le tecniche 46 messe in campo dalla British Library per la conservazione delle tesi digitalizzate e native digitali. In Germania il progetto nazionale Dissonline47 , oltre a raccogliere le tesi di dottorato e lavori post-dottorato prodotti nelle Università tedesche e permetterne la ricerca online, fornisce anche tutta una serie di servizi di supporto per gli autori ed è agganciata a progetti di conservazione nel lungo periodo, che nascono dalla cooperazione tra biblioteche nazionali, universitarie, musei e archivi e si raccolgono intorno a Nestor 48 , rete di competenze e istituzioni fattivamente impegnate nella questione della conservazione dei documenti digitali a livello nazionale ed europeo. Il progetto europeo Planets 49 , finanziato per vincere la sfida della conservazione digitale, si pone l’obiettivo di produrre servizi e strumenti utili ad assicurare la conservazione a lungo termine. Collaborano al progetto diverse biblioteche nazionali europee e proprio la Biblioteca nazionale austriaca si è fatta promotrice di un progetto locale di conservazione delle tesi attraverso uno studio approfondito dei formati e la loro reazione a processi di migrazione (Becker et al., 2007). 44 <http://www.ndltd.org/Members/gail/etd-preservation-network>. <http://www.ethos.ac.uk/>. 46 La strategia si basa sulla cosiddetta “gestione del ciclo di vita”. In ogni stadio del ciclo di vita dei documenti i contenuti digitali vengono trattati opportunamente per le peculiarità e necessità proprie di quello stadio. 47 <http://www.dissonline.de/eng/index.htm>. 48 <http://www.langzeitarchivierung.de/eng/index.htm>. 49 <http://www.planets-project.eu/>. 45 23 DART 50 , partner europeo di NDLTD, nasce come un semplice servizio di TDE ed ancora oggi che è cresciuto tende a mantenere un basso profilo nell’approccio ai metadati ed es., ma è fortemente impegnato nelle tematiche della conservazione ed anche in progetti di retro-digitazione. Da questi pochi esempi è facile capire che la conservazione dei contenuti digitali in generale è un terreno ancora nuovo da esplorare. Le buone pratiche sono ancora da costruire e si aspettano significativi passi avanti della tecnologia. 5. Archiviazione delle tesi di dottorato elettroniche: lo scenario italiano 5.1 Le Linee guida CRUI: una policy comune per gli Atenei italiani Sulla scia del movimento internazionale Open Access, nel 2006 viene istituito presso la Commissione biblioteche della Conferenza dei Rettori delle Università Italiane 51 un Gruppo di lavoro con il compito di promuovere iniziative capaci di favorire la libera circolazione e la diffusione della ricerca scientifica in Italia. Uno dei sottogruppi viene incaricato di studiare ed elaborare indicazioni per l’accesso aperto alle tesi di dottorato in formato elettronico (Galimberti, 2008). Il lavoro del Gruppo ha portato alla stesura delle Linee guida per il deposito delle tesi di dottorato negli archivi aperti, approvate il 23 novembre 2007, il cui scopo principale è di rispondere alla necessità di stabilire uno standard nazionale per la raccolta e l’esposizione di questi prodotti della ricerca. Le Linee guida si presentano sottoforma di raccomandazioni di conformità nelle procedure da adottare da parte degli Atenei italiani per il deposito delle TDE negli archivi istituzionali e la successiva cattura automatica delle informazioni da parte delle due Biblioteche nazionali di Firenze e Roma, in funzione di fornitori di servizi. Si è inteso in questo modo mettere ordine in una situazione eterogenea e frammentata, in cui alcuni Atenei procedevano già autonomamente a raccogliere gli elaborati, oltre che in formato cartaceo, anche in formato elettronico nei propri archivi istituzionali, altri che ne lasciavano il deposito alla volontà del singolo autore, altri che lo rendevano obbligatorio, pur chiedendo una liberatoria, altri ancora che continuavano a raccoglierli solo in formato cartaceo o su CD-Rom. 50 51 <http://www.dart-europe.eu/basic-search.php>. Da ora in poi CRUI. 24 La natura scientifica 52 e amministrativa 53 di questi documenti ha permesso di intervenire con decisione e di stabilire dei punti fermi nella trattazione di una materia che non si presta a fraintendimenti. Innanzitutto attraverso una modifica dei regolamenti dei bandi di dottorato con la clausola del deposito obbligatorio nell’archivio istituzionale e presso le Biblioteche nazionali. Quest’ultima diventerà una presa d’atto da parte dell’autore. Nessuna autorizzazione sarà più necessaria e nessuna volontà individuale potrà disconoscere l’obbligo del deposito legale. Il dottorando dovrà essere consapevole che la sua tesi di dottorato è un documento pubblico, già dalla sua discussione e che sarà inserita in un archivio digitale e resa pubblica anche per via telematica. Il dottorando mantiene presso di sé il diritto d’autore sul testo della tesi, ovvero i diritti morali (paternità, integrità, ritiro dell’opera dal commercio), che non sono trasmissibili e i diritti di utilizzazione economica o patrimoniali (distribuzione, comunicazione, riproduzione, traduzione ecc.), che possono essere ceduti in parte o in esclusiva 54 . Il libero accesso alle TDE può subire delle restrizioni solo in alcuni motivati casi, circoscritti nel tempo, di cui i dottorandi devono essere a conoscenza: - brevetti; - alcune parti dell’elaborato sono state sottoposte ad un editore, sono in attesa di pubblicazione e l’editore non ne accetta una precedente pubblicazione ad accesso aperto; - la tesi è frutto di un progetto di ricerca finanziato da un ente esterno, che vanta per questo dei diritti su di essa e sulla sua pubblicazione; - temi sensibili da un punto di vista politico, commerciale o industriale; - sicurezza pubblica; - dati sensibili; - uso di materiale altrui non autorizzato: testi, foto, immagini; - materiale che comprenda informazioni ottenute sotto la promessa di riservatezza confidenzialità. In questi casi è possibile prevedere un periodo di secretazione (embargo) dai sei ai dodici mesi, trascorsi i quali la tesi diventa liberamente consultabile. 52 La tesi di dottorato si può definire una pubblicazione scientifica per la natura dei suoi contenuti, per la discussione pubblica alla fine del ciclo di studi, per il deposito obbligatorio presso le Biblioteche nazionali, che di fatto ne sanciscono la pubblicità. Allo stesso tempo, la sua produzione non è finanziata da editori, né il processo di validazione è affidato a loro. Difficilmente su di essa insistono diritti di terzi, né è necessario ottenere autorizzazioni per il deposito negli archivi istituzionali, in quanto già documento pubblico al momento della discussione (CRUI, 2007). 53 Il D.M. 224/1999, art. 6, comma 11 (Regolamento in materia di dottorato di ricerca) recita” Il titolo è rilasciato dal rettore dell’università che, a richiesta dell’interessato, ne certifica il conseguimento. Successivamente al rilascio del titolo, l’università medesima cura il deposito di copia della tesi finale presso le biblioteche nazionali di Roma e Firenze.” La legge 15 aprile 2004, n. 106 sul deposito legale non cita le tesi di dottorato, ma di fatto le fa ricadere fra i “documenti diffusi tramite rete informatica”, quindi oggetto di deposito legale. Nel Regolamento di attuazione DPR 252/2006, art. 37, tra le tipologie di documenti diffusi tramite rete informatica per i quali vale il deposito legale, al comma 3, legge testualmente “documenti concernenti la produzione scientifica delle università, dei centri di ricerca e delle istituzioni culturali”. 54 Per una esaustiva trattazione dell’argomento si rimanda all’addenda alle Linee guida, CRUI. Gruppo OA, Tesi di dottorato e diritto d’autore. Indicazioni per l’applicazione delle Linee guida per l’accesso aperto alle tesi di dottorato. <http://www.crui.it/download.aspx?catalogo=&folder=allegati&file=AddendaLineeGuidaTesi.pdf>. 25 Molto utili a fini pratici sono le raccomandazioni proposte infine dalle Linee guida, che mirano a regolamentare i comportamenti degli Atenei a riguardo. Oltre alla rettifica dei bandi di concorso, viene proposto l’uso di una declaratoria per i corsi già avviati, da mantenere anche in seguito come certificazione dell’integrità, l’autenticità e la conformità del documento depositato 55 . La declaratoria e l’auto-archiviazione sono due pratiche consigliate, perché sollevano l’Università da ogni responsabilità circa la natura del materiale depositato. E’ bene, inoltre, che per il deposito e il formato dei file ci si conformi ai requisiti richiesti dalle Biblioteche nazionali, che si adotti lo stesso schema di metadati, che si coinvolgano nel progetto tutti i soggetti interessati all’interno dell’Ateneo, che si integri l’archivio con il sistema di autenticazione di Ateneo, che si rendano esplicite le regole di funzionamento attraverso la massima pubblicità e coinvolgimento. Ad oggi sono 34 le Università italiane che applicano le Linee guida. 5.2 Deposito legale via harvesting automatico e riversamento dei dati nell’Indice SBN Le Linee guida prevedono anche la consegna per il deposito legale delle TDE alle Biblioteche nazionali di Firenze e Roma. In collaborazione con il Gruppo OA CRUI e nell’ambito del progetto Magazzini digitali 56 , le due BNC hanno implementato una procedura che permette di adempiere all’obbligo del deposito legale tramite raccolta automatica (harvesting) dei dati e dei metadati delle TDE. La procedura è stata autorizzata dalla Circolare n. 1746/2007 del MIUR e può essere adottata da tutti gli Atenei che raccolgono le tesi in un archivio istituzionale aperto, conforme al protocollo OAI-PMH e in raccordo con le raccomandazioni (formato dei file, metadati) contenute nelle Linee guida. I benefici di questa procedura sono evidenti: snellimento delle pratiche amministrative per gli Atenei, riduzione dei tempi di trattamento catalografico e bibliografico a carico della Bibliografia Nazionale Italiana e realizzazione di un servizio nazionale di raccolta e accesso alle TDE. Da una parte gli Atenei devono assolvere il compito di realizzare degli archivi istituzionali ad accesso aperto, predisposti per generare strutturalmente i metadati MPEG21DIDL ed esporli tramite il protocollo OAI-PMH. Questo formato è stato scelto in quanto permette di rappresentare risorse digitali anche composte da più file. Dall’altra tutte le fasi di deposito legale sono a carico delle due Biblioteche nazionali e si possono sintetizzare in questo modo (Bergamin, 2008): 55 Problema non di poco conto: la tesi di dottorato è un documento amministrativo, che ha valore giuridico. A rigore una TDE, essendo un documento informatico a conservazione illimitata, secondo il Dlgs. 235/2010, o nuovo Codice dell’amministrazione digitale, dovrebbe essere corredato da una firma elettronica qualificata o da una firma digitale. I costi di gestione di firme digitali per ogni studente sarebbero molto elevati e al momento sarebbe molto difficile da parte delle Università gestire una tale evenienza da un punto di vista archivistico (ICT4University. Tavolo tecnico Università digitale, 2011). 56 Il progetto Magazzini digitali, avviato nel 2006 dalla Fondazione Rinascimento Digitale, dalla Biblioteca Nazionale Centrale di Firenze e dalla Biblioteca Nazionale Centrale di Roma, si propone di realizzare depositi digitali accreditati e affidabili per la conservazione nel lungo periodo dei documenti elettronici pubblicati in Italia e diffusi attraverso la rete, in attuazione della normativa sul deposito legale. Si vedano in proposito: <http://www.rinascimento-digitale.it/magazzinidigitali.phtml>, <http://www.depositolegale.it>, <http://www.bncf.firenze.sbn.it/pagina.php?id=212>. 26 - - - - raccolta dei metadati secondo il protocollo OAI-PMH; raccolta del full-text a partire dall’identifier, lo URL che identifica univocamente la risorsa in rete mediante un crawler che registra anche i metadati di cattura e raccolta. Il crawler genera file di tipo WARC in grado di aggregare più risorse con relativi metadati in un unico file; verifica dei formati, in particolare se sono conformi ad alcuni requisiti come la traducibilità, che consente di mantenere nel tempo il controllo della risorsa. Il formato richiesto è il PDF/A. Se i file raccolti sono solo pdf vengono accettati con riserva e l’archivio istituzionale di partenza viene investito del problema 57 . acquisizione dei full-text e dei metadati nel servizio Magazzini digitali; invio delle ricevute di avvenuto deposito tramite e-mail all’amministratore dell’archivio istituzionale di partenza con l’impronta digitale della TDE in formato SHA-1 base 32 58 a garanzia dell’autenticità della risorsa depositata; l’accesso in rete delle TDE è per il momento consentito solo dalle postazioni interne delle Biblioteche nazionali. Questo almeno fino a quando non si saranno risolte con i fornitori dei dati le questioni riguardanti i metadati relativi ai diritti di accesso. Il riversamento dei dati nell’Indice SBN e negli opac delle due Biblioteche nazionali, fornitori del servizio di harvesting, non è ancora una realtà visibile per l’utente. In accordo con l’ICCU esse stanno lavorando al progetto di trattamento dei metadati delle TDE con interventi di normalizzazione, al fine di permettere il dialogo con l’Indice per le operazioni di import. Finora le tesi di dottorato, come tipologia di materiale propria, sono state escluse dall’inserimento in Indice, perché considerate letteratura grigia (Vignocchi, Bergamin, Messuti, 2010). 5.3 Uno standard nazionale per la raccolta e l’esposizione dei dati Dal 2007 le Linee guida assolvono il compito meritorio di aver aggregato numerose Università italiane intorno al progetto dell’accesso aperto alla letteratura scientifica. Oltre al richiamo verso comportamenti omogenei, ciò ha portato inevitabilmente all’elaborazione di uno standard nazionale per la raccolta e l’esposizione dei dati e dei metadati. Lo standard prevede: Formato del file PDF/A preferibile. I formati aperti sono accettati. Protocollo di scambio dei metadati I dati e i metadati delle TDE devono essere esposti attraverso il protocollo OAI-PMH. Formato dei metadati 57 Lo strumento di validazione utilizzato è Jhove (JSTOR/Harvard Object Validation Environment). Le funzioni hash per creare un’impronta digitale, a partire da un testo di lunghezza arbitraria, generano una stringa di lunghezza fissa. La trasformazione funziona in un solo senso: non è quindi possibile, dalla stringa generata, risalire al testo iniziale. L’hash è usata per attestare che il file non è stato alterato da virus o dall’intervento di un malintenzionato. 58 27 Il formato dei metadati supportato è MPEG21-DIDL 59 . Uso di oai_dc Ai fini dell’interoperabilità sintattica e semantica si richiede l’uso del seguente schema di metadati, definito sullo schema base Dublin Core. Dataset title creator Dublin Core dc:title dc:creator description dc:description language dc:language identifier dc:identifier type dc:type contributor dc:contributor date dc:date publisher dc:publisher format subjects rights dc:format dc:subject dc:rights Note Titolo della tesi Autore dell’opera (nel formato cognome, nome); non obbligatorio, ma raccomandato è l’indicazione dell’anno di nascita dell’Autore inserito con la seguente sintassi cognome, nome <anno> Abstract (meglio se in inglese) Lingua (nel formato ISO639-1) URL a cui raggiungere il full-text della tesi o a una pagina intermedia Tipologia di materiale, da impostare di default come Doctoral Thesis è importante per il recupero dei dati usare la forma inglese Nome del tutor (nella forma cognome, nome) Data di discussione della tesi (min. anno) Nome dell’università (è importante perché l’università di provenienza rende esplicito il valore della tesi) Opzionale (mime type, size) Settore Scientifico Disciplinare MIUR Va espresso secondo il vocabolario info:eu-repo. Vedi tesi in embargo Identificatore OAI univoco I record esposti via oai-pmh devono avere un identificatore univoco, comunemente legato alla base URL dell’archivio. Evidenza dell’avvenuto deposito A riprova dell’avvenuto deposito, una e-mail viene inviata all’amministratore dell’archivio con allegato un file .xml con l’elenco degli URI delle tesi depositate e la relativa impronta digitale in formato SHA-1 base32. 59 Dal sito depositolegale.it <http://www.depositolegale.it/tesi-di-dottorato/#configurazione>, “La scelta di tale formato è dettata dalla necessità di poter identificare risorse digitali (tesi) composte da più file. MPEG21-DIDL permette di identificare con precisione i componenti (didl:Component) della risorsa (didl:Item) e la cosiddetta JOP (jump off page), url della pagina web che riporta informazioni sulla risorsa utili alla consultazione mediante un browser. L’uso del solo Dublin Core (oai_dc) permette di identificare, attraverso dc:identifier, solo la jump off page, senza ulteriori informazioni sui componenti. In casi di eccezione, quali l’utilizzo di software autoprodotti o non supportanti DIDL, l’harvesting può essere effettuato usando oai_dc, esclusivamente se le tesi sono composte da un solo file riportato in dc:identifier.” 28 5.4 CamEprints: l’archivio istituzionale delle tesi di dottorato presso l’Università di Camerino L’archivio istituzionale di Ateneo dell’Università di Camerino, CamEprint 60 , è stato implementato nel 2006 e le prime TDE inserite risalgono proprio quell’anno. L’Università si è fatta carico di seguire da vicino fin dal suo esordio gli sviluppi del lavoro che il Gruppo Open Access della Commissione Biblioteche stava svolgendo presso la CRUI. Sulla scia delle novità intervenute a seguito della pubblicazione delle Linee guida nel 2007, si è provveduto ad adeguare, secondo le nuove regole, sia le norme riguardanti il deposito con un nuovo articolo inserito del Regolamento della Scuola di Alta Formazione 61 , sia il deposito legale presso le Biblioteche Nazionali attraverso la procedura di harvesting automatico per la quale una apposita convenzione è stata stipulata con il fornitore del servizio. L’archivio non nasce come unicamente destinato alle TDE. Nelle intenzioni dei promotori ed implementatori (bibliotecari e dipartimento ITC) del progetto, esso è destinato ad ospitare materiali misti. Vero è che ad oggi il deposito è obbligatorio solo per le TDE e non per altre pubblicazioni prodotte in seno all’Ateneo 62 . Attualmente l’archivio ospita 189 TDE e 22 tra articoli, recensioni, materiali didattici. E’ inserito nel circuito Pleiadi ed i suoi contenuti sono ricercabili anche attraverso questo portale. I dati relativi alla reperibilità in rete di CamEprints e le sue politiche mandatarie sono disponibili anche in ROARMAP 63 . Il deposito delle TDE in CamEprints è affidato al dottorando attraverso la procedura di auto-archiviazione, ovvero si incoraggiano gli utenti a registrarsi nel sistema e a provvedere all’upload del proprio elaborato. Non si è però abbandonata la pratica di provvedere al loro inserimento ad opera di un bibliotecario, laddove necessario. Dopo l’espletamento delle pratiche amministrative e burocratiche e il deposito contestuale nella segreteria della Scuola di Alta Formazione di una copia della tesi su CD o DVD, questa viene inviata all’addetto per la catalogazione ed l’inserimento. Nel primo caso, invece, si provvede soltanto al completamento e controllo del record prodotto, al controllo del formato e alla validazione finale. Le TDE non sono inserite contestualmente nell’Opac di Ateneo. L’archivio non è al momento integrato con il sistema di gestione dei dati amministrativi e con l’anagrafe iscritti e neanche con l’ILS Aleph in dotazione delle biblioteche per la catalogazione semiautomatica in UNIMARC. 60 <http://cameprints.unicam.it/>. "Art. 13:5 (Conseguimento del titolo). L'Università archivierà e renderà consultabile in rete il testo completo della tesi di dottorato attraverso l'archivio istituzionale ad accesso aperto dell’Ateneo, che ne garantirà la conservazione e la pubblica consultabilità. All'atto della consegna il dottorando dovrà firmare una declaratoria relativa alla pubblica accessibilità della tesi. Potrà essere concesso, su motivata richiesta del Dottorando, un periodo, comunque non superiore ai 3 anni, in cui la tesi non sia consultabile da parte di terzi, ai fini della tutela e sfruttamento economico delle opere dell’ingegno e/o delle proprietà industriali. Sarà cura dell'Università effettuare il deposito a norma di legge presso le Biblioteche Nazionali di Roma e Firenze." 62 Per il prossimo futuro nell’ambito di un progetto di digitalizzazione di libri antichi in possesso delle Biblioteche di Ateneo si sta studiando la possibilità di utilizzare CamEprints anche per ospitare questa tipologia di materiale. 63 <http://roarmap.eprints.org/>. 61 29 La scelta del software è caduta su EPrints 64 per le sue caratteristiche di gratuità e flessibilità. EPrints è stato sviluppato dalla University of Southampton ed è fra i più diffusi in Italia e a livello internazionale. CamEprints sta utilizzando la release 3.1. I formati di metadati supportati sono: oai_dc, uketd_dc, mpeg21-didl, mets, context_object. Il sistema utilizza tutti i dodici campi Dublin Core richiesti dallo standard nazionale, ma non ne ha sviluppati ulteriori a livello locale, che possano insistere soltanto sull’archivio istituzionale e non essere utilizzati per l’esportazione verso i service provider. Da parte degli amministratori del sistema è stato fatto uno sforzo notevole di dare, in modo semplice, attraverso l’interfaccia web tutte le istruzioni su come utilizzare la funzione di autoarchiviazione, prevedendo tutte le possibili opzioni: caricamento in locale, da un sito web, file singolo, file multipli. 6. Conclusioni Le Linee guida CRUI rappresentano un traguardo molto importante. Hanno stabilito uno standard, hanno dato norme di comportamento in un settore ancora tutto da esplorare quale l’accesso aperto alla conoscenza e alla ricerca scientifica. Molto è ancora da fare, anche nel settore delle TDE, soprattutto se si parla di disseminazione e conservazione nel lungo periodo. Sullo scenario internazionale sembra che molti problemi riguardanti la visibilità di questi materiali siano stati risolti grazie a progetti nazionali dedicati, con procedure standard e pressoché completamente automatizzate, che a volte passano anche attraverso le biblioteche nazionali, come in Gran Bretagna e in Germania. Quando si parla invece di conservazione, l’impressione è che si tratti comunque di lavoro in corso di svolgimento sul quale non esistono che risultati parziali. Per quel che riguarda la situazione italiana, su fronte della disseminazione molto lavoro di comunicazione e advocacy deve essere fatto per far in modo che anche l’altra metà delle Università italiane riescano ad entrare nel circuito di harvesting per il deposito delle TDE. Ci sono Atenei che non dispongono di archivi istituzionali. Ancora a settembre 2010, trentuno Università italiane continuano a consegnare alle Biblioteche nazionali le tesi prodotte nel proprio Ateneo su CDRom, tanto da indurre la Nazionale di Firenze ad investire del problema il MIBAC e la CRUI per la difficoltà di trattamento catalografico e messa in disponibilità che questa mole di materiale (18mila tesi in tre anni) comporta. Si auspica che questa situazione difforme venga superata nel prossimo futuro e che tutte le Università italiane vadano verso la raccolta delle TDE in archivi istituzionali in grado di esporre i dati 64 EPrints è un software gratuito e con il codice sorgente disponibile, è interamente basato su standard (XML, HTML, CSS, SQL) e su strumenti open-source (Web server Apache, linguaggio Perl e database MySql); è ricco di funzionalità; l’interfaccia grafica è personalizzabile e l’insieme dei metadati estensibile; è basato sull’autoarchiviazione, ma con la possibilità da parte dello staff-editoriale di intervenire sui metadati; gli utenti possono consultare il contenuto avvalendosi delle funzioni di ricerca base e avanzata; possiede un sistema di alerting; è predisposto per supportare il protocollo per l’harvesting dei metadati definito da OAI (Pasqui, 2003?). 30 verso le Biblioteche nazionali e che possa entrare a regime il riversamento dei metadati nell’Indice SBN. Questi potrebbero essere i due punti fermi verso altri significativi passi successivi, ovvero un archivio nazionale delle TDE in grado di dialogare per interoperabilità sintattica e semantica, grazie a standard comuni, con partner a livello europeo e internazionale e non lasciare alla volontà della singola istituzione la richiesta di vedere indicizzati i propri archivi, anche se questa è sempre una strada percorribile 65 . Tutto questo ha forti ripercussioni anche sul trattamento conservativo. In generale, si può dire che nessun Ateneo ha previsto un piano di conservazione dei propri documenti digitali, perché troppo oneroso. Non dimentichiamo che una tesi di dottorato è un documento scientifico prodotto in seno ad una comunità e la rappresenta. Nello stesso tempo è un documento amministrativo che va conservato con fini giuridici e in quanto documento informatico, secondo la normativa vigente, va conservato secondo precise regole 66 . Solo progetti cooperativi e condivisi possono essere validi in questo contesto, per una suddivisione dei costi e per una condivisione delle procedure. 7. Bibliografia Alemneh, D.G. (2011) “Assessing the Usage of Electronic Theses and Dissertations: An Overview of ETD Statistics and Metrics in the UNT Libraries”. Proceedings of the 14th International Symposium on Electronic Theses and Dissertations, Cape Town, South Africa, 13-17 September 2011. UNT Digital Library.[Online] http://digital.library.unt.edu/ark:/67531/metadc32969/. Arabito, S. et al. (2008) “Le linee guida per l’accesso aperto alle tesi di dottorato”, AIDA informazioni, 26, n. 3-4, pp. 73-89. [Online] http://eprints.rclis.org/bitstream/10760/12459/1/arabito-etal342008.pdf. Bailey, C.W. Jr. (2011) The Institutional Repository and ETD Bibliography. [Online] http://digital-scholarship.org/iretd/iretd2011.htm. Bertot, J.C. (2001) “Measuring service quality in the networked environment: approaches and considerations”, Library trends, 49(4), p. 758-75, Infotrac [Online] http://pdfserve.galegroup.com/pdfserve/get_item/1/S589960w4_1/SB432_01.pdf Beazley, M.R. (2010) “Eprints Institutional Repository Software: A Review”, Partnership: The Canadian Journal of Library and Information Practice and Research, 5(2). [Online] http://journal.lib.uoguelph.ca/index.php/perj/article/viewArticle/1234. Becker, C. et al. (2007) “Long-term Preservation of Electronic Theses and Dissertations: a Case Study in Preservation Planning”, Proceedings of the 9th Russian Conference on 65 Ad es. ad oggi le istituzioni universitarie italiane che contribuiscono a Dart-Europe sono soltanto otto. Il DPR 513/1997 recita: "Il documento informatico da chiunque formato, l’archiviazione su supporto informatico e la trasmissione con strumenti telematici, sono validi e rilevanti a tutti gli effetti di legge se conformi alle disposizioni del presente regolamento". Conservare un documento informatico significa mantenere nel tempo la capacità di riprodurlo con il contenuto e la forma originaria. 66 31 Digital Libraries RCDL’2007, Pereslavl, Russia. [Online] http://rcdl2007.pereslavl.ru/papers/paper_22_v2.pdf. Bevan, S.J. & P. Needham (2009) “Statistics – can we count on them?”, ETD 2009. 12th Symposium on Electronic Theses and Dissertations, University of Pittsburgh, June 1013, 2009. [Online] http://conferences.library.pitt.edu/ocs/viewpaper.php?id=713&cf=7. Bergamin, G. (2008) “Il deposito per il lungo periodo delle tesi di dottorato in formato digitale: molti problemi si possono risolvere”, in Cristalli di esperienza: Nuove prospettive e scenari per le tesi di dottorato: conservazione, accessibilità, certificazione, formati, integrazione con Open Access, Convegno CNBA, Torino, 23 maggio 2008, p. 21-25. Bergamin, G. & M. Messina (2010) “Magazzini digitali: dal prototipo al servizio”, Digitalia, (5)2, pp. 144-153. [Online] http://www.bncf.firenze.sbn.it/documenti/MagazziniDigitali_Digitalia_2010.pdf. Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities, 22 ottobre 2003. [Online] http://oa.mpg.de/berlin-prozess/berliner-erklarung/. Bollini, A. & N. De Paoli (2010) Harvesting delle tesi di dottorato delle Biblioteche Nazionali tramite Dspace. Milano, Cilea, 14 settembre. [Online] http://www.aepic.it/docs/dspace/DocumentazioneHarvestingBNCF.pdf. Boock, M. & S. Kunda (2009) "Electronic Thesis and Dissertation Metadata Workflow at Oregon State University Libraries" Cataloging & Classification Quarterly, (47)3/4, pp. 297-308. [Online] http://ir.library.oregonstate.edu/jspui/handle/1957/11396. Brown, J. & K. Sadler (2010) Vision, Impact, Success: Mandating Electronic Theses. Case Studies of E-theses Mandates in Practice in the UK Higher Education Sector. London: University College London. [Online] http://eprints.ucl.ac.uk/116947/. Brown, J. (2010) Literature Review of Research into Attitudes towards Electronic Theses and Dissertations (ETDs). UCL Eprints. [Online] http://eprints.ucl.ac.uk/20424/. Budapest Open Access Initiative (2002). [Online] http://www.soros.org/openaccess/read. Calvi, L. & Geudens, A. (2008) Expert evaluation of an institutional repository. In: Third International Conference on Open Repositories 2008, 1-4 April 2008, Southampton, United Kingdom. [Online] http://pubs.or08.ecs.soton.ac.uk/47/ Casilio, G. (2006) “Gli open archives delle università italiane”, Bibliotime, 9(3). [Online] http://didattica.spbo.unibo.it/bibliotime/num-ix-3/casilio.htm. Cassella, M. (2006) “Statistiche d’uso delle risorse elettroniche remote”, Biblioteche oggi, 1, pp. 48-61. Cassella, M. (2008) “I depositi istituzionali tra politiche mandatarie e strategie a sostegno dell’auto-archiviazione”, AIDA informazioni, 26(3-4), pp. 13-28. 32 Copeland, S., A. Penman, & R. Milne (2005), “Electronic theses: the turning point”, Program: electronic library and information systems, 39(3), pp. 185-197. [Online] https://openair.rgu.ac.uk/handle/10059/40. Crow, R. (2002) The Case for Institutional Repositories: A SPARC Position Paper, Washington: SPARC. [Online] http://scholarship.utm.edu/20/1/SPARC_102.pdf. Crow, R. (2004) A Guide to Institutional Repository Software. 2nd ed. New York: Open Society Institute. [Online] http://www.soros.org/openaccess/pdf/OSI_Guide_to_Institutional_Repository_Softwar e_v2.pdf. CRUI. Conferenza dei rettori delle Università italiane, Tesi di dottorato di ricerca: deposito legale via harvesting automatico e riversamento dei dati nell’Indice SBN. [Online] http://www.crui.it/HomePage.aspx?ref=1891#. CRUI. Conferenza dei rettori delle Università italiane, (2007) Linee guida per il deposito delle tesi di dottorato negli archivi aperti. [Online] http://www.crui.it/homepage.aspx?ref=1149. CRUI. Gruppo OA, Tesi di dottorato e diritto d’autore. Indicazioni per l’applicazione delle Linee guida per l’accesso aperto alle tesi di dottorato. [Online] http://www.crui.it/HomePage.aspx?ref=1891#. CRUI. Gruppo OA (2009) Linee guida per gli archivi istituzionali. [Online] http://www.crui.it/HomePage.aspx?ref=1781#. Day, M. (1999) “Dublin Core to UNIMARC: Mapping Dublin Core to UNIMARC”, UKOLN. [Online] http://www.ukoln.ac.uk/metadata/interoperability/dc_unimarc.html. De Robbio, A. & P. Galimberti (2011) Dottorandi e diritti: linee guida sulle tesi di dottorato ad accesso aperto. [Online] http://paduaresearch.cab.unipd.it/dottorato/dottorandi_e_diritti.pdf. Dichiarazione di Messina, (2004) Gli atenei italiani per l'Open Access: verso l'accesso aperto alla letteratura di ricerca. Documento italiano a sostegno della Dichiarazione di Berlino sull’accesso aperto alla letteratura accademica, Messina, 4 novembre 2004. [Online] http://www.aepic.it/conf/Messina041/viewpaper5af5.pdf?id=49&cf=1 Dolan, M. (2011) “Assessing Awareness of Repositories and the Open Access Movement Among ETD Faculty Advisors”, International Symposium on Electronic Theses and Dissertations, Cape Town, South Africa, 13-17 September 2011. [Online] http://dl.cs.uct.ac.za/conferences/etd2011/papers/etd2011_dolan.pdf Dublin Core Metadata Element Set, ver. 1.1. [Online] http://dublincore.org/documents/dces/. Edminster, J. & J. Moxley (2002) “Graduate Education and the Evolving Genre of Electronic Theses and Dissertations”, Computers and Composition, 19, pp. 89-104. [Online] http://scholar.lib.vt.edu/presentations/ETDgenreALL.pdf. D.M. 30 aprile 1999, n. 224 (Regolamento in materia di dottorato di ricerca). 33 D.M. 22 ottobre 2004, n. 270 (Modifiche al regolamento recante norme concernenti l'autonomia didattica degli atenei). Dublin Core Metadata Element Set, Version 1.1 (2010). [Online] http://dublincore.org/documents/dces/. Dublin Core Metadata Initiative. [Online] http://dublincore.org/. ETD Guide. The Guide for Electronic Theses and Dissertations. [Online] http://en.wikibooks.org/wiki/ETD_Guide. [Ultima modifica: 19 agosto 2010]. ETD-MS: an Interoperability Metadata Standard for Electronic Theses and Dissertations Ver. 1.00, rev. 2. [Online] http://www.ndltd.org/standards/metadata/etd-ms-v1.00rev2.html. [Ultima modifica: 25 giugno 2008]. EUA Working Group on Open Access (2008) Recommendations adopted by the EUA Council on 26th of March 2008 (University of Barcelona, Spain). [Online] http://www.eua.be/eua-work-and-policy-area/research-and-innovation/OpenAccess.aspx. Fay, E. (2010) “Repository Software Comparison: Building Digital Library Infrastructure at LSE”, Ariadne, 64. [Online] http://www.ariadne.ac.uk/issue64/fay/. Feliciati, P. (2009) “Gestione e conservazione di dati e metadati: quali standard?”, Conservare il digitale, Macerata, 7-8 maggio 2009. [Online] http://www.task.sinp.net/convegni/070509/materiale/Feliciati_rela01.pdf. Fyffe, R. & W.C. Welburn (2008) “ETDs, scholarly communication, and campus collaboration”, C&RL News, March, pp. 152-155. Galimberti, P. (2008) “Le Linee guida per l'accesso aperto alle tesi di dottorato”, in Cristalli di esperienza: Nuove prospettive e scenari per le tesi di dottorato: conservazione, accessibilità, certificazione, formati, integrazione con Open Access, Convegno CNBA, Torino, 23 maggio 2008. [Online] http://eprints.rclis.org/bitstream/10760/11722/1/relazione_Torino_23052008.pdf . Greenberg, C. & C.A. McLean (2011) “Where Sharing Should Not Go: An Environmental Scan of Originality Assurance Awareness and Efforts to Discourage or Prevent Plagiarism”, International Symposium on Electronic Theses and Dissertations, Cape Town, South Africa, 13-17 September 2011. [Online] http://dl.cs.uct.ac.za/conferences/etd2011/papers/etd2011_greenberg.pdf Guerrini, M. (2010) Gli archivi istituzionali. Milano: Editrice bibliografica. Guy, M., A. Powell, & M. Day (2004) “Improving the Quality of Metadata in Eprint Archives”, Ariadne, no. 38. [Online] http://www.ariadne.ac.uk/issue38/guy/. Harnad, S. (1995) “A Subversive Proposal”. In: Ann Okerson & James O'Donnell (Eds.) Scholarly Journals at the Crossroads; A Subversive Proposal for Electronic Publishing. Washington, DC., Association of Research Libraries, June 1995. [Online] http://www.ecs.soton.ac.uk/~harnad/subvert.html. 34 Harnad, S. (2009) “Integrating Universities' Thesis and Research Deposit Mandates”, ECS EPrints Repository. [Online] http://eprints.ecs.soton.ac.uk/18032/. Harnad, S. & N. McGovern (2009) "Topic 4: Institutional Repository Success Is Dependent upon Mandates”, Bulletin of the American Society for Information Science and Technology, 35(4), 27-31. [Online] http://www.asis.org/Bulletin/Apr09/AprMay09_Harnad-McGovern.pdf. ICCU. Istituto Centrale per il Catalogo Unico, Mapping Dublin Core / UNIMARC. [Online] http://www.iccu.sbn.it/opencms/opencms/en/main/standard/metadati/pagina_118.html.[ Ultima modifica: 28 aprile 2011]. ICT4University. Tavolo tecnico Università digitale (2011) Tesi di laurea, tesi di dottorato e dissertazioni elettroniche. Linee guida per la digitalizzazione e conservazione archivistica a norma. Linee guida in elaborazione [Online] http://www.ict4university.gov.it/media/59653/lineeguidadissertazionielettroniche.pdf Jackson, A.S. et al. (2008) “Dublin Core Metadata Harvested through OAI-PMH”, Journal of Library Metadata, 8(1). [Online] http://www.ideals.illinois.edu/handle/2142/9091. Johnson, R.K. (2002) “Institutional repositories. Partnering with Faculty to Enhance Scholarly Communication”, D-Lib Magazine, November, 8(11). [Online] http://www.dlib.org/dlib/november02/johnson/11johnson.html. Kim, J. (2005) “Finding Documents in a Digital Institutional Repository: DSpace and Eprints”, 68th Annual Meeting of the American Society for Information Science and Technology (ASIST), Charlotte (US), 2 8 October - 2 November 2005. [Online] http://hdl.handle.net/10760/6964. Lagoze, C. & H. Van de Sompel (2008) The Open Archives Initiative Protocol for Metadata Harvesting, Protocol Version 2.0, 2002. Document Version 2008. Open Archives Initiative. [Online] http://www.openarchives.org/OAI/openarchivesprotocol.htm. L. 341/1990 (Riforma degli ordinamenti didattici universitari). L. 210/1998 (Norme per il reclutamento dei ricercatori e dei professori universitari di ruolo). L. 240/2010, art. 19 (Disposizioni in materia di dottorato di ricerca). L. 633/1941(Protezione del diritto d'autore e di altri diritti connessi al suo esercizio). Lynch, C.A. (2003) “Institutional Repositories: Essential Infrastructure for Scholarship in the Digital Age”, ARL: A Bimonthly Report, no. 226, pp. 1-7. [Online] http://scholarship.utm.edu/21/1/Lynch,_IRs.pdf. Lynch, C.A. (2001) “Metadata Harvesting and the Open Archives Initiative”, ARL: A Bimonthly Report, no. 217 (August 2001). [Online] http://www.arl.org/resources/pubs/br/br217/br217mhp.shtml. Lubas, R.L. (2009) “Defining best practices in electronic thesis and dissertation metadata”, Journal of library metadata, 9(3), pp. 252-263. [Online] http://repository.unm.edu/handle/1928/12350. 35 McMillan, G. (2001) “Do ETDs Deter Publishers? Coverage from the 4th International Symposium on ETDs”, College and Research Libraries News, 62(6), pp. 620-621. McMillan, G. et al. (2011) “An investigation of ETDs as prior publications. Findings from the 2011 NDLTD Publishers’ Survey”, presented at International Symposium on Electronic Theses and Dissertations, Cape Town, South Africa, 13-17 September 2011, in University Library Faculty Publications. Paper 53. [Online] http://digitalarchive.gsu.edu/univ_lib_facpub/53. Magazzini Digitali. Servizio nazionale coordinato di conservazione e di accesso a lungo termine per le risorse digitali, http://www.depositolegale.it/. MIBAC. Circolare sul deposito legale delle tesi di dottorato, 29 settembre 2010. MIUR. Circolare n. 1746 del 20 luglio 2007. Moxley, J.M. (2001) “American Universities Should Require Electronic Theses and Dissertations”, Educause Quarterly, 3, pp. 61-63. NDLTD. Networked Digital Library of Theses and Dissertations. [Online] http://www.ndltd.org/. NISO (2004) Understanding metadata. Bethesda: NISO. [Online] http://www.niso.org/publications/press/UnderstandingMetadata.pdf. OA CRUI. Tesi di dottorato e diritto d’autore. Indicazioni per l’applicazione delle Linee guida per l’accesso aperto alle tesi di dottorato. [Online] http://www.openstarts.units.it/AddendaLineeGuidaTesi.pdf. Open Archives Initiative. [Online] http://www.openarchives.org/. Open Archives Forum. [Online] http://www.oaforum.org. Open Archives Forum (2003) Inventory of Open Archive Software Tools. [Online] http://www.oaforum.org/resources/tvtools.php. OpenDOAR. Directory of Open Access Repositories. [Online] http://www.opendoar.org/. Open Society Institute (2004) A Guide to Institutional Repository Software. 3rd ed. New York: Open Society Institute. [Online] http://www.soros.org/openaccess/pdf/OSI_Guide_to_IR_Software_v3.pdf. Palombo, M. & E. Garbarino (2006) Ricerca sociale: metodo e tecniche. Milano: Angeli. Pasqui, V. (2003?) Archivi e-prints & Open Archives Initiative [Online] http://eprints.unifi.it/archive/00000462/01/1_multipart_xF8FF_2_Relazione_ValdoPasqui.pdf. Patton, M.Q. (1990) Qualitative evaluation and research methods. 2nd edn. Newbury Park, CA: Sage. 36 Pigliapoco S. & S. Allegrezza (2008) Produzione e conservazione del documento digitale. Requisiti e standard per i formati elettronici, vol. 1 (a cura di S. Pigliapoco), Macerata: EUM. Pleiadi. Portale per la letteratura scientifica elettronica italiana su archivi aperti e depositi istituzionali. [Online] http://www.openarchives.it/pleiadi/. Polfreman, M. & S. Rajbhandari (2009) MetaTools. Investigating Metadata Generation Tools: Final Report. London: JISC. [Online] http://www.jisc.ac.uk/publications/documents/metatools.aspx. Poll, R. (2001) “Performance Indicators for the Digital Library”, Liber Quarterly, 11, pp. 244-258. [Online] http://liber.library.uu.nl/publish/articles/000423/article.pdf. Progetto Minerva (2007) Linee guida tecniche per i programmi di creazione di contenuti culturali digitali. Edizione italiana 2.0. [Online] http://www.minervaeurope.org/publications/lineeguidatecnicheita/metadati.html. Reeves, S. (2010) How to Set Up an ETD Submission Program. [Online] http://www.ndltd.org/resources/how-to-set-up-an-etd-submission-program. [Ultima modifica: 4 giugno 2010] Suber, P. (2004) Open access overview. Focusing on open access to peer reviewed research articles an their preprints. http://www.earlham.edu/~peters/fos/overview.htm [Ultima modifica: 6 novembre 2010]. UK ETD Metadata Core Set. [Online] http://www2.rgu.ac.uk/library/guidelines/metadata.html. UKOLN, (2002) Mapping between metadata formats. [Online] http://www.ukoln.ac.uk/metadata/interoperability/. [Ultima modifica: 22 maggio 2002]. Unimarc Committee, (2004) UNIMARC/Dublin Core Mapping. Version 1.0. [online] http://www.unimarc.net/dubin-core-map.html. Vignocchi, M.L. (2007) “Un futuro migliore per le tesi di dottorato”, Bibliotime, 10(2). [Online] http://didattica.spbo.unibo.it/bibliotime/num-x-2/vignocch.htm Vignocchi, M.L., Bergamin, G., Messuti, R. (2010) “Tesi di dottorato: stato dell’arte, iniziative in corso, scenari possibili”, Bibliotime, 13(3). [Online] http://spbo.unibo.it/bibliotime/num-xiii-3/vignocchi.htm Weenink, K., L. Waaijers & K. van Godtsenhoven (2008) A DRIVER’s Guide to European Repositories, Amsterdam: Amsterdam University Press. Wikipedia, Open access [voce]. [Online] http://it.wikipedia.org/wiki/Open_access. 37