Testo
Transcript
Testo
Archivi Multimediali e Data Mining Esercitazione 1 Vincenzo D’Elia [email protected] 28 settembre 2009 1 Obiettivo Obiettivo della prima esercitazione di laboratorio é l’apprendimento delle nozioni di base riguardanti Greenstone. In questa esercitazione verrá costruita una piccola collezione dedicata a Henri de Toulouse-Lautrec. Per questa esercitazione la fonte di materiale sará Wikipedia. Mentre per i testi non ci sono problemi, non tutte le immagini potrebbero essere sotto licenza Creative Commons. Assicuratevi quindi sempre che la licenza vi permetta il libero utilizzo del materiale1 . 2 Esecuzione al LABINF Il software necessario per lo svolgimento di questa esercitazione é disposibile presso il LABINF solo sotto Windows. Una volta effettuato il login su una macchina, trovate i componenti di Greenstone all’interno del menu Start. Andate quindi in Start > Programs > Greenstone ... e lanciate Greenstone Librarian. Nella prima finestra che compare fate click su Restart Library. Salvare il proprio lavoro Per salvare quanto svolto in laboratorio, in modo da poter eventualmente proseguire in un secondo momento, é necessario procedere come segue: 1. se aggiungete nuovi metadati, estendete Dublic Core anziché creare nuovi namespace; questo evita problemi nel momento in cui volete proseguire il lavoro da un’altra installazione 1 Ad ogni immagine é associata una pagina contenente informazioni relative alla licenza 1 2. é sufficiente andare in C:\ Program Files\ Greenstone \ collect e copiare la directory contenente la propria collezione. Il nome della directory é riportato tra parentesi vicino al titolo della collezione quando si esegue File > Open in Greenstone Librarian Interface 3 Creazione della collezione 1. Create una nuova collezione intitolata Toulouse-Lautrec 2. Assegnate alla collezione • Creator’s email • Maintainer’s email 3. Modificate la descrizione in modo da rendere in grassetto alcune sue parti2 . 4 Importazione di file HTML Inserimento di semplici documenti HTML. 1. Costruite una semplice pagina html organizzata nel seguente modo <html> <head><title>Toulouse-Lautrec</title></head> <body> <h1>Henri de Toulouse-Lautrec</h1> <!-- testo da wikipedia se volete --> <h2>Biografia</h2> <h3>Giovinezza</h3> <h3>Parigi</h3> <h2>Musei</h2> </body> </html> Potete eventualmente arricchire la pagina con le informazione presenti su Wikipedia, 2 nel campo descrizione é possibile inserire HTML 2 2. Importate questa pagina nella vostra collezione Greenstone ( abilitate l’opzione tidy html di HTMLPlug) 3. Configurate il plugin opportuno in modo da rendere la pagina divisa e navigabile per sezioni • opzione sectionalize using h tags di HTMLPlug 4. Assegnate un’immagine di frontespizio al documento • Format > Format Features, scegliere DocumentImages, Add Format, settare enabled • Se la pagina html ha nome xyz.html aggiungere nella stessa directory un file chiamato xyz.jpg Opzionale (a) Create su Greenstone una directory Luoghi (b) Aggiungere pagine (anche vuote, contenenti i tag <h*>) relative a Albi, Parigi, Montmartre, Moulin Rouge 5 Importazione di immagini Il materiale di riferimento si trova all’indirizzo http://commons.wikimedia.org/wiki/Henri de Toulouse-Lautrec. 1. Aggiungete alla collezione un ritratto dell’artista 2. Aggiungete alla collezione alcune immagini relative a quadri e manifesti. Di ogni immagine si vuole conoscere la tecnica utilizzata, l’anno di realizzazione e il luogo in cui l’opera é conservata 6 Ricerca Costruite indici che permettano 1. ricerca full text nei documenti inseriti 2. ricerca combinata luogo, anno 3 7 Navigazione Devono essere presentate le seguenti navigazioni 1. Immagini ordinate (alfabeticamente) per anno di realizzazione 2. Immagini raggruppate per luogo in cui sono conservate 3. Immagini categorizzate per tecnica 4. Immagini categorizzate in Ritratti, Dipinti, Manifesti 4