Testo

Transcript

Testo
Archivi Multimediali e Data Mining
Esercitazione 1
Vincenzo D’Elia
[email protected]
28 settembre 2009
1
Obiettivo
Obiettivo della prima esercitazione di laboratorio é l’apprendimento delle nozioni di base riguardanti Greenstone.
In questa esercitazione verrá costruita una piccola collezione dedicata a Henri
de Toulouse-Lautrec.
Per questa esercitazione la fonte di materiale sará Wikipedia.
Mentre per i testi non ci sono problemi, non tutte le immagini potrebbero essere sotto licenza Creative Commons. Assicuratevi quindi sempre che la
licenza vi permetta il libero utilizzo del materiale1 .
2
Esecuzione al LABINF
Il software necessario per lo svolgimento di questa esercitazione é disposibile
presso il LABINF solo sotto Windows.
Una volta effettuato il login su una macchina, trovate i componenti di
Greenstone all’interno del menu Start.
Andate quindi in Start > Programs > Greenstone ... e lanciate Greenstone
Librarian.
Nella prima finestra che compare fate click su Restart Library.
Salvare il proprio lavoro
Per salvare quanto svolto in laboratorio, in modo da poter eventualmente proseguire in un secondo momento, é necessario procedere come segue:
1. se aggiungete nuovi metadati, estendete Dublic Core anziché creare nuovi
namespace; questo evita problemi nel momento in cui volete proseguire il
lavoro da un’altra installazione
1 Ad
ogni immagine é associata una pagina contenente informazioni relative alla licenza
1
2. é sufficiente andare in C:\ Program Files\ Greenstone \ collect e copiare la directory contenente la propria collezione. Il nome della directory
é riportato tra parentesi vicino al titolo della collezione quando si esegue
File > Open in Greenstone Librarian Interface
3
Creazione della collezione
1. Create una nuova collezione intitolata Toulouse-Lautrec
2. Assegnate alla collezione
• Creator’s email
• Maintainer’s email
3. Modificate la descrizione in modo da rendere in grassetto alcune sue parti2 .
4
Importazione di file HTML
Inserimento di semplici documenti HTML.
1. Costruite una semplice pagina html organizzata nel seguente modo
<html>
<head><title>Toulouse-Lautrec</title></head>
<body>
<h1>Henri de Toulouse-Lautrec</h1>
<!-- testo da wikipedia se volete -->
<h2>Biografia</h2>
<h3>Giovinezza</h3>
<h3>Parigi</h3>
<h2>Musei</h2>
</body>
</html>
Potete eventualmente arricchire la pagina con le informazione presenti su
Wikipedia,
2 nel
campo descrizione é possibile inserire HTML
2
2. Importate questa pagina nella vostra collezione Greenstone ( abilitate
l’opzione tidy html di HTMLPlug)
3. Configurate il plugin opportuno in modo da rendere la pagina divisa e
navigabile per sezioni
• opzione sectionalize using h tags di HTMLPlug
4. Assegnate un’immagine di frontespizio al documento
• Format > Format Features, scegliere DocumentImages, Add Format,
settare enabled
• Se la pagina html ha nome xyz.html aggiungere nella stessa directory
un file chiamato xyz.jpg
Opzionale
(a) Create su Greenstone una directory Luoghi
(b) Aggiungere pagine (anche vuote, contenenti i tag <h*>) relative a
Albi, Parigi, Montmartre, Moulin Rouge
5
Importazione di immagini
Il materiale di riferimento si trova all’indirizzo
http://commons.wikimedia.org/wiki/Henri de Toulouse-Lautrec.
1. Aggiungete alla collezione un ritratto dell’artista
2. Aggiungete alla collezione alcune immagini relative a quadri e manifesti.
Di ogni immagine si vuole conoscere la tecnica utilizzata, l’anno di realizzazione e il luogo in cui l’opera é conservata
6
Ricerca
Costruite indici che permettano
1. ricerca full text nei documenti inseriti
2. ricerca combinata luogo, anno
3
7
Navigazione
Devono essere presentate le seguenti navigazioni
1. Immagini ordinate (alfabeticamente) per anno di realizzazione
2. Immagini raggruppate per luogo in cui sono conservate
3. Immagini categorizzate per tecnica
4. Immagini categorizzate in Ritratti, Dipinti, Manifesti
4