un`applicazione softwa- re per la classificazione automatica del

Transcript

un`applicazione softwa- re per la classificazione automatica del
UN'APPLICAZIONE SOFTWARE PER LA CLASSIFICAZIONE
AUTOMATICA DEL CONTENUTO
DI DOCUMENTI MULTIMEDIALI
STEFAN GUERRA
Project Management M.E.T.A. s.rl.- http://www.metaonline.it
V.le Carlo del Prete, 347/F- 55100 Lucca (LU) - Italy
Tel. 0583 464156 - Fax. 0583 471204
[email protected]
La classificazione automatica di documenti multimediali di natura eterogenea è un
prerequisito per l'accesso ad alto livello al contenuto digitale ed è intrinsecamente un compito molto ambizioso poiché i diversi layers di
informazione del documento multimediale, il
sonoro, sia parlato che non, l'immagine ed il
testo, possono complementarsi reciprocamente in modi molto diversi.
Ad oggi sono stati realizzati sono alcuni
tentativi limitati di usare questi layers contemporaneamente per avanzate analisi dei contenuti tramite comitati indipendenti di classificatori esperti.
La nostra proposta di progetto risponde a
questa sfida attraverso la realizzazione di un
sistema di gestione integrata dell'informazione
per la classificazione automatica ed un'evoluta navigazione delle collezioni di video digitali
per la loro pubblicazione multi canale e multipiattaforma.
Il sistema progettato combina efficacemente tecniche avanzate di machine learning
con sistemi robusti di estrazione dell'informazione basati su tecniche e metodologie di
Image, Sound e Natural Language
Processing.
Un impatto significativo della tecnologia
proposta è atteso nel campo della fornitura
dell'informazione multimediale ed accesso
(Web) (Web/Interactive TV e digital video
libraries); più in particolare il sistema progettato intende inserirsi come strumento generale
di classificazione nel normale workflow di
133
un'agenzia stampa che quotidianamente tratta
contributi video (video news digitali) ed intende
fornire strumenti per la loro analisi in modalità
automatica/semiautomatica e costituire dunque il principale supporto per la creazione di
un nuovo tipo di prodotto editoriale: il video
news multimediale.
A questo scopo il progetto intende dunque combinare le opportunità offerte dai nuovi
protocolli di trasmissione e definizione dei formati video con i recenti avanzamenti nel
campo dell'estrazione automatica ed indicizzazione dell'informazione digitale multimediale
per sviluppare un sistema integrato di gestione
dell'informazione per l'accesso veloce e sicuro, la categorizzazione e l'uso creativo del contenuto multimediale.
In particolare il progetto intende:
1. esplorare una possibile efficace integrazione incrementale dell'output dei moduli
indipendenti di text, image e sound processing
per l'analisi automatica del contenuto digitale e
la classificazione dei video news;
2. implementare un sistema flessibile e
portabile di recupero dell'informazione capace
di adattarsi al mutamento delle richieste rispetto alle collezioni di video news, in costante trasformazione ed evoluzione;
3. Contribuire allo sviluppo di strumenti
pionieristici nell'area della produzione creativa
di contenuti digitali ed alla loro diffusione;
4. Contribuire agli sforzi di standardizzazione nell'area dell'accesso ai contenuti multimediali, tagging e classificazione.
L'impegno richiesto dal progetto prevede
tre livelli distinti:
1. sviluppo parallelo di moduli indipendenti per image-, sound- e NLP-processing
che forniscano, corrispondentemente al layer
trattato, come output un vettore di indici relativo allo specifico documento digitale;
2. sviluppo di classificatori indipendenti
dell'output dei singoli moduli di sound-, image
and NLP-processing;
3. uso di comitati di classificatori per raggruppare i risultati della classificazione intermedia specifica ai layer ed assicurare consistenza e affidabilità dei risultati finali;
4. integrazione software e sviluppo di
interfacce per la gestione del sistema;
5. Valutazione funzionale ed orientata
all'utente del sistema di gestione integrata dell'informazione; fattorizzazione dei risultati in
linea con gli sforzi in corso nella stardardizzazione dei metodi di indicizzazione dei documenti digitali.
134
Data la natura multilinguistica del video
news multimediale, al momento il partenariato
che intende partecipare alla realizzazione di
questo progetto è costituito da centri di ricerca
italiani e stranieri per le tecnologie di Natural
Language Processing (Istituto di Linguistica
Computazionale del C.N.R. di Pisa, Università
di Sheffield, Politecnico di Catalogna,
Barcellona), Image Processing (Enic, Lione;
EGID, Bordeaux, M.E.T.A., Lucca) e Speech
Recognition (ITC-IRST, Trento; Vecsys,
Courtaboeuf), da partner industriali per lo sviluppo e l'ingegnerizzazione del sistema
(M.E.T.A., Lucca) e da partner industriali in
veste di utilizzatori finali dell'applicazione
(eBisMedia - AP BISCOM, Roma; APTN,
Londra; Citylife, Firenze). Il progetto è inoltre
sostenuto dal maggior istituto internazionale
per la standardizzazione dei formati editoriali
(http://www.iptc.org).
Infine, i tempi di realizzazione previsti per
il progetto non saranno inferiori ai 24 mesi.