un`applicazione softwa- re per la classificazione automatica del
Transcript
un`applicazione softwa- re per la classificazione automatica del
UN'APPLICAZIONE SOFTWARE PER LA CLASSIFICAZIONE AUTOMATICA DEL CONTENUTO DI DOCUMENTI MULTIMEDIALI STEFAN GUERRA Project Management M.E.T.A. s.rl.- http://www.metaonline.it V.le Carlo del Prete, 347/F- 55100 Lucca (LU) - Italy Tel. 0583 464156 - Fax. 0583 471204 [email protected] La classificazione automatica di documenti multimediali di natura eterogenea è un prerequisito per l'accesso ad alto livello al contenuto digitale ed è intrinsecamente un compito molto ambizioso poiché i diversi layers di informazione del documento multimediale, il sonoro, sia parlato che non, l'immagine ed il testo, possono complementarsi reciprocamente in modi molto diversi. Ad oggi sono stati realizzati sono alcuni tentativi limitati di usare questi layers contemporaneamente per avanzate analisi dei contenuti tramite comitati indipendenti di classificatori esperti. La nostra proposta di progetto risponde a questa sfida attraverso la realizzazione di un sistema di gestione integrata dell'informazione per la classificazione automatica ed un'evoluta navigazione delle collezioni di video digitali per la loro pubblicazione multi canale e multipiattaforma. Il sistema progettato combina efficacemente tecniche avanzate di machine learning con sistemi robusti di estrazione dell'informazione basati su tecniche e metodologie di Image, Sound e Natural Language Processing. Un impatto significativo della tecnologia proposta è atteso nel campo della fornitura dell'informazione multimediale ed accesso (Web) (Web/Interactive TV e digital video libraries); più in particolare il sistema progettato intende inserirsi come strumento generale di classificazione nel normale workflow di 133 un'agenzia stampa che quotidianamente tratta contributi video (video news digitali) ed intende fornire strumenti per la loro analisi in modalità automatica/semiautomatica e costituire dunque il principale supporto per la creazione di un nuovo tipo di prodotto editoriale: il video news multimediale. A questo scopo il progetto intende dunque combinare le opportunità offerte dai nuovi protocolli di trasmissione e definizione dei formati video con i recenti avanzamenti nel campo dell'estrazione automatica ed indicizzazione dell'informazione digitale multimediale per sviluppare un sistema integrato di gestione dell'informazione per l'accesso veloce e sicuro, la categorizzazione e l'uso creativo del contenuto multimediale. In particolare il progetto intende: 1. esplorare una possibile efficace integrazione incrementale dell'output dei moduli indipendenti di text, image e sound processing per l'analisi automatica del contenuto digitale e la classificazione dei video news; 2. implementare un sistema flessibile e portabile di recupero dell'informazione capace di adattarsi al mutamento delle richieste rispetto alle collezioni di video news, in costante trasformazione ed evoluzione; 3. Contribuire allo sviluppo di strumenti pionieristici nell'area della produzione creativa di contenuti digitali ed alla loro diffusione; 4. Contribuire agli sforzi di standardizzazione nell'area dell'accesso ai contenuti multimediali, tagging e classificazione. L'impegno richiesto dal progetto prevede tre livelli distinti: 1. sviluppo parallelo di moduli indipendenti per image-, sound- e NLP-processing che forniscano, corrispondentemente al layer trattato, come output un vettore di indici relativo allo specifico documento digitale; 2. sviluppo di classificatori indipendenti dell'output dei singoli moduli di sound-, image and NLP-processing; 3. uso di comitati di classificatori per raggruppare i risultati della classificazione intermedia specifica ai layer ed assicurare consistenza e affidabilità dei risultati finali; 4. integrazione software e sviluppo di interfacce per la gestione del sistema; 5. Valutazione funzionale ed orientata all'utente del sistema di gestione integrata dell'informazione; fattorizzazione dei risultati in linea con gli sforzi in corso nella stardardizzazione dei metodi di indicizzazione dei documenti digitali. 134 Data la natura multilinguistica del video news multimediale, al momento il partenariato che intende partecipare alla realizzazione di questo progetto è costituito da centri di ricerca italiani e stranieri per le tecnologie di Natural Language Processing (Istituto di Linguistica Computazionale del C.N.R. di Pisa, Università di Sheffield, Politecnico di Catalogna, Barcellona), Image Processing (Enic, Lione; EGID, Bordeaux, M.E.T.A., Lucca) e Speech Recognition (ITC-IRST, Trento; Vecsys, Courtaboeuf), da partner industriali per lo sviluppo e l'ingegnerizzazione del sistema (M.E.T.A., Lucca) e da partner industriali in veste di utilizzatori finali dell'applicazione (eBisMedia - AP BISCOM, Roma; APTN, Londra; Citylife, Firenze). Il progetto è inoltre sostenuto dal maggior istituto internazionale per la standardizzazione dei formati editoriali (http://www.iptc.org). Infine, i tempi di realizzazione previsti per il progetto non saranno inferiori ai 24 mesi.