Indicizzazione di file audio
Transcript
Indicizzazione di file audio
Tipologia dei dati e organizzazione delle informazioni Sistemi di indicizzazione e recupero 8.Ricerca mediante i media: Dati strutturati , testi, immagini, suoni Indicizzazione di file audio I file audio sono “dati numerici” e si possono quindi parametrizzare Spettro dell’audio MFCC Suddivisione in finestre Trasformata discreta di Fourier(DFT) Eseguire DFT (Discrete Fourier Transform) Funzione della scala di Mel Logaritmo ampiezza dello spettro Post-elaborazione e rappresentazione mediante istogrammi 1 Retrieval Un file audio di query puo’ essere confrontato coi file audio in archivio fornendo una lista ordinata per similarita’ Istogramma A Istogramma di query Istogramma B Istogramma n Calcola distanza similarità Misura della distanza = D(X,A), D(X,B), …, D(X,n) Sort Lista ordinata dei risultati Ricerca di documenti con audio simile Il metodo è integrato nel sito web AESS 2 Ricerca di documenti (immagini) simili sistema http://quicklook.itc.cnr.it/main.html http://www.hermitagemuseum.org IBM: Query By Image Content QBIC 3 Ricerca di documenti mediante: •Dati strutturati (autore, anno di pubblicazione… •Testi (analisi testuale delle componenti descrittive) •Immagini (criterio di similarità) •L’esempio dei brevetti (WISPER) http://wisper.dyndns.org/wisper/loginpage.xml Esempio di prodotto con strumenti avanzati di ricerca (AUTONOMY) 9Trova pagine concettualmente simili alle ricerche precedenti dell’utente mediante tecniche probabilistiche, non solo matching di parole 9Produce sommari ed estrae contenuti dai documenti 9Usa parsing intelligente per effettuare ricerche basate su keyword 9Ricerche basate su linguaggio naturale 9Indicizza dati strutturati per ricerche basate sul contenuto di campi 9Supporta thesauri per la ricerca basata su sinonimi 9Riporta documenti correlati (trova i documenti simili) …………………………………….. 4