Indicizzazione di file audio

Transcript

Indicizzazione di file audio
Tipologia dei dati e organizzazione delle informazioni
Sistemi di indicizzazione e recupero
8.Ricerca mediante i media:
Dati strutturati , testi, immagini,
suoni
Indicizzazione di file audio
I file audio sono “dati numerici” e si possono
quindi parametrizzare
Spettro dell’audio
MFCC
Suddivisione
in finestre
Trasformata discreta
di Fourier(DFT)
Eseguire DFT (Discrete
Fourier Transform)
Funzione della
scala di Mel
Logaritmo
ampiezza dello
spettro
Post-elaborazione e rappresentazione mediante istogrammi
1
Retrieval
Un file audio di query puo’ essere confrontato
coi file audio in archivio fornendo una lista
ordinata per similarita’
Istogramma A
Istogramma
di query
Istogramma B
Istogramma n
Calcola distanza
similarità
Misura della distanza = D(X,A), D(X,B), …, D(X,n)
Sort
Lista ordinata dei risultati
Ricerca di documenti con audio simile
Il metodo è integrato nel sito web AESS
2
Ricerca di documenti (immagini) simili
sistema
http://quicklook.itc.cnr.it/main.html
http://www.hermitagemuseum.org
IBM: Query By Image Content QBIC
3
Ricerca di documenti mediante:
•Dati strutturati (autore, anno di
pubblicazione…
•Testi (analisi testuale delle componenti
descrittive)
•Immagini (criterio di similarità)
•L’esempio dei
brevetti (WISPER)
http://wisper.dyndns.org/wisper/loginpage.xml
Esempio di prodotto
con strumenti avanzati di ricerca
(AUTONOMY)
9Trova pagine concettualmente simili alle ricerche precedenti dell’utente
mediante tecniche probabilistiche, non solo matching di parole
9Produce sommari ed estrae contenuti dai documenti
9Usa parsing intelligente per effettuare ricerche basate su keyword
9Ricerche basate su linguaggio naturale
9Indicizza dati strutturati per ricerche basate sul contenuto di campi
9Supporta thesauri per la ricerca basata su sinonimi
9Riporta documenti correlati (trova i documenti simili)
……………………………………..
4