Dipartimento di Informatica Università degli Studi di Verona
Transcript
Dipartimento di Informatica Università degli Studi di Verona
Dipartimento di Informatica Università degli Studi di Verona Rapporto di Ricerca Research Report RR 13/2003 Trasformata Wavelet e Trasformata di Gabor a confronto Laura Ottaviani Questo rapporto è disponibile su Web all’indirizzo This report is available on the web at the address http://www.sci.univr.it/~ottavian/Works/wavelet_gabor.pdf Indice Sommario 2 1 Definizioni preliminari 4 2 Introduzione alle frame 8 3 Trasformata di Gabor vs. Trasformata Wavelet 11 3.1 Analisi tempo-frequenza: dalla trasformata di Fourier alla trasformata di Gabor . . . . . . . . . . . . . . . . . . . . . . . 11 3.2 La Trasformata Wavelet . . . . . . . . . . . . . . . . . . . . . 13 3.2.1 La Trasformata Wavelet continua . . . . . . . . . . . . 16 3.2.2 La Trasformata Wavelet discreta . . . . . . . . . . . . 18 3.3 La Trasformata di Gabor . . . . . . . . . . . . . . . . . . . . 21 3.3.1 La Trasformata di Gabor continua . . . . . . . . . . . 22 3.3.2 La Trasformata di Gabor discreta . . . . . . . . . . . 22 4 Conclusioni 26 4.1 Tabella riassuntiva . . . . . . . . . . . . . . . . . . . . . . . . 26 Bibliografia 28 2 Sommario Dopo aver introdotto le definizioni preliminari necessarie per la comprensione dell’argomento trattato, sarà presentato il concetto di frame per uno spazio di Hilbert H, che sarà richiamato successivamente. Si passerà, quindi, all’argomento centrale di questo studio: la trasformata wavelet e la trasformata di Gabor. Esse saranno presentate sia nel caso continuo, che in quello discreto. Per entrambe le trasformate, verranno evidenziate le loro proprietà, confrontando i vantaggi e gli svantaggi di ciascuna di esse. Inoltre, si presenteranno gli aspetti comuni di esse, le loro similarità e le loro differenze. 3 Capitolo 1 Definizioni preliminari Definizione 1.1 Uno spazio vettoriale V è detto spazio vettoriale normato se è dotato di una funzione k k : V 7−→ [0, ∞[ tale che 1. kxk = 0 ⇐⇒ x = 0 2. kαxk = |α|kxk ∀x ∈ V, α ∈ C 3. kx + yk ≤ kxk + kyk ∀x, y ∈ V La funzione k k è chiamata norma. Definizione 1.2 Una successione {xn }n∈N è detta successione di Cauchy se per ogni > 0 esiste N ∈ N tale che kxn − xm k ≤ ∀n, m ≥ N (1.1) Definizione 1.3 Lo spazio di Banach o spazio normato completo è lo spazio normato in cui ogni successione di Cauchy converge. Definizione 1.4 Lo spazio di Hilbert è uno spazio vettoriale H, dotato di prodotto interno, che sia uno spazio di Banach rispetto alla norma indotta, cioè è uno spazio vettoriale pH, dotato di prodotto interno h , i, tale che la norma definita da kxk := hx, xi, x ∈ H lo rende uno spazio di Banach. Due spazi di Hilbert sono particolarmente interessanti per questo studio: • lo spazio delle funzioni a valori complessi, definito su R, che sono a quadrato integrabile rispetto alla misura di Lebesgue Z 2 2 L (R) := f : R 7−→ C : f è misurabile e |f (x)| dx < ∞ 4 Esso è uno spazio di Hilbert rispetto al prodotto interno Z hf, giL2 = f (x)g(x) dx dove g(x) è il coniugato complesso di g(x). • lo spazio delle successioni a quadrato sommabile, dove l’insieme I degli indici è numerabile ( ) X 2 2 l (I) := {xn }n∈I : |xn | < ∞ n∈I Esso è uno spazio di Hilbert rispetto al prodotto interno X h{xn }, {yn }il2 = xn yn n∈I Definizione 1.5 Siano K e H due spazi di Hilbert. Sia T una funzione lineare da K a H. Si dice che T è limitata se esiste una costante k > 0 tale che kT xk ≤ kkxk ∀x ∈ K (1.2) La norma kT k di T è la più piccola costante k che può essere usata nella condizione 1.2, oppure, equivalentemente, kT k = sup {kT xk : x ∈ K, kxk = 1} Definizione 1.6 Siano K e H due spazi di Hilbert. L’ operatore aggiunto è l’unico operatore T ∗ tale che T ∗ : H 7−→ K soddisfa hx, T yiH = hT ∗ x, yiK , ∀x ∈ H, y ∈ K Se K = H, allora: • l’operatore T si dice autoaggiunto se T = T ∗ ; • l’operatore T si dice unitario se T T ∗ = T ∗ T = I. Se T è unitario, allora hT x, T yi = hx, yi, ∀x, y ∈ H Definizione 1.7 Su L2 (R) definiamo i seguenti operatori: 5 • di traslazione (nel tempo) Ta : L2 (R) 7−→ L2 (R), a∈R (Ta f )(x) = f (x − a) • di modulazione (o di traslazione in frequenza) Mb : L2 (R) 7−→ L2 (R), b∈R (Mb f )(x) = eibx f (x) • di dilatazione Da : L2 (R) 7−→ L2 (R), 1 (Da f )(x) = p f |a| a>0 x a Si può dimostrare che gli operatori Ta , Mb e Da sono unitari. Si noti che Mb e Ta non commutano, ma vale la seguente relazione: Ta Mb = e−iba Mb Ta . Definizione 1.8 Siano {λi , ∀i ∈ [1, n]} ∈ C e {vi , ∀i ∈ [1, n]} ∈ V , dove V è uno spazio complesso di dimensione finita. I vettori {vi , ∀i ∈ [1, n]} sono linearmente indipendenti per ogni λi ∈ C se n X λi vi = 0̄ ⇒ λi = 0, ∀i ∈ [1, n] i=1 Definizione 1.9 Un insieme {vi , ∀i ∈ [1, n]} ∈ V di vettori linearmente indipendenti in uno spazio complesso V di dimensione finita è una base per V se n X ∀v ∈ V ∃{λi , ∀i ∈ [1, n]} ∈ C : v = λi vi i=1 Definizione 1.10 Due vettori x, y ∈ H sono ortogonali se hx, yi = 0. Definizione 1.11 Si definisce {ei }∞ i=1 ⊆ H un sistema ortonormale (ONS) se hei , ej i = δi,j , dove δi,j è la δ-funzione di Kronecker, ossia quella funzione che vale 1 se i = j, 0 altrimenti. Definizione 1.12 Un sistema ortonormale {ei }∞ i=1 è una base ortonormale (ONB) se H = span{ei }∞ . i=1 6 Definizione 1.13 Sia V uno spazio vettoriale e S ⊆ V e non vuoto. Allora v ∈ V si dice combinazione lineare degli elementi di S se esiste un numero P finito n di vi ∈ V e ai ∈ R tale che v = ni=1 ai vi . Si dice che v è una combinazione lineare di {vi }ni=1 con coefficienti {ai }ni=1 . Definizione 1.14 Sia S ⊆ V e non vuoto. Lo span di S indicato con span(S) è l’insieme che contiene tutte le combinazioni lineari degli elementi di S. Per convenzione: span(0) = {0̄}. ∞ Per un sistema ortonormale {ei }∞ i=1 , H = span{ei }i=1 è equivalente alla formula di Parseval: ∞ X |hf, ei i|2 = kf k2 ∀f ∈ H i=1 Quando {ei }∞ i=1 è una base ortonormale, ogni f ∈ H può essere scritta come: f= ∞ X hf, ei iei i=1 7 Capitolo 2 Introduzione alle frame Definizione 2.1 Una frame per uno spazio di Hilbert H con prodotto interno h , i è una famiglia di elementi {fi }∞ i=1 ⊆ H tale che ∃A > 0, B < ∞ : Akf k2 ≤ X |hf, fi i|2 ≤ Bkf k2 ∀f ∈ H (2.1) i∈I dove i numeri A, B sono detti frame bound. Si osservi che i frame bound non sono unici. I frame bound definiti ottimali sono il più grande valore possibile per A e il più piccolo valore possibile per B nell’eq. 2.1. Se A = B, allora la frame è detta tight. Se una frame cessa di essere tale quando un qualsiasi suo elemento viene rimosso, la frame viene definita esatta. Si noti che le frame non sono necessariamente basi ortonormali. Teorema 2.1 (Condizione sufficiente per una tight frame con frame bound A = B = 1 affinchè essa sia una base ortonormale) Sia {fi }i∈I ⊆ H una tight frame in H, con frame bound A = B = 1. Supponiamo kfi k = 1 per ogni i ∈ I. Allora {fi }i∈I è una base ortonormale. Definizione 2.2 Sia {fi }i∈I ⊆ H una frame in H e c = {ci }i∈I una successione in l2 (I). Definiamo l’ operatore di analisi T come la funzione lineare: T : H 7−→ l2 (I) T f = {hf, fi i}∞ i=1 8 L’operatore aggiunto T ∗ di T è calcolato nel modo seguente: hT ∗ {ci }i∈I , f i = h{ci }, T f i X = ci T f i∈I = X ci hf, fi i X ci hfi , f i i∈I = i∈I (2.2) da cui: T ∗ {ci }i∈I = X ci fi i∈I L’operatore T ∗ è chiamato operatore di sintesi o espansione. Definizione 2.3 Sia {fi }i∈I ⊆ H una frame in H. L’ operatore di frame è definito come la funzione: S : H 7−→ H X Sf = T ∗ T f = hf, fi ifi i∈I Definizione 2.4 Sia {fi }i∈I ⊆ H una frame in H. Definiamo una famiglia di vettori {fei }i∈I come segue: fei = S −1 fi = (T ∗ T )−1 fi Si può dimostrare (teorema 2.2) che tale famiglia costituisce una frame, che chiamiamo frame duale di {fi }. Teorema 2.2 (Proprietà dell’operatore di frame) Sia {fi }i∈I ⊆ H una frame in H con frame bound A, B. Per l’operatore di frame S valgono le seguenti proprietà: 1. L’operatore di frame S è invertibile e soddisfa B −1 I ≤ S −1 ≤ A−1 I; 2. fei = {S −1 fi } è una frame con bound B −1 , A−1 . Una frame possiede una delle proprietà principali di una base, ossia quella di poter esprimere una funzione come combinazione lineare degli elementi della base. 9 Teorema 2.3 (Decomposizione in frame) Se {fi }i∈I è una frame con operatore di frame S, allora ogni elemento dello spazio di Hilbert H si può rappresentare come combinazione lineare di elementi della frame. f = SS −1 f X = hf, S −1 fi ifi ∀f ∈ H i∈I = X i∈I hf, fei ifi ∀f ∈ H (2.3) Spesso viene anche usata la decomposizione in frame nella forma: f = S −1 Sf X = hf, fi iS −1 fi ∀f ∈ H i∈I = X i∈I hf, fi ifei ∀f ∈ H (2.4) Perciò, da tale teorema, se {fi }i∈I è una frame, ricaviamo la formula X X f= hf, fi ifei = hf, fei ifi ∀f ∈ H (2.5) i∈I i∈I Essa indica: • sia come ricostruire f a partire da hf, fi i, cioè come, nota la frame duale {fei } di {fi }i∈I , possiamo ricostruire f mediante hf, fi i. Perciò si deve solamente calcolare fei e ciò implica l’inversione di T ∗ T = S; • sia come scrivere f come sovrapposizione di fi . Si osservi che, dati i coefficienti hf, fi i, i vettori fei che ricostruiscono f non sono determinati univocamente. Infatti, le frame non sono generalmente basi (ortonormali), poichè gli fi sono di solito non linearmente indipendenti. Quindi, uno stesso f può essere ricostruito dagli stessi hf, fi i, ma con vettori fei diversi. Ciò significa che esistono molte sovrapposizioni diverse che portano alla medesima f . 10 Capitolo 3 Trasformata di Gabor vs. Trasformata Wavelet 3.1 Analisi tempo-frequenza: dalla trasformata di Fourier alla trasformata di Gabor L’analisi tempo-frequenza occupa un posto centrale nell’analisi dei segnali. La trasformata di Fourier, definita da 1 Ff (ξ) = fˆ(ξ) = √ 2π Z ∞ e−ixξ f (x)dx, ξ ∈ R, fˆ(ξ) ∈ C (3.1) −∞ è ideale per studiare segnali stazionari, in cui, cioè, le proprietà sono statisticamente invarianti nel tempo. Molti processi e segnali, però, sono nonstazionari, ossia essi evolvono nel tempo, come, per esempio, i segnali vocali e la musica. Per analizzare segnali non-stazionari bisogna utilizzare una rappresentazione che sia locale sia nel dominio del tempo, sia in quello delle frequenze. Per località nel tempo si intende la capacità di localizzare il contenuto di frequenze appartenenti ad un certo intervallo temporale. Si pensi, ad esempio, ad uno spartito musicale, il quale indica al musicista quale nota suonare (l’informazione riguardo la frequenza), e in quale istante suonarla (l’informazione temporale). La trasformata di Fourier non permette la localizzazione temporale, poiché per calcolare il suo valore fˆ ad una determinata frequenza ξ, si deve conoscere l’intero segnale f (x). Se in un certo istante x il segnale viene alterato, questo si ripercuote sull’intero spettro. 11 Un approccio per ottenere un’analisi tempo-frequenza locale consiste nel “tagliare” il segnale in parti e applicare un’analisi di Fourier su ciascuna di queste parti. Le funzioni, però, ottenute da una segmentazione di questo tipo, non smussata, non sono periodiche, poiché la trasformata di Fourier interpreta i salti agli estremi come discontinuità o come brusche variazioni del segnale. Per evitare tali artefatti, è stato introdotto il concetto di windowing (finestratura). Invece di localizzare il segnale mediante una funzione rettangolare, si usa, per la segmentazione, una funzione finestra smussata, che assuma un valore vicino ad 1 intorno all’origine e decada verso il valore 0 agli estremi. La procedura di analisi locale tempo-frequenza risultante viene detta Short-Time Fourier Transform continua (STFT ) o windowed Fourier transform o trasformata di Gabor. La trasformata di Gabor di una funzione arbitraria f ∈ L2 (R) rispetto ad una data finestra g è definita come: Z win T f (t, ω) = f (s)g(s − t)e−iωs ds (3.2) Indicando con Tt e Mω gli operatori rispettivamente di traslazione e modulazione, possiamo esprimere la eq. 3.2 come T win f (t, ω) = hf, Tt Mω gi = hf, gω,t i (3.3) La trasformata di Gabor o STFT è vista come la sovrapposizione traslata nel tempo e nella frequenza (cioè modulata) della finestra g data. Le funzioni gω,t vengono, talvolta, definite [4] funzioni figlie di g, mentre g è chiamata funzione finestra o atomo di Gabor. Uno svantaggio della STFT è il suo limite nella capacità risolutiva tempofrequenza, dovuta al principio di indeterminazione. Infatti, le frequenze gravi sono difficilmente rappresentabili con finestre strette, mentre brevi impulsi possono essere localizzabili con fatica nel tempo se si utilizzano finestre ampie. Quindi, per riassumere: • finestra stretta: buona risoluzione temporale; risoluzione frequenziale povera • finestra ampia: buona risoluzione frequenziale, risoluzione temporale povera Un’altro svantaggio della STFT continua è la sua elevata ridondanza. Si può ridurre tale ridondanza campionando T win f (t, ω), cioè valutandola su 12 un reticolo discreto del piano tempo-frequenza. La discretizzazione applicata per t, ω consiste in: t = nt0 , ω = mω0 (3.4) dove t0 , ω0 > 0 sono fissati e n, m ∈ Z, ossia si campiona T win f su un reticolo tempo-frequenza della forma t0 Z × ω0 Z, in cui t0 , ω0 , chiamate costanti di reticolo, indicano il passo di campionamento in traslazione e modulazione. Quindi, la eq. 3.2 diventa: T win f m,n = Z f (s)g(s − nt0 )e−imω0 s ds = hf, Tnt0 Mmω0 gi = hf, gm,n i (3.5) Possiamo dire che le gm,n (s) = eimω0 s g(s − nt0 ) sono ottenute traslando g lungo il reticolo t0 Z × ω0 Z nel piano tempo-frequenza. Perciò, ogni gm,n occupa una certa area nel piano tempo-frequenza. Per costanti di reticolo t0 , ω0 scelte appropriatamente, le gm,n coprono tutto il piano. Nella figura 3.1, sono rappresentate le funzioni elementari di Gabor gm,n (s) = eimω0 s g(s − nt0 ) che sono copie traslate nel tempo e nella frequenza della della finestra g data. Ogni gm,n ha inviluppo della forma di g. Nella figura 3.2, sono rappresentate schematicamente le posizioni delle funzioni elementari di Gabor gm,n nel piano tempo-frequenza. Nella sez. 3.3.2, vedremo più dettagliatamente le proprietà dipendenti dal valore del prodotto t0 ω0 e stabiliremo un limite ad esso. Ricordiamo che Gabor propose di usare la funzione di Gauss e le sue traslazioni e modulazioni con costanti di reticolo tali che t0 ω0 = 2π, poichè essi, come riporta [6] citando [8], “assicurano il miglior utilizzo dell’area dell’informazione, nel senso che posseggono il più piccolo prodotto di durata efficace per ampiezza efficace”. 3.2 La Trasformata Wavelet La trasformata wavelet fornisce una descrizione tempo-frequenza simile alla STFT, con alcune differenze significative. Le formule per la trasformata wavelet, analoghe alle eq. 3.2 e eq. 3.5 rispettivamente, sono le seguenti: 13 Figura 3.1: Funzioni gm,n , figlie di g. In questa figura è stata rappresentata solo la parte reale delle funzioni gm,n . La figura è stata tratta da [6] e adattata secondo la nostra notazione. 14 Figura 3.2: Posizioni delle funzioni elementari di Gabor gm,n nel piano tempo-frequenza rappresentate schematicamente. La figura è stata tratta da [6] e adattata secondo la nostra notazione. 15 • caso continuo 1 T wav f (a, b) = p |a| Z f (s)ψ s−b ds, a a, b ∈ R, a 6= 0 (3.6) • caso discreto wav (f ) = q1 Tj,k aj0 Z f (s)ψ s aj0 − kb0 ! j, k ∈ Z, a0 > 1, b0 > 0 ds (3.7) In entrambi i casi assumiamo che ψ soddisfi vedremo il motivo per una tale assunzione. 3.2.1 R ψ(s)ds = 0. In seguito La Trasformata Wavelet continua Prendiamo in considerazione la trasformata wavelet continua: Z s−b 1 wav f (s)ψ ds, a, b ∈ R, a 6= 0 T f (a, b) = p a |a| = hf, Tb Da ψi = hf, ψa,b i (3.8) Le funzioni ψa,b sono dette wavelet o, talvolta [4], wavelet figlie, mentre la funzione ψ è chiamata wavelet madre. Si può notare una similarità tra essa e la STFT (eq. 3.2, 3.3): sia la trasformata wavelet che quella di Gabor nel continuo considerano il prodotto interno di f con una famiglia di funzioni di analisi indicizzate da due parain eq. 3.8. metri, gω,t (s) = eiωs g(s − t) in eq. 3.2, 3.3 e ψa,b (s) = √1 ψ s−b a |a| Però, la trasformata di Gabor o STFT produce, nel piano tempo-frequenza, una traslazione nel tempo e nella frequenza (modulazione) di una finestra g data, mentre la trasformata wavelet produce, nel dominio del tempo, una traslazione ed una dilatazione nel tempo di una wavelet madre ψ data. Nella figura 3.3, sono rappresentate schematicamente le wavelet come traslazione ed dilatazione nel dominio del tempo di una wavelet madre ψ data. I parametri a,b sono i parametri rispettivamente di dilatazione e di traslazione. Quando il parametro di dilatazione a cambia, l’equazione ψa,0 (s) = √1 ψ as copre diversi intervalli di frequenza: grandi valori di |a| corri|a| spondono a frequenze gravi o ad una ψa,0 ampia, mentre piccoli valori di 16 Figura 3.3: Wavelet come traslazione ed dilatazione nel dominio del tempo di una wavelet madre ψ data. La figura è stata tratta da [9]. |a| corrispondono a frequenze acute o ad una ψa,0 stretta. Il parametro di traslazione b permette di muovere il centro di localizzazione del tempo: ogni ψa,b (s) è localizzata intorno a s = b. La differenza tra la trasformata wavelet e quella di Gabor sta nella forma delle funzioni di analisi gω,t e ψa,b . Le funzioni gω,t consistono tutte della stessa funzione inviluppo g, l’atomo di Gabor, traslata alla localizzazione temporale appropriata e “riempita” con oscillazioni a frequenze più acute. Tutte le gω,t , trascurando il valore ω, hanno la stessa ampiezza. Invece, le ψa,b hanno ampiezze nel tempo che variano con la frequenza: ψa,b a frequenze acute sono molto strette, mentre ψa,b a frequenze gravi sono molto ampie. Perciò, la trasformata wavelet è in grado di “zoomare” meglio rispetto a quella di Gabor o STFT su segnali a frequenze acute molto brevi, privilegiando la risoluzione temporale alle frequenze acute e la risoluzione spettrale alle frequenze gravi. La trasformata wavelet continua è una trasformata reversibile, se viene soddisfatta la seguente condizione di ammissibilità: Cψ = 2π Z +∞ −∞ |ψ̂(ξ)|2 dξ < ∞ |ξ| (3.9) Questa non è una richiesta molto restrittiva. La trasformata wavelet continua è reversibile se la condizione di ammissibilità 3.9 viene soddisfatta, anche se le funzioni base non sono ortonormali. La costante Cψ dipende solo da ψ, ossia dalla wavelet madre utilizzata. Questa costante viene chiamata costante di ammissibilità. Una funzione può essere ricostruita dalla sua trasformata wavelet mediante la formula di ricostruzione seguente, detta formula della risoluzione di identità: Z +∞ Z +∞ 1 f = Cψ−1 hf, ψa,b iψa,b da db 2 a −∞ −∞ 17 Cψ−1 = Z +∞ Z +∞ −∞ −∞ 1 wav (T f )ψa,b da db a2 (3.10) Se ψ è in L1 (R), allora ψ̂ è continua eR la condizione di ammissibilità può essere soddisfatta solo se ψ̂(0) = 0, cioè ψ(s)ds = 0. La eq. 3.10 può essere vista in due modi diversi: • come un modo di ricostruire f quando la sua trasformata wavelet T wav f è nota; • come un modo di scrivere f come sovrapposizione di wavelet ψa,b . I coefficienti di questa sovrapposizione sono dati esattamente dalla trasformata wavelet T wav f di f. 3.2.2 La Trasformata Wavelet discreta Consideriamo, ora, la trasformata wavelet discreta. La eq. 3.7 è stata ottenuta dalla eq. 3.6 riducendo a, b a valori discreti, come spiegato qui di seguito. Per quanto riguarda il parametro di dilatazione, la discretizzazione è a = aj0 dove j ∈ Z e il passo di dilatazione a0 6= 1 è fissato. Per convenienza si assume che a0 > 1. Per il parametro di traslazione b, • per j = 0, sembra naturale prendere solo gli interi (positivi e negativi) multipli di un b0 fissato (si assume b0 > 0), dove b0 sia scelto appropriatamente in modo che ψ(s − kb0 ) copra l’intero asse; 1 • per j 6= 0, l’ampiezza di q j ψ sj è aj0 volte l’ampiezza di ψ(s). a0 a0 kb0 aj0 Perciò, la scelta b = assicurerà che le wavelet discretizzate al livello j coprano l’asse come avviene per ψ(s − kb0 ). Per convenienza, nella discretizzazione riduciamo il parametro a solamente a valori positivi. In tal modo, la condizione di ammissibilità diventa: Cψ = Z 0 +∞ |ψ̂(ξ)|2 dξ = ξ Z 0 −∞ |ψ̂(ξ)|2 dξ < ∞ |ξ| (3.11) Riassumendo, quindi, discretizziamo la trasformata wavelet continua scegliendo: a = aj0 , b = kb0 aj0 , dove j, k ∈ Z, a0 > 1, b0 > 0 fissati. La scelta di 18 a0 , b0 appropriati dipende dalla wavelet madre ψ. Con tale discretizzazione otteniamo: ! 1 s − kb0 aj0 ψj,k (s) = q ψ aj0 aj0 ! s 1 − kb0 = q ψ aj0 aj0 = (Daj Tkb0 ψ)(s) (3.12) 0 Ci poniamo, ora, due domande: 1. I coefficienti wavelet discreti hf, ψj,k i caratterizzano completamente la funzione f ? Possiamo ricostruire la funzione f in un modo numericamente stabile a partire dai coefficienti hf, ψj,k i? 2. Ogni funzione f può essere scritta come sovrapposizione di “blocchi costruttivi elementari” ψj,k ? Possiamo trovare un algoritmo per trovare i coefficienti di una tale sovrapposizione? Queste domande sono aspetti duplici dello stesso problema. Nel caso della trasformata wavelet continua, la risoluzione di identità 3.10 risponde ad entrambe le domande, se, almeno, ψ è ammissibile. Nel caso discreto, invece, non c’è una equazione analoga alla risoluzione di identità. Si osservi che ciò non è vero per ψ speciali. Se le ψj,k costituiscono una base ortonormale, allora l’espansione ripetto a questa base ortonormale fornisce una risoluzione di identità discreta. Cerchiamo se esiste una condizione di ammissibilità discreta e qual’è. Consideriamo funzioni f ∈ L2 (R). Esse possono essere caratterizzate mediante i loro coefficienti wavelet hf, ψj,k i se è vero che hf1 , ψj,k i = hf2 , ψj,k i ∀j, k ∈ Z ⇒ f1 ≡ f2 oppure, equivalentemente, se hf, ψj,k i = 0 ∀j, k ∈ Z ⇒ f = 0 Ma, la prima domanda richiede più della caratterizzabilità. Richiede se sia possibile ricostruire f in un modo numericamente stabile a partire dai coefficienti wavelet hf, ψj,k i. Si può dimostrare che, per avere un algoritmo di ricostruzione numericamente stabile per f a partire dai coefficienti wavelet hf, ψj,k i, le ψj,k devono costituire una frame. In tal caso si parla di frame di wavelet. Possiamo, perciò stabilire la seguente definizione: 19 Definizione 3.1 Una frame di wavelet è una frame per L2 (R) della forma {Daj Tkb0 ψ}j,k∈Z , dove a0 > 1, b0 > 0 e ψ ∈ L2 (R) è una funzione fissata, 0 cioè una frame di wavelet è un sistema {ψj,k }j,k∈Z = {Daj Tkb0 ψ}j,k∈Z in cui 0 esistono due costanti A > 0, B < ∞ tali che X Akf k2 ≤ |hf, ψj,k i|2 ≤ Bkf k2 ∀f ∈ L2 (R) j,k∈Z Il seguente teorema [3] è una generalizzazione di una condizione sufficiente presentata in [1]. Teorema 3.1 (Condizione sufficiente per avere una frame di wavelet) Siano ψ ∈ L2 (R) data e a0 > 1 b0 > 0. Supponiamo che: X X X k j j A := inf |ξ|∈[1,a0 ] |ψ̂(aj0 ξ)|2 − ψ̂(a0 ξ)ψ̂ a0 ξ + >0 b0 j∈Z k6=0 j∈Z X X k j j B := sup|ξ|∈[0,a0 ] ψ̂(a0 ξ)ψ̂ a0 ξ + <∞ b0 k6=0 j∈Z allora {Daj Tkb0 ψ}j,k∈Z è una frame per L2 (R) con frame bound 0 A B b0 , b0 . Applicando la decomposizione in frame (eq. 2.5), X X g g f= hf, ψj,k iψ hf, ψ j,k = j,k iψj,k j,k j,k si trova un algoritmo per ricostruire f a partire dai coefficienti wavelet hf, ψj,k i, se le ψj,k costituiscono una frame. Contemporaneamente, mediante lo stesso teorema, si ottiene l’algoritmo per scrivere f come sovrapposizione delle ψj,k . Per questa ragione, le due domande poste in precedenza sono aspetti duplici dello stesso problema. Si può dimostrare che la richiesta che le ψj,k costituiscano una frame, impone già che ψ sia ammissibile. Infatti: Teorema 3.2 (Condizione necessaria per avere una frame di wave- let: l’ammissibilità della wavelet madre) Se le ψj,k (s) = q1 j ψ sj − kb0 , a0 L2 (R) a0 j, k ∈ Z costituiscono una frame per con frame bound A, B, allora Z +∞ b0 ln a0 |ψ̂(ξ)|2 b0 ln a0 A≤ dξ ≤ B π ξ π 0 20 e b0 ln a0 A≤ π Z 0 −∞ |ψ̂(ξ)|2 b0 ln a0 dξ ≤ B |ξ| π Quindi, assumiamo sempre che ψ sia ammissibile. Se le ψj,k costituiscono una tight frame, allora π A=B= b0 ln a0 Z |ψ̂(ξ)|2 dξ ξ e se normalizziamo ψ tale che Z |ψ̂(ξ)|2 dξ = 1 ξ allora π b0 ln a0 A=B= Perciò, il teorema 3.2 stabilisce la relazione tra i parametri delle frame di wavelet e i frame bound. 3.3 La Trasformata di Gabor Richiamiamo le formule della trasformata di Gabor, nel caso continuo (eq. 3.2, eq. 3.3) e in quello discreto (eq. 3.5): • caso continuo T win f (t, ω) = Z f (s)g(s − t)e−iωs ds = hf, Tt Mω gi = hf, gω,t i (3.13) • caso discreto win f Tm,n = Z f (s)g(s − nt0 )e−imω0 s ds = hf, Tnt0 Mmω0 gi = hf, gm,n i 21 (3.14) 3.3.1 La Trasformata di Gabor continua Data T win f (t, ω) = hf, gω,t i, dove gω,t (s) = eiωs g(s − t), la funzione f può essere ricostruita dalla STFT mediante la formula inversa: ZZ f = (2πkgk2 )−1 T win f (t, ω)gω,t dt dω (3.15) Non c’è condizione di ammissibilità in questo caso: qualsiasi funzione g in L2 (R) è ammessa. Se normalizziamo g tale che kgkL2 = 1, allora ZZ 1 f= T win f (t, ω)gω,t dt dω 2π 3.3.2 La Trasformata di Gabor discreta Consideriamo, ora, la trasformata di Gabor discreta, o STFT discreta. Possiamo, anche in questo caso, formulare le stesse domande che ci eravamo posti esaminando la trasformata wavelet discreta: 1. Possiamo ricostruire la funzione f in un modo numericamente stabile a partire dai coefficienti hf, gm,n i? 2. Possiamo trovare un algoritmo efficiente per scrivere f come combinazione lineare delle gm,n ? Le risposte a tali domande si trovano in modo analogo al caso delle wavelet. Una ricostruzione numericamente stabile di f a partire dai coefficienti hf, gm,n i è possibile solo se le gm,n costituiscono una frame. In tal caso si parla di frame di Gabor. Possiamo, perciò, stabilire la seguente definizione: Definizione 3.2 Una frame di Gabor o Weyl-Heisenberg frame è una frame per L2 (R) della forma {Mmω0 Tnt0 g}m,n∈Z , dove ω0 , t0 > 0 e g ∈ L2 (R) è una funzione fissata, cioè una frame di Gabor è un sistema {gm,n }m,n∈Z = {Mmω0 Tnt0 g}m,n∈Z in cui esistono due costanti A > 0, B < ∞ tali che X Akf k2 ≤ |hf, gm,n i|2 ≤ Bkf k2 ∀f ∈ L2 (R) m,n∈Z Il valore del prodotto t0 ω0 è fondamentale per caratterizzare una frame in L2 (R). Ciò viene affermato dal seguente teorema [3]: 22 Teorema 3.3 Sia {Mmω0 Tnt0 g}m,n∈Z una frame di Gabor con ω0 , t0 > 0. 1. Se t0 ω0 > 2π, allora {Mmω0 Tnt0 g}m,n∈Z non è completo in L2 (R) e, quindi, non è una frame per L2 (R). 2. Se {Mmω0 Tnt0 g}m,n∈Z è una frame, allora t0 ω0 = 2π se e solo se {Mmω0 Tnt0 g}m,n∈Z è una base di Riesz. dove definiamo una base di Riesz come segue: Definizione 3.3 Una successione {fi }i∈N in uno spazio di Hilbert H è una base di Riesz se esistono una base ortonormale {ei }i∈N per H e una funzione invertibile e limitata T : H 7−→ H tali che T ei = fi per ogni i ∈ N. Perciò, per il teorema 3.3, sappiamo che {Mmω0 Tnt0 g}m,n∈Z è una frame soltanto se t0 ω0 ≤ 2π e la frame è sovracompleta se t0 ω0 < 2π. Il seguente teorema, analogo al teorema 3.1, definisce una condizione sufficiente per avere una frame di Gabor. Le condizioni di questi due teoremi si ricavano secondo lo stesso procedimento, lasciando intuire, pur nella diversità delle combinazioni degli operatori di modulazione, traslazione e dilatazione, una comune origine tra le frame di Gabor e quelle wavelet. Teorema 3.4 (Condizione sufficiente per avere una frame di Gabor) Siano g ∈ L2 (R) data e ω0 , t0 > 0. Supponiamo che: X X X m A := inf s∈[0,t0 ] |g(s − nt0 )|2 − g(s − nt0 )g s − nt0 − >0 ω0 n∈Z m6=0 n∈Z B := sups∈[0,t0 ] X X m g(s − nt0 )g s − nt0 − <∞ ω0 m6=0 n∈Z allora {Mmω0 Tnt0 g}m,n∈Z è una frame per L2 (R) con frame bound B A ω0 , ω0 . Applicando la decomposizione in frame (eq. 2.5), se le {gm,n }m,n∈Z costituiscono una frame, allora ogni funzione f ∈ L2 (R) può essere scritta come X X f= hf, gm,n igg hf, gg (3.16) m,n = m,n igm,n m,n m,n dove i gg m,n sono i vettori nella frame duale di gm,n , che, in questo caso, viene chiamata frame duale di Gabor. L’equazione 3.16 mostra sia come ricostruire f a partire dai coefficienti hf, gm,n i, se le gm,n costituiscono una frame, sia come scrivere f come sovrapposizione delle gm,n . Analogamente al teorema 3.2, possiamo definire una condizione necessaria per avere una frame di Gabor: 23 Teorema 3.5 (Condizione necessaria per avere una frame di Gabor: densità tempo-frequenza sufficientemente alta) Se le {gm,n }m,n∈Z costituiscono una frame per L2 (R) con frame bound A,B, allora A≤ 2π kgk2 ≤ B ω 0 t0 Quindi, non imponiamo nessun’altra restrizione su g. Si ricordi che assumiamo sempre g ∈ L2 (R). Se le {gm,n }m,n∈Z costituiscono una tight frame, allora 2π A=B= kgk2 ω 0 t0 e se normalizziamo g tale che kgkL2 = 1, allora A=B= 2π ω 0 t0 In particolare, per il teorema 2.1, le gm,n costituiscono una base ortonormale, se ω0 t0 = 2π. Perciò, il teorema 3.5, come il teorema 3.2 nel caso delle wavelet, stabilisce la relazione tra i parametri delle frame di Gabor e i frame bound. L’assenza di qualsiasi condizione su g nel teorema 3.5 è simile all’assenza di una condizione di ammissibilità per la trasformata di Gabor continua (sez. 3.3.1) e molto diversa dalla condizione Z +∞ |ψ̂(ξ)|2 dξ < ∞ |ξ| −∞ sulla wavelet madre, necessaria sia nel caso continuo, che discreto. Un’altra differenza tra la trasformata di Gabor e la trasformata wavelet consiste nel fatto che i passi di traslazione nel tempo e nella frequenza t0 e ω0 hanno una condizione: non esiste nessuna frame di Gabor per coppie ω0 , t0 tali che ω0 t0 > 2π. Infatti, se ω0 t0 > 2π, per ogni scelta di g ∈ L2 (R), esiste una corrispondente f ∈ L2 (R) tale che f 6= 0 e f è ortogonale a tutte le gm,n (s) = eimω0 s g(s − nt0 ), cioè hf, gm,n i = 0 ∀m, n ∈ Z. In tal caso, non solo le gm,n non costituiscono una frame, ma i prodotti interni hf, gm,n i non sono persino sufficienti per determinare f . Quindi, ci dobbiamo limitare a ω0 t0 ≤ 2π. Si noti che, nel caso delle wavelet, non esiste una limitazione simile per a0 , b0 . Per avere una buona localizzazione temporale e frequenziale, dobbiamo scegliere ω0 t0 < 2π. Infatti, le frame nel caso limite ω0 t0 = 2π hanno necessariamente cattive proprietà di localizzazione o nel dominio del tempo, o della frequenza, o, persino, in entrambi. Infatti: 24 Teorema 3.6 (Balian-Low) Se le gm,n (s) = eimω0 s g(s−nt0 ) costituiscono una frame per L2 (R) con ω0 t0 = 2π, cioè se le gm,n costituiscono una base di Riesz, allora o Z s2 |g(s)|2 ds = ∞ oppure Z ξ 2 |ĝ(ξ)|2 dξ = ∞ ovvero o g ∈ / L2 (R) o ĝ ∈ / L2 (R) Per riassumere, se: • ω0 t0 > 2π allora non esistono frame; • ω0 t0 = 2π allora esistono frame, ma non hanno una buona localizzazione tempo-frequenziale; • ω0 t0 < 2π allora esistono frame (persino tight) con una eccellente localizzazione tempo-frequenziale. Si osservi che, nonostante ω0 t0 ≤ 2π, non è detto che le gm,n costituiscano necessariamente una frame. La condizione sufficiente per avere una frame di Gabor è quella fissata dal teorema 3.4. 25 Capitolo 4 Conclusioni 4.1 Tabella riassuntiva def. caso continuo def. Trasformata Wavelet R wav T f (a, b) = √1 f (s)ψ |a| funzione figlia operatori coinvolti ds a, b ∈ R, a 6= 0 = hf, Tb Da ψi = hf, ψa,b i R 1 s wav Tj,k (f ) = q j f (s)ψ j − kb0 ds a0 a0 caso discreto s−b a j, k ∈ Z, a0 > 1, b0 > 0 = hf, Daj Tkb0 ψi 0 = hf, ψj,k i ψa,b (s) = √1 ψ s−b a |a| traslaz. e dilataz. nel tempo di una wavelet madre ψ data. Risultato: nel dominio del tempo ψa,b hanno ampiezze nel tempo che variano con la freq.: ψa,b a freq. acute sono molto strette, mentre ψa,b a freq. gravi sono molto ampie 26 Trasformata di Gabor R win T f (t, ω) = f (s)g(s − t)e−iωs ds = hf, Tt Mω gi = hf, gω,t i win f = Tm,n R f (s)g(s − nt0 )e−imω0 s ds = hf, Tnt0 Mmω0 gi = hf, gm,n i gω,t (s) = eiωs g(s − t) traslaz. nel tempo e nella freq. (modulaz.) di una finestra g data. Risultato: nel piano tempo-frequenza gω,t hanno tutte la stessa ampiezza nel tempo capacità risolutiva cond. ammiss. nel continuo reversibilità nel caso continuo eq. ricostruz. caso continuo cond. ammiss. nel discreto per avere alg. ricostruz. Cond. suff. per avere Cond. necess. per avere Trasformata Wavelet privilegia la risoluzione temporale alle freq. acute e la risoluzione spettrale alle freq. gravi R +∞ 2 Cψ = 2π −∞ |ψ̂(ξ)| |ξ| dξ < ∞ è reversibile se la condizione di ammissibilità viene soddisfatta R +∞ R +∞ f = Cψ−1 −∞ −∞ a12 hf, ψa,b iψa,b da db R +∞ R +∞ 1 wav = C −1 (T f )ψ da db ψ −∞ −∞ a2 non c’è condizione di ammissibilità è sempre reversibile f= RR T win f (t,ω)gω,t dt dω 2πkgk2 a,b se ψ è ammissibile R +∞ |ψ̂(ξ)|2 Cψ = 0 dξ ξ R 0 |ψ̂(ξ)|2 = −∞ |ξ| dξ < ∞ le ψj,k devono costituire una frame di wavelet una frame di wavelet (th. 3.1) una frame di wavelet (th. 3.2) nessuna cond. su a0 , b0 27 Trasformata di Gabor ha una limitata capacità risolutiva tempo-frequenza ∀g ∈ L2 (R) nessuna cond. di ammiss. su g le gm,n devono costituire una frame di Gabor una frame di Gabor (th. 3.4) una frame di Gabor (th. 3.5) cond. su ω0 , t0 (ω0 t0 ≤ 2π) Bibliografia [1] I. Daubechies, Ten lectures on wavelets, SIAM conf, series in applied math. Boston 1992. [2] I. Daubechies, The wavelet transform, time-frequency localization and signal analysis, IEEE Trans. Info. Theory, 36:961-1005, 1990. [3] Marco Zantoni, Trasformata di Gabor e calcolo dell’operatore inverso: teoria e algoritmi, Tesi di Laurea, Università degli Studi di Udine, 2002. [4] Elke Wilczok, New Uncertainty Principles for the Continuous Gabor Transform and the Continuous Wavelet Transform, Documenta Mathematica 5, pp. 201-226, 2000. [5] Peter Prinz, Theory and algorithtms for discrete 1-dimensional Gabor frames, Tesi di Laurea, Università di Vienna, 1996. [6] T. Strohmer, A short introduction to Gabor analysis, disponibile su http://www.math.ucdavis.edu/∼strohmer/research/gabor/gaborintro/ [7] Robi Polikar, The wavelet tutorial, disponibile su http://engineering.rowan.edu/∼polikar/WAVELETS/WTtutorial.html [8] D. Gabor, Theory of communication, J. IEE (London), 93(III):429-457, November 1946. [9] C. Valens, A Really Friendly Guide to Wavelets, disponibile su http://perso.wanadoo.fr/polyvalens/clemens/wavelets/wavelets.html [10] A. Janssen, Representations of Gabor frame operators, disponibile su http://tyche.mat.univie.ac.at/Janssen/, presented at NATO-ASI 2000, Il Ciocco, Tuscany (Italy), July 2-15 (2000). 28 [11] R. Ashino, M. Nagase and R. Vaillancourt, Gabor, wavelet and chirplet transforms in the study of pseudodifferential operators, disponibile su http://okumedia.cc.osaka-kyoiku.ac.jp/∼ashino/pdf/rimsr.pdf [12] C. Guerrini, Segnali e wavelet, Atti dell’Accademia delle Scienze dell’Istituto di Bologna, anno 282 serie V n.6 pp.7-26, febbraio 1995. 29