Dipartimento di Informatica Università degli Studi di Verona

Transcript

Dipartimento di Informatica Università degli Studi di Verona
Dipartimento di Informatica
Università degli Studi di Verona
Rapporto di Ricerca
Research Report
RR 13/2003
Trasformata Wavelet e
Trasformata di Gabor a
confronto
Laura Ottaviani
Questo rapporto è disponibile su Web all’indirizzo
This report is available on the web at the address
http://www.sci.univr.it/~ottavian/Works/wavelet_gabor.pdf
Indice
Sommario
2
1 Definizioni preliminari
4
2 Introduzione alle frame
8
3 Trasformata di Gabor vs. Trasformata Wavelet
11
3.1 Analisi tempo-frequenza: dalla trasformata di Fourier alla
trasformata di Gabor . . . . . . . . . . . . . . . . . . . . . . . 11
3.2 La Trasformata Wavelet . . . . . . . . . . . . . . . . . . . . . 13
3.2.1 La Trasformata Wavelet continua . . . . . . . . . . . . 16
3.2.2 La Trasformata Wavelet discreta . . . . . . . . . . . . 18
3.3 La Trasformata di Gabor . . . . . . . . . . . . . . . . . . . . 21
3.3.1 La Trasformata di Gabor continua . . . . . . . . . . . 22
3.3.2 La Trasformata di Gabor discreta . . . . . . . . . . . 22
4 Conclusioni
26
4.1 Tabella riassuntiva . . . . . . . . . . . . . . . . . . . . . . . . 26
Bibliografia
28
2
Sommario
Dopo aver introdotto le definizioni preliminari necessarie per la comprensione dell’argomento trattato, sarà presentato il concetto di frame per uno
spazio di Hilbert H, che sarà richiamato successivamente.
Si passerà, quindi, all’argomento centrale di questo studio: la trasformata
wavelet e la trasformata di Gabor. Esse saranno presentate sia nel caso
continuo, che in quello discreto.
Per entrambe le trasformate, verranno evidenziate le loro proprietà,
confrontando i vantaggi e gli svantaggi di ciascuna di esse. Inoltre, si
presenteranno gli aspetti comuni di esse, le loro similarità e le loro differenze.
3
Capitolo 1
Definizioni preliminari
Definizione 1.1 Uno spazio vettoriale V è detto spazio vettoriale normato
se è dotato di una funzione k k : V 7−→ [0, ∞[ tale che
1. kxk = 0 ⇐⇒ x = 0
2. kαxk = |α|kxk
∀x ∈ V, α ∈ C
3. kx + yk ≤ kxk + kyk
∀x, y ∈ V
La funzione k k è chiamata norma.
Definizione 1.2 Una successione {xn }n∈N è detta successione di Cauchy
se per ogni > 0 esiste N ∈ N tale che
kxn − xm k ≤ ∀n, m ≥ N
(1.1)
Definizione 1.3 Lo spazio di Banach o spazio normato completo è lo spazio normato in cui ogni successione di Cauchy converge.
Definizione 1.4 Lo spazio di Hilbert è uno spazio vettoriale H, dotato di
prodotto interno, che sia uno spazio di Banach rispetto alla norma indotta,
cioè è uno spazio vettoriale
pH, dotato di prodotto interno h , i, tale che la
norma definita da kxk := hx, xi, x ∈ H lo rende uno spazio di Banach.
Due spazi di Hilbert sono particolarmente interessanti per questo studio:
• lo spazio delle funzioni a valori complessi, definito su R, che sono a
quadrato integrabile rispetto alla misura di Lebesgue
Z
2
2
L (R) := f : R 7−→ C : f è misurabile e
|f (x)| dx < ∞
4
Esso è uno spazio di Hilbert rispetto al prodotto interno
Z
hf, giL2 = f (x)g(x) dx
dove g(x) è il coniugato complesso di g(x).
• lo spazio delle successioni a quadrato sommabile, dove l’insieme I degli
indici è numerabile
(
)
X
2
2
l (I) := {xn }n∈I :
|xn | < ∞
n∈I
Esso è uno spazio di Hilbert rispetto al prodotto interno
X
h{xn }, {yn }il2 =
xn yn
n∈I
Definizione 1.5 Siano K e H due spazi di Hilbert. Sia T una funzione
lineare da K a H. Si dice che T è limitata se esiste una costante k > 0 tale
che
kT xk ≤ kkxk
∀x ∈ K
(1.2)
La norma kT k di T è la più piccola costante k che può essere usata nella
condizione 1.2, oppure, equivalentemente,
kT k = sup {kT xk : x ∈ K, kxk = 1}
Definizione 1.6 Siano K e H due spazi di Hilbert. L’ operatore aggiunto
è l’unico operatore T ∗ tale che T ∗ : H 7−→ K soddisfa
hx, T yiH = hT ∗ x, yiK ,
∀x ∈ H, y ∈ K
Se K = H, allora:
• l’operatore T si dice autoaggiunto se T = T ∗ ;
• l’operatore T si dice unitario se T T ∗ = T ∗ T = I. Se T è unitario,
allora
hT x, T yi = hx, yi,
∀x, y ∈ H
Definizione 1.7 Su L2 (R) definiamo i seguenti operatori:
5
• di traslazione (nel tempo)
Ta : L2 (R) 7−→ L2 (R),
a∈R
(Ta f )(x) = f (x − a)
• di modulazione (o di traslazione in frequenza)
Mb : L2 (R) 7−→ L2 (R),
b∈R
(Mb f )(x) = eibx f (x)
• di dilatazione
Da : L2 (R) 7−→ L2 (R),
1
(Da f )(x) = p f
|a|
a>0
x
a
Si può dimostrare che gli operatori Ta , Mb e Da sono unitari. Si noti che Mb
e Ta non commutano, ma vale la seguente relazione: Ta Mb = e−iba Mb Ta .
Definizione 1.8 Siano {λi , ∀i ∈ [1, n]} ∈ C e {vi , ∀i ∈ [1, n]} ∈ V , dove
V è uno spazio complesso di dimensione finita. I vettori {vi , ∀i ∈ [1, n]}
sono linearmente indipendenti per ogni λi ∈ C se
n
X
λi vi = 0̄ ⇒ λi = 0,
∀i ∈ [1, n]
i=1
Definizione 1.9 Un insieme {vi , ∀i ∈ [1, n]} ∈ V di vettori linearmente
indipendenti in uno spazio complesso V di dimensione finita è una base per
V se
n
X
∀v ∈ V ∃{λi , ∀i ∈ [1, n]} ∈ C : v =
λi vi
i=1
Definizione 1.10 Due vettori x, y ∈ H sono ortogonali se hx, yi = 0.
Definizione 1.11 Si definisce {ei }∞
i=1 ⊆ H un sistema ortonormale (ONS)
se hei , ej i = δi,j , dove δi,j è la δ-funzione di Kronecker, ossia quella funzione
che vale 1 se i = j, 0 altrimenti.
Definizione 1.12 Un sistema ortonormale {ei }∞
i=1 è una base ortonormale
(ONB) se H = span{ei }∞
.
i=1
6
Definizione 1.13 Sia V uno spazio vettoriale e S ⊆ V e non vuoto. Allora
v ∈ V si dice combinazione lineare degli elementi
di S se esiste un numero
P
finito n di vi ∈ V e ai ∈ R tale che v = ni=1 ai vi . Si dice che v è una
combinazione lineare di {vi }ni=1 con coefficienti {ai }ni=1 .
Definizione 1.14 Sia S ⊆ V e non vuoto. Lo span di S indicato con
span(S) è l’insieme che contiene tutte le combinazioni lineari degli elementi
di S. Per convenzione: span(0) = {0̄}.
∞
Per un sistema ortonormale {ei }∞
i=1 , H = span{ei }i=1 è equivalente alla
formula di Parseval:
∞
X
|hf, ei i|2 = kf k2
∀f ∈ H
i=1
Quando {ei }∞
i=1 è una base ortonormale, ogni f ∈ H può essere scritta come:
f=
∞
X
hf, ei iei
i=1
7
Capitolo 2
Introduzione alle frame
Definizione 2.1 Una frame per uno spazio di Hilbert H con prodotto interno h , i è una famiglia di elementi {fi }∞
i=1 ⊆ H tale che
∃A > 0, B < ∞ :
Akf k2 ≤
X
|hf, fi i|2 ≤ Bkf k2
∀f ∈ H
(2.1)
i∈I
dove i numeri A, B sono detti frame bound.
Si osservi che i frame bound non sono unici.
I frame bound definiti ottimali sono il più grande valore possibile per
A e il più piccolo valore possibile per B nell’eq. 2.1. Se A = B, allora la
frame è detta tight. Se una frame cessa di essere tale quando un qualsiasi
suo elemento viene rimosso, la frame viene definita esatta.
Si noti che le frame non sono necessariamente basi ortonormali.
Teorema 2.1 (Condizione sufficiente per una tight frame con frame bound A = B = 1 affinchè essa sia una base ortonormale) Sia
{fi }i∈I ⊆ H una tight frame in H, con frame bound A = B = 1. Supponiamo
kfi k = 1 per ogni i ∈ I. Allora {fi }i∈I è una base ortonormale.
Definizione 2.2 Sia {fi }i∈I ⊆ H una frame in H e c = {ci }i∈I una successione in l2 (I). Definiamo l’ operatore di analisi T come la funzione
lineare:
T : H 7−→ l2 (I)
T f = {hf, fi i}∞
i=1
8
L’operatore aggiunto T ∗ di T è calcolato nel modo seguente:
hT ∗ {ci }i∈I , f i = h{ci }, T f i
X
=
ci T f
i∈I
=
X
ci hf, fi i
X
ci hfi , f i
i∈I
=
i∈I
(2.2)
da cui:
T ∗ {ci }i∈I =
X
ci fi
i∈I
L’operatore T ∗ è chiamato operatore di sintesi o espansione.
Definizione 2.3 Sia {fi }i∈I ⊆ H una frame in H. L’ operatore di frame è
definito come la funzione:
S : H 7−→ H
X
Sf = T ∗ T f =
hf, fi ifi
i∈I
Definizione 2.4 Sia {fi }i∈I ⊆ H una frame in H. Definiamo una famiglia
di vettori {fei }i∈I come segue:
fei = S −1 fi = (T ∗ T )−1 fi
Si può dimostrare (teorema 2.2) che tale famiglia costituisce una frame, che
chiamiamo frame duale di {fi }.
Teorema 2.2 (Proprietà dell’operatore di frame) Sia {fi }i∈I ⊆ H una
frame in H con frame bound A, B. Per l’operatore di frame S valgono le
seguenti proprietà:
1. L’operatore di frame S è invertibile e soddisfa B −1 I ≤ S −1 ≤ A−1 I;
2. fei = {S −1 fi } è una frame con bound B −1 , A−1 .
Una frame possiede una delle proprietà principali di una base, ossia quella di poter esprimere una funzione come combinazione lineare degli elementi
della base.
9
Teorema 2.3 (Decomposizione in frame) Se {fi }i∈I è una frame con
operatore di frame S, allora ogni elemento dello spazio di Hilbert H si può
rappresentare come combinazione lineare di elementi della frame.
f
= SS −1 f
X
=
hf, S −1 fi ifi
∀f ∈ H
i∈I
=
X
i∈I
hf, fei ifi
∀f ∈ H
(2.3)
Spesso viene anche usata la decomposizione in frame nella forma:
f
= S −1 Sf
X
=
hf, fi iS −1 fi
∀f ∈ H
i∈I
=
X
i∈I
hf, fi ifei
∀f ∈ H
(2.4)
Perciò, da tale teorema, se {fi }i∈I è una frame, ricaviamo la formula
X
X
f=
hf, fi ifei =
hf, fei ifi
∀f ∈ H
(2.5)
i∈I
i∈I
Essa indica:
• sia come ricostruire f a partire da hf, fi i, cioè come, nota la frame
duale {fei } di {fi }i∈I , possiamo ricostruire f mediante hf, fi i. Perciò si
deve solamente calcolare fei e ciò implica l’inversione di T ∗ T = S;
• sia come scrivere f come sovrapposizione di fi .
Si osservi che, dati i coefficienti hf, fi i, i vettori fei che ricostruiscono f non
sono determinati univocamente. Infatti, le frame non sono generalmente
basi (ortonormali), poichè gli fi sono di solito non linearmente indipendenti.
Quindi, uno stesso f può essere ricostruito dagli stessi hf, fi i, ma con vettori fei diversi. Ciò significa che esistono molte sovrapposizioni diverse che
portano alla medesima f .
10
Capitolo 3
Trasformata di Gabor vs.
Trasformata Wavelet
3.1
Analisi tempo-frequenza: dalla trasformata di
Fourier alla trasformata di Gabor
L’analisi tempo-frequenza occupa un posto centrale nell’analisi dei segnali.
La trasformata di Fourier, definita da
1
Ff (ξ) = fˆ(ξ) = √
2π
Z
∞
e−ixξ f (x)dx,
ξ ∈ R, fˆ(ξ) ∈ C
(3.1)
−∞
è ideale per studiare segnali stazionari, in cui, cioè, le proprietà sono statisticamente invarianti nel tempo. Molti processi e segnali, però, sono nonstazionari, ossia essi evolvono nel tempo, come, per esempio, i segnali vocali
e la musica.
Per analizzare segnali non-stazionari bisogna utilizzare una rappresentazione che sia locale sia nel dominio del tempo, sia in quello delle frequenze. Per località nel tempo si intende la capacità di localizzare il contenuto
di frequenze appartenenti ad un certo intervallo temporale. Si pensi, ad
esempio, ad uno spartito musicale, il quale indica al musicista quale nota
suonare (l’informazione riguardo la frequenza), e in quale istante suonarla
(l’informazione temporale).
La trasformata di Fourier non permette la localizzazione temporale, poiché per calcolare il suo valore fˆ ad una determinata frequenza ξ, si deve
conoscere l’intero segnale f (x). Se in un certo istante x il segnale viene
alterato, questo si ripercuote sull’intero spettro.
11
Un approccio per ottenere un’analisi tempo-frequenza locale consiste nel
“tagliare” il segnale in parti e applicare un’analisi di Fourier su ciascuna di
queste parti. Le funzioni, però, ottenute da una segmentazione di questo
tipo, non smussata, non sono periodiche, poiché la trasformata di Fourier
interpreta i salti agli estremi come discontinuità o come brusche variazioni
del segnale.
Per evitare tali artefatti, è stato introdotto il concetto di windowing
(finestratura). Invece di localizzare il segnale mediante una funzione rettangolare, si usa, per la segmentazione, una funzione finestra smussata, che
assuma un valore vicino ad 1 intorno all’origine e decada verso il valore 0
agli estremi. La procedura di analisi locale tempo-frequenza risultante viene
detta Short-Time Fourier Transform continua (STFT ) o windowed Fourier
transform o trasformata di Gabor.
La trasformata di Gabor di una funzione arbitraria f ∈ L2 (R) rispetto
ad una data finestra g è definita come:
Z
win
T
f (t, ω) = f (s)g(s − t)e−iωs ds
(3.2)
Indicando con Tt e Mω gli operatori rispettivamente di traslazione e modulazione, possiamo esprimere la eq. 3.2 come
T win f (t, ω) = hf, Tt Mω gi
= hf, gω,t i
(3.3)
La trasformata di Gabor o STFT è vista come la sovrapposizione traslata nel
tempo e nella frequenza (cioè modulata) della finestra g data. Le funzioni
gω,t vengono, talvolta, definite [4] funzioni figlie di g, mentre g è chiamata
funzione finestra o atomo di Gabor.
Uno svantaggio della STFT è il suo limite nella capacità risolutiva tempofrequenza, dovuta al principio di indeterminazione. Infatti, le frequenze
gravi sono difficilmente rappresentabili con finestre strette, mentre brevi
impulsi possono essere localizzabili con fatica nel tempo se si utilizzano
finestre ampie. Quindi, per riassumere:
• finestra stretta: buona risoluzione temporale; risoluzione frequenziale
povera
• finestra ampia: buona risoluzione frequenziale, risoluzione temporale
povera
Un’altro svantaggio della STFT continua è la sua elevata ridondanza. Si
può ridurre tale ridondanza campionando T win f (t, ω), cioè valutandola su
12
un reticolo discreto del piano tempo-frequenza. La discretizzazione applicata
per t, ω consiste in:
t = nt0 ,
ω = mω0
(3.4)
dove t0 , ω0 > 0 sono fissati e n, m ∈ Z, ossia si campiona T win f su un
reticolo tempo-frequenza della forma t0 Z × ω0 Z, in cui t0 , ω0 , chiamate
costanti di reticolo, indicano il passo di campionamento in traslazione e
modulazione. Quindi, la eq. 3.2 diventa:
T win f
m,n
=
Z
f (s)g(s − nt0 )e−imω0 s ds
= hf, Tnt0 Mmω0 gi
= hf, gm,n i
(3.5)
Possiamo dire che le gm,n (s) = eimω0 s g(s − nt0 ) sono ottenute traslando
g lungo il reticolo t0 Z × ω0 Z nel piano tempo-frequenza. Perciò, ogni gm,n
occupa una certa area nel piano tempo-frequenza. Per costanti di reticolo
t0 , ω0 scelte appropriatamente, le gm,n coprono tutto il piano.
Nella figura 3.1, sono rappresentate le funzioni elementari di Gabor
gm,n (s) = eimω0 s g(s − nt0 ) che sono copie traslate nel tempo e nella frequenza della della finestra g data. Ogni gm,n ha inviluppo della forma di
g.
Nella figura 3.2, sono rappresentate schematicamente le posizioni delle
funzioni elementari di Gabor gm,n nel piano tempo-frequenza.
Nella sez. 3.3.2, vedremo più dettagliatamente le proprietà dipendenti
dal valore del prodotto t0 ω0 e stabiliremo un limite ad esso. Ricordiamo che
Gabor propose di usare la funzione di Gauss e le sue traslazioni e modulazioni
con costanti di reticolo tali che t0 ω0 = 2π, poichè essi, come riporta [6]
citando [8], “assicurano il miglior utilizzo dell’area dell’informazione, nel
senso che posseggono il più piccolo prodotto di durata efficace per ampiezza
efficace”.
3.2
La Trasformata Wavelet
La trasformata wavelet fornisce una descrizione tempo-frequenza simile alla
STFT, con alcune differenze significative.
Le formule per la trasformata wavelet, analoghe alle eq. 3.2 e eq. 3.5
rispettivamente, sono le seguenti:
13
Figura 3.1: Funzioni gm,n , figlie di g. In questa figura è stata rappresentata
solo la parte reale delle funzioni gm,n . La figura è stata tratta da [6] e
adattata secondo la nostra notazione.
14
Figura 3.2: Posizioni delle funzioni elementari di Gabor gm,n nel piano
tempo-frequenza rappresentate schematicamente. La figura è stata tratta
da [6] e adattata secondo la nostra notazione.
15
• caso continuo
1
T wav f (a, b) = p
|a|
Z
f (s)ψ
s−b
ds,
a
a, b ∈ R, a 6= 0 (3.6)
• caso discreto
wav (f ) = q1
Tj,k
aj0
Z
f (s)ψ
s
aj0
− kb0
!
j, k ∈ Z, a0 > 1, b0 > 0
ds
(3.7)
In entrambi i casi assumiamo che ψ soddisfi
vedremo il motivo per una tale assunzione.
3.2.1
R
ψ(s)ds = 0. In seguito
La Trasformata Wavelet continua
Prendiamo in considerazione la trasformata wavelet continua:
Z
s−b
1
wav
f (s)ψ
ds,
a, b ∈ R, a 6= 0
T
f (a, b) = p
a
|a|
= hf, Tb Da ψi
= hf, ψa,b i
(3.8)
Le funzioni ψa,b sono dette wavelet o, talvolta [4], wavelet figlie, mentre la
funzione ψ è chiamata wavelet madre.
Si può notare una similarità tra essa e la STFT (eq. 3.2, 3.3): sia la trasformata wavelet che quella di Gabor nel continuo considerano il prodotto
interno di f con una famiglia di funzioni di analisi indicizzate da due parain eq. 3.8.
metri, gω,t (s) = eiωs g(s − t) in eq. 3.2, 3.3 e ψa,b (s) = √1 ψ s−b
a
|a|
Però, la trasformata di Gabor o STFT produce, nel piano tempo-frequenza,
una traslazione nel tempo e nella frequenza (modulazione) di una finestra
g data, mentre la trasformata wavelet produce, nel dominio del tempo, una
traslazione ed una dilatazione nel tempo di una wavelet madre ψ data.
Nella figura 3.3, sono rappresentate schematicamente le wavelet come
traslazione ed dilatazione nel dominio del tempo di una wavelet madre ψ
data.
I parametri a,b sono i parametri rispettivamente di dilatazione e di traslazione. Quando
il parametro di dilatazione a cambia, l’equazione ψa,0 (s) =
√1 ψ as copre diversi intervalli di frequenza: grandi valori di |a| corri|a|
spondono a frequenze gravi o ad una ψa,0 ampia, mentre piccoli valori di
16
Figura 3.3: Wavelet come traslazione ed dilatazione nel dominio del tempo
di una wavelet madre ψ data. La figura è stata tratta da [9].
|a| corrispondono a frequenze acute o ad una ψa,0 stretta. Il parametro di
traslazione b permette di muovere il centro di localizzazione del tempo: ogni
ψa,b (s) è localizzata intorno a s = b.
La differenza tra la trasformata wavelet e quella di Gabor sta nella forma
delle funzioni di analisi gω,t e ψa,b . Le funzioni gω,t consistono tutte della
stessa funzione inviluppo g, l’atomo di Gabor, traslata alla localizzazione
temporale appropriata e “riempita” con oscillazioni a frequenze più acute.
Tutte le gω,t , trascurando il valore ω, hanno la stessa ampiezza. Invece, le
ψa,b hanno ampiezze nel tempo che variano con la frequenza: ψa,b a frequenze acute sono molto strette, mentre ψa,b a frequenze gravi sono molto
ampie. Perciò, la trasformata wavelet è in grado di “zoomare” meglio rispetto a quella di Gabor o STFT su segnali a frequenze acute molto brevi,
privilegiando la risoluzione temporale alle frequenze acute e la risoluzione
spettrale alle frequenze gravi.
La trasformata wavelet continua è una trasformata reversibile, se viene
soddisfatta la seguente condizione di ammissibilità:
Cψ = 2π
Z
+∞
−∞
|ψ̂(ξ)|2
dξ < ∞
|ξ|
(3.9)
Questa non è una richiesta molto restrittiva. La trasformata wavelet
continua è reversibile se la condizione di ammissibilità 3.9 viene soddisfatta,
anche se le funzioni base non sono ortonormali.
La costante Cψ dipende solo da ψ, ossia dalla wavelet madre utilizzata.
Questa costante viene chiamata costante di ammissibilità.
Una funzione può essere ricostruita dalla sua trasformata wavelet mediante la formula di ricostruzione seguente, detta formula della risoluzione
di identità:
Z +∞ Z +∞
1
f = Cψ−1
hf, ψa,b iψa,b da db
2
a
−∞
−∞
17
Cψ−1
=
Z
+∞ Z +∞
−∞
−∞
1 wav
(T
f )ψa,b da db
a2
(3.10)
Se ψ è in L1 (R), allora ψ̂ è continua eR la condizione di ammissibilità può
essere soddisfatta solo se ψ̂(0) = 0, cioè ψ(s)ds = 0.
La eq. 3.10 può essere vista in due modi diversi:
• come un modo di ricostruire f quando la sua trasformata wavelet
T wav f è nota;
• come un modo di scrivere f come sovrapposizione di wavelet ψa,b .
I coefficienti di questa sovrapposizione sono dati esattamente dalla
trasformata wavelet T wav f di f.
3.2.2
La Trasformata Wavelet discreta
Consideriamo, ora, la trasformata wavelet discreta. La eq. 3.7 è stata ottenuta dalla eq. 3.6 riducendo a, b a valori discreti, come spiegato qui di
seguito.
Per quanto riguarda il parametro di dilatazione, la discretizzazione è
a = aj0 dove j ∈ Z e il passo di dilatazione a0 6= 1 è fissato. Per convenienza
si assume che a0 > 1.
Per il parametro di traslazione b,
• per j = 0, sembra naturale prendere solo gli interi (positivi e negativi) multipli di un b0 fissato (si assume b0 > 0), dove b0 sia scelto
appropriatamente in modo che ψ(s − kb0 ) copra l’intero asse;
1
• per j 6= 0, l’ampiezza di q j ψ sj è aj0 volte l’ampiezza di ψ(s).
a0
a0
kb0 aj0
Perciò, la scelta b =
assicurerà che le wavelet discretizzate al
livello j coprano l’asse come avviene per ψ(s − kb0 ).
Per convenienza, nella discretizzazione riduciamo il parametro a solamente a valori positivi. In tal modo, la condizione di ammissibilità diventa:
Cψ =
Z
0
+∞
|ψ̂(ξ)|2
dξ =
ξ
Z
0
−∞
|ψ̂(ξ)|2
dξ < ∞
|ξ|
(3.11)
Riassumendo, quindi, discretizziamo la trasformata wavelet continua scegliendo: a = aj0 , b = kb0 aj0 , dove j, k ∈ Z, a0 > 1, b0 > 0 fissati. La scelta di
18
a0 , b0 appropriati dipende dalla wavelet madre ψ. Con tale discretizzazione
otteniamo:
!
1
s − kb0 aj0
ψj,k (s) = q ψ
aj0
aj0
!
s
1
− kb0
= q ψ
aj0
aj0
= (Daj Tkb0 ψ)(s)
(3.12)
0
Ci poniamo, ora, due domande:
1. I coefficienti wavelet discreti hf, ψj,k i caratterizzano completamente la
funzione f ? Possiamo ricostruire la funzione f in un modo numericamente stabile a partire dai coefficienti hf, ψj,k i?
2. Ogni funzione f può essere scritta come sovrapposizione di “blocchi costruttivi elementari” ψj,k ? Possiamo trovare un algoritmo per trovare
i coefficienti di una tale sovrapposizione?
Queste domande sono aspetti duplici dello stesso problema.
Nel caso della trasformata wavelet continua, la risoluzione di identità 3.10
risponde ad entrambe le domande, se, almeno, ψ è ammissibile.
Nel caso discreto, invece, non c’è una equazione analoga alla risoluzione
di identità. Si osservi che ciò non è vero per ψ speciali. Se le ψj,k costituiscono una base ortonormale, allora l’espansione ripetto a questa base
ortonormale fornisce una risoluzione di identità discreta.
Cerchiamo se esiste una condizione di ammissibilità discreta e qual’è.
Consideriamo funzioni f ∈ L2 (R). Esse possono essere caratterizzate mediante i loro coefficienti wavelet hf, ψj,k i se è vero che
hf1 , ψj,k i = hf2 , ψj,k i
∀j, k ∈ Z
⇒
f1 ≡ f2
oppure, equivalentemente, se
hf, ψj,k i = 0
∀j, k ∈ Z ⇒ f = 0
Ma, la prima domanda richiede più della caratterizzabilità. Richiede se
sia possibile ricostruire f in un modo numericamente stabile a partire dai
coefficienti wavelet hf, ψj,k i.
Si può dimostrare che, per avere un algoritmo di ricostruzione numericamente stabile per f a partire dai coefficienti wavelet hf, ψj,k i, le ψj,k devono
costituire una frame. In tal caso si parla di frame di wavelet. Possiamo,
perciò stabilire la seguente definizione:
19
Definizione 3.1 Una frame di wavelet è una frame per L2 (R) della forma
{Daj Tkb0 ψ}j,k∈Z , dove a0 > 1, b0 > 0 e ψ ∈ L2 (R) è una funzione fissata,
0
cioè
una frame di wavelet è un sistema {ψj,k }j,k∈Z = {Daj Tkb0 ψ}j,k∈Z in cui
0
esistono due costanti A > 0, B < ∞ tali che
X
Akf k2 ≤
|hf, ψj,k i|2 ≤ Bkf k2
∀f ∈ L2 (R)
j,k∈Z
Il seguente teorema [3] è una generalizzazione di una condizione sufficiente presentata in [1].
Teorema 3.1 (Condizione sufficiente per avere una frame di wavelet) Siano ψ ∈ L2 (R) data e a0 > 1 b0 > 0. Supponiamo che:


X
X
X
k 
j
j
A := inf |ξ|∈[1,a0 ] 
|ψ̂(aj0 ξ)|2 −
ψ̂(a0 ξ)ψ̂ a0 ξ +
>0
b0 j∈Z
k6=0 j∈Z
X X k j
j
B := sup|ξ|∈[0,a0 ]
ψ̂(a0 ξ)ψ̂ a0 ξ +
<∞
b0 k6=0 j∈Z
allora {Daj Tkb0 ψ}j,k∈Z è una frame per L2 (R) con frame bound
0
A B
b0 , b0 .
Applicando la decomposizione in frame (eq. 2.5),
X
X
g
g
f=
hf, ψj,k iψ
hf, ψ
j,k =
j,k iψj,k
j,k
j,k
si trova un algoritmo per ricostruire f a partire dai coefficienti wavelet
hf, ψj,k i, se le ψj,k costituiscono una frame. Contemporaneamente, mediante
lo stesso teorema, si ottiene l’algoritmo per scrivere f come sovrapposizione
delle ψj,k . Per questa ragione, le due domande poste in precedenza sono
aspetti duplici dello stesso problema.
Si può dimostrare che la richiesta che le ψj,k costituiscano una frame,
impone già che ψ sia ammissibile. Infatti:
Teorema 3.2 (Condizione necessaria per avere una frame di
wave- let: l’ammissibilità della wavelet madre) Se le ψj,k (s) = q1 j ψ sj − kb0 ,
a0
L2 (R)
a0
j, k ∈ Z costituiscono una frame per
con frame bound A, B, allora
Z +∞
b0 ln a0
|ψ̂(ξ)|2
b0 ln a0
A≤
dξ ≤
B
π
ξ
π
0
20
e
b0 ln a0
A≤
π
Z
0
−∞
|ψ̂(ξ)|2
b0 ln a0
dξ ≤
B
|ξ|
π
Quindi, assumiamo sempre che ψ sia ammissibile. Se le ψj,k costituiscono
una tight frame, allora
π
A=B=
b0 ln a0
Z
|ψ̂(ξ)|2
dξ
ξ
e se normalizziamo ψ tale che
Z
|ψ̂(ξ)|2
dξ = 1
ξ
allora
π
b0 ln a0
A=B=
Perciò, il teorema 3.2 stabilisce la relazione tra i parametri delle frame di
wavelet e i frame bound.
3.3
La Trasformata di Gabor
Richiamiamo le formule della trasformata di Gabor, nel caso continuo (eq. 3.2,
eq. 3.3) e in quello discreto (eq. 3.5):
• caso continuo
T win f (t, ω) =
Z
f (s)g(s − t)e−iωs ds
= hf, Tt Mω gi
= hf, gω,t i
(3.13)
• caso discreto
win f
Tm,n
=
Z
f (s)g(s − nt0 )e−imω0 s ds
= hf, Tnt0 Mmω0 gi
= hf, gm,n i
21
(3.14)
3.3.1
La Trasformata di Gabor continua
Data T win f (t, ω) = hf, gω,t i, dove gω,t (s) = eiωs g(s − t), la funzione f può
essere ricostruita dalla STFT mediante la formula inversa:
ZZ
f = (2πkgk2 )−1
T win f (t, ω)gω,t dt dω
(3.15)
Non c’è condizione di ammissibilità in questo caso: qualsiasi funzione g
in L2 (R) è ammessa.
Se normalizziamo g tale che kgkL2 = 1, allora
ZZ
1
f=
T win f (t, ω)gω,t dt dω
2π
3.3.2
La Trasformata di Gabor discreta
Consideriamo, ora, la trasformata di Gabor discreta, o STFT discreta. Possiamo, anche in questo caso, formulare le stesse domande che ci eravamo
posti esaminando la trasformata wavelet discreta:
1. Possiamo ricostruire la funzione f in un modo numericamente stabile
a partire dai coefficienti hf, gm,n i?
2. Possiamo trovare un algoritmo efficiente per scrivere f come combinazione lineare delle gm,n ?
Le risposte a tali domande si trovano in modo analogo al caso delle wavelet. Una ricostruzione numericamente stabile di f a partire dai coefficienti
hf, gm,n i è possibile solo se le gm,n costituiscono una frame. In tal caso si
parla di frame di Gabor. Possiamo, perciò, stabilire la seguente definizione:
Definizione 3.2 Una frame di Gabor o Weyl-Heisenberg frame è una frame per L2 (R) della forma {Mmω0 Tnt0 g}m,n∈Z , dove ω0 , t0 > 0 e g ∈ L2 (R)
è una funzione fissata,
cioè
una frame di Gabor è un sistema {gm,n }m,n∈Z = {Mmω0 Tnt0 g}m,n∈Z in cui
esistono due costanti A > 0, B < ∞ tali che
X
Akf k2 ≤
|hf, gm,n i|2 ≤ Bkf k2
∀f ∈ L2 (R)
m,n∈Z
Il valore del prodotto t0 ω0 è fondamentale per caratterizzare una frame
in L2 (R). Ciò viene affermato dal seguente teorema [3]:
22
Teorema 3.3 Sia {Mmω0 Tnt0 g}m,n∈Z una frame di Gabor con ω0 , t0 > 0.
1. Se t0 ω0 > 2π, allora {Mmω0 Tnt0 g}m,n∈Z non è completo in L2 (R) e,
quindi, non è una frame per L2 (R).
2. Se {Mmω0 Tnt0 g}m,n∈Z è una frame, allora t0 ω0 = 2π se e solo se
{Mmω0 Tnt0 g}m,n∈Z è una base di Riesz.
dove definiamo una base di Riesz come segue:
Definizione 3.3 Una successione {fi }i∈N in uno spazio di Hilbert H è una
base di Riesz se esistono una base ortonormale {ei }i∈N per H e una funzione
invertibile e limitata T : H 7−→ H tali che T ei = fi per ogni i ∈ N.
Perciò, per il teorema 3.3, sappiamo che {Mmω0 Tnt0 g}m,n∈Z è una frame
soltanto se t0 ω0 ≤ 2π e la frame è sovracompleta se t0 ω0 < 2π.
Il seguente teorema, analogo al teorema 3.1, definisce una condizione
sufficiente per avere una frame di Gabor. Le condizioni di questi due teoremi si ricavano secondo lo stesso procedimento, lasciando intuire, pur nella
diversità delle combinazioni degli operatori di modulazione, traslazione e
dilatazione, una comune origine tra le frame di Gabor e quelle wavelet.
Teorema 3.4 (Condizione sufficiente per avere una frame di Gabor) Siano g ∈ L2 (R) data e ω0 , t0 > 0. Supponiamo che:


X
X X
m

A := inf s∈[0,t0 ] 
|g(s − nt0 )|2 −
g(s − nt0 )g s − nt0 −
>0
ω0 n∈Z
m6=0 n∈Z
B := sups∈[0,t0 ]
X X
m g(s − nt0 )g s − nt0 −
<∞
ω0 m6=0 n∈Z
allora {Mmω0 Tnt0 g}m,n∈Z è una frame per L2 (R) con frame bound
B
A
ω0 , ω0 .
Applicando la decomposizione in frame (eq. 2.5), se le {gm,n }m,n∈Z costituiscono una frame, allora ogni funzione f ∈ L2 (R) può essere scritta
come
X
X
f=
hf, gm,n igg
hf, gg
(3.16)
m,n =
m,n igm,n
m,n
m,n
dove i gg
m,n sono i vettori nella frame duale di gm,n , che, in questo caso,
viene chiamata frame duale di Gabor. L’equazione 3.16 mostra sia come
ricostruire f a partire dai coefficienti hf, gm,n i, se le gm,n costituiscono una
frame, sia come scrivere f come sovrapposizione delle gm,n .
Analogamente al teorema 3.2, possiamo definire una condizione necessaria per avere una frame di Gabor:
23
Teorema 3.5 (Condizione necessaria per avere una frame di Gabor: densità tempo-frequenza sufficientemente alta) Se le {gm,n }m,n∈Z
costituiscono una frame per L2 (R) con frame bound A,B, allora
A≤
2π
kgk2 ≤ B
ω 0 t0
Quindi, non imponiamo nessun’altra restrizione su g. Si ricordi che assumiamo sempre g ∈ L2 (R). Se le {gm,n }m,n∈Z costituiscono una tight frame,
allora
2π
A=B=
kgk2
ω 0 t0
e se normalizziamo g tale che kgkL2 = 1, allora
A=B=
2π
ω 0 t0
In particolare, per il teorema 2.1, le gm,n costituiscono una base ortonormale,
se ω0 t0 = 2π. Perciò, il teorema 3.5, come il teorema 3.2 nel caso delle
wavelet, stabilisce la relazione tra i parametri delle frame di Gabor e i frame
bound.
L’assenza di qualsiasi condizione su g nel teorema 3.5 è simile all’assenza
di una condizione di ammissibilità per la trasformata di Gabor continua
(sez. 3.3.1) e molto diversa dalla condizione
Z +∞
|ψ̂(ξ)|2
dξ < ∞
|ξ|
−∞
sulla wavelet madre, necessaria sia nel caso continuo, che discreto.
Un’altra differenza tra la trasformata di Gabor e la trasformata wavelet
consiste nel fatto che i passi di traslazione nel tempo e nella frequenza t0 e
ω0 hanno una condizione: non esiste nessuna frame di Gabor per coppie ω0 ,
t0 tali che ω0 t0 > 2π. Infatti, se ω0 t0 > 2π, per ogni scelta di g ∈ L2 (R),
esiste una corrispondente f ∈ L2 (R) tale che f 6= 0 e f è ortogonale a tutte
le gm,n (s) = eimω0 s g(s − nt0 ), cioè hf, gm,n i = 0 ∀m, n ∈ Z. In tal caso,
non solo le gm,n non costituiscono una frame, ma i prodotti interni hf, gm,n i
non sono persino sufficienti per determinare f . Quindi, ci dobbiamo limitare
a ω0 t0 ≤ 2π. Si noti che, nel caso delle wavelet, non esiste una limitazione
simile per a0 , b0 .
Per avere una buona localizzazione temporale e frequenziale, dobbiamo
scegliere ω0 t0 < 2π. Infatti, le frame nel caso limite ω0 t0 = 2π hanno
necessariamente cattive proprietà di localizzazione o nel dominio del tempo,
o della frequenza, o, persino, in entrambi. Infatti:
24
Teorema 3.6 (Balian-Low) Se le gm,n (s) = eimω0 s g(s−nt0 ) costituiscono
una frame per L2 (R) con ω0 t0 = 2π, cioè se le gm,n costituiscono una base
di Riesz, allora o
Z
s2 |g(s)|2 ds = ∞
oppure
Z
ξ 2 |ĝ(ξ)|2 dξ = ∞
ovvero o g ∈
/ L2 (R) o ĝ ∈
/ L2 (R)
Per riassumere, se:
• ω0 t0 > 2π allora non esistono frame;
• ω0 t0 = 2π allora esistono frame, ma non hanno una buona localizzazione
tempo-frequenziale;
• ω0 t0 < 2π allora esistono frame (persino tight) con una eccellente localizzazione tempo-frequenziale.
Si osservi che, nonostante ω0 t0 ≤ 2π, non è detto che le gm,n costituiscano
necessariamente una frame. La condizione sufficiente per avere una frame
di Gabor è quella fissata dal teorema 3.4.
25
Capitolo 4
Conclusioni
4.1
Tabella riassuntiva
def.
caso
continuo
def.
Trasformata Wavelet
R
wav
T
f (a, b) = √1
f (s)ψ
|a|
funzione
figlia
operatori
coinvolti
ds
a, b ∈ R, a 6= 0
= hf, Tb Da ψi
= hf, ψa,b i
R
1
s
wav
Tj,k (f ) = q j f (s)ψ j − kb0 ds
a0
a0
caso
discreto
s−b
a
j, k ∈ Z, a0 > 1, b0 > 0
= hf, Daj Tkb0 ψi
0
= hf, ψj,k i
ψa,b (s) = √1 ψ s−b
a
|a|
traslaz. e dilataz. nel tempo di una
wavelet madre ψ data.
Risultato: nel dominio del tempo
ψa,b hanno ampiezze nel tempo che
variano con la freq.: ψa,b a freq. acute
sono molto strette, mentre ψa,b
a freq. gravi sono molto ampie
26
Trasformata di Gabor
R
win
T
f (t, ω) = f (s)g(s − t)e−iωs ds
= hf, Tt Mω gi
= hf, gω,t i
win f =
Tm,n
R
f (s)g(s − nt0 )e−imω0 s ds
= hf, Tnt0 Mmω0 gi
= hf, gm,n i
gω,t (s) = eiωs g(s − t)
traslaz. nel tempo e nella freq.
(modulaz.) di una finestra g data.
Risultato: nel piano tempo-frequenza
gω,t hanno tutte la stessa
ampiezza nel tempo
capacità
risolutiva
cond. ammiss.
nel continuo
reversibilità nel
caso continuo
eq. ricostruz.
caso continuo
cond. ammiss.
nel discreto
per avere alg.
ricostruz.
Cond. suff.
per avere
Cond. necess.
per avere
Trasformata Wavelet
privilegia la risoluzione temporale
alle freq. acute e la risoluzione
spettrale alle freq. gravi
R +∞
2
Cψ = 2π −∞ |ψ̂(ξ)|
|ξ| dξ < ∞
è reversibile se la condizione di
ammissibilità viene soddisfatta
R +∞ R +∞
f = Cψ−1 −∞ −∞ a12 hf, ψa,b iψa,b da db
R +∞ R +∞ 1 wav
= C −1
(T
f )ψ da db
ψ
−∞
−∞ a2
non c’è condizione di
ammissibilità
è sempre reversibile
f=
RR
T win f (t,ω)gω,t dt dω
2πkgk2
a,b
se ψ è ammissibile
R +∞ |ψ̂(ξ)|2
Cψ = 0
dξ
ξ
R 0 |ψ̂(ξ)|2
= −∞ |ξ| dξ < ∞
le ψj,k devono costituire una
frame di wavelet
una frame di wavelet
(th. 3.1)
una frame di wavelet (th. 3.2)
nessuna cond. su a0 , b0
27
Trasformata di Gabor
ha una limitata capacità
risolutiva tempo-frequenza
∀g ∈ L2 (R)
nessuna cond. di ammiss.
su g
le gm,n devono
costituire una
frame di Gabor
una frame
di Gabor (th. 3.4)
una frame di
Gabor (th. 3.5)
cond. su ω0 , t0
(ω0 t0 ≤ 2π)
Bibliografia
[1] I. Daubechies, Ten lectures on wavelets, SIAM conf, series in applied
math. Boston 1992.
[2] I. Daubechies, The wavelet transform, time-frequency localization and
signal analysis, IEEE Trans. Info. Theory, 36:961-1005, 1990.
[3] Marco Zantoni, Trasformata di Gabor e calcolo dell’operatore inverso:
teoria e algoritmi, Tesi di Laurea, Università degli Studi di Udine, 2002.
[4] Elke Wilczok, New Uncertainty Principles for the Continuous Gabor Transform and the Continuous Wavelet Transform, Documenta
Mathematica 5, pp. 201-226, 2000.
[5] Peter Prinz, Theory and algorithtms for discrete 1-dimensional Gabor
frames, Tesi di Laurea, Università di Vienna, 1996.
[6] T. Strohmer, A short introduction to Gabor analysis, disponibile su
http://www.math.ucdavis.edu/∼strohmer/research/gabor/gaborintro/
[7] Robi
Polikar,
The
wavelet
tutorial,
disponibile
su
http://engineering.rowan.edu/∼polikar/WAVELETS/WTtutorial.html
[8] D. Gabor, Theory of communication, J. IEE (London), 93(III):429-457,
November 1946.
[9] C. Valens, A Really Friendly Guide to Wavelets, disponibile su
http://perso.wanadoo.fr/polyvalens/clemens/wavelets/wavelets.html
[10] A. Janssen, Representations of Gabor frame operators, disponibile su http://tyche.mat.univie.ac.at/Janssen/, presented at
NATO-ASI 2000, Il Ciocco, Tuscany (Italy), July 2-15 (2000).
28
[11] R. Ashino, M. Nagase and R. Vaillancourt, Gabor, wavelet and chirplet
transforms in the study of pseudodifferential operators, disponibile su
http://okumedia.cc.osaka-kyoiku.ac.jp/∼ashino/pdf/rimsr.pdf
[12] C. Guerrini, Segnali e wavelet, Atti dell’Accademia delle Scienze
dell’Istituto di Bologna, anno 282 serie V n.6 pp.7-26, febbraio 1995.
29