Lezioni IT Terza parte

Transcript

Facoltà di Ingegneria
Appunti dalle lezioni del corso di
Teoria dell’informazione e codici
Parte III
Prof. Alessandro NERI
Anno accademico 2008-2009
CONTENUTI

Motivazioni

Analisi a multirisoluzione e trasformata Wavelet

Scalogramma complesso

Funzioni armoniche circolari (CHF)

Wavelet Armoniche Circolari (CHW)

Wavelet di Laguerre-Gauss

Espansioni in funzioni Laguerre-Gauss ed Hermite-Gauss

Piramide ipercompleta di Wavelet Armoniche Circolari

Applicazioni

restauro di immagini

ricerca di oggetti in una scena

stima del movimento

semplificazione di immagini
Conclusioni
MOTIVAZIONI
Definizione di immagine:
♦
B/N
f : D → R,
D ⊆R
2
♦
estensione
f : D → C,
D ⊆R
2
♦
Colori
f :D →R ,
D⊆R
2
3
un'immagine f è un elemento di uno spazio di Hilbert
Applicazioni
¾ restauro
¾ codificazione (archiviazione e trasmissione) di
immagini fisse
sequenze video
¾ Rivelazione e riconoscimento di oggetti per
visione artificiale
ricerche su basi di dati multimediali
•
•
•
•
MOTIVAZIONI
♦
Necessità di
una rappresentazione efficiente e parsimoniosa delle varie componenti di una scena naturale
quali bordi e tessiture ( non ottenibile per mezzo di un unico sistema non ridondante)
♦
Tecniche correnti
Matching pursuit strategy: adatta la base di sviluppo ai contenuti locali dell'immagine,
selezionando gli elementi della base a partire da un insieme altamente ridondante
(dizionario di forme d'onda)
− elementi critici
♦
−
costruzione del dizionario
−
costruzione della migliore rappresentazione locale (Minimum Description
Length).
Obiettivo
espansione locale
−
efficacemente approssimabile con pochi elementi dello sviluppo
−
basata su pattern specifici rilevanti per il sistema visivo umano (bordi, linee, incroci) la
cui scala ed il cui orientamento possano essere variati in modo parametrico
ANALISI DI SEGNALI A MULTIRISOLUZIONE
♦
teoria matematica che permette di rappresentare uno stesso segnale a livelli di accuratezza
differenti, caratterizzati da una risoluzione crescente
♦
nasce dal limite intrinseco dell’analisi di Fourier: l’impossibilità di ottenere una
localizzazione congiunta sia nel tempo che in frequenza, che risulta invece altamente
desiderabile in molti contesti applicativi:
Analisi di segnali acustici
musica
voce umana
Percezione di un'immagine
TRASFORMATA WAVELET MONODIMENSIONALE
♦
REQUISITI
esprimere una funzione come combinazione lineare di una famiglia di forme d'onda elementari
♦
−
con forte localizzazione sia in spazio che in frequenza
−
mediante un algoritmo veloce
−
con sviluppo rapidamente convergente
FONDAMENTI
Base costituita da una famiglia di funzioni ricavate da una sola mother wavelet ψ (t ) per
cambiamenti di scala e traslazioni
ψ b,a (t ) =
1
⎛t −b ⎞
ψ⎜
⎟
a ⎝ a ⎠
TRASFORMATA WAVELET UNIDIMENSIONALE
2
¾ Data una funzione g ∈ L ( R , dt ) ed una funzione ψ che soddisfi la condizione di
ammissibilità
0 < Cψ = ∫
∞
0
ψˆ (ω)
ω
2
dω < ∞,
la funzione g può essere rappresentata come combinazione lineare di repliche
traslate e scalate di ψ
g (t ) = ∫
⎡ 1 1
⎤
∫−∞ ⎢⎢ Cψ a2 Wψ g(b, a)⎥⎥ ψb,a (t) db da
⎣
⎦
∞ ∞
0
essendo Wψ g(b, a) la trasformata Wavelet (WT) di g rispetto a ψ, definita da
Wψ g (b, a) = g (t ), ψb,a (t ) =
1
⎛ t −b ⎞
g
(
t
)
ψ
⎜
⎟ dt
∫
R
a
a
⎝
⎠
La validità della formula di inversione può essere verificata facilmente nel dominio
della frequenza. A questo scopo riscriviamo la formula di inversione come segue
g (t ) = ∫
⎡1 1
⎤
∫−∞ ⎢⎢ Cψ a 2 Wψ g(b, a)⎥⎥ ψ0,a (t − b) db da =
⎣
⎦
∞ ∞
0
poichè ψ soddisfa la condizione di stabilità e Ψ ( af ) è una funzione pari, si ha la seguente
2
eguaglianza
1=
Pertanto
∞
1
Cψ ∫0
Ψ ( a)
a
2
da =
∞
1
Cψ ∫0
Ψ ( af )
af
2
d ( af ) =
∞
1
Cψ ∫0
Ψ ( af )
a
2
da
G( f ) =
∞
1
G( f )
Cψ ∫0
Ψ ( af )
a
2
da =
1 ∞1
=
aΨ∗ (af )G( f ) aΨ(af )da =
∫
2
Cψ 0 a
1 ∞1
=
F {Wg (t, a) ∗ψ0,a (t )} da.
Cψ ∫0 a2
ovvero
g (t ) =
1 ∞ 1 +∞
W g (b, a)ψb,a (t )dbda .
∫
2 ∫−∞ ψ
0
Cψ a
c.d.d.
In alternativa, poichè
⎧
1
⎛ t ⎞⎫
F {Wψ g (b, a)} = F ⎨g (t ) ∗ ψ * ⎜ − ⎟⎬ = G( f ) aΨ *(af )
a
⎝ a ⎠⎭
⎩
si ha
⎧⎪ ∞ ∞ 1 1
⎫⎪
F ⎨∫ ∫
W g (b, a)ψb,a (t ) db da⎬ =
2 ψ
0 −∞ C
a
⎪⎩
⎪⎭
ψ
⎧⎪ ∞ 1 1
⎫⎪
⎡W g (t, a) ∗ψ0,a (t ) ⎤⎦ da⎬ =
= F ⎨∫
2⎣ ψ
0 C
ψ a
⎩⎪
⎭⎪
=∫
∞
=∫
∞
0
0
1 1
F {Wψ g (t, a) ∗ψ0,a (t )} da =
Cψ a2
2
1 1
G
f
a
Ψ
af
da =
(
)
(
)
2
Cψ a
1 ∞ Ψ ( af )
= G( f ) ∫
da =
0
Cψ
a
2
1 ∞ Ψ ( ω)
= G( f ) ∫
dω = G( f )
0
Cψ
ω
2
WAVELET DIADICHE
¾
Teorema: Se una funzione ψ soddisfa la condizione di stabilità
0< A≤
∞
∑
2
Ψ (2k f ) ≤ B < ∞
a.e.
k =−∞
la funzione g può essere ricostruita a partire dai soli coefficienti Wψ g (b,2−m ) della WT
tramite la formula di inversione
g (t ) =
+∞
1 ∞
∑ 2m ∫−∞ Wψ g(b,2m ) ψ′b,2m (t) db
m=−∞
essendo ψ′ definita a partire dalla sua trasformata di Fourier pari a
Ψ′( f ) =
Ψ( f )
∞
∑
Ψ (2 f )
m
2
m =−∞
poichè ψ soddisfa la condizione di stabilità, si ha la seguente eguaglianza
2
Ψ (2 f )
m
∞
∑
∞
m =−∞
∑
Ψ (2k f )
2
=1
k =−∞
Pertanto per la trasformata di Fourier di g(t) si ha
∞
∑
G( f ) =
m =−∞
2
Ψ (2 f ) G ( f )
m
∞
∑
Ψ (2k f )
2
=
k =−∞
=
∞
1
2 Ψ (2 f )G ( f ) m
2
∑
m
m =−∞
∗
m
2m Ψ (2m f )
∞
∑
Ψ (2k f )
k =−∞
=
∞
∑ {
m =−∞
}
1
F Wψ g (b, 2 ) m
2
m
2m Ψ (2m f )
∞
∑
k =−∞
Poiché
Ψ (2k f )
2
2
=
∞
∑
2
Ψ (2 f ) =
k
k =−∞
∞
∑
Ψ (2
k +m
f)
2
k =−∞
Si ha
G( f ) =
∞
∑ {
m =−∞
}
1
F Wψ g (b, 2 ) m
2
m
2m Ψ (2m f )
∞
∑
Ψ (2k + m f )
k =−∞
=
∞
∑ {
m =−∞
=
∞
∑
m =−∞
} 21
F Wψ g (b, 2m )
{
m
2m Ψ′(2m f ) =
}
1
m
F
W
g
t
(
,
2
) ∗ ψ′0,2m (t ) .
ψ
m
2
2
=
ANALISI A MULTIRISOLUZIONE
• Sia Φ una
{2
funzione tale che
−i / 2
(
φ 2−i t − k Δτ
)}
formi una base ortonormale per il
sottospazio Vi ∈ L2 ( \ ) .
• Sia Ψ una wavelet ammissibile tale che
o l'insieme discreto
{2
−i / 2
(
ψ 2−i t − k Δτ
)} formi una base ortogonale per il sottospazio
Wi ∈ L2 (\)
o i due sottospazi Vi e Wi siano mutuamente ortogonali Wi ⊥ Vi
o il sottospazio Vi-1 può essere espresso come somma diretta di Vi e Wi
Vi−1 = Vi ⊕ Wi
Un segnale s(t) ∈V0 può essere rappresentato tramite un'approssimazione a risoluzione i=M
ottenuta combinando linearmente repliche traslate della funzione φ ( t ) scalata per un fattore 2M e
M dettagli alle scale diadiche 2l ottenute combinando linearmente repliche traslate e dilatate della
mother wavelet ψ ( t )
s (t ) = ∑ 2
k
−M / 2
(
cM [ k ] φ 2
−M / 2
)
(
M
t − k Δτ + ∑∑ 2− A / 2 dA [ k ] ψ 2− A / 2 t − k Δτ
A =1 k
)
• è possibile dimostrare che la wavelet e la basic scaling function soddisfano le equazioni
φ(t ) = 2 ∑ h [ k ] φ ( 2t − k Δτ )
k
ψ (t ) = 2 ∑ g [ k ] φ ( 2t − k Δτ )
k
in cui g ⎡⎣ k ⎤⎦ e h ⎡⎣ k ⎤⎦ sono i coefficienti di due Quadrature Mirror Filter (QMF)
H(ω ) =
1
2
G(ω ) =
1
2
∑ h[k]e− jω kΔτ
k
∑ g[k]e− jω kΔτ
k
e Δτ è l’intervallo di campionamento.
• La trasformata wavelet discreta (DWT) può essere calcolata per mezzo dell'algoritmo
piramidale di Mallat.
• Siano c0 [ k ] i coefficienti della rappresentazione del segnale s(t) ∈V0 rispetto alla base
ortogonale φ (t − Δτ ) :
c0 ⎡⎣ k ⎤⎦ = 〈s(t),φ (t − Δτ )〉 = ∫ s(t)φ * (t − Δτ )dt
• I coefficienti c0 [k] possono
essere espressi come combinazione lineare dei coefficienti
c1 ⎡⎣ n ⎤⎦ relativi all'approssimazione del segnale a livello di risoluzione 1
e dei coefficienti
d1 ⎡⎣ n ⎤⎦ relativi ai dettagli relativi al livello di risoluzione 1 per mezzo della convoluzione
discreta tra la serie dei coefficienti c1 ⎣⎡ n ⎤⎦ ed il filtro passa basso h[n] e della convoluzione
discreta tra la serie dei coefficienti d1 ⎡⎣ n ⎤⎦ ed il filtro il filtro passa alto g[n] seguito da un
ricampionamento per un fattore 2:
c0 ⎡⎣ n ⎤⎦ = ∑ c1 ⎡⎣ k ⎤⎦ h ⎡⎣ 2k − n ⎤⎦ + d1 ⎡⎣ k ⎤⎦ g ⎡⎣ 2k − n ⎤⎦
k
• I coefficienti c1 ⎡⎣ n ⎤⎦ e d1 ⎡⎣ n ⎤⎦ possono essere ottenuti dai coefficienti c0 [ k ] tramite filtraggio
con il
filtro passa basso
h[n] eil filtro il filtro passa alto g[n] seguito da un
sottocampionamento per un fattore 2:
c1 ⎡⎣ n ⎤⎦ = ∑ c0 ⎡⎣ k ⎤⎦ h ⎡⎣ 2n − k ⎤⎦
k
d1 ⎡⎣ n ⎤⎦ = ∑ c0 ⎡⎣ k ⎤⎦ g ⎡⎣ 2n − k ⎤⎦
k
• La scomposizione DWT dimezza la risoluzione temporale e raddoppia la rislouzione in
frequenza perché la larghezza della banda del segnale d'uscita e solo la metà di quella
d'ingresso, quindi metà dei campioni possono essere scartati senza perdita d'informazione.
• La procedura di scomposizione può essere reiterata e ad ogni livello di decomposizione l il
filtro ed il sottocampionamento dimezzano il numero dei campioni e la larghezza di banda
cA [ n] = ∑ cA −1 [ k ] h [ 2n − k ]
k
dA [ n] = ∑ cA −1 [ k ] g [ 2n − k ]
k
Essendo cA [ n ] e d A [ n ] i coefficienti dell’approssimazione grossolana e dei dettagli alla
risoluzione l-esima.
• Questo approccio riduce il carico computazionale rispetto alla Fast Fourier Transform (FFT),
perche ad ogni livello di scomposizione solo elaborati solo la metà degli elementi.
d A [ n ] = ∑ cA −1 [ k ] g [ 2n − k ]
k
WAVELET DI DAUBACHIE
♦
Le wavelet di Daubachie sono caratterizzate dalla proprietà che i primi A momenti sono
nulli.
scaling
and
wavelet
functions
amplitudes of
the frequency
spectrum
SCALOGRAMMA COMPLESSO
♦
La rivelazione di patterns indipendentemente dalla loro scala, dal loro orientamento e dalla
loro posizione, nonché la stima di tali parametri si semplificano se si considera come
dominio di una immagine il piano complesso C costituito dai punti z=x1+jx2, invece del
piano reale R2 costituito dai punti x=(x1, x2)
♦
Infatti, in questo caso variazioni di scala e rotazioni possono essere tenute in conto tramite
una sola operazione: il cambiamento di scala complessa
ªnel piano complesso il fattore complesso di scala α = a e jϕ corresponde a
♦
•
una dilatazione/contrazione isotropica per un fattore pari al modulo a,
•
una rotazione ϕ attorno all'origine z= 0.
Quindi una qualsiasi combinazione di traslazioni, dilatazioni, rotazioni di un pattern attorno
ad un qualsiasi punto del piano complesso può essere sempre posto nella forma
⎛ z −β ⎞
⎟⎟
f ⎜⎜
⎝ α ⎠
TRASFORMATA WAVELET 2-D
La trasformata Wavelet (WT) di una funzione
2
f ∈ L ( C , dz dz ) rispetto a ψ è definita da
Wψ f (β, α) = f ( z ),ψβ,α ( z ) =
1
2 α
∫
⎛ z −β ⎞
⎟⎟ dz d z
f ( z )ψ⎜⎜
⎝ α ⎠
C
⎛ β⎞
= f (β ) ∗ ψ 0,α ( −β ) = f (β ) ∗
ψ⎜ − ⎟
α ⎝⎜ α ⎟⎠
2
2
1
1
1
in cui ψβ,α è ottenuta da ψ applicando gli operatori di traslazione e di cambiamento di scala
complessa che lascia invariata la norma L2(C, dz dz )
ψ β,α ( z ) =
1 ⎛ z −β⎞
ψ⎜
⎟
α ⎝ α ⎠
Quando ψ soddisfa la condizione di ammissibilità
0 < Cψ =
∫
C
ˆ ( ω)
ψ
ω
2
2
dω d ω < ∞ ,
la WT costituisce una rappresentazione dell'immagine f, nel senso che la trasformata inversa
esiste
f ( z) =
1
∫
1
∫
Wψ f (β, α)ψβ,α ( z ) d β d β dα d α
2Cψ C α 4 C
poichè ψ soddisfa la condizione di stabilità e Ψ ( af ) è una funzione pari, si ha la seguente
2
eguaglianza
1=
1 ∞
Cψ ∫0
Ψ ( a)
2
a
da =
1 ∞
Cψ ∫0
Pertanto
Ψ ( af )
1 ∞
G( f ) =
(
)
G
f
da =
∫
0
Cψ
a
2
=
1 ∞1
∗
Ψ
a
(af )G( f ) aΨ(af )da =
∫
2
0
Cψ a
1 ∞1
F Wg (t, a) ∗ψ0,a (t )} da.
∫
2 {
0
Cψ a
ovvero
=
g (t ) =
1 ∞ 1 +∞
Wψ g (b, a)ψb,a (t )dbda .
Cψ ∫0 a2 ∫−∞
Ψ ( af )
af
2
d ( af ) =
1 ∞
Cψ ∫0
Ψ ( af )
a
2
da