Lezioni IT Terza parte
Transcript
Lezioni IT Terza parte
Facoltà di Ingegneria Appunti dalle lezioni del corso di Teoria dell’informazione e codici Parte III Prof. Alessandro NERI Anno accademico 2008-2009 CONTENUTI Motivazioni Analisi a multirisoluzione e trasformata Wavelet Scalogramma complesso Funzioni armoniche circolari (CHF) Wavelet Armoniche Circolari (CHW) Wavelet di Laguerre-Gauss Espansioni in funzioni Laguerre-Gauss ed Hermite-Gauss Piramide ipercompleta di Wavelet Armoniche Circolari Applicazioni restauro di immagini ricerca di oggetti in una scena stima del movimento semplificazione di immagini Conclusioni MOTIVAZIONI Definizione di immagine: ♦ B/N f : D → R, D ⊆R 2 ♦ estensione f : D → C, D ⊆R 2 ♦ Colori f :D →R , D⊆R 2 3 un'immagine f è un elemento di uno spazio di Hilbert Applicazioni ¾ restauro ¾ codificazione (archiviazione e trasmissione) di immagini fisse sequenze video ¾ Rivelazione e riconoscimento di oggetti per visione artificiale ricerche su basi di dati multimediali • • • • MOTIVAZIONI ♦ Necessità di una rappresentazione efficiente e parsimoniosa delle varie componenti di una scena naturale quali bordi e tessiture ( non ottenibile per mezzo di un unico sistema non ridondante) ♦ Tecniche correnti Matching pursuit strategy: adatta la base di sviluppo ai contenuti locali dell'immagine, selezionando gli elementi della base a partire da un insieme altamente ridondante (dizionario di forme d'onda) − elementi critici ♦ − costruzione del dizionario − costruzione della migliore rappresentazione locale (Minimum Description Length). Obiettivo espansione locale − efficacemente approssimabile con pochi elementi dello sviluppo − basata su pattern specifici rilevanti per il sistema visivo umano (bordi, linee, incroci) la cui scala ed il cui orientamento possano essere variati in modo parametrico ANALISI DI SEGNALI A MULTIRISOLUZIONE ♦ teoria matematica che permette di rappresentare uno stesso segnale a livelli di accuratezza differenti, caratterizzati da una risoluzione crescente ♦ nasce dal limite intrinseco dell’analisi di Fourier: l’impossibilità di ottenere una localizzazione congiunta sia nel tempo che in frequenza, che risulta invece altamente desiderabile in molti contesti applicativi: Analisi di segnali acustici musica voce umana Percezione di un'immagine TRASFORMATA WAVELET MONODIMENSIONALE ♦ REQUISITI esprimere una funzione come combinazione lineare di una famiglia di forme d'onda elementari ♦ − con forte localizzazione sia in spazio che in frequenza − mediante un algoritmo veloce − con sviluppo rapidamente convergente FONDAMENTI Base costituita da una famiglia di funzioni ricavate da una sola mother wavelet ψ (t ) per cambiamenti di scala e traslazioni ψ b,a (t ) = 1 ⎛t −b ⎞ ψ⎜ ⎟ a ⎝ a ⎠ TRASFORMATA WAVELET UNIDIMENSIONALE 2 ¾ Data una funzione g ∈ L ( R , dt ) ed una funzione ψ che soddisfi la condizione di ammissibilità 0 < Cψ = ∫ ∞ 0 ψˆ (ω) ω 2 dω < ∞, la funzione g può essere rappresentata come combinazione lineare di repliche traslate e scalate di ψ g (t ) = ∫ ⎡ 1 1 ⎤ ∫−∞ ⎢⎢ Cψ a2 Wψ g(b, a)⎥⎥ ψb,a (t) db da ⎣ ⎦ ∞ ∞ 0 essendo Wψ g(b, a) la trasformata Wavelet (WT) di g rispetto a ψ, definita da Wψ g (b, a) = g (t ), ψb,a (t ) = 1 ⎛ t −b ⎞ g ( t ) ψ ⎜ ⎟ dt ∫ R a a ⎝ ⎠ La validità della formula di inversione può essere verificata facilmente nel dominio della frequenza. A questo scopo riscriviamo la formula di inversione come segue g (t ) = ∫ ⎡1 1 ⎤ ∫−∞ ⎢⎢ Cψ a 2 Wψ g(b, a)⎥⎥ ψ0,a (t − b) db da = ⎣ ⎦ ∞ ∞ 0 poichè ψ soddisfa la condizione di stabilità e Ψ ( af ) è una funzione pari, si ha la seguente 2 eguaglianza 1= Pertanto ∞ 1 Cψ ∫0 Ψ ( a) a 2 da = ∞ 1 Cψ ∫0 Ψ ( af ) af 2 d ( af ) = ∞ 1 Cψ ∫0 Ψ ( af ) a 2 da G( f ) = ∞ 1 G( f ) Cψ ∫0 Ψ ( af ) a 2 da = 1 ∞1 = aΨ∗ (af )G( f ) aΨ(af )da = ∫ 2 Cψ 0 a 1 ∞1 = F {Wg (t, a) ∗ψ0,a (t )} da. Cψ ∫0 a2 ovvero g (t ) = 1 ∞ 1 +∞ W g (b, a)ψb,a (t )dbda . ∫ 2 ∫−∞ ψ 0 Cψ a c.d.d. In alternativa, poichè ⎧ 1 ⎛ t ⎞⎫ F {Wψ g (b, a)} = F ⎨g (t ) ∗ ψ * ⎜ − ⎟⎬ = G( f ) aΨ *(af ) a ⎝ a ⎠⎭ ⎩ si ha ⎧⎪ ∞ ∞ 1 1 ⎫⎪ F ⎨∫ ∫ W g (b, a)ψb,a (t ) db da⎬ = 2 ψ 0 −∞ C a ⎪⎩ ⎪⎭ ψ ⎧⎪ ∞ 1 1 ⎫⎪ ⎡W g (t, a) ∗ψ0,a (t ) ⎤⎦ da⎬ = = F ⎨∫ 2⎣ ψ 0 C ψ a ⎩⎪ ⎭⎪ =∫ ∞ =∫ ∞ 0 0 1 1 F {Wψ g (t, a) ∗ψ0,a (t )} da = Cψ a2 2 1 1 G f a Ψ af da = ( ) ( ) 2 Cψ a 1 ∞ Ψ ( af ) = G( f ) ∫ da = 0 Cψ a 2 1 ∞ Ψ ( ω) = G( f ) ∫ dω = G( f ) 0 Cψ ω 2 WAVELET DIADICHE ¾ Teorema: Se una funzione ψ soddisfa la condizione di stabilità 0< A≤ ∞ ∑ 2 Ψ (2k f ) ≤ B < ∞ a.e. k =−∞ la funzione g può essere ricostruita a partire dai soli coefficienti Wψ g (b,2−m ) della WT tramite la formula di inversione g (t ) = +∞ 1 ∞ ∑ 2m ∫−∞ Wψ g(b,2m ) ψ′b,2m (t) db m=−∞ essendo ψ′ definita a partire dalla sua trasformata di Fourier pari a Ψ′( f ) = Ψ( f ) ∞ ∑ Ψ (2 f ) m 2 m =−∞ poichè ψ soddisfa la condizione di stabilità, si ha la seguente eguaglianza 2 Ψ (2 f ) m ∞ ∑ ∞ m =−∞ ∑ Ψ (2k f ) 2 =1 k =−∞ Pertanto per la trasformata di Fourier di g(t) si ha ∞ ∑ G( f ) = m =−∞ 2 Ψ (2 f ) G ( f ) m ∞ ∑ Ψ (2k f ) 2 = k =−∞ = ∞ 1 2 Ψ (2 f )G ( f ) m 2 ∑ m m =−∞ ∗ m 2m Ψ (2m f ) ∞ ∑ Ψ (2k f ) k =−∞ = ∞ ∑ { m =−∞ } 1 F Wψ g (b, 2 ) m 2 m 2m Ψ (2m f ) ∞ ∑ k =−∞ Poiché Ψ (2k f ) 2 2 = ∞ ∑ 2 Ψ (2 f ) = k k =−∞ ∞ ∑ Ψ (2 k +m f) 2 k =−∞ Si ha G( f ) = ∞ ∑ { m =−∞ } 1 F Wψ g (b, 2 ) m 2 m 2m Ψ (2m f ) ∞ ∑ Ψ (2k + m f ) k =−∞ = ∞ ∑ { m =−∞ = ∞ ∑ m =−∞ } 21 F Wψ g (b, 2m ) { m 2m Ψ′(2m f ) = } 1 m F W g t ( , 2 ) ∗ ψ′0,2m (t ) . ψ m 2 2 = ANALISI A MULTIRISOLUZIONE • Sia Φ una {2 funzione tale che −i / 2 ( φ 2−i t − k Δτ )} formi una base ortonormale per il sottospazio Vi ∈ L2 ( \ ) . • Sia Ψ una wavelet ammissibile tale che o l'insieme discreto {2 −i / 2 ( ψ 2−i t − k Δτ )} formi una base ortogonale per il sottospazio Wi ∈ L2 (\) o i due sottospazi Vi e Wi siano mutuamente ortogonali Wi ⊥ Vi o il sottospazio Vi-1 può essere espresso come somma diretta di Vi e Wi Vi−1 = Vi ⊕ Wi Un segnale s(t) ∈V0 può essere rappresentato tramite un'approssimazione a risoluzione i=M ottenuta combinando linearmente repliche traslate della funzione φ ( t ) scalata per un fattore 2M e M dettagli alle scale diadiche 2l ottenute combinando linearmente repliche traslate e dilatate della mother wavelet ψ ( t ) s (t ) = ∑ 2 k −M / 2 ( cM [ k ] φ 2 −M / 2 ) ( M t − k Δτ + ∑∑ 2− A / 2 dA [ k ] ψ 2− A / 2 t − k Δτ A =1 k ) • è possibile dimostrare che la wavelet e la basic scaling function soddisfano le equazioni φ(t ) = 2 ∑ h [ k ] φ ( 2t − k Δτ ) k ψ (t ) = 2 ∑ g [ k ] φ ( 2t − k Δτ ) k in cui g ⎡⎣ k ⎤⎦ e h ⎡⎣ k ⎤⎦ sono i coefficienti di due Quadrature Mirror Filter (QMF) H(ω ) = 1 2 G(ω ) = 1 2 ∑ h[k]e− jω kΔτ k ∑ g[k]e− jω kΔτ k e Δτ è l’intervallo di campionamento. • La trasformata wavelet discreta (DWT) può essere calcolata per mezzo dell'algoritmo piramidale di Mallat. • Siano c0 [ k ] i coefficienti della rappresentazione del segnale s(t) ∈V0 rispetto alla base ortogonale φ (t − Δτ ) : c0 ⎡⎣ k ⎤⎦ = 〈s(t),φ (t − Δτ )〉 = ∫ s(t)φ * (t − Δτ )dt • I coefficienti c0 [k] possono essere espressi come combinazione lineare dei coefficienti c1 ⎡⎣ n ⎤⎦ relativi all'approssimazione del segnale a livello di risoluzione 1 e dei coefficienti d1 ⎡⎣ n ⎤⎦ relativi ai dettagli relativi al livello di risoluzione 1 per mezzo della convoluzione discreta tra la serie dei coefficienti c1 ⎣⎡ n ⎤⎦ ed il filtro passa basso h[n] e della convoluzione discreta tra la serie dei coefficienti d1 ⎡⎣ n ⎤⎦ ed il filtro il filtro passa alto g[n] seguito da un ricampionamento per un fattore 2: c0 ⎡⎣ n ⎤⎦ = ∑ c1 ⎡⎣ k ⎤⎦ h ⎡⎣ 2k − n ⎤⎦ + d1 ⎡⎣ k ⎤⎦ g ⎡⎣ 2k − n ⎤⎦ k • I coefficienti c1 ⎡⎣ n ⎤⎦ e d1 ⎡⎣ n ⎤⎦ possono essere ottenuti dai coefficienti c0 [ k ] tramite filtraggio con il filtro passa basso h[n] eil filtro il filtro passa alto g[n] seguito da un sottocampionamento per un fattore 2: c1 ⎡⎣ n ⎤⎦ = ∑ c0 ⎡⎣ k ⎤⎦ h ⎡⎣ 2n − k ⎤⎦ k d1 ⎡⎣ n ⎤⎦ = ∑ c0 ⎡⎣ k ⎤⎦ g ⎡⎣ 2n − k ⎤⎦ k • La scomposizione DWT dimezza la risoluzione temporale e raddoppia la rislouzione in frequenza perché la larghezza della banda del segnale d'uscita e solo la metà di quella d'ingresso, quindi metà dei campioni possono essere scartati senza perdita d'informazione. • La procedura di scomposizione può essere reiterata e ad ogni livello di decomposizione l il filtro ed il sottocampionamento dimezzano il numero dei campioni e la larghezza di banda cA [ n] = ∑ cA −1 [ k ] h [ 2n − k ] k dA [ n] = ∑ cA −1 [ k ] g [ 2n − k ] k Essendo cA [ n ] e d A [ n ] i coefficienti dell’approssimazione grossolana e dei dettagli alla risoluzione l-esima. • Questo approccio riduce il carico computazionale rispetto alla Fast Fourier Transform (FFT), perche ad ogni livello di scomposizione solo elaborati solo la metà degli elementi. d A [ n ] = ∑ cA −1 [ k ] g [ 2n − k ] k WAVELET DI DAUBACHIE ♦ Le wavelet di Daubachie sono caratterizzate dalla proprietà che i primi A momenti sono nulli. scaling and wavelet functions amplitudes of the frequency spectrum SCALOGRAMMA COMPLESSO ♦ La rivelazione di patterns indipendentemente dalla loro scala, dal loro orientamento e dalla loro posizione, nonché la stima di tali parametri si semplificano se si considera come dominio di una immagine il piano complesso C costituito dai punti z=x1+jx2, invece del piano reale R2 costituito dai punti x=(x1, x2) ♦ Infatti, in questo caso variazioni di scala e rotazioni possono essere tenute in conto tramite una sola operazione: il cambiamento di scala complessa ªnel piano complesso il fattore complesso di scala α = a e jϕ corresponde a ♦ • una dilatazione/contrazione isotropica per un fattore pari al modulo a, • una rotazione ϕ attorno all'origine z= 0. Quindi una qualsiasi combinazione di traslazioni, dilatazioni, rotazioni di un pattern attorno ad un qualsiasi punto del piano complesso può essere sempre posto nella forma ⎛ z −β ⎞ ⎟⎟ f ⎜⎜ ⎝ α ⎠ TRASFORMATA WAVELET 2-D La trasformata Wavelet (WT) di una funzione 2 f ∈ L ( C , dz dz ) rispetto a ψ è definita da Wψ f (β, α) = f ( z ),ψβ,α ( z ) = 1 2 α ∫ ⎛ z −β ⎞ ⎟⎟ dz d z f ( z )ψ⎜⎜ ⎝ α ⎠ C ⎛ β⎞ = f (β ) ∗ ψ 0,α ( −β ) = f (β ) ∗ ψ⎜ − ⎟ α ⎝⎜ α ⎟⎠ 2 2 1 1 1 in cui ψβ,α è ottenuta da ψ applicando gli operatori di traslazione e di cambiamento di scala complessa che lascia invariata la norma L2(C, dz dz ) ψ β,α ( z ) = 1 ⎛ z −β⎞ ψ⎜ ⎟ α ⎝ α ⎠ Quando ψ soddisfa la condizione di ammissibilità 0 < Cψ = ∫ C ˆ ( ω) ψ ω 2 2 dω d ω < ∞ , la WT costituisce una rappresentazione dell'immagine f, nel senso che la trasformata inversa esiste f ( z) = 1 ∫ 1 ∫ Wψ f (β, α)ψβ,α ( z ) d β d β dα d α 2Cψ C α 4 C poichè ψ soddisfa la condizione di stabilità e Ψ ( af ) è una funzione pari, si ha la seguente 2 eguaglianza 1= 1 ∞ Cψ ∫0 Ψ ( a) 2 a da = 1 ∞ Cψ ∫0 Pertanto Ψ ( af ) 1 ∞ G( f ) = ( ) G f da = ∫ 0 Cψ a 2 = 1 ∞1 ∗ Ψ a (af )G( f ) aΨ(af )da = ∫ 2 0 Cψ a 1 ∞1 F Wg (t, a) ∗ψ0,a (t )} da. ∫ 2 { 0 Cψ a ovvero = g (t ) = 1 ∞ 1 +∞ Wψ g (b, a)ψb,a (t )dbda . Cψ ∫0 a2 ∫−∞ Ψ ( af ) af 2 d ( af ) = 1 ∞ Cψ ∫0 Ψ ( af ) a 2 da