Lezione3 - Sapienza
Transcript
Lezione3 - Sapienza
TECNICHE DI ELABORAZIONE NUMERICA DI IMMAGINE E VIDEO Ing. Michele Scarpiniti Dipartimento INFOCOM – Università di Roma “La Sapienza” [email protected] http://ispac.ing.uniroma1.it/scarpiniti/index.htm Dispense su: http://ispac.ing.uniroma1.it/scarpiniti/didactics.htm Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 1 Lezione 3: Sommario La strumentazione ottica; La televisione; L’image processing; The Gimp. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 2 La strumentazione ottica (1/30) Una macchina fotografica (o fotocamera) è un apparecchio usato per acquisire foto, singolarmente o in sequenza. Una macchina fotografica può lavorare con lo spettro visibile della luce o con altre porzioni dello spettro elettromagnetico. Ogni macchina fotografica è costituita da una camera, con un'apertura ad un'estremità per permettere alla luce di entrare e con una superficie di visualizzazione o di registrazione per catturare la luce all'altra estremità. La prima apertura è spesso controllata da un meccanismo ad iride (il diaframma), mentre la seconda è costituita da un qualche tipo di sensore fotosensibile, che può essere una pellicola fotografica. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 3 La strumentazione ottica (2/30) Per reflex si intendono le macchine fotografiche dotate di un sistema composto da uno specchio posto a 45° rispetto all'obiettivo e da un pentaprisma. Lo specchio è dotato di un meccanismo che lo fa sollevare al momento dello scatto in modo che la luce raggiunga l'elemento sensibile (pellicola o sensore). Questo meccanismo consente di osservare nel mirino della macchina fotografica la stessa immagine catturata dall'obiettivo. Caratteristico delle fotocamere reflex è il fatto che, durante l'esposizione, il soggetto non è più visibile al fotografo, a causa dell'inclinazione dello specchio verso l'elemento sensibile. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 4 La strumentazione ottica (3/30) Un diaframma è un'apertura (solitamente circolare o poligonale) attraverso cui la luce fluisce attraverso una lente o un obiettivo fotografico. Il centro del diaframma coincide con l'asse ottico della lente. La maggior parte delle fotocamere dispongono di un diaframma di ampiezza regolabile (simile, per funzione, all'iride dell'occhio) contenuto nella lente; la regolazione del diaframma si chiama apertura. Diaframmi di piccole dimensioni hanno l'effetto di ridurre gli effetti di aberrazione ottica dell'obiettivo e di incrementare la profondità di campo, ma richiedono tempi di esposizione più lunghi, e conseguentemente implicano un maggior rischio di mosso se il soggetto o la fotocamera si spostano durante l'esposizione. Nelle fotocamere, il diaframma può essere aperto a diverse ampiezze, distribuite regolarmente su una scala di intervalli detti stop o f-stop. Ogni valore di stop corrisponde a una quantità di luce doppia rispetto al precedente. La sequenza dei valori di stop è una progressione geometrica di ragione 2. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 5 La strumentazione ottica (4/30) Comprende i seguenti valori: f/1 f/1.4 f/2 f/2.8 f/4 f/5.6 f/8 f/11 f/16 f/22 f/32 f/45 f/64 dove a valori più bassi corrispondono aperture di diaframma più ampie. Passare da un valore di f/2 a f/2.8 significa raddoppiare l'esposizione. I numeri sopra riportati sono identici indipendentemente dalla lunghezza focale dell'obiettivo; in realtà il rapporto es. f/4 stà a significare che per un tele-obietivo di lunghezza focale f=200mm il diametro dell'apertura dell'obbiettivo è pari a 200/4=50mm mentre per un grandangolare di lunghezza focale f=35mm l'apertura è pari a 35/4=8.75mm. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 6 La strumentazione ottica (5/30) L'otturatore è il dispositivo che regola il tempo di esposizione della pellicola alla luce. Gli otturatori possono essere classificati in due tipi: otturatori centrali otturatori a tendina Al primo tipo corrispondono tutti gli otturatori dotati di lamelle disposte a raggiera, in modo simile a quelle del diaframma. Il secondo tipo è un otturatore composto da due superfici di stoffa o metallo disposte parallelamente lungo il piano focale, che scorrono verticalmente formando una fessura che lascia passare la luce. Se il tempo richiesto è lento, la prima tendina raggiunge il fine corsa e conseguentemente parte la seconda che copre la pellicola concludendo l'esposizione. In caso di tempi più rapidi, la seconda tendina viene azionata durante la corsa della prima, quindi la pellicola non viene esposta contemporaneamente lungo tutto il fotogramma, ma solo attraverso la fessura formatasi dal ritardo fra la prima e la seconda tendina. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 7 La strumentazione ottica (6/30) L'otturatore, insieme al diaframma, è un fattore indispensabile per determinare una corretta esposizione. Può essere utilizzato in modo creativo, scegliendo un tempo lento per catturare un soggetto ed esaltarne il movimento, oppure un tempo rapido per fissare un istante e aumentare la nitidezza dell'immagine. Nelle moderne fotocamere, i tempi dell'otturatore sono selezionabili da una ghiera oppure, negli apparecchi elettronici, da pulsanti o comandi digitali. Normalmente i tempi utilizzati in fotografia sono inferiori al secondo e vengono calcolati come una progressione in cui il valore successivo è il doppio del precedente. Ecco una lista dei valori selezionabili, in secondi, sui moderni otturatori: 8 4 2 1 1/2 1/4 1/8 1/15 1/30 1/60 1/125 1/250 1/500 1/1000 1/2000 1/4000 Di norma i valori inferiori al secondo sono visualizzati solo con il divisore: 1/125 diviene 125. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 8 La strumentazione ottica (7/30) Il termine esposizione indica talvolta il periodo di tempo durante il quale l'otturatore della fotocamera rimane aperto nello scatto di una fotografia; più spesso, in gergo tecnico, la stessa parola indica la quantità totale di luce che viene fatta giungere alla pellicola (o al sensore nel caso di fotocamere digitali) nel suddetto periodo. L'esposizione si misura in EV (valore di esposizione) ed è determinata con l'ausilio dell'esposimetro. Matematicamente parlando, l'esposizione è definita in: Esposizione = Intensità luminosa * tempo e può essere descritta come la somma dei fattori di diaframma, tempo di esposizione e velocità della pellicola. Il rapporto che intercorre tra questi tre elementi è definito come reciprocità. A parità di condizioni di luce, si ottiene la stessa esposizione se aumentando un fattore se ne diminuisce un altro della stessa quantità. Ad esempio, portando il tempo da 1/250 a 1/500, quindi dimezzando l'esposizione alla luce, si può scegliere se raddoppiare il diaframma oppure aumentare la sensibilità della pellicola. In entrambi i casi la quantità di luce che colpirà la pellicola sarà la stessa. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 9 La strumentazione ottica (8/30) Questa caratteristica permette un elevato controllo sul risultato fotografico. Modificando l'apertura del diaframma otteniamo una profondità di campo più o meno ampia, agendo sul tempo controlliamo l'effetto mosso, mentre utilizzando una pellicola più o meno veloce, gestiamo la granularità della pellicola. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 10 La strumentazione ottica (9/30) La profondità di campo nitido o semplicemente profondità di campo (abbreviato in PdC) è la distanza davanti e dietro il soggetto principale che appare nitida (a fuoco). Per ogni impostazione dell'obiettivo, c'è un'unica distanza a cui gli oggetti appaiono perfettamente a fuoco; la nitidezza diminuisce gradualmente in avanti (verso il fotografo) e indietro (in direzione opposta). Il campo nitido è quell'intervallo di distanze davanti e dietro il soggetto in cui la sfocatura è impercettibile o comunque tollerabile; la PdC si dice essere maggiore se questo intervallo è ampio e minore se è ridotto. Per motivi legati all'angolo di incidenza dei raggi luminosi, il campo nitido è sempre più esteso dietro al soggetto a fuoco che davanti; più precisamente, la distanza perfettamente a fuoco si trova grosso modo a un terzo del campo nitido, verso il fotografo. Un punto al di fuori del campo nitido (sfocato) produce sulla pellicola un circolo di confusione, il cui diametro cresce man mano che ci si allontana dal campo nitido stesso. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 11 La strumentazione ottica (10/30) Si usa dire che obiettivi con lunghezza focale maggiore (come i teleobiettivi) hanno una PdC minore, e viceversa. In effetti, questa affermazione richiede una precisazione, in quanto il rapporto fra PdC e focale consegue più dall'uso tipico che si fa delle focali di diversa lunghezza (focali lunghe per riprendere oggetti distanti, corte per soggetti vicini) che non da proprietà fisiche delle lenti. A parità di tutto il resto, la messa a fuoco di un soggetto lontano risulta in una maggiore PdC rispetto a quella di un soggetto vicino. In particolare, per ogni impostazione della fotocamera esiste una distanza iperfocale, e la PdC è tanto maggiore quanto più il soggetto, allontanandosi, si avvicina a tale distanza. Quando il punto a fuoco coincide con l'iperfocale, si raggiunge la massima PdC possibile, che si estende in lontananza fino all'infinito e, verso il fotografo, fino a metà dell'iperfocale. f/32 f/5 Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 12 La strumentazione ottica (11/30) Nella schematizzazione più semplice ogni obiettivo, per quanto complesso, si comporta come una lente sottile. In questo senso si definisce lunghezza focale la distanza dalla superficie dell'obiettivo al punto nel quale converge la luce quando questo viene illuminato con un fascio di luce parallela, si misura con la messa a fuoco a infinito. Gli obiettivi in cui la lunghezza focale non può cambiare si chiamano obiettivi a focale fissa; dove può variare l'obiettivo prende il nome di focale variabile o zoom. La lunghezza focale è indicata negli obiettivi fissi con un numero espresso in millimetri (es. 180mm); per gli zoom sono presenti due valori che delimitano il campo di focali ottenibili, ad esempio 35-135mm. In funzione dello schema costruttivo il cambio di focale viene ottenuto con un sistema a ghiera rotante o con un sistema cosiddetto a pompa in cui spostando avanti o indietro la ghiera di messa a fuoco si varia la focale. Nelle migliori ottiche la distanza di messa a fuoco e l'apertura non variano cambiando la focale Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 13 La strumentazione ottica (12/30) La pellicola fotografica è il supporto necessario alla cattura di immagini all'interno di una fotocamera analogica. È costruita a strati, il supporto di base è un sottile nastro di plastica (solitamente poliestere o triacetato di celluloide), a cui segue uno strato antialone per evitare riflessi interni. Gli strati successivi contengono una emulsione di alogenuro d'argento con cristalli di grandezza variabile. Il materiale fotosensibile è legato con della gelatina, realizzata da materiali organici animali, all'alogenuro. Nelle pellicole bianco e nero, è presente un solo strato di emulsione fotosensibile, mentre nelle pellicole colore sono necessari tre diversi strati sensibili alle diverse frequenze di luce visibile per formare l'immagine finale, utilizzando la sintesi cromatica sottrattiva. Questi strati sono disposti uno sopra l'altro e resi sensibili ai colori con delle molecole organiche chiamate sensibilizzatori spettrali. Partendo dal basso, il primo strato è sensibile al rosso, poi verde e infine blu. Tra il verde e il blu è presente uno strato filtro di colorante giallo per evitare il passaggio del blu. L'emulsione può essere resa sensibile alla luce visibile, all'infrarosso, all'ultravioletto, ai raggi X o ai raggi gamma. Quando la pellicola viene sottoposta ad una esposizione controllata di luce si imprime una immagine su di essa, chiamata immagine latente. È necessario applicare i processi chimici di rivelazione alla pellicola per creare una immagine stabile e insensibile alle future esposizioni alla luce, mediante i processi di sviluppo e fissaggio. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 14 La strumentazione ottica (13/30) La pellicola fotografica può essere di tipo negativo, invertibile o diapositiva. La prima trasforma l'immagine latente in negativo, quindi viene stampata su carta fotografica per ottenere il positivo, mentre nella pellicola invertibile o diapositiva il processo di sviluppo trasforma l'immagine in positiva, da proiettare o stampare, seppure con un aumento di contrasto. Esistono in commercio pellicole che contengono i chimici necessari per lo sviluppo direttamente all'interno dello stesso supporto. La prima pellicola di questo tipo è stata introdotta dalla Polaroid nel 1948 e permette di ottenere l'immagine positiva pochi minuti dopo l'esposizione La classificazione per formato si basa sulla dimensione del fotogramma. 135 (conosciuto come 35mm, il piccolo formato) APS (Advanced Photo System) 110 (13 x 17 mm, fuori produzione) 120/220 (56 × 56 mm, il medio formato) Il supporto fotografico è distribuito anche in lastre per utilizzo singolo nelle fotocamere a banco ottico a grande formato. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 15 La strumentazione ottica (14/30) Nelle fotocamere digitali il principio è lo stesso di quelle analogiche: l’unica differenza è che al posto della pellicola è presente un sensore CCD. Un CCD (acronimo di Charge Coupled Device) consiste in un circuito integrato formato da una riga, o da una griglia, di elementi semiconduttori in grado di accumulare una carica elettrica (charge) proporzionale all'intensità della radiazione elettromagnetica che li colpisce. Questi elementi sono accoppiati (coupled) in modo che ognuno di essi, sollecitato da un impulso elettrico, possa trasferire la propria carica ad un altro elemento adiacente. Inviando al dispositivo (device) una sequenza temporizzata d'impulsi, si ottiene in uscita un segnale elettrico grazie al quale è possibile ricostruire la matrice dei pixel che compongono l'immagine proiettata sulla superficie del CCD stesso. Questa informazione può essere utilizzata direttamente nella sua forma analogica, per riprodurre l'immagine su di un monitor o per registrarla su supporti magnetici, oppure può essere convertita in formato digitale per l'immagazzinamento in file che ne garantiscano il riutilizzo futuro. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 16 La strumentazione ottica (15/30) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 17 La strumentazione ottica (16/30) La telecamera è un dispositivo elettronico per l'acquisizione di immagini dinamiche (in movimento). Permette la cattura di immagini bidimensionali in sequenza, a velocità di cattura prefissate, solitamente nella gamma visibile dello spettro elettromagnetico. Si avvale di sistemi a tubo catodico o a CCD. Le telecamere possono essere in bianco e nero o a colori con standard di acquisizione e trattamento delle immagini allineate agli standard televisivi dei paesi in cui vengono usate. L'abbinamento di una telecamera con un videoregistratore genera il camcorder che è diventato l'apparecchio di registrazione televisiva più diffuso degli ultimi anni. Esso, viene utilizzato sia per applicazioni professionali sia in tutti i sistemi di registrazione amatoriali. Ultimamente sono presenti sul mercato telecamere che registrano su supporto DVD e telecamere che registrano in formato compresso (solitamente DivX) su disco rigido con possibilità di collegarle con un cavo ad alta velocità ad un computer per effettuare montaggi, effetti speciali e via dicendo. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 18 La strumentazione ottica (17/30) In una telecamera l’immagine si forma sul sensore che ne consente la scansione per righe e che da luogo ad un segnale che nel tempo di scansione di ciascuna riga è proporzionale alla luminanza dell’immagine lungo tale riga. Idealmente da un organo di ripresa in bianco e nero escono tre segnali: il primo che descrive l’andamento della luminanza lungo ciascuna riga, e altri due, detti di sincronismo orizzontale e verticale, che identificano gli istanti di interruzione della scansione ad ogni riga e alla fine del quadro. Se la telecamera è a colori, l’immagine viene focalizzata sul fondo di tre sensori, ciascuno dei quali è preceduto da un filtro ottico trasparente ai tre colori R, G e B. Così le uscite dei tre sensori forniscono l’andamento delle tre componenti di colore, in sostituzione della sola luminanza. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 19 La strumentazione ottica (18/30) Luminanza Riga 1 Riga 2 Riga 3 Riga N Sinc. Orizz. Sinc. Vert. Sono mostrati i tre segnali generati da una telecamera in bianco e nero. Data un’immagine di base A e altezza H, si definisce rapporto d’aspetto il rapporto: R = A/H. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 20 La strumentazione ottica (19/30) Una webcam è una piccola telecamera utilizzabile solo (o principalmente) come dispositivo di input per un computer. A differenza di una telecamera tradizionale, non dispone di un proprio sistema di memorizzazione di video (per esempio su nastro), ma trasmette semplicemente le immagini riprese, in forma digitale. Il principale utilizzo delle webcam consiste infatti nella possibilità di impiegarle per realizzare una videoconferenza attraverso il Web o altri sistemi basati su Internet. Un altro uso piuttosto diffuso delle webcam consiste nella trasmissione continua di immagini dal vivo (streaming video) da determinati luoghi del mondo; per esempio, il sito View Sydney offre immagini dal vivo, 24 ore al giorno, della zona del Darling Harbour di Sydney. Ancora, webcam vengono talvolta utilizzate a scopi di videosorveglianza, o per la registrazione di video (sul disco rigido del computer). Negli ultimi anni alcuni modelli di webcam sono diventati popolari tra gli astrofili, che le impiegano come strumenti a basso costo per la ripresa di immagini di pianeti e altri oggetti celesti luminosi. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 21 La strumentazione ottica (20/30) Uno schermo a cristalli liquidi, o LCD (Liquid Crystal Display), è uno schermo sottile e leggero senza nessuna parte mobile. Esso è composto da un liquido intrappolato in numerose celle. Ogni cella è provvista di contatti elettrici in modo da poter applicare un campo elettrico al liquido che contiene. Le celle stesse sono contenute all'interno di due schermi polarizzatori lungo assi perpendicolari tra loro. I cristalli liquidi torcono di 90° la polarizzazione della luce che arriva da uno dei polarizzatori, permettendole di passare attraverso l'altro. Prima che il campo elettrico sia applicato, la luce può passare attraverso l'intera struttura, e, a parte una piccola parte di luce assorbita dai polarizzatori, l'apparecchio risulta trasparente. Quando il campo elettrico viene attivato le molecole del liquido si allineano parallelamente al campo elettrico, limitando la rotazione della luce entrante. Se i cristalli sono completamente allineati col campo, la luce che vi passa attraverso è polarizzata perpendicolarmente al secondo polarizzatore, e quindi è bloccata del tutto. Il pixel apparirà non illuminato. Controllando la torsione dei cristalli liquidi in ogni pixel, si può controllare quanta luce far passare, corrispondentemente illuminando il pixel. La grandezza dello schermo si misura in diagonale utilizzando il pollice come unità di misura. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 22 La strumentazione ottica (21/30) Gli schermi LCD posso essere usati in due modalità denominate transmissive e reflective. Gli schermi di tipo transmissive sono illuminati da un lato e vengono visti dall'altro. In pratica una luce viene posizionata sul retro dello schermo e i cristalli liquidi agiscono da filtro facendo passare solo la componente cromatica desiderata. In questo modo si ottengono schermi molto luminosi, d'altro canto, però la fonte di luce spesso consuma più energia di quella richiesta dallo schermo in sé. Questi schermi hanno una buona leggibilità in condizioni di scarsa luce ambientale, mentre diventano poco visibili in condizioni di forte illuminazione, risultando adatti per l'uso in interni. Gli schermi LCD di tipo reflective usano la luce presente nell'ambiente che viene riflessa da uno specchio posto dietro lo schermo. Questo schermo ha un contrasto più basso rispetto al LCD transmissive, infatti la luce è costretta a passare due volte attraverso il filtro. Il vantaggio principale di questo tipo di schermo è che l'assenza di una fonte di luce artificiale mantiene i consumi energetici molto bassi. Gli schermi Transflexive cercano di unire le caratteristiche migliori dei Transmissive e dei Reflective. Hanno un semi-specchio posto dietro il display, in grado di riflettere la luce frontale (come i reflective), ma di far passare la luce proveniente da un illuminatore posto nella parte posteriore (come i trasmissive). Questo tipo di display si va diffondendo rapidamente, soprattutto negli apparecchi mobili (telefoni cellulari e computer palmari), per la sua buona leggibilità in tutte le condizioni di luce. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 23 La strumentazione ottica (22/30) Gli schermi di medie dimensioni, come quelli delle agende elettroniche, hanno una struttura a matrice passiva. Questo tipo di struttura ha un gruppo di contatti per ogni riga e colonna dello schermo, invece che una per ogni pixel. Lo svantaggio è che può essere controllato solo un pixel alla volta, gli altri pixel devono ricordare il loro stato finché il circuito di controllo non si dedica nuovamente a loro. Il risultato è un contrasto ridotto ed una certa difficoltà a visualizzare bene le immagini in rapido movimento. Il problema chiaramente va peggiorando man mano che il numero di pixel aumenta. Per gli schermi ad alta risoluzione, come i monitor per computer, si usa un sistema a matrice attiva. In questo caso lo schermo LCD contiene una sottile pellicola di transistor (Thin Film Transistor - TFT). Questo dispositivo memorizza lo stato elettrico di ogni pixel dello schermo mentre gli altri pixel vengono aggiornati. Questo metodo permette di ottenere immagini molto più luminose e nitide rispetto agli LCD tradizionali. La durata media degli schermi LCD si attesta al giorno d'oggi intorno alle 50.000 ore. Questo fatto, unitamente alla notevole flessione dei prezzi, rende questa tecnologia un'alternativa agli schermi a tubo catodico.Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 24 La strumentazione ottica (23/30) 1) Piastra di vetro 2) e 3) Filtri polarizzatori orizzontali e verticali 4) Matrice colori RGB 5) e 6) Linee di comando orizzontali e verticali 7) Stato di polimeri 8) Separatori 9) Thin Film Transistor 10) Elettrodo anteriore 11) Elettrodo posteriore Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 25 La strumentazione ottica (24/30) OLED è l'acronimo di Organic Light Emitting Diode ovvero diodo organico ad emissione di luce. Tecnologia che permette di realizzare display a colori con la capacità di emettere luce propria: a differenza dei display a cristalli liquidi, i display OLED non richiedono componenti aggiuntivi per essere illuminati, ma producono luce propria; questo permette di realizzare display molto più sottili e addirittura pieghevoli e arrotolabili, e che richiedono minori quantità di energia per funzionare. Un display OLED è composto da vari strati sovrapposti: su un primo strato trasparente, che ha funzioni protettive, viene deposto uno strato conduttivo trasparente che funge da anodo; successivamente vengono aggiunti 3 strati organici: uno per l'iniezione delle lacune, uno per il trasporto di elettroni, e, tra di essi, i tre materiali elettroluminescenti (rosso, verde e blu), disposti a formare un unico strato composto da tanti elementi, ognuno dei quali formato dai tre microdisplay colorati. Infine, viene deposto uno strato riflettente che funge da catodo. Nonostante la molteplicità di strati, lo spessore totale, senza considerare lo strato trasparente, è di circa 300 nanometri. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 26 La strumentazione ottica (25/30) Uno schermo al plasma è uno schermo dove la luce viene creata grazie a dei fosfori eccitati da una scarica di plasma. La scarica di plasma contiene una mistura di gas nobili (neon e xeno); questi gas sono contenuti in centinaia di migliaia di piccole celle all'interno di un guscio formato da due elettrodi e rivestito da uno strato di fosforo. Quando gli elettrodi inducono un campo elettrico i gas contenuti nella cella ionizzano, emettendo una scarica di plasma che, reagendo col fosforo della cella, produce luce. Ogni singola cella è in realtà una componente cromatica di un pixel che, insieme a tutti gli altri, contribuisce a formare l'immagine. Ogni pixel infatti è formato da tre subpixel, uno con fosforo rosso, uno verde e il terzo blu, che corrispondono alle singole celle (RGB). Variando gli impulsi della corrente che attraversa le celle, il sistema di controllo può aumentare o diminuire l'intensità di ogni colore del subpixel, per generare le centinaia di diverse combinazioni di rosso, verde e blu. In questo modo, il sistema di controllo può produrre i colori dell'intero spettro. Gli schermi al plasma sono luminosi (1000 cd/m2 o più) e molto sottili. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 27 La strumentazione ottica (26/30) Il principale vantaggio degli schermi al plasma è che è possibile produrre schermi molto grandi usando materiali estremamente sottili. Inoltre, visto che ogni pixel è illuminato singolarmente, l'immagine è molto luminosa e non dipende dall'angolo di visuale. La qualità di immagine non è ancora al livello degli schermi CRT migliori, ma certamente è sufficiente per la maggior parte delle persone. Gli svantaggi più grandi di questa tecnologia sono dati dal prezzo e dal progressivo degrado dell'immagine; soprattutto la persistenza di immagini statiche tende a creare fastidiose ombreggiature e zone scure, che, nei casi più gravi, si notano anche a schermo spento, il degrado dell'immagine è conseguente alla progressiva alterazione cromatica della superficie interna della singola cella contenente il gas, e dal progressivo ridursi della sua luminosità, analogamente come avviene nelle lampade al neon. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 28 La strumentazione ottica (27/30) Il termine tubo a raggi catodici, più comunemente tubo catodico o CRT, indica la tecnologia comunemente usata per la visualizzazione nei monitor e nei televisori, che consiste nel convogliare ad hoc dei raggi catodici su di una superficie sensibile, che ricostruisce l'immagine visibile. La misura dei monitor CRT si effettua sulla diagonale dell'area visibile, in Pollici. I monitor a tubo catodico presentano il vantaggio, rispetto alle tecnologie concorrenti, di una migliore velocità di reazione (o minore latenza, molto apprezzata nell'uso dei videogiochi) e immagini con colori più fedeli. La struttura del tubo catodico deriva direttamente dal diodo a catodo freddo, a sua volta derivato dal tubo di Crookes, a cui è aggiunto uno schermo rivestito di materiale fluorescente. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 29 La strumentazione ottica (28/30) Il catodo è un piccolo elemento metallico riscaldato all'incandescenza che emette elettroni per effetto termoelettronico. All'interno del tubo catodico, in cui è stato praticato un vuoto spinto, questi elettroni vengono diretti in un fascio (raggi catodici) per mezzo di una elevata differenza di potenziale elettrico tra catodo e anodo. Il raggio (detto anche pennello elettronico) viene deflesso dall'azione di campi magnetici (Forza di Lorentz) in modo da arrivare a colpire un punto qualunque sulla superficie interna dello schermo, l'anodo. Questa superficie è rivestita di materiale fluorescente (detti fosfori, in genere metalli di transizione oppure terre rare) che eccitato dall'energia degli elettroni emette luce. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 30 La strumentazione ottica (29/30) I tubi catodici a colori utilizzano differenti tipi di fosfori in grado di emettere i colori rosso, verde e blu, disposti in sottili strisce parallele (tecnica aperture grille) oppure a gruppi di punti (tecnica shadow mask). Ci sono quindi tre catodi con tre sistemi di focalizzazione (complessivamente detti cannoni elettronici), che generano un fascio per ciascun colore (in realtà i fasci sono invisibili, la corrispondenza con il colore dipende esclusivamente da quale fosforo viene colpito). Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 31 La strumentazione ottica (30/30) All'interno del tubo, a breve distanza dallo schermo, è presente una maschera metallica forata con la funzione di assorbire gli elettroni che non siano sulla traiettoria esatta per raggiungere il fosforo corretto e che causerebbero altrimenti confusione nei colori visualizzati. L'impatto degli elettroni con la maschera metallica è causa di produzione di una piccola quantità di raggi X. Per questo motivo la parte frontale del tubo è realizzata in vetro al piombo, in modo da lasciarsi attraversare dalla luce dell'immagine ma non dai raggi X. Inoltre il sistema elettronico è progettato in modo da impedire che la tensione anodica possa salire a valori eccessivi, causando l'emissione di raggi X di energia maggiore. Si sono sperimentati in passato altri metodi per generare i colori, come per esempio l'utilizzo di un unico pennello elettronico che scandisce in sequenza i tre fosfori colorati che costituiscono il pixel dell'immagine. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 32 La televisione (1/18) Un televisore dovrebbe riprodurre 25 fotogrammi al secondo, ovvero uno ogni 40 ms. Nella realtà per evitare sfarfallamenti, la si ripropone due volte ogni 40 ms. In teoria potrei prendere due immagini diverse ogni 20 ms e trasmetterli, ma in questo modo raddoppierei l’occupazione di banda (scansione progressiva). Una soluzione è quella di trasmettere ogni 20 ms non l’intera immagine, ma alternativamente le sue righe pari e poi le sue righe dispari (scansione interlacciata). Una simile rappresentazione corrisponde al cosidetto campionamento quincunx. Si indica con quadro l’intero fotogramma, con semiquadro un fotogramma rappresentato dalle sole righe pari o dispari. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 33 La televisione (2/18) fy fx Esempio di campionamento quincunx. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 34 La televisione (3/18) Per permettere la diffusione degli apparecchi televisivi inizialmente e dei dispositivi informatici in seguito sono stati sviluppato una serie di standard che raccolgono le specifiche tecniche da rispettare per ottenere delle apparecchiature interoperanti. Essi sono il PAL, il SECAM e l’NTSC. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 35 La televisione (4/18) NTSC: National Television System Committee Sviluppato negli USA, fu il primo standard di tv a colori ad essere inventato. Le trasmissioni pubbliche iniziarono ufficialmente nel 1954. linee/ quadri Caratteristiche tecniche: portante audio frequenza orizzontale 525/60 15.734 kHz frequenza verticale frequenza portante colore 60 Hz 3.579545 MHz banda video 4.2 MHz 4.5 MHz (FM) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 36 La televisione (5/18) PAL: Phase Alternation Line Sviluppato in Germania, deriva dall'NTSC, rispetto al quale elimina la distorsione nei colori. Le trasmissioni iniziarono nel 1967 Caratteristiche tecniche: Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 37 La televisione (6/18) PAL B-G-H linee/ quadri frequenza orizzontale 625/50 PAL I 625/50 PAL D 625/50 PAL N 625/50 PAL M 525/60 15.625 kHz 15.625 kHz 15.625 kHz 15.625 kHz 15.734 kHz frequenza verticale 50 Hz 50 Hz 50 Hz 50 Hz 60 Hz frequenza portante colore 4.433618 MHz 4.433618 MHz 4.433618 MHz 3.582056 MHz 3.575611 MHz banda video 5.0 MHz 5.5 MHz 6.0 MHz 4.2 MHz 4.2 MHz portante audio 5.5 MHz (FM) 6.0 MHz (FM) 6.5 MHz (FM) 4.5 MHz (FM) 4.5 MHz (FM) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 38 La televisione (7/18) SECAM: Sequential Couleur Avec Memoire Sviluppato in Francia. Trasmissioni iniziate nel 1967. Caratteristiche tecniche: SECAM B-G-H SECAM D-KK1-L linee/ quadri 625/50 625/50 frequenza orizzontale 15.625 kHz 15.625 kHz frequenza verticale 50 Hz 50 Hz banda video 5.0 MHz 6.0 MHz portante audio 5.5 MHz 6.5 MHz (FM) Tranne SECAM L Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 39 La televisione (8/18) Il digitale terrestre (anche noto con l'acronimo DTT) è una tecnologia che permette di ricevere sul televisore di casa trasmissioni televisive del livello qualitativo e prestazionale della TV satellitare, utilizzando l'impianto ricevente preesistente, affiancato da un decoder. Con il sistema digitale, si trasmette un'onda elettromagnetica che però non è copia dell'onda elettrica generata dalla telecamera ma un flusso di bit, un flusso di dati binari, cioè in grado di assumere soltanto due valori. La trasformazione dell'onda elettrica in uscita dalla telecamera in flusso di dati digitali da trasmettere attraverso un'onda elettromagnetica è fatta dai circuiti di conversione analogico/digitale (A/D). In particolare, il sistema digitale terrestre approvato in Italia prevede l'uso della trasmissione dei dati aggiuntivi per la distribuzione di programmi software scritti secondo lo standard MHP. Il principale vantaggio della tecnologia di trasmissione digitale del segnale è la qualità. Il secondo vantaggio è l'indifferenza ai disturbi in ricezione, insieme all’aumento del numero di canali disponibili. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 40 La televisione (9/18) L' MHP (Multimedia Home Platform) è uno standard della famiglia DVB che definisce l’interfaccia (middleware) tra le applicazioni interattive digitali e gli apparati dove queste sono attivate (Set-Top-Box o STB). Le specifiche di questo Linguaggio sono state definite appunto dal Digital Video Broadcast Project un consorzio formato da più di 300 operatori del settore, costruttori, sviluppatori di software di circa 35 paesi diversi. La conformità del progetto è sotto la responsabilità dell'European Telecommunications Standards Institute. L'MHP fin dal principio viene sviluppato in due modi differenti: DVB-HTML, poco fortunato perché molto complesso, e DVB-J. DVB-J che rappresenta lo standard più diffuso si basa su un subset di linguaggio di programmazione Java. Esso costituisce un software intermedio e aperto per la messa a punto di molti tipi di applicazioni e servizi anche con modalità interattive. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 41 La televisione (10/18) L'acronimo DVB (Digital Video Broadcasting, Diffusione Video Digitale) rappresenta un insieme di standard aperti ed accettati a livello internazionale, concepiti per lo sviluppo e la diffusione della televisione digitale. Il sistema DVB ha prodotto degli standard per ciascun mezzo trasmissivo (terrestre, satellite, via cavo) utilizzato dalla TV analogica. In particolare. si possono annoverare i seguenti: DVB-S (la "S" sta per "satellitare"): in questo caso per ricevere i segnali video è necessario collegare il televisore ad un'antenna parabolica, che riceve i segnali direttamente dai satelliti posti in orbita geostazionaria; DVB-C (la "C" per "cavo"): qui invece il segnale è ricevuto grazie ad un cavo coassiale; DVB-T (la "T" sta per "Terrestrial"): infine in quest'ultimo caso, il segnale video è ricevuto attraverso le normali antenne televisive, andando (per il momento) ad affiancarsi alle trasmissioni analogiche, ossia quelle che siamo abituati a ricevere da anni. Quest'ultimo tipo di trasmissioni, però, è destinato per legge a scomparire, in quanto è previsto che nel mese di dicembre 2008 (in precedenza stimato il 1° gennaio 2006) tutti i trasmettitori televisivi analogici d'Italia saranno spenti, e da quel momento in poi sarà possibile vedere i programmi televisivi solo dotandosi di un ricevitore digitale, che nei televisori più nuovi è già incorporato. DVB-H (la "H" sta per "handheld"): è lo standard del consorzio europeo DVB per una modalità di radiodiffusione terrestre studiata per trasmettere programmi TV, radio e contenuti multimediali ai dispositivi handheld, come i più comuni smartphone e i palmari Pda. Si tratta di uno standard derivato dal DVB-T e funziona combinando gli standard del video digitale con l'Internet Protocol in modo da suddividere i contenuti in pacchetti di dati da trasferire sul cellulare e leggibili da parte dell'utente. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 42 La televisione (11/18) IPTV (Internet Protocol Television) descrive un sistema atto a utilizzare l'infrastruttura di trasporto IP per veicolare contenuti televisivi in formato digitale attraverso connessione internet a banda larga. Spesso la fruizione dei contenuti televisivi è offerta in modalità Video on Demand ed abbinata all'accesso al web ed al VOIP, poiché questi tre servizi condividono la stessa infrastruttura. Per i prossimi anni molti si attendono che l'IPTV avrà una forte diffusione, di pari passo con la disponibilità della banda larga. L'interesse degli utenti finali è ulteriormente spinto dalla sempre maggiore disponibilità di contenuti sia a pagamento che gratuiti. Al momento , le sole alternative all'IPTV sono le distribuzioni televisive tradizionali come la televisione analogica terrestre, il digitale terrestre, il satellite e, nei paesi in cui viene usata, la TV via cavo. L'esecuzione dell'IPTV richiede l'utilizzo di un PC oppure di un apposito set-top box collegato alla TV. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 43 La televisione (12/18) L'Advanced Television Systems Committee (ATSC), ovvero il Comitato per i Sistemi Televisivi Avanzati è un'organizzazione internazionale senza fini di lucro volta allo sviluppo di standard volontari per la televisione digitale. Le organizzazioni membri della ATSC rappresentano le industrie di semiconduttori, satelliti, TV via cavo, computer, elettronica di consumo e sistemi di trasmissione video. In particolare, ATSC sta lavorando per coordinare gli standard televisivi tra i differenti mezzi di trasmissione, con particolare attenzione alla televisione digitale, i sistemi interattivi, e le comunicazioni multimediali a larga banda. Formati supportati dallo standard ATSC: Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 44 La televisione (13/18) Con il termine HDTV (High Definition Television) ci si riferisce a trasmissioni televisive a risoluzioni molto più alte di quella usata tradizionalmente (SDTV - Standard Definition Television). Se la realizzazione tecnica (produzione del contenuto, encoding digitale, trasmissione, ricevitore, display) non lo impedisce, HDTV ha il potenziale di permettere un livello qualitativo più elevato di quello attualmente in uso. Un fotogramma video tradizionale nel sistema PAL è composto da 625 linee, di cui quelle dedicate all'informazione video vera e propria sono circa 525. La tecnologia HDTV comprende due formati video, che differiscono sia per la risoluzione effettiva che per le modalità di scansione dell'immagine. Il formato 720p, chiamato comunemente HDV, presenta una risoluzione complessiva di 921.600 pixel (1280×720) con scansione progressiva, ovvero per ciascun ciclo di trasmissione di un fotogramma (50 o 60 Hz a seconda dei Paesi) viene trasmesso l'intero quadro dell'immagine. Il formato 1080i, chiamato comunemente HD, presenta una risoluzione complessiva di 2.073.000 pixel (1920×1080) con scansione interlacciata, ovvero per ciascun ciclo viene trasmesso un semiquadro formato alternativamente dalle sole linee pari o dispari dell'immagine. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 45 La televisione (14/18) La definizione dei programmi HDTV è circa 4 volte superiore a quella del formato DVD e nonostante la buona efficienza di compressione offerta dall'MPEG-4, lo spazio richiesto per la loro è comunque rilevante. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 46 La televisione (15/18) I DVD-Video sono supporti digitali in grado di contenere fino a 240 minuti di materiale video in formato MPEG-2. L'audio può essere indifferentemente in formato PCM (stereo non compresso), in formato Dolby Digital AC3 (che prevede da 1 a 6 canali), in formato DTS (a 6 o 7 canali) o in formato MPEG2. I DVD-Video in commercio possiedono un codice detto codice regionale per poter essere riprodotto, usando un lettore DVD da tavolo, solo in una determinata zona del mondo (il globo è stato suddiviso in aree dalle major cinematografiche). I codici regionali dei DVD-Video sono i seguenti: 0 - Tutto il mondo (nessuna restrizione) 1 - Canada, USA e suoi territori 2 - Europa, Giappone 3 - Sudest asiatico 4 - Australia, Nuova Zelanda, America centrale e meridionale 5 - Russia, India, Asia nordovest e Africa del nord 6 - Cina 7 - Riservato 8 - Speciali sedi di riunioni (aeroplani, navi, hotel, etc.) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 47 La televisione (16/18) HD DVD (acronimo di High Density Digital Versatile Disc o High Definition Digital Video Disc) è un formato ottico digitale che è stato sviluppato al fine di diventare uno standard per i DVD di nuova generazione adatti ai contenuti ad alta definizione. Il 19 novembre 2003, il DVD Forum ha deliberato per 8 voti contro 6, che l'HD-DVD sarà il successore del DVD per l'alta definizione. HD-DVD è simile al concorrente Blu-ray Disc, che utilizza anch'esso supporti della stessa dimensione, pari a quella dei CD (120 mm di diametro) e un laser blu di 405 nanometri di lunghezza d'onda. Un disco HD-DVD ha una capacità di 15 GB per ogni singolo layer, e al momento esiste in 3 versioni differenti: 15 GB (1 layer), 30 GB (2 layer) e recentemente, il 12 maggio 2005 al Media-Tech Expo di Los Angeles ne è stata proposta un'evoluzione da 45 GB (3 layer). Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 48 La televisione (17/18) Il Blu-ray Disc® (spesso abbreviato in BD) è il supporto ottico proposto dalla Sony agli inizi del 2002 come evoluzione del DVD per la televisione ad alta definizione. Grazie all'utilizzo di un laser a luce blu, riesce a contenere fino a 57 GB di dati, quasi 12 volte di più rispetto a un DVD Single Layer - Single Side (4,7 GB). Anche se questa capacità sembra enorme un disco da 50 GB può contenere a malapena 2 ore di filmato ad alta definizione anche utilizzando il sofisticato codec MPEG-4 al posto del tradizionale MPEG-2. La tecnologia alla base di Blu-ray è più complessa e sofisticata, ma permette di raggiungere capacità teoriche superiori ai 500 GB per singolo disco. Uno dei motivi principali per cui lo standard Blu-Ray consente capacità superiori rispetto al concorrente è rappresentato dallo spessore dello strato protettivo. I dischi DVD e HD DVD dispongono di un polimero trasparente di 0,6 mm che copre i substrati, mentre lo strato del Blu-Ray è di solo 0,1 mm. Questo significa che il substrato è molto vicino alla superficie, e la diffusione del laser è minore. Meno materiale il laser deve penetrare, maggiore sarà l‘apertura numerica e minore sarà la distanza tra due tracce e la lunghezza dei pit. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 49 La televisione (18/18) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 50 L’image processing (1/52) Quando una funzione delta bi-dimensionale (un impulso bi-dimensionale) transita attraverso un filtro lineare, viene modificata, allargata e per questo chiamata point spread function (PSF). L’occhio è un eccellente esempio di questo concetto. Infatti se l’occhio guarda un punto bianco su sfondo grigio, compare un alone nero intorno al punto luminoso. L’immagine trasmessa al cervello è la convoluzione tra l’immagine reale e la PSF. La stessa cosa può essere applicata alla luminosità: il fronte di passaggio tra due livelli non è più graduale, ma presenta delle creste. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 51 L’image processing (2/52) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 52 L’image processing (3/52) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 53 L’image processing (4/52) Una funzione PSF è detta separabile se può essere fattorizzata nel prodotto di due termini: una proiezione orizzontale e una proiezione verticale. x[r,c] = vert[r] x horz[c] Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 54 L’image processing (5/52) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 55 L’image processing (6/52) Molto utile anche nell’image processing come nell’audio è l’analisi di Fourier. L’idea di base è quella che nel dominio spaziale, si possono identificare delle regioni in cui è facile intervenire con un filtro. Inoltre la convoluzione nel tempo corrisponde al prodotto nella frequenza, e moltiplicare due matrici è molto semplice. Lo spettro può essere calcolato in vari modi, ma quello più efficiente è quello che utilizza un algoritmo di FFT. L’immagine originale è composta da N righe ed N colonne, con N pari ad una potenza di due. Se ciò non è possibile vengono aggiunti dei pixel di valore zero fino al raggiungimento del valore esatto. L’algoritmo si calcola, implementando la FFT monodimensionale per ogni riga, seguito dalla FFT monodimensionale di ogni colonna. Poiché le due direzioni sono equivalenti, posso anche procedere in ordine inverso. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 56 L’image processing (7/52) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 57 L’image processing (8/52) Dato che la FFT deve essere periodica di periodo N, cioè si deve ripetere uguale ogni N campioni, posso disegnare lo spettro tra –N/2 e N/2, shiftando tutto di N/2. Nel quadrante [0 N/2] ho tutte le informazioni, il resto è simmetrico. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 58 L’image processing (9/52) Un problema interessante è quello di verificare il match tra un’immagine ed una sua parte, come nel caso della verifica di banconote. Per risolvere il problema, basta implementare un matched filter, cioè una correlazione che può essere implementata come una convoluzione. Questo si effettua applicando una rotazione di 180° all’immagine target. Altro accorgimento che può essere usato per migliorare l’efficacia dell’algoritmo è quello di trovare i contorni dell’immagine target. Vediamo un esempio. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 59 L’image processing (10/52) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 60 L’image processing (11/52) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 61 L’image processing (12/52) Facendo quindi la convoluzione tra il target ruotato (con detection dei bordi) e l’immagine originale, e ripassando nel tempo, ottengo un picco di luce, tanto più luminoso quanto più è perfetto il matcing. La correlazione è infatti una misura di quanto buono sia il matching raggiunto. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 62 L’image processing (13/52) La trasformata della funzione PSF è chiamata modulation transfer function (o MTF). Se la PSF è simmetrica basta solo il primo quadrante in [0 N/2]. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 63 L’image processing (14/52) Per sensori CCD non troppo ottimi, cioè se l’apertura spaziale è più ampia dell’intervallo di campionamento, posso avere un blurry detector, contrapposto al perfect detector: ovvero ho un contributo luminoso dovuto ai pixel vicini. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 64 L’image processing (15/52) Parametro fondamentale è il rapporto segnale rumore SNR, definito come il valore del contrasto diviso dalla deviazione standard del rumore. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 65 L’image processing (16/52) Le immagini casuali possono essere di due tipi differenti: quelle che hanno un livello di rumore costante all’aumentare dell’intensità luminosa, e quelle che hanno un livello di rumore proporzionale all’intensità rumorosa. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 66 L’image processing (17/52) Campo di applicazione interessante dell’image procesing è il processamento morfologico dell’immagine: cioè trasformare un’immagine a scala di grigi in un’immagine binaria, cioè in cui i pixel possono valere solo 0 o 1 (bianco o nero). Su queste immagini binarie posso fare poi delle semplici operazioni: Erosione: ogni pixel al contorno è trasformato nel contorno; Dilatazione: allarga gli oggetti; Aperture: erosione + dilatazione; Chiusura: dilatazione + erosione Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 67 L’image processing (18/52) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 68 L’image processing (19/52) Applicazione interessante del processamento morfologico è la scheletrizzazione (skeletonization), cioè la semplificazione dei pixel ridondanti, come viene utilizzato nell’analisi delle impronte digitali. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 69 L’image processing (20/52) Altro campo di interesse è quello bio-medico in cui da qualche tempo si scattano immagini tri-dimensionali del compo umano con una tecnica nota come TAC (Tomografia Assiale Computerizzata). Vengono prese immagini da varie angolazioni, in modo da poter ricostruire l’immagine in 3D. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 70 L’image processing (21/52) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 71 L’image processing (22/52) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 72 L’image processing (23/52) Data una funzione monodimensionale f(t), un bordo è un punto (o un insieme di punti) per il quale la derivata f’(t) assume un valore relativamente grande rispetto ad una prefissata soglia. Intuitivamente si pensi al fatto che la derivata di una funzione rappresenta in qualche modo la sua variazione e assume valori tanto maggiori quanto più è brusca la variazione suddetta. Analogamente nel caso bidimensionale si dirà che un punto p di f(x,y) è un punto di bordo se il valore del grad[f(x,y)] è grande. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 73 L’image processing (24/52) Per estrarre il bordo (edge detection) basta quindi andare a verificare in quali punti della matrice dell’immagine derivata ho valori elevati oltre una certa soglia, e considerarli come bordo. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 74 L’image processing (25/52) Di solito non si agisce solo sulle righe o sulle colonne, ma contemporaneamente in entrambe le direzioni, ottenendo uno schema tipo: Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 75 L’image processing (26/52) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 76 L’image processing (27/52) In realtà l’operazione del gradiente può essere filtrato con varie funzioni che agiscono da operatori: Roberts, Sobel, Prewitt, FreiChen. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 77 L’image processing (28/52) A=imread('A.jpg'); imshow(A) disp(' '); disp('Premere un tasto per etrarre il contorno'); pause B=diff(A); for i=1:size(B,1), for j=1:size(B,2), if B(i,j)<15 C(i,j)=255; else C(i,j)=0; end end end figure imshow(C) imwrite(C,'Bordo_di_A.jpg','JPEG') Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 78 L’image processing (29/52) D=zeros(128); D(:,[1:64])=0.2; D(:,[65:128])=0.9; figure imshow(D) imwrite(D,'B.jpg','JPEG') F=diff(D.'); F=F.'; for i=1:size(F,1), for j=1:size(F,2), if F(i,j)<0.5 E(i,j)=255; else E(i,j)=0; end end end figure imshow(E) imwrite(E,'Bordo_di_B.jpg','JPEG') Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 79 L’image processing (30/52) G=rand(128); figure imshow(G) imwrite(G,'Immagine_Casuale.jpg','JPEG') Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 80 L’image processing (31/52) Uno dei difetti fotografici più comuni è la presenza di un contrasto non ottimale. Per immagini continue, la correzione del contrasto è difficile, mentre per immagini campionate è molto semplice: basta riscalare ogni pixel con una funzione di trasferimento tale da aumentare il contrasto. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 81 L’image processing (32/52) Ci sono comunque diverse scelte di questa funzione: posso usare una funzione lineare, una funzione lineare con clipping (preferibile quando pochi pixel hanno un valore di contrasto povero) oppure un valore assoluto. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 82 L’image processing (33/52) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 83 L’image processing (34/52) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 84 L’image processing (35/52) Oppure posso anche usare funzioni non lineari, del tipo: G ( j , k ) = ⎡⎣ F ( j , k ) ⎤⎦ p dove p rappresenta la potenza del miglioramento e F(j,k) l’immagine originale. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 85 L’image processing (36/52) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 86 L’image processing (37/52) Tecnica utile può essere la modifica dell’istogramma: l’immagine originale è modificata al punto da ottenere un istogramma dalla forma desiderata. Ad esempio Andrews ed Hall hanno proposto delle tecniche di equalizzazione dell’ istogramma, in modo da ottenere un’immagine con istogramma piatto. Questa tecnica può essere sia adattativa che non adattativa. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 87 L’image processing (38/52) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 88 L’image processing (39/52) Frei ha proposto la tecnica dell’iperbolizzazione dell’istogramma, ovvero all’uscita del processo ottengo un’immagine con istogramma simile ad un’iperbole. Poiché l’occhio ha una curva simile all’inverso dell’iperbole, vedo l’immagine come possedere istogramma piatto. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 89 L’image processing (40/52) I sensori o il canale di trasmissione che agiscono sull’immagine non sono mai perfetti, ma introducono sempre del rumore. Il rumore è di solito fastidioso: esistono tecniche di cancellazione del rumore. A volte il rumore agisce su singoli pixel, che quindi assumono un valore diverso dal proprio. Altre volte il rumore è additivo, nel senso che si somma su tutta l’immagine. Il rumore additivo può essere uniforme o impulsivo. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 90 L’image processing (41/52) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 91 L’image processing (42/52) Una prima tecnica è quella di operare sull’immagine un filtraggio passa basso con funzione di trasferimento H. Posso usare delle funzioni note (Butterworth, Chebichev, etc.), oppure posso usare semplicemente le seguenti maschere: Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 92 L’image processing (43/52) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 93 L’image processing (44/52) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 94 L’image processing (45/52) Altra tecnica è quella di usare il filtraggio olomorfico (chepstrum), che si basa sul fatto che il logaritmo di un prodotto è pari alla somma dei logaritmi. Infatti se suppongo che un’immagine è data da un’immagine originale moltiplicata un fattore di illuminazione: F(j,k) = I(j,k) S(j,k) allora passando ai logaritmi ottengo log{F(j,k)} = log{I(j,k)} + log{S(j,k)} e quindi posso applicare tecniche di filtraggio tradizionali per ridurre il termine di rumore. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 95 L’image processing (46/52) Dopo che ho effettuato il filtraggio, posso applicare l’operatore esponenziale (inverso del logaritmo) e ottenere il segnale originale ripulito. Di seguito è illustrato un esempio. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 96 L’image processing (47/52) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 97 L’image processing (48/52) Altre tecniche di cancellazione del rumore si basano su algoritmi non lineari. Prima è la tecnica dell’outlier: in cui il valore di un pixel viene confrontato con gli otto pixel che lo circondano, calcolandone la media. Se questa media supera un certo valore, pongo il pixel pari alla media. Il filtraggio è fatto con la seguente matrice: Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 98 L’image processing (49/52) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 99 L’image processing (50/52) Seconda tecnica è quella di fare dei filtri a media mobile, estendendoli a due dimensioni: Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 100 L’image processing (51/52) Ultime tecniche di denoising non lineare sono i filtri a pseudo-media, in cui invece di operare la media di tutti i pixel in una finestra, agisce sulla media del valore minimo e massimo in sottointervalli. Tecniche innovative sono invece quelle basate sulla decomposizione wavelet: man mano che ottengo immagini trasformate ottengo componenti in alta frequenza che posso eliminare senza troppa difficoltà. Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 101 L’image processing (52/52) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 102 The Gimp (1/3) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 103 The Gimp (2/3) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 104 The Gimp (3/3) Tecniche di Elaborazione Numerica di Immagine e Video – Ing. Michele Scarpiniti 105