Digitalizzione, Audio e Video - Dipartimento di Ingegneria dell
Transcript
Digitalizzione, Audio e Video - Dipartimento di Ingegneria dell
Corso di Laurea Cultura e Stilismo della Moda Esperti di linguaggi multimediali e tendenze moda Parte III e IV Rappresentazione Informazione Multimediale Formati Audio e Video Corso: Sistemi di Elaborazione Dati Docente: Ing. Ivan Bruno E-mail: [email protected] Formati per video digitali 1 Cosa è il Suono ? 31/10/2006 Sistemi di Elaborazione Dati 3 Onda Sonora { { { { 31/10/2006 Onda elastica longitudinale – trasmette energia meccanica Ha origine da una sorgente Si propaga attraverso un mezzo che viene perturbato Viene percepita da un soggetto ricevente (20 Hz < f < 20000 Hz) Sistemi di Elaborazione Dati 4 2 Forma d’Onda (Waveform) { { { Indica la variazione di pressione nel tempo. La forma d'onda più semplice: la sinusoide. Alcuni parametri sintetici di una forma d’onda sinusoidale: z z z 31/10/2006 Ampiezza (A) Periodo (T) Frequenza (f) Sistemi di Elaborazione Dati 5 Frequenza e intonazione { { { 31/10/2006 La frequenza di riferimento è quella della nota LA3, fissata per convenzione a 440 Hz. Frequenza = Altezza Da questa frequenza si ottengono quelle degli altri semitoni secondo la formula: 440x2(n/12) Sistemi di Elaborazione Dati 6 3 Analisi frequenziale { { Una forma d’onda complessa può essere scomposta in tante forme d’onda sinusoidali con diverse caratteristiche di frequenza ed ampiezza (legge di Fourier). Spettro di Frequenza 31/10/2006 Sistemi di Elaborazione Dati 7 Il Timbro { { { { { 31/10/2006 Perchè un “LA” di una chitarra ha un suono diverso da una sinusoide a 440 Hz? Perchè ha uno spettro diverso ! Cioè un diverso timbro. Quando una nota viene suonata su uno strumento viene generata la sinusoide a frequenza corrispondente alla nota, che viene chiamata armonica fondamentale, e insieme ad essa le armoniche, cioè tutti i multipli interi di quella frequenza con ampiezza inferiore. La differenza di timbro che caratterizza i vari strumenti musicali è determinata dalla diversa ampiezza delle armoniche successive alla fondamentale ! Quindi strumenti diversi che producono le stesse note generano forme d’onda diverse. Anche i rumori sottostanno alla legge di Fourier, tuttavia non vi è alcuna regolarità tra le varie sinusoidi presenti. Sistemi di Elaborazione Dati 8 4 Sovrapposizione di più suoni • In generale, se il suono varia nel tempo (ad esempio una canzone) allora la sua forma d’onda varia… e varia anche lo spettro del suono. • Questo spiega cosa fa un analizzatore di spettro. • Un equalizzatore grafico, invece modifica i suoni amplificando o attenuando l'ampiezza delle sinusoidi che li compongono 31/10/2006 Sistemi di Elaborazione Dati 9 Audio Analogico { { 31/10/2006 Il microfono converte la variazione di pressione nell’aria esercitata dalle onde sonore in una variazione di tensione elettrica. Questa a sua volta potrà essere convertita in un’altra grandezza per memorizzare il suono (es. su nastro o disco). Un altoparlante lavora in maniera analoga al microfono ma all’inverso. Sistemi di Elaborazione Dati 10 5 Audio Analogico { { In pratica, in un sistema analogico l’informazione relativa all’onda sonora è codificata nelle variazioni di un parametro continuo, come il grado di magnetizzazione di un nastro o la tensione elettrica in un filo. Inoltre, la distanza nel supporto (disco, nastro, etc.) rappresenta il tempo. z z 31/10/2006 La grandezza fisica usata per la memorizzazione è “analoga” alla pressione dell’aria. La lunghezza del supporto è “analoga” al tempo. Sistemi di Elaborazione Dati 11 Audio Analogico – Svantaggi { { { 31/10/2006 Se viene alterata la velocità con cui viene percorso il supporto allora viene alterata la forma d’onda Se il nastro o il disco si degrada allora la forma d’onda cambia. Non ho nessun modo oggettivo per valutare e individuare l’alterazione. Le degradazioni non possono essere separate dal segnale originale. Sistemi di Elaborazione Dati 12 6 Audio Digitale – Vantaggi Economico: z z z { { { { { { I circuiti digitali costano meno da fabbricare, occupano meno spazio e sono più resistenti Spazio fisico necessario per la memorizzazione I suoni diventano dati: sfrutto tecniche già usate per trattare gli altri tipi di dati La qualità di riproduzione di un sistema digitale non dipende dal supporto ma solo dalla qualità di conversione! Separo le degradazioni dal segnale originale: posso individuare e correggere gli errori! Elevata qualità nella elaborazione del segnale, senza degrado. Le tecniche di codifica e trasmissione dei segnali digitali sono più efficienti. Posso copiare l’originale senza perdita di qualità infinite volte Compromesso qualità – spazio Comodità: non devo riavvolgere il nastro! 31/10/2006 Sistemi di Elaborazione Dati 13 Digitalizzazione Audio Per rappresentare i suoni, l’onda analogica viene trasformata in digitale approssimandone in ogni punto l’andamento con numeri interi. A maggiore frequenza di campionamento, corrisponderà migliore qualità. A maggior ampiezza di variazione dei valori numerici di altezza corrisponderà ancora migliore qualità del suono. Suono onda di pressione dell’aria Cavo elettrico 1 Trasporta il segnale elettrico analogico fino al ADC Analog to Digital Converter Cavo elettrico 2 Trasporta il segnale elettrico digitale verso il computer Microfono Converte il suono in segnale elettrico Analog to Digital Converter Campionamento Segnale analogico 31/10/2006 Quantizzazione Segnale campionato Sistemi di Elaborazione Dati 10001001010001 Segnale digitale 14 7 Audio Digitale – Come funziona ? { { { 31/10/2006 Campionamento: la forma d’onda originaria viene spezzata in un numero finito di campioni (samples). Ad esempio nei CD audio vengono raccolti 44.100 campioni per ogni secondo della forma d’onda ! Il numero di campioni raccolti al secondo viene detto Frequenza di Campionamento (Sampling Rate o Frequency Resolution) Sistemi di Elaborazione Dati 15 Audio Digitale – Come funziona ? { { { 31/10/2006 Quantizzazione: ciascun valore di cui prendo nota (campione) viene tradotto in un numero che può assumere solo un numero finito di valori. Es: esprimo l’ampiezza della forma d’onda con 256 possibili valori. Æ mi servono 8 bit Il numero di possibili valori che utilizzo per esprimere l’ampiezza determina la risoluzione in bit (bit depth). Sistemi di Elaborazione Dati 16 8 PCM – Pulse Code Modulation { 31/10/2006 La tecnica di conversione analogico – digitale appena vista prende il nome di Pulse Code Modulation. Sistemi di Elaborazione Dati 17 Riproduzione Audio Digitale { { { 31/10/2006 Lasciamo che il fiume riempia il bacino (cioè, che i dati audio caricati riempiano il buffer) … Quando il bacino è pieno, anche se il flusso d’acqua in ingresso (i dati audio) è discontinuo, possiamo comunque prelevare acqua in uscita in modo continuo (cioè ascoltare l’audio senza interruzioni) Sistemi di Elaborazione Dati 18 9 PRODUZIONE DEL SUONO Esiste anche il processo inverso, che trasforma l’informazione da digitale ad analogica. Nel caso del suono questo compito è svolto dal D.A.C. (Digital to Analog Converter) che trasforma il segnale digitale in segnale elettrico analogico; tale segnale viene successivamente trasformato in onda sonora dalle casse acustiche. Cavo elettrico 1 Trasporta il segnale elettrico digitale verso il DAC Digital to Analog Converter Cavo elettrico 2 Trasporta il segnale elettrico analogico fino alla cassa Suono onda di pressione dell’aria Cassa Acustica Trasforma il segnale elettrico analogico in suono 31/10/2006 Sistemi di Elaborazione Dati 19 Formato WAV { { { { { 31/10/2006 Basato sulla codifica PCM (Pulse Code Modulation), che memorizza i campioni a intervalli di tempo costante All’aumentare della qualità del suono riprodotto aumenta la dimensione del file generato Equivale al BMP per le immagini (raster) Qualità variabile: da 44Khz, 16 bit, stereo per i cd musicali a 8Khz, 8 bit, mono. Non compresso: è il formato usato per la musica su CD. Sistemi di Elaborazione Dati 20 10 Cosa è possibile fare con un PC ? { { { { { { { { { 31/10/2006 A/D (conversione analogico-digitale) Recording Audio Processing (equalizzazione, effetti, DSP, …) Comporre musica Mixare più tracce / Sincronizzarle / Loop Codifica e conversione tra vari formati Riproduzione (D/A) Aggiungere il suono a Video / Presentazioni / prodotti multimediali.. Digital Radio Sistemi di Elaborazione Dati 21 Quali sono le parti coinvolte ? { { { { { { 31/10/2006 Scheda Audio PC Strumenti e Microfoni (non indispensabili) Supporti (CD – DVD – HD ...) Monitor (Casse o Cuffie !) Software (programmi, filtri, codec, sample, etc..) Sistemi di Elaborazione Dati 22 11 La scheda audio { { { { Mixer A/D D/A Interfaccia MIDI 31/10/2006 Sistemi di Elaborazione Dati 23 Codec: COdifica/DECodifica Audio { { La codifica PCM è detta non compressa Problemi di trasmissione e memorizzazione: z z { Nasce l’esigenza di codificare riducendo l’impiego di memoria utilizzando codifiche con compressione: z z 31/10/2006 Bitrate: 1 sec. di musica stereo codificata in PCM qualità CD: 2 x 16 bit x 44100 = 1400000 bit !! (circa 1.4Mbps) 5 min = 300s x 1.4Mbps = 420 Mb = 52 MB Codec compressi lossless Codec compressi lossy Sistemi di Elaborazione Dati 24 12 Codec e File Format { { { { Un “audio file format” è uno specifico formato di file in cui memorizzare dati audio. Il file format è un contenitore, può supportare differenti codec oppure uno solo. Per questo spesso si confondono codec e file format.. Es. file di tipo WAV, AIFF, AU memorizzano dati non compressi (in PCM) Es. file AVI memorizzano sia video che audio, entrambi codificabili con diversi tipi di codec 31/10/2006 Sistemi di Elaborazione Dati 25 Codec compressi { Lossless: z z { Lossy: z z z z z z z z 31/10/2006 Monkey’s Audio (file .APE) FLAC Free Lossless Audio Codec MP2 MP3 Ogg Vorbis (open and free codec, alcuni trovano più piacevole la maniera in cui codifica l’audio quando la perdita di informazione è percepibile..) MPEG-4 AAC (considerato il successore di mp3, supporta frequenze di campionamento più elevate, supporta fino a 48 canali, più efficiente, migliore qualità a parità di bitrate) MPC Musepack (open and free, problemi di brevetti..) Real Audio Windows Media Audio (.ASF .WMA) AC-3 (Dolby Digital) (supporta mono/stereo/5.1, utilizzato nei dvd, nella tv digitale e nel cinema con pellicole da 35mm, inferiore ad AAC, DD-Plus is coming..) Sistemi di Elaborazione Dati 26 13 Psicoacustica { { { { { { 31/10/2006 Descrive quanto la nostra capacità di udire sia limitata in termini temporali, frequenziali e spaziali Le caratteristiche del segnale originale non percepibili dall’utente medio si dicono mascherate La qualità è completamente soggettiva e può essere testata solo attraverso prove di ascolto In presenza di un segnale con uno spettro molto complesso, l’orecchio subisce un effetto di mascheramento di alcune bande rispetto ad altre L’orecchio umano ha una risoluzione frequenziale finita, cioè non è in grado di distinguere tra due toni troppo prossimi in frequenza Come conseguenza (diseguaglianza di Heisenberg) l’orecchio umano ha una risoluzione temporale finita Sistemi di Elaborazione Dati 27 Psicoacustica { { { 31/10/2006 Come ulteriore esempio: brevi interruzioni di un tono continuo sono difficili da individuare Come conseguenza della finita risoluzione temporale si ha che il mascheramento può anche avvenire per un tono mascherante che inizia dopo e cessa prima di quello mascherato Questo effetto viene detto forward e backward masking Sistemi di Elaborazione Dati 28 14 La codifica percettiva { { { 31/10/2006 E’ basata sul mascheramento uditivo Il mascheramento causa una minore sensibilità dell’apparato uditivo (orecchio/cervello) nei confronti del suono ad una frequenza in presenza di un suono ad una frequenza prossima Se un tono è presente in ingresso all’apparato uditivo, maschererà i segnali di potenza inferiore e localizzati, in frequenza, in sua prossimità Sistemi di Elaborazione Dati 29 La codifica percettiva { { { 31/10/2006 La proprietà di mascheramento può essere utilizzata per quantizzare in modo più grossolano i toni mascherati Quantizzazione più grossolana Æ Minor numero di bit necessari per codificare la stessa informazione Æ Guadagno di codifica Si ha un aumento della distorsione di quantizzazione permesso dalla presenza del tono mascherante Sistemi di Elaborazione Dati 30 15 MP3 { { { { Nato nel 1992 da studi condotti dal gruppo di MPEG Acronimo di MPEG 1 Audio Layer 3 Usato per la condivisione di file audiovideo sul web Si basa sul principio di esclusione dalla codifica delle frequenze teoricamente non percepite dall’udito umano: z z non sensibile a alte frequenze non comprende chiaramente le basse frequenze se coperte da altre 31/10/2006 Sistemi di Elaborazione Dati 31 MP3 { { { { 31/10/2006 Un’orecchio esperto può comunque notare la diversità del suono codificato in MP3 rispetto l’originale. C’è però una diminuzione dello spazio occupato notevole (anche di 1:12 rispetto l’originale). Codifica a 32 kbps – 605 KB Codifica a 320 kbps – 5.93 MB Sistemi di Elaborazione Dati 32 16 MP3 { La qualità di un file MP3 dipende da: z z z { { { 31/10/2006 bitrate tipo di codifica difficoltà con la quale il segnale viene codificato In generale si ottiene una qualità discreta al di sopra dei 128 kbit/s che è più o meno quella di un cd audio (sempre senza tralasciare il tipo di codificatore). Ad oggi vi sono molti codificatori MP3 poiché non c’è uno standard unico (decodifica e formato sono invece ben definiti). Il migliore al momento è LAME ad alti bitrate e Fraunhofer a bassi bitrate. Sistemi di Elaborazione Dati 33 MIDI - Musical Instrument Digital Interface { { { { { 31/10/2006 Standard di comunicazione digitale Max 16 strumenti Æ Politimbrica e polifonia Comandi (nota, velocity, aftertouch, vibrato, volume, …) Qualità dipendente dal riproduttore File piccoli (anche 10KB/min) Sistemi di Elaborazione Dati 34 17 MIDI { { { { Interfaccia MIDI Sequencer (diverse viste) Generatore di Suoni (sound table, SWsynth, synth, sampler, drummachine) MIDI Controller 31/10/2006 Sistemi di Elaborazione Dati 35 Formati Audio Encoding (voce) ITUITU-T G.711 ITUITU-T G.728 • Pulse Code Modulation • Low Delayelay-Code Excited Linear Prediction • Banda:300Banda:300-3400Hz • Banda:300Banda:300-3400Hz • 8 kHz sample rate • Bit Rate: 16Kb/s • 8 bits per sample • Multiulti-Pulse Maximum Likelihood Quantization • Bit Rate: 56/64Kb/s • Banda:300Banda:300-3400Hz • Bit Rate: 5.3/6.3Kb/s ITUITU-T G.723.1 ITUITU-T G.729 • Complementary Symmetryymmetry-Algebraic Code Excited Linear Prediction • Banda:300Banda:300-3400Hz • Bit Rate: 8Kb/s • Adaptive Differential Pulse Code Modulation ITUITU-T G.726 • Banda:300Banda:300-3400Hz ITUITU-T G.722 • Sub Band - Adaptive Differential Pulse Code Modulation • Banda: 5050-7000Hz • Bit Rate: 48/56/64Kb/s 31/10/2006 GSM • Bit Rate: 8Kb/s • Regular Pulse Exitation - Long Term Prediction) rediction) • Banda:300Banda:300-3400Hz • 13Kb/s Sistemi di Elaborazione Dati 36 18 Formati Audio Encoding MIDI • Musical Instrument Digital Interface Wave • contengono istruzioni che comunicano alla scheda audio di modulare la frequenza in modo da produrre una particolare nota che abbia una timbrica simile a quella dello strumento in questione e che duri una certa quantità di tempo. • variante MS dell’AIFF (Apple (Apple)) • nessuna compressione • max qualità • poco efficiente • estensioni: .wav MOD, XM, IT,S3M • varianti del MIDI • contegono campioni degli strumenti originari AIFF • Audio Interchange File Format • nessuna compressione • max qualità • poco efficiente • estensioni: .aif ief, ief, AAC • Advanced Audio Coding • Mpeg Layer 2 MP3 AC3 • Mpeg Mpeg Layer 3 • fattore di compressione tipico 12:1 • compressione Psicoacustica • estensioni: .mp3 • Dolby ACAC-3 Audio Coding rev. 3 • Home theatre 5+1 canali audio • sinonimi: surround sound, 3D sound. 31/10/2006 Sistemi di Elaborazione Dati 37 Fasi del processo di Digitalizzazione (Workflow) Acquisizione Audio Indicizzazione Identificazione dei contenuti Produzione Pubblicazione Acquisizione altri documenti multimediali Controllo e gestione del workflow 31/10/2006 Sistemi di Elaborazione Dati 38 19 Distribuzione delle fasi di Digitalizzazione Computer di tipo A - Acquisizione SERVER Gestione ……… Log.X LS DoA .XLS DoA.XLS => DoA.XML ETHERNET Verifica Consistenza HUB 10/100 ……… Computer di tipo C Elaborazione Versioni Realizzazione di versioni a bassa/alta definizione 31/10/2006 Copia #2 1001011 0101010 WAV + DoAX Copia #1 Computer di tipo B Produzione ML COPIA MASTER Sistemi di Elaborazione Dati 39 Formati per video digitali 20 Conversione analogico-digitale di video { Un video è una sequenza di immagini (fotogrammi) accompagnata da un suono il processo di digitalizzazione può essere considerato una estensione di quello descritto per le immagini, sommato e sincronizzato con quello descritto per il suono z { In realtà la riproduzione digitale di un video è molto complessa si deve tener conto di molti fattori, ad es. la velocità di trasferimento delle informazioni dalla memoria del computer al monitor z Compressione: { Il formato digitale di audio, immagini e video è estremamente “pesante”: Esempio: una immagine di 640x480 pixel a 256 colori occupa 307.200 byte (2457600 bit) e richiede 55,10 sec per essere trasmessa con un modem a 44.600 bps z { E’ necessario applicare tecniche di compressione che permettono di alleggerire il peso di audio, immagini e video in formato digitale, senza ridurne in maniera percettibile la qualità 31/10/2006 Sistemi di Elaborazione Dati 41 Le dimensioni dei file video { 1 sec di filmato z z z Di dimensione 640x480 30 frames a colori al sec Profondità di colore a 3 bytes (RGB in True Color) 640x480x30x3 = 27.648.000 bytes (~27MB) 31/10/2006 Sistemi di Elaborazione Dati 42 21 31/10/2006 Sistemi di Elaborazione Dati 43 Formati Video Encoding ITUITU-T H.261/263 Divx • n x 64Kb/s, 1< n <30 • basato su Meg4 • ISDN • indee: indee: mpeg1,2, quicktime • Common Intermediate Format: • (f)Cif (288 linee x 352 pixel) • QCIF (176 linne x 144 pixel) • 4CIF (704 linee x 576 pixel) • Altissimi fattori di compression JPEG • Joint Photographic Expert Group • Standard nel 1992. MPEG • lossy compression algorithm • Motion Picture Expert Group AVI • Audio Video Interleave • proprietario MS • mpeg1 (qualità VHS) • mpeg2 (qualità DVD) • Evoluzioni: mpeg4 • standar compressione: RLE, Indeo, Indeo,Cinepak 31/10/2006 Sistemi di Elaborazione Dati QuickTime • proprietario Apple • standar compressione: Cinepak, Cinepak, JPEG, and MPEG. 44 22 Streaming su Internet E’ un’applicazione che permette la trasmissione video da un server a un client attraverso la rete internet. Un video deve poter essere visualizzato immediatamente senza che tutto il file sia stato scaricato, inoltre audio, video e testo devono avere una corretta sincronizzazione. Per poter usufruire dello streming è necessario che il client installi un apposito software. Se diversi client accedono contemporaneamente agli stessi dati video di un server, la banda utile disponibile diminuisce. La qualità del video è misurabile a partire da parametri fissi quali frame-rate, dimensione e qualità della figura, rumore, ecc. Per l’interazione con l’utente è necessario disporre di comandi per il controllo del flusso come Fast Forward, Fast Riverse, Pause e Play, a cui è possibile accedere grazie a pulsanti visualizzati sulla linea di comando del web browser. Se c’è del testo associato al video, deve essere cliccabile per fornire collegamenti. 31/10/2006 Sistemi di Elaborazione Dati 45 Streaming - Standard di fatto I sistemi più diffusi per realizzare streaming sono: { Apple (IPv6 Ready!) z z z z z z { Microsoft (IPv6 Ready!) z z z z { Streaming server: Windows Media Server (incluso in Windows server2003) Encoder: Windows Media Encoder Player: Windows Media Player o Mplayer. Formati trasmessi .wmv .asf Real Networks z z z z 31/10/2006 Streaming server: Quick Time Streaming Server (Free), Darwin server (Free). Encoder: Quick time Broadcaster (Free), VLC Encoder multipiattaforma (Free). Player: Quick time (Free). Formati trasmessi .mov e MPEG-4. Streaming Server: Helix Universal Server (Commerciale $$$) Encoder: Real Producer (~100-150€) Player: Real Player (free). Formati trasmessi: .rm, .wmv, .asf .MPEG-4 Sistemi di Elaborazione Dati 46 23 Formati streaming ASF REAL Standard de facto Il formato utilizzato da Microsoft per la distribuzione di filmati via streaming: streaming: Advanced Streaming Format (ASF). ASF). Sviluppato appositamente dalla casa di Redmond per il Web sin dal 1995, è diventato uno dei principali formati di web streaming disponibili oggi sul mercato. Per poter utilizzare il formato Microsoft è necessario utilizzare un server specifico che supporti la distribuzione di file ASF e uno specifico lettore, il noto Windows Media Player che proprio in questi ultimi giorni è giunto alla versione 9. RealNetworks ha integrato nella piattaforma di streaming anche una particolare tecnologia chiamata SureStream. In poche parole si tratta di una modalità che è in grado di adattare alla velocità del collegamento il flusso di dati in modo da renderlo scalabile anche in previsione di una calo di prestazione della connessione. QuickTime • proprietario Apple • standar compressione: Cinepak, Cinepak, JPEG, JPEG, and MPEG. 31/10/2006 Sistemi di Elaborazione Dati 47 Compressione video coder 31/10/2006 Sistemi di Elaborazione Dati 48 24 Prima idea: M-JPEG JPEG coder JPEG coder M-JPEG JPEG coder JPEG coder 31/10/2006 Sistemi di Elaborazione Dati compressione insufficiente: insufficiente: non viene sfruttata la ridondanza temporale (frame consecutivi possono essere anche molto simili fra loro) 49 Compressione Video { { { Generalmente le sequenze video contengono un elevato grado di ridondanza Due immagini successive di una sequenza video tendono, tipicamente, a differenziarsi poco Per sfruttare questo forte legame tra elementi successivi, sono stati proposte due tecniche: z z 31/10/2006 La tecnica del rimpiazzamento condizionato (ridondanza spaziale - intra frame) La tecnica della compensazione del movimento (ridondanza temporale - inter frame) Sistemi di Elaborazione Dati 50 25 Compensazione del movimento { { { { 31/10/2006 Segmentata l’immagine in elementi più semplici da trattare, detti macroblocchi, si valuta qual è la migliore approssimazione del macroblocco corrente nell’immagine di riferimento Il movimento viene rappresentato e codificato con un vettore di movimento Dell’immagine attuale viene codificata la correzione con tale approssimazione Intuitivamente è come se si codificasse il movimento degli oggetti nella successione di immagine Sistemi di Elaborazione Dati 51 MPEG MPEG (Moving Picture Expert Group Moving Picture Expert Group) ISO/IEC ISO/IEC JTC1 SC29 WG11 { { { { { { { 31/10/2006 Una famiglia di standard Da MPEG-1 a MPEG-4 video (e audio) MPEG-7 “Multimedia Content Description Interface” MPEG-21 "Multimedia Framework“ Si tratta di modalità di rappresentazione e relativi algoritmi di decodifica. Scopo: maggiore compressione senza compromettere la qualità. La decodifica può essere fatta via software o via hardware. Sistemi di Elaborazione Dati 52 26 Compressione MPEG Evoluzione: MPEGMPEG-1 permettere video da CDCD-ROM (circa 1.2 Mbps) Mbps) MPEGMPEG-2 video di grandi dimensioni per HDTV MPEGMPEG-4 trasmissione su mezzi a bassa banda (< 64Kbps) MPEGMPEG-7 descrizione ad alto livello dei contenuti MPEGMPEG-21 futuro 31/10/2006 Sistemi di Elaborazione Dati 53 Struttura MPEG-1 e -2 • parte VIDEO la vedremo nel seguito • parte AUDIO es. MPEG Layer3 = MP3 • parte SYSTEM come i vari flussi possono essere separati (demultiplexati (demultiplexati)) e sincronizzati fra loro • parte Conformance definisce una serie di test per verificare se una particolare implementazione è conforme allo standard 31/10/2006 Sistemi di Elaborazione Dati 54 27 Compressione MPEG - Video { { { { 31/10/2006 Si basa sul fatto che l’occhio non distingue cambiamenti di colore ad alta frequenza spaziale, e frame successivi hanno generalmente zone comuni. L’immagine viene trasformata come nel JPEG, generando gli intra-frames (I frames) Viene usato lo spazio di colore YCbCr. L’immagine è discretizzata e quantizzata: perdita di dettagli. Sistemi di Elaborazione Dati 55 Compressione MPEG - Video { { { { 31/10/2006 Fa uso della compensazione del movimento L’immagine è suddivisa in blocchi Viene ricercata la corrispondenza tra i blocchi nei frames successivi. Sono conservati i parametri del moto dei blocchi (P e B frames) Sistemi di Elaborazione Dati 56 28 Compressione MPEG - Video Tre tipi di frame: • I-frame immagini complete (come se fossero JPEG) • P-frame ricavabili da frame precedenti opportunamente modificati • B-frame possono dipendere sia da frame precedenti, sia da frame successivi (predizione bidirezionale) P B B 31/10/2006 I B B P B B Sistemi di Elaborazione Dati I 57 Compressione MPEG - Video { { P e B frames sono soggetti ad errori: hanno bisogno di altri frame per ricostruirli. Si può selezionare ogni quanti frame mettere un I frame (funziona da key-frame), normalmente è presente ogni 12 frame. z z 31/10/2006 diminuisce però la compressione. L’ordine ed il numero di P e B frame è deciso dall’encoder. Sistemi di Elaborazione Dati 58 29 Compressione MPEG - Video 31/10/2006 Sistemi di Elaborazione Dati 59 Predizione temporale 16x16 16x16 16x16 16x16 8x8 R G I-frame 31/10/2006 B Y 8x8 YCbCr 4:2:0 Cb Cr P-frame Sistemi di Elaborazione Dati 60 30 Motion Estimation - 1 { { { { { { Una volta codificata un’immagine di riferimento come spiegato prima (I-Frame) si cercano similarità con i frames adiacenti; Innanzitutto controllo che il macroblocco in esame non sia rimasto identico (o quasi) nel frame successivo, nel qual caso non lo invio Altrimenti, cerco nelle vicinanze per identificare se si è mosso. Se lo trovo, invio un vettore di movimento Codifico secondo lo schema visto in precedenza solo se non ho trovato il macroblocco da nessuna parte nel frame; Se sono tra una I e una P-Picture, interpolo i vettori di movimento; Non è la panacea, però. Se commetto un piccolo errore e calcolo i frames successivi solo partendo dal precedente, l’errore si propaga rapidamente. 31/10/2006 Sistemi di Elaborazione Dati 61 Motion Estimation - 2 Ricerca dei blocchi corrispondenti per la compensazione del moto 31/10/2006 Sistemi di Elaborazione Dati 62 31 MPEG-4 Requisiti: • Interattività; • VLBR Video - Migliore compressione; • 3D scenes; • Non-rectangular elements; • Robustezza; • Scalabilità; • Editing; • Random-Access; • Hybrid, Natural and Synthetic Data coding. 31/10/2006 Sistemi di Elaborazione Dati 63 Altri standard MPEG 4 per multimedia interattivi, GUI, Ambienti virtuali, TV Digitale HDTV, dati grafici/audio/video, WWW, Internet, ISDN, cavo, .... computer TV/film MPEG-4 telecomunicazioni 31/10/2006 Sistemi di Elaborazione Dati 64 32 Altri standard MPEG 7 • Multimedia content description interface: − descrizione standard di material multimediale: immagini, testo, grafica, modelli 3D, audio, parlato, etc... − espressioni facciali, caratteristiche personali; • consente ricerca e reperimento: − ricerca testuale e per contenuto; • compatibile con standard per disegni e documenti, es. PDF. 31/10/2006 Sistemi di Elaborazione Dati 65 Altri standard MPEG-7 - applicazioni: • digital library - video, grafica, musicale, .... • multimedia directory service • broadcast media selection, canali radi e TV • multimedia editing, media authoring 31/10/2006 Sistemi di Elaborazione Dati 66 33 Atri Formati Grafica vettoriale { { { { { { La grafica vettoriale definisce le immagini costruendo dei modelli di oggetti fatti di figure geometriche semplici (linee, curve e poligoni) i dati dell’immagine vengono tradotti in formule matematiche che contengono tutte le istruzioni necessarie per tracciarla E’ una grafica orientata agli oggetti dove ogni oggetto è composto da singoli elementi ognuno dei quali è caratterizzato da una serie di proprietà (dimensione, posizione, etc…) Ogni oggetto può essere facilmente modificato I file delle immagini vettoriali sono molto più leggeri rispetto alle immagini bitmap e possono essere manipolati senza diminuirne la qualità Un'immagine vettoriale si può raffigurare a qualsiasi risoluzione: z 31/10/2006 Si può ingrandire o rimpicciolire a piacimento mantenendo inalterate nitidezza e definizione Sistemi di Elaborazione Dati 68 34 Grafica vettoriale { SW per la creazione e la modifica di immagini vettoriali: z z z { CorelDraw Adobe Illustrator Macromedia Freehand Alcuni formati vettoriali z .cdr (CorelDraw) .ai (Adobe Illustrator) .fh (Freehand) .swf (ShockWave Flash) z .svg (Scalable Vector Graphics) z z z { { { { { 31/10/2006 il formato di Macromedia Flash formato standard del W3 Consortium, creato nel 1999 è visualizzabile dai browser ma necessita del plug-in Adobe SVG Viewer come il formato di Flash, permette di creare delle animazioni si basa sul linguaggio XML Sistemi di Elaborazione Dati 69 Formati ibridi { Sono usati sia per le immagini vettoriali che raster z { Principali standard della Adobe z z 31/10/2006 Consentono di memorizzare testo e immagini EPS (Encapsulated Postscript) utilizzato nel campo della stampa professionale PDF (Portable Document Format) E' il formato visualizzabile con Adobe Acrobat Reader Sistemi di Elaborazione Dati 70 35 Il formato EPS { { { { { { 31/10/2006 Consente l’archiviazione di una immagine, intesa in senso più ampio, come insieme di testo e figure Le immagini EPS sono descritte nel linguaggio PostScript (PS), sviluppato per descrivere le pagine di un documento in cui siano presenti sia dati vettoriali che dati raster La rappresentazione del documento risulta indipendente dal dispositivo di stampa o di visualizzazione Il formato EPS fornisce una rappresentazione definitiva dell’immagine, che non può essere modificata dall’applicazione con cui il file viene interpretato (stampante o programma di videoscrittura) supporta le gestioni di colore RGB, CMYK non supporta il canale alfa (il canale della trasparenza) Sistemi di Elaborazione Dati 71 Il formato PDF { { { 31/10/2006 È un’evoluzione del modello di rappresentazione PostScript per descrivere testo e immagini indipendentemente dai dispositivi PDF è un formato con una struttura più ricca ed articolata di EPS Include oggetti che non fanno parte del documento ma che sono utili per una visione interattiva (note, collegamenti ipertestuali,…) Sistemi di Elaborazione Dati 72 36 31/10/2006 Sistemi di Elaborazione Dati 73 37