Il Formato MPEG - Associazione Innovit Onlus

Transcript

Il Formato MPEG - Associazione Innovit Onlus
2. I formati MPEG
Perché i film registrati su supporti digitali come DVD o VideoCd sono compressi? Lo sono in quanto se si
registrasse un film di 135 minuti senza compressione, occorrerebbe un elevatissimo bitrate di 167 megabit/s,
pari a 117 Gigabyte per un film da 1 ora e 40 min. Su un DVD-R da 4.7 Gigabyte non entrerebbero più di 4
minuti di film.
Il problema è stato affrontato con le sofisticate tecniche di compressione offerte dalla codifica MPEG
derivante dagli studi del Motion Picture Expert Group.
La prima versione MPEG1 consente una registrazione a risoluzione di 352x288 pixel con una qualità di
immagine simile a quella di una cassetta VHS, MPEG1 è usato ad esempio per la realizzazione di VideoCd.
La codifica MPEG usa un algoritmo che analizza i dati corrispondenti alle immagini video selezionando le
ripetizioni o ridondanze nell'immagine rispetto ad un fotogramma campione. Tali ridondanze rappresentano
oltre il 95% dei dati digitali relativi ad un segnale video e, dopo averle compresse si provvede a memorizzare
le variazioni significative per la corretta restituzione del filmato.
Il codec MPEG2 funziona svolgendo il processo in più fasi, due delle quali sono le più importanti: nella
prima viene analizzata la complessità del video da comprimere; nella seconda il codec procede alla
compressione adattandola alla complessità delle informazioni. Con l'impiego di questa tecnica, la banda
passante e la quantità di informazioni generata, viene ridotta in media del 30% rispetto ad un sistema di
compressione ad indice fisso.
La sigla CoDec sta per Compressore-Decompressore, in altre parole è un software che indica al programma
che registra il filmato (l'encoder) con quale algoritmo comprimere i dati e al successivo programma che lo
dovrà visualizzare (il Player) come decomprimere i vari fotogrammi.
Con l'introduzione del codec MPEG4 l'algoritmo di compressione è stato ulteriormente migliorato grazie a
tecniche frattali che riducono il fenomeno della blocchettizzazione, delle alterazioni cromatiche e della
sfocatura permettendo così una compressione da 4 ad 8 volte maggiore del MPEG2 con una perdita
qualitativa limitata. Attualmente questo codec sta avendo un successo notevolissimo grazie alla diffusione
gratuita consentita del formato DivX che altro non è che una versione modificata e migliorata del codec
MPEG4 di Microsoft.
2.1 Gli standard definiti
Moving Picture Experts Group
L'MPEG, acronimo dell'inglese Moving Picture Experts Group, designazione ISO/IEC JTC1/SC29 WG11, è
un gruppo di lavoro dell'ISO/IEC che cura la definizione di un insieme di standard di codifica di flussi dei
dati audio/video. Il gruppo si riunisce per la prima volta nel maggio 1988 a Ottawa in Canada col fine,
successivamente raggiunto, di creare degli standard globalmente diffusi.
Gli standard definiti dall'MPEG sono i seguenti:
MPEG-1: utilizzato nel Video CD (un formato a bassa qualità, analoga al sistema VHS);
MPEG-2: utilizzato nella televisione digitale satellitare, nel DVD-Video, nella televisione digitale terrestre.
Ha una qualità superiore all'MPEG-1 ma richiede per contro una maggior quantità di risorse;
MPEG-3: inizialmente sviluppato per l'HDTV, in seguito si è scoperto che l'MPEG-2 era sufficiente per
l'HDTV quindi questo nuovo standard venne abbandonato;
MPEG-4: estensione dell'MPEG-1 in grado di gestire flussi audio/video eterogenei, contenuti 3D, flussi
video a basso bitrate e diritti digitali. Per la codifica video supporta il formato MPEG-2 oppure un nuovo
codec molto efficiente chiamato MPEG-4 AVC/H.264;
MPEG-7: un sistema formale per descrivere i contenuti multimediali;
MPEG-21: nato per sviluppare una piattaforma comune per le future applicazioni multimediali.
2.2. Gli algoritmi
Gli algoritmi sviluppati dal gruppo MPEG sono tutti algoritmi a perdita di informazione (lossy). La tecnica
impiegata è la seguente:
1
•
•
•
il flusso video viene campionato, viene ridotto a segmenti;
i segmenti vengono elaborati per estrarne le informazioni fondamentali (tecnica lossy);
le informazioni vengono codificate con algoritmi di compressione non a perdita di informazione
(lossless).
Il gruppo di standardizzazione non rilascia le specifiche su come debba essere realizzato il codificatore o il
decodificatore MPEG. Il gruppo rilascia le specifiche che indicano come debba essere composto il formato
del file MPEG in modo che ogni costruttore possa realizzare il codificatore e il decodificatore come meglio
crede pur attenendosi al formato del file definito dal consorzio MPEG.
2.3 Il metodo di campionamento del segnale audio
Il formato predecessore WAV, utilizza una codifica PCM che occupa una notevole quantità di spazio, circa
1.5 Mb/s a 48 kHz. Un modo per ridurne l'occupazione è utilizzare meno bit per rappresentare i campioni
ma, così facendo il suono riprodotto è di qualità scadente.
Una possibile soluzione è rappresentare il segnale nel dominio delle frequenze e poi campionarlo con pochi
bit, in questo modo c'è una perdita di fedeltà molto minore.
La trasformazione nel dominio delle frequenze viene effettuata da MPEG tramite un banco di filtri che
scompone il segnale in 32 sottobande d'uguale ampiezza. Questo approccio non rispecchia il modello
percettivo umano; infatti, gli studi effettuati dimostrano che sarebbe più corretto dividere la banda di
frequenze in 26 parti di dimensioni crescenti con andamento di tipo logaritmico.
Due suoni con frequenza diversa ma all'interno della stessa banda sono percepiti come identici. Il punto di
confine fra due bande è chiamato banda critica. Il nostro orecchio è più sensibile alle variazioni in basse
frequenze, qui sono sufficienti poche decine di hertz per farci percepire due suoni come diversi, mentre alle
alte frequenze sono necessarie migliaia di hertz. In difesa della decisione presa da MPEG vi è però la
complessità dell'operazione di trasformazione, infatti il numero di operazioni elementari da compiere nel
caso di sottobande con larghezza fissa è elevato ma accettabile (alcune migliaia di prodotti e somme), mentre
nel caso di sottobande con larghezze diverse la complessità aumenta notevolmente e se in fase di codifica
questa può essere trascurata, così non accade in fase di decodifica, fase che deve essere eseguita in tempo
reale.
Va inoltre ricordato il periodo storico in cui questa scelta è stata effettuata, se oggi un carico di lavoro simile
è accettabile per un normale computer così non era alla fine degli anni ottanta, è dunque probabile che in
futuro il modello a sottobande variabili venga implementato.
2.3.1. Modello percettivo
Elaborare il segnale nel dominio delle frequenze offre anche altri vantaggi. Il nostro orecchio non è uno
strumento lineare, cioè non percepisce tutti i suoni e soprattutto non li percepisce tutti nello stesso modo. Da
qui l'idea di eliminare tutte quelle componenti frequenziali che non possiamo udire. Questa è ovviamente una
tecnica lossy: il suono compresso sarà diverso da quello originale ma i nostri sensi non riusciranno a
percepirne la differenza. Si rende quindi necessario uno studio sul modello percettivo, cioè sulla percezione
umana del suono. La banda di frequenze udibili va dai 16 Hz fino a 20 kHz. Nel modello MPEG-1 il primo
taglio in frequenza viene effettuato eliminando le frequenze troppo basse o troppo alte. Affinché un suono sia
2
percepibile deve essere sufficientemente forte, cioè deve esercitare un livello minimo di pressione sulla
membrana del timpano dell'orecchio, tuttavia tale soglia non è costante ma, varia in funzione della frequenza.
In figura è riportato un grafico qualitativo che mostra quale deve essere la pressione minima che un suono
deve avere per poter essere percepito. Nelle ascisse (in scala logaritmica) ci sono le frequenze, mentre nelle
ordinate ci sono i livelli di pressione sonora (in dB). Tutti i suoni che si trovano nella zona grigia possono
essere eliminati.
A questo va aggiunto che la percettività del suono non è costante nel tempo, ma varia in funzione di ciò che
ascoltiamo. In pratica un tono forte copre i suoni d'intensità minore, non solo ad una determinata frequenza
ma anche in quelle vicine, infatti come tutti i sensori, l'orecchio non ha tempi di reazione nulli cioè impiega
un certo tempo per adattarsi alle nuove condizioni e soprattutto impiega tempo a tornare in quiete dopo una
sollecitazione.
Affinché un suono sia percepito è dunque necessario che si mantenga per un certo tempo senza disturbi.
MPEG-1, in considerazione dei fattori sopra citati, filtra Il suono digitale utilizzando una maschera detta
Global Masking Threshold o soglia d'udibilità dinamica, che elimina la parte dell'informazione che per
l'orecchio umano è ininfluente.
2.4. DivX Il DivX® è una tecnologia multimediale di cui fa parte tra l'altro un celebre compressore video
sviluppato da DivX Inc. ed utilizzato da circa 200 milioni di persone nel mondo. Grazie a questa tecnologia, DivX Inc.
ha creato un ecosistema che permette di usufruire in modo più immediato del video digitale. Di tale ecosistema fanno
parte, oltre ad applicazioni (software) per computer, anche lettori DVD/DivX e macchine fotografiche digitali.
Attraverso l'apposito codec è possibile riprodurre e creare file video di questo formato. La particolarità del DivX, oltre
alla sua presenza in parecchi prodotti di elettronica di consumo, sta nella sua versatilità nel produrre file di dimensioni
ridotte di filmati di lunga durata, lasciando pressoché inalterata la qualità dell'immagine. In pratica, con le opportune
impostazioni, è possibile convertire un film DVD di 6-8 Gigabyte in un file DivX di 700 MB (la dimensione di un cd
rom) con una qualità video e audio più che discrete. Per questo motivo è stato al centro di controversie per il suo
utilizzo nella duplicazione e distribuzione di DVD protetti.
2.4.1.La storia Nel 1997, la Microsoft inizia a sviluppare un innovativo sistema di compressione video. Il suo
obiettivo è creare un file video di ottima qualità e di ridotte dimensioni, da destinare allo streaming e alla diffusione
nella rete. Tuttavia, la ristretta banda delle connessioni Internet e l'impossibilità di sfruttare il già creato formato Mpeg,
si schierano come un ostacolo insormontabile. Dopo circa un anno, gli sviluppatori dell'azienda di Seattle realizzano il
sistema di compressione Div (Digital Internet Video) che fu chiamato MPEG-4 (codename Windows Media Video V3) e
scherzosamente definito l'Mp3 del video. Fu deciso di associare a questo tipo di file l'estensione ASF (Advanced
Streaming Format) e, di conseguenza, nel codec fu integrata la funzione AVI Lock, in modo da impedire la creazione di
file video AVI. Nonostante gli sforzi dei programmatori, i risultati furono, però, pessimi: l'immagine, in particolare
nelle scene molto movimentate, tendeva a rovinarsi in modo ben visibile. Dunque, il progetto fu abbandonato (verrà
ripreso per creare il formato WMV).
2.4.2. Nasce il DivX Nel 1998, un hacker francese di nome Jerome Rota (allora conosciuto in rete come Gej),
deluso dal formato ASF e interessato all'idea di creare un formato video adatto alla diffusione in rete, decide di estrarre
il codice sorgente dal codec. Nell'estate del 1999, grazie all'aiuto dell'hacker tedesco Max Morice, ci riesce e viene a
conoscenza dell'algoritmo di compressione che è il cuore dell'Mpeg-4. Come prima modifica, annullano il sistema AVI
Lock, permettendo, così, la realizzazione di file AVI in formato Mpeg-4. Successivamente, integrano un sistema per
riprodurre l'audio nel formato Mp3: una modifica che, nella sua semplicità, permette di ridurre ulteriormente le
dimensioni finali del file video. Jerome decide di chiamare il codec DivX ;-) (includendo nel nome una emoticon
sorridente, con riferimento sarcastico al fallimento del Div di Microsoft).
In seguito attraverso miglioramenti e trasformazioni si è arrivati alla versione attuale del software.
3

Documenti analoghi

codec-formati

codec-formati riprodurre filmati, slideshow e file audio attraverso codec audio/video performanti.. Nato fondamentalmente per il web questo formato consente di ottenere buoni rapporti qualità/dimensione per una ...

Dettagli

1 Videoediting: concetti di base e formati 1. Codec (codifica e

1 Videoediting: concetti di base e formati 1. Codec (codifica e dividono in base alla modalità in cui effettuano la compressione:  con perdita di informazione (lossy),  senza  perdita di informazione (lossless). Per realizzare tale compressione si fa ricorso al...

Dettagli