audio per il podcasting

Transcript

audio per il podcasting
AUDIO PER IL PODCASTING
di Alberto Pian
Quali sono le caratteristiche principali di un file audio destinato a una trasmissione podcast? Spieghiamo
qui brevemente e senza addentrarci troppo nei particolari, alcune caratteristiche dell'audio digitale e delle
possibilità offerte dai sistemi di compressione. Come avviene una compressione adatta?
Prima di tutto dobbiamo capire alcune caratteristiche dei formati audio digitali. Lo facciamo attraverso
iTunes che potete scaricare gratuitamente dal sito Apple nella versione per Mac e per Win. Selezioniamo il
nostro file audio e cerchiamo le informazioni che lo riguardano.
Da iTunes basta selezionare il menu Archivio › Informazioni (oppure fare clic con il tasto destro del
mouse direttamente su file e quindi scegliere la voce Informazioni). Appare questa finestra che riporta alcune
informazioni tecniche sul documento che abbiamo selezionato:
Le informazioni riportate nell'immagine indicano che il file audio è stato compresso.
Per comprimere un file audio, usiamo ancora una volta iTunes: scegliamo dal menu iTunes › Preferenze,
scegliamo la voce Avanzate › Importazione e ci troveremo di fronte ad alcune scelte che non è semplice decifrare.
Se decidiamo poi di abbandonare le impostazioni guidate e di fare tutto da soli, selezionando la voce "ad
hoc...", la situazione si complica ulteriormente poiché ci viene chiesto di operare una serie di scelte non certo
semplici da capire! Cerchiamo quindi di mettere un po’ di ordine e di chiarire le idee.
Dobbiamo sapere che un file audio digitale è in realtà un documento “campionato”. Campionare un suono
vuol dire indicare con quale frequenza il software di registrazione che stiamo usando, deve prelevare
porzioni di audio e trasformarle in formato digitale. A 44,1 kHz il suono viene registrato per 44,100 volte
ogni secondo. Se un file audio campionato a 44,100 kHz pesasse 1 MB, a 22,050 peserebbe la metà e un
quarto a 11.050, cioè 250 KB. La prima lezione che possiamo trarre da questa osservazione è che più è basso
il livello di campionamento e più sarà scadente la qualità sonora. Scadente però fino a un certo punto. Infatti
un campionamento a 11.025 kHz indica comunque che l'audio viene registrato per 0,090702947846 ogni
secondo! Per un podcast parlato con sottofondo musicale andrà benissimo; per un podcast che contiene solo
parlato è più che sufficiente un campionamento di 11.025 kHz.
Se un file che pesa 1 MB, campionato a 44,1 kHz fosse stereofonico, sarebbe composto da due canali
dello stesso peso in termini di bit. Lo stesso file registrato in mono peserebbe la metà. Tuttavia, a parità di
campionamento potremmo avere riproduzioni dell'onda sonora molto diverse fra loro. Infatti, più è bassa
l'ampiezza in bit e più la riproduzione dell'onda sarà scadente.
La qualità CD audio è registrata a un'ampiezza di 16 bit (oltre ad essere campionata a 44,100 kHz, in
stereo). Dunque registrando più o meno informazioni (bit), avremo un suono più o meno ricco di tonalità, di
sfumature, di timbri, di alti e bassi perché una parte di queste informazioni verrà tagliata o conservata.
Un altro dato incide, sempre in termini di bit, sulla qualità dell'audio e sul suo ingombro: il cosiddetto
bitrate. Per bitrate si intende la quantità del flusso di informazioni che passa per ogni secondo di audio
campionato. Il bitrate viene identificato con la sigla kbs o kbps. Prendiamo 1 secondo registrato in qualità
CD audio, cioè a 44,100, stereo, 16 bit (2 byte). 1 secondo di registrazione in questa qualità sarà equivalente
a un file delle dimensioni di 176,4 KB. Questo è anche il suo kbs o kbps. Il bitrate sarà quindi pari a 176,4 x
8 cioè per il numero di bit contenuti in un singolo byte, pari quindi a 1411,2 bit/sec. Quando fra le scelte di
compressione ci viene chiesto di stabilire la frequenza in KB o in bit del campionamento, sappiamo già che
una frequenza di 170 KB o superiore, pari cioè a 1411 bit o superiore, è certamente di alta qualità. Frequenze
inferiori tagliano l'onda, non la riproducono più fedelmente e saranno di qualità inferiore.
Comprimere significa trovare il modo di rendere un file audio il più leggero possibile (che pesi poco in
termini di Mb), alla massima qualità udibile. Non è semplice. La ricerca è partita dall'esame dell'onda sonora
e della percezione del nostro udito, per mettere a punto dei sistemi di compressione che, pur comprimendo
l'audio, vale a dire pur non riproducendo perfettamente l'onda sonora e riducendone le informazioni,
potessero restituire un suono di qualità comunque eccezionale, in certi casi indistinguibile dalla qualità audio
CD. Possibile? Certo, ecco i risultati, che abbiamo rielaborato sulla base di una tabella fornita da Apple,
mettendo a confronto i formati AAC, mp3, ed Apple Lossless con i formati AIFF ed WAV, che
rappresentano i documenti di qualità CD.
FORMATO DI
CODIFICA1
AAC (MPEG-4)
MP3
RIPRODUZIONE
Tutti gli iPod e lettori portatili di ultima
generazione che supportano il formato
applicazioni che supportano il formato;
iTunes, QuickTime
Tutti gli iPod e lettori mp3, computer
Win, Mac, Linux
DIMENSIONE
> 1 MB/min
(impostazione Alta
qualità)
NOTE
Default per computer su
Windows e Mac con
QuickTime 6.2 o versione
successiva, e iTunes
1 MB/min (impostazione
Alta qualità)
Default per computer Mac e
Win con QuickTime 6.1 o
versione precedente e iTunes
Apple Lossless
Alcuni modelli di iPod, tute le
applicazioni che supportano QuickTime
per Mac e per Win
5 MB/min
Utilizza questo formato per
masterizzare i CD audio ad
alta qualità dai brani importati
AIFF e WAV
Molte applicazioni per Mac e Win,
iTunes, QuickTime (AIFF è più diffuso
in ambito Mac; WAV in ambito
Windows)
10 MB/min
Utilizza questo formato per
masterizzare i CD audio ad
alta qualità dai brani importati
I sistemi di compressione quindi cercano prima di tutto di agire sui fenomeni psicoacustici, tagliando le
frequenze che comunque risulterebbero impercettibili all'orecchio umano. In secondo luogo cercano di
analizzare l'onda sonora in modo da applicare un bitrate variabile, elevandolo là dove il segnale è più
complesso e diminuendolo quando non sono necessarie molte informazioni, cercando di avere poi un bitrate
medio accettabile. Il risultato è che la qualità di un file audio compresso, in certi casi può tranquillamente
essere paragonata a quella di un CD musicale standard.
QUALCHE SUGGERIMENTO
A parte i parametri di compressione, molto dipende dalla qualità iniziale della registrazione, dalla qualità
degli strumenti di registrazione (microfoni, mixer, ecc.), dai rumori fondo, dalla presenza e dal tipo di
musiche, dal missaggio delle diverse tracce e così via. A vantaggio del podcasting però, abbiamo il principio
secondo il quale il parlato ha meno esigenze della musica e le sue imperfezioni sono accettabili,
specialmente quando si tratta di conversazioni, battute, letture di news, episodi talk. Quando invece abbiamo
a che fare con letture impostate, per esempio di racconti o di poesie o, peggio ancora, di radiodrammi, è
chiaro che occorre prestare molta più attenzione alla qualità iniziale della registrazione. Un’altra
considerazione da tenere presente, è che una bassa qualità iniziale, vale a dire una cattiva registrazione, non
potrà mai diventare una buona registrazione. Sotto certi aspetti potrà essere migliorata con appositi
accorgimenti (sopprimendo alcuni rumori e imperfezioni), ma in sede di compressione rimarrà quella che è.
Infatti, comprimendo un file audio si può sottrarre qualità, non aggiungerne. Così, se avete un documento
1
I sistemi di compressioni possono essere con perdita di qualità (definite come lossy), e senza perdita di qualità (definite losless).
AIFF e WAV (senza perdita di qualità). Rappresentano lo standard dei CD audio, quindi alta qualità. Sono ottimi formati, da
impiegare per conservare una traccia originale della registrazione. Le colonne sonore che usate abitualmente dovrebbero essere
conservate in questo formato.
APPLE LOSSLESS (senza perdita di qualità). E' un formato della stessa qualità dei precedenti, però occupa un po' meno spazio. Viene
letto da iTunes e QuickTime, ma non da tutti i software. E' utile conservare le copie originali in questo formato per risparmiare spazio.
AAC (.m4a .m4b) (con perdita di qualità). Appartiene alla famiglia MPEG - 4 che caratterizza l'audio dei DVD. E' il formato
consigliato dal consorzio MPEG. Si tratta di compressione con perdita di qualità, ma i documenti codificati nel formato AAC hanno
una qualità pari a quella di un CD audio (se si usa una compressione almeno di 128 KB 44,100 kHz, stereo a 16 bit), e il loro suono è
qualitativamente uguale o superiore ai documenti MP3 codificati alla stessa frequenza bit o persino superiore. E' supportato da tutti
gli iPod e dalla maggior parte dei lettori audio di ultima generazione. Occorre installare QuickTime/iTunes per ascoltare i file
registrati in questo formato da una pagina Internet. Con questo formato si possono creare i "podcast aumentati", cioè dei file audio
che contengono una divisione in capitoli, diverse immagini, link URL a pagine web che sono nel formato m4b (il "b" sta per
bokmarkable, consente l'inserimento di capitoli segnalibri).
MP3 (mp3) (con perdita di qualità). Si tratta dell'MPG layer 3. E' il formato più diffuso, comprime l'audio con perdita di qualità. Si
può associare un'immagine di copertina e un testo, come negli AAC ma non supporta la funzione di divisione in capitoli,
l'inserimento di più immagini e di URL, come negli AAC, quindi non si usa nel caso di podcast aumentti. Ha una qualità inferiore
all'AAC a parità di compressione.
audio registrato a una bassa qualità è perfettamente inutile convertirlo a una qualità più elevata (per esempio
da mp3 ad AIFF o a un formato mp3 migliore): c'è il rischio che il file pesi molto, ma molto di più...
restando esattamente lo stesso! In questo caso varrebbe la pena, invece, utilizzare i filtri messi a disposizione
dalle applicazioni di montaggio audio, per cercare di eliminare qualche rumore di fondo oppure, cambiando
decisamente la tonalità e il timbro, mascherare le imperfezioni.
Ecco quindi alcune indicazioni pratiche per regolare le compressioni audio. Ci riferiamo a trasmissioni
audio nelle quali il parlato è predominante rispetto alla musica (magari in sottofondo), che abbiamo
inizialmente registrato alla massima qualità (AIFF o WAWE) e quindi importato all'interno di iTunes per
essere convertito.
Suggerimenti per i parametri di compressione
CODIFICA
SOLO PARLATO
A UNA VOCE
PARLATO A PIÙ VOCI
PARLATO CON MUSICHE,
SIGLE E INTERMEZZI
AAC (MPEG-4)
(.m4a)
Mono, 32 KB, 32.000 kHz,
ottimizzato per voce
Stereo, 64/96 KB,
22,050 kHz, VBR attivo
Stereo, 96/128 KB, 44,100 kHz,
VBR attivo, ottimizza per parlato
MP3
(.mp3)
Mono, 48 KB, 22,050 kHz,
VBR attivo
Stereo, 96Kb,
22,050 kHz, VBR attivo
Stereo, 128/160 KB, 44,100 kHz,
VBR attivo, ottimizza per parlato
Nota: quando è attiva l'opzione VBR il risultato medio del bitrate può essere di molto inferiore a quello stabilito come
tetto massimo, per questo conviene restare un po' più elevati: consente di avere un maggior margine per certi
campionamenti più impegnativi.
Avete notato che in alcuni casi viene suggerito l'impiego di un metodo di calcolo del bitrate denominato
VBR (Variable Bit Rate). Di che cosa si tratta? Con il metodo VBR, il bitrate non viene stabilito una volta
per tutte, per esempio a 96 KB, se è stata questa scelta, ma 96 KB indica il valore massimo a cui può arrivare
il campionamento. Significa che il campionamento avviene in modo variabile, in certi punti il suo valore
potrà essere più alto, in altri più basso, ma la media non supererà mai il valore assegnato. È una scelta
obbligata per il podcasting, perché? Perché in una trasmissione ci sono pause, addirittura silenzi, momenti in
cui le informazioni sono scarse (per esempio solo qualche rumore o una voce) e altri più complessi. iTunes,
esaminerà l'onda sonora e applicherà un bitrate adatto per le sue variazioni. Benissimo, non ci resta che
metterci al lavoro dunque... saranno necessarie delle prove ma in capo a breve tempo avrete tre o quattro
indicazioni di massima dalle quali difficilmente vi scosterete e vi renderanno semplice il vostro lavoro.
Compressione di un documento audio con iTunes