audio per il podcasting
Transcript
audio per il podcasting
AUDIO PER IL PODCASTING di Alberto Pian Quali sono le caratteristiche principali di un file audio destinato a una trasmissione podcast? Spieghiamo qui brevemente e senza addentrarci troppo nei particolari, alcune caratteristiche dell'audio digitale e delle possibilità offerte dai sistemi di compressione. Come avviene una compressione adatta? Prima di tutto dobbiamo capire alcune caratteristiche dei formati audio digitali. Lo facciamo attraverso iTunes che potete scaricare gratuitamente dal sito Apple nella versione per Mac e per Win. Selezioniamo il nostro file audio e cerchiamo le informazioni che lo riguardano. Da iTunes basta selezionare il menu Archivio › Informazioni (oppure fare clic con il tasto destro del mouse direttamente su file e quindi scegliere la voce Informazioni). Appare questa finestra che riporta alcune informazioni tecniche sul documento che abbiamo selezionato: Le informazioni riportate nell'immagine indicano che il file audio è stato compresso. Per comprimere un file audio, usiamo ancora una volta iTunes: scegliamo dal menu iTunes › Preferenze, scegliamo la voce Avanzate › Importazione e ci troveremo di fronte ad alcune scelte che non è semplice decifrare. Se decidiamo poi di abbandonare le impostazioni guidate e di fare tutto da soli, selezionando la voce "ad hoc...", la situazione si complica ulteriormente poiché ci viene chiesto di operare una serie di scelte non certo semplici da capire! Cerchiamo quindi di mettere un po’ di ordine e di chiarire le idee. Dobbiamo sapere che un file audio digitale è in realtà un documento “campionato”. Campionare un suono vuol dire indicare con quale frequenza il software di registrazione che stiamo usando, deve prelevare porzioni di audio e trasformarle in formato digitale. A 44,1 kHz il suono viene registrato per 44,100 volte ogni secondo. Se un file audio campionato a 44,100 kHz pesasse 1 MB, a 22,050 peserebbe la metà e un quarto a 11.050, cioè 250 KB. La prima lezione che possiamo trarre da questa osservazione è che più è basso il livello di campionamento e più sarà scadente la qualità sonora. Scadente però fino a un certo punto. Infatti un campionamento a 11.025 kHz indica comunque che l'audio viene registrato per 0,090702947846 ogni secondo! Per un podcast parlato con sottofondo musicale andrà benissimo; per un podcast che contiene solo parlato è più che sufficiente un campionamento di 11.025 kHz. Se un file che pesa 1 MB, campionato a 44,1 kHz fosse stereofonico, sarebbe composto da due canali dello stesso peso in termini di bit. Lo stesso file registrato in mono peserebbe la metà. Tuttavia, a parità di campionamento potremmo avere riproduzioni dell'onda sonora molto diverse fra loro. Infatti, più è bassa l'ampiezza in bit e più la riproduzione dell'onda sarà scadente. La qualità CD audio è registrata a un'ampiezza di 16 bit (oltre ad essere campionata a 44,100 kHz, in stereo). Dunque registrando più o meno informazioni (bit), avremo un suono più o meno ricco di tonalità, di sfumature, di timbri, di alti e bassi perché una parte di queste informazioni verrà tagliata o conservata. Un altro dato incide, sempre in termini di bit, sulla qualità dell'audio e sul suo ingombro: il cosiddetto bitrate. Per bitrate si intende la quantità del flusso di informazioni che passa per ogni secondo di audio campionato. Il bitrate viene identificato con la sigla kbs o kbps. Prendiamo 1 secondo registrato in qualità CD audio, cioè a 44,100, stereo, 16 bit (2 byte). 1 secondo di registrazione in questa qualità sarà equivalente a un file delle dimensioni di 176,4 KB. Questo è anche il suo kbs o kbps. Il bitrate sarà quindi pari a 176,4 x 8 cioè per il numero di bit contenuti in un singolo byte, pari quindi a 1411,2 bit/sec. Quando fra le scelte di compressione ci viene chiesto di stabilire la frequenza in KB o in bit del campionamento, sappiamo già che una frequenza di 170 KB o superiore, pari cioè a 1411 bit o superiore, è certamente di alta qualità. Frequenze inferiori tagliano l'onda, non la riproducono più fedelmente e saranno di qualità inferiore. Comprimere significa trovare il modo di rendere un file audio il più leggero possibile (che pesi poco in termini di Mb), alla massima qualità udibile. Non è semplice. La ricerca è partita dall'esame dell'onda sonora e della percezione del nostro udito, per mettere a punto dei sistemi di compressione che, pur comprimendo l'audio, vale a dire pur non riproducendo perfettamente l'onda sonora e riducendone le informazioni, potessero restituire un suono di qualità comunque eccezionale, in certi casi indistinguibile dalla qualità audio CD. Possibile? Certo, ecco i risultati, che abbiamo rielaborato sulla base di una tabella fornita da Apple, mettendo a confronto i formati AAC, mp3, ed Apple Lossless con i formati AIFF ed WAV, che rappresentano i documenti di qualità CD. FORMATO DI CODIFICA1 AAC (MPEG-4) MP3 RIPRODUZIONE Tutti gli iPod e lettori portatili di ultima generazione che supportano il formato applicazioni che supportano il formato; iTunes, QuickTime Tutti gli iPod e lettori mp3, computer Win, Mac, Linux DIMENSIONE > 1 MB/min (impostazione Alta qualità) NOTE Default per computer su Windows e Mac con QuickTime 6.2 o versione successiva, e iTunes 1 MB/min (impostazione Alta qualità) Default per computer Mac e Win con QuickTime 6.1 o versione precedente e iTunes Apple Lossless Alcuni modelli di iPod, tute le applicazioni che supportano QuickTime per Mac e per Win 5 MB/min Utilizza questo formato per masterizzare i CD audio ad alta qualità dai brani importati AIFF e WAV Molte applicazioni per Mac e Win, iTunes, QuickTime (AIFF è più diffuso in ambito Mac; WAV in ambito Windows) 10 MB/min Utilizza questo formato per masterizzare i CD audio ad alta qualità dai brani importati I sistemi di compressione quindi cercano prima di tutto di agire sui fenomeni psicoacustici, tagliando le frequenze che comunque risulterebbero impercettibili all'orecchio umano. In secondo luogo cercano di analizzare l'onda sonora in modo da applicare un bitrate variabile, elevandolo là dove il segnale è più complesso e diminuendolo quando non sono necessarie molte informazioni, cercando di avere poi un bitrate medio accettabile. Il risultato è che la qualità di un file audio compresso, in certi casi può tranquillamente essere paragonata a quella di un CD musicale standard. QUALCHE SUGGERIMENTO A parte i parametri di compressione, molto dipende dalla qualità iniziale della registrazione, dalla qualità degli strumenti di registrazione (microfoni, mixer, ecc.), dai rumori fondo, dalla presenza e dal tipo di musiche, dal missaggio delle diverse tracce e così via. A vantaggio del podcasting però, abbiamo il principio secondo il quale il parlato ha meno esigenze della musica e le sue imperfezioni sono accettabili, specialmente quando si tratta di conversazioni, battute, letture di news, episodi talk. Quando invece abbiamo a che fare con letture impostate, per esempio di racconti o di poesie o, peggio ancora, di radiodrammi, è chiaro che occorre prestare molta più attenzione alla qualità iniziale della registrazione. Un’altra considerazione da tenere presente, è che una bassa qualità iniziale, vale a dire una cattiva registrazione, non potrà mai diventare una buona registrazione. Sotto certi aspetti potrà essere migliorata con appositi accorgimenti (sopprimendo alcuni rumori e imperfezioni), ma in sede di compressione rimarrà quella che è. Infatti, comprimendo un file audio si può sottrarre qualità, non aggiungerne. Così, se avete un documento 1 I sistemi di compressioni possono essere con perdita di qualità (definite come lossy), e senza perdita di qualità (definite losless). AIFF e WAV (senza perdita di qualità). Rappresentano lo standard dei CD audio, quindi alta qualità. Sono ottimi formati, da impiegare per conservare una traccia originale della registrazione. Le colonne sonore che usate abitualmente dovrebbero essere conservate in questo formato. APPLE LOSSLESS (senza perdita di qualità). E' un formato della stessa qualità dei precedenti, però occupa un po' meno spazio. Viene letto da iTunes e QuickTime, ma non da tutti i software. E' utile conservare le copie originali in questo formato per risparmiare spazio. AAC (.m4a .m4b) (con perdita di qualità). Appartiene alla famiglia MPEG - 4 che caratterizza l'audio dei DVD. E' il formato consigliato dal consorzio MPEG. Si tratta di compressione con perdita di qualità, ma i documenti codificati nel formato AAC hanno una qualità pari a quella di un CD audio (se si usa una compressione almeno di 128 KB 44,100 kHz, stereo a 16 bit), e il loro suono è qualitativamente uguale o superiore ai documenti MP3 codificati alla stessa frequenza bit o persino superiore. E' supportato da tutti gli iPod e dalla maggior parte dei lettori audio di ultima generazione. Occorre installare QuickTime/iTunes per ascoltare i file registrati in questo formato da una pagina Internet. Con questo formato si possono creare i "podcast aumentati", cioè dei file audio che contengono una divisione in capitoli, diverse immagini, link URL a pagine web che sono nel formato m4b (il "b" sta per bokmarkable, consente l'inserimento di capitoli segnalibri). MP3 (mp3) (con perdita di qualità). Si tratta dell'MPG layer 3. E' il formato più diffuso, comprime l'audio con perdita di qualità. Si può associare un'immagine di copertina e un testo, come negli AAC ma non supporta la funzione di divisione in capitoli, l'inserimento di più immagini e di URL, come negli AAC, quindi non si usa nel caso di podcast aumentti. Ha una qualità inferiore all'AAC a parità di compressione. audio registrato a una bassa qualità è perfettamente inutile convertirlo a una qualità più elevata (per esempio da mp3 ad AIFF o a un formato mp3 migliore): c'è il rischio che il file pesi molto, ma molto di più... restando esattamente lo stesso! In questo caso varrebbe la pena, invece, utilizzare i filtri messi a disposizione dalle applicazioni di montaggio audio, per cercare di eliminare qualche rumore di fondo oppure, cambiando decisamente la tonalità e il timbro, mascherare le imperfezioni. Ecco quindi alcune indicazioni pratiche per regolare le compressioni audio. Ci riferiamo a trasmissioni audio nelle quali il parlato è predominante rispetto alla musica (magari in sottofondo), che abbiamo inizialmente registrato alla massima qualità (AIFF o WAWE) e quindi importato all'interno di iTunes per essere convertito. Suggerimenti per i parametri di compressione CODIFICA SOLO PARLATO A UNA VOCE PARLATO A PIÙ VOCI PARLATO CON MUSICHE, SIGLE E INTERMEZZI AAC (MPEG-4) (.m4a) Mono, 32 KB, 32.000 kHz, ottimizzato per voce Stereo, 64/96 KB, 22,050 kHz, VBR attivo Stereo, 96/128 KB, 44,100 kHz, VBR attivo, ottimizza per parlato MP3 (.mp3) Mono, 48 KB, 22,050 kHz, VBR attivo Stereo, 96Kb, 22,050 kHz, VBR attivo Stereo, 128/160 KB, 44,100 kHz, VBR attivo, ottimizza per parlato Nota: quando è attiva l'opzione VBR il risultato medio del bitrate può essere di molto inferiore a quello stabilito come tetto massimo, per questo conviene restare un po' più elevati: consente di avere un maggior margine per certi campionamenti più impegnativi. Avete notato che in alcuni casi viene suggerito l'impiego di un metodo di calcolo del bitrate denominato VBR (Variable Bit Rate). Di che cosa si tratta? Con il metodo VBR, il bitrate non viene stabilito una volta per tutte, per esempio a 96 KB, se è stata questa scelta, ma 96 KB indica il valore massimo a cui può arrivare il campionamento. Significa che il campionamento avviene in modo variabile, in certi punti il suo valore potrà essere più alto, in altri più basso, ma la media non supererà mai il valore assegnato. È una scelta obbligata per il podcasting, perché? Perché in una trasmissione ci sono pause, addirittura silenzi, momenti in cui le informazioni sono scarse (per esempio solo qualche rumore o una voce) e altri più complessi. iTunes, esaminerà l'onda sonora e applicherà un bitrate adatto per le sue variazioni. Benissimo, non ci resta che metterci al lavoro dunque... saranno necessarie delle prove ma in capo a breve tempo avrete tre o quattro indicazioni di massima dalle quali difficilmente vi scosterete e vi renderanno semplice il vostro lavoro. Compressione di un documento audio con iTunes