La codifica dei suoni
Transcript
La codifica dei suoni
La codifica dei suoni • Anche i suoni possono essere rappresentati in forma digitale • Dal punto di vista fisico un suono è un'alterazione della pressione dell'aria che, quando rilevata, ad esempio dall'orecchio umano, viene trasformata in un stimolo auditivo al cervello • L’alterazione della pressione deve avere le caratteristiche di una vibrazione • La durata, l'intensità e la frequenza della vibrazione sono le quantità fisiche che rendono un suono diverso da ogni altro • Mediante un microfono le variazioni della pressione dell’aria (vibrazioni) vengono trasformate in un segnale elettrico RAPPRESENTARE I SUONI • Fisicamente un suono è rappresentato come un'onda (onda sonora) che descrive la variazione della pressione dell'aria nel tempo t Sull'asse delle ascisse viene rappresentato il tempo e sull'asse delle ordinate viene rappresentata la variazione di pressione corrispondente al suono stesso RAPPRESENTARE I SUONI Quindi i suoni consistono in vibrazioni che formano un’onda, la cui ampiezza misura l’altezza dell’onda e il periodo è la distanza tra due onde. AMPIEZZA PERIODO TEMPO RAPPRESENTARE I SUONI • L’intensità del suono descrive l’ampiezza delle variazioni dell’onda sonora e si misura in decibel (DB) • La frequenza è il numero di periodi (o di vibrazioni) al secondo e si misurano in Hertz (Hz) • L’orecchio umano e’ sensibile alle frequenze tra 20 e 20000Hz RAPPRESENTARE I SUONI • La rappresentazione in forma d’onda è analogica e fornisce una descrizione continua dell'onda sonora • Le rappresentazioni di tipo analogico non sono utilizzabili in informatica, data l'impossibilità di trattare informazioni di tipo continuo • È necessario trovare un modo per codificare in forma digitale (numerica) un’onda sonora IL CAMPIONAMENTO Pertanto per registrare un suono e memorizzarlo sul computer si usa la tecnica del campionamento. Infatti un file viene prodotto suddividendo un’onda acustica in moltissimi frammenti e memorizzando ogni frammento come un piccolo campione digitale del suono. IL CAMPIONAMENTO Tanto maggiore è il numero di campioni che vengono presi ogni secondo, tanto maggiore sarà la precisione con cui nel computer sarà rappresentata la forma d’onda FREQUENZA DI CAMPIONAMENTO Il numero di campioni registrati al secondo si dice frequenza di campionamento. Frequenza delle schede audio 11 KHz (11.000 campioni/sec.) 22 KHz 44 KHz Maggiore è il numero di KHz maggiore sarà lo spazio occupato su disco DIMENSIONE DI CAMPIONAMENTO Un altro fattore che influenza la qualità del suono è la dimensione di campionamento (quantizzazione), ossia il numero di bit disponibili per memorizzare ciascun campione d’onda. 4 BIT 8 BIT 16 BIT Si distinguono 16 valori Si distinguono 256 valori Si distinguono 65.536 valori Codifica dei suoni (esempio) Se volessimo codificare la musica di qualità CD dovremmo: • Usare due registrazioni corrispondenti a due microfoni distinti • Campionare il segnale musicale producendo 44.100 campioni al secondo • Per ogni campione (che è un numero) si usano 16 bit Per cui, il numero di bit che sarebbero necessari per codificare ogni secondo è pari a 2 x 44.100 campioni x 16 bit/campione = 1.414.200 bit Tasso di Nyquist • Tasso di Nyquist*: per ricostruire il segnale è necessario e sufficiente un numero di campioni almeno due volte la frequenza dell’onda Quindi: • Fissato il tasso di campionamento e’ possibile catturare solo frequenze non più grandi della metà del tasso di campionamento *il teorema di Nyquist afferma che in una conversione analogico-digitale la minima frequenza di campionamento necessaria per evitare ambiguità e perdita di informazione nella ricostruzione del segnale analogico originario (ovvero nella riconversione digitale-analogica) con larghezza di banda finita e nota è pari al doppio della sua frequenza massima. Tasso di campionamento • La voce umana ha come frequenza massima 4000 Hz: richiede un tasso di campionamento di 8000 campioni al secondo • Per catturare frequenze fino a 20.000Hz e’ necessario campionare il segnale almeno 40.000 volte al secondo • Il tasso di campionamento dei CD è 44.100 campioni al secondo Quantizzazione e codifica • Un dispositivo (detto ADC Analog-Digital converter): trasforma impulsi elettrici (i campioni) in una sequenza di numeri • Il numero di bit destinati alla rappresentazione dei valori numerici ripartisce i valori di tensione in un insieme di livelli discreti: • Esempio con 8bit (1byte) si distinguono 256 livelli di tensione • Esempio con 16 bit (2byte) si distinguono 65356 livelli di tensione Approssimazione della quantizzazione • Ogni numero non rappresenta un valore preciso di voltaggio, ma un intervallo. Tanto piu’ piccolo e’ tale intervallo, tanto e’ accurata la quantizzazione • Esempio se l’ampiezza varia da -10 a +10 volt una codifica con 1byte rappresenta un intervallo di 0,078125 V dell’ampiezza totale (20/256). • I CD musicali usano una codifica a 16 bit perfettamente adeguata rispetto alla percezione umana Spazio occupato • Esempio: 1 secondo di voce umana a 8000 campioni al secondo, campionata a 8 bit richiede 64.000bit = ~8KB • Esempio: 1 secondo di musica qualità CD richiedono (2 canali stereofonia): 2 x 44.100 x 16= 1.411.200bit = ~ 175KB 1 minuto di musica richiede quindi 10.584.000 = ~10MB REGISTRARE SUONI )) ) Impossibile visualizzare l'immagine. La memoria del computer potrebbe essere insufficiente per aprire l'immagine oppure l'immagine potrebbe essere danneggiata. Riavviare il computer e aprire di nuovo il file. Se viene visualizzata di nuovo la x rossa, potrebbe essere necessario eliminare l'immagine e inserirla di nuovo. Scheda audio La scheda audio converte in numeri (digitali) l’onda analogica in entrata e memorizza questi numeri in un file (conversione ADC) Analog to Digital Converter Campionamento Segnale analogico Quantizzazione Segnale campionato 10001001010001 Segnale digitale RIPRODURRE SUONI Scheda audio La scheda prende i numeri (digitali) da un file e li riconverte in un segnale analogico che pilota agli altoparlanti( conversione DAC) )) ) I DIVERSI FILE DI SUONI Una scheda audio può creare e riprodurre due tipi diversi di file di suoni: i file di forma d’onda e i file MIDI MIDI vuol dire Musical Instrument Digital Interface, ossia interfaccia digitale per strumenti musicali, infatti indica un protocollo che governa lo scambio di dati tra strumenti musicali elettronici e computer. I DIVERSI FILE DI SUONI I file MIDI non contengono audio , ma istruzioni per la produzione di suoni, pertanto possono essere ascoltati solo se vengono inviati ad un sintetizzatore (esterno o interno alla scheda) che traduce le istruzioni del file in note I DIVERSI FILE DI SUONI File di forme d’onda Estensione .WAV File MIDI Estensione .MID Memorizzano informazioni sulle onde acustiche e sono prodotti dal processo di campionamento Memorizzano istruzioni per la produzione di suoni e non i suoni stessi Possono memorizzare voci, musica, effetti speciali Possono memorizzare solo musica Sono molto grandi Sono più compatti Un minuto di musica Midi occupa meno spazio di un secondo di suono registrato I DIVERSI FILE DI SUONI File MP3 La sigla MPEG (Motion Picture Experts Group) identifica un gruppo di studiosi che si riuniscono sotto la ISO allo scopo di generare codifiche standard internazionali per la digitalizzazione video e la compressione audio I File MP3 La sigla è diventata poi per estensione il nome che definisce l’algoritmo di compressione audio/ visivo nato dalla cooperazione del gruppo. La sigla MP3 significa “MPEG1-Layer 3” (Layers sono i differenti livelli di compressione), il cui scopo è quello di comprimere il più possibile un file audio, mantenendone inalterata, per quanto possibile, la qualità. In questo modo il file diviene facilmente trasportabile su dischetti o trasferibile attraverso Internet. I File MP3 Come funzionano L’MPEG elimina dai file audio determinate informazioni che non sono necessarie, basandosi su alcune ricerche della psicoacustica. Questi studi rivelano che il nostro orecchio non è in grado di percepire frequenze “deboli” adiacenti a frequenze “forti”, in quanto queste ultime coprono le prime. I File MP3 Come funzionano Le informazioni inerenti le frequenze più deboli, in quanto non percettibili dall’orecchio umano, vengono quindi eliminate dall’MPEG durante la fase di compressione. In questo modo si ottiene una riduzione del file audio in termini di spazio fisico occupato. Qualità del formato MP3 audio È opinione diffusa che, per una resa soddisfacente dell'MP3, il bit rate deve essere almeno di 128 kbps; la qualità di un MP3 compresso a questo bit-rate, tuttavia, non si avvicina a quella di un CD-Audio, pur garantendo delle discrete prestazioni con dimensioni del file molto ridotte. Test di ascolto mostrano che, attraverso un po' di pratica, molti sono in grado di distinguere un formato MP3 a 128 kbit/s da un CD originale. La qualità di un file MP3 dipende dalla qualità della codifica e dalla difficoltà con la quale il segnale deve essere codificato. Buoni codificatori hanno una qualità accettabile da 128 a 160 kbit/s, la chiarezza perfetta di un brano si ottiene da 160 a 192 kbit/s. Una caratteristica importante dell'MP3 è la perdita di dati dovuta alla compressione – è il modo con cui si rimuove l'informazione dal file audio originale allo scopo di risparmiare spazio. Nei moderni codificatori MP3 gli algoritmi più efficaci fanno di tutto per assicurare che i suoni rimossi siano quelli che non possono essere rilevati e/o che vengono rilevati meno dall'orecchio umano. Esempio di codificatore: L.A.M.E. WMA WMA è l'acronimo di "Windows media Audio. " WMA è un formato di compressione audio sviluppato da Microsoft per l'utilizzo nel loro sistema operativo Windows . WMA è stato concepito come un concorrente di MP3 e AAC . Ci sono più versioni del formato WMA . WMA Pro permette di audio ad alta risoluzione . WMA Lossless consente la compressione audio senza perdita di fedeltà audio , al contrario di formati lossy , che perdono fedeltà audio durante la compressione . AAC AAC è l'acronimo di " Advanced Audio Coding ". AAC è un metodo di compressione audio digitale . Come MP3 , il formato AAC è considerato " lossy ", cioè si sacrifica di proposito i dati in cambio di un file di dimensioni inferiori . AAC è stato progettato come il successore di MP3 . Test cieco hanno dimostrato che i file codificati in formato AAC possiedono una maggiore fedeltà del suono che lo stesso file codificati in formato MP3 . AAC ha guadagnato molta popolarità quando Apple lo ha adottato come metodo di codifica di scelta per il loro software iTunes e il lettore di musica digitale iPod .