La codifica dei suoni

Transcript

La codifica dei suoni
La codifica dei suoni
•  Anche i suoni possono essere rappresentati in forma digitale
•  Dal punto di vista fisico un suono è un'alterazione della
pressione dell'aria che, quando rilevata, ad esempio
dall'orecchio umano, viene trasformata in un stimolo auditivo
al cervello
•  L’alterazione della pressione deve avere le caratteristiche di
una vibrazione
•  La durata, l'intensità e la frequenza della vibrazione sono le
quantità fisiche che rendono un suono diverso da ogni altro
•  Mediante un microfono le variazioni della pressione dell’aria
(vibrazioni) vengono trasformate in un segnale elettrico
RAPPRESENTARE I SUONI
•  Fisicamente un suono è rappresentato come un'onda
(onda sonora) che descrive la variazione della pressione
dell'aria nel tempo
t
Sull'asse delle ascisse viene rappresentato il tempo e
sull'asse delle ordinate viene rappresentata la variazione di
pressione corrispondente al suono stesso
RAPPRESENTARE I SUONI
Quindi i suoni consistono in vibrazioni che
formano un’onda, la cui ampiezza misura l’altezza
dell’onda e il periodo è la distanza tra due onde.
AMPIEZZA
PERIODO
TEMPO
RAPPRESENTARE I SUONI
•  L’intensità del suono descrive l’ampiezza delle
variazioni dell’onda sonora e si misura in decibel (DB)
•  La frequenza è il numero di periodi (o di vibrazioni) al
secondo e si misurano in Hertz (Hz)
•  L’orecchio umano e’ sensibile alle frequenze tra 20 e
20000Hz
RAPPRESENTARE I SUONI
•  La rappresentazione in forma d’onda è analogica e
fornisce una descrizione continua dell'onda sonora
•  Le rappresentazioni di tipo analogico non sono
utilizzabili in informatica, data l'impossibilità di
trattare informazioni di tipo continuo
•  È necessario trovare un modo per codificare in
forma digitale (numerica) un’onda sonora
IL CAMPIONAMENTO
Pertanto per registrare un suono e memorizzarlo sul
computer si usa la tecnica del campionamento.
Infatti un file viene
prodotto suddividendo
un’onda acustica in
moltissimi frammenti e
memorizzando ogni
frammento come un
piccolo campione digitale
del suono.
IL CAMPIONAMENTO
Tanto maggiore è il numero di campioni che vengono presi ogni secondo,
tanto maggiore sarà la precisione con cui nel computer sarà
rappresentata la forma d’onda
FREQUENZA DI CAMPIONAMENTO
Il numero di campioni registrati al secondo si dice
frequenza di campionamento.
Frequenza delle schede audio
11 KHz (11.000 campioni/sec.)
22 KHz
44 KHz
Maggiore è il numero di KHz maggiore
sarà lo spazio occupato su disco
DIMENSIONE DI CAMPIONAMENTO
Un altro fattore che influenza la qualità del suono è
la dimensione di campionamento (quantizzazione),
ossia il numero di bit disponibili per memorizzare
ciascun campione d’onda.
4 BIT
8 BIT
16 BIT
Si distinguono 16 valori
Si distinguono 256 valori
Si distinguono 65.536 valori
Codifica dei suoni (esempio)
Se volessimo codificare la musica di qualità CD
dovremmo:
•  Usare due registrazioni corrispondenti a due
microfoni distinti
•  Campionare il segnale musicale producendo 44.100
campioni al secondo
•  Per ogni campione (che è un numero) si usano 16 bit
Per cui, il numero di bit che sarebbero necessari per
codificare ogni secondo è pari a
2 x 44.100 campioni x 16 bit/campione = 1.414.200
bit
Tasso di Nyquist
•  Tasso di Nyquist*: per ricostruire il segnale è
necessario e sufficiente un numero di campioni
almeno due volte la frequenza dell’onda
Quindi:
•  Fissato il tasso di campionamento e’ possibile
catturare solo frequenze non più grandi della metà
del tasso di campionamento
*il teorema di Nyquist afferma che in una conversione analogico-digitale la
minima frequenza di campionamento necessaria per evitare ambiguità e perdita di
informazione nella ricostruzione del segnale analogico originario (ovvero nella
riconversione digitale-analogica) con larghezza di banda finita e nota è pari al
doppio della sua frequenza massima.
Tasso di campionamento
•  La voce umana ha come frequenza massima 4000
Hz: richiede un tasso di campionamento di 8000
campioni al secondo
•  Per catturare frequenze fino a 20.000Hz e’
necessario campionare il segnale almeno 40.000
volte al secondo
•  Il tasso di campionamento dei CD è 44.100
campioni al secondo
Quantizzazione e codifica
•  Un dispositivo (detto ADC Analog-Digital converter):
trasforma impulsi elettrici (i campioni) in una sequenza di
numeri
•  Il numero di bit destinati alla rappresentazione dei valori
numerici ripartisce i valori di tensione in un insieme di
livelli discreti:
•  Esempio con 8bit (1byte) si distinguono 256 livelli di
tensione
•  Esempio con 16 bit (2byte) si distinguono 65356 livelli di
tensione
Approssimazione della quantizzazione
•  Ogni numero non rappresenta un valore preciso di voltaggio,
ma un intervallo. Tanto piu’ piccolo e’ tale intervallo, tanto e’
accurata la quantizzazione
•  Esempio se l’ampiezza varia da -10 a +10 volt una codifica
con 1byte rappresenta un intervallo di 0,078125 V
dell’ampiezza totale (20/256).
•  I CD musicali usano una codifica a 16 bit perfettamente
adeguata rispetto alla percezione umana
Spazio occupato
•  Esempio: 1 secondo di voce umana a 8000 campioni al secondo,
campionata a 8 bit richiede
64.000bit = ~8KB
•  Esempio: 1 secondo di musica qualità CD richiedono (2 canali
stereofonia):
2 x 44.100 x 16= 1.411.200bit = ~ 175KB
1 minuto di musica richiede quindi 10.584.000 = ~10MB
REGISTRARE SUONI
))
)
Impossibile visualizzare
l'immagine. La memoria del
computer potrebbe essere
insufficiente per aprire
l'immagine oppure
l'immagine potrebbe essere
danneggiata. Riavviare il
computer e aprire di nuovo
il file. Se viene visualizzata
di nuovo la x rossa,
potrebbe essere necessario
eliminare l'immagine e
inserirla di nuovo.
Scheda
audio
La scheda audio converte in numeri (digitali) l’onda
analogica in entrata e memorizza questi numeri
in un file (conversione ADC)
Analog to Digital Converter
Campionamento
Segnale analogico
Quantizzazione
Segnale campionato
10001001010001
Segnale digitale
RIPRODURRE SUONI
Scheda
audio
La scheda prende i numeri (digitali) da un file
e li riconverte in un segnale analogico che
pilota agli altoparlanti( conversione DAC)
))
)
I DIVERSI FILE DI SUONI
Una scheda audio può creare e riprodurre due
tipi diversi di file di suoni: i file di forma
d’onda e i file MIDI
MIDI vuol dire Musical
Instrument Digital Interface,
ossia interfaccia digitale per
strumenti musicali, infatti indica
un protocollo che governa lo
scambio di dati tra strumenti
musicali elettronici e computer.
I DIVERSI FILE DI SUONI
I file MIDI non contengono audio , ma istruzioni
per la produzione di suoni, pertanto possono
essere ascoltati solo se vengono inviati ad un
sintetizzatore (esterno o interno alla scheda) che
traduce le istruzioni del file in note
I DIVERSI FILE DI SUONI
File di forme d’onda
Estensione .WAV
File MIDI
Estensione .MID
Memorizzano informazioni sulle
onde acustiche e sono prodotti
dal processo di campionamento
Memorizzano istruzioni per la
produzione di suoni e non i suoni
stessi
Possono memorizzare voci, musica,
effetti speciali
Possono memorizzare solo musica
Sono molto grandi
Sono più compatti
Un minuto di musica Midi occupa meno spazio di un secondo
di suono registrato
I DIVERSI FILE DI SUONI
File MP3
La sigla MPEG (Motion Picture Experts
Group) identifica un gruppo di studiosi che si
riuniscono sotto la ISO allo scopo di
generare codifiche standard internazionali
per la digitalizzazione video e la
compressione audio
I File MP3
La sigla è diventata poi per estensione il nome
che definisce l’algoritmo di compressione audio/
visivo nato dalla cooperazione del gruppo.
La sigla MP3 significa “MPEG1-Layer 3” (Layers
sono i differenti livelli di compressione), il cui
scopo è quello di comprimere il più possibile un file
audio, mantenendone inalterata, per quanto
possibile, la qualità.
In questo modo il file diviene facilmente
trasportabile su dischetti o trasferibile
attraverso Internet.
I File MP3
Come funzionano
L’MPEG elimina dai file audio determinate
informazioni che non sono necessarie, basandosi
su alcune ricerche della psicoacustica. Questi
studi rivelano che il nostro orecchio non è in
grado di percepire frequenze “deboli” adiacenti
a frequenze “forti”, in quanto queste ultime
coprono le prime.
I File MP3
Come funzionano
Le informazioni inerenti le frequenze più deboli, in
quanto non percettibili dall’orecchio umano, vengono
quindi eliminate dall’MPEG durante la fase di
compressione.
In questo modo
si ottiene una
riduzione del
file audio in
termini di
spazio fisico
occupato.
Qualità del formato MP3 audio
È opinione diffusa che, per una resa soddisfacente dell'MP3, il bit rate deve essere almeno di
128 kbps; la qualità di un MP3 compresso a questo bit-rate, tuttavia, non si avvicina a quella di
un CD-Audio, pur garantendo delle discrete prestazioni con dimensioni del file molto ridotte.
Test di ascolto mostrano che, attraverso un po' di pratica, molti sono in grado di distinguere un
formato MP3 a 128 kbit/s da un CD originale.
La qualità di un file MP3 dipende dalla qualità della codifica e dalla difficoltà con la quale il
segnale deve essere codificato. Buoni codificatori hanno una qualità accettabile da 128 a 160
kbit/s, la chiarezza perfetta di un brano si ottiene da 160 a 192 kbit/s.
Una caratteristica importante dell'MP3 è la perdita di dati dovuta alla compressione – è il modo
con cui si rimuove l'informazione dal file audio originale allo scopo di risparmiare spazio. Nei
moderni codificatori MP3 gli algoritmi più efficaci fanno di tutto per assicurare che i suoni
rimossi siano quelli che non possono essere rilevati e/o che vengono rilevati meno dall'orecchio
umano.
Esempio di codificatore: L.A.M.E.
WMA
WMA è l'acronimo di "Windows media Audio. " WMA è un formato di
compressione audio sviluppato da Microsoft per l'utilizzo nel loro sistema operativo
Windows . WMA è stato concepito come un concorrente di MP3 e AAC . Ci sono più versioni del formato WMA . WMA Pro permette di audio ad alta
risoluzione . WMA Lossless consente la compressione audio senza perdita di fedeltà
audio , al contrario di formati lossy , che perdono fedeltà audio durante la
compressione .
AAC
AAC è l'acronimo di " Advanced Audio Coding ". AAC è un metodo di compressione
audio digitale . Come MP3 , il formato AAC è considerato " lossy ", cioè si sacrifica
di proposito i dati in cambio di un file di dimensioni inferiori . AAC è stato
progettato come il successore di MP3 . Test cieco hanno dimostrato che i file
codificati in formato AAC possiedono una maggiore fedeltà del suono che lo stesso
file codificati in formato MP3 . AAC ha guadagnato molta popolarità quando Apple
lo ha adottato come metodo di codifica di scelta per il loro software iTunes e il
lettore di musica digitale iPod .