Your Site or Page Name Here

Codificação de Áudio

1. Homepage

2. Base da Codificação de Áudio

3. Breve História da Compressão de Áudio

4. MPEG - Codificação Áudio

5. Conclusão

6. Bibliografia

Os primeiros dois métodos de codificação de áudio são extremamente simples e foram desenvolvidos para aplicações relacionadas com a fala, ou seja sinais com uma largura de banda de 4 kHz. Eles foram o Linear Predictive Coding (LPC) e o Code Excited Linear Predictor (CELP). Estes métodos comparavam o discurso com um modelo analítico do trato vocal de modo a guardar apenas os coeficientes que modelavam o sinal. O primeiro método tinha uma baixa qualidade e hoje em dia já não é utilizado, o segundo, sendo posterior obteve melhores resultados, devido a maior capacidade computacional que permitia acrescentar ao sinal um erro de modo a melhorar a qualidade final do mesmo.

Estes dois métodos estão na base dos primeiros codificadores de fala e servem apenas para mostrar por onde começou a codificação de áudio.

Os dois seguintes métodos são mais recentes, ainda que sejam uma abordagem relativamente simples e ainda tenham como principal aplicação a codificação de fala.

São eles a mu-law e o Adaptive Differential Pulse Code Modulation (ADPCM).

A mu-law consiste em comprimir o sinal logarítmicamente, o que é perfeitamente justificável uma vez que como já vimos o nosso aparelho auditivo também funciona com uma escala logarítmica. Assim as perdas impostas por esta compressão não são por nós perceptíveis. Basicamente esta compressão permite que com 8 bits se consigam representar 14 bits, naturalmente os sinais com menor amplitude são representados de forma mais correcto que os com maior amplitude. Este método é actualmente utilizado nos EUA, Canadá e Japão; no resto mundo um método semelhante é utilizado, a A-law.

Por sua vez, o ADPCM, ao contrário do PCM que considera as amostras independentes das suas vizinhas, tira partido do facto de em geral as amostras vizinhas terem valores semelhantes. Partindo desse facto ele descreve o sinal apenas utilizando a diferença entre amostras vizinhas. Ainda a apontar há o facto de o passo de quantização ser adaptativo, permitindo poupar mais bits em casos em que a diferença entre amostras seja muito pequena.

Depois de apresentadas as primeiras abordagens à codificação, apresenta-se agora a evolução dos codificadores desde os seus primórdios, até a actualidade.

O primeiro codificador que surgiu foi o ATC, a principal particularidade deste codificador estava na capacidade de utilizar janelas de tamanho variável para o cálculo da transformada, de modo a evitar o pré-eco. O pré-eco é o resultado de uma quantificação inadequada de uma zona do sinal fortemente não estacionaria. Esta quantificação inadequada conduz a erros de quantificação elevados na zona silenciosa. Este fenómeno está ilustrado na figura 4 bem como a vantagem em utilizar janelas de tamanho variável. Esta ideia revelou ser muito vantajosa daí ter sido utilizada pela maior parte dos codificadores daí para a frente.

Figura 4: Variação de janelas: (a) sinal original, (b) sinal reconstruído com um bloco de tamanho N=1024 (maior ruído pré-eco), (c) sinal reconstruído com um bloco de tamanho N=256 (menor ruído pré-eco).

Em seguida, o codificador OCF (Optimum Coding in the Frquency domain) apresentou três novas particularidades face ao ATC que viriam a ser utilizadas pela maioria dos codificadores daí em diante; são elas: o uso da MDCT, uso de quantificação não uniforme e ainda a introdução da codificação de Huffman para codificar os coeficientes espectrais quantificados. Outra particularidade importante deste codificador é o facto de usar dois mecanismos de controlo, um controlando o débito de codificação ou o ruído de quantificação por banda, permitindo assim ajustar melhor os passos de quantificação para o débito pretendido, de acordo com o limiar de mascaramento estimado pelo modelo psicoacústico.

Cerca da mesma altura surgiu o codificador PXFM (Perceptual Transform Coding), ainda que muito semelhante ao OCF, apresenta duas ligeiras diferenças com alguma importância para os futuros codificadores: o facto de utiliza janelas para o cálculo da MDCT com sobreposição de 1/16 e o facto de codificar os canais canais estéreo em conjunto, processando a soma e a diferença entre eles. Esta técnica representa uma novidade bastante importante uma vez que tira partido da grande semelhança existente entre os sinais de cada canal, permitindo explorar ainda mais redundância e irrelevância.

Por fim, estes codificadores seriam seguidos de novos codificadores que serviram para o desenvolvimento do primeiro sistema normalizado, o MPEG. São eles o MUSICAM e o ATAC. Na próxima secção apresentamos estes codificadores de forma mais detalhada, particularmente na formação das normas MPEG áudio.

1 - 2 - 3 - 4 - 5 - 6