|
A necessidade de efectuar codificação de áudio está intrinsecamente ligada à necessidade de efectuar um compromisso viável entre qualidade e o tamanho dos ficheiros. Como iremos descrever posteriormente, quando referirmos resumidamente a história do mp3, iremos ver que foi por volta do ano 1970 que passou a existir a necessidade de desenvolver ferramentas de codificação, de modo a poder transmitir áudio de alta qualidade sem que para isso fosse necessário transmitir também informação inútil e portanto ter ficheiros com um tamanho bastante elevado, que poderiam demorar eternidades a ser transmitidos.
Sendo assim, durante cerca de 12 anos foram estudados eventuais métodos e algoritmos de codificação áudio, levados a cabo principalmente por instituições académicas. O culminar destes estudos foi a criação de um grupo especializado denominado MPEG (Moving Picture Experts Group), que passou a ser responsável pela centralização da maior parte dos estudos relacionados com codificação de áudio e vídeo (este grupo inclui as companhias Dolby, Fraunhofer (FhG), AT&T, Sony e Nokia). Por volta do ano 1995, o MPEG, tinha então chegado a um primeiro conjunto de
codec’s de áudio (abreviatura de CODificador DESCOdificador)[1]. Este conjunto de
codec’s era encabeçado pela designação de MPEG-1 e estava dividido em três camadas (layers), na qual cada camada empregava uma relação entre a quantidade de bits, ou informação disponível por segundo (bit
rate), tempo necessário para codificar, etc.
As especificações podem ser organizadas na seguinte tabela:

Tabela 1.1- Especificações MPEG [2]
Apesar de as três camadas empregarem semelhantes técnicas de codificação, dependendo de vários factores relacionados com o objectivo da utilização do ficheiro de som, tais como público-alvo, base suporte para armazenar os ficheiros, etc., iria ser empregue um
codec que conseguisse uma melhor relação entre bit-rate e tempo de codificação.
A ideia fundamental que está por detrás destes
codec’s é o facto de estes serem “perceptuais”, ou seja, de se basearem na ideia de que, uma vez que existe sempre erro de codificação, é melhor ‘escondê-lo’ nas zonas onde ele pode ser melhor tolerado.

Figura 1.1- Diagrama de blocos para um codificador e um descodificador perceptual [3]
Na figura 1.1 temos então o diagrama de blocos tanto para um codificador como para um descodificador perceptual. Para o codificador (diagrama superior) podemos ver que o áudio em PCM é enviado em simultâneo para o banco de filtros (Filterbank) e para o modelo perceptual, que integra os algoritmos psicoacústicos (Perceptual Model), e com base na informação obtida do modelo perceptual, que indica por exemplo que “partes” do áudio são mais sensíveis ao sistema auditivo humano, o Quantificador (Quantization & Coding) introduz mais erro de codificação nas zonas para as quais o sistema auditivo humano é menos sensível. Por fim o áudio é codificado utilizando uma codificação entrópica (Encoding of Bitstream).
O descodificador (diagrama inferior) efectua o processo inverso, ou seja, recebe um pedaço de áudio codificado
(trama áudio - janela) que vai descodificar (Decoding of Bitstream), efectua a quantificação inversa (Inverse Quantization) e por fim converte esse pedaço de áudio na frequência para o tempo (Synthesis Filterbank). [3]
Inicialmente seria o MP2 (MPEG-1 Layer 2) que à partida preenchia estes requisitos necessários para as mais varias aplicações, não era muito complexo e atingia
bit rates aceitáveis. Mas após alguns testes optou-se por escolher o MP3 (MPEG-1
Layer 3) como o codec padrão. Como iremos ver adiante, o MP3 englobava as melhores técnicas de codificação da altura com uma complexidade e qualidade bastante aceitáveis.
Apesar do domínio avassalador do MP3 durante largos anos, os estudos não pararam, e desde alguns anos para cá têm-se apostado num outro
codec, mais complexo, mas também mais robusto, denominado AAC (Advanced Audio Coding), que tem vindo a ser adoptado por uma larga maioria de marcas de peso internacional.
Neste trabalho propomo-nos a apresentar uma descrição do funcionamento tanto do MP3 como do AAC, e no fim apresentar uma comparação entre ambos.
|