MP3 Vs AAC

Mp3 História

Desde a expansão da Internet nos anos 90, o MPEG-1/2 Layer-3 é considerado um caso de sucesso comparativamente com outras tecnologias de compressão áudio. Tal facto deve-se essencialmente ao aparecimento de computadores rápidos a processar, descodificar e codificar ficheiros áudio, placas de som para o mercado doméstico, difusão do CD-ROM e CD-Audio por parte das editoras e distribuidores de música e a partilha ilegal de ficheiros áudio. Ser um padrão aberto teve um profundo impacto na interoperabilidade dos equipamentos, dando aos fabricantes grande margem de manobra no desenvolvimento de melhoramentos ao nível da codificação e descodificação de dados áudio MPEG sem alterar o código base.

A primeira fase do trabalho do grupo MPEG (Moving Pictures Experts Group) recebeu o nome MPEG-1 sendo iniciado em 1988 e término em no final de 1992. A secção de codificação áudio do MPEG-1 descreve um sistema de codificação genérico, desenhado para corresponder às exigências de muitas aplicações e consiste em três modos denominados Layers, aumentando em complexidade e desempenho da Layer-1 para a Layer-3. Esta última apresenta o modo com maior complexidade e optimizado para dar alta qualidade a débitos baixos, aproximadamente 128 kbit/s para um sinal stereo. A Layer-2 aplica o modelo Psico-acústico de forma mais eficiente, é capaz de suprimir mais redundância num sinal e requer uma codificação/descodificação mais complexa do que a Layer-1. Por fim a Layer-1 possui baixa complexidade e é direccionada para aplicações onde o codificador desempenha um papel crítico.

Após a sua elaboração em 1991, o MPEG-1 Layer-3 foi fonte de diversas investigações no que toca a técnicas de codificação perceptiva e de eficiência de compressão. A tarefa de um sistema de codificação de percepção áudio é, fundamentalmente, comprimir dados de áudio digital de forma eficiente e reconstruir os dados áudio nos dados áudio originais, dentro do possível. A baixa complexidade é outro dos requisitos ao desenvolver técnicas de compressão áudio assim como a flexibilidade para utilização numa panóplia de aplicações. Esta técnica é designada Codificação Perceptiva e usa o conhecimento do sistema acústico humano (modelo Psico-acústico) para obter eficiência com compressão de informação irrelevante (técnica de compressão com perdas), em que os dados descodificados não são réplicas exactas ao bit dos dados originais.

Na figura em baixo é apresentado um diagrama de blocos simples de um sistema de codificação perceptiva. O bloco Filterbank é usado para decompor o sinal de entrada em componentes espectrais sub-amostradas no dominó tempo/frequência, formando um sistema de análise/síntese juntamente com o Filterbank no descodificador. O Perceptual Model usa o sinal de entrada no domínio do tempo e/ou o sinal de saída do Filterbank de análise para gerar uma estimativa do limiar (threshold) actual de camuflagem (e que depende do tempo e da frequência), usando as propriedades do Modelo Psico-acústico. A quantização e codificação das componentes espectrais permitem manter o ruído, introduzido pela quantificação, abaixo do limiar. Finalmente, no bloco Encoding of Bitstream os coeficientes espectrais quantizados e codificados são agregados juntamente com alguma informação complementar (side information).

Diagrama de Blocos de um sistema de codificação perceptiva

O MPEG-2 é a segunda fase do MPEG e introduziu muitos novos conceitos, especialmente na codificação de vídeo uma vez que a televisão digital era o principal âmbito deste padrão. Em 1994, o padrão de áudio MPEG-2 original consistia apenas em duas extensões do MPEG-1, suporte para compatibilidade directa e inversa na codificação de sinais multicanal, e a adição das frequências de amostragem 16 kHz, 22.05 kHz e 24 kHz às frequências de amostragem típicas do MPEG-1, permitindo uma codificação eficiente a débitos baixos. Na secção AAC deste estudo será apresentado em mais detalhe o MPEG-2 Advanced Audio Coding (AAC), um sistema de codificação genérico para sinais stereo e multicanal.