Esta absoluta necessidade nos dias de hoje de realizar codificação de áudio está intimamente ligada á necessidade de
efectuar um compromisso viável entre a qualidade e o tamanho dos ficheiros resultantes. Será descrito posteriormente,
quando for apresentada de uma forma resumida a história do MP3, como surgiu esta necessidade de desenvolver ferramentas
de codificação de forma a obter uma transmissão de áudio de alta qualidade, sem que para isso fosse necessário a
transmissão de informação desnecessária e por conseguinte conseguir uma redução do tamanho dos ficheiros a ser transmitidos
que de outra forma levariam eternidades a serem transmitidos
Sinalizada a necessidade durante cerca de 12 anos foram estudados eventuais métodos e algoritmos de codificação de áudio,
estudos estes realizados principalmente por instituições académicas. No culminar destes estudos procedeu-se à criação de
um grupo especializado denominado por MPEG (Moving Picture Experts Group), que passou a ser o principal responsável pela
centralização de grande parte dos estudos realizados com a codificação de áudio e vídeo (este grupo inclui as companhias
Dolby, Fraunhofer (FhG), AT&T, Sony e Nokia). Em 1995 o MPEG tinha chegado ao primeiro conjunto de codec’s de áudio
(Abreviatura de Codificador/ Descodificador) [1].
Este conjunto de codec’s era designado por MPEG-1 e apresentava-se dividido em três camadas (layers), na qual cada camada
traduzia uma relação entre a quantidade de bits, ou informação disponível por segundo (bit-rate), tempo necessário para
codificar entre outros parâmetros. As especificações podem ser organizadas na tabela apresentada abaixo:
Layers
|
Bit Rate
|
Tempo de codificação
|
Layer 1
|
32 - 448 kbit/s
|
19 ms
|
Layer 2
|
32 - 384 kbit/s
|
32 ms
|
Layer 3
|
32 - 320 kbit/s
|
59 ms
|
A ideia fundamental que está na base destes codec’s é o facto de estes serem perceptuais, isto é,
de se basearem numa ideia de que, uma vez que existe erro de codificação, é melhor que este erro se
encontre em zonas onde ele possa ser tolerado.
Figura 1.1 – Diagrama de blocos do Codificador Perceptual
Na figura acima está representado o diagrama de blocos de um codificador perceptual onde é visível o
envio do áudio em PCM em simultâneo para o banco de filtros (Filterbank) e para o modelo perceptual
(Perceptual Model), que integra os algoritmos psicoacústicos e, com base na informação obtida do modelo
perceptual o Quantificador (Quantization & Coding) introduz mais erro de codificação nas zonas para as
quais o sistema auditivo humano é menos sensível. Na fase final do processo o áudio é codificado utilizando
uma codificação entrópica (Enconding Beatstream).
Figura 1.2 – Diagrama de blocos do Descodificador Perceptual
Na figura acima está representado o diagrama de blocos de um descodificador perceptual que efectua o processo
inverso do codificador, ou seja, recebe áudio codificado que vai descodificar (Decoding Beatstream), efectuar
a quantificação inversa (Inverse Quantization) e por fim converter o áudio da frequência para o tempo (Synthesis Filterbank).
Inicialmente a layer preferida era o MP2 que à partida preenchia os requisitos necessários para as mais variadas aplicações,
não era muito complexo e atingia bit-rates aceitáveis. No entanto, após alguns testes optou-se por escolher o MP3 como codec padrão.
Como será demonstrado mais à frente o MP3 englobava as melhores técnicas de codificação da altura com uma complexidade e qualidade
bastante aceitáveis.
Apesar do domínio avassalador do MP3 durante longos anos, os estudos não cessaram e à alguns anos têm-se apostado num outro codec,
mais complexo, mas também mais robusto denominado AAC (Advanced Audio Coding) que tem vindo a ser adoptado por uma larga maioria
de marcas internacionais.
Neste trabalho irá ser feita uma descrição do funcionamento tanto do MP3 como do AAC e por fim apresentada uma comparação entre
ambos aos mais diversos níveis.
|