Codificação de Áudio

Tecnologia


mp3

AAC

SBR

 

           

Para se codificar um sinal de áudio analógico, que tem características sinusoidais, o primeiro passo é fazer a amostragem a um determinado ritmo, onde se divide o sinal no tempo (em fatias). Quanto maior for o ritmo de amostragem, mais finas são as fatias. O passo seguinte é a quantização de cada uma das fatias, ou seja, criam-se níveis escalados. Os valores referentes as fatias vão ser comparados a esses níveis, criando assim um sinal escalado. Daqui pode-se concluir que a eficácia da quantização é directamente proporcional ao ritmo de amostragem e aos níveis de quantização. Nas Figuras 1 e 2 apresenta-se dois exemplos do mesmo sinal com ritmos de amostragem diferentes.

 

 

 

 

                  

Figura 1 – Ritmo de amostragem = 1000, quantização = 10 [9]                                                           Figura 2 – Ritmo de amostragem = 4000, quantização = 40 [9]

                A partir da quantificação e da quantização obtem-se um sinal discreto ao qual se pode aplicar métodos matemáticos e computacionais, deste modo consegue-se a implementação de vários algoritmos (sequência de encadeamento lógico) para obter compressão. Quem elabora o processo de compressão é o codificador, em que uma das suas funções é identificar a redundância e definir a irrelevância.

No caso do áudio a redundância é temporal, ou seja, explora-se as partes do sinal que não se alteram ao longo do tempo. Deste modo, têm-se amostras do sinal constantes durante um grande intervalo de tempo, e substitui-se todas essas amostras por apenas um bit que as representa a todas. Assim diminui-se o número de bits necessários para a representação do sinal de áudio.

Em adição explora-se a irrelevância que está intimamente ligada com a psicoacústica (modelo matemático do sistema auditivo humano) em que se procura explorar as zonas de menos sensibilidade auditiva para se “esconder” algum do ruído de codificação, de modo a diminuir o débito da representação codificada das amostras do sinal de áudio.

                Apresenta-se na Figura 3 um esquema geral de um codificador de áudio.

Figura 3- Esquema de blocos de um codificador de áudio perceptível [1]

                Existem várias normas, que consistem em soluções desenvolvidas por um organismo internacional, que impõem algumas regras. As quais são suficientes para que exista interoperabilidade entre os diversos dispositivos que usam essa norma, dando algumas sugestões de implementação.

                O formato pode ou não usar uma norma, é mais restrito ao nível de implementação diminuindo um pouco a liberdade. A titulo de exemplo se pretender implementar algo num formato Y já existente, a única melhoria/inovação que pode efectuar encontra-se no modo como se codifica o sinal, uma vez que o descodificador para o mesmo formato, é igual para todos os fabricantes, obrigando deste modo a existência de interoperabilidade.

                Portanto, a complexidade do codificador é independente do descodificador, o produto final do codificador tem de estar segundo um formato para que o descodificador o possa interpretar, independentemente do modo como se gerou esse stream de informação.

                Os formatos mais importantes são: o mp3; AAC e SBR. Existem outros formatos como: o vorbis; mp4; wav e VQF (Transform-domain Weighted Interleave Vector Quantization).

 

Home