Multimédia Móvel
Comunicação de Áudio e Vídeo
Codecs Áudio
Ao falar sobre normas de compressão de som torna-se necessário fazer a distinção entre compressão de áudio e compressão de voz.
Em relação ao áudio, há que considerar frequências de amostragem superiores, maior amplitude do som e de variações no espectro, e finalmente, uma maior expectativa de qualidade do lado do receptor.
Relativamente à codificação de voz, existem modelos que exploram as propriedades da voz humana, associados ao modelo psico-acústico que explora as propriedades do sistema auditivo humano, também utilizado na codificação de áudio. O conjunto destes dois modelos, explorando simultaneamente as características do emissor e do receptor, permite uma melhor eficiência de compressão. No entanto, existe um ponto em comum: a noção de qualidade do som é subjectiva, baseando-se nas capacidades auditivas humanas, e portanto depende de efeitos fisiológicos e psicológicos.
Apresentamos em seguida os Codecs Áudio mais relevantes.
MPEG 1 Audio Layer 3: MP3
Este modo de compressão de áudio faz parte da norma MPEG 1. Foi desenvolvido com o objectivo de codificar áudio com uma qualidade próxima do CD (PCM), com um débito de 128 kbit/s e um factor de compressão típico de 12.
A compressão de áudio assenta em dois princípios fundamentais:
- Mascaramento: Ter em consideração que a percepção de um som é afectada pela presença de outro. Na imagem abaixo descreve-se este fenómeno, exemplificando que um som de elevada amplitude, a 1kHz, afecta a percepção dos restantes sons entre os 0,5 e os 5kHz (superfície a verde).
- Perceptive Coding: Não é necessário transmitir informação com detalhe superior ao que pode ser percebido pelo sistema auditivo humano.
A arquitectura de um Codec MP3 está representada na figura abaixo.
A amostra de áudio é processada num bloco híbrido de transformação tempo – frequência, e simultaneamente enviada para um bloco onde lhe é aplicado um modelo psico-acústico, processando o mascaramento. O bloco “distortion control” tem a seu cargo o controlo do débito de codificação e do ruído de quantificação. Por fim, a informação necessária ao descodificador é adicionada ao áudio codificado de modo a formar um “.mp3” válido.
MPEG-2 Part 7: AAC
Apresenta, em geral, as funcionalidades do MP3, oferecendo ainda codificação multi-canal, com e sem compatibilidade inversa com a norma MPEG-1 Áudio. Em geral, permite atingir melhor qualidade do som, e melhores taxas de compressão (no caso em que não apresenta compatibilidade inversa), o que torna o AAC uma boa solução para aplicações exclusivamente áudio, e para sistemas de televisão e videoconferência.
Compressão de Voz – AMR
O sistema AMR - Adaptive Multi Rate – foi inicialmente desenvolvido no âmbito de uma parceria entre Ericsson, Nokia e Siemens, e foi adoptado pela 3GPP como norma de compressão de voz em 1998.
Este modo de compressão tem dois principais requisitos: alta qualidade a baixo débito e robustez a erros em débitos elevados. Sendo estes requisitos difíceis de conciliar, cedo se chegou à conclusão de que este standard não poderia basear-se num débito fixo.
Assim, desenvolveu-se uma solução auto-ajustável para 8 débitos diferentes, entre 4.75 e 12.2 kbit/s, consoante as condições do canal. Estas características introduzem uma melhoria significativa na qualidade das transmissões em relação aos serviços já existentes em GSM. Mais tarde foi desenvolvido o AMR-WB, que foi seleccionado pela 3GPP como standard de serviços de voz para 3ª geração. Em 2001 foi também adoptado pela ITU-T para débitos na ordem dos 16kbit/s.
Este modo de compressão usa uma largura de banda dos 3.4 kHz aos 7kHz, em oposição ao AMR, cuja banda é limitada entre os 200 e os 3400Hz, passando a ser conhecido por AMR-NB (Narrowband).
O AMR-WB introduz melhorias substanciais na codificação de voz, apresentando uma operação robusta mesmo na presença simultânea de erros de canal e elevado nível de ruído de fundo.