Pag. Anterior    Início    Pag. Seguinte

 

3. MP3

 

MPEG-1 Layer III (MP3) é um dos formatos de compressão de áudio mais usados actualmente devido á sua facilidade de uso, nomeadamente a nível da Internet. Este facto deve-se sobretudo à necessidade da troca de ficheiros através da Internet, o que era inviável com os formatos de codificação existentes anteriormente. Foi desenvolvido para reduzir significativamente a quantidade de informação necessária para representar um ficheiro de áudio, tornando-o mais compacto, mantendo o mesmo nível de qualidade auditiva. O MP3 explora as propriedades perceptuais do sistema auditivo humano, tendo como base o modelo psicoacústico, já descrito anteriormente.

Esta tecnologia permite obter níveis de compressão de até 12 vezes à custa de maior complexidade tanto no processo de codificação como no de descodificação. A codificação de MP3 mais simples usa um ritmo de transmissão constante para todo o ficheiro, o que torna a codificação mais rápida. No entanto, é possível criar ficheiros em que o ritmo de transmissão é variável. Algumas partes do áudio são mais fáceis de comprimir, nomeadamente os momentos de silêncio ou música com apenas alguns instrumentos, enquanto que outras são mais difíceis de comprimir. Pode-se aumentar a qualidade do ficheiro comprimido usando um ritmo de transmissão mais baixo no primeiro caso, enquanto que no segundo um ritmo de transmissão mais elevado.

        São usadas várias taxas de transmissão no MP3 sendo a mais comum a de 128 kbps, pois consegue-se uma boa qualidade de áudio com um nível de compressão bastante elevado.

        O MP3 usa um algoritmo de compressão com perdas composto por:

·         Modelo psicoacústico;

·         Filtro com 32 sub-bandas;

·         Transformada Discreta de Co-seno Modificada (MDCT);

·         Quantização;

·         E codificação de Huffman.

O processo de codificação encontra-se apresentado na figura 4.

 

Figura 4 – Esquema do processo de codificação do MP3

 

        Inicialmente, o sinal de áudio passa por um banco de filtros, onde é separado em 32 sub-bandas de igual frequência. O filtro é relativamente simples e fornece uma boa resolução temporal, assim como uma boa resolução em frequência. Apesar de o banco de filtro ter perdas, estas são poucas e inaudíveis.

        MPEG-1 Layer III compensa algumas das deficiências do banco de filtros, processando a saída dos mesmos, com a MDCT. Esta transformada subdivide os sinais de áudio, que se encontram à saída das sub-bandas, em frequência, de modo a obter-se uma melhor resolução espectral.

        As amostras à saída da MDCT não são todas quantizadas da mesma forma, isto para reduzir os erros inerentes ao processo. O código de Huffman é aplicado para se obter os índices de quantização mais adequados conseguindo-se assim a maior eficiência possível. O codificador coordena o comprimento das palavras de código da tabela do código de Huffman de modo a ter uma taxa de transmissão constante. Isto é possível devido ao uso de um reservatório de bits. O reservatório guarda os bits que não são necessários em determinada palavra de código para depois serem usados posteriormente quando são precisos.

        Em seguida são alocados os bits para cada sub-banda de acordo com as informações retiradas do modelo psicoacústico. O último passo do processo consiste na formação da informação binária de saída de acordo com os padrões do MP3. Os bits são armazenados em frames contendo, cada uma, 1152 amostras de áudio por canal. 

        O MPEG-1 Layer III tem diversas aplicações, nomeadamente para sistemas que tenham uma capacidade de canal limitada. Existem três grandes áreas que beneficiam do uso do MP3 são elas a transmissão, a radiodifusão e teledifusão e ainda o armazenamento de dados. Quando uma rádio faz uma transmissão em directo pode usar este sistema para obter uma boa qualidade na emissão. No que diz respeito à radiodifusão reduz-se as tramas de dados utilizando a compressão de áudio para conseguir transmitir mais áudio utilizando o mesmo canal. E por fim, no caso do armazenamento de dados, consegue-se utilizar menos memória para armazenar mais informação de áudio.

        Apesar de todas as vantagens descritas anteriormente em relação à norma MP3 esta tem algumas limitações que restringem a eficiência do código quando comparada com outras normas. MP3 não pode permutar de modo Join Stereo entre as diversas bandas. Depois de especificado um modo (Intensity Stereo ou MS Stereo) para uma determinada banda, esse é mantido para todas as bandas, o que por vezes leva a uma codificação menos eficiente.

        Apesar do uso do reservatório de bits, este pode não ser suficiente. Como as frames são limitadas, por vezes, pode-se ter um excesso de bits, o que pode provocar uma degradação da qualidade do sinal de áudio. Uma outra desvantagem é o facto do tamanho das janelas não ser o adequado para a codificação MP3. No caso dos long blocks o número de amostras é insuficiente o que limita a resolução espectral e consequentemente a eficiência do código. No caso dos short blocks o número de amostras é demasiado elevado o que limita a resolução temporal, provocando uma falta de precisão.

        Para manter a compatibilidade com a norma MPEG-1 Layer II, a norma MPEG-1 Layer III só aplica a transformada MDCT após as bandas serem filtradas do mesmo modo que na norma MPEG-1 Layer II. Esta filtragem introduz um ruído que não é totalmente eliminado e que se traduz numa desvantagem para a norma MP3.

        A norma MP3 permite o uso de mixed blocks tendo como vantagem uma fácil adaptação do sinal às transições de alta-frequência e uma boa resolução a baixas frequência. No entanto, o uso de mixed blocks tem regras rígidas o que impõe uma complexidade adicional no processo de codificação.

        Por último existem limitações ao nível da falta de ferramentas, que actualmente outras normas de codificação já usam, são elas:

·         PNS (perceptual noise substitution);

·         SBR (spectral band replication);

·         TNS (temporal noise shaping);

·         LTP (long term prediction).

 

Pag. Anterior    Início    Pag. Seguinte