Instituto Superior Técnico
Comunicação de Áudio e Vídeo
MP3

História

1936É inventada a técnica PCM (“Pulse Code Modulation”) que permitiu a representação digital de um sinal analógico.   

1970Inicia-se investigação sobre codificação de áudio de alta qualidade com baixos débitos.  

1979 – É desenvolvido o primeiro processador digital de sinal, com a capacidade de comprimir áudio. 

1987 – É formada uma aliança entre a Erlangen-Nuremberg e o Fraunhofer Institut Integrierte Schaltungen, para a emissão de áudio digital. 

1989 – Karlheinz Brandenburg, termina a sua tese de doutoramento em Codificação Óptima no domínio da frequência e o Fraunhofer Institut Integrierte Schaltungen recebe uma patente alemã de tecnologia usada no MP3. 

1991 – Surgiram dois algoritmos de codificação de áudio, o ASPEC e o MUSICAM. 

1992 – A norma MPEG-1 é normalizada.  

1996 – É emitida uma patente Norte-Americana para o MP3. Nesta altura o formato já tinha muito sucesso. 

1998 – A era do MP3 portátil começa com a introdução do “Diamond Multimédia Rio” nos Estados Unidos e do “Saehan Information Systems's MPMAN”, na Coreia.

  

Hoje em dia, existe uma série de codificadores concorrentes do MP3, que tentam ganhar espaço no mercado. No entanto, o legado que o MP3 tem, permite-lhe continuar a ser a norma de codificação de áudio mais utilizada. Apesar dos seus concorrentes serem mais modernos, o valor acrescentado aos olhos do utilizador não é suficientemente grande para que tomem o lugar que o MP3 ocupa actualmente.


1936

 O PCM é uma técnica que permite transformar um sinal analógico em digital.

A principal diferença entre um sinal analógico e um sinal digital é que, o primeiro é algo contínuo no tempo, enquanto o segundo é discreto, ou seja, é uma sequência finita de valores. Na figura seguinte é perceptível a diferença, entre um sinal contínuo e um discreto.

Então como é que se transforma um sinal de áudio analógico num digital?

A resposta é mais simples do que possa parecer…

O primeiro passo é amostrar o sinal, ou seja, transformar o sinal contínuo num sinal discreto, como mostra a figura. Existe um teorema (Teorema da Amostragem de Nyquist), que garante que, se a frequência de amostragem for dupla da frequência do sinal, obtemos um sinal que permite recuperar o original sem perdas de informação.

 

O segundo passo da digitalização consiste em atribuir símbolos às amostras que se obtêm da amostragem. É aqui que entram os bits do mundo digital… Como não se dispõe de um número infinito de bits, para representar todos os valores possíveis que uma amostra pode ter, é necessário “arredonda-los” a patamares previamente definidos, que dependem do número de bits disponíveis. Por exemplo: se quisermos representar o sinal usando apenas 8 bits/amostra teremos uma gama de 28 (256) valores que as amostras podem tomar.

Tipicamente um sinal de áudio digitalizado em PCM, aquele que se encontra nos CDs, utiliza 16 bits/amostra.


1970

Na Universidade Erlangen-Nuremberg na Alemanha, o Professor Dieter Seitzer, começou a investigar a codificação de áudio de alta qualidade com baixos débitos para transmissão de música pelas linhas telefónicas, sendo para isso formada uma equipa de especialistas.

A técnica de digitalização PCM não poderia ser considerada para este efeito, já que necessita de débitos muito elevados. Foi por isso que se começou a pensar-se em codificar o sinal PCM, de maneira a obter-se um sinal comprimido que não tivesse requisitos de débito tão grandes.


1979

A equipa formada em 1970 desenvolve este processador digital de sinal, com a capacidade de comprimir áudio. Nesse mesmo ano um aluno do Professor, Karlheinz Brandenburg (responsável pela investigação no Fraunhofer Institut Integrierte Schaltungen), estuda a codificação de áudio tendo em conta as propriedades do ouvido humano e são desenvolvidos novos algoritmos de codificação. 


 1987

Esta aliança foi formada através do projecto europeu EUREKA com o objectivo de emitir áudio digital (D.A.B. Digital Áudio Broadcasting) e mais tarde veio a integrar-se na norma MPEG-1 Audio Layer 2 (MP2).


1989

Na tese de Karlheinz Brandenburg estão descritas as características de um eventual codificador de MP3, como um filtro de alta-frequência, quantificação não uniforme e codificação de Huffman. O algoritmo inventado por Karlheinz, restringia a gama dinâmica (relação entre as amplitudes máxima e mínima), aproveitando a irrelevância do sistema auditivo humano.


1991

Com as contribuições da Universidade de Hannover, AT&T e Thomson, a equipa de investigadores melhora o algoritmo de Codificação Óptima no domínio da frequência, resultando num novo algoritmo chamado ASPEC (Adaptive Spectral Perceptual Entropy Coding).

O algoritmo ASPEC, e outro chamado MUSICAM (Masking pattern adapted Universal Subband Integrated Coding And Multiplexing), foram usados para a codificação de áudio no desenvolvimento das normas MPEG (Moving Picture Experts Group), para vídeo digital.

Depois de testes formais, as propostas ASPEC e MUSICAM foram utilizadas para criar uma família de 3 níveis hierárquicos na norma MPEG-1: Audio Layer 1, variante de baixa complexidade do MUSICAM; Audio Layer 2, versão optimizada do MUSICAM e Audio Layer 3 baseado no ASPEC.

Devido à sua baixa complexidade a norma Audio Layer 2 foi usada na emissão digital de áudio. Esta norma, apesar de menos complexa que a ASPEC, foi a chave para transmitir áudio de alta qualidade via linha telefónica ISDN (Integrated Services Digital Network).

Ainda assim, equipamento com a norma ASPEC foi vendido a alguns estúdios, estações de rádio e a utilizadores profissionais.

O MPEG-1 Audio Layer 3 (MP3), acabou por ser uma evolução do ASPEC que também utilizou conceitos Áudio Layer 2. Inicialmente pensou-se que o MP3 não seria usado por ser muito complexo, foi apenas concebido para preencher a camada de alta qualidade dos codificadores áudio MPEG-1. No entanto com a evolução do poder computacional tornou-se simples implementar e massificar o codificador.


1992

A ISO (International Organization of Standardization), normaliza a norma MPEG-1 para ser usada em vídeo CDs.

São especificados 3 codecs audio, Audio Layer-1, 2 e 3 (MP3).


1998

Os leitores usavam memória flash para armazenar ficheiros MP3, descarregados da Internet ou extraídos de um CD de música. Devido à popularidade do MP3, começaram a surgir muitas lojas de música on-line, e muitos outros leitores de MP3.

Foi também nesta altura, que a Fraunhofer começou a exercer os seus direitos de patente, obrigando todos os fabricantes de codificadores e descodificadores a pagar pelos direitos do uso da tecnologia. Isto fez com que começassem a surgir uma série de novos formatos, que não tinham obrigações com patentes.