História
1936 – É inventada a técnica PCM (“Pulse
Code Modulation”) que permitiu a representação digital de um
sinal analógico.
1970 – Inicia-se investigação
sobre codificação de áudio de alta
qualidade com baixos débitos.
1979 – É desenvolvido o primeiro processador
digital de sinal, com a capacidade de comprimir áudio.
1987 – É formada uma aliança entre a
Erlangen-Nuremberg e o
Fraunhofer Institut
Integrierte Schaltungen, para a emissão de áudio digital.
1989 – Karlheinz Brandenburg, termina a sua
tese de doutoramento em Codificação Óptima no domínio da frequência
e o Fraunhofer Institut
Integrierte Schaltungen recebe uma patente alemã de tecnologia
usada no MP3.
1991 – Surgiram dois algoritmos de
codificação de áudio, o ASPEC e o MUSICAM.
1992 – A norma MPEG-1 é normalizada.
1996 –
É emitida uma patente Norte-Americana para o MP3. Nesta altura o
formato já tinha muito sucesso.
1998 – A era do MP3 portátil começa com a introdução do “Diamond Multimédia Rio” nos Estados Unidos e do “Saehan Information Systems's MPMAN”, na Coreia.
Hoje em dia, existe uma série de codificadores concorrentes do MP3, que tentam ganhar espaço no mercado. No entanto, o legado que o MP3 tem, permite-lhe continuar a ser a norma de codificação de áudio mais utilizada. Apesar dos seus concorrentes serem mais modernos, o valor acrescentado aos olhos do utilizador não é suficientemente grande para que tomem o lugar que o MP3 ocupa actualmente.
A principal diferença entre um sinal analógico
e um sinal digital é que, o primeiro é algo contínuo no tempo,
enquanto o segundo é discreto, ou seja, é uma sequência finita de
valores. Na figura seguinte é perceptível a diferença, entre um
sinal contínuo e um discreto.
Então como é que se transforma um sinal de áudio analógico num digital?
A resposta é mais simples do que possa parecer…
O primeiro passo é amostrar o sinal, ou seja, transformar o sinal contínuo num sinal discreto, como mostra a figura. Existe um teorema (Teorema da Amostragem de Nyquist), que garante que, se a frequência de amostragem for dupla da frequência do sinal, obtemos um sinal que permite recuperar o original sem perdas de informação.
O segundo passo da digitalização consiste em atribuir símbolos às amostras que se obtêm da amostragem. É aqui que entram os bits do mundo digital… Como não se dispõe de um número infinito de bits, para representar todos os valores possíveis que uma amostra pode ter, é necessário “arredonda-los” a patamares previamente definidos, que dependem do número de bits disponíveis. Por exemplo: se quisermos representar o sinal usando apenas 8 bits/amostra teremos uma gama de 28 (256) valores que as amostras podem tomar.
Tipicamente um sinal de áudio digitalizado em PCM, aquele que se encontra nos CDs, utiliza 16 bits/amostra.
Na Universidade Erlangen-Nuremberg na Alemanha, o Professor Dieter Seitzer, começou a investigar a codificação de áudio de alta qualidade com baixos débitos para transmissão de música pelas linhas telefónicas, sendo para isso formada uma equipa de especialistas.
A técnica de digitalização PCM não poderia ser
considerada para este efeito, já que necessita de débitos muito
elevados. Foi por isso que se começou a pensar-se em codificar o
sinal PCM, de maneira a obter-se um sinal comprimido que não tivesse
requisitos de débito tão grandes.
A equipa formada em 1970 desenvolve este
processador digital de sinal, com a capacidade de comprimir áudio.
Nesse mesmo ano um aluno do Professor, Karlheinz Brandenburg
(responsável pela investigação no
Fraunhofer Institut
Integrierte Schaltungen), estuda a codificação de áudio tendo em
conta as propriedades do ouvido humano e são desenvolvidos novos
algoritmos de codificação.
Esta aliança foi formada através do projecto europeu EUREKA com o objectivo de emitir áudio digital (D.A.B. Digital Áudio Broadcasting) e mais tarde veio a integrar-se na norma MPEG-1 Audio Layer 2 (MP2).
Na tese de Karlheinz Brandenburg estão descritas as características de um eventual codificador de MP3, como um filtro de alta-frequência, quantificação não uniforme e codificação de Huffman. O algoritmo inventado por Karlheinz, restringia a gama dinâmica (relação entre as amplitudes máxima e mínima), aproveitando a irrelevância do sistema auditivo humano.
Com as contribuições da Universidade de Hannover, AT&T e Thomson, a equipa de investigadores melhora o algoritmo de Codificação Óptima no domínio da frequência, resultando num novo algoritmo chamado ASPEC (Adaptive Spectral Perceptual Entropy Coding).
O algoritmo ASPEC, e outro chamado MUSICAM (Masking pattern adapted Universal Subband Integrated Coding And Multiplexing), foram usados para a codificação de áudio no desenvolvimento das normas MPEG (Moving Picture Experts Group), para vídeo digital.
Depois de testes formais, as propostas ASPEC e MUSICAM foram utilizadas para criar uma família de 3 níveis hierárquicos na norma MPEG-1: Audio Layer 1, variante de baixa complexidade do MUSICAM; Audio Layer 2, versão optimizada do MUSICAM e Audio Layer 3 baseado no ASPEC.
Devido à sua baixa complexidade a norma Audio Layer 2 foi usada na emissão digital de áudio. Esta norma, apesar de menos complexa que a ASPEC, foi a chave para transmitir áudio de alta qualidade via linha telefónica ISDN (Integrated Services Digital Network).
Ainda assim, equipamento com a norma ASPEC foi vendido a alguns estúdios, estações de rádio e a utilizadores profissionais.
O MPEG-1 Audio Layer 3 (MP3), acabou por ser
uma evolução do ASPEC que também utilizou conceitos Áudio Layer 2.
Inicialmente pensou-se que o MP3 não seria usado por ser muito
complexo, foi apenas concebido para preencher a camada de alta
qualidade dos codificadores áudio MPEG-1. No entanto com a evolução
do poder computacional tornou-se simples implementar e massificar o
codificador.
A ISO (International Organization of Standardization), normaliza a norma MPEG-1 para ser usada em vídeo CDs.
São especificados 3 codecs audio, Audio Layer-1, 2 e 3 (MP3).
Os leitores usavam memória flash para armazenar ficheiros MP3, descarregados da Internet ou extraídos de um CD de música. Devido à popularidade do MP3, começaram a surgir muitas lojas de música on-line, e muitos outros leitores de MP3.
Foi também nesta altura, que a Fraunhofer começou a exercer os seus direitos de patente, obrigando todos os fabricantes de codificadores e descodificadores a pagar pelos direitos do uso da tecnologia. Isto fez com que começassem a surgir uma série de novos formatos, que não tinham obrigações com patentes.