Tecnologia

MP3


            O mp3 é o acrónimo da norma MPEG-1/2 Audio Layer 3, e tem um tipo de compressão lossy.

As taxas de compressão alcançadas pelo mp3 dependem da qualidade desejada, podem chegar até 320 kbit/s (qualidade máxima), em que a redução do tamanho do arquivo é de cerca de 25%. Existe a possibilidade de utilizar outras taxas de compressão: 128 kbit/s; 192 kbit/s; 256 kbit/s.[2]

Para alcançar estas taxas de compressão o mp3 utiliza para além das técnicas habituais de compressão, os estudos de psicoacústica, que permitem aproveitar as limitações e imperfeições do sistema auditivo humano. Essas limitações baseiam-se:

§       na faixa de frequência audível dos seres humanos (varia de 20 Hz a 20 kHz);

§        no limiar da audição na faixa de frequência audível;

§        no mascaramento temporal e na frequência.

Para se tirar proveito desta limitações: 

Ø     Aplica-se o teorema de Nyquist, ou seja, amostra-se o sinal pelo menos ao dobro da sua frequência máxima de interesse que é 20 kHz, portanto basta amostrar a 40 kHz. Na prática a taxa da amostragem utilizada é de 44,1 kHz, ou seja, tem-se em consideração 10% de tolerância, desta forma funciona como um filtro passa baixo (remove todos os componentes de frequência acima de 20 kHz);

Ø     Tem-se em consideração que a sensibilidade para os sons varia com a frequência, portanto, a abordagem consiste em descartar amostras que se encontrem abaixo do limiar da audição humana; 

Ø     Faz-se o mascaramento auditivo, na frequência. Que acontece quando um som é mascarado por outro de maior intensidade e de frequência próxima. Para se tirar partido deste efeito descarta-se os sinais não audíveis. Como está demonstrado na Figura 4;

Ø     Existe ainda o mascaramento no tempo, em que um som forte é precedido por um mais fraco e se encontram numa frequência próxima, portanto descarta-se os sons que seriam mascarados. Este efeito apresenta-se na Figura 5.

 

 

 

 

                                                                        

                    Figura 4 – Mascaramento na frequência [10]                                                    Figura 5 – Mascaramento no tempo [10]

Tendo em conta o que foi exposto anteriormente, apresenta-se na Figura 6 um esquema de blocos de um codificador de áudio mp3.

 

Figura 6 – Esquema do codificador do formato mp3 [1 ]

                Um arquivo de mp3 é constituído por múltiplos frames, cada frame possui um cabeçalho (MP3 Header) e dados (MP3 Data) como se ver na Figura 7 e 8 [2].

 

                                                                                                      

  

Figura 7 – Frame MP3

 

                                                                            Figura 8 – Arquivo MP3

                Os arquivos podem, também, conter metadados (ID3 Metadata). Os metadados permitem obter informações como o título, artista e álbum. Esta estrutura está evidenciada na Figura 9.

 

 

 

 

Figura 9 – Estrutura do mp3 com metadados

                                    Considerando o seguinte exemplo pode-se ver os detalhes de um MP3 header na Figura 10 [2].

 

Bits

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

Binário

1

1

1

1

1

1

1

1

1

1

1

1

1

0

1

1

1

0

1

0

0

0

0

0

0

1

0

0

0

0

0

0

Hex

F

F

F

 

B

 

A

0

 

 

 

4

 

 

 

0

Significado

Palavra de sincronização MP3

Versão

Layer

Protecção Erro

Ritmo Binário

Frequência

Pad.Bit

Priv. Bit

Modo

Extensão modo

Copia

Original

Ênfase

Valor

Palavra de sincronização

MPEG

Layer 3

Não

160

44100 Hz

Frame is not padded

Desconhecido

Joint Stereo

Intensidade Stereo Off

MS Stereo Off

Não foi copiado

Copia do original

Nenhuma

Figura 10 – Exemplo de um cabeçalho MP3 e os seus detalhes

 

Back

Home