Sistema auditivo humano



O som é uma onda mecânica, que ao entrar no ouvido humano é transformado num sinal electroquímico que é posteriormente processado no cérebro.
Estudando este sistema e as suas limitações, é possível comprimir mais informação, nas zonas onde o sistema auditivo humano é menos sensível, conseguindo assim, uma maior poupança de bits sem perda notória da qualidade do som por parte do ouvinte.
Para o estudo do sistema auditivo humano, desenvolveram-se modelos psicoacústicos, de onde se destacam 3 factos que são explorados pela codificação de áudio.

Limiar da audição em silêncio

 

A intensidade sonora mínima para que um determinado som seja audível pelo ouvido humano varia consoante a frequência o mesmo, [1] na figura 1 pode-se verificar que o ouvido humano é mais sensível nas frequências entre os 2kHz e os 5kHz.



Limiar da audição
Figura 1 - Limiar da audição em silêncio. [2]



Qualquer som abaixo do limiar de audição não necessita de ser codificado, já que o ouvinte não será capaz de o ouvir.

O limiar de dor define-se como a intensidade de som acima da qual provoca danos no ouvido humano.[3]

Sabe-se também por testes, que o ser humano em média é incapaz de detectar frequências abaixo dos 20 Hz e acima dos 20 kHz,[4] sendo que o limite superior vai diminuindo com a idade, logo não é necessário codificar sons fora dessas frequências.

Masking na frequência



O limiar de audição para cada frequência é alterado na presença de outras frequências,[5] isto é, no caso de termos um trecho de áudio com mais do que uma frequência o nosso limiar de audição altera-se, sendo que algumas frequências ficam “mascaradas” pelas outras, como se pode verificar pela figura 2.



Limiar da audição na presença de uma frequencia de masking

Figura 2 - Limiar da audição na presença de uma frequencia de masking.[6]

Assim sendo podemos poupar bits ao não codificar as frequências que são “mascaradas”.



Masking temporal



Como vimos, quando estamos na presença de uma frequência de masking há certas frequências que não são detectadas pelo ouvido humano, quando a frequência de masking desaparecer o nosso ouvido leva um certo tempo até restaurar o seu limiar de audição normal, a este efeito chama-se de masking temporal. [7] (figura 3)



Masking temporal

Figura 3 - Masking tamporal.[8]



Assim sendo não é necessário codificar som que esteja “mascarado” pois não é perceptível pelo ouvido humano.[9]