2. Psicoacústica

Para uma melhor compreensão do tipo de codificação a que se deve submeter um determinado sinal deve-se em primeiro lugar conhecer e saber caracterizar tanto a fonte, como o receptor do mesmo. No caso dos sinais de áudio é bastante complicado caracterizar de modo completo a sua fonte, dado que existe um número infinito de sons que podem ser produzidos. Sendo assim, exceptuando o caso da voz humana em que também é possível caracterizar de uma forma bastante completa a fonte, será mais interessante conhecer o receptor destes sinais: o sistema auditivo do ser humano.

Para este efeito é estudada a percepção subjectiva por parte dos humanos das características do som, especificamente a sua frequência e amplitude. Este estudo é designado por psicoacústica.


2.1. Sensibilidade

Em média, o sistema auditivo humano permite uma audição de sinais sonoros com uma frequência entre 20 Hz e 20 kHz, podendo existir algumas diferenças de pessoa para pessoa. Este intervalo é também influenciado pelo processo de envelhecimento, sendo que apesar de na idade infantil se poder ouvir sons acima dos 20 kHz, aos 20 anos este limite pode já ter baixado para os 16 kHz.

Por outro lado, considera-se que o humano consegue ouvir sons entre, aproximadamente, os 0 e os 130 decibéis. Define-se assim os 130 dB como limite de dor (threshold of pain) para o ouvido humano. [2]

De notar que ambos os intervalos indicados (intervalos de frequência e amplitude) não são independentes. Estes relacionam-se, o que resulta num limite de audição (threshold of hearing) tal como é demonstrado na Figura 1.

Da figura é ainda possível concluir que o sistema auditivo humano tem um melhor desempenho (detectando sons com menor amplitude) entre os 1 kHz e os 10 kHz, com o mínimo som a ser ouvido aproximadamente aos 4 kHz.



Figura 1, Limiar de audição e de dor do humano


2.2. Mascaramento

Depois da análise à sensibilidade auditiva do humano aquando da audição de um som isoladamente, resta estudar como esta é afectada pela presença de outro qualquer sinal sonoro. Este fenómeno é designado por mascaramento (masking) e é de fulcral importância na compressão áudio.

Para melhor se demonstrar este fenómeno recorre-se a um exemplo onde se considera um sinal A numa determinada frequência fc, cujo máximo de amplitude se encontra nos 10 dB. Depois de se verificar a correcta detecção deste sinal é adicionado na mesma frequência fc um outro sinal, denominado B, com 26 dB. Em resultado verifica-se que o sinal A acaba por não ser detectado, sendo “abafado” pelo sinal B. Sendo assim, para A voltar a ser ouvido terá que ultrapassar o novo limite de 26 dB, imposto por B. Este exemplo é ilustrado na Figura 2.

Além do mascaramento simultâneo exemplificado anteriormente, pode-se ainda considerar um mascaramento temporal, evidenciado pouco antes de o sinal ser emitido (pré-masking) e prolongando-se por cerca de 160 ms depois de o sinal ter acabado (post-masking), e um mascaramento em frequência, provocando um ligeiro mascaramento nas bandas vizinhas à banda crítica. [3]




Figura 2, Exemplo de mascaramento