De modo a se conseguir compreender o funcionamento de um codificador de voz em geral é importante perceber o que se está a codificar, neste caso perceber bem o que é a voz, como é produzida e as suas características únicas, pois, o codificador vai explorar todos estes factores de modo a ser o mais eficiente possível.
Antes da voz ser codificada passa por um processo natural complexo. A produção de voz inicia-se nos pulmões que forçam ar para fora com a ajuda do diafragma. O ar forçado para fora dos pulmões faz vibrar as cordas vocais que dão origem á voz. Este som criado pelas cordas vocais é amplificado pela faringe, laringe e boca. Quando as cordas vocais estão em contacto o ar expelido pelos pulmões fá-las vibrar, abrindo e fechando alternadamente deixando passar o ar em sopros (Figura 2). A frequência da voz é determinada por esta vibração. Este abrir e fechar com a mesma frequência base é denominado por pitch. Nos homens esta frequência está tipicamente entre os 80-160Hz e nas mulheres entre os 180-320Hz. Este frequência é em grande parte determinada pelo comprimento das cordas vocais. Esta periodicidade da voz é muito importante no desenvolvimento dos codificadores.
As frequências no espectro da voz são controladas pela forma do tracto vocal, por exemplo, pelo movimento da língua. Uma parte importante dos codificadores de voz é a modelação do tracto vocal num filtro e visto que a forma do tracto vocal varia poucas vezes, a função transferência do filtro modelado também não precisa de ser actualizada frequentemente [4][5].
Bem como a fala, o sistema auditivo (Figura 3) tem propriedades únicas que são muito importantes para o desenvolvimento de codificadores, pois vão ser estas características que vão determinar as irrelevâncias mais á frente mencionadas.
O Sistema auditivo humano só consegue distinguir as frequência num espectro limitado de 16 – 20 000 Hz. A largura de banda da voz por outro lado é bastante mais reduzida, sendo que nas telecomunicações apenas se consideram para a voz as frequências dos 300 aos 3400 Hz.
![]() |
![]() |