Normas de codificação de vídeo

Introdução

A necessidade de comprimir vídeo digital advém do enorme débito binário, que resulta da sua representação digital não comprimida, determinado pelo Teorema de Nyquist [1]. Assim, a disponibilização de vídeo digital só é possível devido ao esforço de normalização conduzido pela ITU-T (International Telecommunication Union - Telecommunication Standardization Sector) e pela ISO (International Organization for Standardization) / IEC (International Electrotechnical Commission), em colaboração com as empresas de electrónica de consumo, telecomunicações e universidades. De notar que, a ISO/IEC designa as suas especificações por normas (standards) e a ITU designa as suas especificações por recomendações (recommendations).

Dependendo da aplicação a que se destina o vídeo, os factores de compressão podem ser mais ou menos elevados. Além disso, a subamostragem aplicada às crominâncias em relação à luminância pode variar. Por exemplo, é comum usar o formato de subamostragem das crominâncias 4:2:0 em vídeo digital comprimido, o que significa que o número de amostras de cada crominância é metade do número de amostras da luminância, em ambas as dimensões da imagem, vertical e horizontal. Esta opção resulta da bem conhecida menor sensibilidade do sistema visual humano, em relação à informação de cor.

Ainda que não sejam tecnologicamente tão interessantes como as normas de compressão, existem normas de codificação de vídeo digital, sem compressão, que correspondem a representações com débito muito elevados. A norma de representação de vídeo digital não comprimida mais relevante e referenciada é, sem dúvida, a recomendação ITU-R BT.601 [2]. Esta recomendação tem o objectivo de especificar a amostragem e codificação, sem compressão, de sinais analógicos de televisão, para sistemas com factores de forma 4:3 e 16:9.

Em televisão digital, o formato não comprimido mais usado na Europa é o formato ITU-R 601, 4:2:2 com 576 linhas úteis (25 Hz), enquanto nos EUA se usa o formato ITU-R 601, 4:2:2 com 480 linhas úteis (30 Hz). Em termos de vídeo, estes formatos correspondem ao mesmo débito total, cerca de 166 Mbit/s. Este tipo de débitos, justifica a necessidade absoluta de comprimir e consequentemente de especificar as normas de compressão, que serão apresentadas nas próximas secções.

Antes de passar à apresentação das normas de codificação, é importante perceber, de forma superficial, como funciona o sistema de vídeo, representado na Figura 1. O módulo de pré-processamento é opcional e permite ao emissor de vídeo fazer algum pré-processamento, com o objectivo de realizar alguma conversão de formato, de resolução ou até de algum melhoramento. Depois do codificador (não normativo) fazer a conversão do vídeo original, no fluxo binário codificado (sintaxe e semântica normativas), o descodificador (normativo) descodifica o fluxo recebido, eventualmente com erros devido ao uso de canais ou meios de armazenamento não ideais. O vídeo descodificado é então visualizado após a aplicação ou não do módulo de pré-processamento [3].

Figura 1 - Arquitectura global do sistema de vídeo [3].

Evolução Cronológica

Ao longo dos anos, têm sido definidas diversas normas de codificação de vídeo, no sentido de proporcionar novas formas de experiência aos utilizadores, aproveitando os benefícios da evolução tecnológica. A Figura 2 representa a ordem cronológica do aparecimento dos principais codecs de vídeo.

Figura 2 - Evolução cronológica dos codecs [4].