5. MPEG-2


Em Novembro de 1994, o ITU-T em conjunto com o ISO (International Organization for Standardization) estabeleceram a norma MPEG-2 (H.262 para o ITU-T). Esta norma mantém todas as características do MPEG-1, contudo, acrescenta uma codificação de conteúdos entrelaçados e várias formas de escalabilidade.
Para codificar em modo Intra imagens entrelaçadas, são possíveis duas estruturas: trama ou campo. Na primeira, o MB é tratado como se a imagem fosse progressiva. Este, para a aplicação da DCT, divide-se em quatro blocos em que cada um contém linhas pares e ímpares. Esta estrutura é mais indicada quando existe pouco movimento, porque existe pouca diferença entre dois quadros adjacentes. Na estrutura campo, o MB divide-se também em quatro blocos, porém, dois destes blocos contêm linhas pares e os outros dois, linhas ímpares. Esta estrutura é mais indicada quando há muito movimento e pouco detalhe, uma vez que ao fazer a junção de linhas ímpares ou pares, vai fazer que dois pixels distantes sejam codificados como vizinhos. A ilustração 4 ilustra os dois modos. No caso de estimação de movimento, são possíveis três modos. No modo trama, um MB dum campo ímpar é usado pela predição do MB correspondente no campo ímpar seguinte, e o mesmo pelos campos pares. O vector de movimento correspondente tem a duração de uma imagem (40 ms a 25 Hz). No modo campo, um MB é codificado em relação ao MB correspondente do campo anterior, e o vector de movimento correspondente tem a duração de um campo (20 ms a 25 Hz). No modo misto, a codificação é feita em relação ao MB de duas tramas.

Os dois modos de codificação para imagens entralaçadas na MPEG-2.

Ilustração 4. Os dois modos de codificação para imagens entralaçadas na MPEG-2.

Para o varrimento dos coeficientes DCT , em vez da ordem em zig-zag, pode ser usado, para as imagens-trama, a ordem alternada, apresentado na ilustração 5, onde se codificam antes os coeficientes correspondentes a transições verticais. Isto porque a correlação vertical para imagens com muito movimento é pouca em relação à correlação horizontal (duas linhas adjacentes são adquiridas muito depois de que dois pixels adjacentes na mesma linha).

Diferença entre o varrimento a zig-zag e o varrimento alternado.

Ilustração 5. Diferença entre o varrimento a zig-zag (à esquerda) e o varrimento alternado (à direita).

A escalabilidade é uma funcionalidade que visa uma descodificação útil do sinal comprimido, descodificando apenas algumas das suas partes. A norma prevê diferentes formas de escalabilidade. Com a escalabilidade na frequência (ou data partitioning) os diferentes níveis contêm um diferente subconjunto dos coeficientes DCT, correspondentes a frequências diferentes. A norma prevê dois níveis, o nível base e o nível de melhoramento. Ao primeiro atribui-se dados de endereçamento e controlo, bem como os coeficientes DCT de mais baixa frequência. Este nível é transmitido num canal de mais alta prioridade ou sujeito a um código de correcção de erros mais poderoso. O nível de melhoramento contém o restante da informação codificada. Com a escalabilidade espacial, o vídeo é codificado em vários níveis com resoluções espaciais diferentes. O nível de base é constituído por tramas I e P, enquanto os níveis de melhoramento são codificados como um conjunto de tramas P e B. A trama actual de um nível de melhoramento pode ser prevista fazendo uso da trama correspondente do nível anterior ou da trama anterior do mesmo nível. Com a escalabilidade de qualidade, ou de SNR (Signal-to-Noise Ratio), muda a precisão da quantificação nos níveis. O nível base é codificado com degraus de quantização mais largos; os níveis de melhoramento contêm a diferença entre o sinal do nível anterior e o sinal original, codificada com degraus de quantização mais largos. A escalabilidade temporal permite ter níveis com resoluções temporais diferentes. No nível base, são enviadas apenas algumas imagens da sequência codificada. Nos níveis de melhoramento envia-se as restantes. É também possível combinar as várias formas de escalabilidade para obter una escalabilidade híbrida.
A escalabilidade é útil para, por exemplo, transmitir o mesmo vídeo a descodificadores normais, que o devem descodificar com a resolução básica, e a descodificadores HD (High Definition), que o podem descodificar com a resolução mais alta. Também é útil para garantir, no mesmo descodificador, uma qualidade básica em condições difíceis e uma melhor qualidade com melhores condições de recepção.
O MPEG-2 organiza o conjunto das ferramentas de codificação que disponibiliza por perfis. Cada perfil é um subconjunto de funcionalidades, definidos para satisfazer diferentes conjuntos de aplicações, e que podem ser suportadas de forma separada. São também definidos níveis de qualidade. Para cada nível é prevista uma gama de variação de parâmetros, como resolução espacial e temporal.
A norma MPEG-2 prevê quatro níveis de resolução:

Prevê, depois, vários perfis:

MPEG-2, pela possibilidade de codificar imagens entrelaçadas, como a compatibilidade com os aparelhos de televisão analógica requer, é usado na transmissão da televisão digital, também em definição normal e HD, em vários canais: satélite, cabo e antenas terrestres. Uma outra grande aplicação da norma é a gravação de vídeo em DVD (Digital Video Disc).
Inicialmente, eram previstas duas normas: uma para a resolução normal e uma para a alta resolução. A norma MPEG-2 acabou por incluir, também, a alta resolução e, como consequência, não surgiu a norma MPEG-3.

<< Anterior | Página inicial | Índice | Seguinte >>