Em Novembro de 1994, o ITU-T em conjunto com o ISO (International Organization for Standardization) estabeleceram a norma MPEG-2
(H.262 para o ITU-T). Esta norma mantém todas as características do MPEG-1, contudo, acrescenta uma codificação de conteúdos entrelaçados e várias
formas de escalabilidade.
Para codificar em modo Intra imagens entrelaçadas, são possíveis duas estruturas: trama ou campo. Na primeira, o MB é tratado
como se a imagem fosse progressiva. Este, para a aplicação da DCT, divide-se em quatro blocos em que cada um contém linhas pares e ímpares. Esta
estrutura é mais indicada quando existe pouco movimento, porque existe pouca diferença entre dois quadros adjacentes. Na estrutura campo, o MB divide-se
também em quatro blocos, porém, dois destes blocos contêm linhas pares e os outros dois, linhas ímpares. Esta estrutura é mais indicada quando há muito
movimento e pouco detalhe, uma vez que ao fazer a junção de linhas ímpares ou pares, vai fazer que dois pixels distantes sejam codificados como vizinhos. A
ilustração 4 ilustra os dois modos. No caso de estimação de movimento, são possíveis três modos. No modo trama, um MB dum campo ímpar é usado pela
predição do MB correspondente no campo ímpar seguinte, e o mesmo pelos campos pares. O vector de movimento correspondente tem a duração de uma imagem
(40 ms a 25 Hz). No modo campo, um MB é codificado em relação ao MB correspondente do campo anterior, e o vector de movimento correspondente tem a
duração de um campo (20 ms a 25 Hz). No modo misto, a codificação é feita em relação ao MB de duas tramas.
Ilustração 4. Os dois modos de codificação para imagens entralaçadas na MPEG-2.
Para o varrimento dos coeficientes DCT , em vez da ordem em zig-zag, pode ser usado, para as imagens-trama, a ordem alternada, apresentado na ilustração 5, onde se codificam antes os coeficientes correspondentes a transições verticais. Isto porque a correlação vertical para imagens com muito movimento é pouca em relação à correlação horizontal (duas linhas adjacentes são adquiridas muito depois de que dois pixels adjacentes na mesma linha).
Ilustração 5. Diferença entre o varrimento a zig-zag (à esquerda) e o varrimento alternado (à direita).
A escalabilidade é uma funcionalidade que visa uma descodificação útil do sinal comprimido, descodificando
apenas algumas das suas partes. A norma prevê diferentes formas de escalabilidade. Com a escalabilidade na frequência (ou data partitioning) os
diferentes níveis contêm um diferente subconjunto dos coeficientes DCT, correspondentes a frequências diferentes. A norma prevê dois níveis, o nível
base e o nível de melhoramento. Ao primeiro atribui-se dados de endereçamento e controlo, bem como os coeficientes DCT de mais baixa frequência. Este
nível é transmitido num canal de mais alta prioridade ou sujeito a um código de correcção de erros mais poderoso. O nível de melhoramento contém o
restante da informação codificada. Com a escalabilidade espacial, o vídeo é codificado em vários níveis com resoluções espaciais diferentes. O nível de
base é constituído por tramas I e P, enquanto os níveis de melhoramento são codificados como um conjunto de tramas P e B. A trama actual de um nível de
melhoramento pode ser prevista fazendo uso da trama correspondente do nível anterior ou da trama anterior do mesmo nível. Com a escalabilidade de
qualidade, ou de SNR (Signal-to-Noise Ratio), muda a precisão da quantificação nos níveis. O nível base é codificado com degraus de quantização
mais largos; os níveis de melhoramento contêm a diferença entre o sinal do nível anterior e o sinal original, codificada com degraus de quantização
mais largos. A escalabilidade temporal permite ter níveis com resoluções temporais diferentes. No nível base, são enviadas apenas algumas imagens da
sequência codificada. Nos níveis de melhoramento envia-se as restantes. É também possível combinar as várias formas de escalabilidade para obter una
escalabilidade híbrida.
A escalabilidade é útil para, por exemplo, transmitir o mesmo vídeo a descodificadores normais, que o devem descodificar com a
resolução básica, e a descodificadores HD (High Definition), que o podem descodificar com a resolução mais alta. Também é útil para garantir, no
mesmo descodificador, uma qualidade básica em condições difíceis e uma melhor qualidade com melhores condições de recepção.
O MPEG-2 organiza o conjunto das ferramentas de codificação que disponibiliza por perfis. Cada perfil é um subconjunto de
funcionalidades, definidos para satisfazer diferentes conjuntos de aplicações, e que podem ser suportadas de forma separada. São também definidos níveis
de qualidade. Para cada nível é prevista uma gama de variação de parâmetros, como resolução espacial e temporal.
A norma MPEG-2 prevê quatro níveis de resolução:
Nível baixo, que corresponde à resolução SIF (até 360 x 288), com um débito até 4 Mbit/s;
Nível principal (até 720 x 576), com um débito até 15 Mbit/s;
Nível alto-1440, para televisão de alta definição, HDTV (até 1440 x 1152), com um débito até 60 Mbit/s;
Nível alto, para HDTV em ecrã largo (até 1920 x 1152), com um débito até 80 Mbit/s.
Prevê, depois, vários perfis:
Perfil simples, que não usa predição bidireccional, mas usa só imagens I e P;
Perfil principal, que usas imagens I, P e B;
Perfil alto, para aplicações broadcast no formato 4:2:0 o 4:2:2;
Perfis escaláveis.
MPEG-2, pela possibilidade de codificar imagens entrelaçadas, como a compatibilidade com os aparelhos de televisão analógica
requer, é usado na transmissão da televisão digital, também em definição normal e HD, em vários canais: satélite, cabo e antenas terrestres. Uma outra
grande aplicação da norma é a gravação de vídeo em DVD (Digital Video Disc).
Inicialmente, eram previstas duas normas: uma para a resolução normal e uma para a alta resolução. A norma MPEG-2 acabou por
incluir, também, a alta resolução e, como consequência, não surgiu a norma MPEG-3.