A norma H.263 começou a ser desenvolvida em 1993 pelo ITU-T Study Group 15 e a norma foi publicada no Março de 1996. O algoritmo de codificação da
H.263 é similar ao que foi usado na H.261, contudo, com alguns melhoramentos e mudanças para um melhor desempenho e resistência a erros.
Destacam-se:
Mais formatos de imagens e estruturas de GOB diferentes. Para além dos formatos CIF e QCIF, suportados pela H.261, a H.263 acrescenta os formatos Sub-QCIF, 4CIF e 16CIF. São mantidos os formatos para as crominâncias (4:2:0) e as resoluções para a luminância, em pixels, são, respectivamente, 128 x 96, 704 x 576 e 1408 x 1152. Na H.263, os GOB são estruturados numa ou mais linhas completas de MB.
Codificação de vector de movimento e predição de ½ pixel. É usada a média dos vectores de movimento de 3 MB, vizinhos (esquerda, cima e diagonal superior direita) do MB corrente, para a predição do vector de movimento deste último. O erro de predição é codificado e transmitido. Se um destes vizinhos estiver fora da fronteira duma imagem ou dum GOB, é usado um vector nulo em substituição do vector de movimento desse MB. Se dois vizinhos estiverem nessa situação, é usado, como predição, o vector de movimento do único MB do lado de dentro. A predição de ½ pixel é feita como se descreveu na norma MPEG-1.
3D VLC. A norma H.263 acrescenta um elemento "último" ao par (posição, nível), para indicar se o coeficiente corrente é (último=1), ou não (último=0), o último coeficiente não nulo do bloco. Ficamos assim com um conjunto (último, posição, nível) e, desta maneira, não será necessário o envio da palavra de código EOB, usada na H.261.
Modo de Presença Contínua em Multiponto (Anexo C). Este modo permite enviar múltiplos fluxos de vídeo dentro de um único canal vídeo.
Modo de Vector de Movimento Não Restrito (Anexo D). Os vectores de movimento podem apontar para pixels fora da imagem de predição. Isto significa que a predição para um MB a codificar pode ser um MB que fica em parte na imagem anterior e em parte fora, com a parte que falta enchida por uma repetição dos pixels no bordo da imagem. Isto é útil sobretudo se a resolução espacial for pequena. A segunda característica que este modo introduz é uma extensão do intervalo possível para os vectores de movimento, que agora podem ir desde -30 até 30, para as duas direcções da imagem, horizontal e vertical. Isto é útil quando há muito movimento entre duas imagens consecutivas, por exemplo no caso duma resolução temporal baixa.
Modo de Codificação Aritmética (Anexo E). A norma introduz a possibilidade de usar o código aritmético para explorar a redundância estatística, em vez do código de Huffmann. Isto permite alcançar factores de compressão com um ganho de cerca de 10 % na codificação de imagens Intra e de cerca de 4 % na codificação de imagens Inter.
Modo de Predição Avançado (Anexo F). É possível com este modo usar um ou quatro vectores de movimento por MB, ou seja, um para cada bloco. A predição para cada pixel do MB (ou bloco) é, depois, a soma pesada de três valores obtidos com três vectores de movimento: aquele do MB corrente, aquele do MB mais perto do pixel a codificar na direcção horizontal e aquele do MB mais perto do pixel a codificar na direcção vertical.
Modo de Tramas PB (Anexo G). Este modo introduz a codificação de duas imagens como uma só. A primeira, chamada trama P, é codificada em relação à imagem já codificada anterior. A segunda, chamada trama B, é codificada só através de vectores de movimento, em relação a uma interpolação linear entre a imagem anterior e a imagem P.
Correcção de Erros, como na norma H.261 (Anexo H).
O descodificador diz ao codificador quais as opções que consegue descodificar. Se o codificador suportar algumas dessas opções,
pode activá-las. Estes modos de operação têm um significado semelhante aos perfis, descritos na norma MPEG-2.
Embora a H.263 tenha sido criada com o objectivo de desenhar uma norma capaz de funcionar bem em muito baixos débitos
(cerca de 20 Kbit/s), depressa chegou-se à conclusão que a H.263 podia providenciar um significativo melhoramento da H.261 a qualquer débito. Mais
especificamente, a H.263 pode poupar mais de 50% no débito necessário para representar vídeo a uma qualidade perceptual aceitável a muito baixos
débitos, relativamente à H.261. Também a esses débitos, o H.263 consegue um ganho de 3 dB na SNR, em relação à H.261. De facto, a H.263 consegue uma
codificação mais eficiente que a H.261 a todos os débitos. Comparando com a MPEG-1, a H.263 consegue também poupanças significativas a altos débitos
(por ventura 30% a cerca de 1 Mbit/s) [6].
Depois de estandardizada a versão 1 da H.263, um contínuo interesse nas capacidades do seu desenho básico, depressa tornou claro que era possível
realizar futuros melhoramentos na norma. Assim, em Janeiro de 1998 a segunda versão da norma, conhecida como H.263+, é aprovada. Esta manteve todo o
conteúdo técnico da versão anterior, contudo, acrescentou mais 16 anexos, como modos opcionais. Estes vêm possibilitar que esta nova versão se destaque
da sua precedente pelas seguintes características:
Capacidade de providenciar uma alta resiliência a erros em redes móveis e de pacote.
Melhoramentos na eficiência da codificação.
Resolução dinâmica para uma adaptação da resolução de uma imagem codificada ao conteúdo.
Suporte de uma grande variedade de resoluções de imagens de vídeo e débitos de tramas.
Escalabilidade espacial, de qualidade e temporal para operações de multi-débitos simultâneas.