Comunicações Pessoais Audiovisuais
 
Introdução  |  Overview  |  Internet  |  UMTS  | RDIS  |  Tecnologia H.32X  |  Tecnologia SIP   |   Protocolos  | Conclusão  |

 

4. Protocolos

4.3. Estrutura Protocolar H.323

Nesta norma estão associados múltiplos protocolos que permitem a transferência de conteúdos multimédia sobre uma rede de dados. A Figura4, representa a estrutura protocolar da norma H.323.

protocolos

Figura4: Estrutura Protocolar H.323

4.4. Codecs Vídeo

Considerando uma amostra de vídeo, num dado instante de tempo, uma imagem deve ter um atraso máximo para a transmissão e recepção no outro interlocutor. Caso não se tenha em conta esta propriedade, a comunicação torna-se impercebível, ou seja, o interlocutor perde a sincronização, o que dificulta bastante a comunicação.
Neste contexto, é muito importante pensar nas limitações impostas pela rede que se irá utilizar para implementar este serviço, pois com base nos ritmos suportados é que se pode realizar alguns cálculos para garantir a qualidade no fuxo de imagens.

Deste modo, é necessário comprimir os dados antes de serem transmitidos, tarefa que o codificador realiza. O codificador de vídeo, é o responsável pela representação o mais eficiente possível, ou seja, usando o menor número de bits, de uma sequência periódica de imagens interdependentes.

Norma ITU-T H.263

A norma H.263 é uma recomendação publicada pela ITU e baseada no H.261, descrito anteriormente.
Os códigos propostos nesta recomendação melhoram a performance da compressão e permitem que o vídeo tenha taxas variáveis. A recomendação H.263 especifica a representação codificada que pode ser usada para compressão de imagem em movimento, para aplicações audiovisuais em baixas taxas de bits.

O algoritmo de codificação é baseado no algoritmo da recomendação H.261, com a inclusão de algumas opções de codificação para incremento de performance e mecanismos de recuperação de erro.
Tal como na norma H.261, é explorada a redundância temporal, redundância espacial, redundância estatística e a Irrelevância. Porem, esta possui maior precisão na compensação de movimentos, tornando-se mais eficiente na compactação identificando redundâncias temporais além de espaciais, como descrito.

A taxa de bits do vídeo pode ser variável, não há restrições no H.263 quanto a esta taxa, sendo as restrições  impostas pela rede. Além dos dois formatos de imagem apresentados no padrão H.261, outros três formatos foram apresentados. As resoluções e obrigatoriedade de implementação estão relacionadas na Tabela2, juntamente com os formatos da recomendação anterior.

Formato
Colunas
Linhas
Suporte em H.261
Suporte em H.263
Sub-QCIF
128
96
-------------
Obrigatório
QCIF
176
144
Obrigatorio
Opcional
CIF
352
288
Opcional
Opcional
4CIF
704
576
-------------
Opcional
6CIF
1408
1152
-------------
Opcional

Tabela2: Normas dos codificadores de vídeo

4.5 Codecs de áudio

As aplicações destinadas a videoconferência incluem suporte a áudio. Esta componente merece uma atenção especial, pois em quanto que no vídeo, a perda de um pacote na maioria dos casos, não chega a ser prejudicial à aplicação, a perda de uma amostra de áudio numa sessão de videoconferência pode comprometer seriamente a interactividade.
Assim como vídeo digital, o áudio é sempre obtido a partir de fontes analógicas, sendo necessário a conversão de analógico para digital (A/D). A conversão de um sinal analógico para digital envolve a captura de uma série de amostras da fonte analógica. A agregação das amostras forma o equivalente digital de uma onda sonora analógica. Quanto maior a taxa de amostragem, maior a qualidade do som digital, pois foram utilizados mais pontos de referência para replicar o sinal analógico. O processo de conversão A/D pode ser dividido em três fases: amostragem, quantificação e compressão.

A Tabela3 apresenta um resumo das características das recomendações do ITU-T relacionadas com a codificação de áudio e referenciadas nas recomendações da série H.
 São apresentados os tipos de algoritmos usados por cada codec, a taxa de bits a qual se destina e o delay típico entre dois pontos (exclusivamente do codec, sem considerar o canal).

Recomendação ITU-T 
Algoritmo
Bitrate(kbit/s)
Delay entre pontos (ms) 
Qualidade de voz 
G.711
PCM
48; 56; 64; 
<1
Excelente
G.722
Sub-banda ADPCM 
48; 56; 64; 
<<2
Boa
G.723.1
ACELPMP-MLQ
5,36,3
67-97
Razoável Boa 
G.726
ADPCM 
16;24;32;40
60
Boa(40)
Razoável(24)
G.727
AEDPCM 
16;24;32;40
60
Boa(40)
Razoável(24)
G.728
LD-CELP
16
<<2
Boa 
G.729
CS-ACELP
8
25-35
Boa

Tabela3: Normas dos codificadores de audio

Vamos agora detalhar algumas das normas mais usadas em aplicações de videoconferência, em especifico, na norma H.323, que usa obrigatoriamente a norma G.711, e opcionalmente as restantes apresentadas na tabela. Neste artigo apenas iremos detalhar a norma G.729 e a norma G.723.1 que possuem taxas de transmissão inferiores, as da norma G.711, desta forma, é possível usar ligações de baixo débito.

Norma G.711

A norma G.711 é o standart internacional para codificação de áudio em telefone para canais de 64 kbps. Trata-se de um Pulse Code Modulation (PCM) que opera numa taxa de amostragem de 8 kHz, com 8 bits por amostra.
A recomendação G.711 define um esquema logarítmico para a distribuição das amplitudes dos sub-intervalos de quantificação, com sub-intervalos menores na parte baixa da escala, e maiores na parte alta. Este processo, conhecido como companding (COMPressing and expANDING) pode ser feito de duas formas, conhecidas como μ-law, usada nos Estados Unidos e Japão, e A-law, usada nos demais países. As duas formas são equivalentes, mas a A-law exige menos esforço computacional para implementação. O algoritmo, nos dois casos, é simples: primeiro é feita uma quantificação linear com um número maior de intervalos (4096 ou 65536), e depois os números binários resultantes desta quantificação linear (com 12 ou 16 bits) são transformados num número binário com 8 bits, de acordo com uma função de mapeamento.

Norma G.729

A norma G.729 é um algoritmo para a codificação de sinais de voz a 8 kbps que foi desenvolvido originalmente para uso na telefonia fixa com comutação de circuito. Esta é baseada no modelo de codificação CELP (Code-Excited Linear-Prediction), que é um tipo de codificação preditiva linear, baseada em análise-por-síntese (CPLbAS), mais especificamente, usa o algoritmo CS-ACE (Conjugate-Structure Algebric CELP).
Tal como nos outros codificadores, este também é baseado no princípio CPLbAS, o qual codifica amostras dos sinais de voz. Nesse caso, o tamanho das amostras é de 10 ms, o que corresponde a 80 amostras do sinal obtendo a taxa de 8 kHz. Há, ainda, um atraso adicional de 5 ms, resultando num atraso algorítmico total de 15 ms.

Norma G.723.1

A norma G.723.1 trabalha com taxas de bits muito baixas, 5,3 ou 6,3 kbps, e aplica-se tipicamente em telefonia de redes de pacotes, como voz sobre IP. Esta norma é muito utilizada em codificação de voz por videoconferência e em todos os padrões da família H.324. Codifica os sinais de voz em amostras, usando a codificação preditiva linear baseada em análise-por-síntese. Para a taxa de 5,3 kbps, usa o algoritmo ACELP (Algebraic-Code-Excited Linear-Prediction) para gerar o sinal de excitação e para a taxa de 6,3 kbps, usa o algoritmo MP-MLQ (Multipulse Maximum Likelihood Quantization). O tamanho das amostras é de 30 ms e há um atraso adicional de 7,5 ms, resultando num atraso algorítmico total de 37,5 ms.

4.6. Camada de Controlo e Sinalização

Ao nível da camada de controlo e sinalização existem duas normas que são importantes de referir, H.225.0 que se divide em duas componentes, uma parte que define as funções de controlo de chamada (RAS), estabelecimento de chamada (semelhante ao Q.931) e a outra que está encarregue da sincronização dos dados, por outro lado, existe a norma H.245 responsável pela comunicação das capacidades dos terminais. A camada de sinalização é responsável pelo estabelecimento, cancelamento e manutenção de ligações. Por outro lado é responsável por negociar os parâmetros que permitam a ligação multimédia e por separar os fluxos multimédia em canais lógicos, diferentes da sinalização RAS/controlo e chamadas.

Norma H.225.0

Esta norma é composta por duas componentes:

 - A componente base (H.225.0 layer) que especifica o uso de canais lógicos para transferência de dados e informação audiovisual, bem como informação de controlo (H.225.0 control e H.245), sendo usados para o efeito os protocolos RTP/RTCP (Real Time Protocol/ Real Time Control Protocol), TCP (Transmission Control Protocol) ou UDP (User Datagram Protocol) e IP (Internet Protocol).

 - A componente de controlo (H.225.0 control) que incluí um protocolo de sinalização para estabelecimento de chamadas (Q.931) entre terminais, suportado sobre TCP/IP e um protocolo RAS (Registration, Admission and Status) usado para comunicação entre um terminal e o gatekeeper.

Norma H.245

A norma H.245 permite estabelecer um canal para transferência de informação de controlo extremo-a-extremo (separado o canal de transferência de informação). As mensagens de controlo são usadas para negociação de capacidades (por exemplo, codecs suportados), para estabelecimento e terminação de canais lógicos para transmissão de streams, controlo de fluxo e também para o envio de comandos e indicações genéricos.
Uma vez estabelecido o canal de controlo H.245, o canal de sinalização H.225.0 (Q.931) deixa de ser necessário e pode ser terminado.

4.7. Protocolo RTP e RTCP

O RTP(Real-Time Transport Protocol), é o protocolo utilizado para transporte de dados em tempo real. Este protocolo é utilizado em aplicações multimédia como telefonia na Internet, videoconferência, entre outros. O protocolo RTP é um serviço rápido, sendo utilizado sobre UDP, no qual se dá prioridade à perda de um pacote face a um atraso temporal, de modo a recuperar o pacote perdido. Num fluxo RTP, a cada pacote é adicionado um cabeçalho contendo um timestamp e um número de sequência, permitindo assim que o terminal receptor consiga controlar o fluxo de dados, facto que o UDP não permite.

O controlo do RTP é efectuado através do RTCP(Real-time Transport Control Protocol), o qual envia pacotes periódicos para controlo da sessão, aos vários participantes da sessão. A principal função é monitorizar a qualidade do serviço, como congestionamento, largura de banda, atraso entre outras. Com base nestas informações é possível aumentar a taxa de transmissão da rede quando esta se encontra em boas condições, ou diminuir a mesma taxa caso a rede esteja com algum problema.






André Portela Nº 54397 ; Pedro Cavalheiro Nº55959