COMUNICAÇÃO DE IMAGEM

INSTITUTO SUPERIOR TÉCNICO

Ano lectivo de 1996/97 - 2º Semestre

2º Exame, 1ª Época - 27 de Junho de 1997 - 13 h


As notas desta prova sairão até às 14 h do dia 1 de Julho (3ª feira), no placard da cadeira e a revisão de provas será às 14 h do dia 1 de Julho (3ªfeira), junto à Secretaria da Secção de Telecomunicações.
A duração do exame é de 3 h.
Responda às seguintes questões apresentando os cálculos que efectuar e JUSTIFICANDO as respostas dadas. Nunca fique ‘preso’ em nenhuma pergunta; se necessário, passe à frente para regressar mais tarde à mesma questão. Boa sorte !
 


I (1.5+ 1+ 1 val.)

Considere uma transmissão de telecópia usando o Método de READ Modificado - norma CCITT T.5 - a 6400 bit/s, para páginas com 2000 linhas, cada uma com 1728 amostras. Suponha que, em média, cada linha tem 70% dos pixels brancos.

a) Supondo que as linhas codificadas unidimensionalmente têm um factor de compressão médio de 10 para os comprimentos pretos e 20 para os brancos e as linhas codificadas bidimensionalmente têm um factor de compressão médio de 20 para os comprimentos pretos e 25 para os brancos, indique qual o valor mínimo de k que pode ser usado para protecção contra erros (1 linha unidimensionalmente codificada em cada k transmitidas), sabendo que se deseja, no mínimo, um factor de compressão global médio de 22. (R: 9)
b) Supondo que, devido à necessidade de limitar a propagação de erros, se usa apenas codificação unidimensional, indique qual o número de bits gastos na codificação de uma imagem que é 2 vezes mais eficiente (dobro do factor de compressão) em termos de codificação do que uma ‘imagem média’. (R: 112318 bit)
c) Supondo agora que não deve haver cuidados com a propagação de erros em virtude de se passar a operar sobre uma rede de dados, garantindo uma transmissão (virtualmente) isenta de erros, indique qual o factor de compressão máximo que se pode atingir para a mesma imagem da alínea anterior. (R: 46,5)
 


II (1+ 1+ 1 val.)

Considere a norma JPEG para codificação de imagens fotográficas.

a) Explique qual o esquema de codificação em que se baseia o modo sem perdas desta norma. Qual o tipo de informação a enviar como resultado desta codificação ? (R: Esquema preditivo, transmitindo-se o modo de predição e o erro de predição)
b) Indique qual a diferença entre o método de selecção espectral e o método de aproximações sucessivas (ambos possíveis no contexto do modo progressivo) em termos da reprodução das altas frequências de uma imagem.
c) Indique um exemplo, em termos da informação transmitida, para o uso simultâneo dos métodos de selecção espectral e aproximações sucessivas.
 


III (2+ 1 + 1 val.)

Considere um sistema de videotelefonia usando a norma ITU-T H.261 para codificação do sinal de vídeo, com resolução 360x288 pixels para a luminância e metade desta resolução em cada direcção para as crominâncias (8 bit/amostra), a 10 Hz. Suponha que o factor de compressão médio, na ausência de quaisquer restrições externas sobre os modos de codificação, é de 10 para a luminância e 15 para a crominância.

a) Suponha que em cada imagem são codificados, em média, 200 macroblocos. Para garantir maior protecção contra erros, cada macrobloco é obrigatoriamente codificado em modo intra, uma em cada 50 vezes que é transmitido. Supondo que a compressão em modo intra é 50% menos eficiente (metade do factor de compressão) do que a compressão média, acima indicada, determine qual o factor de compressão global correspondente a esta situação. (R: 11)
b) Se por razões de edição, lhe pedissem para codificar todos os macroblocos, de todas as tramas, em modo intra, qual seria o débito binário gerado ? (R: 4,48 Mbit/s)
c) Indique qual a dimensão da memória de saída a usar no codificador, nas condições da alínea anterior, se se pretender um atraso inicial de visualização no receptor (máximo) de 200 ms e supondo que o codificador gera os bits de código de modo uniforme. (R: 448000 bit)
 


IV (3.5 val.)

Suponha que a sua empresa é contactada pela EXPO’98 para projectar um sistema de comunicação audiovisual para ligar o sistema de painéis gigantes do recinto à sala VIP do aeroporto com a finalidade de transmitir ‘em directo’ a chegada das individualidades mais importantes, dando aos visitantes a possibilidade de fazer perguntas às ‘vedetas’. O atraso emissão-recepção máximo aceitável, medido como a diferença máxima entre os momentos de aquisição e visualização de uma imagem, nomeadamente da primeira, é de 150 ms. A resolução a usar é a resolução CIF - 352x288 (Y) e 176x144 (Cr, Cb) a 25 Hz (8 bit/amostra).
 

Tipo de Trama
Factor de Compressão

Luminância

Factor de Compressão

Crominância

I
10
15
P
15
20
B
20
30

Suponha que tem à sua disposição, oferecendo a qualidade de imagem considerada aceitável, um codificador MPEG-1 que pode funcionar em duas configurações: 1) M= 3, N=3; 2) M=1, N=3. Os factores de compressão médios para os vários tipos de tramas estão indicados na tabela em anexo. Indique, justificando, qual a solução que proporia ao seu cliente para satisfazer as necessidade indicadas, sabendo que ele deseja minimizar os custos em termos de capacidade de transmissão. (R: M=1 e N=3)
 


V (1+ 1+ 1 val.)

Considere a norma ITU-T H.263 para codificação de vídeo no contexto de comunicações multimédia a baixos débitos binários e a norma ITU-T H.261 para codificação de vídeo no contexto de serviços videotelefónicos ou de videoconferência a p x 64 kbit/s.

a) Explique qual a diferença entre as duas normas em termos da determinação da predição dos vectores de movimento.
b) Explique qual a diferença entre as duas normas em termos do modo como é indicado qual o último coeficiente DCT de um dado bloco, a ser transmitido. (R: EOB versus símbolos 3D)
c) Explique qual a principal diferença entre as duas normas em termos da protecção contra erros de transmissão. (R: Ambas adoptam o mesmo código corrector de erros - BCH(511,493))
 


VI (1+ 1+ 1 val.)

Considere a norma MPEG-2 para codificação de vídeo digital.

a) Como sabe, os perfis "Principal" e "Simples" diferem em termos das suas características sintácticas. Qual a principal diferença sintáctica entre estes 2 perfis ? (R: Uso das tramas B)
b) Explique porque motivo um bitstream cujas capacidades superam, ainda que por muito pouco, os limites sintácticos correspondentes a um determinado ponto de conformidade perfil-nível, é classificado com o ponto de conformidade imediatamente superior em termos de perfis e de níveis.
c) Considere que se usa um débito binário de 5 Mbit/s só para a informação de vídeo (a 25 Hz) e se tem para os parâmetros característicos da estrutura temporal das imagens, M= 1 e N= 12. Se a estratégia básica de alocação de bits atribuir às tramas I, 4 vezes mais bits que às tramas P, e às tramas P, 3 vezes mais bits que às tramas B (tudo em média), calcule o número médio de bits disponíveis para cada um dos tipos de tramas, no caso acima indicado, considerando que cada trama tem 396 macroblocos. (R: NI = 640000 e NP = 160000 bit)