COMUNICAÇÃO DE ÁUDIO E VÍDEO

INSTITUTO SUPERIOR TÉCNICO

Ano lectivo de 2006/2007 - 2º Semestre

1ª Época - 26 de Junho de 2007 (3ª feira) - 9 h


MEEC: As notas desta prova sairão até às 17 h do dia 10 de Julho (3ª feira) no placard e página Web da cadeira e a revisão de provas será às 17 h do dia 10 de Julho (3ª feira) no Laboratório de Telecomunicações 4. 

MERC: As notas desta prova sairão até às 17 h do dia 10 de Julho (3ª feira) na página Web da cadeira e a revisão de provas será às 14 h do dia 11 de Julho (4ª feira) na sala 0.23. 

A duração do exame é de 3 h. Responda às seguintes questões apresentando os cálculos que efectuar e JUSTIFICANDO as respostas dadas. Não se deixe ficar ‘preso’ em nenhuma resposta; se necessário, passe à frente para regressar mais tarde à mesma questão. Boa sorte !

I (1+ 1,5 + 1 + 0.5 = 4 val)

Considere uma estação de televisão na fase de passagem entre a ‘tecnologia analógica’ e a ‘tecnologia digital’, como aquela que alguns de vós visitaram na deslocação à RTP.

a)      Indique, justificando, 2 tecnologias chave na passagem dos conteúdos analógicos em legado para os novos formatos digitais. (R: digitalização e codificação de fonte)

b)      Indique, justificando, 3 formatos e débitos binários de referência correspondentes à codificação da componente de vídeo dos mesmos conteúdos em fases diferentes do processo de armazenamento, gestão, edição e transmissão (resolução standard ou seja semelhante à analógica). (R: Armazenamento: PCM, cerca de 270 Mbit/s; distribuição: MPEG-2 Vídeo, cerca de 3-5 Mbit/s; gestão: MPEG-1 Vídeo, cerca de 1 Mbit/s)

c)      Indique, justificando, 2 parâmetros da codificação de vídeo que seria expectável alterar se tivesse de distribuir o mesmo conteúdo vídeo, por exemplo um filme, para set-top boxes avançadas, acesso Internet e terminais handheld.  (R: Débito binário e resolução espacial)

d)      Indique em que consiste a principal diferença conceptual obrigatória, com impacto no consumo da bateria, entre a transmissão DVB-T e DVB-H. (R: Time slicing)

II (1 + 0,5 + 1 = 2,5 val.)

Considere uma transmissão de fax do Grupo 3, a 4800 bit/s, através da rede telefónica analógica.

a)      Considere que se usa uma resolução de 1728 amostra/linha, que a palavra de código correspondente a uma sequência de 1728 brancos tem 18 bits (usam-se folhas brancas, normais) e que a palavra de código correspondente ao fim de linha tem 13 bits. Calcule o factor de compressão máximo teórico para este sistema se o fax receptor tiver um tempo mínimo de varrimento de linha (TMVL) de 15 ms. (R: 24)

b)      Nas condições da alínea anterior, indique a sua melhor estimativa (com a informação dada) para o factor de compressão máximo se o TMVL passar para 0 ms. (R: 55,74)

c)      Considerando que se dispõe de uma largura de banda de 2400 Hz e que se usa uma modulação do tipo M-PSK, indique qual deverá ser a eficiência mínima dessa modulação. (R: 2 bit/símbolo)

III (0,5 + 1,5 + 1 = 3 val.)

Considere uma comunicação videotelefónica usando um débito binário de 40 kbit/s. A sequência é codificada usando a resolução espacial CIF e uma frequência de imagem de 10 Hz.

A imagem que tem de transmitir está dividida horizontalmente em 4 partes iguais, sendo as 2ª e última faixas fixas e as 1ª e 3ª partes com movimento. Atendendo a que o codificador faz uma codificação sequencial dos macroblocos, constata-se que os bits de código são gerados uniformemente, nos vários intervalos em que há informação para codificar, não sendo gerados bits nos períodos correspondentes a zonas fixas, com excepção da primeira imagem onde os bits são gerados uniformemente em toda a imagem. Posteriormente à primeira imagem, a faixa da imagem mais acima tem uma menor actividade que a 3ª faixa que se traduz por uma produção de bits que, para cada imagem, é sempre tripla da faixa mais acima, menos activa.

No codificador, os bits de código aguardam a sua transmissão na memória de saída. Sabendo que na codificação da primeira imagem se gastaram 15000 bit, na da segunda 20000 e na da terceira 8000, calcule, justificando:

a)      O instante em que o receptor obtém todos os bits de código correspondentes à 2ª imagem. (R: 875 ms)

b)      A dimensão mínima da memória de saída do codificador para que nunca haja perda de bits na situação acima descrita. (R: 32000 bits)

c)      O atraso inicial de visualização mínimo a aplicar no descodificador supondo que tem disponível à saída do codificador metade da memória determinada na alínea anterior e que o codificador passa a produzir os bits de código para cada imagem, instantaneamente no momento da sua aquisição (codificação infinitamente rápida). (R: 400 ms)

 

IV (1,5 + 1 + 1 = 3,5 val.)

Considere que se tornou num dos gestores do sistema YouTube ao nível da informação de informação multimédia.

a)      Indique qual a capacidade em disco que precisaria para armazenar 500.000 clips com uma duração média de 3 minutos se o vídeo tiver uma resolução CIF (352´288 amostras de luminância, 4:2:0) a 25 Hz, o áudio (estéreo) uma frequência de amostragem de 44 kHz (usando o número típico de bit/amostra), sabendo ainda que o factor de compressão para o áudio é o factor de compressão típico para MP3 (para qualidade transparente) e o do vídeo é o dobro do áudio. (R: 1,24 x 10*14)

b)      De quanto se alteraria em percentagem essa capacidade, se decidisse melhorar a resolução espacial do vídeo para o dobro nas 2 direcções e a frequência de amostragem do áudio para 48 kHz, sabendo que nesse caso os factores de compressão aumentariam de 30% ? (R: 188,7 %)

c)      Se lhe fosse dada a possibilidade de tentar melhorar a satisfação dos utentes de forma significativa ao utilizar o sistema usando 1% da capacidade calculada acima, de que modo e porquê investiria esses bits ? (R: Metadados, p.e. palavras chave, para permitir procuras e navegação aos utentes)

 

V (0,6 + 1 + 0,6 + 0,8 = 3 val.)

Considere a codificação de sinais de áudio.

a)      Indique 3 factores importantes para a definição do custo do terminal e da experiência auditiva do utente para os quais as 3 camadas de codificação MPEG-1 Áudio oferecem diferentes compromissos ? (R: Débito binário, qualidade e complexidade)

b)      Qual as 2 principais funções do modelo psicoacústico no contexto dos métodos de codificação perceptiva de áudio ? (R: determinar componentes do sinal irrelevantes e determinar quantidade de ruído de quantificação aceitável para as componentes relevantes)

c)      Indique as 2 principais diferenças entre a codificação segundo as camadas 1 e 2 e a camada 3 da norma MPEG-2 Áudio. (R: Estrutura híbrida tempo-frequência e codificação entrópica)

d)      Indique, justificando, qual o principal fenómeno que justifica a necessidade de ‘comutar de janela’ quando se usa codificação de transformada em áudio. (R: Pré-ecos)

 

VI (1 + 1 + 0,5 + 0,5 + 1 = 4 val.)

Considere um sistema de televisão digital semelhante ao especificado na norma DVB-T.

a)      Indique qual o débito binário típico necessário para codificar em MP3 um sinal mono onde cada canal tem uma largura de banda de 24 kHz e se usam 16 bit/amostra. (R: 64 kbit/s)

b)      Indique qual o débito para protecção contra erros de canal num sistema DVB que usa uma taxa de codificação de 4/6 e um débito binário de fonte de 20 Mbit/s num canal de 8 MHz. (R: 10 Mbit/s)

c)      Indique qual é a razão entre os débitos binários das duas camadas mais baixa e mais alta que se podem transmitir usando modulação 64-QAM de forma hierárquica ? (R: 1/2)

d)      Indique qual o débito binário típico que se gasta na transmissão da Program Association Table (PAT) sabendo que a representação dessa tabela gasta 300 bits. (R: 3-15 kbit/s)

e)      Se tivesse que escolher com base no débito binário útil (de fonte) entre uma solução usando um taxa de codificação ½ e modulação 64-QAM e outra solução usando uma taxa de codificação 2/3 e modulação 16-PSK (todos os outros parâmetros iguais) qual escolheria e porquê ?  (R: Solução 1)