3.1. MPEG-2

 

O formato DVD-Video requer que a informação vídeo seja comprimida no formato MPEG-2. Este formato de compressão é usado para reduzir a quantidade de informação armazenado dos elementos vídeo para um nível manejável. A qualidade de vídeo Broadcast ou "CCIR 601" requer aproximadamente 21 Mbytes por segundo de espaço de armazenamento, o que significaria que um disco DVD-5 (4,37Gbytes) poderia guardar apenas 3,7 minutos de vídeo sem compressão.

 

 

 

·  Sistema:

 

O primeiro nível na organização da norma MPEG-2 é o sistema e tem como objectivo combinar um ou mais fluxos de áudio e vídeo codificados num único fluxo binário, designado por fluxo MPEG-2. É a este nível que é definida a sintaxe do fluxo, encarregue pelo controlo da temporização, e a multiplexagem e sincronização dos fluxos áudio e vídeo.

 

Existem dois níveis de fluxos, o sistema que contém a informação necessária a desmultiplexagem e temporização dos níveis de compressão, e compressão que inclui os dados codificados que serão entregues aos descodificadores de áudio e vídeo. Existem ainda dois sub-níveis ao nível do sistema, os packs e os packets. Os packs são conjuntos de packets, onde a informação relativa aos vários fluxos elementares, áudio ou vídeo, são organizados juntamente com outras informações que dizem respeito à leitura do fluxo e sua descodificação.

                                                                                                                                                                                                                                           

 

·  Vídeo:

 

O vídeo comprimido em MPEG-2 tem um resolução de 720x480 pixels por imagem e uma taxa de 30 imagens por segundo nos países com o formato de transmissão NTSC, ou uma resolução de 720x576 pixels por imagem e uma taxa de 25 imagens por segundo nos países com o formato de transmissão PAL. Os ficheiros MPEG-2 podem ser criados usando o processo de codificação CBR, Constant Bit Rate, ou VBR, Variable Bit Rate. Se é usado o processo de codificação CBR é necessário um débito binário de aproximadamente 6 Mbits por segundo para permitir que o vídeo comprimido seja tão bom como a fonte original CCIR-601. Se for usado o processo de VBR, pode ser usado um débito binário médio de 4 Mbits por segundo para que o vídeo comprimido gerado se pareça tão bom como a fonte original. O vídeo CCIR-601 em componentes passa por uma série de pré filtros e por equipamento de análise espacial e temporal para gerar um sinal de vídeo digital de lata qualidade em componentes. O sinal digital é depois convertido do formato RGB em componentes para o formato Y/Cr/Br em componentes. Cada imagem do vídeo digital é comprimida usando-se o algoritmo DCT, Discreet Cosine Transformation, que remove a informação redundante. De seguida cada imagem é comparada com as imagens anteriores e posteriores para eliminar a informação redundante entre as imagens. Finalmente a informação de vídeo comprimido é formatada para cumprir com o standard do formato MPEG-2.

 

Um fluxo binário MPEG-2, é composto por uma sequência de fatias, imagens e grupos de imagens, GOP Group Of Images. Uma imagem MPEG-2 corresponde à resolução total de uma trama, com duas fatias que correspondem a cada campo de uma trama entrelaçada. Existem três tipos de trama codificados em MPEG-2, uma trama I que contém toda a informação requerida para reconstituir a trama original e as imagens subsequentes dentro do GOP serão tramas P ou B. As tramas P e B são tramas preditivas, o que significa que elas só guardam as mudanças da trama anterior para a posterior. Um GOP é uma sequência de tramas comprimidas que começa com uma imagem que é uma trama I.

 

Figura 3: Exemplo de uma estrutura de um GOP [3]

 

O formato DVD-Vídeo requer que um fluxo de vídeo digital comprimido em MPEG-2 que não pode incluir mais do que 18 imagens em cada GOP, tamanho máximo do GOP. O formato DVD-Vídeo também requer que a informação vídeo em MPEG-2 seja multiplexada com o áudio, sub-imagens, imagens paradas e informação de controlo associadas.

 

Quando é usada uma codificação em VBR, o número de bits dedicados ao processo de codificação MPEG varia dependendo do conteúdo do fluxo de vídeo. Se o conteúdo da cena é uma pessoa a falar, com um fundo relativamente estático, são necessários poucos bits para descrever correctamente a cena. Se o conteúdo de vídeo for uma cena com muita acção e movimento, ou uma cena com muitos e pequenos detalhes, é necessário uma maior quantidade de informação para prevenir a introdução de artefactos digitais no ficheiro de vídeo digital comprimido.

 

As técnicas de compressão de vídeo digital estão sujeitas a perdas, Lossy, tanto o MPEG-1 como o MPEG-2 podem criar artefactos digitais durante o processo de compressão. Os artefactos digitais podem ser distorção da cor, degradação da cor, degradação do movimento, aumento do ruído, duplicação de tramas, geração de blocos (efeito de bloco), etc. O artefacto digital mais comum gerado pelo vídeo comprimido em MPEG é o efeito de bloco, este efeito é a presença de blocos padrão de 8x8 pixels no fluxo de vídeo comprimido que não fazem parte do vídeo original, e é causado pelo uso do algoritmo DCT que ópera em blocos de 8x8 pixels. Os artefactos de vídeo digital podem ser eliminados recorrendo a um variado conjunto de técnicas, tais como o aumento do débito binário médio usado na compressão dos conteúdos ou a filtragem do fluxo de vídeo para eliminar o ruído de alta-frequência.

                                                                                                                                                                                                                                           

 

·  Áudio:

 

No que diz respeito ao Áudio o codec utilizado em MPEG-2 é o AAC, Advanced Audio Coding, que é inversamente compatível com o famoso MP3, mas que vem melhorar as suas potencialidades pois comprime mais eficientemente mantendo uma qualidade comparável ao CD-Áudio. O AAC foi desenvolvido pelo grupo MPEG que inclui Dolby, Fraunhofer (FhG), AT&T, Sony e Nokia — empresas que também se envolveram na programação de codificadores de áudio, como MP3 e AC3 (também conhecido como Dolby Digital). O codificador AAC no QuickTime carrega uma nova tecnologia de processamento de sinal do Dolby Laboratories e apresenta codificação de dados a uma taxa de dados variável para o QuickTime.

 

O AAC, assim como o MP3, explora o facto de existirem componentes dos sinais áudio que são imperceptíveis ao ouvido humano e a existência de redundância. No entanto, este novo codec utiliza uma versão modificada da DCT, a MDCT, para processar o sinal de acordo coma sua complexidade, novos padrões de correcção de erros e uma aplicação moderna do algoritmo de Luhn para prevenir amostrar corrompidas.

 

Algumas das vantagens do AAC sobre o codec utilizado no MPEG-1, o MP3, são o facto de a compressão oferecer resultados de alta qualidade em arquivos de menor dimensão, o suporte de múltiplos canais de áudio, até 48 canais de frequência, áudio de alta resolução, amostras com taxas até 96 kHz, eficiência de descodificação aprimorada, exigindo menor poder de processamento na descodificação.

                                                                                                                                                                                                                                           

 

·  Acesso aleatório:

 

Devido às propriedades do codec MPEG-2, com a organização em tramas I, P e B, para fazer uma visualização normal não há problemas pois a sequência de descodificação segue a lógica temporal. No entanto para fazer um avanço rápido para a frente, o chamado fast-forward, o leitor deve ter uma lógica associada de passagem somente pelas tramas I, que não dependem de outros, e assim avançar mais rápido, não por comprimir o tempo mas por passar apenas algumas das imagens da sequencia normal de vídeo. O problema ganha maior proporção quando se tenta fazer o vídeo andar para trás pois neste caso a descodificação segue o percurso contrário ao normal então o leitor terá de efectuar a descodificação de trás para a frente.

 

Figura 4: Tipos especiais de leitura de DVD [3]

 

O processo de descodificação está representado na figura 4 através de um exemplo.