3. O MPEG e o DVB

A norma MPEG-2 foi a norma adoptada em primeiro lugar pelo DVB. Posteriormente, assitiu-se a um desenvolvimento e um aumento de popularidade do MPEG-4, que hoje em dia prevê-se que seja a próxima norma a ser utilizada massificadamente pelo DVB. Esta norma foi desenvolvida pelo organismo de standardização ISO/IEC. O DVB foi desenvolvido pelo Joint Technical Committee do ETSI / CENELEC / EBU.

O MPEG-2 está dividido em vários componentes. De entre os quais salientam-se: o MPEG-2 sistema[2], vídeo[3], áudio[4], conformidade[5], Software[6] e DSM-CC[7]. Uma vez que esta norma é extremamente genérica e flexível, o DVB especifica mais concretamente o que o MPEG-2 não especifica, servindo-lhe de complemento. Será feita uma descrição de cada um dos componentes: áudio, vídeo e sistema.

3.1 Sistema

A arquitectura genérica do sistema está definida na figura abaixo.

Figura 1: Blocos Funcionais de MPEG-2 Sistema

Esta é a arquitectura genérica definida na norma MPEG-2, a qual é adaptada ao DVB conforme será explicado mais à frente no texto. A sua principal função é a de multiplexar os diferentes fluxos de áudio e vídeo e tratar da respectiva sincronização. A norma define dois tipos de fluxos (Transport Stream-TS e Program Stream-PS), sendo que é o TS o usado no DVB e agrega tantos fluxos quantos se quiser (no caso do DVB permite o envio de inúmeros canais de televisão multiplexados). As razões subjacentes a esta utilização passam pela sua robustez a erros (por força da forma como está organizada a informação - pacotes fixos de 188 bytes), sendo adequado para canais extremamente agressivos e por permitir a agregação de vários canais diferentes. A multiplexagem dos diferentes canais é feita à custa de informação específica (sob a forma de tabelas - Service Information), que permite a sua posterior de-multiplexagem no receptor.

3.1.1 DVB-SI - Service Information

A SI está sob a forma de tabelas e é a ferramenta que permite guiar o descodificador na escolha dos fluxos de áudio e vídeo correctos. A figura que se segue é ilustrativa do processo.

Figura 2: Tabelas SI do DVB

As tabelas SI contêm informação sobre os diferentes fluxos de informação. Tomemos como exemplo o caso em que um telespectador está a ver televisão. Ele liga a televisão e é preciso que a set-top box apanhe os fluxos correspondentes ao canal que se pretende visualizar. O descodificador vai então ao fluxo TS e procura pela Program Association Table (PAT). Esta tabela tem um identificador 0x00 e é obrigatória. Contem a informação sobre os identificadores das tabelas dos diversos fluxos de informação (Program Map Tables - PMT). Estes, são específicos de um dado canal. Isto é, se pretendemos ver a BBC, consultamos a PMT que lhe corresponde e temos acesso aos locais onde está situada a stream de vídeo, de áudio e todos os outros streams associados. Assim, basta estar atento ao fluxo de dados que está a ser recebido e escolher selectivamente os fluxos de informação que correspondem ao canal em questão. A informação de áudio é então recolhida e entregue ao descodificador de áudio (correspondente ao identificador de áudio), o vídeo entregue ao descodificador de vídeo (identificador do vídeo) e a informação temporal para uma outra entidade responsável pela sincronização. Para uma informação mais detalhada no que diz respeito a todas as tabelas, sugere-se a consulta de [8] onde estão definidas todas as especificações das tabelas a usar como SI.

3.2 Vídeo

Um dos objectivos do DVB é o de proporcionar boa qualidade de imagem aos telespectadores, gastando menos banda do que a televisão analógica. Neste ponto existe uma situação bastante interessante e que é relevante de se falar. Sempre que se pensava em televisão, pensava-se em vídeo. Isto porque nos tempos da televisão analógica, o vídeo ocupava uma largura de banda elevadíssima, sendo que para o áudio era reservada uma pequena fatia do espectro. No MPEG-1 saiu pela primeira vez uma norma de codificação de áudio. Esta foi a primeira norma a preocupar-se com a codificação de áudio comprimido. Foi este o ponto de viragem, o ponto em que a voz começa a ter um papel mais importante no meio da transmissão de dados. No entanto, as ferramentas mais abundantes são realmente para o vídeo. E se pensarmos com atenção, com alguma lógica, uma vez que é o elemento que ocupa mais banda.

Os objectivos iniciais do MPEG-2 eram dois: distribuição primária e secundária. A distribuição primária é direccionada para sistemas de contribuição (qualidade para transmissão entre estúdios televisivo). Aqui, os requisitos são bastante elevados. Tipicamente, o sinal de vídeo é manipulado, sendo-lhe colocados efeitos de todo o tipo, publicidade, símbolos, etc. A qualidade é semelhante à sugerida pela recomendação ITU-R 601 (PCM) para sinais codificados com ritmos binários entre 8-10 Mbit/s. É interessante reparar na flexibilidade desta norma. Apenas o últimao se relaciona com a difusão. Este objectivo diz que para aplicações do tipo radiodifusão, o sinal deverá ser codificado 3-5 Mbit/s, com uma qualidade comparável à de sistemas analógicos existentes (PAL,NTSC,SECAM). É interessante notar que a norma MPEG-2 é tão genérica e tão flexível que tanto funciona para colocar dados em DVD's, transmiti-los seguindo uma lógica de difusão com qualidade média, baixa, alta e ainda a sua capacidade para ser transmitido entre estúdios televisivos. Veremos mais à frente qual o papel da compressão para conseguir este feito.

3.2.1 Níveis e Perfis

Com a norma MPEG-2 foram introduzidos os conceito de níveis e de perfis.

O termo perfil está directamente associado à complexidade da codificação do vídeo, sendo que define ferramentas de descodificação que respondem a requisitos de classes de aplicações. No que diz respeito ao termo nível, este estabelece para cada perfil os valores que alguns parâmetros de codificação tomam (são exemplo deste a limitação do débito binário ou da resolução). Sem estes, não era possível garantir a interoperabilidade entre os diferentes descodificadores.

A conjugação dos diferentes tipos de níveis e perfis permite a sua utilização em diferentes ambientes/aplicações. Tal como definido em [9], que é um guia para a implementação do DVB, podem ser implementados diferentes níveis e perfis. Para a televisão "Standard" está definido o MP@ML (Main profile and main level), enquanto que para a televisão de alta definição (HDTV) está definido MP@HL (Main Profile and High Level).

A Figura seguinte mostra a multiplicidade de perfis e níveis que existem e a sua combinação e é exemplo das segmentações que podem existir. Se o que se pretende é um descodificador com capacidade para SDTV (Standard Definition Television), basta que ele tenha as restrições indicadas na tabela.

Figura 3: Níveis e Perfis de MPEG-2

Note-se, no entanto, um pormenor interessante na tabela. O leitor, à primeira vista, olha para a tabela e verifica que os valores de débitos binários para cada par perfil/nível são completamente diferentes dos objectivos traçados inicialmente para o MPEG-2 vídeo. Acontece que os descodificadores foram sobredimensionados inicialmente, uma vez que não se sabia qual a resposta que os fabricantes de codecs iriam dar à tecnologia e a sua capacidade de alcançar aquele tipo de níveis. É interessante reparar que passados cerca de 10 anos de a norma ter sido produzida, os débitos de 3-5 Mbit/s já foram alcançados com alguma facilidade.

3.3 Áudio

O áudio é o último dos pilares da experiência televisiva. Apesar de tipicamente o vídeo ter um interesse maior, é importantíssimo falar do áudio aqui, pois a experiência não está completa sem ele. A título de curiosidade, a ISO não definiu muitos codecs de áudio. O primeiro codec de áudio definido surgiu com o MPEG-1. Este é conhecido como ISO 11172-3. É uma norma que trata basicamente com sinais stereo de dois canais. A norma MPEG-2 estende esta capacidade a cinco canais com som surround. Esta nova capacidade vai permitir uma sensação televisiva muito melhor para o telespectador.

Voltando à especificação MPEG-2 áudio, esta vem em duas formas diferentes: uma é Backward Compatible - BC com o MPEG-1 (significa que faixas de áudio MPEG-2-BC funcionam em descodificadores MPEG-1), ao passo que a outra não é. De notar que este constrangimento vai limitar grandemente a eficiência da compressão, mas permite que haja uma transição suave entre o MPEG-1 e o MPEG-2.

3.4 A magia da compressão

Pensemos um pouco nas implicações de o MPEG-2 ter débitos binários a rondar os 3-5 Mbit/s. Para a mesma informação a ser transmitida em PCM, para uma resolução de 720x576, em 4:2:0 a uma frequência de amostragem de 25Hz, teríamos a necessidade de um débito da ordem dos 165 Mbit/s. Com a tecnologia actual, é completamente impensável a transmissão de vídeo com estas características. Veja-se então que os factores de compressão necessários para conseguir esta proeza têm de se situar na ordem dos 40. Não esquecer que os requisitos do DVB se baseiam em entregar ao utilizador áudio e vídeo com uma qualidade comparável à dos sistemas existentes - PAL, NTSC e SECAM.

Estes factores de compressão obrigam a que os codificadores de áudio e vídeo possuam um conjunto de ferramentas que tratem desta compressão. Estas ferramentas foram criadas ao longo do tempo, à medida que as diferentes normas foram evoluindo. Assim, o legado que vem desde o JPEG, H.261, MPEG-1 foram-se todas acumulando. No momento em que o MPEG-2 é feito, todas as ferramentas relevantes são reaproveitadas e, mediante algumas características específicas adicionadas outras. É interessante notar que, à medida que este conjunto de ferramentas aumenta, mais capacidade têm os codificadores para tomar decisões. Tudo isto tem uma influência bastante positiva, uma vez que permite que se transmitam fluxos de áudio e vídeo com débito binário mais baixo. No entanto, toda esta capacidade tem um preço. Tipicamente, o preço que se paga é a complexidade, memória e atraso.

Das ferramentas disponíveis encontram-se a redundância temporal (predição e compensação de movimento), espacial (DCT), estatística (codificação entrópica) e a irrelevância (quantificação) - todas estas ferramentas já estavam disponíveis para o MPEG-1 (estão a ser reaproveitadas). No entanto, foram adicionadas mais algumas ferramentas ao MPEG-2 vídeo, como sejam a codificação de conteúdos entrelaçados e a codificação de fluxos escaláveis.

A primeira ferramenta foi introduzida muito por força de o MPEG-2 Vídeo estar adaptado à televisão. Isto é, desde há muitos anos que os conteúdos vídeo estavam a ser codificados e adquiridos entrelaçados. É o legado que a televisão analógica deixou. Muito por força desta razão, a norma adoptou esta nova ferramenta.

A segunda ferramenta foi introduzida porque é realmente importante. Vejamos o seguinte cenário. A rigidez que advém de uma stream que não seja escalável é muito elevada. Isto é, se pretendermos transmitir um canal em HDTV, fazemo-lo, codificando a stream nesse formato. No entanto, se alguns dos descodificadores a quem pretendemos transmitir não têm capacidade de descodificar esta stream (por motivos de ruído ou por qualquer outro motivo), simplesmente não podem ver esse canal. Quando se fala de escalabilidade, fala-se num conceito muito interessante, uma vez que o codificador faz o trabalho uma vez e nunca mais tem de se preocupar. É assim possível transmitir os diferentes conteúdos aos diferentes descodificadores. Note-se que, no mundo moderno, esta ferramenta faz todo o sentido. A quantidade de redes de difusão que existem hoje em dia (DVB-T, DVB-S, DVB-C e outras) em conjugação com a quantidade de terminais (móveis, fixos, etc) criam uma multiplicidade de capacidades diferentes. Não é muito viável pensar em modos não escaláveis de transmissão de televisão. A solução é claramente o modo escalável.

O sinal de áudio como sempre na televisão tem sempre menos importância. Mas no caso, o estudo do modelo psico-acústico, que é o modelo que o humano tem, permite explorar uma série de pontos, reduzindo assim o débito binário. O que acontece é que, uma vez que o sinal de áudio não é redundante na sua maioria, exploram-se os pontos irrelevantes. O princípio fundamental passa por injectar o máximo de ruído possível, fazendo assim com que se gastem menos bits aquando da transmissão. Aconselha-se a consulta de [10] para mais informação.

Back Home Next