O MPEG-2 está dividido em vários componentes. De entre os quais salientam-se: o MPEG-2 sistema[2], vídeo[3], áudio[4], conformidade[5], Software[6] e DSM-CC[7]. Uma vez que esta norma é extremamente genérica e flexível, o DVB especifica mais concretamente o que o MPEG-2 não especifica, servindo-lhe de complemento. Será feita uma descrição de cada um dos componentes: áudio, vídeo e sistema.
A arquitectura genérica do sistema está definida na figura abaixo.
Esta é a arquitectura genérica definida na norma MPEG-2, a qual é adaptada ao DVB conforme será explicado mais à frente no texto. A sua principal função é a de multiplexar os diferentes fluxos de áudio e vídeo e tratar da respectiva sincronização. A norma define dois tipos de fluxos (Transport Stream-TS e Program Stream-PS), sendo que é o TS o usado no DVB e agrega tantos fluxos quantos se quiser (no caso do DVB permite o envio de inúmeros canais de televisão multiplexados). As razões subjacentes a esta utilização passam pela sua robustez a erros (por força da forma como está organizada a informação - pacotes fixos de 188 bytes), sendo adequado para canais extremamente agressivos e por permitir a agregação de vários canais diferentes. A multiplexagem dos diferentes canais é feita à custa de informação específica (sob a forma de tabelas - Service Information), que permite a sua posterior de-multiplexagem no receptor.
As tabelas SI contêm informação sobre os diferentes fluxos de informação. Tomemos como exemplo o caso em que um telespectador está a ver televisão. Ele liga a televisão e é preciso que a set-top box apanhe os fluxos correspondentes ao canal que se pretende visualizar. O descodificador vai então ao fluxo TS e procura pela Program Association Table (PAT). Esta tabela tem um identificador 0x00 e é obrigatória. Contem a informação sobre os identificadores das tabelas dos diversos fluxos de informação (Program Map Tables - PMT). Estes, são específicos de um dado canal. Isto é, se pretendemos ver a BBC, consultamos a PMT que lhe corresponde e temos acesso aos locais onde está situada a stream de vídeo, de áudio e todos os outros streams associados. Assim, basta estar atento ao fluxo de dados que está a ser recebido e escolher selectivamente os fluxos de informação que correspondem ao canal em questão. A informação de áudio é então recolhida e entregue ao descodificador de áudio (correspondente ao identificador de áudio), o vídeo entregue ao descodificador de vídeo (identificador do vídeo) e a informação temporal para uma outra entidade responsável pela sincronização. Para uma informação mais detalhada no que diz respeito a todas as tabelas, sugere-se a consulta de [8] onde estão definidas todas as especificações das tabelas a usar como SI.
Os objectivos iniciais do MPEG-2 eram dois: distribuição primária e secundária. A distribuição primária é direccionada para sistemas de contribuição (qualidade para transmissão entre estúdios televisivo). Aqui, os requisitos são bastante elevados. Tipicamente, o sinal de vídeo é manipulado, sendo-lhe colocados efeitos de todo o tipo, publicidade, símbolos, etc. A qualidade é semelhante à sugerida pela recomendação ITU-R 601 (PCM) para sinais codificados com ritmos binários entre 8-10 Mbit/s. É interessante reparar na flexibilidade desta norma. Apenas o últimao se relaciona com a difusão. Este objectivo diz que para aplicações do tipo radiodifusão, o sinal deverá ser codificado 3-5 Mbit/s, com uma qualidade comparável à de sistemas analógicos existentes (PAL,NTSC,SECAM). É interessante notar que a norma MPEG-2 é tão genérica e tão flexível que tanto funciona para colocar dados em DVD's, transmiti-los seguindo uma lógica de difusão com qualidade média, baixa, alta e ainda a sua capacidade para ser transmitido entre estúdios televisivos. Veremos mais à frente qual o papel da compressão para conseguir este feito.
O termo perfil está directamente associado à complexidade da codificação do vídeo, sendo que define ferramentas de descodificação que respondem a requisitos de classes de aplicações. No que diz respeito ao termo nível, este estabelece para cada perfil os valores que alguns parâmetros de codificação tomam (são exemplo deste a limitação do débito binário ou da resolução). Sem estes, não era possível garantir a interoperabilidade entre os diferentes descodificadores.
A conjugação dos diferentes tipos de níveis e perfis permite a sua utilização em diferentes ambientes/aplicações. Tal como definido em [9], que é um guia para a implementação do DVB, podem ser implementados diferentes níveis e perfis. Para a televisão "Standard" está definido o MP@ML (Main profile and main level), enquanto que para a televisão de alta definição (HDTV) está definido MP@HL (Main Profile and High Level).
A Figura seguinte mostra a multiplicidade de perfis e níveis que existem e a sua combinação e é exemplo das segmentações que podem existir. Se o que se pretende é um descodificador com capacidade para SDTV (Standard Definition Television), basta que ele tenha as restrições indicadas na tabela.
Note-se, no entanto, um pormenor interessante na tabela. O leitor, à primeira vista, olha para a tabela e verifica que os valores de débitos binários para cada par perfil/nível são completamente diferentes dos objectivos traçados inicialmente para o MPEG-2 vídeo. Acontece que os descodificadores foram sobredimensionados inicialmente, uma vez que não se sabia qual a resposta que os fabricantes de codecs iriam dar à tecnologia e a sua capacidade de alcançar aquele tipo de níveis. É interessante reparar que passados cerca de 10 anos de a norma ter sido produzida, os débitos de 3-5 Mbit/s já foram alcançados com alguma facilidade.
Voltando à especificação MPEG-2 áudio, esta vem em duas formas diferentes: uma é Backward Compatible - BC com o MPEG-1 (significa que faixas de áudio MPEG-2-BC funcionam em descodificadores MPEG-1), ao passo que a outra não é. De notar que este constrangimento vai limitar grandemente a eficiência da compressão, mas permite que haja uma transição suave entre o MPEG-1 e o MPEG-2.
Estes factores de compressão obrigam a que os codificadores de áudio e vídeo possuam um conjunto de ferramentas que tratem desta compressão. Estas ferramentas foram criadas ao longo do tempo, à medida que as diferentes normas foram evoluindo. Assim, o legado que vem desde o JPEG, H.261, MPEG-1 foram-se todas acumulando. No momento em que o MPEG-2 é feito, todas as ferramentas relevantes são reaproveitadas e, mediante algumas características específicas adicionadas outras. É interessante notar que, à medida que este conjunto de ferramentas aumenta, mais capacidade têm os codificadores para tomar decisões. Tudo isto tem uma influência bastante positiva, uma vez que permite que se transmitam fluxos de áudio e vídeo com débito binário mais baixo. No entanto, toda esta capacidade tem um preço. Tipicamente, o preço que se paga é a complexidade, memória e atraso.
Das ferramentas disponíveis encontram-se a redundância temporal (predição e compensação de movimento), espacial (DCT), estatística (codificação entrópica) e a irrelevância (quantificação) - todas estas ferramentas já estavam disponíveis para o MPEG-1 (estão a ser reaproveitadas). No entanto, foram adicionadas mais algumas ferramentas ao MPEG-2 vídeo, como sejam a codificação de conteúdos entrelaçados e a codificação de fluxos escaláveis.
A primeira ferramenta foi introduzida muito por força de o MPEG-2 Vídeo estar adaptado à televisão. Isto é, desde há muitos anos que os conteúdos vídeo estavam a ser codificados e adquiridos entrelaçados. É o legado que a televisão analógica deixou. Muito por força desta razão, a norma adoptou esta nova ferramenta.
A segunda ferramenta foi introduzida porque é realmente importante. Vejamos o seguinte cenário. A rigidez que advém de uma stream que não seja escalável é muito elevada. Isto é, se pretendermos transmitir um canal em HDTV, fazemo-lo, codificando a stream nesse formato. No entanto, se alguns dos descodificadores a quem pretendemos transmitir não têm capacidade de descodificar esta stream (por motivos de ruído ou por qualquer outro motivo), simplesmente não podem ver esse canal. Quando se fala de escalabilidade, fala-se num conceito muito interessante, uma vez que o codificador faz o trabalho uma vez e nunca mais tem de se preocupar. É assim possível transmitir os diferentes conteúdos aos diferentes descodificadores. Note-se que, no mundo moderno, esta ferramenta faz todo o sentido. A quantidade de redes de difusão que existem hoje em dia (DVB-T, DVB-S, DVB-C e outras) em conjugação com a quantidade de terminais (móveis, fixos, etc) criam uma multiplicidade de capacidades diferentes. Não é muito viável pensar em modos não escaláveis de transmissão de televisão. A solução é claramente o modo escalável.
O sinal de áudio como sempre na televisão tem sempre menos importância. Mas no caso, o estudo do modelo psico-acústico, que é o modelo que o humano tem, permite explorar uma série de pontos, reduzindo assim o débito binário. O que acontece é que, uma vez que o sinal de áudio não é redundante na sua maioria, exploram-se os pontos irrelevantes. O princípio fundamental passa por injectar o máximo de ruído possível, fazendo assim com que se gastem menos bits aquando da transmissão. Aconselha-se a consulta de [10] para mais informação.
Back | Home | Next |