cod

A uniformização dos formatos 3D nunca foi um processo pacífico. O ideal seria ter um formato que fosse universal, escalável e com compatibilidade inversa. Sendo universal, seria utilizado por todos os dispositivos, deixando de existir os problemas de compatibilidade (ignorando a incompatibilidade dos diferentes perfis existentes numa norma). Se for escalável, consegue servir as diferentes exigências dos utilizadores (telemóvel e blu-ray, por exemplo). No caso da compatibilidade inversa, é essencial para as pessoas que possuem um equipamento que não suporte 3D consigam descodificar e usufruir da normal televisão 2D.

Posto isto, um formato deverá ter: um factor de compressão elevado, pois pretende-se transmitir um número baixo de bits; um tempo de acesso aleatório rápido, ou seja, cada imagem deve ser acedida, descodificada e apresentada num tempo considerado aceitável e gastando pouca memória; qualidade escalável, pois, como já foi referido, pretende-se servir um grande leque de clientes; número de vistas escalável, isto é, o consumidor é que decide quantas vistas é que pretende receber, consoante o bitstream disponível; compatibilidade inversa, ou seja, deverá existir uma vista que é codificada como se de uma stream 2D se tratasse, para um televisor 2D poder descodificar e apresentar o canal.
Para garantir uma boa experiência 3D tem de se apresentar duas imagens (uma para cada olho) em vez de uma (tradicional 2D), ou seja, supõe-se usar o dobro da largura de banda usada até agora. De seguida, e com base nos requisitos apresentados anteriormente, apresentam-se formatos que se propõem a baixar o bit rate.

O
multi-view simulcasting codifica cada vista independentemente, ignorando o facto de existirem imagens semelhantes. É a solução mais simples, mas é também a que obtém um factor de compressão mais baixo, pois não explora a redundância existente nas varias vistas. No entanto, será possível aumentar o factor de compressão através de uma redução de qualidade de uma das vistas (que até pode alternar ao longo da emissão), pois para o consumidor o impacto visual não é relevante.

O formato
Frame Compatible Stereo consiste na colocação das duas vistas com metade da resolução na mesma imagem, que depois são descodificadas e separadas em duas imagens. Existem várias possibilidades de colocar as duas imagens numa só frame: Side- by-Side e Top-Bottom, onde não existe mistura das as diferentes vistas; Row Interveaved, Column Interleaved e Checkerboard que, pelo facto de misturarem as duas vistas, são mais robustos a erros de rajada mas, devido às mudanças bruscas de cor entre as vistas, usam altas frequências (aumenta o bit rate e diminuem o factor de compressão).

pic13_
Modo sequencial vs side-by-side

pic14_
Diferentes formas de colocar duas formas numa frame

O principal problema deste formato está na redução da resolução da imagem, pelo que a imagem transmitida terá de ter maior qualidade que uma imagem de televisão normal, para compensar este facto. No que diz respeito à reprodução no televisor, são apresentadas duas imagens em vez de apenas uma, o que aumenta o framerate para 50 imagens por segundo, como se pode observar na figura 16. Existe ainda a desvantagem de não se explorar a redundância espacial entre as duas vistas, ou seja, apenas se explora a redundância temporal. No entanto, o Side-by-Side foi o formato mais aceite pela indústria, sendo que a Sky Broadcast escolheu este modo para transmitir o seu canal em 3D para os seus clientes.

O
Convencional Stereo Format usa a resolução total das imagens e explora a redundância espacial e temporal entre as duas vistas. Com isto garante qualidade, pois não altera a resolução das vistas. No entanto, envia mais frames, logo o bit rate é mais elevado. Para minimizar o aumento do bit rate, explora a redundância temporal e a redundância entre vistas. O esquema de visualização tem a seguinte forma:

pic15_
Esquema de visualização do Convencional Stereo Format

Através deste esquema, garante-se a compatibilidade inversa, pois um televisor 2D descodifica e apresenta apenas a vista esquerda. Note-se também que não faz sentido enviar uma trama I (intra) na vista esquerda e na vista direita ao mesmo tempo, pois não se ganha nada em termos de acesso (zapping) e desaproveita-se a redundância espacial que existe entre as duas vistas (por isso, usa-se uma trama P).

Segue-se o 2D + Depth Format, que envia duas frames, uma com a imagem em duas dimensões e outra com a profundidade (mede as distâncias dos objectos à câmara). O objectivo passa por processar as duas frames recebidas e estimar várias vistas. Com isto, um utilizador pode mover-se livremente dentro de um certo ângulo (que deverá ser reduzido) e ter uma perspectiva de 3D bastante mais realista. Associado à estimação das várias vistas está a complexidade que, devido ao facto de ser do lado do descodificador, leva a um aumento do preço dos televisores que irão estar em milhões de casas.

No que diz respeito à compatibilidade inversa, esta está presente, pois um utilizador que possua uma televisão 2D descodifica e apresenta apenas o stream com as imagens 2D. O aumento do bit rate não é significativo, pois as
frames com a profundidade não requerem muitos bits.

pic16_
Duas frames enviadas por imagem com o formato 2D + Depth Format