Sendo um negócio que move milhões, o entretenimento evolui a passos largos na direcção de proporcionar experiências cada vez mais imersivas e atractivas ao utilizador. Assiste-se a significativos avanços tecnológicos ao nível de dispositivos de visualização a par com uma qualidade crescente de conteúdo multimédia, tanto a nível de codecs como de resolução. Ao vídeo de alta definição e áudio surround alia-se o 3D para se recriarem realidades pormenorizadas. O despoletar de sensações e emoções no utilizador é o auge.

Este é um fenómeno alheio às máquinas cuja linguagem primária são números. São capazes de editar, comprimir e transmitir conteúdos mas não apreender a sua semântica. Sofrem de lacunas semântica e sensorial que uma vez transpostas, permitem que um mundo de conteúdos esteja automaticamente mais próximo de quem os quer aceder.

Nos dias que correm e, prevê-se que, durante os próximos anos, o número de dispositivos capazes de produzir conteúdos aumentam em proporções incríveis. Há umas décadas atrás nem se admitia a necessidade de cada casa ter um computador, muito menos se dar a actual explosão de smatphones, tablets, portáteis e muitos outros dispositivos! Como consequência, o paradigma mudou e os conteúdos já não são apenas fornecidos por produtoras. Com as inúmeras formas de partilha pela internet, os indivíduos tem o poder de se expressar através dos seus próprios conteúdos. E o sucesso é estrondoso, como provam plataformas de file sharing e sites como o Facebook, Twitter e Youtube.

Há uma questão que se coloca: como gerir, representar e navegar em todos estes conteúdos? A verdade é que sem um sistema que o permita fazer, a maior parte dos conteúdos estarão inacessíveis. Este problema é especialmente fatal em vídeos, já que existe uma dificuldade inerente à incompreensão semântica pelas máquinas computacionais.

Parte da resposta reside nos metadados e na sua capacidade de descrever conteúdos. É que, com a enorme quantidade de informação disponibilizada nas redes, e que todos os dias se multiplica, os metadados tem tanto impacto que há quem defenda que são mais importantes que os próprios dados. Isto no sentido em que, sem a correcta descrição do conteúdo, o seu acesso é significativamente dificultado.

Muitos conteúdos já possuem uma descrição, tal como título, autores, etc. inserida manualmente. São atributos insuficientes para descrever a riqueza de informação que os conteúdos proporcionam. Além disso, atributos mais específicos dependem do domínio e do conhecimento deste e subjectividade da pessoa a classificar. Ainda, a descrição manual é morosa e requer recursos humanos significativos. Uma alternativa, sem estas desvantagens, será fazê-lo automaticamente.

É nesta problemática que a área de recuperação de vídeo se centra. O seu objectivo é desenvolver sistemas que possibilitem uma descrição automática e precisa do conteúdo de vídeo para futura pesquiza e acesso bem como formas de o sintetizar.

Geralmente, os sistemas até agora propostos começam por analisar o vídeo de forma a extrair os seus atributos para depois os representar através de MPEG-7, por exemplo. A pesquisa é então efetuada por comparação destes atributos.

Nas próximas secções apresentam-se brevemente os metadados e a respectiva norma, o MPEG-7. No seguimento descrevem-se as características de cada operação de um sistema de recuperação de vídeo. Alguns sistemas alternativos também são discutidos.Seguem-se uma exposição de aplicações relevantes em vários domínios, uma análise de possíveis modelos de negócio e referências ao possível impacto social e legal.Por fim, lança-se um olhar ao futuro e aos desafios que a recuperação de vídeo tem a enfrentar.