Este artigo pretende introduzir as características dos sistemas de videovigilância, assim como a sua evolução até se tornarem redes de vigilância totalmente digitais. É também discutida a problemática da invasão de privacidade, e o facto de não haver a consciência da ameaça à liberdade individual que estes novos sistemas representam. Finalmente são introduzidas as perspectivas de evolução futura, bem como as capacidades dos sistemas vindouros, de aproveitarem as sinergias da digitalização do vídeo, da rede de comunicação e do reconhecimento facial.

 

Nos tempos que correm, a videovigilância tornou-se uma realidade ubíqua[1], em boa parte, devido ao crescimento do número de instalações deste género, que vão dos sistemas de CCTV (Closed Circuit Television) às câmaras totalmente IP, acessíveis através da Internet. Esta é uma realidade que já não pode ser evitada, apesar de ainda levantar muitas questões éticas e até jurídicas, relativamente à gravação de imagens sem o consentimento das pessoas. Os sistemas desta natureza já são usados em inúmeras aplicações e, frequentemente, são instalados em áreas protegidas, com o objectivo de monitorizar eventos em tempo real ou de gravar ocorrências, actuando ainda, em muitos casos, como elementos dissuasores da criminalidade. [2][3].

Vão ser analizadas, individualmente, cada uma das componentes integrantes dum sistema CCTV. De seguida, vão ser apresentadas as evoluções tecnológicas mais marcantes a que estes sistemas estiveram sujeitos nos últimos anos. Vamos também introduzir e discutir o problema da privacidade e dos direitos do cidadão, finalizando com uma breve introdução aos sistemas de videovigilância do futuro.

O primeiro sistema CCTV foi criado na Alemanha, pela Siemens AG, com o objectivo de observar o lançamento de rockets. Embora as tecnologias de cada componente mudem muito frequentemente, a estrutura destes sistemas permaneceu relativamente constante, sendo introduzidas nesta secção as suas componentes essenciais.


2.1. Câmaras

A função essencial de uma câmara é converter um ambiente visível, capturado pela sua lente, num sinal eléctrico que possa ser transmitido para um sistema no qual se possa visualizar uma imagem desse ambiente.

A escolha da câmara ideal para operar num determinado ambiente constitui muitas vezes um processo complexo, pois envolve decisões que podem ser condicionadas por vários parâmetros, que variam em função do objectivo visado. A selecção de uma câmara, para além depender do ambiente em que esta vai actuar e da qualidade de imagem desejada, é habitualmente, condicionada também pelo custo global do sistema. As dimensões do sistema e o consumo de energia são ainda factores que, entre outros, podem condicionar o processo de decisão.

Consoante o tipo de cobertura do ambiente que se pretende fazer, assim há que optar por um dos seguintes tipos de câmaras: as fixas ou as do tipo Pan Tili Zoom (PTZ). Nas figuras 1 e 2 mostram-se exemplos de uma câmara fixa e de uma PTZ, respectivamente.

Contrariamente às câmaras fixas, as PTZ podem ser movimentadas remotamente, em qualquer das direcções (esquerda, direita, cima e baixo) e possuem, na maior parte das vezes, a capacidade de fazer Zoom da imagem captada.

                                                         

Figura 1 – Exemplo de uma câmara fixa


Figura 2 – Exemplo de uma câmara PTZ


Frequentemente, as câmaras PTZ estão protegidas no interior de uma redoma de plexiglass preta. Este tipo de encapsulamento apresenta a vantagem de dificultar que se perceba qual é a direcção apontada pela câmara e, por outro lado, possibilita a expansão do sistema com câmaras falsas, o que pode melhorar o aspecto estético do sistema e aumentar a dificuldade de identificação da câmara operacional.

 

2.2. Lente

As lentes têm um papel importante no desenho de sistemas CCTV. A sua função principal é recolher a luz reflectida de uma cena e retirar uma imagem clara. Tipicamente, quanto mais luz passa através da lente, melhor é a qualidade da imagem. Assim sendo, a escolha da lente é especialmente crítica, pois influencia directamente o tamanho, a forma e o detalhe da imagem a ser apresentada. Existe ainda uma série de factores, como a depth of field, o FOV (field of view), a iluminação e o formato, que afectam a qualidade final das imagens produzidas pela câmara.


2.2.1 FOV (Field of View)

O FOV é essencialmente o tamanho da imagem (altura V e largura H) que é recolhido por uma determinada lente a uma certa distância L (ver Figura 3). As lentes das câmaras podem ser divididas em dois tipos básicos: lentes de distância focal fixa e lentes de distância focal variável (Zoom). Caso sejam necessárias imagens com ângulos de visão diferentes, as lentes com distância focal variável são a melhor escolha.

                                                     

Figura 3 – Esquema ilustrativo do FOV

2.2.2 Depth of field

Outro parâmetro a considerar relativamente às lentes é a depth of field, que consiste na área de foco antes e depois de um determinado objecto. Isto significa que quando se foca um objecto de forma precisa, existe uma certa distância antes e depois desse objecto que também se vai encontrar focada.


2.3. Condições de Iluminação

As condições de iluminação são um factor condicionante na escolha de um sistema de videovigilância. A qualidade de imagem tem uma relação directa com as condições de iluminação no sítio que se deseja monitorizar.

Dependendo do local em questão, podem existir fontes de luz naturais ou artificiais, sendo necessário determinar o nível mínimo de luz com o qual o sistema vai ter de trabalhar. Este nível mínimo de luz é uma referência importante, pois existem outros elementos que dele dependem (por exemplo a cor da imagem).


2.4. Cor da imagem

Embora a utilização de câmaras a cores esteja a aumentar, existem situações em que as câmaras a preto e branco têm vantagens. Este tipo de câmaras consegue capturar imagens de boa qualidade em situações de muito pouca luz, sendo importante notar que, tanto nas câmaras a cores como a preto e branco, o preço cresce com o aumento desta capacidade. Assim, antes de se comprar um sistema de videovigilância, é necessário fazer uma comparação entre os encargos resultantes da melhoria de iluminação no local em que se pretende implementar o sistema e os custos inerentes  à aquisição de câmaras com esta capacidade.

As câmaras a cores, por sua vez, geram imagens mais ricas e naturais do que as suas homólogas a preto e branco (Figura 5). Esta naturalidade permite detectar melhor certos eventos, permitindo ao operador analisar com um maior detalhe a realidade que as imagens apresentam. A título de exemplo, na eventualidade de existir um incidente que envolva um carro vermelho (ver Figura 4), é fácil identificar a sua cor utilizando uma câmara deste género. Tal já não acontece no caso de se utilizar uma câmara a preto e branco. Além disso, imagem de uma câmara a cores consegue manter o interesse do operador por um maior período de tempo.


Figura 4 – Exemplo de uma imagem gravada numa câmara a cores.


Figura 5 – Imagem da ocorrência de um delito , gravado numa câmara a preto e branco


2.5. Meios de Transmissão de vídeo

O papel desempenhado pelo meio de transmissão consiste em levar o sinal de vídeo da câmara até ao monitor onde se vai visualizar a área monitorizada; eventualmente, poderá ainda ser usado para transmitir informação em sentido contrário (por exemplo, comandos remotos para a câmara).

Existe hoje em dia, uma série de meios de transmissão diferentes: cabo coaxial, fibra óptica, linha telefónica e rádio frequência (ex: microondas). A escolha do meio de transmissão depende de factores como a distância, o ambiente, o custo e até o próprio desenho da estrutura em que se pretende instalar o sistema. Todos os meios de transmissão apresentam perdas e estão sujeitos a interferências. No desenho de uma rede, um dos objectivos importantes é minimizar o impacto destes efeitos.


2.6. Interface do Sistema

Um aspecto importante a considerar no desenvolvimento de sistemas, é a interface com o operador. Por um lado, é importante que a utilização do sistema seja intuitiva e, por outro, deve-se viabilizar a rápida e eficiente monitorização de todas as câmaras. É ainda relevante que a interface gráfica possua um aspecto apelativo para que não canse mas também não distraia o operador da sua função.

Tipicamente, a interface que é fornecida ao operador deve contemplar a possibilidade de se visualizarem as diversas câmaras disponíveis, tanto em modo sequencial como em subconjuntos das câmaras existentes, podendo estes ser revezados automaticamente. Em sistemas em que existam câmaras PTZ, a interface deverá disponibilizar os comandos para o controlo remoto. Na Figura 6 apresenta-se um bom exemplo de um interface para o operador.


                                       

                        Figura 6 – Exemplo de uma Interface gráfica


2.7. Armazenamento

O problema do armazenamento é uma questão delicada, neste tipo de sistemas. O vídeo é na sua essência um tipo de conteúdo com requisitos de capacidade, processamento e de tempo elevados.

Existe toda uma série de motivos que justificam o armazenamento dos dados capturados pelas câmaras de videovigilância. Desde logo, para utilização própria em termos de segurança, já que poderá haver interesse em guardar registos dos acessos e das acções das pessoas que se encontram nos locais vigiados. Depois, porque esses registos poderão vir a ser solicitados pelas autoridades, caso venha a ser cometido algum tipo de delito nas áreas circundantes. Em terceiro lugar, podemos necessitar de ter os dados armazenados para fins estatísticos (por exemplo, estatísticas de afluência a um determinado serviço).

O problema surge quando se tem de decidir durante quanto tempo os dados têm de ser armazenados. Se usarmos apenas pequenas janelas de tempo, perdemos a capacidade de investigar ocorrências mais antigas e de retirar padrões e estatísticas. No outro extremo (longos períodos de armazenamento), é necessária uma grande capacidade de armazenamento, o que aumenta o TCO (Total Cost of Ownership) do sistema.

Este problema pode ainda ser agravado pelo facto de existirem obrigações em termos do período em que se é obrigado a reter os dados, o que significa que o parâmetro do tempo de armazenamento acaba por não ser uma decisão unilateral de quem implementa o sistema, mas sim influenciada ou imposta pela legislação em vigor.

 

A evolução tecnológica nos sistemas de videovigilância tem sido muito influenciada pelo aparecimento da Internet e das tecnologias que a suportam. Existem, no entanto, algumas tecnologias que conseguiram influenciar de forma dramática estes sistemas.

3.1. Revolução do armazenamento

O armazenamento de dados tem vindo a ser historicamente feito, em cassetes. No entanto, com a digitalização do vídeo, é cada vez mais comum fazer-se o armazenamento dos dados em suportes digitais, como por exemplo, em discos rígidos. A digitalização destes conteúdos abre as portas a um novo mundo: o da codificação e a compressão de vídeo. É agora possível utilizar normas de codificação de vídeo que possuem uma serie de técnicas para redução da quantidade de dados que têm que ser transmitidos (e consequentemente a capacidade de armazenamento necessária). Além disso, o próprio armazenamento nos suportes digitais é agora feito com recurso a técnicas de compressão de dados que permitem aumentar a sua capacidade[4].

A fórmula (1) representa uma forma de calcular a capacidade de armazenamento necessária para guardar vídeo.

                                          


Na formula 1, Nc corresponde ao número de câmaras, Rf à frame rate (FPS), Sf ao tamanho médio da cada imagem no disco e D ao número total de dias que se pretende armazenar os vídeos. A título de exemplo, temos o sistema representado na figura 7, que é constituído por 3 câmaras IP, nas quais a frame rate é de 25 FPS, a resolução é CIF 352x288 e o tamanho médio de cada imagem é cerca de 2.4Kbyte (com MPEG4 para compressão)[4]. Caso se pretenda armazenar os dados por 30 dias, pela (2) o espaço total de armazenamento só para vídeo ronda os 445GB.



Figura 7 – Exemplo de um sistema com 3 câmaras


                                      

Embora este número pareça bastante elevado, a evolução da relação preço/capacidade nestes dispositivos de armazenamento faz com que seja um número razoável. Note-se que, a grande evolução tecnológica se fez à volta do parâmetro Sf (tamanho médio da imagem em disco). É este parâmetro que se tem de minimizar, de forma ocupar menos espaço de armazenamento, para a mesma qualidade de imagem e é sobre este parâmetro que as técnicas de codificação e compressão actuam.

3.2. Tecnologias de acesso

A tecnologia de acesso é outra das áreas que foi muito influenciada pelo fenómeno da Internet e das redes baseadas em IP. Embora durante os últimos 20 anos toda a área de vigilância tenha sido baseada em tecnologia analógica, o crescimento do fenómeno digital fez com que os problemas associados a este tipo de tecnologias se tornassem mais visíveis [5]. Estes problemas passam essencialmente pelos elevados requisitos de manutenção, pela falta de acesso remoto e pela dificuldade de integração com outros sistemas.

Uma grande vantagem da passagem de tecnologias analógicas para digital é a possibilidade de dos sistemas se desenvolverem passo-a-passo[5]. A utilização do protocolo IP nas câmaras surgiu apenas como mais um passo na transformação dos sistemas analógicos para os digitais. Isto significa que caso já se possua um sistema CCTV analógico, existe a possibilidade de integração com uma rede digital, através do uso de um Network DVR (Digital Video Recorder). Na figura 8 encontra-se representado um diagrama desta integração.


Figura 8 – Esquema representativo de uma rede


3.3. Vantagens da evolução para digital

Relativamente à evolução da infra-estrutura propriamente dita, há a salientar duas grandes vantagens: a facilidade de integração com outros sistemas e aplicações e a diminuição do TCO (Total Cost of Ownership), devido à reutilização das redes já existentes e à possibilidade de integração de equipamentos legacy[5]. As outras vantagens desta mudança advêm do facto de possibilitar a utilização de equipamentos integrados com a rede (como é o caso das Câmaras IP). Estes equipamentos trazem uma série de benefícios ao sistema, entre os quais se destacam:

  1. Permite adicionar novas câmaras sem grandes custos de instalação, caso já exista uma rede de comunicação no edifício

  2. Deixa de ser necessário ter monitores dedicados para a visualização das imagens, podendo ser utilizado qualquer computador para esse efeito.

  3. Permite o acesso remoto, com segurança, às imagens das câmaras.

  4. Existe a possibilidade fornecer alimentação eléctrica às câmaras através da própria rede de comunicação

 

Os dilemas de privacidade dos sistemas de vigilância não são fáceis de resolver. Por um lado, as pessoas não querem ser observadas enquanto estão a tratar de assuntos pessoais, ou quando estão no trabalho; por outro, querem que haja uma vigilância constante, que permita a detecção e a prevenção de potenciais acções ilícitas ou criminosas.

Embora a utilização destes tipos de sistemas em locais públicos seja relativamente comum, é frequente serem considerados como um ataque aos direitos individuais do cidadão, independentemente do fim a que se destinam. Podem surgir sempre preocupações sobre a utilização das câmaras para fins diferentes daqueles para os quais foram inicialmente montadas (vigilância dos condutores, por exemplo[6]). Pode-se também questionar a conduta dos operadores dos sistemas de vigilância [3]. Será que realmente existe confiança na sua capacidade de observar as imagens objectivamente e sem parcialidade?


4.1. De CCTV para Webcams

As mudanças tecnológicas que a videovigilância sofreu ao longo das últimas décadas, fizeram com que as antigas tecnologias se tornassem obsoletas, e tornassem o CCTV numa sigla que engana. Os sistemas de vigilância modernos já não utilizam circuitos fechados para a comunicação. Como foi referido na secção relativa à evolução tecnológica, é cada vez mais frequente utilizar-se a rede de comunicações para transmitir o vídeo digitalizado. O uso continuado do termo CCTV pode, de certa forma, indicar a falta de consciência das implicações destes sistemas modernos e mascarar os objectivos, as possibilidades e, principalmente, os perigos das tecnologias actuais [3].

Estes sistemas de vigilância modernos podem ser encarados, de certa forma, como webcams. Embora a maior parte dos sistemas não envie os dados directamente para a internet, ambos possuem o mesmo princípio de funcionamento e o mesmo tipo de capacidades. Por exemplo, podem ambas estar ligadas a uma rede local de grande área, as suas imagens podem ser enviadas para a internet ou para a televisão, os vídeos são guardados digitalmente, etc.

4.2 Lei 67/68 – Protecção de Dados Pessoais

Relativamente à legislação em vigor em Portugal, a lei diz claramente que:

“O tratamento dos dados pessoais só pode ser efectuado se o seu titular tiver dado de forma inequívoca o seu consentimento...”[7] . O grande problema é as excepções aplicadas à lei geral. Ainda no artigo [7], é enumerada uma série de excepções na qual se encontra dito, por exemplo, que qualquer instituição pública pode fazer tratamento de dados sem este consentimento explícito.

Isto significa que, por um lado, estamos cada vez mais sujeitos a sistemas de videovigilância públicos (possivelmente com acesso pela internet), por outro, a lei possui uma série de excepções à regra fundamental do tratamento de dados que fazem com que a captura desses dados seja legal.

Foram apresentadas uma série de evoluções revolucionárias, na tecnologia de suporte aos sistemas de videovigilância. Estas tecnologias, por si só, não mudaram a forma de funcionamento dos sistemas, tendo sido muito importantes para a optimização de recursos e para facilitar o acesso àquilo que já nos era dado anteriormente - imagens de vídeo. No entanto, estas tecnologias vão ser a pedra basilar da próxima evolução destes sistemas, uma evolução que muda a forma como são usadas e que aproveita todas as capacidades dadas pela mudança para digital.


5.1. Reconhecimento facial

O ser humano sempre teve a capacidade inata de reconhecer e distinguir entre diferentes caras, de diferentes indivíduos, sendo que só recentemente é que os computadores demonstraram habilidades semelhantes.

Cada cara tem inúmeras características que faz com que seja possível distingui-las entre si. Algumas dessas características são utilizadas pelos softwares de reconhecimento de imagem, nomeadamente:

  1. Distância entre os olhos

  2. Largura do nariz

  3. Comprimento do maxilar



Figura 9 – Programa de medição das características faciais


Estes pontos distintos criam um código numérico chamado faceprint, que representa a face de um indivíduo e é armazenada nas bases de dados, para posterior comparação [8].

O grande problema destas técnicas de reconhecimento facial, é o facto de apresentaram um número de falsos positivos e falsos negativos mais elevados do que outras técnicas de reconhecimento biométrico. Surgem assim algumas dúvidas quanto à sua eficácia, e aplicabilidade prática [9].


5.2. Sistemas de videovigilância do futuro

Os sistemas do futuro vão permitir identificar e seguir qualquer indivíduo em tempo real.

Para conseguir alcançar este objectivo, têm de ser criadas sinergias entre as capacidades dos sistemas de vigilância digitais, as redes de comunicação que os suportam e as técnicas de reconhecimento facial.

Um exemplo desta integração de sistemas é o caso da cidade chinesa de Shenzhen [10], com 12.4 milhões de habitantes e na qual é estimada a instalação de mais de 2 milhões de sistemas CCTV, fazendo parte do projecto Golden Shield[11]. Um dos grandes objectivos deste projecto é, em grande parte, a integração dos vários sistemas de vigilância em cada cidade com um sistema central de reconhecimento facial, permitindo seguir qualquer pessoa, em qualquer parte do país [10].

Este sistema foi posto à prova muito recentemente com os incidentes relacionados com a tocha olímpica em Pequim. Embora a tecnologia de reconhecimento facial ainda não se encontre implementada, as autoridades foram capazes de retirar imagens e publicá-las nas redes de televisão, conseguindo proceder à captura dos indivíduos em questão.

A grande vantagem da utilização de um sistema global deste género, totalmente digital, é realmente a possibilidade de fazer todo o tipo de tratamento de dados, quer seja para identificar e seguir um determinado indivíduo, quer seja para detectar em tempo real se existe um ajuntamento de pessoas na rua, e alertar imediatamente as autoridades competentes.


5.3. Sistemas de videovigilância do futuro

Embora não seja surpreendente a existência de um sistema deste género na China, já se começa a ver o mesmo tipo de tendências noutros países. Em alguns aeroportos dos EUA, começam a ser tiradas fotografias e gravadas as impressões digitais de todos os estrangeiros que entram no país[12]. Estes dados são gravados em bases de dados e podem vir a ser utilizados no mesmo tipo de sistemas de reconhecimento de imagem, atingindo o mesmo tipo de invasão de privacidade que o sistema GoldenShield.

Tem de ser dado o alerta para que as pessoas possam compreender as implicações da existência deste tipo de sistemas, e se possa mudar legislação em vigor para que consiga garantir a privacidade do cidadão

 

As redes de videovigilância sofreram uma evolução enorme na última década. Passámos de sistemas CCTV analógicos a utilizar meios de transmissão dedicados, para sistemas totalmente digitais, a utilizar as infra-estruturas de comunicações já existentes do mundo das redes de computadores.

Esta evolução permitiu diminuir o custo de manutenção, aumentando a escalabilidade e as capacidades, no processo. Uma das grandes vantagens da digitalização do vídeo, advém do facto de poderem ser reutilizadas técnicas de codificação e compressão amplamente divulgadas, aumentando muito a eficiência destes sistemas.

Infelizmente, há falta de consciência dos perigos destas novas redes de vigilância digital, acompanhada por uma falta  de legislação adequada que proteja os nossos direitos individuais. A ubiquidade destas redes requer uma maior atenção ao impacto da digitalização na privacidade do domínio público, e o fim das percepções desactualizadas do que é um sistema de videovigilância, herdadas da geração do CCTV.

Bruno Gonçalves nasceu em Lisboa no ano de 1986, frequenta actualmente a Licenciatura e Mestrado em Engenharia de Redes de Comunicação no Instituto Superior Técnico.

É deste 2006 Secretário do Núcleo de Estudantes de Engenharia de Redes de Comunicação e Informação (NEERCI-IST) e é membro activo do Centro Espacial Português (CEP).



Diogo Mónica nasceu em Fort Ord, California USA em 1986, tendo-se licenciado em Engenharia de Redes de Comunicação pelo Instituto Superior Técnico em 2007. Actualmente frequenta o Mestrado na mesma área.

É desde 2006 Presidente do Núcleo de Estudantes de Engenharia de Redes de Comunicação e Informação (NEERCI-IST), Liasion do IST-Taguspark no IEEE-IST e é membro activo do Centro Espacial Português (CEP).