Metadados

Literalmente, metadados significa “dados sobre dados”.

Os metadados eram usados tradicionalmente no sistema de catalogação das bibliotecas, que registavam, por exemplo, o autor, título, assunto e localização na prateleira. Como a informação se tornou cada vez mais digital, os metadados são utilizados para descrever os dados digitais utilizando os padrões standard. Ao descrever o conteúdo e contexto de arquivos de dados, a utilidade dos dados originais é muito maior. Uma página da Web pode incluir metadados a especificar em que língua está escrito, quais as ferramentas que foram usadas para criá-lo, para onde ir para obter mais informação sobre o assunto, permitindo assim melhorar automaticamente a experiência dos utilizadores.

Outro exemplo, é a Wikipedia, incentiva o uso de metadados, pedindo aos editores para adicionar os nomes das categorias dos artigos, e para incluir informações com citações como título, fonte e data de acesso. Seja no contexto tradicional ou no contexto da Internet, o propósito essencial dos metadados é facilitar e melhorar o acesso a informações.

Tipos de metadados

Em 1994, Bretheron e Singley[3], fizeram a distinção entre duas classes distintas: metadados estruturais, sobre o design e as especificações das estruturas de dados e metadados descritivos sobre o conteúdo dos dados.

Os metadados estruturais são usados para descrever a estrutura do banco de dados de objetos, como tabelas, colunas, chaves e índices. Os metadados descritivos são usados para ajudar os utilizadores a encontrar itens específicos e é normalmente expressa como um conjunto de palavras-chave em uma linguagem natural.

Há também quem defina um terceirto tipo de metadados. Metadados administrativos. Estes ajudam a gestão de recursos de informação através de elementos, tais como o número da versão, data do arquivo, e outras informações técnicas para fins de gestão de arquivos, gestão de direitos e preservação.

Estruturas de metadados

Os metadados, ou mais corretamente, os vocabulários utilizados na montagem dos metadados, normalmente são estruturados de acordo com um conceito padronizado usando um esquema de metadados bem definido, incluindo: padrões dos metadados[5] e modelos dos metadados[6].

Padrões de metadados

Padrões de metadados são os requisitos que se destinam a estabelecer um entendimento comum do significado ou semântica dos dados, para garantir o uso correto e adequado e interpretação dos dados pelos seus proprietários e utilizadores. Em 1995, um grupo (Library of Congress, universidades, empresas de TIC, organizações não governamentais, etc.) liderado pela OCLC reuniu-se na cidade de Dublin, no estado americano de Ohio, para propor uma padronização para estas informações sobre informações dos arquivos digitais. Depois de mais algumas reuniões, o grupo chegou a um conjunto mínimo de elementos para a identificação dos objetos digitais.

O conjunto ficou conhecido como Dublin Core (DC) [7] e é mantido pela Dublin Core Metadata Initiative. Em 2003, o DC tornou-se o padrão ISO 15836, tendo sido antes o ANSI Z39.85.

Muito trabalho vem sendo realizado nas comunidades nacionais e internacionais de normalização, especialmente ANSI (American National Standards Institute) e ISO (International Organization for Standardization) para chegar a um consenso sobre a padronização de metadados.

O padrão standard é o ISO / IEC 11179-1: 2004 e normas posteriores. É importante notar que este padrão refere-se metadados como os dados sobre os recipientes de dados e não aos metadados como os dados sobre o conteúdo dos dados.

Metadata na música

Os metadados são uma das características realmente úteis de arquivos de áudio digital. Quando o áudio foi do analógico para o digital, tornou-se possível codificar arquivos de áudio com mais informação do que apenas o nome do arquivo.

Os metadados podem ser usados para nomear, descrever, catalogar e indicar os direitos de autor de um arquivo de áudio digital, e a sua presença faz com que seja muito mais fácil para localizar um arquivo de áudio específico dentro de um grupo - através do uso de um motor de busca que acessa os metadados. Como diferentes formatos de áudio digitais foram desenvolvidos, foi acordado que um local padronizado e específico, seria reservado dentro dos arquivos digitais onde estas informações pudessem ser armazenadas.

Como resultado, os formatos de áudio digital, incluindo MP3, WAV e AIFF, têm posições semelhantes padronizados que podem ser preenchidos com metadados.

Normalmente na codificação de ficheiros de áudio é usado o microformato ID3 [8]. O ID3 permite que informações como o título, artista, álbum, número da faixa, e outras informações sobre o arquivo a ser armazenado apareçam no próprio arquivo.

Embora o ID3 é por vezes referido como um padrão, o termo só se aplica apenas no sentido de palavra, já que nenhum organismo de normalização foi envolvido na sua criação, nem nenhuma dessas organizações lhe deu esse estatuto de aprovação formal.

Os CDs, levam uma camada de metadados sobre as gravações, tais como datas, artista, gênero, proprietário dos direitos autorais, etc. Os metadados, normalmente não são exibidos nos leitores de CD, contudo podem ser visualizados por dispositivos ou aplicações de reprodução de música.

Os metadados podem ser armazenados internamente, no mesmo arquivo como os dados (isso também é chamado de metadados incorporados), ou externamente, em um arquivo separado. Uma base de dados normalmente armazena os metadados externamente a partir dos dados, mas pode ser projetado para suportar abordagens de metadados incorporados. Cada opção tem vantagens e desvantagens.

O armazenamento interno: os metadados são transportados como parte dos dados que descrevem; assim, os metadados estão sempre disponíveis com os dados, e podme ser manipulados no local. Este método cria redundância (impedindo a normalização), e não permite a gestão de todos os metadados de um sistema em um só lugar.

O armazenamento externo permite a instalação de metadados para todos os conteúdos, por exemplo, numa base de dados, para uma procura e uma gestão mais eficiente. A redundância pode ser evitada através da normalização da organização dos metadados. Nesta abordagem, os metadados podem ser unidos com o conteúdo quando a informação é transferida, por exemplo, em media streaming; ou pode ser referenciada (por exemplo, como um link) a partir do conteúdo transferido. O lado negativo, os ficheiros sozinhos não transportam os metadados.

Os metadados podem ser armazenados em qualquer forma legível ou binário. O armazenamento de metadados num formato legível, como XML pode ser útil, pois os utilizadores conseguem entender e editar sem ferramentas especializadas. Por outro lado, estes formatos raramente são otimizados para capacidade de armazenamento, tempo de comunicação, e velocidade de processamento. Um formato de metadados binário permite eficiência em todos estes aspectos, mas requer bibliotecas especiais para converter a informação binária em conteúdo legível.