Ir direto para menu de acessibilidade.
Portal do Governo Brasileiro
Início do conteúdo da página

Preservação Digital

Publicado: Sexta, 16 de Maio de 2014, 15h37

O que é Preservação Digital?

A preservação é um dos grandes desafios do século XXI. Durante os últimos anos do século XX, as bibliotecas, os arquivos e os centros e institutos de pesquisa e organismos governamentais criavam conteúdo digital relevante. Muitas coleções digitais importantes estão sendo construídas fora das bibliotecas e dos arquivos por diferentes organizações, ou sendo publicadas diretamente na Internet. Com o aumento da produção de informação em formato digital, tem sido questionada cada vez mais a importância de garantir a sua disponibilização e preservação por grandes períodos de tempo. Os objetos digitais não podem ser deixados em formatos obsoletos para serem transferidos, depois de longos períodos de esquecimento, para repositórios digitais, pois existe o risco de a tecnologia não conseguir recuperar as informações. Esta preocupação envolve tanto os produtores dos dados quanto os órgãos detentores dessa informação.

A preservação digital compreende os mecanismos que permitem o armazenamento em repositórios de dados digitais que garantem a perenidade dos seus conteúdos. Para atingir esse fim, os objetos digitais devem ser compreendidos e gerenciados em vários níveis: como um objeto físico, como uma codificação lógica, como objetos conceituais ou possuidores de significado para os humanos e como um conjunto de elementos essenciais que devem ser preservados para oferecer aos futuros usuários a essência do objeto. 

A condição básica à preservação digital seria, então, a adoção desses métodos e tecnologias que integrariam a preservação física, lógica e intelectual dos objetos digitais. A preservação física está centrada nos conteúdos armazenados em mídia magnética (fitas cassete de áudio e de rolo, fitas VHS e DAT) e discos óticos (CD-ROM, WORM e discos óticos regraváveis). A preservação lógica procura, na tecnologia, formatos atualizados para inserção dos dados (correio eletrônico, material de áudio e audiovisual e material em rede), novos software e hardware que mantenham vigentes seus bits, para conservar sua capacidade de leitura.

A preservação digital é a parte mais longa e também a última do ciclo de gerenciamento de objetos digitais. Ela permite o emprego de mecanismos que viabilizam o armazenamento em repositórios de objetos digitais e que garantem a autenticidade e perenidade dos seus conteúdos.  São necessários, não apenas, procedimentos de manutenção e recuperação de dados, no caso de perdas acidentais para resguardar a mídia e seu conteúdo, mas também estratégias e procedimentos para manter sua acessibilidade e autenticidade através do tempo, podendo requerer colaboração entre diferentes financiadoras e boa prática de licenciamento, metadados e documentação, antes de aplicar ações técnicas.

"A preservação digital precisa ser uma responsabilidade compartilhada, principalmente pelo grande volume de informação digital que está sendo produzido e pela natureza da tecnologia digital."             -Miguel Márdero Arellano

Ao analisar o ciclo da informação (geração, tratamento, preservação e conservação e, finalmente, difusão da informação), percebe-se que a preservação e conservação necessitam ser revistas no âmbito da informação digital. Até pouco tempo, entendia-se a preservação no sentido de conservar e prevenir os documentos do risco de deterioração. É importante analisar a preservação a partir da necessidade de assegurar o acesso e recuperação da informação científica como fundamento para a pesquisa acadêmica. Aliado a isso, deve-se considerar o crescente uso dos computadores e a quantidade de informações disponíveis em meio eletrônico (algumas, inclusive, somente neste meio). 

A natureza dos documentos digitais está permitindo ampla produção e disseminação de informação no mundo atual. É fato que, na era da informação digital, muita ênfase é dada à geração e/ou aquisição de material digital, em vez de manter a preservação e o acesso de longo prazo aos acervos eletrônicos existentes. Em geral, as tarefas relacionadas com a preservação digital seriam os procedimentos de manuseio e armazenamento da mídia digital, a cópia da informação contida, a migração para novas mídias e a preservação da integridade da informação digital.

___________________________________________________________________________________________________________________________________________________

Modelos de Preservação Digital

Preservação significa a conservação a longo prazo do conteúdo intelectual e do aspecto do recurso, mas também a garantia do cumprimento das regras de acesso estabelecidas para esse documento. Um programa de preservação correto deve garantir o acesso ao recurso para sempre, mas se o conteúdo estiver protegido por direitos de autor e restrições de outra natureza, isso deve ser assegurado, tal como no período “ativo” do documento.

O conceito de “período activo” e “não activo” de um documento faz cada vez menos sentido na actual linha de desenvolvimento dos estudos e experiências na área de conservação. A visão australiana de tomar os recursos como “continuum” e não em fases ou ciclos (corrente mais convencional), obriga à tomada de consciência da importância de preservar e trabalhar nesse sentido desde o ato de criação do recurso. Assim, a preservação seria algo de intrínseco e presente em todo o proceso de gestão desse recurso.

 

Duas soluções radicalmente diferentes

No campo das revistas científicas, duas entidades avançaram com propostas que tomaram forma nos últimos tempos. Portico (Digital Preservation and Electronic Archiving Service) e Lockss. 

Portico é a resultado da iniciativa de JSTOR que em 2002 procurava um modelo de preservação para a literatura científica viável. Atualmente, é uma entidade autônoma que recebe apoios da Biblioteca do Congresso, do JSTOR, do Ithaka e de Andrew W. Mellon Foundation.

A estratégia consiste na centralização do processo de preservação no Portico, retirando às bibliotecas e aos editores a tarefa de se ocuparem individualmente desse problema. Em contrapartida, é-lhes pedido apoio financeiro e, no caso dos editores, autorização para que o Portico possa preservar e dar acesso permanente aos recursos, mesmo nos casos em que o editor desaparece, descontinua um título ou em que a biblioteca deixa de subscrever o serviço ao editor.

Tecnicamente, o processo resume-se à recepção do material original, à conversão para o formato de preservação e à migração, quando necessário. Existe uma cópia do arquivo do Portico na Biblioteca Nacional da Holanda. Os formato, esquema de metadados e modelo usados são: Journal Archiving and Interchange DTD, PREMIS, OAIS.

Inúmeras universidades aderiram ao projeto, sobretudo dos EUA, do Reino unido, da Austrália, da Itália e Grécia. Também muitos editores, compresença significativa das editoras acadêmicas, mas também alguns editores profissionais como Elsevier, Springer, John Wiley & Sons.

 

Lockss é um projeto muito especial, a começar pela logo. Trata-se de uma tartaruga e funciona como símbolo da “longevidade” que se deseja para os recursos eletrónicos.

O motor tem sido a Universidade de Stanford, que deu o pontapé de saída em 2000, mas é atualmente apoiada pela Biblioteca do Congresso, pela Mellon Foundation, pela National Science Foundation, pela Sun Microsystems, HP Labs.

Os membros são também universidades e curiosamente alguns dos editores que abraçaram o projeto do portico: Elsevier e Springer, por exemplo. Isto prova que a preservação é um assunto muito sensível e que as entidades estão genuinamente interessadas em participar nas iniciativas que existam em curso.

Ao contrário do Portico, a filosofia do Lockss defende o modelo tradicional de preservação nas bibliotecas que funcionou muito bem durante séculos e séculos. No esquema proposto, cada entidade, biblioteca ou editor, deve participar no esforço conjunto de preservação a largo prazo.

Em termos muito resumidos, a solução assenta na tecnologia disponível e no conceito de rede. São necessários computadores normais, crawlers usados na web, rede peer-to-peer, permissão dos editores para que seja possível efetuar a recolha sistemática, análise e correção de erros, e, claro, os recursos originais.

O funcionamento é simples:

  1. o trabalho é em parceria, o que significa que a monitorização dos recursos é repartida entre as entidades,
  2. os recursos encontram-se replicados pela rede, pelo que quando ocorre um problema num recurso de uma entidade, ela tem a possibilidade de repor a autenticidade e integridade, valendo-se de outra entidade que não sofreu o dano,
  3. o arquivo está distribuído, ou seja, o risco de que o arquivo seja todo destruído é impossível, o que já não é válido quando se tem um arquivo centralizado,
  4. a garantia de que o sistema se auto-monitoriza e controla a qualidade está assegurada pela replicação dos recursos em diferentes peers, mas também pelas caches permanentes,
  5. a migração é aplicada automaticamente, por isso um documento é sempre lido pelos navegadores sem problema,
  6. além da monitorização dos títulos em preservação, é possível controlar os acessos e sinalizar novos títulos que devem passar ao programa de preservação,
  7. elimina a necessidade de cópias de segurança em dispositivos móveis, porque a “cópia” está na rede,
  8. facilita o acesso imediato ao recurso pedido, porque está disponível e não arquivado por uma entidade.

 As grandes vantagens desta opção são: custo muito reduzido, quando comparado com os megaprojetos centralizados de preservação; recursos ao alcance de qualquer entidade (PC, rede peer-to-peer…); tecnologia inteiramente open source; implementação fácil e autonomia e quase auto-gestão do programa.

Texto editado da notícia original de Cláudia Amorim, agulha.camorim.eu

Fim do conteúdo da página