Modelo de Arquitetura para Gestão da Preservação Digital

Infraestrutura da Dimensão Tecnológica

A esfera tecnológica é uma dimensão que abrange todo o universo de computação, inclusive pessoas e procedimentos para o trato com os dados digitais, assim não se deve considerar apenas a parte lógica e física da computação. Entram em cena os Sistemas de informação (SI) que são um conjunto formado por pessoas, software, hardware, procedimentos e redes de telecomunicações que servem para coletar, criar e distribuir dados úteis, normalmente em ambientes organizacionais.

A dimensão tecnológica é composta pelas infraestruturas de:

1. Software 
2. Hardware

Nesta perspectiva não vamos introduzir as pessoas diretamente nos processos da infraestrutura Tecnológica, apesar do fator humano está diretamente ligado a todas as esferas, vamos no ater somente às tecnologias de software e aos equipamentos de hardwares.

1. Software –  Esta infraestrutura apresenta um panorama do aspecto da tecnologia e de programas de computador que podem auxiliar na recuperação, acesso e utilização da informação inserida em repositórios Institucionais.

2. Hardware –  Trata de uma visão dos aspectos elementares do conjunto de aparatos eletrônicos, peças e equipamentos de um computador que constituem um complexo de preservação em longo prazo.

 

Infraestrutura de Hardware

A infraestrutura de hardware da esfera tecnológica abarca toda a parte física do conjunto de aparatos eletrônicos, peças e equipamentos de um computador de uma infraestrutura computacional. Ao pensarmos em Gestão da Preservação Digital se  apresenta bem mais complexa. Quando elevamos para uma arquitetura computacional de rede ou mesmo um storage de um Repositório Institucional a parceria com a equipe de Tecnologia da Informação, Desenvolvedores e Técnicos de Informática se torna imprescindível. 

É importante considerar estes equipamentos de hardware como partes fundamentais na Preservação Digital, por este motivo é impossível para um único profissional, exercendo a função de curador digital gerir todo o trabalho que demanda um grupo de especialistas,  A gestão da dimensão tecnológica demanda uma equipe uma comissão, um comitê com especialidades técnicas diversificadas, sendo imprescindível a inclusão de tecnólogos e bacharéis em Tecnologia da Informação.

Vale salientar que a Esfera Tecnológica de hardware e software está diretamente conectada com as Esfera Técnica, pois sua infraestrutura demanda o uso destes dispositivos computacionais. Assim o profissional de Gestão da Preservação Digital precisa estar atento a esta dimensão da arquitetura da Preservação Digital tanto quanto as demais.

Dito isto, conhecer como funciona uma infraestrutura de hardware é uma maneira de se familiarizar com esta arquitetura. A estrutura montada para armazenar dados e distribuí-los, é chamada datacenter. Na prática esta central de dados deve ser pensada para no mínimo 10 anos de atividades escalonáveis, assim durante seu planejamento devemos considerar as demandas que irão progressivamente reduzindo o espaço livre de seu desempenho.

A infraestrutura de hardware para Preservação Digital é constituída de equipamentos eletroeletrônicos, energia elétrica, conexão de rede e climatização. Pode parecer estranho a climatização figurar nesta dimensão, no entanto é preciso compreender que hardware, assim como tecnologia não é uma terminologia  exclusiva para a área de Computação. 

A rede elétrica e a conexão de rede são essenciais, sem elas não existe a preservação digital, pois preservar não é apenas guardar em longo prazo, mas também dar acesso à informação armazenada. No tocante ao risco de perdas digitais, a eletricidade e a negligência à sua existência como parte essencial  do ecossistema de preservação digital são fatores de vulnerabilidade que frequentemente colocam em cheque a integridade de Repositórios Institucionais.

Da mesma forma, na atualidade, depois da Internet das Coisas (IoT) a Tecnologia da Informação abrange muito mais que apenas computadores e impressoras, tudo ao nosso redor produz informação, em alguns anos poderemos ter o controle de toda informação produzida dentro de uma infraestrutura de DataCenter para Preservação Digital, inclusive o que diz respeito aos dados climáticos dentro no interior da sala do DataCenter.

 

Atributos Tecnológicos de Hardware

A infraestrutura de hardware da esfera tecnológica abarca os atributos sobre como a gestão da preservação digital entende a infraestrutura de equipamentos físicos de um repositório. Visto que ao se pensar um projeto para preservação digital em Repositórios Institucionais, é essencial que a equipe destacada para gerir o programa, na infraestrutura de governança, tenha a percepção de que os equipamentos de hardware são fundamentais para o funcionamento e existência do Repositório Institucional.

As máquinas e equipamentos eletroeletrônicos, em sua maioria podem e são substituíveis dependendo do porte do projeto estabelecido na sessão de sustentabilidade da infraestrutura de governança. Porém é importante prever estes custos antes da aprovação do projeto, pois caso haja defeito ou sinistro com o equipamento, isso será um fator de risco que pode ser irreversível depois que o programa de preservação estiver implementado, causando uma série de dificuldades para a gestão da preservação, elevando a potencialidade de instalação do risco.Contudo existem dois aspectos que a gestão da infraestrutura tecnológica precisa observar para manter a garantia de longevidade em níveis aceitáveis, o que são o armazenamento e a rede de conexão. O armazenamento guarda – assim como a palavra grega teca –, é o locus, o lugar onde a informação digital está alocada deve ser constantemente monitorada para evitar que ameaças e perigos se aproximem aumentando o risco de acidentes digitais. A rede, por sua vez, tem a função de prover o acesso à informação armazenada, ela representa o elo entre o software e o armazenamento digital.

 Quais perguntas devem ser feitas para o hardware de armazenamento?

• Hard Disk (HDs):

- Modelo do HD
- Capacidade (de uso, espaço livre e ocupado)
- Ano de Fabricação 
- Tipo de Formatação
- Histórico de falhas
- Histórico de desligamento do quadro elétrico

• Data Center, CPD e Nuvem:
- Solicitar mensal (semestral ou anualmente) relatório de desempenho à T.I. da Instituição ou à empresa responsável.

• Rede:	 
- Solicitar mensal (semestral ou anualmente) relatório de desempenho à T.I. da Instituição ou à empresa responsável.

Infraestrutura de Software

A infraestrutura de software da esfera tecnológica abarca os atributos de como programas de computador que podem auxiliar na recuperação, acesso, utilização e preservação da informação inserida em repositórios Institucionais.

Os principais softwares para preservação digital utilizados pelas instituições das redes LOCKSS, para além do DSpace, Archivematica e Atom são: Arca, Atmire, Digital Commons, Hyrax, PUB e Ubiquity.

 

Atributos Tecnológicos de Software

Os atributos de software da infraestrutura tecnológica nos mostram que estando a informação inserida em um armazém digital, é necessário o uso de um programa de computador para que esta possa ser recuperada, acessada e utilizada.

Os programas de computador ou programas informáticos descrevem uma tarefa a ser realizada por um computador a partir de instruções, que também podem ser chamadas de código fonte, o qual pode ser escrito em alguma linguagem de programação que é convertida para um formato de arquivo ou extensão que conterá a forma executável deste código fonte.

Os formatos de arquivos são os mais diversos e sempre estão surgindo outros a todo momento, visto que um formato de arquivo é desenvolvido por uma organização com ou sem fins lucrativos. Desenvolvido pela Adobe Systems, em 1993, o formato PDF (Portable Document Format), por exemplo, auxiliou muitos documentos a ganhar autenticidade, pois à época os processadores de texto como o Microsoft Word apenas geravam arquivos no formato .doc, formato proprietário, do tipo editável. Vendo que este formato tinha um potencial muito vasto houve uma interação de força para torná-lo de Acesso Aberto (Open Access). 

Existem ainda os formatos para as linguagem de programação como Php, Java, Python entre outras e a linguagem de marcação de hipertexto HTML (HyperText Markup Language) que são a maneira como os softwares e hardwares se comunicam, possibilitando que as máquinas interpretem funções e executem executar tarefas específicas.

Dica

Durante a composição da documentação do projeto de Preservação Digital  é preciso registrar informações relevantes para análise de risco em Repositórios Digitais Institucionais(RDI), assim é necessário fazer algumas perguntas sobre o software utilizado no RDI para realização deste registro, tais como:

• Nome do software 
• Versão Instalada
• Data de instalação
• Histórico de atualizações
• Histórico de manutenção do sistema
• Programa de Capacitação
   - Treinamento para uso técnico
   - Capacitação (mensal, semestral, anual)
   - Documentação online disponível
   - Network do software (grupos, comunidade oficial)
   - Comissão para avaliação das funções do software para o RI.
   - Comissão para avaliação da experiência dos usuários (UX) do software.
 
Um ferramenta importante para levantamento de software utilizados por Repositórios Digitais são o OpenDOAR: Directory of Open Access Repositories e o Registry of Open Access Repositories (ROAR), por serem iniciativas tecnológicas relevantes para o monitoramento de repositórios de acesso. Apesar de não focarem nos softwares, em um dos campos de seus mecanismos de busca interna há a possibilidade de consultar qual tipo de software está sendo utilizado. Na iniciativa portuguesa RCAAP ao buscar mais informações sobre repositórios parceiros é retornado em uma das linhas o software que está sendo utilizado.

Referências bibliográficas

OpenDOAR: Directory of Open Access Repositories. Disponível em: https://v2.sherpa.ac.uk/opendoar/
ROAR: Registry of Open Access Repositories. Disponível em: http://roar.eprints.org/
RCAAP: Repositórios Científicos de Acesso Aberto de Portugal. Disponível em: https://www.rcaap.pt/