Modelo de Arquitetura para Gestão da Preservação Digital

Infraestrutura para Glossário

A infraestrutura do glossário da esfera organizacional orienta que devido a necessidade de se consultar diferentes fontes, a definição de termos pode não ser consistente, da mesma forma que cada ambiente pode ter suas próprias definições para termos pouco específicos. Assim sendo, é necessário implementar um glossário específico para que a instituição possa dialogar na mesma língua com outras.

A estrutura de atributos para o glossário de termos é componente essencial na arquitetura de gestão da preservação digital como normativa de referência. Dessa forma, este guia orientador visa fornecer orientações e sugestões para sua elaboração e respectivas definições.

A busca por informações de consulta é uma prática que cabe em toda e qualquer área do conhecimento, a estrutura aqui sugerida se configura como uma lista de termos relevantes à gestão da Preservação Digital.

Existem diversos modelos de glossário que podem ser seguidos, no Brasil, o glossário da Rede Cariniana (IBICT, 2016), é uma ferramenta constantemente atualizada que pode servir como fonte de orientação para a construção do glossário de termos na arquitetura de gestão da preservação digital do repositório de cada Instituição.

 

Atributos para o glossário

Os atributos da infraestrutura do glossário da esfera organizacional sugerem que em face da busca por informações de consulta ser uma prática que cabe em toda e qualquer área do conhecimento, a estrutura aqui sugerida se configura como uma lista de termos relevantes à gestão da Preservação Digital.

A seguir estão listados outros 30 modelos de glossário de termos, com seus respectivos localizadores uniformes de recursos (URL) de instituições internacionais para auxiliar neste processo.

A busca por informações de consulta é uma prática que cabe em toda e qualquer área do conhecimento, a estrutura aqui sugerida se configura como uma lista de termos relevantes à gestão da Preservação Digital.

 

Termos recorrentes

Os termos abaixo podem auxiliar na elaboração de um glossário. Trata-se de uma lista sistematizada, coletada na documentação de frameworks de política de preservação digital de Repositórios Institucionais das Instituições parceiras das redes colaborativas LOCKSS.

É importante destacar que dentre os termos específicos para gestão da preservação digital existem aqueles que são fundamentais. São terminologias que explicam aspectos e elementos da preservação digital, oriundas de glossário de instituições como CCSDSDPCDCCNDSASAA entre outras. Abaixo estão relacionados alguns termos considerados primordiais, muitos comuns na produção científica brasileira e a seguir uma lista que destaca termos ainda pouco explorados ou simplesmente novos para o vocabulário da preservação digital.

• Administrador de coleta
• Administrador de conteúdo digital
• Amplitude ou profundidade de cobertura
• Ativos digitais
• Cadeia de custódia
• Caracterização de arquivo
• Checksum
• Compreensibilidade (preservação lógica)
• Compressão com perda
• Compressão sem perdas
• Comunidade Designada
• CONTENTdm
• Continuidade digital
• Dark object/archive -
• Ecossistema de Preservação
• Fixity
• Fluxo de trabalho
• Ingerir
• Página Tombstone
• Preservação de conteúdo
• Preservação de objetos
• Preservação em nível de bit
• Preservação lógica
• PRONOM
• Validação de arquivo
• Versionamento
• Vigilância tecnológica

Glossário de apoio

A estrutura de atributos para o glossário de termos é componente essencial à arquitetura para gestão da preservação digital, sendo considerada normativa referencial. Dessa forma, este guia fornecer orientações e sugestões para sua elaboração e respectivas definições, bem como um glossário técnico de apoio.

Acesso (Access) – São os processos de recuperação de objetos digitais de mídias de armazenamento, através do uso de catálogos, repositórios e/ou outras ferramentas. Isto é, a capacidade de localizar informações relevantes por meio de catálogos, índices, auxílios à pesquisa ou outras ferramentas. É definido também como a permissão para localizar e recuperar informações para uso (consulta ou referência), dentro das restrições legalmente estabelecidas de privacidade, confidencialidade e autorização de segurança. O acesso enquanto processos físicos de recuperação de informações de mídias de armazenamento, serviços e funções possibilitam que as informações arquivadas e os serviços relacionados estejam visíveis aos consumidores e usuários autorizados. Incluindo a restrição de acesso em alguns casos devido a direitos autorais, confidencialidade ou exigências estatutárias.

Acesso livre (Open Access) – O acesso aberto refere-se a resultados de investigação online que não apresentam barreiras financeiras, legais ou técnicas de acesso e que são frequentemente fornecidos com menos restrições de utilização.

Adesão (Accession) – Assumir a custódia legal e física de um grupo de materiais e estabelecer o controle físico e intelectual.

Adesão (Accessioning) – O processo de assumir a custódia legal e física de um grupo de materiais e estabelecer o controle físico e intelectual. Bem como de um registro digital ou coleção de registros para fins de preservação e acesso a longo prazo.

Administrador de coleta (Collection steward) – Coletivamente refere-se a selecionadores e arquivistas e outros que têm responsabilidades de desenvolvimento ou gestão de coleções. Um indivíduo responsável pela supervisão de uma coleção ou exposição, normalmente dentro de coleções especiais. Às vezes referido a um curador ou arquivista.

Administrador de conteúdo digital (Digital Content Steward) – Indivíduo designado que supervisiona diferentes atividades de preservação de um objeto ou coleção.

Adquirir (Acquire) – Assumir a custódia física e legal de objetos digitais.

Amplitude ou profundidade de cobertura (Breadth or Depth of Coverage) – A extensão que uma coleção reflete o total de informações publicadas ou disponíveis sobre um assunto específico.

Analógico (Analog) – Variando continuamente em correlação com um processo físico. Um objeto físico e tangível.

Aquisição (Acquisition) – Um grupo de materiais transferidos física e legalmente para um repositório.

Archivematica – É um sistema de preservação digital gratuito e de código aberto projetado para manter acesso de longo prazo baseado em padrões a coleções de objetos digitais.

Arquivo (File) – Um fluxo de bits gerenciado por um sistema de arquivos como uma entidade única e nomeada.

Arquivos Universitários (University Archives) – Os Arquivos Universitários servem como memória institucional da Universidade e desempenham um papel integral na gestão dos recursos de informação da Instituição em todas as mídias e formatos. Para cumprir as responsabilidades desta função, os Arquivos Universitários identificam, adquirem e mantêm registros de valor duradouro que narram o desenvolvimento da Universidade e garantem a continuidade da existência desses registros. Os Arquivos Universitários também documentam o processo de evolução institucional, retendo tanto as evidências – que moldam as decisões – quanto às próprias decisões.

Ativos digitais (Digital assets) – Conjunto de arquivos de computador que contém conteúdo intelectual (imagens, textos, sons, vídeo) e/ou metadados descritivos do conteúdo e seu formato digital. Representam um investimento para o depositante e um recurso de informação para o pesquisador.

AtoM – Software de descrição de arquivos baseado na Web, baseado nos padrões do Conselho Internacional de Arquivos (‘ICA’). ‘AtoM’ é um acrônimo para ‘Acesso à Memória’.

Autenticidade (Authenticity) – Característica mecânica de qualquer objeto digital que reflete seu o grau de confiabilidade, à medida em que os metadados de apoio que acompanham o objeto deixam claro que o objeto possuído é o que pretende ser. Desta forma pode ser considerado como a qualidade do objeto digital de ser genuíno, não falsificado e livre de adulteração, sendo normalmente compreendido a partir de evidências internas e externas, incluindo suas características físicas, estrutura, conteúdo e contexto.

Autoridade (Authority) – O direito ou permissão para agir legalmente em nome de outrem. É também compreendido como o poder de uma pessoa afetar as relações jurídicas de outra por meio de atos praticados de acordo com as manifestações de consentimento da outra, isto é, o poder delegado por um principal a um agente (Ver dicionário de terminológias InterPARES. http://www.interpares.org/ip3/ip3 terminologia db.cfm?letter=a&term=988).

Bit (or bit-level, bit stream) – A unidade fundamental de armazenamento digital de informações, que pode ter um valor binário de 1 ou 0. É a menor unidade de dados que pode ser armazenada em um computador (InterPARES: http://www.interpares.org/ip3/ip3 terminologia db.cfm?term=994)

Byte – Unidade de informação digital e medida de volume de dados, normalmente equivalente a oito bits.

Cadeia de custódia (Chain of custody) – Processo de manutenção e documentação do histórico cronológico de tratamento, incluindo a transferência de propriedade, de qualquer arquivo digital arbitrário desde a sua criação até uma versão final. Em outras palavras, é um sistema de controles que se estende ao longo do ciclo de vida do registro digital para garantir a confiabilidade de sua procedência. Pode ser considerado, da mesma forma, como a sequência de indivíduos ou organizações que criaram, modificaram ou transferiram materiais ao longo do seu ciclo de vida. A cadeia de custódia pode ser registrada tanto no nível de objeto digital individual quanto no nível de coleção (Ver também Informações de Proveniência).

Caracterização de arquivo (File characterisation) – Processo pelo qual as informações sobre o registro digital, como formato e versão, são identificadas e extraídas na forma de metadados.

Checksum – Valor matemático usado em um método simples de detecção de erros para verificar dados. Calculado por algoritmos para um arquivo ou conjunto de arquivos, no intuito de validar o estado e o conteúdo do arquivo com a finalidade de detectar erros acidentais que possam ter sido introduzidos durante sua transmissão ou armazenamento. A integridade dos dados pode ser verificada posteriormente, recalculando o checksum e comparando-a com a já armazenada. Se os checksum corresponderem, é quase certo que os dados não foram alterados (Ver também “Fixity Check”.

Ciclo de vida do conteúdo digital (Digital content life cycle) – Processo contínuo de criação, aquisição, avaliação e seleção, atividades de preservação, armazenamento, acesso, uso e reutilização e transformação.

Código aberto (Open Source) – Uma metodologia de desenvolvimento de software e abordagem de licenciamento que torna o código-fonte do computador disponível gratuitamente, aberto à modificação e redistribuível.

Coleção (Collection) – Grupo de materiais com alguma característica unificadora reunidos por uma pessoa, organização ou repositório a partir de diversas fontes, uma coleção artificial, isto é o acervo de um repositório.

Coleção Digital (Digital Collection) – Conjunto de materiais digitais gerenciados coletivamente e com base na proveniência, função, formato ou assunto. Inclui materiais digitais criados, coletados, administrados e publicados pela instituição que possam exigir hospedagem local e gerenciamento de direitos.

Coleções Digitais Permanentes (Permanent Digital Collections) – As coleções designadas pelas Bibliotecas Emory como apropriadas para preservação a longo prazo.

Compreensibilidade (Understandability) – A capacidade de compreender o conteúdo informativo de um objeto digital. Ver também preservação lógica.

Compressão com perda (Lossy compression) – Um mecanismo para reduzir o tamanho dos arquivos que normalmente descartam dados. Os arquivos são compactados e, portanto, menores, mas perdem dados.

Compressão sem perdas (Lossless compression) – Um mecanismo para reduzir o tamanho dos arquivos que retém todos os dados originais. Os arquivos são mantidos sem perda de dados, resultando em arquivos maiores, mas em uma versão completa do original.

Comunidade Designada (Designated Community) – grupo identificado de potenciais consumidores que devem ser capazes de compreender um determinado conjunto de informações. Esses consumidores podem consistir em diversas comunidades, são designados pelo arquivo e podem mudar com o tempo. O termo comunidade designada está intimamente alinhado com o conceito de Sistema Aberto de Informação Arquivística (OAIS).

Container format – Um formato de arquivo que envolve um ou mais bitstream que juntos compõem um arquivo. Por exemplo, um contêiner AVI pode conter um fluxo de vídeo não compactado, um fluxo de áudio não compactado e legendas.

CONTENTdm – Software da OCLC que lida com o armazenamento, gerenciamento e entrega de coleções digitais para a Web.

Conteúdo digital (Digital content) – Termo amplo que abrange objeto digitais (digital surrogates) criados como resultado da conversão de materiais analógicos em formato digital (digitalização) e nascidos digitais para os quais nunca houve e nunca se pretende que seja um equivalente analógico e registros digitais. De forma objetiva é aquilo que está sendo preservado em formato digital. Às vezes chamados de materiais digitais, recursos digitais, objetos digitais ou coleções digitais.

Conteúdo informativo (Information content) – Os dados e informações valiosos que um objeto digital pode conter e que precisam ser preservados, e não o objeto digital em si.

Continuidade digital (Digital Continuity) – Processo de garantir que os arquivos digitais estejam disponíveis por qualquer motivo e a qualquer momento.

Contrato de envio (Submission agreement) – Documento legal por meio do qual um criador concede a uma instituição o direito de armazenar, converter e copiar eletronicamente objetos digitais para fins de preservação.

Curadoria digital (Digital Curation) – São as funções ou tarefas associadas à organização de uma coleção de objetos digitais, incluindo a seleção, preservação, manutenção, coleção e arquivamento de objetos digitais.

Dark object/archive – Um objeto ou conjunto de objetos que não se destina a ser acessado por usuários finais e está disponível apenas para um grupo seleto de funcionários. Por outro lado, um repositório Institucional precisa ser um arquivo “cinza” (grey) no qual alguns materiais podem ser restringidos no momento da ingestão, com a intenção de torná-los acessível no futuro.

Data object  Uma instanciação tecnológica de um objeto de informação, composto por um ou mais bitstreams e dependente de um ambiente técnico específico para fornecer acesso.

Data sets – Conjuntos de dados, mais comumente correspondendo ao conteúdo de uma única tabela de banco de dados ou de uma única matriz de dados estatísticos, onde cada coluna da tabela representa uma variável específica e cada linha corresponde a um determinado membro do dataset em questão.

Dependência de Hardware (Hardware Dependency) – Uma dependência de hardware é um relacionamento entre uma peça de hardware e outra coisa (por exemplo, outro hardware, software ou um arquivo de documento) na qual a outra coisa requer o hardware para que um ou mais de seus recursos possam interagir.

Dependência de Software (Software Dependency) – Uma dependência de software é um relacionamento entre um software e outra coisa (por exemplo, hardware, outro software ou um arquivo de documento), onde a outra coisa requer o software para que um ou mais de seus recursos possam interagir.

Depósito (Deposit) – Materiais transferidos para um repositório sem transferência de título ou propriedade, é o envio inicial de conteúdo digital antes de qualquer processamento para ingestão na coleção digital.

Descomissionamento (Decommissioning) – O ato de remover um objeto digital totalmente ingerido em um repositório institucional ou de um sistema de preservação digital para o qual o acesso foi concedido a usuários finais.

Digitalização (Digitization) – Processo pelo qual materiais analógicos são convertidos em conteúdo digital analógico nato. Às vezes sinônimo de reformatação. Conversão de material analógico em formato digital (SAA, 2016)

Domínio público (Public Domain) – Domínio público refere-se a objetos digitais, geralmente obras publicadas, cujos direitos exclusivos de propriedade intelectual expiraram, foram perdidos ou são inaplicáveis.

Ecossistema de Preservação (Preservation Ecosystem) – O conjunto de serviços gerenciados centralmente que foram implementados por meio de um processo formal de aprovação, contém coleções digitais permanentes e atendem aos requisitos mínimos para preservação digital de longo prazo.

Emulação (Emulation) – A imitação de um sistema de computador para permitir que programas e mídias projetados para um sistema específico operem em um sistema diferente, geralmente mais novo. Um método para superar a obsolescência tecnológica.

Emulação de hardware (Hardware Emulation) – Emulação de hardware é o processo de imitar o comportamento de uma ou mais peças de hardware com outra peça de hardware, normalmente um sistema de software de emulação para fins especiais.

Fixity – Propriedade de um arquivo digital permanecer inalterado ao longo do tempo. É o processo pelo qual se busca garantir a integridade de um arquivo, verificando se o mesmo não foi alterado ou corrompido. O fixity é comumente monitorado por meio da geração e verificação periódica de valores chamados Checksums. Durante a transferência, um arquivo pode executar uma verificação Fixity para garantir que o arquivo transmitido não foi alterado durante o trajeto. Na maioria das vezes, isso é realizado por meio de ferramentas de Checksums como MD5, SHA1 ou SHA256 para um arquivo, comparando-as com um valor armazenado.

Fluxo de trabalho (Workflow) – As tarefas, etapas processuais, organizações ou pessoas, exigiam informações e ferramentas de entrada e saída necessárias para cada etapa de um processo de negócios. Uma abordagem de fluxo de trabalho para analisar e gerenciar um processo de negócios pode ser combinada com uma abordagem de programação orientada a objetos, que tende a se concentrar em documentos, dados e bancos de dados.

Formato de arquivo (File format) – Forma padrão pela qual as informações são codificadas para armazenamento em um arquivo de computador. Informa ao computador como exibir, imprimir, processar e salvar as informações. É editado pelo programa aplicativo que criou o arquivo e pelo sistema operacional sob o qual ele foi criado e armazenado. Alguns formatos de arquivo são projetados para tipos de dados muito específicos, outros podem atuar como contêineres para diferentes tipos. Um formato de arquivo geralmente é indicado por uma extensão de nome de arquivo contendo três ou quatro letras que identificam o formato.

Formato renderizado (Rendered format) – Formato de arquivo que deve ser transformado ou interpretado de código RAW para um formato mais popular.

Formulário Documentário (Documentary Form) – As regras de representação segundo as quais são comunicados o conteúdo de um documento, o seu contexto administrativo e documental e a sua autoridade. A forma documental possui elementos extrínsecos e intrínsecos. O mesmo que apresentação documental (InterPARES, 2023).

Funcionalidade (Functionality) – O conjunto de funções ou capacidades associadas ao conteúdo digital.

Geo-redundante (Geo-redundant) – Dois ou mais locais em diferentes zonas de ameaça.

Gestor de conteúdos (Content Manager) – Um gestor de conteúdo é definido pelas Bibliotecas IU como a pessoa com poder primário de custódia sobre uma coleção discreta de conteúdo digital.

Informações de Proveniência (Provenance Information) – As informações que documentam o histórico das Informações de Conteúdo. Estas informações informam a origem ou fonte das Informações de Conteúdo, quaisquer alterações que possam ter ocorrido desde que foram originadas e quem teve a custódia delas desde que foram originadas. O Arquivo é responsável por criar e preservar informações de procedência desde o ponto de Ingestão; no entanto, informações anteriores sobre a proveniência deverão ser fornecidas pelo Produtor. As informações de proveniência são adicionadas às evidências para apoiar a autenticidade.

Informações de representação (Representation Information) – Informação de representação é qualquer informação necessária para compreender e renderizar o material digital e os metadados associados. O conjunto de informações necessárias para interpretar um objeto de dados como um objeto de informação significativo ou um componente de um ambiente técnico que suporta a interpretação desse objeto (como uma ferramenta de software ou plataforma de hardware). Informações sobre a estrutura e o significado dos bits que compõem um objeto digital. As informações de representação são necessárias para converter sequências de bits em informações significativas.

Infraestrutura {tecnológica} (Infrastructure) – Hardware de computador, servidores, redes, clientes e software usados para gerenciar conteúdo digital.

Ingesta (Ingest) – Processo pelo qual um repositório de preservação reúne e/ou gera os componentes de um objeto digital que será preservado. É a transferência de registros digitais do criador do registro para um sistema de repositório de Preservação Digital. O mesmo que transferência SIP para o AIP.

Integridade (Integrity) – É a qualidade de ser inteiro e inalterado por perda, adulteração ou corrupção. Os arranjos binários de uns e zeros que compõem um(s) objeto(s) digital(is). Ver também Preservação em nível de bit e Checksum.

Integridade de dados (Data integrity) – Envolve garantir que não ocorreram alterações intencionais e não intencionais nos dados, para que os usuários possam acessar dados completos e não corrompidos.

Interoperabilidade (Interoperability) – A capacidade de um sistema de hardware ou software de computador se comunicar e trabalhar efetivamente com outro sistema na troca de dados, geralmente um sistema de tipo diferente, projetado e produzido por um fornecedor diferente.

ISO (International Organization for Standardization)  Organização Internacional de Padronização.

JHOVE – Ferramenta para identificar, validar e caracterizar formatos de arquivo. É uma API de validação de objeto digital específica de formato escrita em Java. O JHOVE foi um projeto conjunto da JSTOR e da Biblioteca da Universidade de Harvard para desenvolver uma estrutura extensível para validação de formato. O Archivematica usa para verificar os formatos dos itens durante a normalização (https://www.archivematica.org/en/docs/archivematica-1.4/user-manual/preservation/preservation-planning/ e https://sourceforge.net/projects/ jhove/)

 
Longo prazo (Long-term) – Um período de tempo suficientemente longo para que haja preocupação sobre os impactos das mudanças tecnológicas, incluindo o suporte para novos meios de comunicação e formatos de dados, e de uma Comunidade Designada em mudança, sobre a informação mantida num OAIS. Este período se estende por um futuro indefinido.

Manifestação (Manifestation) – Um derivado digital ou cópia de um objeto bitstream original.

Materiais Digitalizados (Digitized Materials) – Materiais digitais convertidos de equivalentes impressos ou analógicos.

Materiais substitutos digitais/digitalizados (Digital surrogate/digitized materials) – Materiais que foram originalmente criados em formato analógico, mas foram reformatados (por exemplo, por digitalização) em formato digital, geralmente para preservação ou acesso (SAA, 2023).

Metadados (Metadata) – Caracterização ou descrição que documenta a identificação, gestão, natureza, uso ou localização de recursos de informação (dados). Podem ser do tipo descritivos, técnicos, administrativos, estrutural ou de preservação. São informações que falam de informação. Os metadados podem referir-se à natureza do recurso ou às alterações feitas nele, bem como à sua localização, estrutura, gestão, preservação e detalhes técnicos (DPC: http://www.dpconline.org/advice/preservationhandbook/glossarytM e InterPARES : http://www.interpares.org/ip2/ip2 terminologia db.cfm)

Metadados de preservação (Preservation Metadata) – Informações que detalham atividades de preservação aplicadas a um objeto digital no repositório, como eventos do sistema, fluxos de trabalho iniciados por humanos ou uma trilha de auditoria de modificações. Informações adicionais sobre a composição e codificação de substitutos digitais são registradas especificamente por meio de metadados técnicos/de caracterização.

Metadados descritivos (Descriptive Metadata) – Descreve o conteúdo para contextos de pesquisa e descoberta, auxiliando a conexão de usuários aos recursos e fornece um contexto importante sobre um recurso depois que ele é descoberto. Esse tipo de metadados permite pesquisar, navegar, classificar e filtrar informações.

Metadados minimamente necessários (Minimum Necessary Metadata) – São o título e algum identificador exclusivo.

Migração (Migration) – Transferência de recursos digitais de uma geração de hardware ou software para outra, preservando as características essenciais dos dados. Um método para superar a obsolescência tecnológica através da transferência de recursos digitais de uma geração de hardware/software para a seguinte. O objetivo da migração é preservar o conteúdo intelectual dos objetos digitais e manter a capacidade dos clientes de recuperá-los, exibi-los e utilizá-los de outra forma diante da tecnologia em constante mudança. A migração difere da atualização da mídia de armazenamento porque nem sempre é possível fazer uma cópia digital exata ou replicar características e aparência originais e ainda manter a compatibilidade do recurso com a nova geração de tecnologia.

Migração de conteúdo (Content Migration) – A migração de conteúdo é o processo de transferência de conteúdo entre tipos de armazenamento, formatos ou sistemas de computador.

Migração de formato (Format migration) – Conversão de dados de mídia e estrutura existentes para hardware e formatos de arquivo atualizados, a fim de evitar a obsolescência (SAA, 2023)

Modelo de ciclo de vida de curadoria (Curation Lifecycle Model) – Uma abordagem que documenta as relações entre todas as fases da informação digital – conceptualização, criação, seleção, aquisição, preservação, armazenamento, acesso e transformação – para permitir a gestão ativa do recurso ao longo do tempo, mantendo assim a acessibilidade e a usabilidade.

Modelo de referência (Reference Model) – Uma estrutura para compreender relacionamentos significativos entre as entidades de algum ambiente e para o desenvolvimento de padrões ou especificações consistentes que dêem suporte a esse ambiente. Um modelo de referência é baseado em um pequeno número de conceitos unificadores e pode ser usado como base para educação e explicação de padrões para um não especialista.

Modelo de referência OAIS (Open Archival Information System) – Modelo de referência para sistemas de arquivo digital. Uma estrutura conceitual para um sistema arquivístico dedicado a preservar e manter o acesso à informação digital a longo prazo. O padrão ISO que expressa formalmente as funções (produtor, gerenciamento, consumidor e arquivos implícitos), funções (serviços comuns, ingestão, armazenamento de arquivo, gerenciamento de dados, administração, planejamento de preservação e acesso) e conteúdo (pacote de informações de submissão, coleta de informações arquivísticas, pacote de informações arquivísticas e pacote de informações de disseminação) de um arquivo foi aprovado como norma ISO em 2003, ISO 14721 e atualizado em 2012.

Nascido analógico (Born-analog) – Informação que foi criada em formato não digital e posteriormente digitalizada.

Nascido digital (Born digital) – São arquivos digitais originalmente criados em formato digital, descritores para informações criadas em ambiente ou formato digital (eletrônico) ao invés de terem sido digitalizados a partir de fontes analógicas (InterPARES: http://www.interpares.org/ip3/ip3 terminologia db.cfm?term=679)

Normalização (Normalization) – A conversão para um formato aceito depende da adesão aos padrões mínimos da indústria?

Objeto de informação (Information Object) – O objeto conceitual da preservação. Um objeto de informação é percebido como informação significativa ao interpretar um objeto de dados por meio de suas informações de representação associadas (Ver também “Conteúdo Digital”).

Objeto digital (Digital object) – Unidade de informação que inclui propriedades (atributos ou características do objeto) e também pode incluir métodos (meios de realizar operações no objeto). Também pode ser chamado de recurso digital. Pode ser dividido em: Objeto digital simples: Muitos arquivos, dentro de um único objeto digital. E objeto digital composto: Múltiplas descrições para muitos arquivos, dentro de um único objeto digital. O termo descreve uma unidade agregada de conteúdo digital composta por um ou mais arquivos digitais relacionados. Esses arquivos relacionados podem incluir metadados, versões derivadas e/ou um wrapper para unir as peças. É uma entidade intelectual individual, composta por metadados, arquivos de conteúdo e também pode conter arquivos suplementares. Nesta entidade um ou mais arquivos de conteúdo e seus metadados correspondentes são unidos, física e/ou logicamente, através do uso de um invólucro digital (digital wrapper).

Objeto digital complexo (Complex Digital Object) – Um objeto digital complexo inclui dois ou mais arquivos de conteúdo (e suas variantes ou derivados de formato) e metadados correspondentes. Os arquivos de conteúdo estão relacionados como partes de um todo e são sequenciados logicamente, como páginas ou lados.

Objeto digital simples (Simple Digital Object) – Um objeto digital simples inclui um arquivo de conteúdo (e suas variantes ou derivados de formato) e os metadados desse arquivo.

Originalidade (Originality) – Uma manifestação inicial de uma coisa da qual podem ser feitas cópias. (SAA, 2023)

Pacote de Informação de Disseminação (DIP) (Dissemination Information Package (DIP)) – Pacote de Informação de Disseminação, aquilo que é convocado de um sistema. É composto por derivados de acesso dos objetos digitais mestres no AIP, bem como metadados associados, que podem então ser transferidos para um sistema de acesso (como AtoM ou CONTENTdm) para uso do usuário final.

Pacote de informações de arquivo (AIP) (Archival Information Package (AIP)) – Pacote de informações de arquivo AIP, que fica armazenado em um sistema até ser convocado. Um pacote composto pelos “normalized preservation masters” e todos os metadados associados recebidos durante a transferência e/ou gerados durante a ingestão. O AIP será armazenado para preservação a longo prazo e usado para obter cópias de acesso ou Pacotes de Informação de Disseminação (DIPs).

Pacote de informações de envio (SIP) (Submission Information Package (SIP)) – Pode ser composto por uma ou mais transferências e inclui todos os metadados extraídos e/ou gerados pelo Archivematica à medida que as transferências são executadas através dos microsserviços. É transferido para um AIP antes de ser convocado como DIP.

Padrões (Standards) – Regras normalmente desenvolvidas, adotadas e promovidas por grandes organizações que podem defender a sua ampla utilização. Os padrões de dados permitem a troca de dados, enquanto os padrões tecnológicos permitem a entrega de dados entre sistemas.

Página Tombstone (página de espaço reservado) (Tombstone page (placeholder page)) – Uma página voltada para o usuário gerada quando o conteúdo é desativado ou excluído. A página não deve explicar por que o conteúdo foi removido, mas deve fornecer informações de contato caso o usuário acredite que acessou a página para exclusão por engano.

Pedido original (Original order) – A organização e sequência de registros estabelecida pelo criador dos registros.

Persistência (Persistence) – A capacidade de endereçar e localizar um objeto digital em uma rede ou em um sistema de arquivo digital durante um longo período de tempo.

Preservação (Preservation) – Processos e operações para garantir a sobrevivência técnica e intelectual, estabilidade física e tecnológica, bem como a segurança dos objetos ao longo do tempo (InterPARES, 2023).

Preservação de conteúdo (Content preservation) – Uma estratégia de preservação que garanta a acessibilidade contínua dos objetos digitais ao longo da sua vida para mitigar o efeito da obsolescência tecnológica. Envolve intervenção ativa e migração de formatos para garantir a acessibilidade e a legibilidade dos registos digitais.

Preservação de objetos (Object preservation) – Termo usado para denotar o mais alto nível de preservação, onde o próprio objeto digital é considerado de alto valor, e não apenas o seu conteúdo. A preservação de objetos costuma ser a mais complexa e pode exigir estratégias especializadas, como a emulação.

Preservação digital (Digital preservation) – Atividades realizadas para garantir o uso contínuo de recursos digitais ao longo do tempo, apesar das mudanças na tecnologia, na mídia de armazenamento e nas mudanças organizacionais (InterPARES: http://www.interpares.org/ip3/ip3 terminologia db.cfm?term=221 e DPC: http://www.dpconline.org/advice/preservationhandbook/eglossarvyvttM)

Preservação em nível de bit (Bit-level preservation) – A preservação em nível de bit é um padrão mínimo para preservação digital que permite futuras ações de preservação. Isto é a manutenção do bitstream original de um objeto digital, em oposição à migração de formato de arquivo. Concentra-se em garantir a integridade das representações de bitstream de objetos digitais. O termo é utilizado no sentido de um nível muito básico de preservação do objeto digital conforme ele foi submetido, preservando literalmente os bits que formam um objeto digital. Uma abordagem básica de preservação que garante a integridade dos objetos digitais e dos metadados associados ao longo do tempo em sua forma original, mesmo à medida que a mídia de armazenamento físico que os abriga evolui e muda.

Preservação lógica (Logical preservation) – O aspecto da gestão da preservação que se preocupa em garantir a usabilidade contínua do conteúdo informativo significativo, garantindo a existência de uma manifestação utilizável no objeto digital.

PRONOM – Registro de formatos de arquivo mantido pelos Arquivos Nacionais do Reino Unido. Os formatos são identificados e desambiguados por meio de identificadores exclusivos PRONOM (PUIDs). Os microsserviços no Archivematica dependem deste registro para identificar formatos de arquivo (https://www.archivematica.org/en/docs/archivematica-1.4/user-manual/preservation/preservation-planning/)

Proveniência (Provenance) – Informações sobre a origem, custódia e propriedade de um item ou coleção.

Redundância (Redundancy) – Às vezes chamada de replicação.

Reformatando (Reformatting) – Copiar conteúdo de informações de um meio de armazenamento para outro meio de armazenamento diferente (reformatação de mídia) ou conversão de um formato de arquivo para um formato de arquivo diferente (reformatação de arquivo).

Refrescante (Refreshing) – Copiar conteúdo de informações de uma mídia de armazenamento para a mesma mídia de armazenamento.

Registro digital (Digital record) – Informações em formato eletrônico que demonstrem evidências de uma ação ou atividade.

Registros de arquivo (Archival records) – Os Registros Arquivísticos não precisam ser retidos na Unidade em que se originam ou são recebidos. Esses registros têm valor histórico ou de pesquisa duradouro e, como resultado disso, devem ser retidos e preservados indefinidamente. Os registros universitários que não estão ativos foram retidos durante o período de retenção da série de registros ou tipo de documento específico e são designados como tendo um método de disposição de “Transferências para Arquivos” ou “Revisão por Arquivos” (Ver também registros universitários).

Registros universitários (University records) – Informações que documentam uma transação ou atividade regularmente conduzida pela Universidade e que são criadas, recebidas ou retidas de acordo com a lei, política da Universidade ou em conexão com uma transação, negócio ou atividade da Universidade. O termo inclui documentos, papéis, cartas, livros, desenhos, mapas, plantas, fotografias, fitas, filmes ou gravações sonoras, microformas, arquivos digitais ou analógicos, informações armazenadas ou mantidas eletronicamente e documentos processados com dados ou imagens (Ver também registros de arquivo).

Relevância Curricular e de Pesquisa (Curricular and Research Relevance) – Relação dos materiais de coleção de uma instituição com as atividades de ensino e pesquisa da instituição.

Renderização (Renderability) – Processo pelo qual se obtém o produto final de um processamento digital qualquer.

Repositório digital confiável (Trustworthy Digital Repository) – Repositório “cuja missão é fornecer acesso confiável e de longo prazo a recursos digitais gerenciados para sua comunidade designada agora e no futuro” (RLG, p. 5). Abrange um sistema no qual todas as partes interessadas podem confiar para acesso e posterior preservação da informação. Um Repositório Digital Confiável inclui estratégias para cumprir essas responsabilidades, juntamente com monitoramento, manutenção e conscientização contínuos dos riscos para o sistema. (RLG-OCLC, 2002). Um repositório digital confiável é aquele cuja missão é fornecer acesso de longo prazo a recursos digitais gerenciados à comunidade designada, agora e no futuro; que aceita a responsabilidade pela manutenção a longo prazo dos recursos digitais em nome dos seus depositantes e em benefício dos utilizadores atuais e futuros; que projete seu(s) sistema(s) de acordo com convenções e padrões comumente aceitos para garantir o gerenciamento, acesso e segurança contínuos dos materiais nele depositados; que estabeleça metodologias para avaliação de sistemas que atendam às expectativas de confiabilidade da comunidade; em que se possa confiar para cumprir as suas responsabilidades a longo prazo para com os depositantes e utilizadores de forma aberta e explícita; e cujas políticas, práticas e desempenho podem ser auditados e medidos.

Seletor (Selector) – Um bibliotecário com responsabilidades de desenvolvimento de coleção em uma área específica. Às vezes referido como contato ou bibliógrafo.

Serviço de Preservação Digital (DPS) (Digital Preservation Service (DPS)) – Uma combinação de pessoas, processos e tecnologias que, juntos, fornecem os meios para preservar objetos digitais.

Sistema de preservação digital (Digital preservation system) – Um sistema, constituído por pessoas e tecnologias, para garantir a usabilidade a longo prazo de objetos e materiais digitais, para além dos limites da falha dos meios de comunicação ou da mudança tecnológica.

Supervisão (Stewardship) – Supervisionar e proteger objetos digitais considerados de valor de longo prazo.

Sustentabilidade (Sustainability) – O processo de mudança, no qual a exploração dos recursos, a direcção dos investimentos, a orientação do desenvolvimento tecnológico e a mudança institucional, estão todos em harmonia e aumentam o potencial actual e futuro para satisfazer as necessidades e aspirações humanas.

Totalmente ingestado (Fully Ingested) – Objetos que tenham concluído seu depósito inicial em Coleções Digitais e qualquer processamento pós-depósito necessário ou garantia de qualidade também tenha sido realizado no objeto digital.

Validação de arquivo (File validation) – O processo pelo qual os registros digitais podem ser verificados para estabelecer se o seu formato está em conformidade com as especificações padrão.

Versionamento (Versioning) – O ato de atualizar ou editar um objeto digital que foi totalmente inserido no Repositório.

Vigilância tecnológica (Technology watch) – O processo pelo qual o panorama tecnológico é monitorado para avaliar o impacto provável que quaisquer alterações possam ter na preservação e acessibilidade dos registros digitais.

Referências para consulta

A seguir estão listados outros 30 modelos de glossário de termos, com seus respectivos localizadores uniformes de recursos (URL) de instituições internacionais para auxiliar neste processo.

Arts and Humanities Data Service – AHDS
https://docplayer.net/12899990-Ahds-digital-preservation-glossary.html 

BMI Imaging Systems
https://bmiimaging.com/resources/records-digitization-glossary/

Bowling Green State University
https://www.bgsu.edu/library/special-collections-and-libraries/policies/digital-preservation-framework/appendix-2–glossary.html

Bryn Mawr College
https://guides.tricolib.brynmawr.edu/c.php?g=285679&p=1902314

Consultative Committee for Space Data Systems – CCSDS
https://public.ccsds.org/Pubs/350x8g1s.pdf

Cornell University
https://www.cs.cornell.edu/wya/DigLib/text/Glossary.html

Digital Curation Centre – DCC
https://www.dcc.ac.uk/about/digital-curation/glossary

Digital Preservation Coalition – DPC
https://www.dpconline.org/handbook/glossary

Digital Preservation Management
https://dpworkshop.org/dpm-eng/terminology/g_resources.html

Energy Efficiency & Renewable Energy
https://www.energy.gov/eere/funding/digital-data-management-glossary

Government of New South Wales
https://staterecords.nsw.gov.au/recordkeeping/glossary-terms-digitisation

Institute for Social Research at the University of Michigan
https://www.icpsr.umich.edu/web/ICPSR/cms/2042

InterPARES
http://www.interpares.org/display_file.cfm?doc=ip1_glossary.pdf

Library of Congress
https://www.loc.gov/programs/digital-collections-management/about-this-program/glossary/

Maine Contemporary Archives
https://ourmainearchives.omeka.net/glossary

National Archives of Ireland
https://www.nationalarchives.ie/our-archives/glossary/

National Archives United Kingdom
https://www.nationalarchives.gov.uk/archives-sector/projects-and-programmes/plugged-in-powered-up/digital-preservation-workflows/glossary/

National Digital Stewardship Alliance – NDSA
https://ndsa.org/glossary/

Northeast Document Conservation Center
https://www.nedcc.org/fundamentals-of-av-preservation-textbook/glossary

Princeton University
https://library.princeton.edu/sites/default/files/PUL-DP-Framework_v5.pdf

Society of American Archivists – SAA
https://dictionary.archivists.org/

University Cambridge
https://web.archive.org/web/20150323054140/http://www.lib.cam.ac.uk/dataman/glossary.html

University of Bristol
https://vocab.bris.ac.uk/data/glossary/

University of California
https://cdlib.org/resources/technologists/glossary-of-digital-library-terms/

University of Minnesota
https://libguides.umn.edu/dp/glossary

University of Oxford
https://researchdata.ox.ac.uk/rdm-glossary

University of the Free State
https://ufs.libguides.com/c.php?g=1113411&p=8118655

University of Virginia
https://dcs.library.virginia.edu/files/2013/02/AIMS_final_appA.pdf

Yale University
https://guides.library.yale.edu/digitalpreservation/glossary

York University
https://www.library.yorku.ca/web/about-us/library-policies/digital-preservation-policy/glossary-of-terms/