Ir direto para menu de acessibilidade.
Portal do Governo Brasileiro
Início do conteúdo da página

Glossário de preservação digital

Publicado: Quarta, 30 de Maio de 2018, 13h33

Abrir dados

Dados disponíveis gratuitamente e utilizáveis sem restrições.

Acessibilidade de longo prazo

Acessibilidade do sistema de preservação digital que permite medir as facilidades de uso que ele proporciona aos usuários a dimensão das tarefas realizadas e o grau de conhecimento que eles têm das funções do sistema depende da sua capacidade de ser interoperável usa de ferramentas de softwares livres possibilitando a alteração de qualquer parte do sistema sem nenhuma consequência nas suas funcionalidades. Como um critério pode ser medido por meio de indicadores de desempenho que proporcionam os dados sobre a eficiência do sistema no atendimento de usuários e suas expectativas de tempo e tipo de resposta.

Acesso (de dados)

A continuidade, a disponibilidade para uso, a usabilidade contínua de um recurso digital, mantendo todas as qualidades de autenticidade, precisão e funcionalidade consideradas essenciais para os fins em que o material digital foi criado e/ou adquirido. Os usuários que têm acesso podem recuperar, manipular, copiar e armazenar cópias em uma ampla gama de discos rígidos e dispositivos externos.

Acesso livre

Disponibilização livre e pública na Internet de forma a permitir a qualquer usuário a leitura download cópia impressão distribuição busca ou link com o conteúdo completo de artigos bem como a indexação ou o uso para qualquer outro propósito legal.

Acesso livre

Fazer com que os manuscritos acadêmicos revisados pelos pares estejam livremente disponíveis na internet, permitindo a qualquer usuário ler, baixar, copiar, distribuir, imprimir, pesquisar ou vincular ao texto completo desses artigos, rastreá-los para indexação, passá-los como dados para o software, ou usá-los para qualquer objetivo legal, sem barreiras financeiras, legais ou técnicas, além daquelas permissões inseparáveis pelo fato de ter acesso à internet. A única restrição à reprodução e distribuição, e o único papel para direitos autorais neste domínio, deve ser conferir aos autores o controle sobre a integridade do trabalho e o direito de ser devidamente reconhecido e citado. Pode também referir-se a teses, livros, capítulos de livros, monografias e outros conteúdos [Iniciativa de acesso aberto de Budapeste].

Ações de preservação (preservation action)

Ações tomadas para garantir a viabilidade a longo prazo e disponibilidade do material digital, atestando autoridade sobre a natureza do dado. Ações de preservação devem garantir que o material permaneça autêntico, confiável e utilizável enquanto sua integridade é mantida; tais ações incluem a validação, a atribuição de metadados de preservação, atribuindo a informação à representação, e garantindo estruturas de dados aceitáveis e formatos de arquivo.

Arqueologia digital

Estudo de práticas culturais, sócioeconômicas e políticas por meio da recuperação, documentação e análise de vestígios deixados por usuários no ambiente digital. Webpages institucionais e redes sociais, por exemplo, podem possuir elementos gráficos e informacionais capazes de serem estudados e considerados como fontes primárias para pesquisas em áreas como as ciências sociais e a história. Não apenas software, mas hardware podem compor o material de análise e investigação da arqueologia digital. Estudos forenses se utilizam de equipamentos para recuperar dados já apagados de dispositivos como HDs (hard disk) e celulares, por exemplo. Compõem os objetos da arqueologia digital os materiais tecnológicos, que se utilizem de tecnologia eletrônica e digital, capazes de estocar dados; aplicativos periféricos; sistemas operacionais; linguagens de programação; ferramentas e sistemas de gestão eletrônica de documentos obsoletos, danificados ou descartados.

Arquivamento

Sequência de operações intelectuais e físicas que visam à guarda ordenada de documentos. Ação pela qual uma autoridade determina a guarda de um documento cessada a sua tramitação.

Arquivo

Uma coleção de dados e/ou registros armazenados com vista à preservação a longo prazo.

Arquivos abertos (open archives)

Arquivos eletrônicos conectados por meio do protocolo Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) permitindo a interoperabilidade entre bibliotecas e repositórios digitais.

Artigo científico

Parte de uma publicação com autoria declarada, que apresenta e discute ideias, métodos, técnicas, processos e resultados nas diversas áreas do conhecimento.

Ativo digital

Segundo Van Niekerk (2006) “um ativo digital é qualquer item de texto ou mídia que tenha sido formatado em uma fonte binária que inclui o direito de utilizá-lo.

Atributo

Característica inerente ou qualidade associada a um elemento já mencionado.

Atualização (refreshment)

Migração de dados digitais que procura substituir uma mídia com uma cópia que seja suficientemente exata para que a infraestrutura de hardware e software continue a funcionar como antes.

Auditoria

Permite que os desenvolvedores dos repositórios analisem e respondam de forma sistemática às carências e acertos na criação dos sistemas.

Autenticação (authentication)

Medida de segurança projetada para estabelecer a validade de uma transmissão, mensagem, origem ou um meio de verificar a autoridade de um indivíduo para fornecer categorias específicas de informações).

Autenticidade

Comprovação de autoria do documento por meio de mecanismos de verificação como o layout tipologia de fontes vocabulários controlados da época e assinatura digital.

Autenticidade

O grau em que uma pessoa (ou sistema) considera um objeto como o que se pretende. A autenticidade é julgada com base em provas.

Auto depósito

Que possibilita ao próprio autor a publicação de seu trabalho científico diretamente na Rede sem necessidade de intermediários.

Avaliação de ciência aberta

Uma avaliação aberta dos resultados da pesquisa, não limitada aos revisores de pares, mas exigindo a contribuição da comunidade.

Base de dados

Arquivo de dados homogêneos de conteúdo e formato, coletados sistematicamente e armazenados num computador.

Base de dados bibliográfica

Versão eletrônica de um catálogo ou índice bibliográfico.

Biblioteca digital

Biblioteca com textos completos em formatos digitais armazenados e disponíveis via Internet; Leiner (1998) a define de modo amplo como “o conjunto de serviços e a coleção de objetos de informação e sua organização, estruturação e apresentação que apoia os usuários no trato com objetos informacionais disponíveis, diretamente ou indiretamente, via meios eletrônicos/digitais”.

Biblioteca virtual

Coleção organizada e estruturada de recursos localizados em diversos locais remotos por meio de um catálogo local on-line ou por um gateway, como a Internet.

Big data

Big Data é o recurso de informação caracterizado por um alto volume, velocidade e variedade para exigir tecnologia específica e métodos analíticos para sua transformação em valor.

Bit (binary bit)

Dígito binário menor unidade de informação armazenada em um computador. Um bit tem um valor único 0 ou 1.

Bitstream

A camada mais elementar para dotar de significado um objeto digital emprega a leitura bit por bit em vez do método convencional de 16 bits por vez.

Bundles

Agrupamento ou pacotes de bitstreams. A possibilidade de um documento incluir vários bundles significa que ele pode pertencer a uma ou mais coleções e uma coleção a uma ou mais comunidades. Essa função dos bundles pode ser compreendida na sequência de duas funcionalidades já disponíveis na versão 1.3 do DSpace.

Byte

Grupo de dígitos binários que são armazenados e operados como se fossem uma unidade.

Catálogo on-line

Catálogo em forma de base de dados com informação em formato legível por máquina.

Certificação

Envolve mais do que a aplicação de critérios resultantes de normas e requisitos básicos. Ela deve prover ferramentas para o planejamento da auto avaliação e formas de auditorias internas e externas. O contexto de ambas é geopolítico mas o processo não varia significativamente.

Ciber infraestrutura

Termo utilizado pela NSF para designar a rede de centros de computação distribuída e repositórios, com investimento em pesquisa para o desenvolvimento de soluções automatizadas para repositórios e para a gestão dos dados científicos. O termo ciber infraestrutura foi transplantado para o contexto científico a partir do relatório “Revolutionizing Science and engineering through cyberinstructure ” lançado pela NSF Blue Ribbon Task Force em 2003. Superestrutura para pesquisa científica que teve de ser estabelecida para que a ciência nos dias de hoje nos dias de hoje possa ser realizada de maneira distribuída. Nos dias de hoje – capaz de grandes empreendimentos com contribuições de pesquisadores e acadêmicos distribuídos pelo mundo – possa ser realizada de maneira distribuída.

Ciclo de vida dos dados

Todas as fases da existência da informação digital desde a criação até a destruição.

Ciência aberta

A ciência aberta capta uma mudança sistêmica na forma como a ciência e a pesquisa foram realizadas nos últimos cinquenta anos: deslocando as práticas padrão de publicação de resultados de pesquisas em publicações científicas para compartilhar e usar todo o conhecimento disponível em uma fase anterior do processo de pesquisa. A ciência aberta é para a ciência o que a web 2.0 era para as transações sociais e econômicas: permitir que os usuários finais fossem produtores de ideias, relações e serviços, possibilitando novos modelos de trabalho, novas relações sociais e levando a um novo modus operandi para a ciência. Ciência aberta é uma mudança tão importante e perturbadora como o comércio eletrônico foi para o varejo. O comércio eletrônico afeta todo o "ciclo comercial" de fazer ciência e pesquisa - da seleção de assuntos de pesquisa a realização de pesquisas e ao seu uso e reutilização -, bem como a todos os atores e ações envolvidos à frente (por exemplo, universidades) ou em linha (por exemplo, editores).

Ciência dos dados

A obtenção de conhecimento de dados como uma disciplina que inclui elementos de programação, matemática, modelagem, engenharia e visualização.

Ciência in silico

Expressão usada no âmbito da simulação computacional e áreas correlatas para indicar algo ocorrido "em ou através de uma simulação computacional". A frase foi cunhada em 1989, como uma analogia com as frases latinas in vivo, in vitro, e in situ, comumente usados na Biologia.

Cientista de dados

Não existe uma definição clara até agora do que é um cientista de dados, mas há um debate animado sobre o tema e, mais importante, um mercado animado de recrutadores que oferecem pagar bons salários, pois percebem ser um papel fundamental para o futuro. O consenso parece ser que uma função de cientista de dados é algo entre um analista de dados, um estatístico e um cientista da computação, mas possuindo conhecimentos suficientes de uma área específica e também possuindo outras qualidades pioneiras de pesquisa científica. Outra perspectiva sobre este papel complexo às vezes é referido como um conjunto de habilidades em formato de "T". Por isso, está implícito que os indivíduos possuem uma ampla gama de habilidades, como curiosidade acadêmica, narrativa, senso do produto, engenharia etc., mas também competências profundas em estatística e aprendizagem por máquinas, por exemplo. Além disso, acreditamos que os diretores executivos de amanhã serão reunidos a partir desses cientistas de dados de hoje. Esses indivíduos terão a visão, experiência e sabedoria para liderar as principais empresas do futuro em um mundo cada vez mais centrado em dados.

Computação em nuvem

Um termo usado para descrever a internet como um computador maciço que pode armazenar grandes quantidades de dados e onde os processadores de hardware individuais do computador cooperam para realizar alguma tarefa computacional. Na verdade, ele é usado para descrever a hospedagem de aplicativos de computador de forma distribuída ao invés de tê-los residentes em um único computador. Esta é uma ideia revolucionária que desafia toda a ideia de um computador ou de um conjunto de computadores agrupados localmente como um meio para aplicações.

Comunidade designada

Um grupo identificado de consumidores potenciais que devem ser capazes de entender um determinado conjunto de informações. Pode ser composta por múltiplas comunidades de usuários. Uma comunidade designada é definida pelo arquivo e esta definição pode mudar ao longo do tempo.

Confiabilidade

Garantir o armazenamento e acesso da informação por longo prazo.

Conformidade de dados

A conformidade com os dados consiste nos processos em curso para garantir a adesão dos dados às regras empresariais (departamento de governo, universidade, indústria ou agência) e aos requisitos legais, regulamentares e de credenciamento. A conformidade de dados inclui cinco áreas: controle, auditoria, conformidade legal, conformidade regulamentar e conformidade de reconhecimento.

Conjunto de dados

Uma coleção definida de dados com elementos comuns.

Cópia de segurança (backup)

Cópia de dados de um dispositivo de armazenamento a outro para que possam ser restaurados em caso da perda dos dados originais.

Critérios de preservação digital

Conjunto de atividades que determinam a manutenção de coleções digitais a maioria das propostas de critérios que vem surgindo menciona a influência do modelo de referência OAIS/SAAI elas definem as funções dos repositórios os processos e procedimentos a comunidade alvo a usabilidade da informação e as tecnologias e a infraestrutura técnica. Usados em procedimentos de auditoria e modelos de certificação.

Curadoria de arte

A curadoria de arte compõe, idealiza, desenvolve e/ou expõe um conceito de uma expressão artística. O curador de arte reflete suas inclinações particulares em objetos de arte, construindo uma narrativa artística que eleva os elementos representativos de um artista ou uma coleção dentro de um conjunto de itens em particular com o intuito de informar ou para pura contemplação do público.

Curadoria de conteúdo

Atividade de busca, organização e compartilhamento do conteúdo relevante de um assunto específico online de modo contínuo. Utiliza de mídias e redes sociais para compartilhar conteúdo para consumo imediato. Assuntos relacionados: Ciberjonalismo.

Curadoria de dados

A curadoria de dados trata das atividades de gestão requeridas para manter dados de pesquisa a longo prazo de modo que esteja disponível para o reuso e para a preservação. Ver: e-Science

Curadoria de dados

A curadoria é o ato de gerenciar itens digitais mantidos em um arquivo a longo prazo. É um processo ativo, que implica ação por parte dos curadores para que os itens permaneçam seguros, detectáveis e acessíveis. "A curadoria digital envolve manter, preservar e adicionar valor" aos itens arquivados "ao longo de seu ciclo de vida. A gestão ativa dos dados de pesquisa [digital] reduz as ameaças ao seu valor de pesquisa de longo prazo e mitiga o risco de obsolescência digital”. A curadoria inclui: seleção, avaliação, preservação, disposição e transformação, por exemplo, migração para um formato atualizado.

Curadoria digital

A curadoria é o trabalho de intervenção para preservação em todas as etapas do tratamento da informação em meio digital. Trata-se de termo polissémico para indicar: o planejamento de ações para gestão da informação, ações para preservação e acesso para uso futuro que extrapola os dados científicos, ainda que a termo tenha florescido da preocupação pela manutenção da herança científica para as gerações futuras. Surgido da necessidade de permanência da informação científica em meio digital, evoluiu da curadoria de museus e do mundo da arte, da curadoria de dados e da preservação digital – esta desenvolvida para que a informação digital estivesse disponível na rede mundial de computadores – para a curadoria digital e de conteúdos, estas atreladas a criação, disseminação e acesso da informação em rede. Termo guarda-chuva que está em franco desenvolvimento, que abarca definições correlatas voltadas à seleção, enriquecimento, tratamento e preservação da informação para o acesso e uso futuro, seja ela de natureza científica, administrativa ou pessoal. Termo hiperomínico que designa as atividades e estratégias que compreendem a administração de uma parte específica de coleções da biblioteca – os ativos digitais.

Curadoria digital

A curadoria digital é a seleção, preservação, manutenção, coleta e arquivamento de ativos digitais. A curadoria digital estabelece, mantém e agrega valor aos repositórios de dados digitais para uso atual e futuro. Isso geralmente é realizado por arquitetos, bibliotecários, cientistas, historiadores e estudiosos. As empresas estão começando a usar a curadoria digital para melhorar a qualidade da informação e dos dados em seus processos operacionais e estratégicos. A curadoria digital bem sucedida mitiga a obsolescência digital, mantendo a informação acessível aos usuários indefinidamente.

Dados  

Fatos, medições, gravações, registros ou observações sobre o mundo coletado por cientistas e outros, com um mínimo de interpretação contextual. Dados podem estar em qualquer formato ou meio, sob a forma de escritos, notas, números, símbolos, textos, imagens, filmes, vídeo, gravações de som, reproduções pictóricas, desenhos, desenhos ou outras representações gráficas, manuais processuais, formulários, diagramas, trabalhos fluxogramas, descrições de equipamentos, dados de arquivos, dados algoritmos de processamento, ou registros estatísticos.

Dados abertos (open data)

Por dados abertos em ciência queremos dizer que eles estão disponíveis gratuitamente na internet, permitindo a qualquer usuário baixar, copiar, analisar, reprocessar, captura-los via softwares ou utilizá-los para qualquer outra finalidade, sem outras barreiras financeiras, legais ou técnicas adicionais além daquelas inseparáveis da própria internet. Para este fim os dados relacionados com a ciência publicada deve ser explicitamente colocado no domínio público. Fonte: Extrato de Panton Principles: Principles for Open Data in Science. Disponível em: Acesso em: 10 jul. 2014

Dados científicos (research data)

Dados que são produzidos no contexto de investigação científica ou que de alguma forma são usados em investigação. Estes dados podem ser criados para efeito de processamento científico, como nos dados atmosféricos usados para previsão meteorológica, ou os dados recolhidos de sensores para monitorar o estado de um edifício. Há dados que são obtidos como resultados do processamento automático de objetos (eles próprios representados como dados), como, por exemplo, os histogramas de cor obtidos através do processamento de uma coleção de imagens. Há ainda dados que não sendo produzidos para investigações acabam por ser objeto dela, como as contribuições que os utilizadores de uma rede social fazem, na forma de textos ou outros conteúdos, e que acabam por ser utilizados para estudos sociológicos. Fonte: RECCAP

Dados de pesquisa

Os dados são fatos, observações ou experiências em que um argumento ou uma teoria é construído ou testado. Os dados podem ser numéricos, descritivos, auditivos ou visuais. Os dados podem ser crus, abstraídos ou analisados, experimentais ou observacionais. Os dados incluem, mas não estão limitados a: cadernos de laboratório, cadernos de campo, dados de pesquisa primária (incluindo dados de pesquisa em formato impresso ou em forma legível por computador), questionários, fitas de áudio, fitas de vídeo, modelos, fotografias, filmes, respostas de teste. Coleções de pesquisa podem incluir slides, artefatos, espécimes, amostras.

Dados dinâmicos

No contexto da programação, ou se a conversa assumir de forma segura qual é a escala de tempo dos dados: dados dinâmicos ou dados transacionais denotam informações que são alteradas de forma assíncrona à medida que as futuras atualizações se tornam disponíveis. O oposto disto são dados persistentes, que são dados acessados com pouca frequência e que não são suscetíveis de serem modificados. Os dados dinâmicos também são diferentes dos dados de transmissão, na medida em que não há fluxo constante de informações. Em vez disso, as atualizações podem vir a qualquer momento, com períodos de inatividade no meio.

Dados estruturados

Dados estruturados, em distinção com dados não estruturados, são dados que estão em conformidade com um esquema definido e fixo. Exemplos: bancos de dados relacionais, planilhas e triplos RDF.

Dados não estruturados

Dados que não podem ser armazenados em um banco de dados relacional e podem ser mais desafiantes para analisar documentos e tweets para fotos e vídeos.

Dados persistentes

Dados persistentes denotam informações que são acessadas com pouca frequência e não são suscetíveis de serem modificadas.

Dados vinculados

Os dados vinculados, também chamados Linked Open Data, são dados nos quais as relações/conexões entre os dados devem estar disponíveis. Isso permite um fácil acesso aos dados. Explicação: esta coleção conexa de conjuntos de dados inter-relacionados é armazenada na web e disponível através de um formato comum - RDF.

Data grid

É um conjunto de serviços estruturados que fornece vários serviços, como a capacidade de acessar, alterar e transferir grandes quantidades de dados geograficamente separados, especialmente para fins de pesquisa e de colaboração. Dados de diferentes regiões são puxados a partir de domínios administrativos que filtram dados para fins de segurança e os apresentam para o usuário, mediante pedido por meio de um aplicativo de middleware. Ver: Ciber infraestrutura.

Data steward

Um funcionário de uma universidade ou instituto de pesquisa responsável pelo ciclo de vida de um conjunto de dados de pesquisa, geralmente o investigador principal (PI) do projeto.

Depósito de dados

O processo de depositar dados em um repositório ou em outra instalação de armazenamento.

Digitalização

Transformação de informação analógica para formato digital por meio de dispositivo adequado e seguindo requisito de qualidade no seu processo de produtividade.

Dilúvio de dados

O dilúvio de dados refere-se à situação em que o enorme volume de novos dados gerados dificulta a capacidade das instituições para gerenciá-los e dos pesquisadores para usá-los.

Direitos de propriedade intelectual (ipr)

Os direitos conferidos aos proprietários de propriedade intelectual – IPR, são protegidos automaticamente (por exemplo, direitos autorais, direitos de design) seja registrando-o ou aplicando-o (por exemplo, marcas registradas, patentes). Proteger sua propriedade intelectual facilita a ação legal contra quem a rouba ou copia. O IPR pode ser legalmente vendido, atribuído ou licenciado pelo criador para outras partes, ou ainda, ser de propriedade conjunta.

Documento

Unidade de registro de informações qualquer que seja o suporte ou formato.

Documento digital

Documento codificado em linguagem binária digital ou convertido para formato digital legível por máquinas independente do suporte físico e de sua mensagem original sendo que a digitalização pode chegar a produzir mudanças no se registro.

Documento eletrônico

Um registro que foi criado (elaborado ou recebido) de forma eletrônica.

DOI® (Digital Object Identifier)

Sistema de identificador de objetos digitais on-line para gerenciar a propriedade intelectual e o uso comercial dos objetos materiais digitais.

Dublin core

Esquema de descrição de metadados para descoberta de recursos on-line.

Emulação

Criação de um novo software que imita o funcionamento do antigo hardware e/ou software com o objetivo de reproduzir seu comportamento.

Emulação (preservação digital)

A emulação é a replicação da funcionalidade de um sistema obsoleto. De acordo com Van Der Hoeven, “a emulação não se concentra no objeto digital, mas no ambiente rígido e de software em que o objeto é processado. Ele pretende (re)criar o ambiente no qual o objeto digital foi criado originalmente”. Os exemplos são a capacidade de replicar ou imitar outro sistema operacional. Exemplos incluem emular um Atari 2600 em um sistema Windows ou emular o WordPerfect 1.0 em um Macintosh. Os emuladores podem ser criados para aplicações, sistemas operacionais ou plataformas de hardware.

Encapsulamento

Preservação da informação necessária para o desenvolvimento de conversores emuladores e visualizadores de objetos digitais.

E-science

A e-Science trata da pesquisa ciência realizada em ambientes distribuídos que utiliza imenso volume de dados habilitados pela Internet. Ela faz a distribuição de tarefas por meio de várias organizações; tem uma sobrecarga em termos de complexidade da gestão e exige implementação de infraestrutura global de redes de conexão e financiamento massivo e coletivo. A terminologia ainda está em consolidação, existindo outros termos para indicar a e-Science, a saber: ciber infraestrutura, dados científicos, ciência digital, ciência fortemente baseada em dados, ciência eletrônica, quarto paradigma, ciência orientada por dados, etc.

Espelhamento ou redundância (mirroring or redundancy)

Manter uma cópia exata de um arquivo em diversos lugares muito usado na cópia de segurança de grandes bases de dados.

Estratégia de preservação digital

Tipo de abordagem que permite o acesso contínuo à informação em formato digital. Esquemas técnicos e conceituais que permitem identificar as partes integrantes do processo de preservação digital assim como sua padronização em modelos de referência.

Estratégia de preservação digital           

Uma estratégia de preservação digital é uma abordagem bem avaliada e documentada para a preservação de objetos digitais. Para a coleta de arquivistas, a finalidade de tal estratégia é assegurar que o acesso aos arquivos nano digitais acessados por um repositório possa ser mantido indefinidamente. Para os repositórios responsáveis por arquivos digitais pessoais, isso provavelmente incluirá material criado em computadores e dispositivos longos, recentes, atuais e futuros. Fonte: Projeto Paradigma: www.paradigm.ac.uk/workbook/pdfs/08_digital_preservation.pdf

Ferramentas de ciência aberta

Refere-se às ferramentas que podem ajudar no processo de entrega e construção de ciência aberta.

Financiador

Um instituto, corporação ou órgão que presta assistência financeira para pesquisa.

Formato

Estrutura do arquivo que define o modo como é armazenado ou apresentado na tela ou impressão organização sequencial de dados em termos de seus componentes também chamado de extensão. Formatos abertos de arquivo são aqueles em que os usuários têm acesso aos detalhes técnicos e ao significado de sua estrutura de bits.

Gerenciamento de dados de pesquisa

Refere-se ao armazenamento, acesso e preservação de dados produzidos a partir de uma determinada investigação. As práticas de gerenciamento de dados cobrem todo o ciclo de vida dos dados, desde o planejamento da investigação até a realização, bem como de fazer backup de dados, uma vez que eles são criados e utilizados para a preservação de dados a longo prazo entregues após a conclusão da investigação. Atividades específicas e questões que se enquadram na categoria de gerenciamento de dados incluem: Nomeação de arquivos: a maneira correta de nomear arquivos de computador; Controle de qualidade de dados e garantia de qualidade; Acesso a dados; Documentação de dados (incluindo níveis de incerteza); Criação de metadados e vocabulários controlados ; Armazenamento de dados; Dados arquivamento e preservação; Dados partilha e utilização; Integridade de dados; Segurança de dados; Privacidade de dados; Direitos de dados

Gerenciamento de direitos digitais (digital rights management)

O uso de tecnologias para controlar como o conteúdo digital é utilizado e reutilizado.

Gestão de dados (data management)

Na gestão de dados científicos incluem-se as ações de representação dos dados e seu armazenamento, a associação de metadados que os descrevem, que ajudam a interpretá-los e documentam o seu uso, a organização dos dados em coleções, a indexação dos dados para pesquisa e todas as formas de apresentação dos dados. A gestão de dados pode ser realizada por pessoas que não têm conhecimento direto do seu significado, desde que os dados tenham sido descritos de forma completa pelos seus produtores. Fonte: RECCAP

Governança de dados

A gestão geral da disponibilidade, usabilidade, integridade e segurança dos dados. Um programa sólido de governança de dados inclui um órgão ou conselho de administração, um conjunto definido de procedimentos e um plano para executar esses procedimentos.

Handle system®

Um exemplo de identificador persistente desenvolvido pela Corporation for National Research Initiatives.

Harvesting

Busca automática de endereços web com o resgate das referências para outros documentos links e informações relevantes.

Identificador

Um caractere ou conjunto de caracteres designados para identificar inequivocamente um documento. Alguns exemplos de identificadores são o URN (Uniform Resource Name) o DOI® o ISBN (International Standard Book Number) e o SICI (Serial Item and Contribution Identifier).

Identificador do objeto digital

Um identificador de objeto digital (DOI) é um tipo de persistente usado para identificar objetos de forma exclusiva. O sistema DOI é particularmente utilizado para documentos eletrônicos, como artigos de revistas. O sistema DOI começou em 2000 e é administrado pela International DOI Foundation. DOI significa "identificador de um objeto digital" em vez de "identificador digital de um objeto”. Metadados sobre o objeto são armazenados em associação com o nome DOI. Pode incluir uma localização, como uma URL, onde o objeto pode ser encontrado. O DOI para um documento permanece fixo ao longo da vida útil do documento, enquanto a sua localização e outros metadados podem mudar. Referir-se a um documento on-line por seu DOI fornece uma ligação mais estável do que simplesmente se referir a ele por sua URL, porque se o URL for alterado, o editor só precisa atualizar os metadados do DOI para se conectar ao novo URL.

Identificador persistente

Um único identificador permanentemente associado a um objeto digital quando gerenciado sempre proverá acesso permanente a um objeto independentemente de qualquer mudança de local.

Identificador persistente

Um identificador persistente é uma referência duradoura para um recurso digital. Normalmente, ele possui dois componentes: um identificador exclusivo; e um serviço que localiza o recurso ao longo do tempo, mesmo quando a localização é alterada. O primeiro ajuda a garantir a proveniência de um recurso digital (o que ele pretende ser), enquanto o segundo irá garantir que o identificador resolva a localização atual correta. Os identificadores persistentes visam, assim, resolver o problema da persistência do acesso ao recurso citado, particularmente na literatura acadêmica. Muitas vezes, os endereços da web (links) não conseguem levá-lo ao recurso referenciado que você espera. Isso pode ocorrer por razões tecnológicas, como a falha do servidor, mas as falhas criadas pelo homem são mais comuns. As organizações transferem revistas para novos editores, reorganizam seus sites ou perdem o interesse em conteúdo antigo, levando a links quebrados quando você tenta acessar um recurso. Isso é frustrante para os usuários, mas as consequências podem ser graves se o recurso vinculado for essencial para razões legais, médicas ou científicas. Os identificadores persistentes também podem ser usados "back-the-scenes" dentro de um repositório para gerenciar alguns dos desafios na catalogação e descrição, ou fornecendo controle intelectual e acesso a materiais digitais nascidos. Exemplos de esquemas de identificadores persistentes incluem: Identificador de Objeto Digital (DOI), Handle, Chave de Recurso de Arquivamento (ARK), Localizador de Recursos Uniformes Persistentes (PURL) e Nome de Recurso Universal (URN).

Informação

Usada em geral para englobar ideias, fatos e obras de ficção. No âmbito da Ciência da Informação tais fatos ideias são registrados sobre qualquer tipo de suporte para poderem ser manipulados. Assim, não há informação sem documento nem documento sem informação.

Informação digital

Dados organizados e com significados codificados em dígitos binários bits produzidos e armazenados em computador.

Informação do conteúdo           

(No modelo OAIS) um conjunto de informações que é o alvo original de preservação ou que inclui parte ou toda essa informação.

Informação sobre direito de acesso

A informação que identifica as restrições de acesso pertencentes à informação de conteúdo, incluindo o quadro legal, termos de licenciamento e controle de acesso. Contém as condições de acesso e distribuição estabelecidas no Contrato de Envio, relacionadas tanto à preservação (pelo OAIS) quanto ao uso final (pelo consumidor). Inclui também as especificações para a aplicação de medidas de execução de direitos.

Infraestrutura de dados de pesquisa

A configuração de pessoal, serviços e ferramentas reunidos para apoiar o gerenciamento de dados durante o ciclo de vida da pesquisa e, mais especificamente, para fornecer cobertura abrangente das etapas que compõem o ciclo de vida dos dados. Pode ser organizado localmente e/ou globalmente para apoiar atividades de dados de pesquisa ao longo do ciclo de vida da pesquisa.

Ingestão de dados

A transferência de dados para um repositório.

Integridade (integrity)

Condição dada quando os dados não são alterados a partir de sua origem e não foi acidentalmente ou maliciosamente modificado, alterado ou destruído.

Integridade de dados

A integridade, precisão e ausência de erro de um pacote de dados.

International standard bibliographic description (isbd)

Formato padrão aceito internacionalmente para representar informação bibliográfica.

International standard book number (isbn)

Número padrão aceito internacionalmente que identifica um livro de forma única. No Brasil, a Biblioteca Nacional é o órgão que atribui o ISBN.

International standard serial number (issn)

Número padrão aceito internacionalmente que identifica uma publicação seriada de forma única. No Brasil, o IBICT é o órgão que atribui o ISSN.

Interoperabilidade

Interação de documentos digitais entre diferentes sistemas tecnológicos configuração de todos os arquivos padronizando-os de forma global.

Interoperabilidade

A capacidade de diversos sistemas, conteúdos e organizações trabalharem em conjunto.

Learn (aprender)

Líderes que ativam as redes de pesquisa: implementam o Roteiro e o Toolkit dos Dados de Pesquisa LERU: http://learn-rdm.eu/

Library of congress subject headings (lcsh)

Lista de cabeçalhos de assunto padronizados, criados pela Biblioteca do Congresso dos Estados Unidos.

Longo prazo

Um período de tempo longo o suficiente para que haja preocupação com os impactos da mudança de tecnologias, incluindo suporte para novos formatos de mídia e dados, e de uma Comunidade Designada em mudança, sobre a informação que está sendo realizada em um OAIS. Este período se prolonga em um futuro indefinido.

Metadados

Informações estruturadas e codificadas que descrevem e permitem gerenciar compreender preservar e acessar os documentos digitais ao longo do tempo; os metadados são dados cujo propósito é garantir a autenticidade, descrever, tornar acessíveis, ou de alguma forma qualificar e aumentar a inteligibilidade dos dados de base. Quando o significado dos dados está acessível ao utilizador menos especializado, como é o caso dos registos de publicações, existem normas bem estabelecidas para os metadados, neste exemplo as diversas normas bibliográficas. Na maioria das áreas que produzem dados científicos, não estão fixadas normas para metadados, o que torna a tarefa de descrição um desafio substancial. Fonte: RECCAP

Metadados administrativos

Tipo de metadados que permite o gerenciamento de uma coleção digital.

Metadados de preservação

Atributos especiais de dados ou documentos geralmente descritivos são aqueles relacionados com o conteúdo do documento seu contexto e estrutura no momento da sua criação assim como das mudanças acontecidas em todo seu ciclo de vida.

Migração

Conjunto de atividades para copiar converter ou transferir a informação digital de uma tecnologia antiga ou obsoleta para uma tecnologia nova transferência periódica de dados de uma geração tecnológica para outra.

Migração (preservação digital)

A migração é a transferência de dados para ambientes de sistema mais recentes. Pode incluir a conversão de recursos de um formato de arquivo para outro (por exemplo, conversão de Microsoft Word para PDF ou OpenDocument) ou de um sistema operacional para outro (por exemplo, Windows para GNU/Linux) para que o recurso permaneça totalmente acessível e funcional. Dois problemas importantes confrontam a migração como um método plausível de preservação digital a longo prazo: devido ao fato de os objetos digitais estarem sujeitos a um estado de mudança quase contínua, a migração pode causar problemas em relação à autenticidade; e a migração provou ser demorada e cara para “grandes coleções de objetos heterogêneos, que precisariam de monitoramento constante e intervenção”.

Mineração de dados

O processo de análise de conjuntos de dados multivariados usando reconhecimento de padrões ou outras técnicas de descoberta de conhecimento para identificar conteúdos, relacionamentos, classificações ou tendências de dados potencialmente desconhecidos e potencialmente significativos. Os parâmetros de mineração de dados incluem: associação (procurando padrões onde um evento está conectado a outro evento); sequência ou análise de caminho (procurando padrões onde um evento leva a outro evento posterior); classificação (procurando novos padrões); clustering (encontrando e documentando visualmente grupos de fatos não conhecidos anteriormente); previsões ou análises preditivas (descobrindo padrões em dados que podem levar a previsões razoáveis sobre o futuro).

Modelo de referência

Estrutura para o entendimento de relações significativas entre entidades de um ambiente e para o desenvolvimento de padrões consistente ou especificações que lhe dão suporte. Um modelo de referência está baseado em um número pequeno de conceitos unificados.

Modelo de referência do sistema de informação de arquivo aberto (oais)

O termo OAIS também se refere, por extensão, ao modelo de referência ISO OAIS para um OAIS. Este modelo de referência é definido pela recomendação CCSDS 650.0-B-1 do Comitê Consultivo de Sistemas de Dados Espaciais, este texto é idêntico ao ISO 14721:2003, que é substituído pela ISO 14721:2012. A competência do CCSDS são agências espaciais, mas o modelo OAIS desenvolvido revelou-se útil para uma grande variedade de outras organizações e instituições com necessidades de arquivamento digital. A informação mantida tem sido considerada como “preservação a longo prazo”, mesmo que o próprio OAIS não seja permanente. ”Longo prazo“ é suficientemente longo para se preocupar com os impactos da mudança de tecnologias, incluindo suporte para novos formatos de mídia e dados, ou com uma comunidade de usuários em mudança. ”Longo prazo” pode prolongar-se indefinidamente. Neste modelo de referência, há um foco particular na informação digital, tanto como as principais formas de informação contidas quanto informações de suporte para materiais arquivados digital e fisicamente. Portanto, o modelo acomoda informações inerentemente não digitais (por exemplo, uma amostra física), mas a modelagem e preservação de tais informações não são abordadas em detalhes. Como um quadro estritamente conceitual, o modelo OAIS não requer o uso de qualquer plataforma de computação específica, ambiente de sistema, paradigma de design de sistema, metodologia de desenvolvimento de sistema, sistema de gerenciamento de banco de dados, paradigma de design de banco de dados, linguagem de definição de dados, linguagem de comando, interface de sistema, usuário interface, tecnologia ou mídia para um arquivo para ser compatível. Seu objetivo é estabelecer o padrão para as atividades que estão envolvidas na preservação de um arquivo digital, em vez do método para a realização dessas atividades.

Nanodigital

Materiais digitais que não se destinam a ter um equivalente analógico, quer como origem ou como resultado da conversão em forma analógica. Este termo é usado para diferenciá-lo de: 1) materiais digitais que foram criados como resultado da conversão de originais analógicos; e 2) materiais digitais, que podem ter origem de uma fonte digital, mas foram impressos em papel, por exemplo, alguns registros eletrônicos.

Negócios abertos

Uma abordagem para a empresa que desenha ideias de movimentos de abertura como software livre, código aberto, conteúdo aberto e ferramentas e padrões abertos. A abordagem coloca valor na transparência, na inclusão das partes interessadas e na prestação de contas. As estruturas comerciais abertas tornam os contribuidores e os não contribuintes visíveis para que os benefícios empresariais sejam distribuídos em conformidade. Eles procuram aumentar o engajamento pessoal e os resultados positivos, contribuindo gratificante de forma aberta.

Nuvem de ciência aberta

Ambientes virtuais com uso livre, serviços abertos e sem interrupções para armazenamento, gerenciamento, análise e reutilização dos dados que estão ligados às suas atividades de pesquisa, além das fronteiras e disciplinas científicas.

Objeto digital

Tipos de arquivos encontrados em meio digital compostos de conjuntos de sequências de bits sobre conteúdos informacionais. Metadados e identificadores.

Objeto digital

Um objeto digital é composto de sequência estruturada de bits/bytes. Como um objeto, ele é nomeado. A sequência de bits que realiza o objeto pode ser identificada e acessada por um identificador único e persistente ou pelo uso de atributos de referência descrevendo suas propriedades.

Online public access catalog (opac)

Sistema automatizado que dá acesso público a catálogos de biblioteca via Internet.

Open access journal     

Um periódico que compreende exclusivamente artigos de acesso aberto.

Open acess publisher

Um editor que publica todos os artigos de pesquisa como artigos de acesso aberto. A maioria dos editores legados tem opções para fazer periódicos, pelo menos parcialmente, de acesso aberto.

Open archival information system (oais)

Esquema conceitual que disciplina e orienta um sistema para a preservação e manutenção de acesso à informação digital por longo prazo contém o termo archival para distingüi-lo de outros usos do termo “arquivo”. Arquivo no OAIS consiste em uma organização de pessoas e sistemas que aceitam a responsabilidade de preservar informação e torna-la disponível.

Pacote de arquivamento de informação (pai)

Informação de conteúdo e sua descrição de preservação necessária para preservá-la dentro de um pacote de informação por longo prazo.

Pacote de disseminação de informação (pdi)

Pacote de informação que contém partes de um PAI que são distribuídas a um Cliente/Usuário quando solicitado.

Pacote de submissão de informação (psi)

Pacote de informação identificado pelo produtor no acordo de submissão na estrutura conceitual do OAIS.

Periódico científico

Publicação seriada com finalidade acadêmica ou profissional, relatando resultado de pesquisas à comunidade de seus pares. Os artigos em geral possuem resumos, notas de rodapé e referências bibliográficas.

Pesquisa reproduzível

“A cura digital envolve manter, preservar e agregar valor aos dados de pesquisa digital ao longo de seu ciclo de vida. A gestão ativa dos dados da pesquisa reduz as ameaças ao seu valor de pesquisa de longo prazo e mitiga o risco de obsolescência digital. Enquanto isso, os dados curados em repositórios digitais confiáveis podem ser compartilhados entre a comunidade de pesquisa mais ampla do Reino Unido. Além de reduzir a duplicação de esforços na criação de dados de pesquisa, a cura aumenta o valor de longo prazo dos dados existentes, tornando-o disponível para novas pesquisas de alta qualidade".

Planejamento de preservação

Um processo contínuo que planeja a preservação de material digital ao longo de seu ciclo de vida. As ações de preservação devem ser planejadas - e depois realizadas - para assegurar que a natureza autorizada do material digital seja protegida a longo prazo. Tais ações incluem validação, atribuição de metadados de preservação, atribuição de informações de representação e garantia de estruturas de dados aceitáveis ou formatos de arquivos. Juntas, essas ações de preservação garantem que seus objetos digitais permaneçam autênticos, confiáveis e utilizáveis, mantendo a integridade em todos os momentos.

Plano de gerenciamento de dados

Um plano de gerenciamento de dados ou DMP é um documento formal que descreve como você irá lidar com seus dados durante sua pesquisa e após o projeto ser concluído. O objetivo de um plano de gerenciamento de dados é considerar os muitos aspectos do gerenciamento de dados, geração de metadados, preservação de dados e análise antes do início do projeto, garantindo que os dados sejam bem gerenciados no presente e preparados para preservação no futuro.

Plataforma digital de investigação (e-research)

Uma plataforma digital de suporte à investigação fornece tecnologias para suportar o processo de investigação, incluindo a colaboração entre grupos, a recolha de dados, a sua análise, a publicação de resultados, o armazenamento e a partilha dos dados. As tecnologias disponíveis neste domínio incluem os ambientes de investigação virtuais, a computação grid, os serviços de visualização, a mineração de dados. Fonte: RECCAP

Política de gerenciamento de dados de pesquisa

Um documento escrito apoiado pela administração que descreve a política e fornece orientações para garantir que sejam utilizados padrões adequados, diretrizes consistentes e estratégias comuns, fornecendo vínculos e consistência com outros sistemas similares e promovendo uma rede verdadeira em uma organização que produz dados.

Políticas de ciência aberta

Diretrizes de melhores práticas para a aplicação da ciência aberta para alcançar seus objetivos fundamentais.

Preservação digital       

O conjunto de processos, atividades e gerenciamento de informações digitais ao longo do tempo para garantir a sua acessibilidade a longo prazo. Devido ao ciclo de vida relativamente curto da informação digital, a preservação é um processo contínuo.

Preservação digital de longo prazo

O ato de manter informação de forma correta e independente por longo prazo. Informação armazenada independentemente que possui documentação suficiente para permitir que seja interpretada e usada por uma comunidade sem necessidade de recursos especiais obsoletos. Requer procedimentos específicos e técnicas apropriadas para cada tipo de formato e mídia. Com ela pretende-se garantir a inalterabilidade dos registros digitais. É o conjunto de atividades ou processos responsáveis por garantir o acesso contínuo a longo prazo à informação existente em formatos digitais. A preservação digital consiste na capacidade de garantir que a informação digital de valor contínuo permaneça acessível e com qualidades de autenticidade suficientes para que possa ser interpretada no futuro ao se recorrer a uma plataforma tecnológica diferente da utilizada no momento da sua criação. Sinônimo: gerenciamento do ciclo de vida de dados digitais

Preservation master file

O objeto derivado do original que será preservado gerenciado e disseminado por longo prazo.

Princípios fair

Os princípios orientadores "FAIR" para gerenciamento e administração de dados científicos formam o foco de um artigo no Nature Journal Scientific Data, um jornal de acesso aberto e revisado por pares para descrições de conjuntos de dados cientificamente valiosos. Os quatro princípios - Acessibilidade, Acessibilidade, Interoperabilidade e Reutilização - fornecem uma diretriz para os produtores e editores de dados para melhorar a reutilização de dados científicos.

Protocolo

Padrões que controlam a transferência de informação entre computadores. Desenvolvidos para melhorar a confiabilidade e a velocidade de dados transferidos.

Publicação seriada

Publicação em fascículos ou volume, em geral numerados cronológica e/ou sequencialmente, com periodicidade predeterminada, sem data prevista de término. Ex.: Jornal, revista, periódico.

Rda

Research Data Alliance

Rdm

Research Data Management

Rede aberta

Uma rede que oferece acesso aberto aos seus usuários com pouca, se houver, autenticação sendo aplicada. O melhor exemplo de uma rede aberta é a Internet.

Replicação

Uma migração digital onde não há alteração na informação da embalagem, na informação do conteúdo e no PDI. Os bits usados para representar esses objetos de informações são preservados na transferência para a mesma ou nova instância de mídia.

Repositório digital

Sistema de informação on-line encarregado de gerar e armazenar objetos digitais para seus subsequentes acessos e recuperações.

Repositório digital

Uma instalação onde os dados podem ser depositados e preservados com segurança, com acesso regulado a ele.

Repositório digital confiável

Resultado da associação de repositórios institucionais serviços de preservação e arquivos por área de conhecimento tem como missão prover acesso de longo prazo confiável a recursos digitais gerenciados para suas comunidades alvo hoje e no futuro.

Repositório institucional

Um local em linha para coletar, preservar e divulgar materiais como artigos de revistas e versões digitais de teses e dissertações. Pode também incluir outros recursos digitais gerados por uma instituição de pesquisa, como documentos administrativos, notas de curso ou objetos de aprendizagem.

Repositório institucional (institutional repositoires)

Repositório digital que incluem não só artigos submetidos ao processo tradicional de revisão dos pares (pos-print) como também versões eletrônicas preliminares de documentos científicos (pré-prints) teses manuais materiais de ensino ou qualquer outro tipo de material que os autores ou sua instituição desejem que se torne disponível para o público. Eles devem estar respaldados por política de gerenciamento que os reconheçam como vitais para a instituição; um repositório institucional é uma infraestrutura mantida por uma organização, tal como uma universidade ou um centro de investigação, com o propósito de colecionar e preservar a sua produção científica, técnica ou administrativa, e de lhe dar visibilidade. Os repositórios institucionais podem contribuir para iniciativas mais alargadas, como a agregação da publicação científica a nível nacional. Os repositórios têm também uma função importante na auditoria das organizações. Fonte: RECCAP

Serviços de repositório (repository services)

Serviços oferecidos por uma infraestrutura técnica que permite o armazenamento, o acesso, a descrição, a disseminação e a preservação de objetos digitais. Nesta infraestrutura também estão presentes os serviços de apoio aos investigadores em aspectos técnicos, legais e das políticas de criação, do depósito e partilha de resultados de investigação. Fonte: RECCAP

Serviços de repositório

Um conjunto de serviços que uma universidade [ou organização de pesquisa] oferece aos membros da sua comunidade para a gestão e disseminação de materiais digitais criados pela instituição e seus membros da comunidade.

Sgml (standard generalized markup language)

Linguagem de Marcação Generalizada Padrão que é a base para a criação de todas as linguagens de marcação definido pela norma ISO 8879 -1986.

Software

Programa de computador. São instruções que o computador é capaz de entender e executar.

Software livre

Programa de computador em que se tem liberdade de executar copiar distribuir modificar e aperfeiçoar de acordo com interesses pessoais ou comerciais. Apresenta um código-fonte aberto.

Tecnologia da informação

Conjunto de dispositivos mecânicos e eletrônicos que auxiliam no armazenamento, recuperação, armazenamento e gestão da informação.

Url (uniform resource locator)

Padronização da localização ou dos detalhes de endereçamento dos recursos da Internet.

Xml (extensible markup language)

Linguagem para descrição de documentos eletrônicos estrutura sintática para descrição de dados entre aplicações de informática em formato de texto é um formato padrão para publicação armazenamento e transferência de documentos por via eletrônica independente dos fabricantes de software facilmente interpretável por múltiplas aplicações e em certa forma autoexplicativo.

 

Fim do conteúdo da página