320 likes | 434 Views
ISO “Reference Model For an Open Archival Information System (OAIS)” Visão Geral Katia P. Thomaz (UFMG/ECI) Setembro 2003. Tópicos Abordados. Histórico Visão geral do Modelo de Referência Algumas Aplicações Acompanhamento das Atividades. Qual a motivação?.
E N D
ISO “Reference Model For anOpen Archival InformationSystem (OAIS)”Visão Geral Katia P. Thomaz (UFMG/ECI) Setembro 2003
Tópicos Abordados • Histórico • Visão geral do Modelo de Referência • Algumas Aplicações • Acompanhamento das Atividades
Qual a motivação? Pesquisa realizada pelo DataQuest, EUA em 2000
Qual a motivação? • Observações climáticas da Terra • Dados de missões espaciais • Resultados de pesquisas bio-genéticas • Documentos do governo eletrônico ...
Qual a motivação? • Essas informações são, fundamentalmente, de caráter arquivístico e, portanto, de natureza: • orgânica • natural • singular • comprobatória
Qual a motivação? • Preservar informação em formato digital é mais difícil que preservar informação em formatos tradicionais • a informação digital está cada vez mais distribuída • dados e metadados devem ser migrados para novas mídias, sistemas operacionais e sistemas aplicativos • representações e formatos devem obrigatoriamente acompanhar novas tecnologias e padrões • a informação digital precisa ser prontamente transportada de arquivo a arquivo
Antecedentes • National Space Science Data Center • Primeiro arquivo digital da NASA • Passou por diversas mudanças tecnológicas desde 1966 • Consultative Committee for Space Data Systems • Grupo internacional de agências espaciais • Desenvolveu diversos padrões independentes de área científica • Tornou-se, por volta de 1990, um corpo de trabalho do ISO TC 20/ SC 13 • TC20: Aircraft and Space Vehicles • SC13: Space Data and Information Transfer Systems • ISO sugeriu que o SC 13 desenvolvesse padrões para arquivos
Organização do Trabalho • NASA estabeleceu parceria com Federal Geographic Data Committee (FGDC) e National Archives and Records Administration (NARA) em outubro de 1995 • Incorporação de representantes de instituições arquivísticas e usuários • Processo “Aberto”, importante para estimular o diálogo entre partes • Oficinas internacionais conduzidas, também, na Inglaterra e na França • Publicação dos resultados das oficinas norte-americanas e internacionais na Web • Comentários e críticas via e-mail
Abordagem Técnica • Iniciar com o desenvolvimento de um modelo de referência para estabelecer termos e conceitos comuns • Investigar outros modelos de referência • ISO “Seven Layer” Communications Reference Model • ISO Reference Model for Open Distributed Processing • ISO TC211 Reference Model for Geomantics • Escolher técnicas formais para especificação • Diagramas de Fluxo de Dados para modelos funcionais e interfaces • Unified Modeling Language (UML) para classes de dados • Prosseguir com novos desenvolvimentos de padrões para arquivos
Andamento do Trabalho • Revisão CCSDS Red Book concluída em Novembro de 2000 • Problemas discutidos e resolvidos nas oficinas ISO Archiving Workshop de Novembro de 2000 e Maio de 2001 • Nova versão entregue a ISO e CCSDS em Julho 2001 • Revisão CCSDS concluída em Outubro 2001 com alguns comentários de edição • Aprovado para publicação final como padrão CCSDS em Janeiro de 2002 • Aprovado para publicação como padrão ISO 14721 em Fevereiro de 2003
Modelo Resultante • Aplicável a diferentes tipos de organizações • Arquivos • Bibliotecas • Centros de pesquisa • Útil a diversas categorias de profissionais • Projetistas de sistemas de arquivos • Usuários de sistemas de arquivos • Responsáveis por sistemas de arquivos • Desenvolvedores de padrões • Versão CCSDS disponível em: http://www.ccsds.org/documents/650x0b1.pdf • Lista de discussão de implementadores oais-implementers@lists2.rlg.org
Modelo de Referência para um Sistema Aberto de Armazenamento de Informação(SAAI) Visão Técnica
O que é um Modelo de Referência? • Um esquema para entender relacionamentos significativos de entidades num ambiente e para desenvolver padrões ou especificações consistentes com esse ambiente • Baseia-se numa pequena quantidade de conceitos integrados • Pode ser usado como base para treinamento e explicação de padrões a não especialistas
Sistema Aberto de Armazenamento de Informação e Preservação por Longo Prazo • Aberto • Recomendações e padrões desenvolvidos em fóruns abertos • Informação • Qualquer tipo de conhecimento que possa ser intercambiado por meio de dados (físico ou digital) • Sistema de Armazenamento de Informação • Hardware, software e pessoas encarregados de receber, preservar e disseminar informação • Longo Prazo • Período de tempo suficiente para se preocupar com mudanças tecnológicas • Preservação por Longo Prazo • Ato de manter informação por Longo Prazo, de forma correta e ‘independentemente compreensível’
Objetivos • Fornecer um esquema para entender os conceitos arquivísticos necessários para a preservação e acesso a informação digital por Longo Prazo • Servir de base para outros esforços de preservação e acesso a informação NÃO digital por Longo Prazo • Fornecer um esquema para descrever e comparar arquiteturas e operações de arquivos existentes e futuros • Ampliar o consenso sobre os elementos e processos de preservação e acesso a informação por Longo Prazo, e fomentar um mercado mais amplo para fornecedores • Direcionar padrões relacionados ao SAAI
Escopo • Define um conjunto de responsabilidades mínimas de um SAAI passíveis de distingui-lo de outros usos do termo ‘arquivo • Descreve as funções para preservação de informação em arquivos e suas interfaces internas e externas • Detalha os tipos de informações que fluem e são gerenciadas pelo SAAI • Também discute • Perspectivas de preservação de informação • Perspectivas de preservação de acesso • Possibilidades de interação entre arquivos SAAI • NÃO define uma implementação
Aplicação • Aplica-se a qualquer arquivo • Aplica-se especificamente a organizações com responsabilidade de tornar informação disponível por Longo Prazo • Interessa, também, àquelas organizações e indivíduos que criam informação que pode vir a necessitar de Preservação por Longo Prazo e àquelas que necessitam adquirir informação desses arquivos
Visão do Ambiente de um SAAI • Produtor é a função desempenhada pelas pessoas ou sistemas cliente que fornecem informação a ser preservada • Administração é a função desempenhada por aqueles que estabelecem as políticas gerais do SAAI, dentro de um domínio mais abrangente de políticas • Consumidor é a função desempenhada pelas pessoas ou sistemas cliente que interagem com os serviços do SAAI para pesquisar e adquirir informação preservada desejada • Comunidade Alvo é um tipo especial de Consumidor que deve ser capaz de entender a informação preservada pelo SAAI SAAI (arquivo) Produtor Consumidor Administração
Responsabilidades de um SAAI • Negociar e aceitar informação de Produtores de informação • Estabelecer controle suficiente para assegurar a Preservação por Longo Prazo • Identificar as Comunidades Alvo da informação preservada • Garantir que a informação preservada seja ‘independentemente compreensível’ para as Comunidades Alvo • Seguir políticas e procedimentos documentados que garantam que a informação seja preservada contra todas as contingências cabíveis • Tornar a informação preservada disponível para as Comunidades Alvo
Conceito de Informação • Uma informação é sempre representada por algum tipo de dado • Pode-se dizer, de forma genérica, que ‘Dados interpretados por sua Informação de Representação produz Informação’ • Para preservar adequamente um Objeto de Informação, o arquivo deve identificar e entender claramente o Objeto de Dados e sua Informação de Representação associada Interpretada por sua Produz Objeto de Dados Informação de Representação Objeto de Informação
Conceito de Pacote de Informação Informação de Descrição de Preservação Informação de Conteúdo Pacote de Informação • Um Pacote de Informação é um continente conceitual de dois tipos de informação • Informação de Conteúdo (alvo original da preservação) • Informação de Descrição de Preservação - IDP
Variações do Pacote de Informação • Pacote de Submissão de Informação • Recebido de um Produtor • Inclui parte ou o todo de um ou mais Pacotes de Armazenamento de Informação • Pacote Armazenamento de Informação (principal componente do modelo) • Pacote de Informação efetivamente preservado pelo SAAI • O conjunto Informação de Conteúdo e Informação de Descrição de Preservação associada deve estar completo • Pacote de Disseminação de Informação • Enviado a um Consumidor pelo SAAI • Inclui parte ou o todo de um ou mais Pacotes de Armazenamento de Informação
Pacote de Armazenamento de Informação Pacote de Armazenamento de Informação (PAI) derivado de Informação de Pacote Descrição de Pacote delimitado por p.e., Informação de suporte a pesquisas de PAI’s por clientes p.e., Como encontrar a informação de Conteúdo e sua IDP em alguma mídia Informação de Descrição de Preservação (IDP) Informação de Conteúdo melhor descrito por • p.e., • Documento impresso • • Documento como um arquivo de dados • eletrônico junto com sua descrição • de formato • • Conjunto de dados científicos • consistindo de um arquivo de imagem, um • arquivo texto e um arquivo com a descrição • dos formatos dos outros arquivos p.e., Como a Informação de Conteúdo foi criada, quem a mantem, como se relaciona com outras informações e como sua integridade é assegurada
Visão do Fluxo de Dados Externo Produtor Pacotes de Submissão de Informação SAAI Pacotes de Armazenamento de Informação consultas resultados Pacotes de Disseminação de Informação pedidos Consumidor
Entidades Funcionais Planejamento de Preservação C O N S U M I D O R P R O D U T O R Info Descritiva Info Descritiva Gerenciamento de Dados consultas resultados Recepção Acesso pedidos PSI PDI PAI PAI Arquivamento Administração do Sistema ADMINISTRAÇÃO PSI = Pacote de Submissão de Informação PAI = Pacote de Armazenamento de Informação PDI = Pacote de Disseminação de Informação
Entidades Funcionais • Recepção:fornece serviços e funções para aceitar os Pacotes de Submisão de Informação (PSI’s) dos Produtores e preparar os conteúdos para armazenamento e gerenciamento dentro do arquivo • Arquivamento:fornece serviços e funções para armazenar, manter e recuperar os Pacotes de Armazenamento de Informação • Gerenciamento de Dados:fornece serviços e funções para incluir, manter e acessar tanto para a informação descritiva que identifica e documenta os acervos do arquivo quanto para os dados de administração interna do arquivo • Administração do Sistema:gerencia as operações do sistema de arquivo como um todo • Planejamento de Preservação: monitora o ambiente do SAAI e fornece recomendações para garantir que a informação armazenada permaneça acessível à Comunidade Usuária Alvo ao longo do tempo mesmo que o ambiente computacional original torne-se obsoleto • Acesso:auxilia os consumidores na descoberta da existência, descrição e localização de informacão armazenada no SAAI e permite que os mesmos requisitem e recebam produtos de informação
Resumo do Modelo de Referência • O modelo de referência aplica-se a todos os arquivos digitais, seus Produtores e Consumidores • Identifica um conjunto mínimo de responsabilidades para que um arquivo seja considerado um SAAI • Estabelece termos e conceitos comuns para comparar implementações mas não especifica uma implementação • Fornece modelos detalhados tanto para funções quanto para informações de arquivos
Base para Arquitetura de Sistemas de Armazenamento de Informação • Networked European Deposit Library (NEDLIB) em seu Deposit System for Electronic Publications (DSEP) • National Library of Australia • CURL Exemplars in Digital Archives (CEDARS) • National Space Science Data Center (NSSDC) • Centre de Donnees de la Physique des Plasmas (CDPP) em seu System for Preservation and Access to Data and Information (SIPAD) • Metadata Encoding and Transmission Standard (METS) • International Research on Permanent Authentic Records in Electronic Systems (InterPARES) • Projeto de pesquisa nível doutorado “A preservação de documentos eletrônicos de caráter arquivístico: novos desafios, velhos problemas” (UFMG/ECI)
Melhoria de Comunicações e Produtividade entre Diferentes Comunidades • National Archives and Records Administration e San Diego Super Computer Center • Bibliotheque Nationale de France e Centre National d’Études Spatialies (CNES) • Desenvolvedores do formato Hierarchical Data Format (HDF) do National Center for Supercomputing Applications (NCSA) e pesquisadores de DNA • Desenvolvedores do Life Sciences Archive e pesquisadores de micro-gravidade • United States Department of Agriculture e especialistas em preservação digital
Acompanhamento das Atividades • Research Libraries Group (RLG) estabeleceu uma página Web para acompanhar os esforços e questões de implementação do OAIS • http://www.rlg.org/longterm/oais.html • CCSDS/ISO Producer-Archive Interface Methodology Standard • CCSDS Certification Coordination Function