530 likes | 595 Views
Organização e Representação da Informação (Digitalizada). Museus, Arquivos e Bibliotecas. nuno oliveira Pedro Rangel Henriques Universidade do Minho. A Internet e a Web. Um pouco de história. 1974. 1974. Internet. IP. TCP. 1990. Web. Vinton Cerf. Robert Kahn. Timothy Berners-Lee.
E N D
18º Webinar BAD Organização e Representação da Informação (Digitalizada) Museus, Arquivose Bibliotecas nuno oliveira Pedro Rangel Henriques Universidade do Minho
18º Webinar BAD A Internet e a Web
18º Webinar BAD Um pouco de história... 1974 1974 Internet IP TCP 1990 Web VintonCerf Robert Kahn Timothy Berners-Lee
18º Webinar BAD Um pouco de história... 1º Website Info.cern.chfoi criado em hypertexto (a primeira forma básica do HTML) HTML (HyperTextMarkupLanguage) conjunto de marcas para descrever a estrutura de um documento na web. HTML foi baseado no SGML (Standard GeneralizedMarkupLanguage), usada para descrever dialetos de anotação
18º Webinar BAD Um pouco de história… 1994 - Criado o W3C (WorldWide Web Consortium) Inicia projeto: criar uma linguageminterpretávelpor software, e integrávelcom outras linguagens de onde nasce XML (eXtensibleMarkupLanguage) a metalinguagem para a criação de linguagens de anotação
18º Webinar BAD Um pouco de história… Redesenhodo acesso à informação! 1998 SergeyBrin LarryPage A importância de uma página web: - não depende do número de acessos com que conta... - depende do número de páginas que lhe apontam (e sua importância) PageRank
18º Webinar BAD Um pouco de história… Redesenhodo uso da web 2001 2004 2003 2006 2005 Jimmy Wales Wikipedia RamuYalamanchi Hi5 Steven Chen Youtube (com ChadHurley) Even Williams Twiter Blogger (1999) Mark Zuckerberg Facebook WEB 2.0 Informação é criada pelos utilizadores! Cooperação!
18º Webinar BAD Um pouco de história... Redesenho da Web Interoperabilidade e Cooperação WEB 3.0 ou WEB Semântica Projeto iniciado em 2001 Inteligência Artificial Dados na web interpretáveis por computadores Ontologias Anotação e Metadados Atribuição de significado aos conteúdos na web Relacionamento semântico entre dados
18º Webinar BAD Instituições detentoras da InformaçãoIDIs
18º Webinar BAD O Documento • O Documento era o centro das IDIs! • Documento visto como qualquer peça informativa • O interesse nestes documentos era por parte da história
18º Webinar BAD Evolução social e institucional • Evolução da sociedade • Evolução das organizações, administrações e instituições • Produção de informação não histórica • Evolução das IDIs • Históricas – informação histórica e cultural • Museus, bibliotecas (e arquivos) • Administrativas – preservação informação social e institucional • Arquivos, bibliotecas (e museus) • IDIs • Mudança de pensamento/paradigma • Pragmatismo • Novas técnicas para organização e tratamento de informação • Facilitação no acesso à informação
18º Webinar BAD A Informação! • O documento deixa de ser o foco das IDIs • A informação é o novo objeto de trabalho • Tratamento de informação passa a ser visto como Ciência • Primeirono contexto dos Museus e das Bibliotecas e, posteriormente, em Arquivos • Evolução conjunta da Informática e da Ciência da Informação • Técnicas de Preservação, Anotação, Digitalização e Pesquisa • Uniformização da Informação para interoperabilidade • Etc.
18º Webinar BAD A disponibilização da informação • Evolução da Web • Maior disponibilidade de informação • Acesso facilitado à informação • Aparecimento de standards para representação de informação • Facilitação da Interoperabilidade entre sistemas de informação • Consequência das IDIs • Necessidade de aceder/disponibilizar, pragmaticamente, Informação • Aparecimento de novos tipos de “documentos” • Necessidade de rever métodos de gestão de informação • Desejo de troca de informação entre sistemas nas IDIs
18º Webinar BAD Em busca da Interoperabilidade
18º Webinar BAD Uniformização de IDIs Modelo OAIS (Open Archival Information System) Arquitetura standard para a construção de repositórios e arquivos digitais Modelo para acesso aberto a informação a ser preservada a longo-termo
18º Webinar BAD Comunicação entre IDIs IDIs não necessitam mais de estar de costas voltadas IDI Troca de Informação IDI Implementação de Protocolos de Comunicação OAI – PMH (Open Archive Initiative – Protocol for Metadata Harvesting) SWORD (Simple Web-service Offering Repository Deposit) IDIs importam e exportam informação nestes standards Providers e Harvesters Auxiliam a comunicação e integração de software com agregadores de informação
18º Webinar BAD Pesquisa Federada IDI IDI IDI IDI IDI Ponto de Acesso - Um ponto de acesso - Uma questão - Resultados de procura provenientes de várias portais agregadores de informação SRU/CQL (Search Retrieval via URL / Context Query Language) Protocolo para queriesde procura sobre a internet CQL define a sintaxe para a escrita de queries
18º Webinar BAD Dados, Informação e Conhecimento
18º Webinar BAD Dados, Informação e Conhecimento Dados Entidades sintáticas (valores, quantidades, etc.) passíveis de serem “medidas” e processados Relacionamento semântico entre os dados atribuindo-lhes um significado Informação Aprendizagem Conhecimento Estruturação e organização da informação adquirida como resultado de um processo cognitivo
18º Webinar BAD Informação, o segredo! A Associação Portuguesa de Editores e Livreirosagradeceu, estasexta-feira, a Pinto da Costa a oferta do estádio do Dragãopararealizar a Feira do Livro do Porto. Apesar da proposta, o evento continua suspenso. notícia retirada do JN a 2013-05-03
18º Webinar BAD Informação, o segredo! A Associação Portuguesa de Editores e Livreirosagradeceu, estasexta-feira, a Pinto da Costa a oferta do estádio do Dragãopararealizar a Feira do Livro do Porto. Apesar da proposta, o evento continua suspenso. notícia retirada do JN a 2013-05-03
18º Webinar BAD Informação, o segredo! A Associação Portuguesa de Editores e Livreirosagradeceu, estasexta-feira, a Pinto da Costa a oferta do estádio do Dragãopararealizar a Feira do Livro do Porto. Apesar da proposta, o evento continua suspenso. <associação> <pessoa> <data> <estádio> <evento> <cidade> notícia retirada do JN a 2013-05-03
18º Webinar BAD Informação, o segredo! Anotação (interna) de documentos Inscrição de notas, comentários ou marcas num documento que ajudam a clarificar/normalizar o seu conteúdo. Marcas dão significado aos dados
18º Webinar BAD Informação, o segredo (2)! A Associação Portuguesa de Editores e Livreirosagradeceu, estasexta-feira, a Pinto da Costa a oferta do estádio do Dragãopararealizar a Feira do Livro do Porto. Apesar da proposta, o evento continua suspenso. Título = “Feira do Livro continua suspensa após proposta de Pinto da Costa” Criador = “Jornal de Notícias” Tema = “Cultura” Descrição = “Notícia sobre a realização da Feira do Livro do Portoem 2013” Editor = “Jornal de Notícias” Data = “2013-05-03” Tipo = “Texto” Formato = “text/plain” Identificador = “http://goo.gl/i1SS5” Língua = “PT”
18º Webinar BAD Informação, o segredo (2)! Enriquecimento da informação com Anotação (externa) de documentos usando Metadados Dados sobre os dados Definem a semântica dos dados externos ao documento ... que não são expressos no conteúdo do documento ...
18º Webinar BAD Metadados e os Documentos
18º Webinar BAD Documentos O que é considerado um documento? Os tipos de documento são variados! Fotografia Certificado Filme Livro Relatório Fatura Página Web Artigo Científico Biografia Gravação Áudio Passaporte Cada tipo pode ser descrito de várias formas... ... depende, claramente, do contexto e da sua utilização
18º Webinar BAD Metadados do Documento Trêsgrandes tipos de metadados... Descritivos Descrevem os dados essenciais do recurso. E.g., título, autor, etc. Administrativos Descrevem dados administrativos que ajudam na manutenção do documento. E.g., a data de criação, como foi a criação, etc. Estruturais Descrevem como o recurso é composto. E.g., ordenação de páginas, organização em sistema de ficheiros
18º Webinar BAD Esquemas de Metadados Conjunto de metadados desenhado em específico para um dado propósito ex. descrever um determinado relatório... Tem, geralmente, um contexto de utilização associado! Definem a semântica (e sintaxe) dos metadados e seus conteúdos Podem completar-se, descrevendo um documento para vários propósitos
18º Webinar BAD Esquemas de Metadados - Dublin Core – para simples descrição de um documento - TEI (Text Encoding Initiative) – para anotação de textos eletrónicos (e.g., romances) - METS (Metadata Encoding and Transmission Standard) – para expressar estrutura de um objeto digital assim como para o descrever e localizar os ficheiros que o compõem - EAD (Encoded Archival Description) – para anotar dados em inventários ou índices em linha - ISAD(g) (General International Standard Archival Description ) – guias para descrever arquivos - LOM (Learning Object Metadata) – para fomentar o uso de recursos didáticos suportados por tecnologia - CDWA (Categories for Description of Works of Art) – para descrever objetos visuais como pinturas ou esculturas
18º Webinar BAD Uma questão de Semântica
18º Webinar BAD Nem só de pão vive o homem... A anotação de documentos ajuda o humano a perceber com maior exatidão o conteúdo e o próprio documento Nesta perspetiva As marcas de anotação por si só fornecem o significado ao valor marcado E as relações semânticas que entre elas existem... Porque (melhor ou pior) o humano conhece o domínio MAS As máquinas NÃO!!! É necessário “ensinar-lhes” o domínio!
18º Webinar BAD Organização semântica da Informação Ontologias “Uma ontologia é um artefacto que define um conjunto de conceitos, relações e axiomas para um domínio de saber específico, representando e organizando o conhecimento implícito (de forma a que um conjunto de sistemas cooperativos concordem e o partilhem).” Retirado, traduzido e adaptado de “OntologicalAdaptiveIntegrationOfReverse EngineeringTools”
18º Webinar BAD Organização semântica da Informação Ontologias O = (C, R, A) • - C – Entidades da Ontologia • - CC – Conceitos (Ex: Mãe, Pessoa, Filho, Irmão) • - CI – Instâncias dos conceitos (Ex: Teresa, Nuno) • - R – Relações entre entidades da Ontologia • - RH – Relações taxonómicas/hierárquicas entre conceitos (Ex: Mãe ‘é_uma’ Pessoa) • - RI – Relações entre conceitos e Instâncias (Ex: Teresa ‘é_uma’ Mãe) • - RS – Relações não taxonómicas entre conceitos (Ex: Mãe ‘tem_filho’ Filho) • - RP – Propriedades dos conceitos (Ex: Pessoa ‘data_de_nascimento’ 1986-02-26) • - A – Axiomas. Dão consistência à ontologia e são usados para inferir novo conhecimento (Ex: “Se dois Filho têm a mesma Mãeentão são Irmão”)
18º Webinar BAD Ontologias…Metadados… Cooperação? Cooperação Só haverá cooperação entre sistemas (de arquivos) se todos falarem a mesma língua! XML é a língua franca para a interoperabilidade (de informação)! Mas o conteúdo em XML pode ser interpretado de várias maneiras! Metadados Mas os metadadostêm um significado bem definido! No entanto o significado depende do domínio específico... Ontologias As ontologias descrevem um domínio! Os metadados (conceitos nas ontologias) podem ser relacionados de forma unívoca numa tal estrutura... Uma vez aceites as relações inter-metadados , os sistemas podem cooperar porque se percebem mutuamente!
18º Webinar BAD Os nossos Projetos
18º Webinar BAD Metadados na Pesquisa Semântica De documentos Jurídicos! • Criação de Ontologia para uma área jurídica • Levantamento de metadados associados a documentos dessa área • Relacionamento entre metadados e conceitos ontológicos • Implementação da pesquisa de documentos baseada na ontologia • Benefícios da pesquisa ontológica na obtenção de informação jurídica
18º Webinar BAD Povoamento Automático de Ontologias A partir da anotação de documentos Jurídicos! • Área jurídica do direito de família • Criação de Ontologia para representar conhecimento sobre a área • Utilização de processamento de linguagem natural para reconhecer padrões e anotar textos jurídicos • Informação anotada usada para povoar ontologias • Diminuição dos custos e esforços na construção de bases de conhecimento
18º Webinar BAD Geração Automática de Museus Virtuais A partir da anotação de espólio de arquivos e museus • Base de dados de espólio (de museus e arquivos) anotado • Ontologia geral para descrever o conhecimento anotado • Construção de salas de exposição virtuais para aprendizagem a partir de especificações sobre a vistas da ontologia e os documentos anotados • Navegação dirigida pela semântica • Uso de browsers semânticos • Projeto CoNVEM / Geny
18º Webinar BAD Geração Automática de Museus Virtuais
18º Webinar BAD Geração Automática de Museus Virtuais • Projeto siME • Museu da Emigração e das Comunidades (Fafe)
18º Webinar BAD Geração Automática de Museus Virtuais
18º Webinar BAD Navegação Conceptual sobreInformação • ProjetoGénio • Espóliodo Museu da Emigração e das Comunidades (Fafe) • Ontologiadescreve o fenómenomigratório • Navegaçãoconceptual sobrea informação • navegação entre osobjectos, mantendo a relaçãológicadefinidapelaontologia http://epl.di.uminho.pt/~ritafaria/MEC/index.php
18º Webinar BAD Navegação Conceptual sobreInformação
18º Webinar BAD Navegação Conceptual sobreInformação
18º Webinar BAD Navegação Conceptual sobreInformação
18º Webinar BAD Outros Projetos
18º Webinar BAD Qwiki
18º Webinar BAD Google Art Project