1 / 53

Organização e Representação da Informação (Digitalizada)

Organização e Representação da Informação (Digitalizada). Museus, Arquivos e Bibliotecas. nuno oliveira Pedro Rangel Henriques Universidade do Minho. A Internet e a Web. Um pouco de história. 1974. 1974. Internet. IP. TCP. 1990. Web. Vinton Cerf. Robert Kahn. Timothy Berners-Lee.

kita
Download Presentation

Organização e Representação da Informação (Digitalizada)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 18º Webinar BAD Organização e Representação da Informação (Digitalizada) Museus, Arquivose Bibliotecas nuno oliveira Pedro Rangel Henriques Universidade do Minho

  2. 18º Webinar BAD A Internet e a Web

  3. 18º Webinar BAD Um pouco de história... 1974 1974 Internet IP TCP 1990 Web VintonCerf Robert Kahn Timothy Berners-Lee

  4. 18º Webinar BAD Um pouco de história... 1º Website Info.cern.chfoi criado em hypertexto (a primeira forma básica do HTML) HTML (HyperTextMarkupLanguage) conjunto de marcas para descrever a estrutura de um documento na web. HTML foi baseado no SGML (Standard GeneralizedMarkupLanguage), usada para descrever dialetos de anotação

  5. 18º Webinar BAD Um pouco de história… 1994 - Criado o W3C (WorldWide Web Consortium) Inicia projeto: criar uma linguageminterpretávelpor software, e integrávelcom outras linguagens de onde nasce XML (eXtensibleMarkupLanguage) a metalinguagem para a criação de linguagens de anotação

  6. 18º Webinar BAD Um pouco de história… Redesenhodo acesso à informação! 1998 SergeyBrin LarryPage A importância de uma página web: - não depende do número de acessos com que conta... - depende do número de páginas que lhe apontam (e sua importância) PageRank

  7. 18º Webinar BAD Um pouco de história… Redesenhodo uso da web 2001 2004 2003 2006 2005 Jimmy Wales Wikipedia RamuYalamanchi Hi5 Steven Chen Youtube (com ChadHurley) Even Williams Twiter Blogger (1999) Mark Zuckerberg Facebook WEB 2.0 Informação é criada pelos utilizadores! Cooperação!

  8. 18º Webinar BAD Um pouco de história... Redesenho da Web Interoperabilidade e Cooperação WEB 3.0 ou WEB Semântica Projeto iniciado em 2001 Inteligência Artificial Dados na web interpretáveis por computadores Ontologias Anotação e Metadados Atribuição de significado aos conteúdos na web Relacionamento semântico entre dados

  9. 18º Webinar BAD Instituições detentoras da InformaçãoIDIs

  10. 18º Webinar BAD O Documento • O Documento era o centro das IDIs! • Documento visto como qualquer peça informativa • O interesse nestes documentos era por parte da história

  11. 18º Webinar BAD Evolução social e institucional • Evolução da sociedade • Evolução das organizações, administrações e instituições • Produção de informação não histórica • Evolução das IDIs • Históricas – informação histórica e cultural • Museus, bibliotecas (e arquivos) • Administrativas – preservação informação social e institucional • Arquivos, bibliotecas (e museus) • IDIs • Mudança de pensamento/paradigma • Pragmatismo • Novas técnicas para organização e tratamento de informação • Facilitação no acesso à informação

  12. 18º Webinar BAD A Informação! • O documento deixa de ser o foco das IDIs • A informação é o novo objeto de trabalho • Tratamento de informação passa a ser visto como Ciência • Primeirono contexto dos Museus e das Bibliotecas e, posteriormente, em Arquivos • Evolução conjunta da Informática e da Ciência da Informação • Técnicas de Preservação, Anotação, Digitalização e Pesquisa • Uniformização da Informação para interoperabilidade • Etc.

  13. 18º Webinar BAD A disponibilização da informação • Evolução da Web • Maior disponibilidade de informação • Acesso facilitado à informação • Aparecimento de standards para representação de informação • Facilitação da Interoperabilidade entre sistemas de informação • Consequência das IDIs • Necessidade de aceder/disponibilizar, pragmaticamente, Informação • Aparecimento de novos tipos de “documentos” • Necessidade de rever métodos de gestão de informação • Desejo de troca de informação entre sistemas nas IDIs

  14. 18º Webinar BAD Em busca da Interoperabilidade

  15. 18º Webinar BAD Uniformização de IDIs Modelo OAIS (Open Archival Information System) Arquitetura standard para a construção de repositórios e arquivos digitais Modelo para acesso aberto a informação a ser preservada a longo-termo

  16. 18º Webinar BAD Comunicação entre IDIs IDIs não necessitam mais de estar de costas voltadas IDI Troca de Informação IDI Implementação de Protocolos de Comunicação OAI – PMH (Open Archive Initiative – Protocol for Metadata Harvesting) SWORD (Simple Web-service Offering Repository Deposit) IDIs importam e exportam informação nestes standards Providers e Harvesters Auxiliam a comunicação e integração de software com agregadores de informação

  17. 18º Webinar BAD Pesquisa Federada IDI IDI IDI IDI IDI Ponto de Acesso - Um ponto de acesso - Uma questão - Resultados de procura provenientes de várias portais agregadores de informação SRU/CQL (Search Retrieval via URL / Context Query Language) Protocolo para queriesde procura sobre a internet CQL define a sintaxe para a escrita de queries

  18. 18º Webinar BAD Dados, Informação e Conhecimento

  19. 18º Webinar BAD Dados, Informação e Conhecimento Dados Entidades sintáticas (valores, quantidades, etc.) passíveis de serem “medidas” e processados Relacionamento semântico entre os dados atribuindo-lhes um significado Informação Aprendizagem Conhecimento Estruturação e organização da informação adquirida como resultado de um processo cognitivo

  20. 18º Webinar BAD Informação, o segredo! A Associação Portuguesa de Editores e Livreirosagradeceu, estasexta-feira, a Pinto da Costa a oferta do estádio do Dragãopararealizar a Feira do Livro do Porto. Apesar da proposta, o evento continua suspenso. notícia retirada do JN a 2013-05-03

  21. 18º Webinar BAD Informação, o segredo! A Associação Portuguesa de Editores e Livreirosagradeceu, estasexta-feira, a Pinto da Costa a oferta do estádio do Dragãopararealizar a Feira do Livro do Porto. Apesar da proposta, o evento continua suspenso. notícia retirada do JN a 2013-05-03

  22. 18º Webinar BAD Informação, o segredo! A Associação Portuguesa de Editores e Livreirosagradeceu, estasexta-feira, a Pinto da Costa a oferta do estádio do Dragãopararealizar a Feira do Livro do Porto. Apesar da proposta, o evento continua suspenso. <associação> <pessoa> <data> <estádio> <evento> <cidade> notícia retirada do JN a 2013-05-03

  23. 18º Webinar BAD Informação, o segredo! Anotação (interna) de documentos Inscrição de notas, comentários ou marcas num documento que ajudam a clarificar/normalizar o seu conteúdo. Marcas dão significado aos dados

  24. 18º Webinar BAD Informação, o segredo (2)! A Associação Portuguesa de Editores e Livreirosagradeceu, estasexta-feira, a Pinto da Costa a oferta do estádio do Dragãopararealizar a Feira do Livro do Porto. Apesar da proposta, o evento continua suspenso. Título = “Feira do Livro continua suspensa após proposta de Pinto da Costa” Criador = “Jornal de Notícias” Tema = “Cultura” Descrição = “Notícia sobre a realização da Feira do Livro do Portoem 2013” Editor = “Jornal de Notícias” Data = “2013-05-03” Tipo = “Texto” Formato = “text/plain” Identificador = “http://goo.gl/i1SS5” Língua = “PT”

  25. 18º Webinar BAD Informação, o segredo (2)! Enriquecimento da informação com Anotação (externa) de documentos usando Metadados Dados sobre os dados Definem a semântica dos dados externos ao documento ... que não são expressos no conteúdo do documento ...

  26. 18º Webinar BAD Metadados e os Documentos

  27. 18º Webinar BAD Documentos O que é considerado um documento? Os tipos de documento são variados! Fotografia Certificado Filme Livro Relatório Fatura Página Web Artigo Científico Biografia Gravação Áudio Passaporte Cada tipo pode ser descrito de várias formas... ... depende, claramente, do contexto e da sua utilização

  28. 18º Webinar BAD Metadados do Documento Trêsgrandes tipos de metadados... Descritivos Descrevem os dados essenciais do recurso. E.g., título, autor, etc. Administrativos Descrevem dados administrativos que ajudam na manutenção do documento. E.g., a data de criação, como foi a criação, etc. Estruturais Descrevem como o recurso é composto. E.g., ordenação de páginas, organização em sistema de ficheiros

  29. 18º Webinar BAD Esquemas de Metadados Conjunto de metadados desenhado em específico para um dado propósito ex. descrever um determinado relatório... Tem, geralmente, um contexto de utilização associado! Definem a semântica (e sintaxe) dos metadados e seus conteúdos Podem completar-se, descrevendo um documento para vários propósitos

  30. 18º Webinar BAD Esquemas de Metadados - Dublin Core – para simples descrição de um documento - TEI (Text Encoding Initiative) – para anotação de textos eletrónicos (e.g., romances) - METS (Metadata Encoding and Transmission Standard) – para expressar estrutura de um objeto digital assim como para o descrever e localizar os ficheiros que o compõem - EAD (Encoded Archival Description) – para anotar dados em inventários ou índices em linha - ISAD(g) (General International Standard Archival Description ) – guias para descrever arquivos - LOM (Learning Object Metadata) – para fomentar o uso de recursos didáticos suportados por tecnologia - CDWA (Categories for Description of Works of Art) – para descrever objetos visuais como pinturas ou esculturas

  31. 18º Webinar BAD Uma questão de Semântica

  32. 18º Webinar BAD Nem só de pão vive o homem... A anotação de documentos ajuda o humano a perceber com maior exatidão o conteúdo e o próprio documento Nesta perspetiva As marcas de anotação por si só fornecem o significado ao valor marcado E as relações semânticas que entre elas existem... Porque (melhor ou pior) o humano conhece o domínio MAS As máquinas NÃO!!! É necessário “ensinar-lhes” o domínio!

  33. 18º Webinar BAD Organização semântica da Informação Ontologias “Uma ontologia é um artefacto que define um conjunto de conceitos, relações e axiomas para um domínio de saber específico, representando e organizando o conhecimento implícito (de forma a que um conjunto de sistemas cooperativos concordem e o partilhem).” Retirado, traduzido e adaptado de “OntologicalAdaptiveIntegrationOfReverse EngineeringTools”

  34. 18º Webinar BAD Organização semântica da Informação Ontologias O = (C, R, A) • - C – Entidades da Ontologia • - CC – Conceitos (Ex: Mãe, Pessoa, Filho, Irmão) • - CI – Instâncias dos conceitos (Ex: Teresa, Nuno) • - R – Relações entre entidades da Ontologia • - RH – Relações taxonómicas/hierárquicas entre conceitos (Ex: Mãe ‘é_uma’ Pessoa) • - RI – Relações entre conceitos e Instâncias (Ex: Teresa ‘é_uma’ Mãe) • - RS – Relações não taxonómicas entre conceitos (Ex: Mãe ‘tem_filho’ Filho) • - RP – Propriedades dos conceitos (Ex: Pessoa ‘data_de_nascimento’ 1986-02-26) • - A – Axiomas. Dão consistência à ontologia e são usados para inferir novo conhecimento (Ex: “Se dois Filho têm a mesma Mãeentão são Irmão”)

  35. 18º Webinar BAD Ontologias…Metadados… Cooperação? Cooperação Só haverá cooperação entre sistemas (de arquivos) se todos falarem a mesma língua! XML é a língua franca para a interoperabilidade (de informação)! Mas o conteúdo em XML pode ser interpretado de várias maneiras! Metadados Mas os metadadostêm um significado bem definido! No entanto o significado depende do domínio específico... Ontologias As ontologias descrevem um domínio! Os metadados (conceitos nas ontologias) podem ser relacionados de forma unívoca numa tal estrutura... Uma vez aceites as relações inter-metadados , os sistemas podem cooperar porque se percebem mutuamente!

  36. 18º Webinar BAD Os nossos Projetos

  37. 18º Webinar BAD Metadados na Pesquisa Semântica De documentos Jurídicos! • Criação de Ontologia para uma área jurídica • Levantamento de metadados associados a documentos dessa área • Relacionamento entre metadados e conceitos ontológicos • Implementação da pesquisa de documentos baseada na ontologia • Benefícios da pesquisa ontológica na obtenção de informação jurídica

  38. 18º Webinar BAD Povoamento Automático de Ontologias A partir da anotação de documentos Jurídicos! • Área jurídica do direito de família • Criação de Ontologia para representar conhecimento sobre a área • Utilização de processamento de linguagem natural para reconhecer padrões e anotar textos jurídicos • Informação anotada usada para povoar ontologias • Diminuição dos custos e esforços na construção de bases de conhecimento

  39. 18º Webinar BAD Geração Automática de Museus Virtuais A partir da anotação de espólio de arquivos e museus • Base de dados de espólio (de museus e arquivos) anotado • Ontologia geral para descrever o conhecimento anotado • Construção de salas de exposição virtuais para aprendizagem a partir de especificações sobre a vistas da ontologia e os documentos anotados • Navegação dirigida pela semântica • Uso de browsers semânticos • Projeto CoNVEM / Geny

  40. 18º Webinar BAD Geração Automática de Museus Virtuais

  41. 18º Webinar BAD Geração Automática de Museus Virtuais • Projeto siME • Museu da Emigração e das Comunidades (Fafe)

  42. 18º Webinar BAD Geração Automática de Museus Virtuais

  43. 18º Webinar BAD Navegação Conceptual sobreInformação • ProjetoGénio • Espóliodo Museu da Emigração e das Comunidades (Fafe) • Ontologiadescreve o fenómenomigratório • Navegaçãoconceptual sobrea informação • navegação entre osobjectos, mantendo a relaçãológicadefinidapelaontologia http://epl.di.uminho.pt/~ritafaria/MEC/index.php

  44. 18º Webinar BAD

  45. 18º Webinar BAD Navegação Conceptual sobreInformação

  46. 18º Webinar BAD Navegação Conceptual sobreInformação

  47. 18º Webinar BAD Navegação Conceptual sobreInformação

  48. 18º Webinar BAD Outros Projetos

  49. 18º Webinar BAD Qwiki

  50. 18º Webinar BAD Google Art Project

More Related