440 likes | 654 Views
CE-262 Ontologia e Web Semântica. Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br +55 12 3947-6941. Introdução à Web Semântica e Ontologias. Sumário de Conteúdo do Tópico. Motivação Web Semântica: o que é?
E N D
CE-262 Ontologia e Web Semântica Prof. José M Parente de Oliveira Sala 120 – Prédio da Computação Instituto Tecnológico de Aeronáutica - ITA parente@ita.br +55 12 3947-6941 Introdução à Web Semântica e Ontologias
Sumário de Conteúdo do Tópico Motivação Web Semântica: o que é? Arquitetura da Web Semântica (W3C) Desafios da Web Semântica Perspectivas da Web Semântica Noção de Ontologia
Material de Referência Projeto e Construção de OntologiasProf. Luiz A M Palazzo - Universidade Católica de Pelotas Ontology Engineering for the Semantic Web and BeyondProf. Natalya F. Noy - Stanford University The Semantic Web Dr. V. Richard Benjamins iSOCO Jena TutorialAnna V. ZhdanovaDERI AT
Material de Referência Ontologias, modelos e busca em JAVA Adriana da Silva Jacinto Ian Horrocks and Alan Rector University of Manchester Manchester, UK
Motivação A web sem semântica!!!!!
Motivação Após muita procura...
Motivação • É necessário navegar muito pela Web antes de se encontrar o conteúdo de interesse • Problema: a tecnologia atual de busca não entende o que se está procurando: • Procura apenas por palavras-chave • = string de caracteres • Retorno de informação em vez de resposta a uma questão!
Motivação Web Sintática [Hendler & Miller 02]
Motivação: Web Sintática • A place where computers do the presentation (easy) and people do the linking and interpreting (hard). • A hypermedia, a digital library • A library of documents called (web pages) interconnected by a hypermedia of links • A database, an application platform • A common portal to applications accessible through web pages, and presenting their results as web pages • A platform for multimedia • BBC Radio 4 anywhere in the world! Terminator 3 trailers! • A naming scheme • Unique identity for those documents [Hendler & Miller 02]
Motivação: Web Sintática Why not get computers to do more of the hard work? [Hendler & Miller 02]
Web Semântica: o que é? • “A Web Semântica é uma extensão da Web atual em que cada informação é dada por um significado bem definido, fazendo com que computadores e pessoas trabalhem melhor em cooperação” • Tim Berners-Lee, James Hendler, Ora Lassila • Scientific American, May 2001
Web Semântica: o que é? • “O poder real da Web Semântica será percebido quando as pessoas criarem programas que coletem conteúdo de diversas fontes, processem a informação e troquem os resultados com outros programas. A eficácia de tais agentes de software aumentará exponencialmente assim como mais máquinas leitoras do conteúdo Web e serviços automatizados (incluindo outros agentes) tornarem-se disponíveis.” • Tim Berners-Lee, James Hendler, Ora Lassila • Scientific American, May 2001
Web Semântica: o que é? • Web Semântica é a idéia de se ter dados na Web definida e interconectada por um caminho que pode ser usado para mais descobertas eficazes, automação, integração e reutilização através de várias aplicações. • A Web pode encontrar todo o seu potencial se tornar-se um local onde dados podem ser tão bem processados por ferramentas automatizadas como o são por pessoas. • W3C
Web Semântica: o que é? • Iniciativa do W3C com o objetivo de adicionar significado à Web • Baseada na tecnologia xml/rdf, fazendo evoluir a html da Web Sintática • WWW Consortium - http://www.w3.org
Camada Lógica Regras de Inferência Ontologia Ontologia Ontologia Arquitetura da Web Semântica Mecanismo de Busca … E-commerce Web Semântica Camada de Esquema Camada de Estrutura Dados
Arquitetura da Web Semântica • Camada de Estrutura • Responsável por estruturar os dados e definir seu significado: • XML, Namespaces • URI, Unicode
Arquitetura da Web Semântica • Camada de Esquema • Responsável por definir relações entre os dados • Uso de ontologias em páginas Web torna mais simples a resolução de indefinição ou conflito de terminologia • RDF Schema, RDF M&S
Arquitetura da Web Semântica • Camada Lógica • Responsável por definir mecanismos para fazer inferência sobre os dados • Composta por um conjunto de regras de inferência • Regras de inferência fornecem aos agentes computacionais o poder de raciocinar sobre as estruturas de dados
Desafios da Web Semântica • Carência de profissionais especializados • Evolução de culturas (html – xml/rdf) • Padrões digitais de mídia instáveis • Crescimento simultâneo e continuado da Web Sintática • Falta de investimento adequado • Falta de visibilidade da área
Perspectivas • Base para a computação móvel e pervasiva • Grande disseminação prevista a médio prazo • Novo patamar para as interações humano-computador • Novos produtos e oportunidades de pesquisa • Aplicação em grande escala em educação e gestão de conhecimento • e-Science
Noção de Ontologia • Corpo de conhecimento declarativo sobre um dado domínio, assunto ou área de conhecimento • Na prática, hierarquias de conceitos (classes) com suas relações, restrições, axiomas e terminologia associada • Termo às vezes mal-empregado. Ontologias não são: • Simples hierarquias • Conjuntos de conceitos associados a palavras-chave • Esquemas de bancos de dados
Noção de Ontologia • Definição de Ontologia: • Especificação formal e explícitade uma conceitualização compartilhada (Gruber, 1993) • Conceitualização: modelo das entidades, relações, axiomas e regras de algum domínio • Formal: • Processável por máquina • Permitindo raciocínio automático • Com semântica lógica formal • Compartilhada: por uma comunidade, permitindo entendimento
Noção de Ontologia • Uma ontologia é uma descrição explícita de um domínio: • Conceitos • Propriedades - atributos de conceitos • Restrições em propriedades e atributos • Indivíduos (às vezes, mas não sempre)
Noção de Ontologia: Estrutura • Ontologies typically have two distinct components: • Names for important concepts in the domain • Elephant is a concept whose members are a kind of animal • Herbivore is a concept whose members are exactly those animals who eat only plants or parts of plants • Adult_Elephant is a concept whose members are exactly those elephants whose age is greater than 20 years • Background knowledge/constraints on the domain • Adult_Elephants weigh at least 2,000 kg • All Elephants are either African_Elephants or Indian_Elephants • No individual can be both a Herbivore and a Carnivore
Noção de Ontologia: Conceitualização • There can be two conceptualizations of this tiny world where the task is to make a plan of stack three blocks as the goal configuration using a robot hand • One is with conceptualization of the table and the other is without the table. In the latter, the table is imbedded in the relation onTable(X) • You can easily see the incompatibility between two plans based on each of the two conceptualizations. They are NOT interoperable each other when they come to a situation where they have to talk about the table. So, it is necessary to have an explicit representation of such a conceptualization.
Noção de Ontologia: Conceitualização • We can design ontology of this block world corresponding to each of the two conceptualizations like this • It is roughly a hierarchy of things with axioms. Definitions of each concept and relation is omitted here • An example of an axiom is above(X,Z):-on(X,Y), on(Y,Z). There are many more axioms to represent constraints among the concepts and relations
Ontologia em Computação O que pode ser representado por um computador Uma ontologia pode ter várias formas, mas ela incluirá necessariamente um vocabulário de termos e alguma especificação de seu significado Uschold 1998, Jaspers & Uschold 1999 Um corpo de conhecimento descrevendo algum domínio de senso comum (Cyc e OpenCyc)
Exemplos de Aplicação de Ontologia • Taxonomias na Web • Yahoo! Categorias • Catálogo para compras on-line • Amazon.com catálogo de produtos • Domínio: especificação de terminologia padrão • Unified Medical Language System (UMLS) • UNSPSC - terminologia para produtos e serviços
Que tipo de vinho eu devo servir com frutos do mar hoje? Vinhos franceses e região de vinhos Uma ontologia compartilhada de vinho e comida Vinhos da Califórnia e região de vinhos Exemplos de Aplicação de Ontologia
Por Que Criar Ontologias? • Para construir declarações explícitas sobre o domínio: • Mais fácil mudar declarações do domínio (considerar, por exemplo, uma base de conhecimento de genética) • Mais fácil entender e atualizar a legalidade dos dados • Para separar conhecimento do domínio do conhecimento operacional: • Reuso do domínio e do conhecimento operacional separadamente
Ferramentas • We need to provide tools and services to help users to: • Design and maintain high quality ontologies, e.g.: • Meaningful— all named classes can have instances • Correct— captured intuitions of domain experts • Minimally redundant— no unintended synonyms • Richly axiomatised— (sufficiently) detailed descriptions • Store (large numbers) of instances of ontology classes, e.g.: • Annotations from web pages • Answer queries over ontology classes and instances, e.g.: • Find more general/specific classes • Retrieve annotations/pages matching a given description • Integrate and align multiple ontologies
Por Que é Difícil Criar Ontologias? • Ontology languages are tricky • “All tractable languages are useless; all useful languages are intractable” • Ontologies are tricky • People do it too easily;People are not logicians • Intuitions hard to formalise • The evidence • The problem has been about for 3000 years • But now it matters! • The semantic web means knowledge representation matters
Alguns Tópicos de Pesquisa • Web semântica • Padrões, princípios, linguagens, limitações • Concepção de ontologias • Engenharia de ontologias • Paradoxo: tensão entre aplicação e extensibilidade • Aspectos a serem abordados • funcional, intencional, social, físico, etc • Relações parte-todo
Alguns Tópicos de Pesquisa • Aprendizado e ontologias • Construção de ontologias a partir de texto (Text-to-Onto) • Anotação semi-automática de páginas baseadas em ontologias • Extração, agrupamento [Hotho et al 2001] e classificação de informação (mineração de textos) • Integração inteligente de informação • Diversidade de visões de ontologias sobre um mesmo domínio, que o abordam sobre perspectivas distintas • Soluções: mapeamento e integração semântica através de contextos comuns [Wache & Stuckenschmidt 2001]