530 likes | 699 Views
Charles Alberton Herdt Dyson Pereira Junior Maurício Edgar Stivanello. Ontologias e Web Semântica. Roteiro. Introdução Ontologias Web Semântica. Roteiro. Introdução Ontologias Web Semântica. Introdução Cenário Atual. Internet introduz um problema de manipulação de informação:
E N D
Charles Alberton Herdt Dyson Pereira Junior Maurício Edgar Stivanello Ontologias eWeb Semântica
Roteiro • Introdução • Ontologias • Web Semântica
Roteiro • Introdução • Ontologias • Web Semântica
IntroduçãoCenário Atual • Internet introduz um problema de manipulação de informação: • Possui grande volume de informações não estruturadas ou pouco estruturadas; • Alguns dos grandes problemas são: • Consulta: encontrar o que se deseja • Integração: integrar informações de várias fontes • Interpretação: extrair significado das páginas • Comunicação: interconectar sistemas
IntroduçãoCenário Atual - Consultas • O modelo atual de busca não é preciso, pela falta de semântica; • O grande volume de informações não estruturadas agrava a situação; • Problema de precisão, pois é baseado em links e palavras chave
IntroduçãoCenário Atual - Integração • Integração de Informações: • O site A tem descrição de produtos de software; • O site B tem preços de material de computação; • Problema: • Combinar produtos e preços; • Dificuldade • Como integrar tais informações?
IntroduçãoCenário Atual - Interpretação • Humanos extraem significado com facilidade; • Para as máquinas não é tão fácil; • Como é possível extrair informações sem conhecer de antemão o formato utilizado na criação das páginas?
IntroduçãoCenário Atual - Interpretação Nome Foto E-mail
IntroduçãoCenário Atual - Interpretação • A extração de informações somente é possível para um conjunto de páginas com formato bem conhecido ( através de wrappers ); • Ex: Coleta de títulos e preço de vendas em um site de comércio eletrônico;
IntroduçãoCenário Atual - Comunicação • Como interconectar sistemas que falam da mesma coisa mas com linguagens diferentes?
IntroduçãoCenário Atual • Resumindo: • O conteúdo pode ser lido, mas é difícil de ser processado pela máquina; • É difícil automatizar processos; • Solução: • A solução seria descrever os dados contidos na Web e representá-los de forma conveniente...
IntroduçãoCenário Atual - Solução... • A IA forneceu alternativas para resolver problemas de manipulação de informação na Internet; • Resurge o paradigma declarativo lógico para a resolução dos problemas surgidos com a Internet;
IntroduçãoCenário Atual - Solução... • Como captar a semântica do conteúdo das páginas da web? • Dotar os sistemas de inteligência e autonomia; • Fazer com que as páginas possuam uma semântica clara e definida. • As ontologias representam um papel fundamental em ambas as soluções.
Roteiro • Introdução • Ontologias • Web Semântica
OntologiasIntrodução • É possível representar conhecimento através de formalismos orientados a classes e relações: • Frames; • Redes Semânticas; • Lógicas de restrição; • Estes formalismos fundamentam a representação do conhecimento em ontologias.
OntologiasDefinição “Uma especificação explícita e formal de uma conceitualização compartilhada” • Por Especificação explícita: definições de conceitos, relações • Por formal: compreensível para agentes e sistemas • Por conceitualização: se trata de um modelo abstrado de uma área de conhecimento • Por compartilhado: conhecimento consensual
OntologiasClassificação das Ontologias • Tipos de Ontologias: • de Representação; • Gerais; • Centrais; • de Domínio; • de Aplicação.
OntologiasKSE – Knowledge Sharing Effort • Até anos 90, Ontologias estavam isoladas. Percebido então os benefícios da reutilização; • KSE criado para prover meios de reutilização do conhecimento; • Como resultado, encontram-se disponíveis várias ontologias e ferramentas.
OntologiasFerramentas para manuseio • Ferramentas KSE (KQML, KIF, Editor de Frames, OKBC, Chimaera, Servidor, Repositório); • Protégé-2000; • Ferramentas KAON e Ontoprise.
OntologiasEngenharia de Ontologias • Princípios de construção de Ontologias: • Clareza; • Legibilidade; • Coerência; • Extensibilidade; • Mínima codificação; • Mínimo compromisso ontológico.
OntologiasCriação ontologia geográfica em 7 passos • Passo 1: • Determinar o domínio e o escopo da ontologia; • Domínio: Geografia • Aplicação: Planificador de rotas • Perguntas possíveis: • Qual é a distância entre duas cidades? • Que tipo de conexão existe entre duas cidades? • Em que país se encontra uma cidade? • Quantas fronteiras são atravessadas?
OntologiasCriação ontologia geográfica em 7 passos • Passo 2: • Reutilizar ontologias existentes; • Verificar se é possível utilizar ou estender alguma das ontologias existentes. Existem várias fontes disponíveis: • Ontolingua Ontology Library (www.ksl.stanford.edu/software/ontolingua); • DAML Ontology Library (www.daml.org/ontologies);
OntologiasCriação ontologia geográfica em 7 passos • Passo 3: • Levantar termos importantes; Termos importantes para o problema de planificação de rotas: capital Conexão por terra fronteira Estado estrada cidade conexão
OntologiasCriação ontologia geográfica em 7 passos • Passo 4: • Definir classes e sua hierarquia; Selecionar do passo 3 somente os objetos, definindo sua hierarquia:
OntologiasCriação ontologia geográfica em 7 passos • Passo 5: • Definir propriedades das classes; Selecionar do passo 3 as propriedades e atribuir às classes:
OntologiasCriação ontologia geográfica em 7 passos • Passo 6: • Definir restrições das propriedades; • Tipo de propriedade; • Valores permitidos; • Cardinalidade; • Tipos de relacionamentos.
OntologiasCriação ontologia geográfica em 7 passos • Passo 6: • Definir restrições das propriedades; Inverso Simétrico Transitivo
OntologiasCriação ontologia geográfica em 7 passos • Passo 7: • Instanciar as classes, criando a base de conhecimento.
Roteiro • Introdução • Ontologias • Web Semântica
Web SemânticaIntrodução • Evolução da Web atual; • Definição W3C: • É a idéia de se ter dados na web definidos e ligados de maneira tal que possam ser usados por máquinas não só com o objetivo de apresentação, mas para automação, integração e reuso de dados entre aplicações. • Idealizada por Tim Berners-Lee;
Web SemânticaCamadas da proposta W3C Berners Lee, T. et al., The Semantic Web. [2001]
Web SemânticaCamada Unicode - URI • UNICODE • Garante o uso padronizado do mesmo conjunto de caracteres; • URI – Identificador Universal de Recursos • Provê uma forma unívoca de identificação e localização de recursos; • Ex: • URL – documentos, imagens, músicas, etc; • E-mail – pessoas;
Web SemânticaCamada XML + XMLS • XML – Extensible Markup Language • escolhida como a linguagem de programação para Web Semântica • Função: • Auto-descrição das informações (metadados) • Padronizar a publicação e troca de dados entre aplicações Web
Web SemânticaCamada XML + XMLS • Metadados: • Auto-descrição das informações • 5353123456785353? Número do cartão de crédito do João da Silva
Web SemânticaCamada XML + XMLS • HTML Metadados Aparência • Marcadores de metadados insuficientes; • Não possui criação de novos marcadores; • Preocupação apenas com apresentação;
Web SemânticaCamada XML + XMLS • XML • Criação de marcadores; • Blocos endereçáveis; • Organização hierárquica;
Web SemânticaCamada XML + XMLS • XML Schema • Permite restrições sobre um documento: • Define os marcadores válidos; • Define regras de validade para o conteúdo de cada bloco: • O marcador <reunião> deve conter • Exatamente um marcador <local>; • 2 ou mais marcadores <pessoa>; • O marcador <pessoa> deve conter • Exatamente um marcador <nome> • Define uma estrutura de dados
Web SemânticaCamada XML + XMLS HTML XML XMLS
Web SemânticaCamada RDF – Sentido por conexão • Temos sintaxe, mas não semântica; • Sentido: • O sentido se estabelece através de relações entre as coisas; • Só podemos definir formalmente o sentido de uma palavra com outras palavras;
Web SemânticaCamada RDF • RDF – Resource Description Framework • É um modelo de dados para referenciar objetos e como eles estão relacionados; • Representado usando a sintaxe XML; • Descreve os recursos através de declarações;
Propriedade Recurso Valor Declaração Web SemânticaCamada RDF • Declarações são triplas(sujeito,predicado,objeto): • Recurso tem propriedades que têm valores;
Web SemânticaCamada RDF • Declarações RDF podem ser vistas como grafos direcionados e rotulados: http://www.paleo.org/dinos.html editora título autor http://www.edissauros.com.br horacio@paleo.org Vida dos Dinossauros
Web SemânticaCamada RDF • Descrição RDF: <?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc=" http://purl.org/dc/elements/1.1/"> <rdf:Description rdf:about="http://www.paleo.org/dinos.html"> <dc:title> Vida dos Dinossauros </dc:title> <dc:creator rdf:resource=“mailto:horacio@paleo.org"/> <dc:publisher rdf:resource="http://www.edissauros.com.br"/> </rdf:Description> </rdf:RDF>
Web SemânticaCamada RDFS • RDF Schema: • Criação de um modelo para recursos de determinada categoria; • Utiliza o conceito de classes da OO;
Web SemânticaCamada RDFS • Classe RDFS: <?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"> <rdfs:Class rdf:ID="Livro"> </rdfs:Class> <rdfs:Property rdf:ID="Titulo"> <rdfs:domain rdf:resource=”#Livro”/> <rdfs:range rdf:resource=”http://www.w3.org/2000/01/rdf-schema#Literal”/> </rdfs:Property> <rdfs:Property rdf:ID="Autor"> <rdfs:domain rdf:resource=”#Livro”/> <rdfs:range rdf:resource=”http://www.w3.org/2000/01/rdf-schema#Literal”/> </rdfs:Property> </rdf:RDF>
Web SemânticaCamada RDFS • RDFS não fornece detalhes suficientes para descrever recursos: • Não possuiu restrições de existência ou cardinalidade. • Não possui propriedades transitivas, inversas ou simétricas.
Web SemânticaCamada Ontologia • Adiciona mais vocabulário para descrever propriedades e classes: • Relações entre classes; • Cardinalidade; • Igualdade; • Tipagem mais rica de propriedades; • Caracteristicas de propriedades;
Web SemânticaCamada Ontologia • OWL – Web Ontology Language