390 likes | 545 Views
Web Semântica. Franklin de Souza Ramalho DSC-CCT-UFCG fsr@cin.ufpe.br http://www.cin.ufpe.br/~fsr. O que será abordado?. Motivação Estudo de caso: engenhos de busca Web Semântica Introdução Arquitetura Ferramentas Aplicações Considerações Finais. Motivação.
E N D
Web Semântica Franklin de Souza Ramalho DSC-CCT-UFCG fsr@cin.ufpe.br http://www.cin.ufpe.br/~fsr Franklin Ramalho DSC-CCT-UFCG
O que será abordado? • Motivação • Estudo de caso: engenhos de busca • Web Semântica • Introdução • Arquitetura • Ferramentas • Aplicações • Considerações Finais Franklin Ramalho DSC-CCT-UFCG
Motivação “WWW: espaço onde a informação tem um significado bem definido, facilitando a cooperação entre pessoas e agentes computacionais” (Tim Berners Lee) Enfoque da Web atual é na comunicação humana Visão de Berners Lee ainda não foi alcançada Franklin Ramalho DSC-CCT-UFCG
Motivação • Páginas Web atuais: HTML • HTML • Define apenas elementos de apresentação de texto e elementos gráficos • Não agrega nenhuma semântica aos dados • Dados apresentados em linguagem natural • Não possui flexibilidade Franklin Ramalho DSC-CCT-UFCG
Motivação Franklin Ramalho DSC-CCT-UFCG
Motivação <meta NAME="Author" CONTENT="Jacques Robin"> <meta NAME="Description" CONTENT="Personal HOme-page of Jacques Robin professor"> … <h3><font face="Arial">Research Interests</font></h3> <ul> <li> Artificial Intelligence </li> <li> Multi-Agent Systems </li> <li> Computational Linguistics </li> <li> NLP </li> <li> Hypertext Generation </li> <li> Intelligent Databases </li> <li> Logic Programming </li> <li>Data Warehousing and OLAP</li> </ul> Franklin Ramalho DSC-CCT-UFCG
Motivação • Dificuldade por parte dos agentes computacionais em tratar a informação na Web • Recuperação de Informação (engenhos de busca) • Comércio eletrônico • Integração da Informação • Chat-Bots • Web Services • Comunicação entre agentes … Franklin Ramalho DSC-CCT-UFCG
Estudo de Caso: o problema dos Engenhos de Busca • Engenhos de Busca • Busca baseada em palavras-chave • Robôs realizam download das páginas Web • Indexadores extraem termos chaves das páginas • Interface de consulta recebe termos que são comparados com a base de termos indexados Franklin Ramalho DSC-CCT-UFCG
Estudo de Caso: o problema dos Engenhos de Busca Baixa precisão Baixa Cobertura Franklin Ramalho DSC-CCT-UFCG
Estudo de Caso: o problema dos Engenhos de Busca • Como coletar a informação desejada precisamente? • Como coletar informação distribuída? • Como coletar informação implícita? • Como realizar consultas sofisticadas? • Como diminuir o esforço humano? Franklin Ramalho DSC-CCT-UFCG
Web Semântica Franklin Ramalho DSC-CCT-UFCG
Web Semântica • Extensão da Web atual • Informação estruturada e com semântica bem definida • Agentes computacionais capazes de processar e entender os dados • Facilita a automação, integração e distribuição dos dados • Visão de Tim Berners Lee é alcançada: Cooperação entre pessoas e agentes computacionais Franklin Ramalho DSC-CCT-UFCG
Arquitetura Ontologia Ontologia Ontologia Engenho de Busca … E-commerce Web Semântica Camada Lógica Regras de Inferência Camada de Esquema Camada de Estrutura Dados Franklin Ramalho DSC-CCT-UFCG
Camada de Estrutura • Responsável por estruturar os dados e definir seu significado • Tecnologia já vinha sendo estudada há algum tempo por pesquisadores de IA (LOOM, LISP, etc) • Sistemas centralizados • Limitação das questões a serem colocadas • Estas limitações não são incorporadas na Web Semântica • Tecnologias atuais: XML e RDF Franklin Ramalho DSC-CCT-UFCG
XML (eXtensible Markup Language) • Meta-linguagem de editoração • Baseada em rótulos que descrevem a estrutura do documento • Separação entre rótulos de descrição e apresentação do conteúdo • Baseado no modelo de árvore • XML é texto Franklin Ramalho DSC-CCT-UFCG
XML <FirstName>Jacques</FirstName> <LastName>Robin</LastName> <Email>jr@cin.ufpe.br</Email> … <Research_Topic> Artificial Intelligence </Research_Topic> <Research_Topic> Multi-Agent Systems </Research_Topic> <Research_Topic> Computational Linguistics </Research_Topic> <Research_Topic> NLP </Research_Topic> <Research_Topic> Hypertext Generation </Research_Topic> <Research_Topic> Intelligent Databases </Research_Topic> … <Research_Topic> Data Warehousing and OLAP </Research_Topic> … Franklin Ramalho DSC-CCT-UFCG
RDF (Resource Definition Framework) • Modelo para descrever recursos • Baseado em um modelo de grafo no lugar de árvore • Sintaxe: (Sujeito, Predicado, Objeto) • Usa XML como sintaxe • Melhora a descoberta, o acesso e o gerenciamento das informações da Web Franklin Ramalho DSC-CCT-UFCG
RDF http://www.cin.ufpe.br Jacques Robin Creator Professor 02-05-2002 http://www.cin.ufpe.br/~jr Date Description Personal home-page … Franklin Ramalho DSC-CCT-UFCG
RDF <rdf:RDF xmlns:rdf=http://www.w3.org/1999/02/22-rdf-syntax-ns# xmlns:dc=http://pur1.org/metadata/dublin_core# > <rdf:Description about=http://www.cin.ufpe.br/~jr> <dc:Creator>Jacques Robin</dc:Creator> <dc:Date>05-02-2002</dc:Date> <dc:Description>Personal home-page …</dc:Description> <Professor rdf:resource=“http://www.cin.ufpe.br”/> </rdf:Description> </rdf:RDF> Franklin Ramalho DSC-CCT-UFCG
Arquitetura Camada de Esquema Ontologia Ontologia Ontologia Engenho de Busca … E-commerce Web Semântica Camada Lógica Regras de Inferência Camada de Estrutura Dados Franklin Ramalho DSC-CCT-UFCG
Camada de Esquema • Responsável por definir relações entre os dados • Ontologia: “Entendimento comum e compartilhado de um domínio” • Documento que define formalmente a relação entre termos de um domínio • Uso de ontologias em páginas web torna mais simples a resolução de indefinição ou conflito de terminologia Franklin Ramalho DSC-CCT-UFCG
Camada de Esquema • Elementos de uma ontologia • Hierarquia de conceitos • Relações • Restrições de Integridade • Instâncias dos conceitos • Não existe ainda nenhuma linguagem que contemple todos os conceitos de uma ontologia Franklin Ramalho DSC-CCT-UFCG
Camada de Esquema Ontologia Person Employee :: Person AcademicStaff :: Employee Researcher :: AcademicStaff PhDStudent :: Researcher Employee[ affiliation : Organization; worksAtProject : Project; headOf : Project; headOfGroup : ResearchGroup]. AcademicStaff[ supervises :PhDStudent]. Researcher[ researchInterest : ResearchTopic; memberOf : ResearchGroup; cooperatesWith : Researcher]. Franklin Ramalho DSC-CCT-UFCG
Camada de Esquema • Formalismos para representar ontologias • Ontolingua, LOOM, Flogic, KIF • XMLS • RDFS • DAML • OIL • DAML-OIL • OWL Franklin Ramalho DSC-CCT-UFCG
Camada de Esquema <rdfs:Class rdf:ID="Researcher"> <rdfs:subClassOf rdf:resource="#AcademicStaff"/> <daml:Restriction daml:mincardinality="n" daml:maxcardinality="1"> <daml:onProperty rdf:resource="#researchInterest"/> <daml:toClass rdf:resource="#ResearchTopic"/> </daml:Restriction> </rdfs:subClassOf> </rdfs:Class> <daml:ObjectProperty rdf:ID=“supervises”> <caml:inversOf rdf:resource=“supervisor”/> </daml:ObjectProperty> Franklin Ramalho DSC-CCT-UFCG
Arquitetura Camada Lógica Regras de Inferência Ontologia Ontologia Ontologia Engenho de Busca … E-commerce Web Semântica Camada de Esquema Camada de Estrutura Dados Franklin Ramalho DSC-CCT-UFCG
Camada de Lógica • Responsável por definir mecanismos para fazer inferência sobre os dados • Composta por um conjunto de regras de inferência • Regras de inferência fornecem aos agentes computacionais o poder de raciocinar sobre as estruturas de dados • RuleML, DAML-L, XRML, RFML, URML, AORML … Franklin Ramalho DSC-CCT-UFCG
RuleML • Linguagem independente de padrões proprietários • Abrange regras reativas, dedutivas e de produção • Representação de fatos • Sintaxe XML (versão 0.8 em DTD) Franklin Ramalho DSC-CCT-UFCG
RuleML - exemplo <imp> <_head> <atom> <rel>cooperatesWith</rel> <var>person2</var> <var>person1</var> </atom> </_head> <_body> <atom> <rel>cooperatesWith</rel> <var>person1</var> <var>person2</var> </atom> </body> </imp> Franklin Ramalho DSC-CCT-UFCG
Agentes Computacionais • O verdadeiro valor da Web Semântica representar valor para os seus utilizadores • Agentes computacionais • Compreender o significado e relação entre objetos • Raciocinar sobre eles • Trocar resultados • Trocar provas • Autenticidade e confiabilidade • Assinaturas difitais • Crenças (estado mental) Franklin Ramalho DSC-CCT-UFCG
Infra-estrutura em camadas para Web Semântica Franklin Ramalho DSC-CCT-UFCG
Ferramentas • Construir páginas Web com semântica é uma tarefa muito laboriosa • Ferramentas de apoio: • Validação XML: XMLSpy … • Construção Ontologias: OilEd, OntoEdit, Protégé … • Anotação de Páginas: OntoMat, OntoAnnotate,UBOT… • Motores de Inferência: LoPix, TRIPLE … Franklin Ramalho DSC-CCT-UFCG
Ferramentas - OntoEdit Franklin Ramalho DSC-CCT-UFCG
Aplicações • Engenho de Busca: OntoBroker • Sistemas de recomendação: MyPlanet • E-commerce: MKBEEM, SMART-EC • NLP: OncoTerm, PANGLOSS, OntoGeneration • Integração da Informação: Ariadne, OBSERVER • Web Services Franklin Ramalho DSC-CCT-UFCG
Considerações Finais • Web mais inteligente! • Grande quantidade de agentes computacionais fazendo uso da WS • Maior sinergia entre diversas comunidades de pesquisa Franklin Ramalho DSC-CCT-UFCG
Considerações Finais • XML – ponto de partida para padronização de conteúdos na comunicação entre agentes computacionais • Markup Languages extensíveis • Markup Languages cada vez mais “verborreicas” • Ferramentas de apoio são necessárias Franklin Ramalho DSC-CCT-UFCG
Considerações Finais • Grupos da W3C ainda trabalham de forma isolada • Necessidade de uma única linguagem que expresse dados e regras para raciocínio sobre estes. • Como prover tratamento de provas e credibilidade? • O que vem por ai? • ?ML, ?ML, ?ML … Franklin Ramalho DSC-CCT-UFCG
Considerações Finais Obrigado!! Franklin Ramalho DSC-CCT-UFCG