270 likes | 398 Views
Łódź, 5 listopada 2012 roku. Technologie. mgr inż. Tomasz Węgliński email: tweglinski@kis.p.lodz.pl www: http://www.tweglinski.pl. WYKŁAD 12. Semantic Web. 2/34. Plan wykładu. Na wykładzie omówimy sobie następujące zagadnienia: Bariery współczesnego Internetu
E N D
Łódź, 5 listopada 2012 roku Technologie mgr inż. Tomasz Węglińskiemail: tweglinski@kis.p.lodz.plwww: http://www.tweglinski.pl
WYKŁAD 12 Semantic Web 2/34
Plan wykładu • Na wykładzie omówimy sobie następujące zagadnienia: • Bariery współczesnego Internetu • Co to jest Semantic Web i jakie są jego idee? • Przykładowe wizje działania • Semantyczny Internet czy sztuczna inteligencja? • Kluczowe pojęcia i technologie • Warstwowość technologii i struktura działania • Podsumowanie • Literatura 3/34 Wykład 12: Semantic Web
BarieryWWW • Powstanie sieci WWW (ang. World Wide Web) na zawsze zmieniło sposób komunikacji międzyludzkiej i biznesowej. • Podstawowe zastosowana Internetu to: • wyszukiwanie informacji • zbieranie informacji (często z wielu źródeł) • komunikacja z innymi ludźmi (portale społecznościowe, blogi etc.) • przeszukiwanie internetowych baz filmów, muzyki, książek… • przeglądanie ofert firmowych • zakupy w sieci i aukcje internetowe • wypełnianie formularzy bankowych, sklepowych, urzędowych… • Treści prezentowane w Internecie są przekazywane w sposób przyjazny dla odbiorcy. • Programiści stron i aplikacji WWW przykładają bardzo dużą wagę do tworzenia jak najbardziej „przyjaznego” interfejsu użytkownika. 4/34 Wykład 12: Semantic Web
BarieryWWW • Sukces Internetu został osiągnięty w dużej mierze dzięki tzw. wyszukiwarkom internetowym (Google, Yahoo, Alta Vista etc…). • Użytkownicy korzystający z wyszukiwarek na co dzień borykają się jednak z wieloma z problemami typu: • Dużo wyników, mało interesujących nas treści • Mało wyników lub ich brak • Wrażliwość na słownictwo (poprawność słów kluczowych) • Szeroki rozrzut informacji (kolekcjonowanie informacji z wielu stron) • Czas poświęcony na zbieranie informacji jest za długi (!) • Trudność z oceną wiarygodności informacji na stronie (wpisy na forum, opinie użytkowników produktu) „The amount of Web content outspaces technological process” -- G. Antoniou, F. van Harmelen, The Semantic Web Vision, MIT, 2004 5/34 Wykład 12: Semantic Web
BarieryWWW Dlaczego wyszukiwarki internetowe mają małą skuteczność? • Analiza języka naturalnego jest bardzo trudna • Treści przekazywane w Internecie są „nieprzyjazne maszynowo” • Prosty przykład: • I am a professor of computer science. • I am a professor of computer science, you may think. Well… …a może użyć technik przetwarzania tekstu, sztucznej inteligencji…? 6/34 Wykład 12: Semantic Web
IdeaSemantic Web • Idea Semantic Web (tłum.: Semantyczny Internet): To nie treści (dane) są złe, tylko sposób ich przetwarzania. • Treści powinny być przekazywane aplikacji w sposób „przetwarzalny maszynowo” (ang. machine-processable) • Podejście to jest ewolucją, nie rewolucją dla współczesnego Internetu • Semantyczny Internet to marzenie i wizja jego twórcy – Tima Bernersa – Lee • Organizacje rządowe wspierają ideę Semantic Web: • Europen Union’s Sixth Framework Programme • DARPA Agent Markup Language (DAML) 7/34 Wykład 12: Semantic Web
Przykładowewizje działania Niemal wszystkie obszary działania oraz zastosowania współczesnego Internetu wymagają usprawnienia. Potrzeba wprowadzenia w życie idei i wizji Semantic Web jest widoczna na co dzień zarówno w sferze biznesu jak i prywatnej. • Zarządzanie wiedzą (ang. Knowledge Management)- to próba jak najlepszego wykorzystania wiedzy, która jest dostępna w organizacji, tworzenie nowej wiedzy oraz zwiększanie jej zrozumienia. • Aktualne problemy: • uciążliwe wyszukiwanie, kolekcjonowanie i gromadzenie informacji • czasochłonne dotarcie do już zgromadzonej informacji, aktualizacje • prezentowanie informacji (różni odbiorcy, różne potrzeby) Wizja Semantic Web: Wiedza zostanie zorganizowana w tzw. semantyczne przestrzenie pojęciowe (ang. conceptual spaces), zgodnie z ich znaczeniem. 8/34 Wykład 12: Semantic Web
Przykładowewizje działania B2C E-commerce (ang. Business-to-consumer Electronic Commerce)- to nazwa relacji występujących pomiędzy firmą a klientem końcowym, często realizowanych za pomocą Internetu (przegląd ofert, wybór, kupno). Przykłady: Allegro, Ebay, Amazon, Morele… • Aktualne problemy: • czasochłonne przeglądanie ofert • nie sposób przejrzeć i wybrać wszystkich dostępnych ofert • przed zakupem często nie znamy cen rynkowych • często kupujemy „na ślepo” – im drożej tym musi być lepiej… • Przeglądanie ofert wspomagają tzw. przeglądarki cenowe (ang. shopbots). Posiadają one jednak wady charakterystyczne dla typowych wyszukiwarek internetowych. Przeglądarki cenowe nie są w stanie przeanalizować wszystkich cennych informacji, np. kosztów przesyłki i czasu dostawy. 9/34 Wykład 12: Semantic Web
Przykładowewizje działania B2C E-commerce (ang. Business-to-consumer Electronic Commerce) Wizja Semantic Web: Opracujmy inteligentne programy, tzw. agentów(ang. software agents), którzy będą umieć interpretowaćinformacje o produkcie oraz politykę działania firmy. • Zalety (zadania) agentów internetowych są oczywiste: • precyzyjny proces zbierania informacji o produkcie i producencie • pobieranie, kolekcjonowanie oraz interpretowanie opinii klientów • przeprowadzenie automatycznych negocjacji ofert (z innymi agentami) zgodnie z ustaleniami i preferencjami klienta 10/34 Wykład 12: Semantic Web
Przykładowewizje działania B2B E-commerce (ang. Business-to-Business Electronic Commerce)- to nazwa relacji występujących pomiędzy firmami, określana często mianem "klasycznego" e-biznesu. • Aktualne problemy: • transfer danych za pomocą EDI (ang. Electronic Data Interchange) jest skomplikowany i zrozumiały tylko dla ekspertów • EDI jest kosztowny i nie jest łatwy w integracji z innymi aplikacjami biznesowymi • język HTML używany do prezentacji danych w sieci WWW nie posiada ustalonej struktury ani semantyki (problem wyszukiwania informacji) • wykorzystanie dokumentów XML do komunikacji B2B wymaga ustalenia wspólnej, jednolitej struktury danych oraz nazewnictwa Wizja Semantic Web: Niezgodność terminologii oraz struktury danych zostanie wyeliminowana przez tzw. modele abstrakcji danych oraz ich interpretery (ang. translation services) z wykorzystaniem agentów. 11/34 Wykład 12: Semantic Web
Przykładowewizje działania Agenci personalni (ang. Personal Agents) • to specjalistyczne programy komputerowe, których zadaniem jest ułatwienie codziennej pracy, poprzez automatyczne lub półautomatyczne wykonywanie powierzonych im zadań w Internecie. • Przykład Michael’a: • Michael miał wypadek samochodowy, po którym chciałby udać się do najlepszego specjalisty w mieście, zlecając jego wybór swojemu personalnemu Agentowi. • Michael jak każdy człowiek ma swoje osobiste preferencje i wie jakie cechy powinien posiadać jego lekarz. • Michael jest także bardzo zajętym człowiekiem, nie może umawiać się w dowolnym terminie. Wizja Semantic Web: Z kilku ofert przedstawionych przez Agenta, Michael z zadowoleniem wybiera swojego lekarza, blisko domu i w przystępnej cenie. Dodatkowo jest już umówiony na pierwszą wizytę! 12/34 Wykład 12: Semantic Web
SW vs. AI Semantyczny Internet == Sztuczna Inteligencja ?? Większość technologii używanych do realizacji założeń Semantic Webopiera się na dotychczasowych osiągnięciach sztucznej inteligencji. • Sztuczna inteligencja (ang. Artificial Intelligence) to dział informatyki, którego przedmiotem jest badanie reguł rządzących inteligentnymizachowaniami człowieka, tworzenie modeli formalnych tych zachowań, a w rezultacie programów komputerowych symulujących te zachowania. • Zasadnicza różnica: • AI --- podejmowanie decyzji za człowieka • SW --- wspomaganie decyzji podejmowanych przez człowieka „The realization of the Semantic Web vision doesnot rely on human-level intelligence; the challenges are approached in different way” -- G. Antoniou, F. van Harmelen, The Semantic Web Vision, MIT, 2004 13/34 Wykład 12: Semantic Web
Podstawowepojęcia SW • Współcześnie, głównym zadaniem twórców Semantycznego Internetujest integracja, standaryzacja, rozwój narzędzi użytkowych oraz wprowadzenie ich do codziennego użytku. • Do słownika podstawowych terminów związanych z SW należą: • metadane (ang. explicit metadata) • ontologie (ang. ontologies) • logika (ang. logic) • agenci (ang. agents) Każdy z wyżej wymienionych terminów kryje w sobie zestaw nowoczesnych technologii pozwalających na spełnienie wymagańi założeń idei Semantycznego Internetu. 14/34 Wykład 12: Semantic Web
Standardowedane • Metadane (ang. explicit metadata) • Współczesne podejście (HTML): • <h1>Agilitas Physiotherapy Centre</h1> • Welcome to the home page of the Agilitas Physiotherapy Centre. • Do you feel pain? Have you had an injury? Let our staff • Lisa Davenport, Kelly Townsend (our lovely secretary) • and Steve Matthews take care of your body and soul. • <h2>Consultation hours</h2> • Mon 11am - 7pm<br> • Tue 11am - 7pm<br> • Wed 3pm - 7pm<br> • Thu 11am - 7pm<br> • Fri 11am - 3pm<p> • But note that we do not offer consultationduring the weeks of the • <a href=". . .">State Of Origin</a> games. • Ustandaryzowane dane (XML): • <company> • <treatmentOffered> Physiotherapy</treatmentOffered> • <companyName>Agilitas Physiotherapy Centre</companyName> • <staff> • <therapist>Lisa Davenport</therapist> • <therapist>Steve Matthews</therapist> • <secretary>Kelly Townsend</secretary> • </staff> • </company> Czytelne dla ludzi, nieczytelne dla maszyn… Oficjalny standard danychw przyszłości, wymaga „adaptacji”… 15/34 Wykład 12: Semantic Web
Ontologie • Ontologie (ang. ontologies) • w sensie informatycznym to formalna reprezentacja pewnej dziedziny wiedzy, na którą składa się zapis zbiorów pojęć (ang. concept) i relacji między nimi. • zapis ten tworzy schemat pojęciowy, który stanowi opis danej dziedziny wiedzy. • schemat pojęciowy jest podstawą do wnioskowania o właściwościach opisywanych ontologią pojęć. • wywodzą się z dziedziny sztucznej inteligencji (podstawa dla SW) • Dla przykładu ontologie mogą zawierać takie informacje jak: • właściwości – X uczy Y • ograniczenia wartości – Tylko pracownicy wydziału mogą prowadzić kursy • rozłączności – Pracownicy wydziałowi i ochrony nie są ze sobą powiązani • specyfikacje logicznych powiązań między obiektami – Każda Katedra musi posiadać co najmniej 10 pracowników wydziałowych 16/34 Wykład 12: Semantic Web
Ontologie wprowadzają porządek znaczeniowy w obrębie domeny, pomagając uniknąć konfliktów nazw (podobnej terminologii). Ontologie Hierarchia znaczeniowa w obrębie domeny (przykład Uniwersytetu) 17/34 Wykład 12: Semantic Web
Ontologie • Korzyści z zastosowania ontologii: • łatwiejsza organizacja i nawigacja po stronie (menu, mapy strony…) • zwiększenie skuteczności wyszukiwarek, wyszukiwanie powiązań zamiast słów kluczowych • wspomaganie procesu wyszukiwania – sugestia bardziej lub mniej złożonych zapytań • Technologie używane do opisu ontologii: • XML – ustandaryzowane dane, brak powiązań • XML Schema – ograniczenia specyficzne dla danych • RDF – model danych dla obiektów, relacje pomiędzy obiektami • RDF Schema – opis (pojęciowy) właściwości i klas obiektów RDF • OWL – rozszerzenie RDF, z bogatszym słownikiem i składnią języka Podstawą wszystkich wymienionych technologii jest język XML. 18/34 Wykład 12: Semantic Web
Logika Logika (ang. logic) • to dział matematyki, którego przedmiotem są formalne teorie matematyczne i ich modele, dowody oraz zasięg matematycznych rozumowań. • przyczyniła się do rozwoju technologii komputerowych, w tym informatyki teoretycznej • osiągnięcia logiki formalnej wykorzystywane są w sztucznej inteligencji • Przykład wyprowadzeń logicznych: 19/34 Wykład 12: Semantic Web
Logika Zastosowanie zasad logiki w Sematic Web pozwoli na: • podejmowanie decyzji przez agentów i wykonywanie określonej akcji • możliwość odtworzenia logicznego procesu „myślenia” agenta Efekt Zwiększone zaufanie klienta do agenta SW • możliwość weryfikacji decyzji jednego agenta przez drugiego Agent I: Posiadasz dług w wysokości 80 zł Agent II: potwierdzam 20/34 Wykład 12: Semantic Web
Aplikacje agentowe • Agenci (ang. agents) • to autonomiczne oprogramowanie, aktywnie wspomagające decyzje użytkownika oraz wykonujące określone przez niego zadania • Podstawowy proces działania agenta: • Definicja zadania i preferencji użytkownika • Kolekcjonowanie informacji i zasobów sieciowych • Komunikacja z innymi agentami • Porównywanie znalezionych informacji z preferencjami użytkownika • Podjęcie decyzji, wybór ofert • Przedstawienie rezultatów działań użytkownikowi • Agenci wykorzystują wszystkie omówione technologie SW: • Metadane – kolekcjonowanie informacji z zasobów sieciowych • Ontologie – wspomaganie działania wyszukiwarek, interpretacja wyników, komunikacja z innymi agentami • Logika – przetwarzanie zebranych informacji, podejmowanie decyzji 21/34 Wykład 12: Semantic Web
Aplikacje agentowe Użytkownik w sieci WWW… W przyszłości… Dziś… 22/34 Wykład 12: Semantic Web
Warstwowośćtechnologii Rozwój technologii Semantic Web podzielony jest na kroki. Każdy krok buduje kolejną warstwę modelu na szczycie poprzedniej. • Strukturę warstwową Semantic Web określa się mianem „warstwowego placka” (ang. layer cake). 23/34 Wykład 12: Semantic Web
Warstwowośćtechnologii W budowie kolejnych warstw modelu Semantic Web muszą byćspełnione dwie zasadnicze reguły: • Kompatybilność wsteczna (ang. downward compatibility) • aplikacje pracujące w wyższej warstwie muszą umieć interpretować i wykorzystywać informacje zapisane w niższych warstwach modelu. • Częściowe rozumienie w przód (ang. upward partial understanding) - aplikacje pracujące w niższej warstwie muszą posiadać zdolność do co najmniej częściowego wykorzystania informacji z wyższych warstw modelu. 24/34 Wykład 12: Semantic Web
Warstwowośćtechnologii • Zależności pomiędzy warstwami modelu Semantic Web: • XML, XML Schema + potrafi przechowywać dane w ustandaryzowany sposób, z użyciem pojęć (nazw elementów) zdefiniowanych przez użytkownika. + bierze udział w procesie przesyłu danych przez sieć WWW. • RDF, RDF Schema + podstawowy model danych, zawiera opis zależności między obiektami + nie jest zależny od XML, lecz posiada jego składnię + RDF Schema bazuje na RDF i jest uboższą wersją OWL • OWL + jest rozszerzeniem możliwości RDF+ stanowi podstawę do wyprowadzeń logicznych • Logic+ wykorzystuje i rozszerza możliwości ontologii do budowy logiki aplikacji • Proof + weryfikuje proces dedukcji oraz działania niższych warstw modelu • Trust + bazując na mechanizmach zabezpieczeń, certyfikacjach, podpisach elektronicznych, ocenie i zaufaniu użytkowników zatwierdza efekt końcowy. 25/34 Wykład 12: Semantic Web
Podsumowanie • Semantyczny Internet jest inicjatywą mającą na celu wzbogacenie dotychczasowych technologii i sposobu użytkowania Internetu • Główną ideą SW jest wykorzystanie informacji „przetwarzalnej maszynowo” (ang. machine-processable) • Podstawowe składniki SW to metadane, ontologie, logika i zależności oraz inteligentni agenci • Rozwój technologii SW przebiega warstwowo (ang. layer cake) „The Web will only achieveits full potential when users have trust in its operations (security) and in thequality of information provided” -- G. Antoniou, F. van Harmelen, The Semantic Web Vision, MIT, 2004 33/34 Wykład 12: Semantic Web
Literatura • Książki • Grigoris Antoniou, Frank van Harmelen, A Semantic Web Primer, 2nd Edition, The MIT Press, 2008 • John Hebeler, Matthew Fisher, Semantic Web Programming, Wiley, 2009 • John Davies, Semantic Web Technologies: Trends and Research in Ontology-based Systems, Wiley, 2006 • T. Berners-Lee, with M. Fischetti. Weaving the Web. San Francisco: Harper, • 1999. • Źródła internetowe • Semantic Web Primer: http://www.ics.forth.gr/isl/swprimer/presentation.htm • W3C Semantic Web Activity: http://www.w3.org/2001/sw/ • Semantyczny Web: http://semantictechnology.eu/ • W3Schools Semantic Web: http://www.w3schools.com/web/web_semantic.asp 34/34 Wykład 12: Semantic Web