90 likes | 222 Views
Ontology-Based Information Extraction:. Marcin Bialek. Internet dzisiaj. Explozja danych 45 GB danych produkowanych przez każdą osobę na świecie 988,000,000,000,000,000,000 bajtów danych dostępnych w sieci w 2010 60% wzrostu rocznie
E N D
Ontology-Based Information Extraction: Marcin Bialek
Internet dzisiaj • Explozja danych • 45 GB danych produkowanych przez każdą osobę na świecie • 988,000,000,000,000,000,000 bajtów danych dostępnych w sieci w 2010 • 60% wzrostu rocznie • 1,800,000,000,000,000,000,000 (1,800 Exa Bajtów) bajtów danych będzie dostępnych na koniec 2011 (zgodnie z danymi IDC statistics)
Internet dzisiaj (2) • Sieć 2.0 • Sieć pełna danych generowanych przez użytkownika • Szacuje się że na koniec roku 2013, 155 milionów użytkowników (tylko w USA) będzie używać danych stworzonych przez innych. • 115 milionów użytkowników będzie aktywnie tworzyło zasoby WWW. • Wzrost dzielenia się danymi jest obecnie 15 razy większy niż wzrost ilości pobieranych danych
Wyszukiwanie "...Search today is still kind of a hunt, where you get all these links, and as we teach software to understand the documents, really read them in the sense a human does, you will get answers more directly..." - Bill Gates.
Wyszukiwarka Google Zapytanie: „Which Nobel prize winners were born before Albert Einstein?” Google - 24,600,000 rezultatów: - Albert Einstein – Biography - Albert Einstein - Wikipedia, the free encyclopedia - Jewish Nobel Prize Winners in Physics - Nobel Prize Winners Hate School (Learn in Freedom!) - HHF Factpaper: Jewish Nobel Prize Winners; Part II: Physics Dlaczego? Ponieważ zapytania w google są wykonywane na podstawie słów kluczowych a nie ich semantyki.
Rozwiązanie problemu niedokładnych informacji • Idea Web 3.0 – TimBerners Lee. • Semantyczna ekstrakcja informacji.
Ekstrakcja Informacji • Redukcja informacji w dokumencie pozwalająca na przekształcenie go do formatu zrozumiałego przez maszyny. • Ściśle powiązane z rozpoznawaniem języka naturalnego. • Coraz więcej ludzi widzi w EI nie tylko narzędzie do bezmyślnej analizy tekstu, lecz kompleksowe rozwiązanie dostarczające semantycznych danych.
Yagovs. Google Zapytanie: „Which Nobel prize winners were born before Albert Einstein?” Yago - 1 rezultat - Johannes_Stark(15 April 1874 – 21 June 1957) was a German physicist, and Physics Nobel Prize laureate who was closely involved with the Deutsche Physik movement under the Nazi regime.