200 likes | 416 Views
Distributed System Assignment #6 Research new Technology. Semantic Web. Contents. Motivation Overview of Semantic Web Technology Topic Maps RDF RDF Application Semantic Web Services Real World Cases Conclusion Reference. Motivation-Current Web. 현재 web 의 한계성
E N D
Distributed System Assignment #6 Research new Technology Semantic Web
Contents • Motivation • Overview of Semantic Web • Technology • Topic Maps • RDF • RDF Application • Semantic Web Services • Real World Cases • Conclusion • Reference
Motivation-Current Web • 현재 web의 한계성 • 정보의 증가 : 방대한 양, 다양한 종류 • 텍스트 문서, 이미지, 멀티미디어자료, 응용프로그램, voice 등. • 인간 중심의 정보 보여주기가 목적 (presentation) • 문서와 자료를 인간이 이해하기 쉬운 형태로 표현하는 것이 중요 • 컴퓨터가 정보를 이해하고 가공하기 어렵다. • 검색 엔진에 의존하는 정보검색 • 대부분이 사용자가 원하는 정보를 제공하지 못한다. • 원인 : 다중적인 의미, 잘못된 단어조합, 사용자 선호도를 구분하지 못함 • “Semantic Web” • 정보를 컴퓨터에 의해 재가공하여 사용자가 쉽게 원하는 정보를 활용할 수 있도록 하는 새로운 패러다임
Overview of Semantic Web • What is Semantic Web? • World-Wide-Web의 창시자 Tim Berners-Lee에 의해 창안된 차세대 Web 기술 "The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation." -- Tim Berners-Lee, James • 컴퓨터가 이해할 수 있는 web • contents에 구조화된 부가정보(metadata) 추가 • 풍부한 탐색 및 검색, 데이터 통합, 자동화를 제공 • 통일된 정보공유체제 확립 • 정보(information) 기반 지식(knowledge) 기반
Overview of Semantic Web • Technology • RDF – W3C기반으로 지식 표현 기술 온톨로지 기술로 발전 • Topic Maps – ISO 기반 지식 표현 기술 • Layer of W3C Semantic Web
Technology - Topic Maps • ISO 중심의 semantic web 기술 • ISO/IEC 13250 지식 표현 기술(knowledge representation) 표준 • 기술언어 : XTM(XML Topic Maps) • 정보 자원의 구성, 추출, 네비게이션에 관계하는 새로운 패러다임 • 정보와 지식의 관리를 위한 최적화된 표현양식 제공 정보와 지식의 분산처리, 통합관리에 중점 • 지식층과 정보층의 이중구조 • 정보층 : 특정 주제(Topic)과 주제 간의 연계(Relation)로 구성 • 지식층 : 디지털 컨텐츠 • 발생(occurrence)를 통해 상호연결
Technology - RDF • Resource Description Framework • 특정자원에 대한 구조화된 메타데이터를 기술하는 XML기반 프레임워크 • 상호 이용성(interoperability) • application 간에 정보를 교환하여 다른 컴퓨터에서 이를 처리 • triple 구조 하나의 statement 구성 • 자원: 주어(subject), URI를 이용한 고유 식별대상 • 속성: 술어(predicate), 자원을 정교하게 설명하기 위함. • 속성명 또는 XML namespace에 정의된 URI로 정의 • 속성값: 목적어(object), 다른 URI, 자체가 자원이 될 수 있음.
RDF Technology • URI (Uniform Resource Identifier) • web의 지시자 : 자원의 이름을 지시, 그 내용을 알지 못함 • URL(Uniform Resource Location)이 한 종류 • XML(eXtensible Markup Language) • “문서”에 구조화된 정보를 표현하는 언어 • 구조화된 정보 = 컨텐츠 + 역할(속성) • tag를 사용자가 정의 가능: XML namespace • Document Type Definition (DTD) or XML schema를 이용 • 같은 데이터를 사용자 정의에 따라 여러 다른 구조로 표현 가능 • 문제 : 컴퓨터가 각기 다르게 정의한 tag를 어떻게 구분할 것인가?
RDF Technology • XML 구조 • RDF 구조- XML namespace <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:love="http://love.example.org/terms/" > <rdf:Description rdf:about="http://aaronsw.com/"> <love:reallyLikes rdf:resource="http://www.w3.org/People/Berners-Lee/Weaving/" /> </rdf:Description> </rdf:RDF>
RDF Technology • Why RDF than XML? • XML tag를 컴퓨터가 자동해석, 의미연관성 파악, 추론 어려움 • “문서”가 아닌 그 안에 담긴 “데이터(Resource, metadata)”를 표현 • RDF에 XML schema를 적용하여 쉽게 serialization statement 해석 정보 제공 • 단순한 구조 : triples • parser를 이용하여 정보를 명확하게 model에 매핑 가능 • HTML 정보를 RDF 정보와 병렬적으로 처리 가능 <XML serialization>
RDF Technology • RDF Schema • 자원이 속한 클래스, 클래스 간의 관계, 속성간의 관계 정의 • RDF statement에 사용될 용어와 타입 정의 • 클래스(class) : 자원과 속성 • 서브클래스(subClassOf) : 특정 application의 schema
RDF Technology • Ontology • RDF Schema에 “분류”와 “논리적인 추론”을 부과하여 기계가 web의 의미를 해석하는 semantic web을 완성 • 특정 주제 영역의 도메인을 계층구조로 나타냄 : 용어, 관계 정의 • 도메인그룹 내에서 합의된 지식 • web ontology • 다른 데이터베이스를 사용하는 동일한 의미의 2개의 용어가 같은 것인지 비교, 결합하기 위한 프로그램 • application사이에 web 기반 지식을 생성, 처리, 공유, 재생산 • 종류 • DAML+OIL, SHOE, OWL (Web ontology language)
RDF Application • DAML+OIL: DARPA Agent Markup Language +OIL • modeling primitives를 가진 확장된 W3C기반의 언어 • 구성 : headers, class elements, property elements, instances • SHOE : Simple HTML Ontology Extension • HTML 문서와 다른 web 문서에 컴퓨터가 이해하는 semantic 지식을 결합 • agent를 이용하여 web pages와 documents의 의미있는 정보를 수집
RDF Application • OWL (Web ontology language) • DAML+OIL에서 파생된 web ontology 언어 • 속성과 클래스를 기술할 다양한 의미 표현 어휘를 제공 • 클래스 간 관계, 관계차수, 동치성, 풍부한 속성타입, 속성 특징, 열거형 클래스 등. • 3개의 하위 언어를 구성 • OWL Lite: 클래스 분류계층과 간단한 제약사항 표현이 필요한 사용자들을 위한 언어 • OWL DL: 계산학적 완전성(모든 결론 계산될 수 있음), 결정가능성(유한시간 내 완료)을 유지하여 최대의 표현력 요구하는 언어 • OWL Full: 최대의 표현력과 RDF의 모든 문법을 활용할 수 있는 언어
Semantic Web Services • SHOE application • semantic search • SHOE 검색 엔진 • the knowledge annotator • SHOE를 포함한 web page에 그래픽한 주석을 달도록 하는 자바 프로그램 • Exposé • SHOE를 포함하는 web page를 검색하여 관련 지식을 수집하는 web 로봇 • PIQ (Parka Interface for Queries) • Exposé에 의해 발견된 SHOE 정보를 비주얼하게 질의하도록 하는 자바 툴
Semantic Web Services • MusicBrainz (www.musicbrainz.org) • 음악정보를 생성하는 음악 메타 데이터베이스 커뮤니티 • CD Player program • Musicbrainz가 CD들을 식별하고 CD에 대한 정보를 제공할 때 이용 • Musicbrainz Tagger • 개인 음악자료의 메타데이터 테그를 자동적으로 식별하고 생성 < MusicBrainz RDF Metadata >
Real World Cases • RSS (Really Simple Syndication) • 뉴스, 블로그 사이트에서 주로 사용하는 XML기반 컨텐츠 표현 방식 • RSS 관련 프로그램을 이용하여 최신정보 자동 수집 RSS 리더프로그램으로 읽고, 다른 형식으로 이용 가능 • ex) Explorer 7 – RSS 리더(구독기) • Google Desktop - 개인 검색 환경 • 웹 검색 뿐 아니라 개인 데스크탑에 대한 검색 • 검색기술 평가 • 현재 : 검색의 응답률(발견한 정보의 양)과 관련있는 정도로 평가 • 미래 : 사용자 별 정확도 파악(검색패턴, 사용자 선호도 반영) • 유비쿼터스 단말기로 확장, 공유 기기 간의 정보검색 가능
Real World Cases • Ajax (Asynchronous JavaScript +XML) • 자바스크립트 렌더링 엔진을 이용한 기술 • Ajax를 이용하여 한번에 브라우저 읽어들여 사용자 이벤트를 자바스크립트가 스스로 처리 • XML자료를 xmlhttp로 관리하므로 다시 페이지를 불러들일 필요없음 • 서버와의 통신은 백그라운드로 진행 • 이벤트마다 서버와의 통신으로 인한 overhead(대기시간)를 줄임 • Application (http://www.google.com) • google gmail – 빠른 로딩, 비동기적 스크립트처리(추가옵션) • google maps – 별도의 설치없이 HTML내에서 지도검색 • google 개인화 – HTML의 재배치 • yahoo!, amazon
Conclusion • Semantic Web은 지식(knowledge) 기반 차세대 web 기술 • W3C 기반 RDF + ontology 기술 표준으로 발전 • 의미있는 정보의 검색, 추론 • 컴퓨터 스스로 지식을 생산 • 이미 상용화된 많은 웹서비스에 기술 적용, 점차 고도화되고 변형된 기술들이 등장 • XML, RDF, DAML+OIL, SHOE • OWL, RSS, Ajax 등 • web ontology (OWL)의 표준화와 함께 온톨로지 기술 발전 가능성 기대
Reference • Wikipedia • http://en.wikipedia.org/wiki/Semantic_Web • The Semantic Web: An Introduction • http://infomesh.net/2001/swintro/ • The Semantic Web In Breadth • http://logicerror.com/semanticWeb-long • 웹 2.0 시대의 기회, 시맨틱 웹, 김태중, 2006, 디지털미디어리서치 • http://www.dal.co.kr/chair/semanticweb/sw.html • Semnatic Web Overview, Prof.Joongmin Choi, Intelligent System Lab,. Hanyang Univ.