60 likes | 183 Views
Research Meeting. 2009-07-27 Jaeseok Myung. Summary. 연구 Supporting realtime access to large RDF data using open-source 기타 가을학기 수업 조교 학부 DB, 웹정보시스템 , 고급컴퓨터공학세미나 수업 수강신청 ( 분산관련 2 과목 , 논문연구 2 과목 ). Big Picture. SPARQL Algebra. Rule. Data Input. Query Mgr. RDF OWL. Converter.
E N D
Research Meeting 2009-07-27 JaeseokMyung
Summary • 연구 • Supporting realtime access to large RDF data using open-source • 기타 • 가을학기 수업 조교 • 학부 DB, 웹정보시스템, 고급컴퓨터공학세미나 • 수업 • 수강신청 (분산관련 2과목, 논문연구 2과목) Center for E-Business Technology
Big Picture SPARQL Algebra Rule Data Input Query Mgr. RDFOWL Converter Parser Planner Optimizer SPARQL Indexer RDB Executor Visualizer Metadata Hadoop Index Statistics HDFS MR Center for E-Business Technology
진행상황 • Data • LUBM 온톨로지(OWL) => 트리플 변환 후 HDFS에 저장 • Query • SPARQL => 쿼리 플랜 생성 (Jena 프레임워크) • Triple Pattern 처리 MR 구현 • SELECT ?xWHERE { ?x rdf:typeub:UndergraduateStudent .} • (project (?x) (bgp (triple ?x <rdf:type> <UndergraduateStudent>))) Center for E-Business Technology
예정사항 • 테스트를 위한 인터페이스 통합 (목) • Jena 표준 인터페이스와 연동 • Web 인터페이스를 통한 테스트서버 구축 • Operator에 대한 MR 구현검토 (다음 주) • A triple pattern => Bagic Graph Pattern • Projection, Filter Constraints • 구현 범위 및 일정 확정 Center for E-Business Technology
구현 범위 및 의의 • SPARQL Algebra의 연산자에 대한 MR식 접근 • 필요한가? • 어떤 연산자를 MR로 구현하는게 좋을까? • Ex) projection과 같이 vertical partition에 대한 연산은 중앙 처리 방식이 더 좋을 수 있지만, BGP 처리와 같이 horizontal partitioning된 데이터에 대한 처리는 MR이 더 좋을 것 같다. • 가능한가? • MR은 제약적인 프로그래밍 모델이므로.. 각 연산자의 구현가능여부에 대해 고민할 필요 있음 • 경쟁력? • Virtuous RDF, YARS2, DARQ, HIVE등과 기반 기술 및 성능 비교 • 주요 contribution을 결정하고 부각시킬 필요 Center for E-Business Technology