1 / 22

Linked Open Data Annual Conference

Linked Open Data Annual Conference. NDSL 과 Linked Open Data. 사업개요. 1. DB 객체화. 2. 콘텐츠 구축. 3. 맺음말. 4. 정보서비스센터 NDSL 서비스실 김완종. 사업 개요 및 추진 배경. 1 .1. 국가 과학기술 경쟁력 제고를 위한 차세대 과학기술정보 서비스 모형 개발. 서비스 요구. 데이터의 개방 및 공유 ( 샘플 LOD 구축 ). 차세대 분석형 정보 서비스. 최적의 검색 서비스.

dea
Download Presentation

Linked Open Data Annual Conference

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Linked Open Data Annual Conference NDSL과 Linked Open Data 사업개요 1 DB 객체화 2 콘텐츠 구축 3 맺음말 4 정보서비스센터 NDSL서비스실 김완종

  2. 사업 개요 및 추진 배경 1.1 국가 과학기술 경쟁력 제고를 위한 차세대 과학기술정보 서비스 모형 개발 서비스 요구 데이터의 개방 및 공유 (샘플 LOD 구축) 차세대 분석형 정보 서비스 최적의 검색 서비스 고부가 콘텐츠화(객체형DB 설계) • Legacy DB 구조의 제약 • 고품질 데이터 객체화, 마이크로화 필요 • 마이크로 DB 스키마 구축 • NDSL 데이터 공유 필요 • Linked Open Data 자동 변환기술 개발 • 콘텐츠별공개ㆍ공유가능 범위 설정 및 지침 마련 • 객체형DB를 근간으로 한차세대분석형 정보서비스 모델 필요 • 분석형 정보서비스 시범 사이트 개발 • 객체형DB 검색 최적화 필요 • 검색 최적화 알고리즘 연구 수행을 통한 검색 서비스 시범 개발

  3. 개발 사업의 목표 1.2 지능화 공유화

  4. 시스템 개념도 2.1 연구환경 선진화를 위한 스마트 정보유통체제 구현 객체화 ,개방화 분석형 서비스 개방형 서비스 (Linked Open Data) 고성능 검색 서비스 4 3 5 동시발생, 유사도, Linked Open Data 객체화 DB 개방형 콘텐츠 (RDF Triple) 개방형 고부가 콘텐츠 1 2 객체화, 마이크로화 개방형 데이터화 LinkedOpen Data NDSL DB & 이용통계 국외 국내 객체화 DB 스키마 개방형 고부가 콘텐츠 생성 알고리즘 (트리플 변환 규칙)

  5. DB 객체화 객체DB 스키마 설계 통합 분석 개별 분석 마이그레이션 수행 2.2 DB 객체화 프로세스 • SCOPUS, XML FullText, OAK Central, NDSL 분석 • 엔티티및 관계 생성 방향성 설정에 활용 • 개념데이터 추출 • 객체 대상 선정 • SCOPUS, XML FullText, OAK Central, NDSL을 대상으로 개별 분석한 내용을 통합하여 분석 • 개념 데이터 통합 • 개념모델 추출 • 세부 속성 정의 • 객체DB 테이블 설계 및 컬럼 속성 정의 • 논리ERD정의 • 물리ERD정의 • 데이터 대상 선정 • 식별체계 정의 • 개체를 식별하고 대상 데이터를 객체DB 데이터로 생성 • 객체DB 생성

  6. DB 객체화 – 통합 구조도 2.3 본문식별자(PK) 논문식별자 (PK) 참고문헌식별자 (PK) 본문식별자(PK) 논문식별자(PK) 순서 섹션타입 본문 본문 1 본문참고문헌 0/n 0/1 그림표식별자 (PK) 논문식별자(PK) 그림표제목 그림표링크 그림표구분 그림/표 0/n 논문식별자(PK) 언어타입 (PK) 초록 초록 0/n 0/1 권호식별자: 저널id_권_호 순서 (PK) 논문식별자(PK) 입수출처 상태 상태날짜 입수처 0/1 권호정보 1 1/n 권호식별자(PK) 저널식별자(FK) 권 호 권호명 대등권호 저널식별자(PK) 저널명 저널국문명 저널명대표언어 DDC P_ISSN E_ISSN 과학기술표준분류 무료전자저널여부 코직넘버 ISSN ISBN 발행국 1 순서 (PK) 논문식별자(PK) 심사구분 심사날짜 심사정보 0/1 저널 1 1 1 1 1 1 1 논문 1 1 1 참고문헌식별자 (PK) 참고문헌타입 참고문헌명 참고문헌국문명 참고문헌명대표언어 시작페이지 종료페이지 권 호 DOI 참고문헌저널영문명 참고문헌저널국문명 참고문헌저자명 참고문헌저자국문명 참고문헌저자명대표언어 발행연도 논문식별자 논문식별자 (PK) 참고문헌식별자 (PK) 참고문헌순서 1 1 논문식별자 (PK) 논문제어번호 논문국문명 논문명 논문명대표언어 논문발행연도 논문출판일 DOI KOI 주제분야 권호식별자(FK) 시작페이지 종료페이지 국문키워드 영문키워드 학회코드 저작권 저작원연도 라이선스 참고 0/n 발행논문 0/n 0/n 0/n 1 0/n 저널-기관 참고문헌 1 논문식별자(PK) 저널식별자(PK) 1/n 0/n 논문저자 논문식별자(PK) 저자식별자(PK) 논문소속 1/n 0/n 0/n 저자식별자(PK) 저자국문명 저자영문명 저자영문전체명 이메일 팩스 연락처 학위구분 전공연도 저자전공 출생일 사망일 1 1 기관 1 1 저자 1 기관id 획득 필요 저자소속 기관전거 사용 0/n 0/n 저자전거 사용

  7. 객체화 DB 논리 스키마 설계 2.4

  8. 객체화 DB 물리 스키마 설계 2.5

  9. 객체화 DB 마이그레이션 프로세스 2.6 데이터 대상 확정 준비 단계 환경 설정 식별체계 정의 NDSL XML 개체식별 실행 단계 스키마 생성 데이터 적재 KIS11 (u-Gate) KIS09 (OCEAN) KIS08 (e-Gate) 전거데이터 XML FullText 1852건 단순적재 전후처리시행 객체DB

  10. DB 마이그레이션 대상 선정 2.7 마이그레이션 대상 • 국내 논문 중 초록이 존재하는 최근 3년 • 국내 논문 중 초록이 존재하지 않는 최근 1년 • 논문번호가 ‘JAKO’로 시작하는 논문 필터링 조건 • 논문 데이터 : KIS11 (u-Gate) DB의 FAST_ARTICLE_NEW 테이블 • 국내 논문 : FAST_ARTICLE_NEW 테이블의 dbt2 컬럼값이JAKO인 것 • 초록 존재 여부 : FAST_ARTICLE_NEW 테이블의 korabstract와 engabstract컬럼값 • 최근 3년 : FAST_ARTICLE_NEW 테이블의 pubyear컬럼값이2010 이상 • 최근 1년 : FAST_ARTICLE_NEW 테이블의 pubyear컬럼값이2012 이상 • 논문번호 시작 : 논문번호 처음시작이 ‘JAKO’로 시작하는 논문

  11. DB 마이그레이션 대상 선정 2.7 최종 마이그레이션 수행 대상 논문수

  12. 콘텐츠 구축 – 트리플 변환 프로세스 온톨로지 스키마 생성 트리플 변환 데이터 분석 트리플 적재 3.1 • 변환 대상이 되는 데이터에 대하여 데이터 구조 및 데이터 현황을 파악하고 데이터 간의 관계를 분석하는 단계 • 일반적으로 중심이 되는 데이터를 파악하고 그 데이터들의 관계를 파악함 • 중심이 되는 데이터 이외에 세부적인 데이터를 분석하고 정리 • 대상 데이터의 특성을 파악하여 변환에 고려 • 온톨로지에 사용할 prefix를 정의하고 데이터의 특성을 고려하여 많이 사용하고 있는 vocabulary를 적용할 것인지 고려 • 인스턴스의 식별체계를 정의 • 중심이 되는 데이터를 바탕으로 온톨로지 클래스 생성 • 분석된 데이터 간의 관계를 통해 온톨로지 프로퍼티 생성 • 변환 대상이 되는 데이터를 변환하기 위해 수집하는 규칙을 생성 • 수집된 데이터와 온톨로지 스키마 간의 변환 매핑이 이루어지도록 매핑 규칙을 생성 • 변환기를 통해 트리플(온톨로지 인스턴스)을 생성 • 생성된 트리플을 트리플 저장소로 적재 • 필요에 따라 추론규칙을 적용하기도 함 • 추론규칙은 기본적인 axiom에 따라 추론을 하는 것과 사용자가 정의한 규칙에 따라 추론을 하는 방법이 가능

  13. 콘텐츠구축 – R2RML을 활용한 변환 규칙 활용 3.2 @prefix rr: <http://www.w3.org/ns/r2rml#>. @prefix bibtex: <http://data.bibbase.org/ontology/#>. @prefix dc: <http://purl.org/dc/elements/1.1/>. @prefix dct: <http://purl.org/dc/terms/>. @prefix foaf: <http://xmlns.com/foaf/0.1/>. @prefix prism: <http://prismstandard.org/namespaces/basic/3.0/>. @prefix pur: <http://prismstandard.org/namespages/pur/3.0/>. @prefix schema: <http://schema.org/>. @prefix kisti: <http://lod.ndsl.kr/ontology/>. <#JournalTableView1> rr:sqlQuery """ select journal.JOURNAL_ID, KOR_NAME, FOREIGN_NAME, COUNTRY, KOJIC, P_ISSN, E_ISSN, ISBN, MAIN_LANG, FREE_FLAG, ELEC_FLAG, VALUE from ndml_journal journal, ndml_classification_codeclasscode where journal.JOURNAL_ID=classcode.JOURNAL_ID and TYPE='1' """. <#TriplesMap1> a rr:TriplesMap; rr:logicalTable <#JournalTableView1>; rr:subjectMap [ rr:template "http://lod.ndsl.kr/ontology/journal/{JOURNAL_ID}"; rr:classkisti:Journal; ]; rr:predicateObjectMap [ rr:predicatefoaf:name; rr:objectMap [ rr:column "KOR_NAME"; rr:language "ko"]; ]; rr:predicateObjectMap [ rr:predicatefoaf:name; rr:objectMap [ rr:column "FOREIGN_NAME"; rr:language "en"]; ]; rr:predicateObjectMap [ rr:predicateprism:location; rr:objectMap [ rr:column "COUNTRY" ]; ]; rr:predicateObjectMap [ rr:predicatekisti:kojic; rr:objectMap [ rr:column "KOJIC" ]; ]; rr:predicateObjectMap [ rr:predicateprism:isbn; rr:objectMap [ rr:column "ISBN" ]; ]. Prefix 영역 TableView영역 TriplesMap영역

  14. 콘텐츠구축 – 변환기 실행 및 결과 3.3 • Setting 폴더안의setting.properties을 통해 변환하고자 하는 변환규칙과 형식, 데이터베이스 접속 정보를 입력 • Start.bat 파일을 실행하면 변환기 실행이 시작

  15. LOD기반 기술 구현 – Linked Data 발행 구조도 3.4

  16. LOD기반 기술 구현 – 트리플 적재 3.5 • 트리플을 적재하기 위한 트리플 저장소의 구조도 • R2RML트리플 변환기를 통해 생성한 개방형 고부가 콘텐츠를OntoBase2.0에 적재하는 과정을 수행 • owl_low단계의 추론규칙을 적용하여 데이터를 적재

  17. LOD기반 기술 구현 – Linked Data 발행 3.6 Linked Data 발행 메인 페이지

  18. LOD기반 기술 구현 – Linked Data 발행 3.6 Linked Data 발행 소개 페이지

  19. LOD기반 기술 구현 – Linked Data 발행 3.6 SPARQL Endpoint 화면

  20. LOD기반 기술 구현 – Linked Data 발행 3.6 SPARQL 결과화면 • [SPARQL 질의] • NDSL LOD 트리플에 질의 수행 • [SPARQL Endpoint] • SPARQL Endpoint를 활용하여 KISTI NDSL LOD 시범서비스에 SPARQL 질의 수행

  21. LOD 기반 기술 구현 – 검색 결과 화면의 LOD 3.7 • 검색서비스 예)

  22. 맺음말 4 성과활용계획 차세대 과학기술정보 서비스 모형 개발 • 국내 LOD 확산 계기 마련 • NDSL 콘텐츠의 품질 혁신으로 다양한 고부가 서비스 개발 기반 마련 • 연구자 간 정보개방 및 공유 활성화 기반으로 활용 • 국가 R&D 생산성 향상에 기여하는 국가과학기술정보센터 역할 수행

More Related