280 likes | 417 Views
4. 역통 연계를 위한 OAI-PMH 적용 상세설명서. 2006.05 2007.02. 한국역사분야 종합정보센터. 목 차. Ⅰ. 한국역사정보통합시스템 1. 시스템 소개 3 2. 역통연계 4
E N D
4. 역통 연계를 위한 OAI-PMH 적용 상세설명서 2006.052007.02 한국역사분야 종합정보센터
목 차 Ⅰ.한국역사정보통합시스템 1. 시스템 소개 3 2. 역통연계 4 Ⅱ. KHCollection 1. 개요 11 2. 프로그램 구성도 11 3. OAI 12 4. KHCollection – SP 14 5. KHCollection – DP 17 [첨부] 역통 통합검색서비스 연계 샘플 XML [첨부] KHCollection 적용 OAI 샘플 XML
경상대학교 문천각 • 국가보훈처 • 국립문화재연구소 • 국사편찬위원회 • 독립기념관 • 동국대학교 도서관 • 명지대학교 국제한국학연구소 • 민족문화추진회 • 민주화운동기념사업회 • 서울대학교 규장각 • 성균관대학교 존경각 • 전북대학교 박물관 • 전쟁기념관 • 한국국학진흥원 • 한국여성개발원 • 한국학중앙연구원 • 국립중앙도서관 Ⅰ.한국역사정보통합시스템 1. 시스템 소개 한국역사정보통합시스템은 한국역사분야 종합정보센터 내 역통시스템과 전문정보센터 간의 연계를 위하여 메타데이터 유통 프로토콜인 OAI-PMH(Open Archieves Initiative Protocol for Metadata Harvesting)을 사용하였다. 또한 역통은 수집된 통합메타데이터 중 지식사업으로 구축된 메타데이터를 국가지식포털에 제공하고 있다. <그림> 한국역사정보통합시스템 구성도 종합정보센터 한국역사분야 종합정보센터 역통웹서버 검색서버 연계 프로그램 KHCollection-SP HTTP Get/Post 기반 OAI-PMH 2.0 전문정보센터 종합정보센터 WEB 서버 KHCollection-DP 국가지식정보통합검색시스템 민간포털 DB 서버 메타DB
전문정보센터 종합정보센터 역통연계자료 작성 및 제출 전문정보센터협의회 신규 연계 대상 데이터베이스 발생 역통연계자료 검토 역통연계자료 변경 요청 통합디렉토리 구성 및 매핑 정보 구성 원문 데이터 변경 역통연계자료 승인 프로그램 또는 데이터 수정 메타데이터 추출 역통 연계 스케줄링 메타데이터 관리 및 전송 승인 메타데이터 수집 오류 발생 메타DB 메타데이터 오류 검토 2. 역통연계 (1) 역통연계 업무 흐름 역통과 전문정보센터 간에 원활한 연계를 위하여 전문정보센터는 역통연계자료를 작성하여 종합정보센터에 제출하고 원문에 대한 메타데이터를 메타DB에 저장 관리하며, 최종 원문이 전문정보센터에서 서비스될 수 있도록 한다. 또한 역통은 역통연계자료를 기반으로 스케줄링에 의한 통합메타데이터 수집 및 구축, 통합디렉토리 구성, 통합검색서비스 등의 업무를 수행한다. <그림> 역통연계 업무 흐름도
전문정보센터 메타데이터 수정 역통 관리자에게 긴급 처리 요청 역통 관리시스템에 의한 수정 역통 웹서비스 확인 KHCollection 실행 (3) 예외사항에 따른 처리 예외사항이라 함은 전문정보센터 또는 역통의 시스템 장애 또는 대량의 메타데이터 발생등과 같이 KHCollection을 통한 Online 연계가 불가능한 경우를 말한다. ○ 소량의 메타데이터 역통에 긴급하게 반영해야 하는 경우 • 전문정보센터는 메타DB를 갱신한 후 역통 관리자에게 긴급 변경 요청을 유선 또는 이메일을 통하여 요청하여야 한다. 이때 메타데이터 제공 방식을 메일을 통한 제공인지, KHCollection 방법인지를 알려 주어야 한다. • 역통 관리자는 이메일등을 통한 메타데이터 제공인 경우는 역통 내 관리시스템을 이용 역통 통합메타DB를 갱신한다. • KHCollection 통한 온라인 갱신인 경우 역통 관리자가 KHCollection-SP를 실행하여 메타데이터 수집, 통합메타DB에 반영한다. • ○ 대량의 메타데이터 역통에 긴급하게 반영해야 하는 경우 전문정보센터 메타데이터 수정 메타데이터 XML 추출 역통 내 파일서버 FTP 전송 역통 관리자에게 긴급 처리 요청 역통 관리시스템에 의한 수정 • 돌발 변수로 인하여 KHCollection을 사용할 수 없게 되었을 경우 등 예외적인 조건에서만 사용한다. • 전문정보센터는 메타데이터 추출기를 사용, XML 파일로 추출한 후 역통 내 파일서버에 FTP 전송한다. 이때 전문정보센터는 역통 내 파일서버의 사용자 ID 및 패스워드를 사전에 신청하여야 하며 종합정보센터에 기술 지원을 요청할 수 있다.
(4) 메타데이터 작성 ○ 통합메타데이터 요소 역통 내 통합메타데이터 DB는 2004년도 역사분야 연계협의회에서 권고한 11개 주요소와 각각의 하위 요소를 기반으로 운영되고 있으며, 전문정보센터는 메타DB에 필수요소가 반영되어 있어야 하며 선택 요소는 자료의 특성 및 역통 내 서비스 시스템 운영 정책을 고려하여 결정하여야 한다. ○ 역통 통합메타데이터 서비스 정책 - 통합디렉토리 서비스 정책
- 통합검색 서비스 정책 - 분류별 정렬 순서
○ 메타데이터 작성시 주의사항 • ‘한국역사정보통합시스템 연계 지침’을 기반으로 작성 • KHCollection은 Online 방식으로 운용되며 메타데이터는 반드시 메타 테이블에 저장 관리되어야 함 • 메타데이터 추출기는 역통에서 개발 보급하고 있으나 필요 시 역통 개발팀과 협의하여 전문정보센터에서 직접 개발 설치 운영할 수 있음 • 메타데이터 테이블의 관리 및 운영은 전문정보센터에서 담당함 • Unit 1(책/서명)간의 isPartOf를 허용하도록 변경함 • 편년자료 상호 연계 대상 데이터베이스는 date 요소의 날짜 스킴을 준수하여 제공하여야 함 [-]YYYYMMDD[L0|L1] 형식을 준수 • ID 및 분류코드 정보에서 ‘.’, ‘_’이외의 특수문자를 사용할 수 없음 • KHIIC, KHEIC 표기를 KHDP(전문정보센터), KHON(역통)으로 표기 변경 하였음 (5) 역통의 통합메타데이터 검색서비스 지원 역통의 통합검색서비스 및 상세검색서비스 기능을 전문정보센터에서 구현하기 위한 기능 지원으로 그 처리 흐름은 다음과 같다. 역통 통합검색 프로그램 호출 결과 출력 XML 형식 결과 리턴 XML 구조 분석 원문연결 결과내 재검색 / 페이지 이동 ○ 접근 URL 및 파라메터 http://www.koreanhistory.or.kr/srchservice/srchTransKTH.jsp 전달 파라메터 정보(Get방식) XML 형식 검색 결과 (2차 워크샵 세션 2 자료 참조) query=검색 : 검색어 currentPage=1 : 현재 페이지 listperpg=10 : 한페이지당 목록 개수 set_id=-1 : set id totalCount=0 : 총 검색 개수
(6) 역통연계관리 역통연계관리는 전문정보센터 정보관리, 제공된 메타데이터 조회, 통합디렉토리 매핑정보 조회, 공지사항 등록, 메타데이터 변경 요청 등의 기능을 전문정보센터 관리자에게 제공하는 기능이다. ○ 접근경로 http://www.koreanhistory.or.kr/back ○ 접근 아이디 역통 관리자에게 아이디 및 패스워드 신청하여야 한다. ○ 주요 기능 - 분류정보변경 요청 - 전문정보센터 정보 조회
- 통합디렉토리 관리 - 공지사항 등록 (7) 기타 ○ 파일서버 접근 특이 경우를 대비하여 전문정보센터의 메타데이터를 KH_Collection을 통하지 않고 종합정보센터에 제공할 수 있도록 파일서버를 운영하고 있다. 접근 IP 및 사용자 계정, 패스워드를 역통 관리자에게 신청하면 된다. 단 전문정보센터별 단일 계정만 허용하고 있음.
Ⅱ. KHCollection 1. 개요 ‘한국역사정보통합시스템 연계지침’에 포함된 ‘역사분야 통합메타데이터 표준’에 근거한 메타데이터 요소를 전문정보센터로 부터 수집하여 역통에 데이터베이스 구축할 수 있도록 OAI-PMH 버전2.0을 이용한 메타데이터 수집기이다. KHCollection 프로그램 구성은 KHCollection-DP, KHCollection-SP, 통합메타데이터 스케줄러로 구성되어 있다. 2. 프로그램 구성도 전문정보센터 웹서버 전문정보센터 DB서버 역통검색 서버 사용 Port는 전문센터에서 결정 메타수집스케줄러 웹서비스 프로그램 메타데이터 DB KHCollection-SP KHCollection-DP 메타데이터 추출기 KRISTAL-2002 검색 시스템 제어권이전 통합 스토리지 역통웹서버 통합디렉토리 서비스 통합메타데이터 검색서비스 통합메타데이터 색인 DB
3. OAI(Open Archives Initiative) (1) 개요 OAI(Open Archives Initiative)는 지식정보를 효과적으로 유통하기 위한 상호운용성을 갖는 표준 개발을 목적으로 한다. OAI의 ‘Open’은 다양한 아카이브의 지식정보에 대한 접근이 개방되어 있음을 의미하며, ‘Archives’는 전문정보센터에서의 지식정보 저장소를 표현한다. 그러므로 OAI는 개방형 지식정보 통합을 위한 지식정보 저장소의 개념을 가지고 있다고 볼 수 있다. ‘Initiative’는 디지털 라이브러리 연합과 멜론 재단의 협력 프로젝트를 뜻한다. OAI는 메타데이터의 구축 및 공유를 위해 상호운용성이 가능한 저장소를 통해 웹으로 접근할 수 있는 정보자원에 대한 접근기능을 제공하는 것을 목적으로 하고 있다. 지식정보 자원의 효과적인 접근과 유통을 지원하는 프레임워크와 표준을 개발하기 위해서 제공되는 정보의 형태와 정보제공을 위한 메커니즘의 독립성을 가지고 다양한 종류의 디지털 자원에 대한 개방성 및 접근성을 향상 시키기 위하여 OAI-PMH(Open Archives Initiative – Protocol for Metadata Harvesting) 프로토콜이 제안되었다. (2) OAI-PMH 프로토콜 메타데이터 수집을 위한 OAI-PMH는 하나의 서비스 시스템에서 타 서비스 시스템으로 메타데이터 레코드의 정규화된 수집 동작을 지원하는 단순 프로토콜로서 하나의 시스템에서 다른 시스템으로 메타데이터를 전송할 수 있는 기능을 갖는다. OAI-PMH의 특징은 첫번째로 HTTP(HyperText Tranfer Protocol), XML(eXtensible Markup Language), XML 스키마와 같은 웹 표준을 기반으로 동작하기 때문에 구현하기가 쉬우며, 둘째로 프로토콜에 의해 지원되는 동작체계가 단순하다. OAI-PMH는 하나의 서비스가 다른 서비스에게 자신의 모든 메타데이터 레코드 또는 자신의 메타데이터 레코드 중 일부를 복사할 수 있게 해준다. 여기서 일부란 명명된 하위 집합이나 특정 기간 동안 수정된 레코드를 말한다.
▪ ▪ ▪ OAI-PMH에서 사용되는 용어 중, 데이터 프로바이더는 서비스 프로바이더가 수집할 수 있는 데이터를 생성하고 제공하는 리퍼지토리(repository)나 웹서버를 말하며 서비스 프로바이더는 메타데이터를 수집하고 검색 서비스를 제공하는 시스템을 말한다. 즉, 클라이언트/서버 모델에서 데이터 프로바이더는 서버의 역할을 수행하는 것이며 서비스 프로바이더는 클라이언트 역할을 수행하는 것이다. 서비스 제공자와 데이터 제공자의 역할 및 기능 비교는 다음과 같다. <표> 서비스 제공자와 데이터 제공자 기능 비교 <그림> OAI-PMH 개념도 6가지 Verb 사용 OAI 요청(HTTP GET 또는 POST) DP-1 스케줄러 메타DB SP DP-2 메타DB 통합메타DB DP-3 서비스 제공자 메타DB OAI 응답(XML 형식의 레코드) 데이터 제공자
(2) 역사분야 연계를 위한 용어 정의 • ○ 리퍼지토리 • 리퍼지토리는 OAI-PMH 요청을 처리할 수 있는 웹서버 및 데이터베이스로서 데이터 프로바이더에서 운영된다. 리퍼지토리는 전문과 메타데이터 모두 저장할 수 있다. 또한 메타데이터만을 저장할 수도 있다. • 리퍼지토리는 하나 이상의 저장소로 구성할 수 있다. • 메타데이터 저장소는 하나 이상의 아이템이 저장되는 테이블들의 집합이다. • 리퍼지토리 구성은 메타데이터 저장소와 메타데이터 관리로 구분한다. • 메타데이터 DB 설계 권고안을 준수하여야 한다. • ○ 아이템 • 아이템 즉 콘텐츠는 유통시킬 자원에 대한 메타데이터이며 리퍼지토리의 구성요소 이다. 하나의 아이템에 대하여 여러 형태의 메타데이터를 생성할 수 있으며 각 아이템은 OAI-PMH를 통하여 레코드로서 수집될 수 있다. 또한 각 아이템은 리퍼지토리 내에 유일한 identifier를 갖는다. • 하나의 아이템 내에는 책(서명) 및 기사 레코드들의 집합 • 하나의 item은 하나의 Identifier를 가져야 함 • ○ 레코드 • 레코드는 하나의 형태로 표현되는 메타데이터로서 XML로 인코딩된 바이트 스트림 형태로 제공된다. XML로 인코딩된 레코드는 다음과 같이 구성된다. • 헤더(header): 아이템의 유일한 identifier를 포함하며 선택적 수집에 필요한 프로퍼티(property)를 갖는다. Header는 리퍼지토리 내의 아이템에 대한 유일한 identifier와 선택적 수집을 목적으로 한 레코드 생성일, 수정일, 삭제일을 나타내는 datestamp, 선택적 수집에 필요한 아이템의 집합을 나타내는 0개 이상의 setSpec 엘리먼트로 구성된다. • 메타데이터: 아이템에 대하여 여러 형태의 메타데이터를 제공할 수 있으며, 역통에서 요구하는 메타데이터 작성 지침을 반드시 준수하여 제공해야 한다. • about: 레코드의 메타데이터에 관한 데이터를 포함하는 컨테이너이다. about 컨테이너의 콘텐츠는 XML 스키마로 구성되어야 한다. about 컨테이너는 저작권 표시 등에 사용될 수 있다.
○ Unique Identifier • 리퍼지토리 구성 내에서 고유한 식별자로 최소한 메타데이터를 구축하는 기관 내에서는 고유하여야 한다. • Unique Identifier는 OAI-PMH 명령어를 이용하여 item으로부터 메타데이타를 추출하기 위해 사용한다. • ○ 삭제 레코드 • 저장소는 삭제 레코드에 대해서 no, persistent, transient의 세가지 레벨 중의 하나의 정책을 가져야 하고 Identify 명령에 대한 응답으로 deleteRecord 항목에 정책을 표시해야함. • no :데이터삭제 이력을 관리하지 않는다. • persistence : 데이터삭제 이력을 항상 관리한다. • transient : 데이터 삭제 이력을 일시적으로 관리한다. • 역통의 경우는 insert, update, delete의 상태 정보를 관리하기 때문에 기본적으로 persistence로 설정 • ○ dataType • 메타데이터 레코드가 신규, 수정, 삭제 데이터 인지를 판단 • 수집기에서는 총 insert, update, delete 형태를 가지고 DP에 해당 형태의 레코드를 수집 요청함. • ○ Set • Set은 선택적 수집을 위한 목적으로 아이템을 그룹핑한 부가적인 구조로 역사정보에서는 분류별로 그룹핑하여 수집할 수 있도록 하고 있다. • Set은단순한list의 형태도 가능하고계층 구조를 가진tree 구조도 가능하다. • 계층 구조에서각각의 상위Set들은 역통에서 전달한 구분자를 가지고 구분한다. • 저장소가 Set을 가진 경우ListIdentifiers, ListRecords, GetRecord 명령의 응답으로 헤더부에 반드시 setSpec(필수), setName(권장), setDescription • (부가) 정보를 전송해야 한다. • ○ 선택적 수집 (Selective Harvesting) • 날짜(datestamp)를 사용한 선택적 수집 : ListRecords, ListIdentifiers 명령에 from이나 util 인자를 사용하여 해당 날짜 범위의 데이터를 요청한다. • Set을 이용하는 선택적 수집 : ListRecords, ListIdentifiers 명령 사용시 setSpec 인자를 사용하여 분류별 데이터를 요청한다.
통합디렉토리 관리 통합메타데이터 수집 스케줄러 통합디렉토리 관리 스케줄러 관리 통합디렉토리정보 스케줄러 수집스케줄링정보 연계조사자료 분류매핑정보 KHCollection-SP 프로그램 실행 KHCollection-SP Verb별 Request 파라메터 생성모튤 역통분류코드 매핑 메타데이터 오류분석 적재결과 리포트 XML 구조 분석 전문센터별 KHCollection-DP호출 메타데이터 적재모듈 적재현황 메일링 수집현황리포트 OAI-PMH (HTTP Get/POST) 통합메타데이터 관리 KHCollection-DP 분류별통합메타DB 4. KHCollection – SP (1) 개요 KHCollection – SP는 역통 검색서버에서 운영되는 OAI의 Service Provider 역할을 수행하는 프로그램으로 스케줄러에 의해 실행되며 프로그램의 구성은 다음과 같다. <그림> KHCollection – SP 구성도
통합디렉토리 매핑 테이블 통합메타데이터 DB (2) 주요기능 • Service Provider에 Verb(identify, ListIdentifiers, ListSets, ListMetadataFormat, ListRecords, GetRecord)별 요청에 대한 정보 전송 기능 • 전송 완료 레코드나 전송 중 오류 레코드 처리: Repository내의 전송 상황 정보를 별도로 관리 • 전송 정보 리포팅 기능 • Service Provider에서 전달 된 메타데이터 생성 날짜를 기준으로 하여 현재일까지의 메타 데이터 조회 후 조건에 맞는 레코드 전송 • Repository가 RDB, KRISTAL인 경우에 쿼리를 환경 설정 파일에서 관리 (3) 통합디렉토리 매핑 연계조사자료 통합디렉토리 정보 통합디렉토리 서비스 전문센터 메타데이터 역통 통합디렉토리 매핑 작업 자료 목록 역통에서 매핑테이블을 기준으로 역통분류코드 추가 함. 제어권 이전 통합디렉토리 정보에 직접 제어권 이전 여부 설정되어 있음(연계협의회에서 결정)
에러 레코드만 별도 디렉토리에 보관 재정렬을 위한 writer Element추가 docCreated, docIssued, dateEvent 날짜 형식 검사 재정렬을 위한 docDate Element추가 Khdpsubject 존재 여부 검사 및 역통 매핑 코드 존재 여부 검사 Error Report 전문센터 코드 Record id 존재 여부 검사 Xerces Parser 를 이용한 Validation 체크 XML 요소 중 dbInfo 존재 여부 체크 mainTiitle 존재 여부 검사 (4) 통합메타데이타 오류 검증 ○ 메타데이터 오류 검증 프로세스 failed ○ URL 오류 검증 프로세스 야간 시간대 샘플링에 의한 통합메타데이터 URL 오류 검사를 실시 한다. URL오류 검사모듈 전문정보센터 URL 오류검사 스케줄러 API Call 2xx : Successful 4xx : Client Error 5xx : Server Error 통합메타DB
5. KHCollection – DP (1) 개요 KHCollection – DP는 전문정보센터 웹서버에 설치 운영되며 종합정보센터(Service Provider)로부터의 요청에 따라 전문정보센터 정보, 스키마 정보, 메타데이터 등의 정보를 XML 형식으로 구성하여 제공한다. <그림> KHCollection – DP 구성도 종합정보센터(Service Provider) • HTTP Get 또는 Post 명령어 사용 • OAI 6개 Verb 중에 하나 request • 메타 갱신 Timestamp 웹사용 Port • XML로 표현된 OAI 응답 KHCollection - DP Request 분석기 모듈 Request 방식에 따른 XML 파일 생성 메타데이터 응답모듈 Request 방식에 따른 OAI XML 생성 XML 파싱 전송 정보 저장 조건에 맞는 Metadata 추출 모듈 오류 및 전송상태 리포트 DBGateway 메타데이터 추출기 메타DB 메타DB 메타데이터 관리기
(2) KHCollection-DP 기능 • Service Provider에 Verb (identify, ListIdentifiers, ListSet, ListMetadataFormat, ListRecords, GetRecord)별 요청에 대한 정보 전송 기능 • 전송 레코드 관리: 역통의 메타데이터 저장소에 적재 완료된 메타데이터 레코드 정보를 수신 받아 메타DB의 전송 상황 필드에 반영 • 전송 정보 리포트 기능 • Service Provider에서 전달된 Parameter를 기준으로 하여 메타데이터 조회 후 조건에 맞는 레코드 전송 (3) 전달 파라메터 상세정보 • Parameter 전달 예 : • http://www.history.go.kr/khcollection/dataprovider/dataProvider.jsp?verb=ListRecords&dataType=insert&kheicsubject=ku&from=2004-10-11&until=2005-06-12&validation=Y&maxCount=200
(4) KHCollection-DP Verb 정의 ○ identify 전문정보센터의 명칭, 관리자 이메일 주소, 전문정보센터 URL, DP 설치일, OAI-PMH 버전 등의 식별 정보를 수집하기 위한 Verb • 메타데이터 수집 스케줄과 별도로 운영되는 명령어 • 역통 관리자가 전문정보센터 정보를 얻을 필요성이 있을 때에만 identify 명령이 전달되며 전송 받은 식별정보의 변경사항은 관리테이블에 수정한다. ○ ListIdentifiers 메타데이터의 레코드 아이디 목록을 수집하기 위한 Verb • SP는 from, until, set을 parameter로 구성하여 전송 • DP는 parameter를 전송 받아 해당 조건에 맞는 메타데이터의 레코드 아이디와 전문센터 분류정보를 수집하여 SP에 전송 • SP는 전송 받은 ListIdentifiers.xml(메타데이터 레코드 아이디 목록 XML)을 Parsing하여 레코드 아이디 건별로 GetRecord Verb를 전송하여 레코드 아이디에 해당하는 메타데이터 정보를 수집 ○ ListMetadataFormat OAI에서 지원하는 메타데이터 Schema 정보를 얻기 위한 Verb로 OAI-PMH는 기본적으로 여러개의 형태소, 여러 개의 Schema를 사용이 가능하다. 이 경우 각 레코드, 혹은 set별로의 schema목록을 전송 받는 명령어이다. 역사정보통합시스템의 경우 확장성을 고려하여 개발하였지만 Schema를 사용하지 않고, 단일한 통합메타데이터 세트를 사용하기 때문에 이 명령어를 적용하지는 않는다. ○ ListSets 전문정보센터 자체 분류정보 목록을 수집하는 Verb • 역통은 연계조사자료를 기반으로 전문정보센터 분류와 역통 분류 매핑 테이블을 구성한다. • DP는 전문정보센터 자체 분류코드, 분류명 등의 정보를 SP에 전송한다. • 역통은 수집된 전문정보센터 분류XML을 파일 형태로 저장 관리하며, 별도의 프로그램을 통하여 통합디렉토리 매핑 테이블에 반영한다.
○ GetRecord 전문정보센터의 메타DB에 적재되어 있는 메타데이터 중 해당하는 레코드 아이디의 메타데이터를 수집하는 Verb • SP는 ListIdentifiers로 전송 받은 레코드 아이디 목록을 가지고 DP에게 레코드 아이디 건 별로 메타데이터를 요청한다. • 이 명령은 스케줄러에 등록할 수 있는 명령어가 아니며 긴급 적재 / 수정 상황이 발생했을 경우 역통 관리자의 프로그램 작동을 통하여 명령을 실행할수 있다. ○ ListRecords 전문정보센터의 메타DB에 적재되어 있는 메타데이터 중 전달 조건에 맞는 메타데이터들을 수집하는 Verb • SP는 from, until, set을 parameter로 전송 • DP는 parameter를 전송 받아 해당 조건에 맞는 메타데이터를 수집하여 SP에 전송한다. • SP는 전송 받은 ListRecords.xml을 Parsing하여 가져올 총 레코드 수를 분석하고 레코드 수가 역통에 Setting되어 있는 1회 수집 시 최대 레코드 갯수를 초과할 경우 Paging방식을 통하여 분할 전송 받는다. • 전송된 ListRecords.xml은 레코드 아이디 별로 분할하여 XML형태로 관리한다.
(5) 메타DB 설계 권고사항 ○ 메타데이터 리퍼지토리 구성 <그림> 메타데이터 리퍼지토리 구성 개요도 리퍼지토리 저장소-1 저장소-n 아이템-1 아이템-1 책서명 레코드 책서명 레코드 기사 레코드 기사 레코드 ••••• •••• •••• 아이템-n 아이템-n 책서명 레코드 책서명 레코드 기사 레코드 기사 레코드 ○ 전문정보센터 메타DB 정보 전문정보센터에서는 하나 이상의 메타데이터 저장소를 가질 수 있으나 반드시 저장소는 질의문 또는 API에 의해 조회/수정/삭제가 가능해야 한다. 또한 아래의 필수요소 및 권장 요소를 참조하여 DB 스키마 설계에 반영되어야 한다. ○ 전문정보센터 분류정보 전문정보센터 내 분류코드는 필수 정보는 아니나 메타데이타의 오류 검증 및 역통에서 KHCollection을 통한 전문정보센터 분류정보 수집하여 매핑정보 갱신, 분류별 메타데이터 수집 등의 목적으로 사용할 예정이다. 권장 스키마는 아래와 같다.
(6) KHCollection-DP 설치 환경 권장사양 • 운영 체제 : Windows 계열, Unix/Linux 계열 • 개발 언어 : JSP, JAVA • JDK : 1.4이상 • WAS서버 : Weblogic, Tomcat, Websphere 등 • 필수 LIB : xerses.jar • 설치 디렉토리 : 전문정보센터의 웹 프로그램이 설치되어 있는 디렉토리 내에 khcollection 폴더에 설치
[첨부 1] 역통 통합검색 서비스 연계 샘플 XML 아래의 내용은 역통에서 검색된 결과를 XML 형식으로 제공할 경우 사용하는 XML 정보의 예제임. <?xml version='1.0' encoding='utf-8'?> <!DOCTYPE metadata> <metadata> <!-- 검색 정보 --> <searchInfo> <!-- 검색 쿼리 --> <query>BI : 국사</query> <!-- 총 검색 건수 --> <totalCount>73675</totalCount> <!-- 검색 set id --> <set_id>35623</set_id> <!-- 목록 제한 수 및 현재 페이지 수 --> <currentPage listperpg="2">1</currentPage> </searchInfo> <!-- 검색 정보 --> <recordSet> <!-- 검색 된 레코드 시작 --> <record id="KH.AKS.46566_012_0027" unit="2"> <title> <mainTitle >興國寺凝香閣次板上韻</mainTitle> <alternative >흥국사응향각차판상운</alternative> </title> <creator> <author ></author> <writer ></writer> </creator> <subject infocenter="KHDP">KH.01.04.003</subject> <subject infocenter="KHON">ad12</subject> <type>image/text</type> <url> <get> http://yoksa.aks.ac.kr/jsp/aa/VolView.jsp?fcs=f&cf=a&cd=ad12&gb=1</get> </url> <publisher>한국학중앙연구원</publisher> <date created="2005-01-16" issued="2005-01-29" modified="2005-01-30"> <docCreated>1898#*#光武 2(1898) 序</docCreated> <docSort>1898#*#光武 2(1898) 序</docSort> </date> <description></description> <format> <medium>image/gif</medium> </format> <format> <medium>text/xml</medium> </format> <relation> <isPartOf id="KH.AKS.kh2_je_a_vsu_46566_012"></isPartOf> <requires> <post action=""></post> </requires> </relation> <metaMetadata> <mdCenter>한국학중앙연구원</mdCenter> </metaMetadata> </record> <!-- 검색 된 레코드 끝--> </recordSet> </metadata>
[첨부 2] KHCollection 적용 OAI 샘플 XML <?xml version='1.0' encoding='UTF-8'?> <OAI-PMH xmlns='http://www.openarchives.org/OAI/2.0/' xmlns:xsi= 'http://www.w3.org/2001/XMLSchema-instance' xsi:schemaLocation='http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd'> <responseDate>2005-07-25T01:21:09Z</responseDate> <request metadataPrefix="oai_dc">http://www.history.go.kr/khcollection/dataprovider/oai.jsp</request> <ListRecords> <record> <header> <identifier>oai:NIKH:kd_035</identifier> <datestamp>2005-07-22 00:00:00.0</datestamp> <setSpec>kd</setSpec> </header> <KHON > <recordSet dbInfo="한국독립운동사자료(국사편찬위원회)" > <record > <title > <mainTitle>한국독립운동사 자료</mainTitle> </title> <creator > <editor >국사편찬위원회</editor> </creator> <subject infocenter="KHDP" >kd</subject> <identifier > <uri infocenter="KHDP" >kd_035</uri> <url > <get >http://www.history.go.kr/front/dirservice/dirFrameSet.jsp?pUrl=/front/dirservice/dpendent/listSubIndependent.jsp&pDatabaseID=kd_035&pLevel=2</get> </url> </identifier> <publisher >국사편찬위원회</publisher> <date created="2005-07-22" > <docCreated >1997-11-29</docCreated> </date> <format > <medium >text/xml</medium> </format> <metaMetadata > <mdCenter KHDP_name="국사편찬위원회" KHDP_url="http://www.history.go.kr" >NIKH</mdCenter> <unit >1</unit> </metaMetadata> </record> </recordSet> </KHON> </record> <resumptionToken completeListSize="22">9999-12-31%7C1753-01-01%7Cnull%7Coai_dc%7Ckd_015%7C2005-07-25T01%3A21%3A10Z</resumptionToken> </ListRecords> </OAI-PMH>