560 likes | 932 Views
정보화 사회와 전자도서관. 연구개발정보센터 및 KAIST 전산학과 김 진 형 jkim@cs.kaist.ac.kr. 정보화 사회의 도래 1차 자본주의. 16세기 - 18세기 전반 중상주의 주체: Spain, Portugal, 영, 불, 네델란드 기술 : 항해술, 조총 목표 : 정복, 식민지화 한국에의 영향: 간접적 : 임진왜란 (네델란드인의 조총 기술) 이순신의 기술로서 극복 직접적 : 박연, 하멜 등의 표류인 일본 : 외국기술을 배워서 소화 활용(침략).
E N D
정보화 사회와 전자도서관 연구개발정보센터및 KAIST 전산학과 김 진 형 jkim@cs.kaist.ac.kr
정보화 사회의 도래 1차 자본주의 • 16세기 - 18세기 전반 • 중상주의 • 주체: Spain, Portugal, 영, 불, 네델란드 • 기술 : 항해술, 조총 • 목표 : 정복, 식민지화 • 한국에의 영향: • 간접적 : 임진왜란 (네델란드인의 조총 기술) • 이순신의 기술로서 극복 • 직접적 : 박연, 하멜 등의 표류인 • 일본 : 외국기술을 배워서 소화 활용(침략)
정보화 사회의 도래 2차 자본주의 • 산업혁명 - 2차 세계 대전 이후 • 대량 생산 • 기술: 동력 (Steam Engine), 전력, 수송기계 • 주체: 영,불, 독, 미, 러 (스페인 등 탈락) • 선진국-후진국의 갈림길 • 일본: 명치유신 (산업화를 국가정책으로) • 한일합방 • 한국: 남북분단, GATT 체제에서 고도 성장 • 1962년 $82 => $10,000 • 인도 $85 => $350, 필립핀 $200 => $650
3차 자본주의(정보화 사회) • WTO 체제 (우루과이 round 1993년) • 세계 단일 시장의 추구 • 자본, 교통, 보험, 광고, 병원, 교육의 개방 • 상품의 개방 => 교육, 문화도 개방 • 무한 경쟁, 약육강식 • 선진국 중심 • 국경없는 경제, 국경있는 정치 • 자본, 기술 이전은 허용, 노동의 이동은 금지 • Borderless : 선진국 이익부문 • Border 강조 : 선진국 이익을 반하는 것
물질, 자본, 토지 ATOM, 량(Quantity) 힘(Power), 문명 투쟁, 전쟁, 국경 중시 획일화 Mass Production Job in Manufacturing Pyramid Organization 국내 시장, 산업 보호 물질적 만족 정보, 지식, 통신망 BIT, 질(Quantity) 문화(Culture) 영향, 종속, Dotted line Border 다양화 Personalization Job in Services Flat Organization 강한 국제 기업 유치/육성 영적 만족 산업화 사회 vs 정보화 사회
정보화 사회의 특징 Service Oriented • 서비스 산업이란 ? : 고객의 가치를 증가시키는 산업 • 지식 산업 사회 (Knowledge / Information Oriented) • 새로운 산업의 태동 • Whale catching vs. Whale watching • Lumber vs. Eco Tourism • 21세기에는 85% 이상의 직업이 서비스업 • USA :75%, Japan : 65%, Korea : 55%, 동경 : 85% • 모든 직업이 컨설팅으로 • fund manager, telecom/network, computers, insurance, etc • 개인화된 서비스
Network Oriented 정보화 사회의 특징 • Network Intensive Multimedia Business • Education (교육) • Entertainment (오락) • Network-based Service로 급속 변환 • 백과사전도 Network License 개념으로 변환 • E-commerce, E-business • 전자도서관(digital library)
Electronic Commerce Explosion 1$ = 1000원 2300조원 년 45% 성장 B$ Source : Killen & Associates, 1996
정보 산업의 특징 무한경쟁 • 큰 시장 • Borderless / One market • Winner Takes All • 국제 수준, 세계 Top의 경쟁력 요구 • 2등 ? • Global de facto Standards • Computer Software : MicroSoft vs Java • Computer Processor : Intel • 자연언어 : 영어 • 타 산업의 생산성, 효율성 제고에 큰 공헌 • 2등이 되더라도 투자하여야 한다 (?)
IMF 사태를 보는 견해 • 무한경쟁시대의 본격적 돌입 • 외국자본의 입출에 따른 파장 • 세계인의 보편적인 가치 체계에 반한 상황 빈발 • 과소비 : 수입과다, 수출 부진 • 근본적으로 국가 경쟁력의 부족 • 선진국과의 지식격차가 점점 커지고 있다(생산성 미국의 1/3) • 정치, 행정, 기업경영, 노동시장, 교육, 과학기술 • “과거의 성공이 미래 발전의 걸림돌” - 개혁 !!! • 과학기술 경쟁력 제고 • 세계적 수준의 교육, 연구가 필요함 • 세계적 관점에서 선별적 집중, 효율성 제고가 필요함 • 지원시설, 인후라에의 투자 요망 - 과학기술정보 유통 체제
전자도서관의 정의 • 디지탈도서관, 가상도서관, 멀티미디어도서관 • 모든 형태의 정보자료를 수용 -멀티미디어 • Text, Image, Audio, Video, Simulation, Interactive media • 전자자료 (Digitized Data) : 기계 가독 형태 • 물리적 위치, 시간적, 공간적 제한이 없는 도서관 • 컴퓨터 망을 통한 원거리 정보검색 • 다양한 방법으로 이용 • 공동 이용 • 전자도서관 = 서점 = 출판사
도서관의 발전 과정 • 자동화 도서관 • Online Catalog System, 수서 및 연속간행물시스템, 대출 및 상호대차시스템
전자문헌의 특징 • 장소적 제약이 없다 • 복수의 이용자들이 동시 사용 가능 • 쉽게 복제할 수 있다 • 개정, 재편성, 개량화, 결합 등이 용이하다 - 유연성 • 공간을 차지하지 않는다 • 책당 $20의 건물, 시설비 • Online 검색이 가능하다 (기계가독형) • 다양한 형태 (MultiMedia) 수용
Original Information Items 자동화 도서관 Manual Information Processing Query Information Retrieval System Secondary Information Relevant Secondary Information
Original Information Items 전자도서관 System Digitization Text SGML Tiff JPEG MPEG WAV et al. Text Summ. OCR Color Ext. Feature Ext. Voice Rec. Manual Information Processing Digitized Information Automatic Information Processing Query Information Retrieval System Secondary Information Relevant Secondary Information Relevant Digitized Information
방대하고 다양한 정보의 수집 및 관리 전자도서관의 필요성 네트워크를 통한 편리한 정보 배포 멀티미디어 정보의 통합 방대한 정보에 대한 편리한 검색
전자도서관 구성요소 • 정보 저장 & 관리 • 저작권 관리 • 정보 수집 & 디지털화 • 정보 검색 • 정보 배포 Image from IBM Digital LIbrary
선진국의 전자도서관(미국) • 기존의 도서관 기반 • 국회도사관의 전자도서관화 • 2000년까지 500만 항목에 걸쳐 디지털화 예정 • Columbia Univ.의 Janus Project • CMU의 Mercury Project • 미 Georgia 주 34개 대학의 Gallieo Project • 새로운 환경 구축 • Digital Library Initiative -I : 6개 대학에 전자도서관 과제 • 1994년부터 UCB, UCSB, UCI, CMU, UM, Stanford • NSF/NASA/DARPA에서 지원 - 94.9 ~ 98.8, $24M • Digital Library Initiative -II : 98.10 ~
선진국의 전자도서관 • 일본 • 학술 정보센터(NACSIS)에서 1995년 2월 시험 시스템 개방 • 국가 전산망을 통해 과학기술 분야의 학술지를 각 기관 및 대학에 제공(전국 249개 대학 539 컴퓨터) • 프랑스 • 1998년까지 1300만 항목의 프랑스 문학,언어학 및 역사에 대해 디지털화된 자료를 제공할 예정 • 바티칸 • 고 성서 전자도서관
연구개발정보센터의 임무 • 과학기술 연구개발에 필요한 정보를 제공 • 과학기술 연구개발에서 생산된 정보의 수집, 가공, 유통 연구개발정보센터는 연구개발에 필요한 정보를 정보통신기술을 활용하여 어디서나 언제나 많은 사람이 쉽게 사용할 수 있도록 공급합니다
연구개발 정보센터 주요 기능 • 컴퓨터망을 통한 과기정보 유통서비스 • 과학기술정보 DB 구축 • 문헌 소장정보(단행본 및 논문단위 소재) • 연구보고서, 학회논문 원문정보 • 인력, 장비 등의 공용정보 • 해외과학기술동향, 학술동향 등 심층정보 • 실험 및 실측치 등의 사실정보 • 과학기술 정보화 인후라 구축 • 연구전산망 운영 • 관련기술 응용연구 및 시스템 개발 • 세부분야 전문정보센터 지원육성 및 조정 • http://www.kordic.re.kr
자체 개발 주요 DB 소개(I) • 과학기술 문헌 DB • 출연기관 보유 학술 문헌 (논문단위) 정보 - 123만건 • 서지 사항 및 초록 • 과학기술 관련 50여개 도서관 소장 단행본 종합 목록 - 77만건 • 전자도서관용 원문(Full Text) DB : 총 338만 페이지 • 국가 지원 연구과제 보고서 원문 - 1만6천건 • 국내 학회 발간 논문 원문 DB - 6개 학회 2천9백건 • 이공계 대학 석 박사 학위 논문 구축 중 • KAIST, KJ-IST, 포항공대, 충남대 • 기술동향 정보 • 해외 주재 과학관 등이 수집한 과학 기술 동향 - 1만9천건 • 이공계 분야별 학술 동향 - 4000건
자체 개발 주요 DB 소개(II) • 공용 DB • 과학기술인력 DB - 3만2천건 • 자연공학계 대학 교수, 출연연구소, 기술사 인력 • 출연연구소 소장 기자재 목록 - 3천6백건 • 3만불 이상 고가 장비, 공동 활용 가능성 등 • 과학기술용어 - 3만2천건 • 한, 영, 일 3개 국어 대역 사전 • 사실정보 DB • 연구과정 중에 생성된 사실 자료 모음 - 6만5천건
주요사업 실적 원문 복사 서비스 • (참여 기관 보유) 자료 원문 복사 서비스 • 2000 여종의 전문 학술지 내용 • 123만건: 논문 제목, 저자, 초록 검색 가능 • DB검색후 마우스 클릭으로 간단히 자료 신청 • 우편, Fax, (E-mail)로 신속한 서비스 • 실적 • 총 서비스 건수 : 37,161건 • 1998년 1사분기 : 5,941건 • 총회원 2,261명 확보 • 전자 미디어의 원문 확보 후 Online 서비스 확대 예정
주요사업 실적 전자도서관 서비스 • 국내 학술지 원문, 연구보고서, 학위 논문의 원문 제공 • 자체 기술로 원문 제공 시스템 개발 서비스 중 • 계속적으로 DB 확대 구축 중 • 국가 시범 사업에도 참가 • 국립도서관, 국회도서관, KAIST과학도서관, 학술진흥재단, KORDIC 등의 초고속 통신망 시범사업 • KORDIC의 검색엔진 KRISTAL-II 사용 중
국가전자도서관 시범사업 시스템구성도 인 터 넷 인 터 넷 KAIST 과학도서관 KAIST 학위논문 및 교수연구논문 본문정보 초고속 정보통신망 초고속 정보통신망 국회도서관 입법부발간자료 및 국정감사자료 분문정보 국립중앙도서관 국가문헌종합목록 귀중본 본문정보 한국학술진흥재단 외국취득박사 학위논문 본문정보 연구개발정보센터 과기처연구보고서 및 정보과학회 본문정보 초고속 정보통신망 초고속 정보통신망 인 터 넷 인 터 넷 인 터 넷
Original Texts Digitization Image-Based Full Text Retrieval System Digitized Full Texts (Tiff Format) SERVER CLIENT Manual Information Processing Image Access Controller Tiff Viewer Image Location User Query Information Retrieval System Secondary Information Retrieved Secondary Information HTML Brower
한글 문서의 DB 화 • 다양한 워드프로세서로 만든 파일의 데이타베이스화 • 기존의 석박사 학위 논문 DB화 사업 • KAIST, 광주과기원, 포항공대, 충남대 이공계열 • 도형 및 한글 문제의 해결 • 표준 형식으로 변환 처리 • PostScript(PS) • • Portable Document Format(PDF) • • Device Independent(DVI) • • HTML • Standard General Markup Language(SGML) • ….. • MS WORD (DOC) • HWP (HWP) • LaTeX (TEX)
한글 문서의 전자형태 변환 DVI플러그인사용 PDF 페이지단위 전송가능 PDF변환가능 HWP DOC TEX DVI TEXT KRISTAL 한글보존 한글/영문가능 페이지단위 분할가능 한글/영문가능 현재의 유일한 Solution
주요사업 실적 해외과학기술동향 • 정보원 • 해외 주재 과학관 송고, 국내외 학술 잡지 번역 • 과학재단, 과학기술정책평가연구소 등의 해외 자료 • KORDIC 선발 분야별 전문가( 대학교수 및 대학원생 ) • 20개분야 매주 약 150건 정보 • 다양한 서비스 형태 • 인터넷 Web 서비스 : 키워드 검색 가능 • PC통신: 천리안,하이텔에 주요정보 서비스 • 주간단위 책자 발간 : 정부 기관 및 언론사 등 배포(400부) • 산기협을 통한 3000개 기업에 디스켓으로 정보 공급
주요사업 실적 KRISTAL-II 개발 • 영어 및 한글 문서의 검색 엔진 • 한국어 형태소 분석기 탑재 • 자체 기술력으로 개발 • 93부터 3년간 연인원 약 20명 투입 • 자체 과학기술 정보 서비스에 이용 • 20여 개 기관에서 활용 / 급속 확산 중 • 국가전자도서관 시범사업의 엔진으로 채택 • 기술 전수를 위한 Consortium 구성 • 3-4개 대기업, 10여 개 중소기업 • 20여 개 전문도서관 / 대학
주요사업 실적 분야별 학술 심층 정보 • 과학기술 심층 학술 정보의 종합적 정리 • 분야에 대한 소개, 중요한 논문 정리, 전문 용어 해설 등을 포함 • 과학기술자들이 전공에 관한 정보 교류의 장으로 역할 기대 • 자발적 정보 제공 유도 • 초기 유급 정보제공 전문가 : 100명 • 1997년 11월부터 정보수집 개시 • 현재 265개 분야 3448개 정보
주요사업 실적 학회 정보화 지원 • 학회는 학술활동, 연구결과 정보의 보고 • 국내 학회 사정이 열악하여 많은 정보를 방기 • 논문, 학술발표집을 DB화 : 99000 page • 기존의 자료는 image로 • 신규 자료는 Text 형태로 (dvi로) • Science Town 구축 : 학회 Home Page 모음 • 통신망을 통한 투고시스템 개발 • 논문이 학술자료 DB로 자동 입력되도록 • 96년 정보과학회와 협동으로 개발 • 97년 10개 학회, 98년 30개 학회로 확산 예정
Digital Libraries Initiative -Phase 2 • 1998부터 5년간 연구, $40~50 M • 미국의 NSF, DARPA, National Library of Medicine, Library of Congress, NASA, National Endowment for the Humanities • Program Goals • to advance usability of globally distributed, networked information resources • innovative applications in education, science, engineering, … • social, behavioral and economic implications and effects
DLI-2 Research • Human-Centered Research • Information discovery and Search • browsing and navigating large information space • search of image/video by content, structure and context • semantic search, multilingual information search • User Interface / Collaboration Technologies • Content and Collection Based Research • Efficient data capture, representation, preservation and archiving • Intelligent indexing, abstracting, interpreting, classifying • Text markup systems / NL analysis • Structuring and Linking of information objects and documents • Data Mining, Knowledge Discovery • Social, economic and legal issues / Intellectual property and rights • System-Centered Research • Open network architecture
멀티미디어 내용 검색 • 멀티미디어 내용의 자동 서술이 요구됨 • 들판에 부부가 서서 기도하는 장면 • 심장의 힘찬 박동같은 타악기주도의 교향곡 • US OPEN 골프대회에서 홀인원하는 장면 • 만화를 이해하는 시스템 (?) • 인공지능의 궁극적 목표 • 내용을 기반한 멀티미디어 검색 • MPEG7 Activities
정보 검색 Agent • 정보의 보고 인터넷 • 필요로하는 정보를 스스로 찾아주는 프로그람 • 단순 문자 비교에서 개념적 이해로 • Semantic Network-based • 원하는 정보를, 원하는 때에 • 사용자의 바램을 파악, 학습 • 감성적 대응 • 정보의 정리, 선별 • Intelligent Data Analysis • collection, filtering, transformation, mining, visualization, distribution