1 / 32

정보검색

60110359 나민경 60110366 백은지 60110383 최광선. 정보검색. ● 목차. 1. 정보검색의 의의 2. 정보검색의 역사 3. 정보검색시스템의 기본모형 4. 정보검색시스템의 유형 5. 정보검색의 하위영역 6. 정보검색의 응용영역 7. 정보검색의 국내외 시스템. 1. 정보검색의 의의. 정보검색 (Information Retrieval)

gil-best
Download Presentation

정보검색

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 60110359 나민경 60110366 백은지 60110383 최광선 정보검색

  2. ● 목차 • 1. 정보검색의 의의 • 2. 정보검색의 역사 • 3. 정보검색시스템의 기본모형 • 4. 정보검색시스템의 유형 • 5. 정보검색의 하위영역 • 6. 정보검색의 응용영역 • 7. 정보검색의 국내외 시스템

  3. 1. 정보검색의 의의 • 정보검색 (Information Retrieval) 수집된 정보 자료를 분석, 표현, 조직, 그리고 축적하여 이를 대상으로 이용자가 원하는 정보로의 접근을 제공하는 모든 과정을 의미한다.

  4. - 정보검색 모형 <그림1>정보검색 모형 매칭 함수 문헌의 주제 표현 (document representation) 요구정보 표현 (request representation)

  5. 2. 정보검색의 역사 2.1. 고대의 색인과 검색 • 칼리마쿠스 - 피나케스 목록 각 문헌을 분류하고, 저자, 서명, 크기 등의 속성들을 이용하여 작성한 서지색인 형태의 목록으로, 이를 통해 도서관의 장서 내용을 찾아내고 식별할 수 있도록 한 검색도구.

  6. 2. 정보검색의 역사 2.2.컴퓨터를 이용한 정보검색 • 1950년대 정보검색 시스템의 등장 -키워드 방식을 채택한 최초의 검색시스템 ‘유니텀 시스템 ‘ • 각종 자동화 기법의 등장 • 자동화 기법의 장점과 단점

  7. 2. 정보검색의 역사 2.3. 온라인 검색서비스의 등장 • 1970년대-정보검색의 황금기 MEDLINE, DIALOG, ORBIT등과 같은 온라인 기반의 검색방식을 채택한 데이터 베이스들이 등장 * 이 시기 정보검색의 한계 -정보전문가 없이는 검색이 쉽지 않음 -이용자가 직접 검색할 수 있는 시스템이 없었음

  8. 2. 정보검색의 역사 2.4. 일반화된 검색서비스의 등장 • 1980년대 온라인 목록시스템인 OPAC의 등장 -OCLC, KERIS • 대규모 네트워크형 정보검색 서비스의 등장 -네이버, 야후, 구글 등

  9. 2. 정보검색의 역사 • 2.5. 차세대 검색서비스의 등장

  10. 3. 정보검색 시스템의 기본모형 • 정보 검색 시스템 구축의 기본 목적은 시스템이 지원해야 할 목적을 달성하기 위한 시스템요구사항의 실현과 이용자 요구사항을 충족시킬 수 있는 시스템이어야 한다. 정보검색시스템의 공통된 기본 구조는 크게 축적(storage)과 검색(retrieval) 과정으로 구분된다. 검색과정에서는 (1) 이용자의 정보요구 (2) 질의 내용 분석 (3) 질의 내용을 탐색어로 변환 (4) 색인어와 탐색어의 일치를 위한 어휘통제 또는 자연언어 그대로 사용 (5) 탐색어로 색인파일 탐색 (6) 색인어와 탐색어가 일치되는 정보자료 대조 (7) 일치되는 정보자료의 청구기호 및 서지사항 또는 +초록, 또는 +원문 출력 을 이용자에게 제공한다.

  11. -정보검색시스템의 모형

  12. 4. 정보검색 시스템의 유형 • 전통적으로 정보검색의 대상정보는 주로 텍스트 형식의 전문정보, 경영정보, 디렉토리 정보, 수치정보, 서지정보 등으로 구분되어 왔다. 그러나 최근에는 정보검색의 범위가 확대되어 이미지, 그래픽, 소리, 소프트웨어, 일반문서의 축적 및 검색 등의 다중매체환경으로 변환되고 있다.

  13. 4.1. 축적정보의 내용에 의한 구분 1) 참조정보검색 시스템 (reference retrieval system) : 일차 문헌에 대한 서지정보 및 초록과 같이 정보원에 대한 참조정보(2차정보)를 검색하는 것으로 이를 서지정보검색시스템이라 한다. 지금 까지 대부분의 정보검색시스템이 차지하고 있는 유형이다. 2) 전문검색 시스템 (full-text retrieval system) : 법령, 신문기사, 학술논문, 학위논문 등과 같은 문헌의 전문을 축적하고 이로부터 질문과 관련된 문장이나 문단 또는 전문을 검색하는 시스템이다. 3) 데이터검색 시스템 (data retrieval system) : 인명과 같이 단어로 표현되거나 통계치와 같이 수치로 표현되는 독립된 형태의 데이터 항목을 축적하고 요구에 따라 데이터를 검색하는 시스템이다. 4) 질문응답 시스템 (question-answering system) : 축적된 데이터나 텍스트로부터 질문에 대한 답을 직접 찾아내는 시스템이다. 주로 자연어 형태의 질문을 받아 답을 제공하는 시스템을 말한다.

  14. 4.2. 지능형 정보검색 시스템 1) 전문가 시스템 (expert system) : 전문가 시스템은 인간 전문가가 수행하는 수준의 업무처리 능력과 방법으로 문제를 해결하고, 조언을 해주고, 요구 정보를 찾아 주는 시스템이다. 이 시스템의 특징은 특정 분야의 전문지식을 축적한 지식베이스(knowledge base)로부터 질문의 답을 찾는 것으로, 경험적 지식베이스, 결정을 정당화하고 결과를 설명 시스템 및 답을 찾아가는 추론 엔진 등이 특징이라 할 수 있다. 2) 하이퍼텍스트 시스템 (hypertext system) : 전통적인 텍스트는 순차적으로 구성되어 있어 기능적으로 하나의 개념을 다중 적으로 건너뛰거나 연결하는 것이 불가능하다. 하이퍼텍스트 시스템은 텍스트 는 물론 소리, 화상, 문자 등 연관성이 있는 다양한 정보들을 연결해서 엮어낼 수 있는 기능을 갖는다. 최근 하이퍼텍스트 기능을 갖는 정보시스템이나 소프트웨어가 많이 개발되고 있다 그 대표적인 예로 인터넷의 WWW 을 들 수 있다.

  15. 4.3. 선택적 정보제공 시스템(SDI : Selective Dissemination of Information • 새로 입수되는 각종 정보자료를 이용자에게 알리는 서비스로 최신정보의 주지를 목적으로 한다. 즉, 특정 개인이나 단체가 필요로 하는 주제나 관심 있는 주제를 선정, 등록하여 놓고(user interest profile), 신착 자료가 입수될 때마다 등록한 이용자에게 관련 자료의 입수를 자동적으로 알려주는 시스템을 말한다.

  16. 4.3. 선택적 정보제공 시스템(SDI : Selective Dissemination of Information)

  17. 5. 정보검색의 하위영역 5.1. 색인 정보자원을 표현하고 검색하는 도구의 의미가 부여된, 즉, 서지도구로서의 색인은 정보자원의 내용을 분석하고, 그 내용을 나타낼 수 있는 주요 개념들을 추출하여, 원래의 정보자원을 대표할 수 있도록 한 것이다. 색인은 방대한 정보자원들을 대상으로 작성되기도 하고, 특정한 정보자원의 본문내용에서 작성되기도 한다. 따라서 특정한 정보자원이나 정보 내용을 식별하고, 선택하고, 접근하도록 해준다. 즉, 색인은 다양한 용도로 사용되고 있다. 검색도구로서의 색인은 정보자원의 내용을 대표하도록 하여 이용자와 정보원을 연결시켜주는 중간 매체의 역할을 한다(윤구호 2001). 이러한 색인의 기능은 두 가지로 정리될 수 있다. 첫째, 이용자에게 정보가 어디에 있는지 찾을 수 있도록 정보의 위치를 알려주는 정보의 지시기능이다. 둘째, 그렇게 찾은 정보가 이용자가 원하는 정보인지를 선별할 수 있게 하는 정보의 선별기능이다. 이러한 선별기능과 지시기능은 검색도구로서의 주요한 역할이다.

  18. 5. 정보검색의 하위영역 5.2. 초록 검색 결과의 수량이 방대하고, 원문에 접근하는데 어떤 제약이 있거나, 또는 원문을 일일이 읽어나갈 만큼의 시간적 여유가 없을 경우, 서지정보를 토대로 확인할 수밖에 없다. 이처럼 서지정보는 원문의 내용을 확인하는데 유용한 정보들로 구성되어 있으며, 이 중에서 가장 유용한 것이 ‘초록’이다. 초록(abstract)은 정보 자료의 본문 내용을 간결하고 포괄적으로 기술한 것으로 해당 문헌이 이용자의 목적에 적합한가를 결정하도록 하여 문헌의 선별을 용이하게 한다(장혜란 1996). 즉, 초록은 정보 자료에 수록된 내용을 요약해서 제공하는 것으로 정보자료의 대용물이라고 할 수 있다. 그리고 초록은 정보검색 시스템에서 정보 축적 및 탐색을 위한 키워드의 추출에 이용되기도 한다(최인숙 1989). 5.3. 데이터베이스 데이터베이스는 저장매체에 저장된 데이터로서 한 조직체의 운영데이터 뿐만 아니라 그 데이터에 관한 설명을 컴퓨터 기억장치 내에 모아놓은 집합체이다.

  19. 6. 정보검색의 응용 • 정보검색은 우리의 생활 곳곳에서 다양하게 응용되고 있다. 또한 인문, 사회과학, 의학, 과학 등등 다양한 학문의 분야에도 이용된다. 특히 정보가 쏟아져 나오는 오늘날 같은 정보화 시대에서 원하는 정보를 찾는 정보검색은 더욱 더 중요하게 여겨지며, 일을 더 쉽게 처리하거나 효율적으로 하기 위해서 정보검색은 다양한 곳에서 널리 응용되고 있다.

  20. 6.1.음성데이터베이스로부터의 효율적인 색인데이터베이스 구축과 정보검색 • 전자도서관과 같은 정보제공원은 이미지, 음성, 동영상 등과 같은 비정형 멀티미디어 데이터 서비스에 대한 요구를 받고 있다. 그리하여 음성 처리를 위해 어절생성기, 음절복원기, 형태소분석기, 교정기를 제안하였다. 제안한 음성처리 기술로 음성데이터베이스를 텍스트데이터베이스로 변환한 후 텍스트데이터베이스로부터 색인데이터베이스를 추출하였다. 그리고 추출한 색인데이터베이스로 텍스트와 음성의 내용기반정보검색에 활용할 수 있음을 보이기 위해 정보검색모델을 제안하였다.

  21. 6.2. 자동분류 알고리즘을 이용한 지능형 정보검색시스템 구축에 관한 연구 • 전문적인 정보를 정확히해결하기 위해서는 상당히 많은 시간이나 노력 그리고 비용 등이 요구되는 것이 사실이다. 그 이유는 소수의 전문가들을 제외하고는 특정주제 분야에 대한 지식구조를 제대로 파악하고 있지 못하기 때문이다. 따라서 이와 같은 문제를 해결하기 위해 이용자의 탐색 행태, 시스템의 정보 구축 행태를 활용한 지능형검색시스템을 구현한다. 이와 같은 지능형 검색시스템을 구축하기 위해선 귀납학습 방법을 통한 자동색인 알고리즘, 자동분류 알고리즘, 자동 정보 검색 알고리즘들이 결합되어야 가능할 것이다. 따라서 본 연구에서는 이들 각 알고리즘에 대한 선행 이론들을 조사하고 본 연구의 목적에 부합되는 알고리즘을 선택해 이를 적용한 지능형 검색시스템을 구축할 것이다.

  22. 6.3. 내과 외래환자에게 필요한 의료정보검색 • 정보전달매체가 발달하면서 환자들이 얻을 수 있는 정보의 양은 점점 늘어나고 있다. 하지만 이러한 양의 증가는 질적 증가와 비례하지 않는다. 환자들이 가장 쉽게 접할 수 있는 매체가 바로 인터넷이다. 하지만 인터넷은 자료의 양은 방대하지만 불확실하고 신뢰성 없는 정보가 많아 잘못 사용하면 환자의 증상을 악화시킬 우려가 있다. 본 연구는 이러한 인터넷 환경 속에서 개인 내과의원을 방문하는 주된 환자들의 질병을 파악하여 이들이 필요로 하는 질병의 정보를 인터넷에서 어느 정도 구축되어 있는지 조사하고 이런 내과 개원의 외래를 찾는 환자들이 필요로 하는 의료정보가 어떤 웹사이트에 존재하는지를 내과 개원의 의사 입장에서 조사하여 이를 필요로 하는 환자를 위해 조사해 보고자 하였다.

  23. 7. 정보검색의 국내외 시스템

  24. Riss • (학술연구정보서비스) 7.1. 국내 시스템 국내 최대의 학술연구 정보서비스로서, 전국 4년 제 대학이 100%참여하는 학술정보 공동활용체를 기반으로 대학이 생산/보유/ 구독하는 모든 학술자원을 공동으로 사용할 수 있도록 개방된 서비스를 제공한 다.

  25. (2) 한국학술정보(kiss) 한국학술정보㈜에서 제공하는 국내학회지 원문검색 시스 템으로 현재 1,217개 학회 및 연구소에서 발간하는 1,361종의 간행물을 서비 스 한다.

  26. (3) Dbpia 국내학술지 전자저널로써, 국내학회 및 정부간행물, 일반간행물을 발행 하고 있는 625개 기관의 1,248여종의 간행물에 대한 원문을 제공한다.

  27. (4) 특허정보 검색시스템 국내·외 지식재산권에 대한 모든 정보를 데이터베이스로 구축하여 누구나 인터넷을 통해 무료로 이용할 수 있도록 제공하고 있는 특허정보 검색서비스이다.

  28. (1) Springer 7.2. 국외 시스템 Springer에서 출판되는 전자저널로 인문, 사회, 자연, 공학 전분 야의 1,600여종에 대한 원문을 제공한다.

  29. (2) Emerald Emerald의 전자저널로 경영, 경제, 사회복지, 문헌정보학, 공학, 교육, 사 회과학 등 111 여종의 학술지에 대한 원문을 제공한다.

  30. (3) ASP 전 학문 분야를 포함하며, 저널에 대한 색인과 초 록을 제공하고 4838여종의 저널에 대한 원문을 제공한다.

  31. (4) CAJ 문학/사학/철학 분야의 중국전자저널(China Academic Journal) 730여종 제공한다.

  32. · 김현희. 2011. 텍스트 멀티미디어 정보검색. 고양 : 조은글터. · 이수상. 2011. 정보검색의 세계. 서울 : 한국도서관협회. · 이경호, 정영미, 권도윤. 2010. 정보검색의 이론과 실제. 대구 : 인쇄마당. · 한규성, 오기욱. 2002. 인터넷과 정보검색. 서울 : 한올출판사. · 박미성. 2004. “음성데이터베이스로부터의 효율적인 색인데이터베이스 구축과 정보검색”. 한국도서관정보학회지, 35(3) : 271-291. · 서휘. 2008. “자동분류 알고리즘을 이용한 지능형 정보검색시스템 구축에 관한 연구”. 한국도서관정보학회지, 39(4) : 283-304. · 김용흔. 2006. “내과 외래환자에게 필요한 의료정보검색”. 석사학위논문. 순천향대학교. · 최용석, 최기선. 2003. “과도한 지식을 요구하지 않는 공동 기반축에 의한 용어 번역과 한영 교차 정보검색에서의 응용”. 인지과학, 14(1) : 29-40. - 참고문헌

More Related