380 likes | 927 Views
2. 온톨로지의 분류와 용도 온톨로지는 사용 목적과 범위 등이 매우 다양하여 형식이나 내용면에서 종류가 많다 . 다양한 온톨로지의 분류 , 기능적 특성 , 사용목적을 알아본다 . 시맨틱 웹에서의 온톨로지의 역할도 간략하게 다룬다 . 1. 온톨로지의 분류 형식성 , 추론 메커니즘의 유무 적용범위 표현 언어. 1.1 형식성과 추론메카니즘의 유무에 따른 분류 온톨로지는 형식성 (formality) 의 정도에 따라 단순한 용어사전에서부터 복잡한 논리언어 기반의 온톨로지까지 그 범위와 종류가 다양하다 .
E N D
2. 온톨로지의 분류와 용도 • 온톨로지는 사용 목적과 범위 등이 매우 다양하여 형식이나 내용면에서 종류가 많다. • 다양한 온톨로지의 분류, 기능적 특성, 사용목적을 알아본다. • 시맨틱 웹에서의 온톨로지의 역할도 간략하게 다룬다. 1.온톨로지의 분류 • 형식성, 추론 메커니즘의 유무 • 적용범위 • 표현 언어 지능스마트응용 연구실
1.1 형식성과 추론메카니즘의 유무에 따른 분류 • 온톨로지는 형식성(formality)의 정도에 따라 단순한 용어사전에서부터 복잡한 논리언어 기반의 온톨로지까지 그 범위와 종류가 다양하다. • 추론메커니즘의 유무 역시 형식성의 정도에 영향을 받는 데, 형식성의 정도가 약한 온톨로지일수록 추론능력이 떨어진다. • 형식성의 정도에 따른 분류 • 비형식적(informal) 온톨로지 • 구조화된비형식적(structured-informal) 온톨로지 • 반형식적(semi-formal) 온톨로지 • 형식적(formal) 온톨로지 지능스마트응용 연구실
그림 2-1 온톨로지 형식성의 정도에 따른 분류 지능스마트응용 연구실
1.1.1 비형식적 온톨로지 • 자연어로 자유롭게 표현되고최소한의 형식적 구조를 가짐 • 따라서 인간이 읽고 이해하기는 쉽지만, 소프트웨어 에이전트가 해석하고 처리하는 것이 용이하지 않다. • 일반 사전(dictionary), 용어사전(glossary) 등 • 예: 정보통신(IT) 용어사전[그림 2-2] • 한국정보통신기술협회가 제작한 용어사전 • 정보통신에서 쓰는 용어의 개념을 풀이 • 특별한 형식이나 규칙없이 나열 지능스마트응용 연구실
1.1.2 구조화된 비형식적 온톨로지(structured-informal) • 비형식적 온톨로지보다는 체계적인 구조를 갖춘 형태로 표현 • 명확성을 높이고 모호성을 줄인 온톨로지, 반비형식적(semi-informal)온톨로지라 부른다. • 각개념에 대한 정의는 자연어로 표현되지만, 개념들 간의 관계가 구조적으로 연결이 되어있다. • 예: 시소러스(thesaurus), 계층분류(taxonomy), EDI(Electronic Data Interchange) • [그림 2-3] 컴퓨터 언어들에 대한 계층분류의 일부 표현 • 컴퓨터 언어에 대한 분류체계를 분류법 형식과 유사하게 계(界, Regnum), 문(門, Phylum), 강(綱, Class), 목(目, Order), 과(科, Family), 속(屬, Genus)의 6단계로 분류 • 특정 컴퓨터 언어가 어디에 해당하는지 표현 지능스마트응용 연구실
1.1.3 반형식적 온톨로지(semi-formal) • 컴퓨터가 이해할 수 있는 형식적 언어로 표현한 온톨로지 • 엄격한 형식적 시맨틱(formal semantic)을 적용하지는 않지만 명확한 형식적 신택스(formal syntax)를 제공하기 때문에 온톨로지 구축 시 문법적 오류를 피할 수 있다. • XML Schema, XML DTD(Document Type Definition), UML(Unified Modeling Language), ER(Entity-Relationship)모델 등과 같은 개념모델(conceptual model), database scheme • XML Schema:[코드2-1] 노트북에 대해 명확한 형식적 신택스 제공 • ‘노트북’에 대한 데이터 항목 정의 시 문법적인 제약사항 명시 • 라인 6~10 : ‘모델명’,’CPU’는 문자열(string)로, • ‘메모리’,’가격’은 양의 정수(positiveinteger) • ‘DMB지원’은 불(boolean)값으로 기록 • 형식성을 지니고 있기 때문에 컴퓨터가 처리하기에 더 용이 지능스마트응용 연구실
XML스키마의 예 지능스마트응용 연구실
1.1.4 형식적 온톨로지(formal) • 주로 논리에 기반한 형식언어로 표현한 온톨로지 • 형식적 시맨틱(formal semantic)을 적용하기 때문에 표현력(expressivity)이 풍부하고 추론 규칙(inference rule)에 대한 정의를 포함시킬 수가 있다는 특징이 있다. • 예: 형식적 계층분류(formal taxonomy), 시맨틱 네트워크(semantic network), 프레임(frame), 기술논리(description logic), PDF Schema, OWL(Web Ontology Language) 등 • OWL -- [코드 2-2] ‘컬러 레이저 프린터’라는 클래스를 형식적으로 정의한 것이며 이것은 ‘컬러프린터’와 ‘레이저 프린터’의 하위클래스(subclass)임을 보여준다. 지능스마트응용 연구실
라인 1: ‘owl : Class’ - 임의의 기능들을 공유하는 프린터를 묶어 ‘컬러 레이저 프린터’란 클래스를 만들 수 있게 한다. • 라인 2: ‘rdfs : subClassOf’ - ‘컬러 레이저 프린터’ 클래스에 속하는 모든 인스턴스들이 ‘컬러 레이저 프린터’ 클래스의 인스턴스도 된다는 의미 • --- 온톨로지의 도메인과 각 개념의 상호 역학적인 흐름을 묘사할 수 있는 표현력을 제공할 뿐만 아니라 새로운 사실의 추론 및 정보검색에서도 중요한 역할을 수행한다. • 라인 5,8~10 : ‘rdfs : resource’ - 이미정의되어 있는 자원을 명시할 수 있도록 해준다. 지능스마트응용 연구실
1.2 적용 범위에 따른 분류 • 온톨로지는 추상화의 정도에 따라 상위(upper-level) 온톨로지와 하위(lower-level) 온톨로지로 구분 • 상위 온톨로지란 다양한 영역에 적용될 수 있는 기본적이고 보편적인 개념, 즉 보편성에 초점을 두고 있기 때문에 특정영역에 종속되지 않는 온톨로지이다. • 주로 상식적인 개념들을 모델링함으로써 일반적으로 이해하고 있는 현실세계를 표현하고자 한다. • 추상적이거나 철학적 또는 일반적 개념에 한정되어 있기 때문에 기본(foundational) 온톨로지 또는 일반(universal ) 온톨로지라고도 부른다. • 하위 온톨로지는 보편성을 추구하지 않고 경계가 있는 특정영역의 현실세계를 구체화하는 것을 목적으로 한다. • 특정 영역이나 분야에 한정된 시각에서 그 영역의 개념과 개념간의 관계를 모델링함으로써 특정 영역을 추상화하고 체계화하고자 한다. 지능스마트응용 연구실
온톨로지의 적용범위에 따른 분류 지능스마트응용 연구실
1.2.1 상위 온톨로지 • (1)일반상식 온톨로지 • 사물, 이벤트, 시간 등과 같이 여러 분야에서 공통적으로 사용되는 개념을 일반화(generalization)시킨 것 • 번지(Bunge) 온톨로지, 오픈사이크상위 온톨로지(OpenCyc Upper Ontology), 소와(Sowa)의 상위 온톨로지(Upper Ontology), SUMO(Suggested Upper Merged Ontology) 등이 있다. • ① 사이크(Cyc) 온톨로지 : 1980년대 CycCorp에서 일반 상식을 담고 있는 지식베이스를 만들기 위해서 만들어진 온톨로지이다. • 상위온톨로지와 마이크로이론(microtheories)로 불리는 여러가지 도메인 온톨로지들로 구성 • 상위 온톨로지는 인간의 지식 중에 가장 기본적인 개념 및 그들의 관계를 담고 있다. • 사이크 온톨로지는 2001년 오픈사이크(OpenCyc)라고 불리는 사이크 온톨로지의 일부가 웹사이트를 통해 공개되었고, 이것을 오픈사이크 온톨로지라 하며, 누구나 참조하고 사용할 수 있기 때문에 IEEE SUO에서 진행하는 표준화된 상위 온톨로지 후보 중 하나이다. 지능스마트응용 연구실
오픈사이크(OpenCyc) 상위 온톨로지 • 최상위 개념은 어떠한 속성도 가지지 않는 Thing(사물)이며, 이는 Individual(개별적인 것), PartiallyIntangible(부분적으로 무형인 것), MathematicalOrComputationalThing(계산 가능한 것) 중에 하나에 반드시 속한다고 보았다.(Noy and Hafner, 1997) • CycL이라는 온톨로지 언어로 구축되어었다. 지능스마트응용 연구실
② 소와(Sowa)의 상위 온톨로지 • 1995년 존 소와(John F. Sowa)가 철학, 언어학, 논리학, 인공지능 등에서 사용되는 개념을 바탕으로 제안한 것이다. • 구별성(distinction), 결합성(combination), 제한성(constraint)의 세가지 원칙을 바탕으로 디자인 • 최상위 개념인 Thing(사물)을 중심으로 다시 Independent(독립적인 것), Relative(관련있는 것), Mediating(중재하는 것), Physical(물질적인 것), Abstract(추상적인 것)으로 나누었고, 총 27개의 개념으로 분류된다.(Spwa, 2000) • ③ SUMO(Suggested Upper Merged Ontology) • 이안 나일즈(Ian Niles), 애덤 피즈(Adam Pease)가 개발 • 소와의 상위 온톨로지, 스튜어트 러셀(Stuart Russell)과 피터 노비그(Peter Norvig)의 온톨로지(Russell and Norvig,1995) 등을 병합해서 만들어졌다. • 최상위 개념은 Entity(실재)이며, 모든 Entity는 Physical(물질적인 것) 혹은 Abstract(추상적인 것)로 분류된다(Niles and Pease,2001). 지능스마트응용 연구실
(2) 언어(linguistic) 온톨로지 • 애플리케이션이나특정영역에 상관없이 사람이 온톨로지를 사용하는 데 있어서 자연어를 이용할 수 있도록 지원하는 역할을 담당한다. • 일반화된 상위 온톨로지(GUM : Generalized Upper Model), 워드넷(WordNet), 펜맨 상위 온톨로지(Penman Upper Model) 등이 있다. • 예: GUM • 특정 도메인에 속하지 않는 일반적인 업무와 주된 언어 개념, 그리고 그 개념들이 언어로 어떻게 구성되는지에 대한 정보만을 담고 있어, 여러 종류의 언어로 자연어 처리를 가능하도록 한다. • Um-Thing을 최상위 개념으로 인식 • Um-Thing은 Upper Model의 최상위 개념 Thing을 의미하며, 다시 Configuration(구성), Element(요소), Sequence(순서)로 나누어 진다. • LOOM 언어로구축되었다(Baterman et al.,1995) 지능스마트응용 연구실
(3) 메타데이터(metadata) 온톨로지 • 온라인및 오프라인 데이터 간의 상호운용성(interoperability)을 제공하기 위한 것 • 메타데이터에서 사용하는 어휘를 표준화시켜 정보검색이 보다 용이하게 이루어질 수 있도록 지원한다. • 대표적인 예: 더블린코어(Dubline Core) • 미국 국립 정보 표준화 기구(NISO: National Information Standards Organization)에 의해서 추진된 메타데이터 표준 • 웹 기반의 메타데이터를 인덱싱하고, 검색하는 기존의 방법을 보완하는데 사용된다. 지능스마트응용 연구실
1.2.2 하위 온톨로지 • 구체적인 내용을 다룬다. • 영역(domain), 과업(task), 방법(method), 응용(application) 온톨로지로 구분 • (1) 영역 온톨로지 • 비즈니스 분야의 앤터프라이즈(Enterprise) 온톨로지, TOVE(Toronto Virtual Enterprise)와 같이 특정한 도메인에서 사용하는 지식을 개념화한 온톨로지이며, 그 해당 도메인에서만 재사용이 가능 • (2) 과업 온톨로지 • 일반적인 문제 혹은 특정 도메인에서 발생하는 문제를 해결하는데 사용되는 어휘(명사, 동사, 형용사 등)를 제공 • 예: 아이스크림회사의 일 처리시 사용되는 과업 온톨로지있다고 가정과업 온톨로지는 명사 온톨로지와 동사 온톨로지로 구성 • 명사 온톨로지 : 생산하는데 자주 사용되는 명사, ‘목표(goal)’, ‘스케줄 (schedule)’, ‘재료(material)’ 등과 같은 개념 포함 • 동사 온톨로지 : 제조하는데 자주 사용되는 동사, ‘만들다(make, produce)’, 보관하다(hold, keep)’, ‘배송하다(deliver, distribute)’ 같은동사형의 단어를 논리적인 계층구조로 모델링하여 과업간의 관계를 정의 지능스마트응용 연구실
(3) 방법 온톨로지 • ‘추론과정을 지원할 때 적용될 수 있는 특정업무와 관련된 개념’과 ‘그 개념들 간의 관계에 대한 정의’를 제공하여 해당 업무를 성공적으로 마무리할 수 있도록 돕는 데 사용 • 영역 온톨로지와 비슷하지만, 일을 처리하는 방법을 기준으로 온톨로지를 구축한 것 • 예: 아이스크림 회사의 경우 • 아이스크림 상품을 ‘기획’, ‘제조’, ‘유통’, ‘판매’하는 것과 관련되어 사용되는 개념들의 관계를 논리적으로 연결하여 특정 단계에서의 일을 처리하는데 도움을 준다. • (4) 응용 온톨로지 • 해당 애플리케이션에서 다루는 지식을 모델링하는 데 필요한 개념을 모두 포함하기 때문에 애플리케이션에서의 활용도가 높다, 하지만 다른 애플리케이션에서 재사용할 가능성은 낮다. • 예 : 의학분야의 통합의학언어시스템 (UMLS : Unified Medical Language System) • 병원에서환자 진료 시 필요한 의학용어들을 모아놓은 온톨로지이기 때문에 의학분야가 아닌 다른 분야에서 이 온톨로지를 재사용하는 일은 드물다. 지능스마트응용 연구실
2. 온톨로지의 사용 목적과 중요성 • 온톨로지는 특정영역의 지식을 모델링하고 처리하여 구성원 간의 지식 공유 및 재사용을 가능하게 하는 아주 중요한 요소 • 온톨로지는 지식표현, 지식베이스, 지식검색, 지식관리, 정보시스템 개발, 비즈니스 프로세스 모델링, 표준화, 기업 정보시스템 통합, 정보시스템 평가, 시맨틱 웹 구축 등의 다양한 용도로 사용 • 온톨로지의 사용 목적 • 시맨틱 상호운용성 • 표준화 • 커뮤니케이션 • 지식관리 및 검색 • 목적은 지식의 공유와 재사용의 관점에서 볼 때 서로 밀접한 관련성을 가지고 있다. 지능스마트응용 연구실
2.1 시맨틱 상호운용성(Semantic Interoperability) • 상호운영성의 의미 : 상이한 정보시스템들이 각각의 고유한 자율성과 다양성을 유지하면서 마치 하나의 시스템처럼 운용되는 것 • 기업이 관리하고 있는 대부분의 정보는 서로 호환되지 않는 다양한 형태로 기존시스템에 저장되어 있다. • 예 : 서로 다른 기업이나 부서가 동일 제품을 두고 상이한 제품명 또는 제품번호를 사용하거나, 각각에 적합한 도량단위 표준 (킬로그램, 온스, 미터, 마일, 인치 등)을 채택하여 제품의 특징 기록하는 경우 • 각 시스템이 저장하고 있는 정보의 형식이나 포맷, 내용의 이질성으로 상호정보 공유 및 교환 시 많은 문제 발생 • 점점 더 많은 기업이 온라인 시장 진출, 합병 또는 협력업체들과의 고급망관리(SCM) 구축 등 새로운 비즈니스가 올 때마다 이종 시스템 간의 통합이나 상호운용성 문제에 부딪치게 된다. 지능스마트응용 연구실
포레스트 리서치(Forrest Research)보고 – 98%의 회사가 IT전략 중 시스템 통합이 ‘극히 중요’하거나 ‘아주 중요’하다고 함 • 예 : 이종 시스템 간에 실시간으로 정보를 공유해야 하는 경우 (RTDI:Real Time Data Integration이라 부름) • 각 시스템에 저장되어 있는 정보의 의미나 논리적 구조의 이질성에 따른 데이터 비호환성을 실시간으로 탐지하고 해결할 수 있는 능력을 시스템이 가지고 있어야 한다. • 그러나 대부분 정보를 공유하기 위해 기존 시스템을 수정해야 하는 경우가 많다. 이는 개별 시스템의 독립성과 자율성을 저해 • 이처럼 다양한 이종 시스템들을 서로 연동시키거나 통합할 경우 각 시스템들의 독립성과 자율성을 최대한 보장하면서도 발생할 수 있는 여러 형태의 의미충돌(semantic conflict)을 관리할 수 있는 시스템 환경을 구축한다는 것은 대단히 어렵다. • 바람직한 시스템 환경 인프라는 통합구조에 주요한 변경없이 개별 시스템을 손쉽게 추가하거나 제거할 수 있는 유연성을 가져야 한다. • 시스템 간의 상호운용성은 다양한 정보시스템에 저장되어 있는 정보에 접근하려고 하는 기업들에게는 매우 중요한 이슈 지능스마트응용 연구실
상호운용성의 종류 • (1) 신택틱 상호운용성(syntatic interoperability) • XML 기반의웹 서비스에서 사용되는 WSDL(WebService Description Language), SOAP(Simple Object Access Protocol) 등과 같은 표준화된 프로토콜을 사용하여 상이한 소프트웨어 컴포넌트간에 메시지를 주고 받음으로써 시스템 간의 상호운용성을 제공 • (2) 시맨틱 상호운용성(semantic interoperability) • 정보 자체에 구체적으로 나타나 있지 않는 암시적 의미나 내재하는 규칙까지도 상호 이해하여 이종 시스템 간에 정보의 의미까지도 공유할 수 있는 능력 • 예 : 대학이라는 영역에서의 평점 3.8(미네소타 주립대학교와 국립서울대학교) - 같은 3.8이지만 의미는 다르다 • 정보를 상대방에게 전달 시 정보 그 자체에 숨겨져 있는 암시적 의미까지 일일이 설명하지 않기 때문이며, 여러 정보 시스템으로부터 정보를 검색할 때나 시스템을 통합할 때에 항상 직면하는 문제 • 문제 해결은 ? 지능스마트응용 연구실
시맨틱 상호운용성을 제공해 줄 수 있는 핵심기술– 온톨로지 • 온톨로지를 이용해 데이터의 의미를 기술할 수 있다 • 온톨로지를 사용하여 다양한 형태의 의미 충돌을 해결 가능 • 관련 집단의 구성원들 사이에서 합의하여 도출된 개념화를 통해 구축한 온톨로지를 이종시스템 간의 상호이해와 시맨틱 조정을 위한 기반으로 사용 • 시스템 간의 시맨틱 이질성을 해결, 시맨틱 상호운용성을 제공하는 매우 중요한 기술이 된다. • 예 : SCROL(Semantic Onflict Resolution Ontology) 이종 데이터베이스(heterogeneous database)간의 정보 공유 시 발생할 수 있는 다양한 의미 충돌을 자동적으로 탐지하고 해결해 주는 온톨로지 지능스마트응용 연구실
온톨로지를 사용하지 않고 여러 시스템이 정보를 공유하고자 한다면 문제가 야기된다. • [그림 2-7(a)] 온톨로지를 사용하지 않을 경우 참여한모든 시스템이 서로 데이터를 매핑하여 필요시에 변환하여야 함n(n-1) • [그림 2-7(b)] 온톨로지를 통해데이터 변환은 2n • 그림 2-7 시스템 간의 데이터 변환이 필요한 경우의 수 • (a)온톨로지없이시스템간직접정보공유 (b)온톨로지를매개로한시스템간의정보공유 지능스마트응용 연구실
2.2 표준화 • 온톨로지는구성원들간에지식의 공유를가능하게한다, 즉이해관계가있는모든구성원에의해공유되고사용될 때가치가있다. • 온톨로지는 특정영역의개념구조를합의된지식으로표현한것. 특정영역에사용되는개념을표현하는단어들과그것들의관계를계층적 구조로나타냄으로써구성원모두가사회적합의하에사용할수있는일종의표준명세인 것이다. • 전자상거래에서글로벌인프라의역할을수행할수가있다. • 예 : 전자상거래의개방형표준인 ebXML, 로제타넷등에서표준화된온톨로지사용 • 표준화는시맨틱상호운용성과도깊게연관되어있다. • 환자의진료정보를전자차트에담는전자의무기록(EMR)에서의문제 : 의사들의진료기록이나처방내역이천차만별이니통일하기가쉽지않다. 가령가슴통증은 ‘흉통’,’가슴아픔’,’가슴저림’,등으로쓰며통증도 ‘찌릿하다’, ‘쿡쿡쑤신다’식따라서 EMR의 궁극목표가불가능 • 이런경우진료관련용어들을온톨로지를통해표준화한다면환자정보를손쉽게공유가능 • 온톨로지는표준명세로서의역할을수행하기때문에응용 프로그램사이의정보 , 지식의공유를수월하게한다. • 즉, 표준화된온톨로지는특정영역의지식을문서화하고재사용할수있는기능을제공하는장점도있다. 지능스마트응용 연구실
2.3 커뮤니케이션 • 온톨로지는개념적으로나 용어적으로 혼돈을 줄 수 있는 부분들을 단일화된 구조로 명시함으로써 서로 다른 견해나 생각을 가진 구성원들 사이에 공유된 이해(shared understanding)와 커뮤니케이션(communication)을 촉진한다. • 예1: ‘자동차’라고 말할 때, 이것이 ‘트럭’과 ‘버스’도 포함하는 것인지 아닌지? 이 경우 ‘자동차’의 범위를 규정, 의미를 정확히 정의한다면 상호간의 의사소통을 원활히 할 수 있으며, 합의를 통해 동일개념의 하나의 통일된 용어를 선택하고, 그 단어가 나타내는 개념을 명확히 정의함으로써 커뮤니케이션 시 발생할 수 있는 오해를 줄일 수 있다. • 예2 : 내가 말하는 ‘강의’와 다른 구성원이 말하는 ‘수업’의 의미가 똑같다면 이를 하나의 용어로 통일시켜 의사소통 시에 야기되는 혼동을 방지할 수 있다. • 온톨로지는 응용 프로그램이나 소프트웨어 에이전트들이 특정 분야의 개념들이 지닌 의미를 정확히 이해할 수 있도록 하여 컴퓨터 간의 커뮤니케이션을 가능하게 한다. • 예 : 전자상거래 분야에서 소프트웨어 에이전트 기반의 구매협상을 위한 커뮤니케이션의 한 수단으로서 자동협상시스템(automated negotiation system)을 구축 시 매우 중요한 역할을 한다. • 소프트웨어 에이전트간에 커뮤니케이션을 할 경우, 협상을 위한 커뮤니케이션 어휘, 협상 프로토콜 관점에서 각 어휘의 의미를 제공하는 것이 중요 • 예: 가격에 관한 협상 시 ‘가격’이란 용어가 의미하는 것에 따라 협상의 내용이 달라질 수 있다.(화폐단위, 어느 나라’달러’,가격이 포함하고 있는 내용) • 온톨로지는 컴퓨터를 포함한 특정분야의 구성원들에게 공통의 이해를 증진시킴으로써 상호 커뮤니케이션을 활성화시킬 수 있다. 지능스마트응용 연구실
2.4 지식 관리 및 검색 • 버클리대학의 한 연구에 지난 2002년 이전 30만년 동안 인류가 누적한 정보를 디지털화했을 경우의 정보량보다 2002년 부터 2005년까지 인류가 생산한 정보의 양이 훨씬 많을 것이라 한다. • 인터넷 등 IT발달로 방대한 양의 정보에 손쉽게 즉각적으로 접근하는 것이 가능하게 되었지만 최소한의 노력으로 우리 자신이 꼭 필요로 하는 지식을 정확하게 검색하는 것이 갈수록 어려워짐 • 과거에는 지식이 주로 전형적인 데이터베이스에 구조화된 형태로 저장되고 관리되었지만, 요즘은 반구조화(semi-structured) 또는자유형식(unstructured)의 텍스트나 멀티미디어 형태의 지식이 많아 이를 체계적으로 저장,관리하며 여기서 필요한 지식을 추출해내는 것을 어렵게 하고 있다. • 따라서 짧은 시간 내에 오직 자신이 필요로 하는 지식을 찾는 것이 매우 중요한 문제로 대두 • 근본적인 문제는 관련 정보를 어떻게 효율적으로 처리하느냐가 아니라 어떤 정보가 관련이 있고, 그 정보가 어디에 있는지를 정확하게 찾아내는 것이다. • 온톨로지는 광대한 정보 공간 속에서 우리의 지식관리 및 검색능력을 향상시키며, 온톨로지를 이용하여 지식 검색 시 특정용어와 관련된 다른 지식까지의 검색도 가능하게 해 준다. • 예 : ‘오사마 빈 라덴’ 검색 시 알카에다 조직, 탈레반과의 관계, 그와 관련된 여러 인물들의 검색도 가능 지능스마트응용 연구실
온톨로지를 이용하여 단순한 검색어 기반의 매칭기술(keyword matching)이 아닌 보다 지능적인 시맨틱 기반의 검색과 필터링(filtering) 기술로 각 개인이 사용하는 용어의 차이에 관계없이 정확히 필요한 정보만을 검색하는 것이 가능 • 만일 검색엔진과 사용자가 온톨로지의 도움을 받는다면 동일한 검색어지만 다른 의미를 지닌, 즉 관련이 없는 정보를 검색하는 경우를 피할 수 있다. • 예 : 소금(salt)에 관한 정보 검색시 온톨로지를 이용한다면 소금(小金)에 관한 정보까지 추출하는 것을 피할 수 있다. • 온톨로지는 이 두 개념이 같은 단어를 사용하지만 다른의미를 지닌다는 것을 알고 있기 때문이다. • 이러한 검색이 가능하려면 우선 웹에 있는 정보들의 의미가 무엇인지를 컴퓨터가 이해할 수 이해할 수 있는 형태로 표현되어야 하며 온톨로지에 매핑되어야 한다. • 이것의 좋은 예가 바로 시맨틱 웹 지능스마트응용 연구실
3. 온톨로지와 시맨틱 웹 • 온톨로지의 개념구조를 이용한 지식 시스템의 구축은 시맨틱 웹을 통해 잘 구현될 수 있다. • 시맨틱 웹은 웹(WWW)의 확장된 개념으로서 웹 정보에 잘 정의된 의미를 부여하여 인간뿐만아니라 컴퓨터도 그 정보의 의미를 이해하고 처리할 수 있는 웹 • 시맨틱 웹은 팀 버너즈 리(Tim Berners-Lee)의 비전에서 출발 지능스마트응용 연구실
시맨틱 웹의 지향 목표 • 다양한 기업들과 커뮤니티뿐만아니라 여러 응용 프로그램이 정보를 공유하고 재사용할 수 있게 함으로써 인간을 지원하는 정보 중개자로서의 역할을 수행하는 것 • 시맨틱 웹은 여러 표준과 관련기술에 기반하여 웹상에 있는 데이터를 표현하는 추상 모델로서 전세계에 흩어져 있는 컴퓨터 간의 시맨틱 상호응용성을 용이하게 할 것이다. • 현재 시맨틱 웹과 관련된 표준과 기술들이 W3C에 의해 공동 개발되고 있다. 지능스마트응용 연구실
그림 2-8 시맨틱 웹의 계층구조 • 웹 데이터를 표현하는 가장 기본 계층 • 유니코드, URI(Uniform Resource Identifier) 및 XML 기반 위에 형성된 RDF(Resource Description Framework)와 RDF Schema로 구성 • (RDF는 웹자원을 기술하는 데 사용되는 메타데이터 작성을 위한 데이터 모델, RDF Schema는 RDF에서 사용되는 어휘들 간의 관계를 정의함으로써 각 어휘가 지닌 의미를 표현하는 언어) • 온톨로지 계층- OWL(Web Ontology Language)로 구성 • OWL은 온톨로지를 표현하는 웹 표준언어이다. • 논리(logic) 계층- 논리적 규칙(rule)들로 구성 • 소프트웨어 에이전트가 일을 처리하는 데 필요한 논리적 추론을 가능하게 해 준다. • 논증(proof) 계층 - 논리적 규칙들이 올바르게 실행되었는지를 증명하는 역할을 담당 • 신뢰(trust) 계층 - 가장 상위계층이며 논증졔층에서 증명한 것들의 사실 여부를 평가하는 장치 • 전자서명 계층 - 여러 계층에 걸쳐져 있으며 웹문서의 무결성을 확인하는 역할을 담당함으로써 신뢰계층을 지원한다. • 논리 계층, 논증 계층, 신뢰 계층은 아직 표준화가 진행 중에 있다. 지능스마트응용 연구실
시맨틱 웹의 성공 • 주로 컴퓨터 프로그램들이 쉽게 접근할 수 있는 인증된 온톨로지와 다양한 콘텐츠의 확보에 의해 결정 • 사용자들이 복잡한 논리학을 알지 못하더라도 손쉽게 온톨로지나 RDF 기반의 웹 콘텐츠를 제작할 수 있는 다양한 툴들이 나와야 한다. • 시맨틱 웹의 사용 • 웹 서비스, 지식관리, 지능형 검색, e-마켓플레이스, 전자상거래, 유비쿼터그 컴퓨팅, 자연어 처리, 가상 커뮤니티, 지능형 정보통합, 실시간 정보 공유 • 온톨로지에 기반한 다양한 추론 서비스를 제공하는 광범위한 지식 기반 시스템 네트워크의 구성을 촉진 지능스마트응용 연구실