220 likes | 517 Views
지식관리 시스템의 효과적인 기반 구축. Verity K2 Enterprise. 2002. 9.4. KM Consulting Team ( 주 ) 쓰리소프트. 2 /20. 목 차. Key Features of EP (or EKP) Tier-1 : Discover Tier-2 : Organize Tier-3 : Connect Verity K2 Technical Features Q & A. 3 /20. KMS to EP. Key Features of EP. Search. Taxonomy.
E N D
지식관리 시스템의 효과적인 기반 구축 Verity K2 Enterprise 2002. 9.4 KM Consulting Team (주) 쓰리소프트
2/20 목 차 • Key Features of EP (or EKP) • Tier-1 : Discover • Tier-2 : Organize • Tier-3 : Connect • Verity K2 Technical Features • Q & A
3/20 KMS to EP Key Features of EP • Search • Taxonomy • Personalization Verity K2 Supports 3-Tier Architecture!!!
4/20 Tier-1 Discover • Full-text Search • Category drill-down • Parametric selection • Federated search
5/20 Tier-1 Discover • Repository Types: • File System • HTTP • ODBC • MS Exchange • Lotus Notes • Documentum • Document Types: • HTML/XML/E-Mail • PDF • MS-Office • 아래아 한글 • 훈민정음 • 아리랑 • 일사천리
6/20 Tier-1 Discover Operator • 단어 검색 : Word,Wildcard,동의어 • 개념 검색 : AND, OR, NOT, ACCRUE • 근접 검색 : Phrase, Sentence, Paragraph, Near • 필드 검색 : =, <, >, <=, >= • 기타 : Starts, Contains, Substring 한글처리기 • Keyword 자동 추출 • 한국어 형태소분석기 사용 • 동사 및 형용사 원형 색인 • 복합명사 처리 • 불용어 배제 • 사용자 사전 : 축약어 및 신조어 • 한자 한글 자동 변환 • KSC5601 / UTF-8 지원 • 8년간 지속적 Tuning • 사전관리기 제공 : 사용자 사전 및 불용어 사전 관리 Query • 키워드 + 조건 복합 검색 • 검색 결과 제한 • 결과 내 재 검색 • 문서 부분 검색
7/20 Tier-1 Discover Parametric Selection 사과 and 바나나 and 오렌지 and 작성일>=2002-01-01 and 작성일<=2002-12-31 and 작성자 = 홍길동 and 문서형태 = PPT and… text Index Parametric Results Parametric Cube fld1 fld2 fld3 fld4
8/20 Tier-1 Discover Federated Search • Why? • 다양한 시스템 • 다양한 검색 엔진 • 일관된 표시 형식 요구 • Connector • Multiple Index DB • Multiple Services • Merge Results • Eliminate Duplicates • Sorted By Relevancy Source Category
9/20 Tier-2 Organize • Automatic Classification • Business Rules • Concept Extraction • Clustering
10/20 Tier-2 Organize • Automatic Classification • From File/URL Path • From Metadata • From Document Clusters • Semio • Semi-Automated Taxonomy Creation • Taxonomy Made By Human • Documents Classified By Machine
11/20 Tier-2 Organize • Logistic Regression Classification • Optimizes the worst case (error bound) • No assumption on document / word distributions • Guarantees good performance across different domains • 88% P/R on Reuters • Allows negative examples
12/20 Tier-2 Organize • Result Clustering • Dynamic Summary • Clustering By Summary • Hierarchical Category Generation • Accept Business Logics
13/20 Tier-3 Connect • Popular Ranking • Document Recommendation • Community • Expert Location
14/20 Tier-3 Connect • Popular Ranking • User Feedback • More Choice, Higher Rank • Recommendation • Analysis of Query, User Behavior, Profiles • Outputs Additional Documents List • Informs Expert Location • Lists Those Who Has Same Interests as U…
15/20 Verity K2 3-Tier Architecture Discover Search Organize Taxonomy Connect Personalization
16/20 K2 Technical Features (1/4) Load Balancing 다수의 서버로 처리 요청을 분산시키기 위해서, 또한 빠른 응답 시간과 시스템의 안정성을 위해서 효과적인 분산 처리 기법을 제공한다. 사용자 K2 Broker K2 Server
17/20 K2 Technical Features (2/4) Distributed Processing 사용자의 요청을 여러 부분으로 나누어 다수의 검색 서버가 동시에 처리하여 결과를 취합 사용자 K2 Broker K2 Server
18/20 K2 Technical Features (3/4) Fault Tolerance 24 X 7 기계적인 문제로 서버의 서비스가 중단되어도 다른 정상적인 서버의 자원을 이용하여 무정지 서비스 가능 사용자 K2 Broker K2 Server X
19/20 K2 Technical Features (4/4) Flexibility & Scalability 통 합 검 색 • Solaris • Oracle Java/JSP • Linux • MySQL ASP/COM • MS-Windows • SQL Server C/C++ • IBM • Informix 서버 측면 사용자 측면
20/20 윤준호 softic@3soft.com 82-2-3772-0361 3SOFT, Inc. Powering Business Portals Q & A