150 likes | 280 Views
MySeek 시스템 소개. ㈜ 마이씨크. Contents. MySeek System 개요 MySeek System 기능도 MySeek System 기능 MySeek System 특징 MySeek 검색기능 MySeek 활용시 장점 Reference Site. MySeek System 개요. 인터넷망. Web Server(Apache,Netscape). 검색 응용프로그램 (C,Python,PHP,OOSQL 등 ). 오디세우스 /Web. MyRobot. 오디세우스 Server.
E N D
MySeek 시스템 소개 ㈜마이씨크
Contents • MySeek System 개요 • MySeek System 기능도 • MySeek System 기능 • MySeek System 특징 • MySeek 검색기능 • MySeek 활용시 장점 • Reference Site
MySeek System 개요 인터넷망 Web Server(Apache,Netscape) 검색 응용프로그램(C,Python,PHP,OOSQL 등) 오디세우스/Web MyRobot 오디세우스 Server 질의처리기 공간DB 검색엔진 멀티미디어 검색엔진 TEXT정보 검색엔진 Cache Data 색인시스템 멀티미디어 객체 저장시스템(OODBMS) DataBase DataBase 색인정보
개발완료 개 발 중 MySeek System 기능도 인터넷망 MyRobot 메일서비스 MyMail 광고서버 MyAd Web Server MyFilter 검색 프로그램 형태소분석 오디세우스 ODBMS 색인시스템 myCategorizer 메일정보 배너정보 광고주정보 Knowledge DB 색인정보 DataBase
MySeek System 기능 *는 현재 개발 중
MySeek System 특징 • 검색시스템 • 색인정보 및 문서 중요도에 따른 검색 • 정보검색기능 밀결합된 객체지향 SQL (Object-Oriented SQL: OOSQL) 기능 제공 • 데이터 저장 시스템 • 대용량 DB 지원 • 최대 8Tera DB 볼륨 지원, 무한대 확장 • 신속한 데이터 로딩(Bulk Loading) • 100만 건 텍스트 정보 6시간 이내 구축 • 실시간 인덱스 정보 Insert, Update, Delete • 인덱스 변경 위해 시스템 정지 필요 없음
MySeek System 특징 • 인덱스 & 로딩 속도 • 데이터 : MySeek 페이지 정보 100만 건 • 데이터 Size : 원본(3GB) + 색인DB(13GB) • 데이타베이스 용량 : 16GB • 시스템 : IBM RISC 450MHz * 6 CPU • 색인시간 • Initial Loading - 약 6시간 • Append Loading –약 24시간 • JDBC Interface 제공 • ODBC Interface 제공 • View 기능 지원 • C/C++ Interface 제공
MySeek System 특징 • 버퍼 일관성 보장 • Multi Server로 운영 시 한 서버의 버퍼 내용이 변경되면 나머지 서버도 일률적으로 변경됨 • 동시성 제어 기능 • 볼륨 단위 Locking Rule Version • Lock의 개수 줄여 최적의 질의 성능 발휘 • 동시에 다수 읽기 질의와 소수 쓰기 질의 지원 • 읽기 위주의 시스템에 적합 • 레코드 단위 Locking Rule Version • 동시에 다수 읽기 질의와 다수 쓰기 질의 지원 • 다 사용자 환경 안정성 증명 위해 2년간 테스트 중(2001년 제공) • 복구기능 • 시스템 비정상 종료시 DB 정보 자동 복구
MySeek 검색기능 • 부울(Boolean) 질의에 의한 검색 • 부울연산(AND, OR, NOT) • 근접연산(Within, Near) • 절단검색(좌,우,중간, 양측) • W-Algorithm에 의한 문서 순위 결정
MySeek 검색기능 • 자연어 질의에 의한 검색 • 검색어에 대한 유사도에 의한 순위결정(Ranking) • 시스템 특성에 맞는 Ranking Algorithm 적용 가능 • 부울연산자 동시 사용 가능 • 사용자 요구에 맞는 순위 결정 모델 적용 • 다양한 한글 자동 색인 • 형태소 단위 색인 • 한글 형태소 분석기 이용하여 명사,형용사,동사,조사,접미사 등 단순명사 뿐만 아니라 복합명사에 대해서도 별도 색인함으로써빠른 검색 실현 • 어절단위 색인 • 불용어를 제외하고 어절, 단어를 색인하여 신조어 등 검색 가능
MySeek 검색 기능 • 기타 주요 기능 • Inverted File를 이용한 빠른 검색어 인덱스 검색 • 분할 색인 방식을 이용한 빠른 인덱싱 • 분야 제한 검색 • 검색 결과내 재검색 지원 • 자연어 검색을 위한 색인어 조회 기능 • 전문검색 기본 • 실시간 자료 삽입, 수정, 삭제(System Non Stop) • 자유로운 검색어 하일라이팅 • 검색된 문서의 질의 최적문단 추출 기능 • 다양한 플랫폼(Unix, Windows N/T 등) • 대용량 Data 신속한 처리 • 빠른 검색, 색인 및 데이터 Loading
최고의 검색기능 빠른 검색/색인속도 대용량 Data 신속처리 다국어지원 자연어지원 다양한 H/W 지원 Ranking Quality 순수 국내 기술 원천 소스 보유로 자유로운Customizing 가능 한글처리 강점 정부구매사업 유리 다양한 검색시스템요구 사항 수용 가능 MySeek 활용시 장점 정부기관, 언론사, 포탈사이트, 전자상거래, BtoB, 커뮤니티, KMS,EDMS MySeek + KAIST
Reference Site • 한국전자도서관 • 과학기술원 전자도서관
Reference Site 과학기술원 전자도서관
㈜마이씨크는 순수 국산 기술을 토대로.. 항상 여러분의 곁에서 고객이 만족하는 시스템을 만들기 위해 오늘도 최선을 다하고 있습니다. 감사합니다