760 likes | 900 Views
IT in Internet Search Industry. ㈜브라보 검색사의 미래 전략을 위한 검색 시장 분석과 기술 동향 분석 . 20053217 박석근 20053689 김기환 20053738 나호열. Table of Contents. Part 1 소개 인터넷 검색 산업 동향 검색 기술 분석 Part 2 검색 비즈니스 분석 Part 3 시장 분석 및 전략. 소개. ㈜ 브라보 검색이라는 가상의 기업을 위한 기술 , 시장 전략 ㈜ 브라보 검색
E N D
IT in Internet Search Industry ㈜브라보 검색사의 미래 전략을 위한 검색 시장 분석과 기술 동향 분석 20053217 박석근20053689 김기환20053738 나호열
Table of Contents • Part 1 • 소개 • 인터넷 검색 산업 동향 • 검색 기술 분석 • Part 2 • 검색 비즈니스 분석 • Part 3 • 시장 분석 및 전략 SEP583 – Bravo Team
소개 • ㈜브라보 검색이라는 가상의 기업을 위한 기술, 시장 전략 • ㈜브라보 검색 • 일정 수준의 검색 기술을 확보하고 있는 시장 초기 진입 회사 • 대용량 스토리지 운용능력, 뛰어난 수준의 색인 기술 확보 • 검색 서비스 확대 전략을 위한 기술, 비즈니스 분석 • 대용량 인터넷 검색 서비스 제공을 위한 전략 필요 SEP583 – Bravo Team
검색 서비스 • 초창기(’94) • 웹 페이지 검색 목적 • 현재 • 정보화 사회 • 정보의 바다 인터넷 • 마케팅 도구로서의 인터넷 ☞정보 검색은 새로운 산업으로 부상 SEP583 – Bravo Team
해외 시장 검색 엔진 라이센스 규모 4억 6000만 US 달러(’03) 5억 3600만 US 달러 (’04) 약 8억 US 달러예상(’08) 국내 시장 검색엔진 솔루션 규모 300억 원(’04) 검색관련 전체 규모 4000억 원(’04) 세계 검색 광고 시장 29억 US 달러(’04) 약 55억 US 달러 예상(’09) 검색 서비스 시장 SEP583 – Bravo Team
해외 주요 업체 현황 SEP583 – Bravo Team
검색 서비스 경쟁 Share of Searches (May 2005) SEP583 – Bravo Team
검색 엔진 경쟁 Search Provider View (May 2005) SEP583 – Bravo Team
Google • 1998년 2명의 Stanford 대학원생 창업 • 2004년 Initial Public Offering (IPO) • 2005년 8월 시가총액 820 억 US 달러 • 독보적인 검색기술 보유 • 유료 검색과 검색 광고 서비스 • 시장 점유율이 낮은 아시아 시장 공략 • 중국, 일본 • 최근에 데스크톱 검색 Tool 공개 SEP583 – Bravo Team
Yahoo! • WWW의 보급과 함께 1994년 시작 • 초창기 시장에서 우위를 확보 • 시장 선점 효과를 이용 • 검색엔진 관련 회사 인수 • AltaVista, AlltheWeb, Inktomi • 검색엔진 부문 기술력 확보 • 2003년 Overture 인수 • 검색 광고 전문 업체 • 포털 시장 확대에 주력 SEP583 – Bravo Team
MSN • MSN 사업부 • 검색, 메일, 메신저 등의 Microsoft 관련 사업 담당 • 웹 검색 시장에서 3위 차지 • Yahoo!의 Inktomi 검색엔진 사용 • 검색엔진 부문의 사업성 과소평가 • 2004년 11월 자체 검색 기술 공개 • 베타 서비스 시작 SEP583 – Bravo Team
국내 주요 업체 현황 SEP583 – Bravo Team
검색 서비스 경쟁 • 네이버의 독주 • 2004년 3/4분기 50% 진입 • 올해 2/4분기 55% 초과 • ’05 하반기 60% 초과예상 • 야후!코리아, Daum, 엠파스 등 점차적 감소 추세 • Google, MSN Korea 등 해외 주류 검색 업체들 하위권 그룹 내 각축 예상 SEP583 – Bravo Team
네이버 • 1996년 6월 설립, ㈜NHN • 자체 개발한 검색엔진 • 통합검색, 지식검색, 도서본문검색 등국내 최초 • 2002년 10월 지식in 검색 서비스 시작 • 1500만개 이상의 지식 DB • 최근 도서본문 검색 서비스 (1000만 페이지) • 뉴스, 메일 서비스, 지식 쇼핑, 포토 갤러리, 블로그 및 카페 서비스 등 • 국내 최고의 포털로 성장 SEP583 – Bravo Team
검색 엔진 등장 배경 • WWW 이전 • 정보 검색 도구의 불편함 존재 • WWW 등장 이후 • 정보의 제공 단위가 개인으로 이동 • 정보의 홍수 • 대량의 자료 검색 필요 • 검색의 효율성 필요 SEP583 – Bravo Team
검색 엔진의 역사 SEP583 – Bravo Team
검색 엔진의 종류(1) • 주제별 검색 엔진 • 대표 주자는 Yahoo! • 분야별 분류로 세부 항목까지 링크를 따라 이동 • 장점 : 검색 대상에 대한 지식 부족해도 대 분류만 알면 됨. • 단점 : 여러 단계의 검색, 잘못된 정보 찾게 될 가능성 • 키워드 검색 동시 지원 SEP583 – Bravo Team
검색 엔진의 종류(2) • 키워드 검색 엔진 • Google이 대표적 • DB에 웹 페이지의 정보 저장 • 키워드로 정보 검색 • 장점 : 간단한 키워드를 통한 정보 검색의 신속성 • 단점 : Index의 정확도에 따라 검색 실패 가능성 SEP583 – Bravo Team
대용량 검색 엔진 기술 • 검색 엔진 평가 기준 • 데이터 베이스 크기 • 빠른 응답 속도 • 검색 결과의 정확도 • 이슈 • 검색 엔진의 구조 • 시스템 아키텍처 • 검색 알고리즘 SEP583 – Bravo Team
검색 엔진 시스템(1) • Crawler • Robot, 자동화된 인터넷 서핑 에이전트 • Indexer • Catalog, 정보 검색에 유용한 형태로 변환 • Parsing, Index 저장, Sorting • Query Engine • 질의어 처리, 불용어나 유사단어의 처리 • Ranker • 정확도를 기준으로 검색 결과 정렬 SEP583 – Bravo Team
검색 엔진 시스템(2) SEP583 – Bravo Team
대용량 검색 엔진 제약 조건 • 대량의 정보를 저장할 수 있는 저장 공간 • 상당량의 CPU Cycle • Peak Request에 대한 응답 속도 저하 방지 • 시스템 운영, 관리(High Availability, Scalability..) • 에러 처리의 용이성(Error tolerance & Isolation..) • 검색 결과의 효율적 랭킹 SEP583 – Bravo Team
Google Cluster(1) • Cluster • 다수의 시스템을 네트워크를 통해 연결, 단일 시스템처럼 동작하도록 만든 병렬 시스템 • 장점 : Error Isolation, Easy to Repair, Easy to scale • 단점 : 관리 비용, N independent Memory, N copies of the OS • Google의 Design Principles • Software Level Reliability : fault-tolerant • Replication :더 나은 request throughput과availability • Price/Performance : 가격 대 성능 비 • Commodity PC: 비용 감소 SEP583 – Bravo Team
Google Cluster(2) • Index Data와 Computation 분리 • Communication의 최소화 • 서버간의 Load balancing • In-house형태의 소프트웨어 제작, 자동화, 모니터링 • System 관리 Overhead 최소화 • Google File System • 확장성 있는 분산 파일 시스템 SEP583 – Bravo Team
Google File System SEP583 – Bravo Team
PageRank 알고리즘(1) • 문헌 정보학에서의 Citation Analysis와 유사 • 양적으로 많이 이용되면 중요한 문서 • 웹 문서는 앵커로 서로 연결, 링크의 개수 이용 • 사용자들의 행동을 확률적 모형화한 보정치 적용 • 문서에서의 링크의 위치, 폰트 크기, 업데이트 정도 반영 • 색인 시에 정렬된 랭킹 이용 가능 • 문제 파악과 정의가 정확하지 않을 때 유용 SEP583 – Bravo Team
PageRank 알고리즘(2) SEP583 – Bravo Team
Yahoo! 검색 • 많은 검색 업체를 인수, 인수 업체의 기술 적용 • 2004 년 Inktomi Database 기반한 검색 엔진 구축 • Google Cluster와 유사한 검색 시스템 운영 • Yahoo! 랭킹 알고리즘 • 키워드의 관련성 • 키워드 위치(title), 비중(빈도수/색인된 총 단어 수) • Anchor text와의 관련성, 클릭 수 • 사이트 인지도 • Google의 PageRank 알고리즘과 유사한 방식 이용 SEP583 – Bravo Team
검색 엔진 비교 SEP583 – Bravo Team
Google의 기술 우위성 • 데이터 베이스 크기 • 타 검색 엔진에 비해 거의 2배에 가까운 정보량 • 정보 검색 정확도에 영향 • Indexing, Crawling 기술 • 빠른 응답 속도 • Google Cluster, Google FileSystem : 고성능과 확장성 확보 • In-House 형태의 소프트웨어 제작과 모니터링을 통한 자동화 • 검색 결과의 정확성 • PageRank : 사용자 행동 패턴과 정보의 중요성 적용 • Yahoo! 도 최근 PageRank 적용 SEP583 – Bravo Team
검색 기술의 발전 방향 • 현재의 검색 기술 • 웹에 한정 • 텍스트 기반이 주류 • 정보의 양과 그 정확도에 대한 요구 증대 • 발전 방향 • 멀티미디어 검색 기술 • 시맨틱 웹 • 개인화 검색 SEP583 – Bravo Team
텍스트 기반 멀티미디어 검색 • 오프라인에서의 멀티미디어 정보 검색 방법 • 일상적인 말(텍스트) • 멀티미디어 데이터와 유사한 데이터 이용 • 이 둘은 상호 보완적 • 텍스트 기반 멀티미디어 검색 • 객체의 속성 지원 • 예) ‘빨간 선인장’, ‘선인장이 빨갛다’, ‘선인장이 빨갛게 보인다’ • 자연어 처리 검색 엔진이 필수 SEP583 – Bravo Team
내용 기반 멀티미디어 검색 • 과거 • 사진, 비디오의 내용을 컴퓨터가 이해하고 기억하여 검색하는 것을 의미 • 기술적 한계 • Feature 추출, 저장, 검색에 연구의 초점 • 현재 • 이미지의 Feature(색상, 질감, 모양 정보)를 이용하여 검색 • 폭 넓은 차원의 이슈 (저장 구조, 유사도에 대한 성능 측정, 효율적 브라우징, 사용자 인터페이스, 지적 소유권 및 보안) SEP583 – Bravo Team
MPEG7 • Multimedia Content Description Interface • 멀티미디어 정보에 대한 Description 표준화 • Description : 검색에 필요한 Metadata • Description에 사용되는 기본 요소만 정의 • Description의 조합, Feature 추출 및 검색 내용은 불 포함 • 주요 연구 개발 분야 – 효과적인 Description, Feature 추출 및 검색 방법 • Pull Model - local, 네트워크에 위치한 DB에서 자료 제공 • Push Model – Contents Provider의 자료를 Filtering, 실시간 처리로 인한 시간적 제약 조건 SEP583 – Bravo Team
시맨틱 웹 • 웹 기술의 문제점 • 인간과 컴퓨터간의 정보 교환에 치중 • 정보와 태그의 혼합으로 정보 추출의 어려움 • 데이터의 의미적 해석 및 처리에 취약 • 데이터의 의미를 사람이 아닌 컴퓨터가 이해, 처리 • 요소 - Language, Infra-Structure, Ontology, Human Interface • 이슈 • 요소 기술들의 유기적 통합 • 손쉬운 온톨로지 도구 개발 • 온톨로지 기반의 시맨틱 웹 프로토타입 • 기존 웹에의 손쉬운 적용 SEP583 – Bravo Team
개인화 검색 • 맞춤 정보 서비스 • 정보의 과포화, 과잉화 상태 • 정보의 격차 발생으로 적절히 분류된 형태의 정보 필요 • 사용자 정보 이용 개개인의 특성에 맞는 검색 결과 제공 • 개인화 검색 기술 • 정답은 없다! • 개개인의 사용자 판별 • 사용자 행동 패턴 분석 • 효과적인 동적 검색 페이지 구성 SEP583 – Bravo Team
인터넷 광고 시장 SEP583 – Bravo Team
가장 적은 비용 Search – $0.45 E-Mail – $0.55 Yellow Page - $1.16 Banner Ads - $2.00 Direct Mail - $9.94 여러 광고 수단에 따른 광고 비용 SEP583 – Bravo Team
여러 요인 • 광고시장의 증대 -> 검색 산업의 증대 • 쉽고 빠른 검색 방법 • 더 많은 사용자 • 개인에게 더욱 적절한 정보 검색 가능 • 많은 수요 창출 -> 시장 증대 • 확고한 상품에 대한 인지도 • 많은 비용도 감수 • Interactive한 양방향의 정보교환 • 더욱 세밀한 소비자의 욕구 충족 SEP583 – Bravo Team
검색 광고 시장 • 선 순환 구조 • 검색이 상품 정보를 찾음 • 보다 많은 수의 광고주들이 동참 • 보다 많은 상품 정보 검색이 가능해지고 더 자주 찾게 됨 • 보다 더 세밀한 검색이 가능 • 더욱 더 많은 수의 광고주들이 참여 SEP583 – Bravo Team
2008년 검색광고 시장 • 2008년 세계 검색 광고 시장 예측 • Paid Placement – 약 100억 US 달러 • Content Match – 약 25억 US 달러 • Paid Inclusion – 약 10억 US 달러 • Analytics – 약 8억 US 달러 • 총 143억 US 달러 시장 SEP583 – Bravo Team
키워드 검색 광고 특정 키워드 판매 검색엔진에 등록 키워드와 관련된 상품광고 노출 키워드에 대한 광고주의 비용이 높으면 높을 수록 좋은 높은 리스팅 차지 Contextual 타겟 광고 내용 위주의 광고기법 중요한 내용이 담겨있는 웹 페이지 여백 이용 내용과 관련된 광고를 노출 검색 광고시장 트랜드 SEP583 – Bravo Team
Google – 수익 모델 • 라이센싱을 포함한 검색 서비스 • 독자적인 검색 기술 • 광고 프로그램 • AdWords • AdSense • 높은 적중률 • 전통적인 배너 방식 광고보다 평균 5배가 넘는 높은 클릭수 • 미국, 중국, 대한민국, 세계 30개국 130여 개 기업 • Acura, Expedia, Eddie Bauer, Ernst & Young 등 SEP583 – Bravo Team
Google-수익모델(2) • AdWords • 키워드 검색 광고 기법 • 특정 키워드 • 일반적인 검색 결과 • 관련된 광고 정보 노출 • CPC (Cost-per-Click) • AdSense • 콘텐츠 타겟 광고 기법 • 웹 사이트 콘텐츠 페이지에 연관성있는 구글 광고 게재 • 구글 검색 기능을 통해 상품정보 검색 • 클릭되는 광고에 대해 수익 배분 SEP583 – Bravo Team
Google - 매출 Google 매출액 현황 2002 ~ 2005 (백만달러) SEP583 – Bravo Team
Yahoo! • 초창기 • 광고 수익에만 의존 • 현재 • 포털, 다양한 서비스 제공(검색, 뉴스, 경매 외) • 유/무료 서비스 • 요금부과 형식의 수익구조 • 기업인수를 통해 기술확보에 성공 • Inktomi, 검색엔진 • Overture, 검색 페이지 광고의 선구자 • 독자적인 엔진 기술로 pay-per-click 광고 프로그램 시작 • 검색엔진 기술 시장 진입 • MSN, Inktomi 엔진 사용 SEP583 – Bravo Team
Yahoo! • 격동기 • 인터넷 버블 붕괴 • 무료 서비스와 핵심 유료 서비스 증대 • 기존의 여러 비즈니스 자산과 서비스들을 바탕으로 Model 창출 • 성공적인 반응 • 유료 서비스 형태로 전향 시도(’01) • 무료 콘텐트 모델에서 프리미엄 서비스 모델로 전환 • 이메일 서비스 유료화로부터 시작 SEP583 – Bravo Team