170 likes | 732 Views
데이터웨어하우스 (DW). 2005. 5. 목 차. 개 념 정 의 필요성 시스템 구성 DW 의 특징 Mart 구성 방법 OLAP 도입효과. 개념. 신속하고 정확한 의사 결정을 위해 기업 내부 및 외부 소스로부터 데이터를 수집하고 관리하기 위해 기업내의 분포되어 있는 다양한 Data 를 모아놓은 저장소로써 경영층 및 관리층의 의사결정지원 (Decision Support) 을 주목적으로 함. 의사결정을 위하여 정보를 필요로 하는 사람들에게 필요한 시간에 원하는 방식으로 접근할
E N D
데이터웨어하우스(DW) 2005. 5
목 차 • 개 념 • 정 의 • 필요성 • 시스템 구성 • DW의 특징 • Mart구성 방법 • OLAP • 도입효과
개념 • 신속하고 정확한 의사 결정을 위해 • 기업 내부 및 외부 소스로부터 • 데이터를 수집하고 관리하기 위해 • 기업내의 분포되어 있는 다양한 Data를 모아놓은 저장소로써 • 경영층 및 관리층의 의사결정지원 (Decision Support)을 주목적으로 함 • 의사결정을 위하여 정보를 • 필요로 하는 사람들에게 • 필요한 시간에 • 원하는 방식으로 접근할 • 수 있도록 하는 것입니다. 수익데이터 상병데이터 . . 처방데이터 Repository
수년간의 각 부서에서 발행한 데이터와 외부 정보를 주제별로 통합하여 별도의 프로그램 없이 통합 의료정보 시스템 여러 각도로 분석이 가능한 즉시에 사용자 스스로 2. 정의 경영분석 진료분석 처리 목적 Data (OCS, 검사, 원무) 진료.경영.관리 등의 주제별 재구성 Data 통계정보
문제제기 3. 필요성 병원 내부 데이터 병원 내부 시스템 병원 내부 프로세스 사용자 인식의 변화 외부 환경의 변화 • 대용량 데이터의 축적 • 지속적인 분석/반영이 안됨 • 데이터로부터 지식 획득/활용이 어려움 • 보다 세분화된 분석, 통계 및 환자진료에 대한 자료 요구 • 의사 결정 시스템의 부재 • 통합적 분석 정보의 축적/분석 미비 • 정형화된 자료 중심의 보고서 • 분석 툴 기능의 활용 미비(타부서 의존) • 많은 수작업으로 인해 분석정보의 적시성 미흡 • 사용자의 Needs의 • 다양화와 고도화 • 고객 요구 수준 향상 • 병원간의 생존 경쟁 심화 • 환자 진료 분석을 통한 대외 전략 수립기능 확보 필요 • IT 기술의 발전에 따른 대용량의 데이터처리 • 와 신속한 분석을 요구 Data Warehouse의 필요성 • 병원내의 분산된 데이터의 통합 / 정보화 • 다양한 진료/연구를 위한 지원 정보 요구 • 신속 정확한 의사결정 지원 요구 • 병원 경영현황의 보다 정확한 파악 • 차별화된 의료 서비스 기반 제공 • 경쟁적 우위 달성
DataMart EIS 병원장 DataMart CIS RDBMS RDBMS RDBMS 지원업무 기타 OCS 관리자 DataMart 보고서 ETL (대상 Data 추출) DataMart 기 타 의사 간호사 관리 4. 시스템 구성 Metadata ROLAP/ Report Data Warehouse (대용량 저장장치) WEB basedAnalysis • ETL(Extraction, Transformation, Loading, ETT와 동의어)이란OLTP으로부터 필요한 데이터를 추출(Extract)하여 • 변환(Transformation) 작업을 거쳐 타겟 시스템(Target System)으로 전송 및 로딩(Loading)하는 모든 과정 • 메타데이타: 어떤 Data를 어떻게 저장할 것인가 정의하고, 데이터를 찿기 위한 인덱스 정보를 가지고 있는 데이터 • 데이타마트: DW에 저장된 정보를 주제별(EIS, CIS등)로 중복 저장하는 장소 • OLAP(On-Line Analytical Processing) : User가 DW나 Mart에 직접 접근하여 대화식으로 정보를 분석하고 의사결정에 활용
5. DW 특징 주제지향성(Subject Orientation) 통합성(Integration) 특징 비휘발성(Non-Volatility) 시계열성(Time-Varient)
Operational Data Warehouse A B C D A B C D A B C D A B C D 5. DW 특징 ●주제지향성(Subject Orientation) ; 통합의 관점에서 조직이 갖고 있는 정보를 업무 중심이 아닌 특정 주제 중심으로 구성하는 것 원무업무 질병별분석 A 진료업무 환자별분석 B 지원업무 처방별분석 C 외부자료 약품별분석 D Applications 주제중심
성별 단위 설명 키 3. DW 특징 ●통합성(Integration) ; 같은 성격을 갖는 데이터의 표현을 단일화하는 것 Operational Data Warehouse encoding Appl A – m, f Appl B – 1, 2 Appl C – x, y Appl D – male, female m, f measurement Appl A – cm Appl B – inches Appl C – mcfs Appl D - yards Cm Description from multiple sources Appl A – description A Appl B – description B Appl C – description C description Conflicting keys Appl A – key char(10) Appl B – key dec fixed(9,2) Appl C – key pic ‘999,999’ Appl D – key char(12) Key char(12)
5. DW 특징 ●비휘발성(Non-Volatility) ; 원시데이터로부터의 로딩(Loading)과 적재된 자료에 대한 검색(Query)이며 자료의 변경 및 삭제와 같은 휘발성(Volatile) 작업은 없다 Operational Data Warehouse Change Select Insert Access Only Delete Load Select 레코드 단위로 데이터 조작 대단위의 데이타 로드 및 엑세스
5. 특징 ●시계열성(Time-Varient) ; 일정한 기간동안의 데이터를 저장하여 시점별로 분석 가능. 즉, DW에 저장되는 각각의 레코드에 시간이라는 필드를 갖게 하여 조회시, 과거-현재-미래 등 시간 흐름상 추세를 분석 Operational Data Warehouse • 검색하는 순간의 데이터의 정확성이 중요 • Key Structure may/may not contain an element of time • 이미 정해진 어느 한 시점의 정확성이 중요 • 일정기간 단위별로 ‘Snap Shot’형식으로 저장 • Key Structure contain an element of time
독립적 Data Mart 종속적 Data Mart 6. Data Mart구성 방법 • 장점 • 빠른 implementation • 빠른 투자 회수(ROI)I • 부분적인 제어 • data는 IT에 의존하지 않고 사용 • 단점 • 여러가지 data models이 발생 • data model에 통일성 떨어짐 • manage/maintain을 위해서는 여러interface가 필요 • No single version of the truth • data의 중복이 발생 • 장점 • Single Version of the Truth • IT에 의한 정제된 data • data medels의 통일성 • 완벽한 data transformation • 유연한 data mart 구성 • 단점 • data warehouse가 존재해야 함 • 기업의 전략과 일치하여야 함
7. OLAP 소개 가. OLAP(On-Line Analytical Processing)의 정의와 목적 ① 정의: 최종 사용자(end-user)가 다차원 정보에 직접 접근하여 대화식으로 정보를 분석하고 의사결정에 활용하는 과정 ② 목적: DW나 Mart로 구성된 자료를 최종사용자는 온라인상에서 직접 데이터에 접근 하며, 대화식으로 정보를 분석하므로 최종사용자가 기업의 전반적인 상황을 이해할 수 있게 하고 의사결정을 지원하는데 그 목적이 있음 나. OLAP 특성 ①다차원성: 사용자들이 실질적인 차원에서 정보를 분석하도록 한다. ②직접접근: 사용자가 전산 부서와 같은 정보 매개자를 거치지 않고 자신이 원하는 정보에 직접 접근한다. ③ 대화식 분석: 사용자는 시스템과의 상호작용을 통해 정보를 분석하며 원하는 결과를 얻을때 까지 계속해서 분석을 수행한다. ④ 의사결정에 활용: 사용자가 기업의 전반적인 상황을 이해할 수 있게 하고 의사결정을 지원한다.
7. OLAP 소개 다. OLAP Tool 비교 • 일반적으로 OLAP툴은 MOLAP, ROLAP, DOLAP, HOLAP로 구분된다. • MOLAP(Multidimensional OLAP) : 다차원 데이터베이스에 기반한 OLAP 아키텍처. • - 원하는 정보를 사전에 다차원데이타베이스(MDB)에 저장한 후 필요시 즉시 조회하는 툴 • - 정보의 유형별로 MDB를 사전에 구성해 놓아야 함으로 IT직원의 업무가 가중 • - 사용자는 사용하기 편함 • ROLAP(Relational OLAP) : 관계형 데이터베이스에 기반한 OLAP 아키텍처. • - MDB를 서로의 관계 정보를 다양하게 조회할 수 있도록 하는 툴 • - 최근 병원업계에서는 ROLAP을 사용하는 추세 • OLAP과 관련하여 가장 많은 논란이 되는 것은 MOLAP 제품과 ROLAP제품 사이의 선택이다. ROLAP제품은 일반적으로 MOLAP제품에 비해 복잡한 비즈니스 로직을 반영하기 힘들고 다차원 연산기능이 부족한 반면, MOLAP제품은 ROLAP제품에 비해 대용량의 데이터를 처리하지 못함.
MOLAP ROLAP 특성 다차원 모델링 및 질의도구 다차원 질의 도구 데이터 조작 읽기/쓰기 읽기 중심 데이터 요구량 대용량 초대용량 연산 기능 다양한 연산 제한된 연산 개발 주체 최종 사용자 주도형 전산부서 주도형 7. OLAP 소개 라. MOLAP과 ROLAP의 비교
8. 도입 효과 가. End-User Comouting 구현으로 업무처리가 단순 나. 일관성있는 데이터를 기반으로 신속 정확한 의사결정지원(DSS)이 가능 다. 업무의 중복성 및 업무절차의 복잡성이 대폭 감소 라. 과거 자료에 의한 추론 및 자료추적이 가능 –공중보건정보에 활용