350 likes | 1.51k Views
데이터 품질관리를 위한 방법론 및 활용방안. 2004. 11. 19 경희대학교 박주석. 데이타베이스 연구. 데이터베이스 연구는 지난 30 년 동안 IT 분야에 이론적으로나 산업적으로 엄청난 변화를 일으켜 왔었다. Architecture. Management. Engineering. PLAN. DO. SEE. 1990 년대 ~ 통합된 정보시스템. 1970 ~ 1980 년대 자동화된 정보시스템. 2000 년대 ~ 효과적인 정보시스템. 데이터모델링 데이터아키텍쳐 !. 데이타웨어하우스
E N D
데이터 품질관리를 위한 방법론 및 활용방안 2004. 11. 19경희대학교 박주석
데이타베이스 연구 • 데이터베이스 연구는 지난 30년 동안 IT 분야에 이론적으로나 산업적으로 엄청난 변화를 일으켜 왔었다. Architecture Management Engineering PLAN DO SEE 1990년대 ~ 통합된 정보시스템 1970 ~ 1980 년대 자동화된 정보시스템 2000년대 ~ 효과적인 정보시스템 데이터모델링 데이터아키텍쳐! 데이타웨어하우스 데이터품질!!! 파일관리시스템 데이타베이스관리시스템 SQL & CASE
데이터품질 정의 • 지금까지는 품질(Quality)를 관리하는 전통적인 이론에 대해서 살펴봄으로써, 품질 관리의 핵심은 고객 만족과 이를 지속적으로 개선시키고자 하는 전사적 활동이 필요하다는 것을 알 수가 있었다. 그렇다면 데이터 현상적 요소(데이터 값)나 구조적 요소(데이터 모델 및 메타 데이터)의 품질은 무엇이고, 전통적 품질 관리 방법과 어떻게 연관 지을 수 있는 지에 대한 궁금증이 유발될 것이다. • 전통적 품질 관리 기법에서 말하는 품질의 대상은 바로 제품(Product, 제품과 서비스를 포함하는 개념)이다. 그리고 고객이 만족하는 수준을 충족시키는 상태가 제품의 품질을 의미한다. 따라서 데이터 품질 관리에서 이야기하는 품질의 대상은 데이터(Data)이며, 데이터를 사용하는 사용자의 만족도를 충족시키는 수준을 만드는 과정이 데이터 품질 관리라고 할 수가 있다. 데이터 품질의 정의 • 데이터(Data) –조직의 전략 및 목적을 달성하기 위해서, 전략, 구현, 운영 등의 정보 시스템 사이클 과정을 통하여 생성된 산출물을 의미한다. 즉, 여기서 의미하는 데이터란 데이터베이스 내에 저장되어 있는 데이터 값 뿐만 아니라, 데이터 모델 및 메타 데이터 등의 데이터 구조적 요인까지 포함하고 있는 개념이다. • 데이터 품질–제조업의 제품이나 서비스 업의 서비스와 마찬가지로, 조직의 목적을 위하여 생성된 데이터의 소기의 목적을 달성하기 위해서 이용하고자 하는 조직 구성원들의 만족도를 충족하는 수준. • 데이터 품질 관리–데이터 품질을 유지 및 개선시키기 위하여, 데이터 자체에 대한 품질 유지 활동을 지속적으로 유지하고 관리하는 활동을 의미한다.
Larry P. English는 데이터 및 정보(Information)를 고객 니즈(Needs)에 따라 데이터 사용자를 다음과 같이 분류하였다. 데이터 사용자(Data Customer) • 최종 사용자(End Customer) –조직의 제품 및 서비스를 구매하여 실질적으로 매출이 발생하게 하는 사용자들이다. 가령, 한 조직이 생산한 전자부품을 팔기 위해서는 그들의 구매자들에게 자사 부품에 관련된 데이터 및 정보를 알려주어야 한다. 이 때, 전자 부품에 대한 자세한 데이터에 대해서 고객들이 충분히 만족하는 지에 대한 여부가 데이터 품질에 해당된다. • 내부 구성원(Internal Knowledge worker)–조직 내의 업무 필요에 따라서, 해당 데이터를 이용하여 업무를 수행하는 조직 내 구성원들을 의미한다. 예를 들면, 백화점 내 매장 관리를 하기 위한 영업 사원에서 부터 조직 전체적인 매출관리를 담당하는 영업 관리자, 영업 전략 및 마케팅 전략을 수립하는 전략 기획 임원 및 대표까지의 모두에 대한 만족을 이끌어 내는 것이 데이터 품질이라고 할 수가 있다. • 조직 이해관계자(External stakeholders)–투자, 감사 및 감시 등의 이유로 조직의 정보를 필요로 하는 사용자를 의미한다. 예를 들면, 한 기업에 투자하기 위한 투자자나 이미 투자하고 있는 사람들은 조직의 재무 정보 및 기타 기업 정보에 대해서 정확하고 신속하게 알고 싶어한다. 다른 예로는 공공 기관의 감사 업무 수행 시, 외부 감사자들은 해당 기관의 정책 실적 및 예산 집행 등에 관한 정보를 알고 싶어한다. 이들에 대한 데이터 및 정보의 만족도를 재고하는 일이 데이터 품질이라고 할 수가 있다.
저 품질 데이터 사례 • 국내 공공 기관 DB 관리 허술 –공공기관의 데이터베이스 관리체계가 허술한 것으로 나타났다. 이는 최근 전자정부 프로젝트의 일환으로, 공공기관 간 데이터 공동 활용이나 통합을 위한 시스템 구축사업에도 상당한 걸림돌로 작용할 것으로 전망돼 대책마련이 시급한 것으로 지적됐다. 한국데이터베이스진흥센터가 지난 6∼9월까지 46개 공공기관을 대상으로 실시한 ‘2004 데이터베이스 품질진단결과’ 데이터와 이에 대한 관리 수준은 100점 만점에서 58.7점으로 나타났다. 부문별로는 데이터 영역의 품질 수준은 평균 60.6점으로 상당수 공공기관의 데이터베이스에 엉뚱한 데이터가 들어 있거나 당연히 있어야 할 데이터가 없거나, 동일한 내용에 대해 내부 시스템 별로 서로 다른 데이터를 갖고 있는 것으로 나타났다. • 또 관리 프로세스 영역은 평균 56.1점으로 대다수 공공기관이 아직 데이터 표준이나 데이터 모델을 체계적으로 관리하기 위한 프로세스를 갖추지 못한 것으로 조사됐다. 이 밖에 데이터베이스 관련 시스템 분야는 평균 59.4점으로 나타났다. 김선영 선임연구원은 “일반적으로 민간기업의 잘못된 데이터로 인해 발생되는 손실은 해당 기업이 떠안겠지만 공공기관의 데이터 품질로 인한 피해는 고스란히 행정서비스의 수혜자인 국민에게 돌아가 그 심각성이 크다”고 말했다. 실제로 최근 호적정보시스템에서 10명 중 1명꼴로 데이터 오류가 발견되고 금융사의 금융계좌 100개 가운데 1개꼴로 잘못된 주민등록번호가 사용되는 사례는 데이터베이스 관리의 허점을 적나라하게 보여준 대표적인 사례라고 진흥센터 측은 설명했다. 또 이 같은 국내 상황은 미국은 연방정부가 제공하는 정보의 품질을 보장하기 위해 ‘데이터 품질 법(Data Quality Act)’을 제정하고 예산관리국이 실행 가이드라인을 만들어 제공하는 것과 대조적이라고 진흥센터는 덧붙였다. (전자신문 2004년 10월 12일 기사)
저 품질 데이터 사례 • 개인 정보 관리 소홀로 인한 법적 공방 –대규모 고객 개인 정보를 보유한 이동통신사업자 및 포털 사이트·쇼핑몰 등의 온라인 상의 개인 정보 유출 문제가 심심찮게 지적되는 가운데 이용자들이 기존의 소극적 묵인에서 탈피해 사법 처리 등 적극적인 대응을 꾀하고 나섰다. 이에 따라 그 동안 개인 정보보호에 소홀해왔던 기업들이 긴급 조치에 나섰으나 관계사 등을 통한 개인 정보 유출에 보다 지속적인 관심이 필요하다는 지적이 높아지고 있다.최근 이와 같이 공개적인 사이트에 자신의 실명과 직장명까지 밝히며 개인 정보 도용 내역을 상세히 설명하고 실제로 개인정보분쟁조정위원회 등 관련기관에 신고하거나 해당 기업에 직접 시정 조치를 요구하는 사례가 늘고 있다. 이 같은 양태는 기존에 ‘늘 있는 일’로 치부하는 정도에서 벗어나 게시판에 이를 등록해 공개적으로 문제 삼거나 아예 시민 단체 등과 연계해 조언을 받고 법적 피해 보상 가능성을 검토하는 등 적극적인 대응으로 변모했다는 점에서 눈길을 끌고 있다. 사용자들이 이처럼 적극적인 행보를 보이자 기업들도 대응 방안 마련에 분주한 모습이다. (전자신문 2004년 09월 09일 기사 일부) • 8년 동안 2,300만 달러를 더 지불한 미국 시민–미국 연금 계산 오류로 인하여 Nashvill 시민 일부는 8년 동안 2,300만 달러를 초과하여 지불하였으며, 반면에 다른 사람들은 같은 기간 동안에 2,600만 달러를 적게 낸 것으로 밝혀졌다. (The Tennessean, 1998년 03월 21일 기사 일부) • 세금 고지서 수취인 불분명으로 반환- 1992년, 미국 국세청은 96,000 장의 세금 고지서가 수취인이 거주하지 않는 다는 이유로 반송되었다고 밝혔다. 이는 거주지 데이터의 오류로 인한 문제로 데이터 회계 감사에서 밝혀졌다.
데이터품질 연구 (1/2) • 초기의 데이터베이스 품질 평가 모델들은 현상 분석 중심에서 점차적으로 구조적 분석 중심 모델로 바뀌었으며, 최근에는 TDQM, TIQM 등과 같이 지속적 개선을 위한 통합모델로 연구가 진행되고 있습니다. 구조적 분석 중심 모델 지속적 개선을 위한 통합 모델 현상 개선 중심 모델 • Larry P. English의 TIQM (2002) • 전체 6단계의 프로세스로 구성. • P1~P3: 데이터 평가 프로세스 • P4: 데이터 유지보수와 ECTL 통제 • P5: 프로세스 개선을 위한 프로세스 • P6: 조직문화의 데이터 품질문화 전환 • Granick의 DB 평가기준(1991) • Greg R. Notes의 DB평가기준(2000) • SCOUG 평가법(1990) • 데이터모델 리소스북(1997) • 데이터모델 패턴(1995) • 데이터모델 핸드북(1994) • Large의 DB품질평가(1989) • MIT의 TDQM (2000) • MIT 대학, 정부기관, 기업 등의 협동 프로젝트 • 데이터품질 정의, 데이터품질이 기업에 미치는 영향, 데이터 품질 개선 등의 3가지 주제에 대한 연구. • Herther CD-ROM 평가(1988) • Brodie의 데이터 품질평가(1980) • Doll & Tokzaden(1983) 총체적 데이터품질요인 발견과 품질개선을 위한 절차에 집중 현상적 데이터품질요인 발견에 집중 구조적 데이터품질요인 발견에 집중 자료원: DPC 2003, 개정: 경희대 박주석 2004 3
데이터품질 연구 (2/2) • 국내에서는 90년대 말부터 데이터품질의 중요성이 부각되면서 이에 대한 연구가 진행되어 왔습니다. 특히 많은 국내 기업들이 데이터웨어하우스를 구축하고 CRM을 구현하면서 국내에서도 지속적인 개선을 위한 데이터품질에 관한 연구가 활발한 것으로 예상됩니다. 구조적 분석 중심 모델 지속적 개선을 위한 통합 모델 현상 개선 중심 모델 • 한국 웹사이트평가개발원의DB품질평가모델(2002) • DPC의 DB품질관리 확장모델(2003) • 안계성의 DB품질평가항목(2000) • 박주석/김찬수의 데이터성숙도모델(2003) • 정보시스템 유형별 품질측정모형개발(1999) • 이제환의 분산체계로 구축된DB품질검증(1997) • 국방데이터표준화 연구(2002) • 박준식의 색인평가기준에 관한 분석(1996) • 분산환경을 위한 중복데이터구조연구(1994) • DPC의 데이터베이스표준 연구(1996) 현상적 데이터품질요인 발견에 집중 구조적 데이터품질요인 발견에 집중 총체적 데이터품질요인 발견과 품질개선을 위한 절차에 집중 4
데이터베이스진흥센터 연구동향 • 데이터베이스 진흥센터는 데이터품질관리 개선과 관리를 위한 체계적인 계획을 수립하였습니다. 2003년의 데이터베이스 품질관리 확장모델 개발 후 2004년에는 해당실무에서 실제로 적용할 수 있는 데이터베이스 품질관리 지침과 해설서를 제시함으로써 지속적인 개선을 통한 품질관리를 지향하고 있습니다. 구조적 분석 중심 모델 지속적 개선을 위한 통합 모델 현상 개선 중심 모델 2004년 확산기 2002년 준비기 2003년 도입기 2005~2006 정착기 • 공공부문 DB 품질관리 의무화 • DB품질 관리지침 개발/보급 • DB품질평가 민간부문 확대 • DB품질평가 안정적 운영 기반 • 공공부문 DB품질평가 우선 적용 및 민간부문 자발적 참여 촉진 • DB품질평가 중요성 마인드확산 • DB품질평가 모델개발 • 중장기 정책 및 세부시행계획 수립 5
데이터품질관리 지침개발 프로젝트 ■ 기 간 : 2004.5.24 ~ 10.23 (5개월) ■ 연구주제 : 공공 부문을 위한 데이터 품질관리 지침 및 해설서 개발 ■ 연구 목적 - 공공기관이 보유하고 있는 데이터베이스의 체계적인 관리 및 품질개선을 지원하기 위해 데이터 품질관리 지침을 개발하여 보급함. ■ 연구 내용 - 데이터 품질관리 프레임워크 개발. - 데이터 품질관리 단계 및 단계별 세부 작업을 도출하고 작업 별 세부활동 내역 및 방법, 산출물 등을 정의. - 지침 및 해설서 제시.
본 프로젝트의 범위 PLAN – DO – CHECK – ACT 사이클 방법론을 이용한 데이터 품질관리 지침 및 해설서 제시하고자 함. 핵심 연구 영역 내용 • PLAN : 데이터 품질관리 정의 및 중요성 제시. • DO : 데이터 품질관리 프레임워크 제시 및 품질관리 요소에 대한 지침 제시. • CHECK : 품질관리 요소 평가에 관한 지침 제시. • ACT : 품질관리 개선활동 관련 내용.
데이터품질 구성영역의 확장 Data Quality Factors Data Value Quality Data Service Quality Data Management Process Quality 독립적인 관점 전사적인 연계성 관점 • 검색성 • 지원성 • 편의성 • 시스템성능 • … • 단일성 • 일치성 • 재사용성 • … • 포괄성 • 정확성 • 완전성 • 최신성 • 활용성 • … 원인개념의 품질 기반개념의 품질 Database Hierarchy Quality • 메타데이터의 품질(표준데이터, 데이터모델, 데이터아키텍쳐 등)
….. 실행계획 실행계획 성숙도 모델의 의미: CMM • 성숙도 모델의 특성은 각 단계로서 정의하기 때문에 현 수준을 쉽게 이해할 수 있고 쉽게 측정할 수 있고 • 다음 발전 단계를 쉽게 보여준다는 점에서 현실적이나 성숙도 모델 그 자체를 도출하기가 어려움 Practices 5. 최적화 레벨 • 모든 프로세스에 대한 • 지속적인 개선이 • 이루어지고 있는 단계 지속적으로 개선되는 프로세스 4. 관리 레벨 • 모든 프로세스에 대한 정량적인 측정이 • 가능한 측정 지표들이 마련되어 있는 단계 예측 가능한 프로세스 3. 정의 레벨 • 정보 시스템을 개발 및 유지 관리하기 위한 • 표준 프로세스가 조직 전반에 걸쳐 정의되고 • 문서화 되어있는 단계 표준/일관된 프로세스 2. 반복 레벨 • 프로젝트 관리 정책과 정책을 구현하기 위한 • 절차가 수립되어 있는 단계 규칙적인 프로세스 1. 초기 레벨 • 정보시스템을 개발 및 유지 관리하는 데에 • 안정적인 기반이 조성되지 않은 단계. 자료원 ’Capability Maturity Model for Software’, SEI 1994
통합 데이터품질관리 모형 • 미시적인 관점에서의 데이터 품질 관리 및 평가를 위해서 데이터베이스 진흥센터(2003년)의 ‘데이터베이스 품질관리 확장모델’을 본 연구팀이 2003년 사기업을 대상으로 파일럿 테스트를 하여 얻은 개선점을 추가하여 데이터 품질 관리에 이용하도록 하겠습니다. • 거시적인 관점에서 데이터 품질관리는 2003년 DB 그랜드 컨퍼런스에 발표된 박주석/김찬수의 ‘데이터베이스 성숙도 모델’을 이용하여 미시적 관점의 평가와 병행하여 성숙도 레벨의 관점을 포함하도록 하겠습니다. 비용/효과/위험 분석 관점 통합 데이터품질관리 모형 거시적 데이터품질관리 성숙단계에 대한 관점 미시적 데이터품질 요소에 대한 관점 데이터품질관리 수정모델 데이터품질관리 성숙도 모델 데이터베이스진흥센터의 DB품질관리 확장모델 경희대 MIS의 데이터품질관리 성숙도 모델 • 활용도(시스템, 업무) 관점 + • 데이터베이스설계 관점 • 정보자원관리 관점 7
통합 데이터품질관리 Framework 본 연구의 Data Quality Management Framework는 관리 대상요소인 데이터, 프로세스, 조직과 품질 관리 활동인 전략, 구현, 운영과의 효율적인 맵핑을 통해 세부 데이터 품질관리 요소를 도출 할 수 있다.
통합 데이터품질관리 Framework • 데이터(Data):데이터 관리 및 품질 관리에 관한 주요 연구를 살펴 보면, 데이터 현상적 요소에 대한 관리에 관한 연구, 데이터 구조적 분석에 관한 연구 등으로 구분되어 진행되어 왔다. 최근에는 이러한 두 가지 요소에 대한 통합적 관점을 가지고 데이터 품질관리의 지속적인 개선을 위한 연구가 선진국 등에서 수행되고 있다. 본 프레임워크에서는 데이터 품질관리 활동은 데이터 현상적 요인과 구조적 요인 등 통합적 관점에서 수행하는 것이 바람직하다고 말하고 있다. 따라서 데이터를 크게 데이터 값(데이터 현상), 데이터 모델 및 메타 데이터(데이터 구조) 등으로 구분하여, 각 요소 별로 주요 품질 관리 사항에 대해서 살펴보고 있다. • 정책 및 규정:본 프레임워크의 정책 및 규정은 데이터 품질관리 활동을 수행하는 데에 있어서 데이터 자체에 대한 품질을 위한 정책 및 규정과 데이터 품질을 유지하고 개선하기 위한 관리 정책 및 규정에 대한 성격으로 구분할 수가 있다. 즉, 데이터 및 모델 관리 정책 및 규정, 데이터 백업 및 복구 정책 및 규정, 시스템 보안 및 사용자 접근 권한 정책 및 규정 등의 데이터 품질에 대한 정책 및 규정과 조직 정책, 품질관리 교육 정책 및 규정, 사용자 요구사항 정책 및 규정, 문서 관리 정책 및 규정 등 데이터 품질을 유지 및 개선하기 위한 지원 활동에 대한 정책 및 규정으로 구분할 수가 있다. • 조직(Organization):데이터 품질 관리활동을 수행하기 위하여 조직은 크게 전략 조직, 구현 조직, 운영 조직 등 3 가지로 구분된다. 여기서는 조직의 역할 및 책임 등 상세한 내용보다는 각 조직을 구성하는 필요 직책 별로 담당 업무 영역에 대해서 거론하고자 한다. 즉, 각 조직 별 담당 업무 영역에 대한 구분을 이해하여, 조직 구조 및 책임 역할을 규정짓는 세부적인 활동은 수립하는 데에 도움을 주고자 한다.
통합 데이터품질관리 성숙도 단계 레벨 1 DBMS에 의한 데이터 관리 레벨 2 데이터 모델에 의한 데이터 관리 레벨 3 전사적 표준에 의한 데이터 관리 레벨 4 전사적 데이터 아키텍처에 의한 데이터 관리 정의 데이터베이스시스템을 통한 데이터의 구조적 품질을 관리하는 단계 정의 논리데이터모델과 물리데이터모델을 통한 데이터의 구조적 품질 관리 정의 전사적인 연계와 통합의 관점에서 데이터 표준화를 통한 데이터 품질 관리 정의 전사데이터아키텍처 관리를 통한 구조적 요소를 유기적으로 관리하는 단계 특징 - 특정 DBMS를 사용하여 업무 효율성을 위주로 하여 데이터 적재와 보고 기능을 위하여 데이터를 관리하는 단계를 의미한다. - 데이터 모델에 관한 절차나 정의에 관한 문서화 수준이 부족하며, DBMS 내의 툴을 사용하여 데이터 관리가 이루어지고 있다. - 업무 필요에 따라서 가변적으로 테이블, 컬럼을 만드는 경우가 많기 때문에 논리모델 관점보다는 물리적 관점이 더 요구되어진다. 특징 - 단위별 혹은 기능별로 분화된 논리 모델을 통하여 데이터 관리의 체계성을 가지고 있다. - 업무 필요에 의한 테이블컬럼 생성, 삭제와 관련되어 체계적인 프로세스를 가지고 있다. - 도메인 정의, 테이블 정의, 속성(컬럼) 정의, 코드 정의, 엔티티 정의에 관하여 문서화 되어 있으며, 이를 통하여 교육이 정기적으로 이루어지고 있다. - 단위별 혹은 기능별로 분화된 데이터 통합에 어려움을 겪고 있다 특징 - 데이터 관리의 중앙집중식 통제가 이루어지는 단계이다. - 단위별 혹은 기능별로 분화된 데이터 요소를 메타 데이터 수준에서 표준화가 이루어지며, 이를 바탕으로 표준화된 데이터 요소의 재사용과 공유가 가능하고, 단위 시스템에서 사용되는 데이터 표준에 대한 정의가 이루어지고 있다. - 데이터 요소 표준에 관하여 전사 차원의 관리 정책이 수립되어 있다. 특징 - 가장 최적화된 이상적인 단계로써, 표준화된 전사 차원의 데이터 아키텍처가 정의되어 있다. - 정의된 표준 데이터 아키텍처를 바탕으로 데이터 요소, 데이터, 데이터 모델 등이 관리되어진다. - 전사 수준에서 데이터 품질 관리에 대한 인식이 자리매김한 단계이다. - 전사 차원의 데이터 품질 관리 조직 체계가 갖추어져 있다.
데이터품질관리 성숙도 모델 II 전략 전략 전략 전략 구현 구현 구현 구현 운영 운영 운영 운영 데이터 (Data) 데이터 (Data) 데이터 (Data) 데이터 (Data) 메타 데이터) 메타 데이터) 메타 데이터) 메타 데이터) 데이터 모델 Model) 데이터 모델 Model) 데이터 모델 Model) 데이터 모델 Model) 데이터 값 데이터 값 데이터 값 데이터 값 프로세스 (Process) 프로세스 (Process) 프로세스 (Process) 프로세스 (Process) 조직 (Organization) 조직 (Organization) 조직 (Organization) 조직 (Organization) 관리 도구(Tool) 관리 도구(Tool) 관리 도구(Tool) 관리 도구(Tool) • 성숙도 모델은 레벨0 부터 레벨 4로 수정되었고, 데이터품질관리 확장모델 II의 각 요소와 맵핑이 되어야 함. 즉 레벨 1은 데이터값 부분이 중요하게 되고 단계가 성숙화됨에 따라 프로세스와 조직의 관점이 점점 중요하게 됨. 레벨 0 애플리케이션에 의한데이터 관리 레벨 1 DBMS에 의한 데이터 관리 레벨 2 모델링에 의한 데이터 관리 레벨 3 전사적 표준에 의한 데이터 관리 레벨 4 데이터 아키텍처에 의한 데이터 관리 정의 : 애플리케이션 프로그램에 의해 파일을 정의하고 관리하는 단계 정의 : 데이터베이스시스템을 통하여 데이타베이스 품질을 관리하는 단계 정의 : 데이터베이스 구축 방법론을 사용하여 논리적인 데이터모델과 물리적인 데이터모델을 관리하는 단계 정의 : 통합의 관점에서 데이터 표준화를 통한 전사적인 데이터 품질을 관리하는 단계 정의 : 전사적인 데이터 아키텍처 관리를 통한 각 데이터 계층을 유기적으로 관리하는 단계
데이터 • 데이터 현상적 요인(데이터 값) • 데이터 구조적 요인(데이터 모델, 메타 데이터) 규정 및 정책 조직 • 데이터 품질관리를 위한 규정 및 정책 • 데이터 품질관리 지원활동을 위한 규정 및 정책 • 데이터 품질 전략 수립 지원 조직 • 데이터 구현 지원 조직 • 데이터 운영 지원 조직 통합 데이터품질관리 지침서 형식 • 관리 대상: 데이터 품질관리 프레임워크에서 제시된 관리 대상을 의미한다. • 세부 요소: 관리 대상을 관리하기 위한 활동(Activity) 관점에서 세부적으로 구분하였다. 이는 관리 대상에 대한 세부적인 관리 활동을 살펴보는 것이 주 목적이다. • 주요 관리 기준/대상/내용/역할: 세부 요소 별로 주요하게 관리 및 주의 하여야 하는 요소를 나타내고 있다. 특히, 이 부분은 관리 대상 별의 특성에 따라서 기준, 대상, 내용, 역할 등으로 구성된다. 이는 데이터 현상, 데이터 구조, 프로세스, 조직 등의 Factor들이 가지는 고유한 특성들을 동일한 틀에 맞추기 보다는 각 특성에 맞는 기준을 제시하여, 통합적인 관점에서 데이터 품질관리를 조명하기 위함이다. • 아래 그림에서 보는 바와 같이, 본 프레임워크에서는 데이터, 규정 및 정책, 조직 등의 3가지 영역에서 데이터 품질관리 활동을 살펴 보고자 한다. 이 3가지 영역은 각각 고유한 관점을 가지고 있기 때문에, 이들에 대한 고유한 관점에서 세부적인 관리 활동을 수행하기 위한 지침 해설서를 작성하였다.
통합 데이터품질관리 지침서 형식 관리 대상 세부 요소 【 품질관리 제안 내용】 1. 설명(Description) - 주요 관리 대상에 대한 소개 및 설명. 2. 절차(Procedure) 및 예시(Example) `- 주요 관리 대상의 관리 절차를 설명하거나 해당 절차가 없는 경우 적절한 예시를 보여줌. 3. 기대 효과(Expected value) - 주요 관리 대상을 관리함으로써 얻을 수 있는 기대 성과 및 효익. 4. 참고사항 - 특히 본 관리 대상에서 타 관리 대상과 구별되거나, 관리 활동 시에 주의해야 하는 점들에 대해서 설명. 논리 모델(Logical model) 논리 모델 설계 • ◈ 개요 • 관리 대상에 대한 간략한 소개 • ◈ 관리 목표 • 대상을 관리함으로써 기대되는 목표 • ▷ 정의 • 관리 대상 별 세부 관리 요소에 대한 정의 및 소개 • ▷ 주요 관리 대상 • - 세부관리요소별 주요 관리 대상
데이터품질관리 ….. ….. 실행계획 실행계획 실행계획 실행계획 Conducted best practices gap analyses practices gap analyses & analysis also has some opportunity ysis also has some SM assessment & analysis also has some opportunity POSCO changed C&C investm POSCO changed C&C investment process 데이터품질관리 업무의 이해 도구의 활용 영업적 측면 회계적 측면