180 likes | 349 Views
Arsitektur DWH. Pertemuan ke-2. Review. Definisi data warehouse Inmon (2002) : “A data warehouse is a subject-oriented, integrated, nonvolatile, and time-variant collection of data in support of management’s decisions”. Subject Oriented.
E N D
Arsitektur DWH Pertemuan ke-2
Review • Definisi data warehouse Inmon (2002) : “A data warehouse is a subject-oriented, integrated, nonvolatile, and time-variant collection of data in support of management’s decisions”.
Subject Oriented • Data warehouse diogranisirberdasarkansubyek yang akandicapaidenganmenggaliinformasi yang terdapatpada database suatuperusahaan. • Contohnyaadalahpembuatan data warehouse untukanalisiskeuntungantransaksipenjualanpadatahun 2012.
Integrated • Data warehouse terintegrasidariberbagai data operasional yang berbedadalamsuatusumber database. • Syarat integrasi sumber data dapat dipenuhi dengan berbagai cara sepeti konsisten dalam penamaan variable,konsisten dalam ukuran variable,konsisten dalam struktur pengkodean dan konsisten dalam atribut fisik dari data.
Non-volatile • Data dalam data warehouse tidakdapatberubahsecara real-time tetapidapatdiperbaharuisecaraperiodik
Time Variant • Data dalam data warehouse sangatbergantungpadakeputusanwaktupengambilan. Contohnyaadalah data warehouse yang bersifatbulananatautahunan.
Data Staging • Data Staging meliputiproses : • Extraction • Transformation • Loading
Extraction • Prosesektraksimerupakanprosespengambilan data darisatu database ataubeberapa database yang berbeda, text files, dansumber data yang lainnya. • Prosesektraksimencakuptugasmemvalidasi data danmembuang data yang tidakcocokdenganpola yang diharapkan. Sehinggatidakseluruh data yang adadalam data operasonaldimasukkan, tetapihanyabagian-bagian yang dibutuhkansaja.
Extraction • Metode yang digunakanuntukmelakukanprosesekstrasiada 2, yaitu : • Full Extraction, • Prosesekstraksidilakukandenganmengambilseluruh data darisource system yang diperlukan • Increment Extraction • Prosesekstraksihanyapada data yang berubahataubelumadapada target sistempadaperiodetertentu • Mekanismeekstraksisecarafisik (physical extraction) dibagimenjadiduajenis, yaitu : • Online extraction • Data diekstrakdari source system ke target system secaralangsung. • Prosesekstraksidilakukandengancaralangsungconnectkesource systemuntukmengaksessource table. • Offline Extraction • Data tidakdiekstraksecaralangsungdarisource system, namunberadadiluarsource system. • Data yang akandiekstraksudahmempunyaistruktur table danstruktur data yang diharapkansudahsesuaidengan data warehouse. Misalnyaflat file.
Transformation • Prosestransformasi data merupakanprosesmengubah data dari format operasionalmenjadi format data warehouse. • Meliputi : • mengkonversitipe data • melakukanbeberapaperhitungan • penyaringan data yang tidakrelevan • meringkasdata
Loading • Proses loading merupakantahapakhirdalampengisian data warehouse. • Tujuandariprosesiniadalahuntukmemuat data yang sudahterseleksidariprosestransformasikedalam data warehouse.
Metadata • Metadata merupakanprosesidentifikasiatributdanstrukturdarisebuah data atauinformasiuntukmenjelaskan database secararinciyaitudarinama, tipe, danukuranatribut. • Jika data tersebutdalambentukteks, metadatanyabiasanyaberupaketeranganmengenainamaruas (field), panjang field, dantipefieldnya: integer, character, date, dll. • Untukjenis data gambar (image), metadata mengandunginformasimengenaisiapapemotretnya, kapanpemotretannya, dan setting kamerapadasaatdilakukanpemotretan
Data Mart • Bagiandaridata warehouse yang mendukungkebutuhanpadatingkatdepartemenataufungsibisnistertentudalamperusahaan. • Karakteristik yang membedakan data mart (Connolly, Begg, Strachan 1999) : • Data mart memfokuskanhanyapadakebutuhan-kebutuhanpemakai yang terkaitdalamsebuahdepartemenataufungsibisnis. • Data mart biasanyatidakmengandung data operasional yang rincisepertipadadata warehouse. • Data mart hanyamengandungsedikitinformasidibandingkandengandata warehouse. • Data mart lebihmudahdipahamidandinavigasi.
DATAWAREHOUSE vs DATAMART • Datawarehouse = gabungan dari beberapa datamart yang levelnya berada pada perusahaan atau organisasi. • Datamart = bagian dari datawarehouse yang berada level departemen pada perusahaan atau organisasi tersebut. Data mart menangani sebuah business proses, misalkan penjualan.