1 / 18

Arsitektur DWH

Arsitektur DWH. Pertemuan ke-2. Review. Definisi data warehouse Inmon (2002) : “A data warehouse is a subject-oriented, integrated, nonvolatile, and time-variant collection of data in support of management’s decisions”. Subject Oriented.

makala
Download Presentation

Arsitektur DWH

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Arsitektur DWH Pertemuan ke-2

  2. Review • Definisi data warehouse Inmon (2002) : “A data warehouse is a subject-oriented, integrated, nonvolatile, and time-variant collection of data in support of management’s decisions”.

  3. Subject Oriented • Data warehouse diogranisirberdasarkansubyek yang akandicapaidenganmenggaliinformasi yang terdapatpada database suatuperusahaan. • Contohnyaadalahpembuatan data warehouse untukanalisiskeuntungantransaksipenjualanpadatahun 2012.

  4. Subject Oriented

  5. Integrated • Data warehouse terintegrasidariberbagai data operasional yang berbedadalamsuatusumber database. • Syarat integrasi sumber data dapat dipenuhi dengan berbagai cara sepeti konsisten dalam penamaan variable,konsisten dalam ukuran variable,konsisten dalam struktur pengkodean dan konsisten dalam atribut fisik dari data.

  6. Non-volatile • Data dalam data warehouse tidakdapatberubahsecara real-time tetapidapatdiperbaharuisecaraperiodik

  7. Time Variant • Data dalam data warehouse sangatbergantungpadakeputusanwaktupengambilan. Contohnyaadalah data warehouse yang bersifatbulananatautahunan.

  8. Arsitektur DWH

  9. Data Staging • Data Staging meliputiproses : • Extraction • Transformation • Loading

  10. Extraction • Prosesektraksimerupakanprosespengambilan data darisatu database ataubeberapa database yang berbeda, text files, dansumber data yang lainnya. • Prosesektraksimencakuptugasmemvalidasi data danmembuang data yang tidakcocokdenganpola yang diharapkan. Sehinggatidakseluruh data yang adadalam data operasonaldimasukkan, tetapihanyabagian-bagian yang dibutuhkansaja.

  11. Extraction • Metode yang digunakanuntukmelakukanprosesekstrasiada 2, yaitu : • Full Extraction, • Prosesekstraksidilakukandenganmengambilseluruh data darisource system yang diperlukan • Increment Extraction • Prosesekstraksihanyapada data yang berubahataubelumadapada target sistempadaperiodetertentu • Mekanismeekstraksisecarafisik (physical extraction) dibagimenjadiduajenis, yaitu : • Online extraction • Data diekstrakdari source system ke target system secaralangsung. • Prosesekstraksidilakukandengancaralangsungconnectkesource systemuntukmengaksessource table. • Offline Extraction • Data tidakdiekstraksecaralangsungdarisource system, namunberadadiluarsource system. • Data yang akandiekstraksudahmempunyaistruktur table danstruktur data yang diharapkansudahsesuaidengan data warehouse. Misalnyaflat file.

  12. Transformation • Prosestransformasi data merupakanprosesmengubah data dari format operasionalmenjadi format data warehouse. • Meliputi : • mengkonversitipe data • melakukanbeberapaperhitungan • penyaringan data yang tidakrelevan • meringkasdata

  13. Loading • Proses loading merupakantahapakhirdalampengisian data warehouse. • Tujuandariprosesiniadalahuntukmemuat data yang sudahterseleksidariprosestransformasikedalam data warehouse.

  14. Metadata • Metadata merupakanprosesidentifikasiatributdanstrukturdarisebuah data atauinformasiuntukmenjelaskan database secararinciyaitudarinama, tipe, danukuranatribut. • Jika data tersebutdalambentukteks, metadatanyabiasanyaberupaketeranganmengenainamaruas (field), panjang field, dantipefieldnya: integer, character, date, dll. • Untukjenis data gambar (image), metadata mengandunginformasimengenaisiapapemotretnya, kapanpemotretannya, dan setting kamerapadasaatdilakukanpemotretan

  15. Data Mart

  16. Data Mart • Bagiandaridata warehouse yang mendukungkebutuhanpadatingkatdepartemenataufungsibisnistertentudalamperusahaan. • Karakteristik yang membedakan data mart (Connolly, Begg, Strachan 1999) : • Data mart memfokuskanhanyapadakebutuhan-kebutuhanpemakai yang terkaitdalamsebuahdepartemenataufungsibisnis. • Data mart biasanyatidakmengandung data operasional yang rincisepertipadadata warehouse. • Data mart hanyamengandungsedikitinformasidibandingkandengandata warehouse. • Data mart lebihmudahdipahamidandinavigasi.

  17. DATAWAREHOUSE vs DATAMART • Datawarehouse = gabungan dari beberapa datamart yang levelnya berada pada perusahaan atau organisasi. • Datamart = bagian dari datawarehouse yang berada level departemen pada perusahaan atau organisasi tersebut. Data mart menangani sebuah business proses, misalkan penjualan.

More Related