290 likes | 459 Views
Pertemuan II. Data Mart dan Metadata Data Warehouse. Cleansing Data . Adalah proses menghilangkan kesalahan-kesalahan data yang berasal dari proses transaksi Merupakan bagian dari proses integrasi
E N D
Pertemuan II Data Mart dan Metadata Data Warehouse
Cleansing Data • Adalahprosesmenghilangkankesalahan-kesalahan data yang berasaldariprosestransaksi • Merupakanbagiandariprosesintegrasi • Jikaproses cleansing inisalah, makainformasi yang dihasilkanoleh data warehouse jugaakansalah
Metode yang digunakanuntukmelakukanprosesekstrasisecara logic (logical exctraction) ada 2, yaitu : • Full Extraction, Prosesekstraksidilakukandenganmengambilseluruh data darisource system yang diperlukan • Increment ExtractionProsesekstraksihanyapada data yang berubahataubelumadapada target sistempadaperiodetertentu
Mekanismeekstraksisecarafisik (physical extraction) dibagimenjadiduajenis, yaitu : • Online extractionData diekstrakdari source system ke target system secaralangsung. Prosesekstraksidilakukandengancaralangsungconnectkesource systemuntukmengaksessource table. • Offline Extraction Data tidakdiekstraksecaralangsungdarisource system, namunberadadiluarsource system. Data yang akandiekstraksudahmempunyaistruktur table danstruktur data yang diharapkansudahsesuaidengan data warehouse. Misalnyaflat file.
Granularity • Adalahtingkatkedetailan data dalamsuatu data warehouse. Semakin detail data, makatingkatgranularity-nyaakansemakinrendahjuga. Level yang paling terendahdari granularity adalah data transaksi • Granularity merupakanisupentingdalam data warehouse, karena : • Semakinrendahlavel granularity, makajumlah data yang disimpandalam data warehouse jugaakansemakinbesar. • Semakinrendahlavel granularity, makatingkatkedetailan data jugaakansemakinbesardanberpengaruhpadapertanyaan yang akandijawab.
Dependent Data Mart (Inmon advocated) berlakusebagaikomponenatausuatubagiandari enterprise Data Warehouse, Data Mart dibangundengancara extract data dari Data Warehouse.
Independent Data Mart (Kimball advocated) dibangundengancara extract langsung data dariberbagai Source System. Independent Data Mart tidaktergantungpadapusatpenyimpan data seperti Data Warehouse arsitekturinibiasajugadisebutsebagai “Data Warehouse Bus structure”.
Keduaarsitektur data mart menentukanbagaimana data mart dibangun, dibedakanmenjadiduapendekatan, yakni.
Keuntungandalammembangun Data Mart lebihduludibandinglangsungmembangun Data Warehouse: - Waktu yang diperlukanuntukmembangun Data Mart lebihsedikit.- Volume Data pada Data Mart lebihsedikit- Waktu Query lebihcepat- Biayamembangun Data Mart lebihmurah.
TigaJenisUtama Metadata • 1. Metadata strukturalmenunjukkanbagaimanakumpulanobyekdisusunsecarabersama-samamenjadisatu, semisalbagaimanahalaman-halamanditatauntukmembentuksuatubab. • 2. Metadata administratifmenyediakaninformasiuntukmembantumengelolasumberdaya, semisalterkaitkapandanbagaimanasuatuinformasidiciptakan, tipedokumendaninformasiteknislainnya, sertasiapa yang bisamengaksesnya. • 3. Metadata deskriptifmenggambarkansuatusumberdayadalammaksudsepertipenemuandanidentifikasi. Diabisameliputielemensemisaljudul, abstrak, pengarang, dankatakunci.
Secarakonsep, metadata dikelompokkandalamtigakomponen. 1. KomponenDirektoriTeknikal, berisiinformasitentang data 2. KomponenDirektoriBisnis, berisiperspektifpenggunapada data 3. KomponenNavigasiInformasi, berisicaraaksespadadirektoribisnisdan data warehouse.
KomponenDirektoriTeknikalmenjelaskankepadadata warehouse administratortentangsumber data danbagaimana data dikeloladalam data warehouse. DirektoriTeknikaljugamenjelaskanaturan-aturan (rules) yang digunakanuntukmembersihkan data danmentrasformasikannyauntukkepentinganbisnis.
IsidariDirektoriTeknikal Data souce • Nama file dantipe file • Bagaimananilaididefinisikan data source • Kapan data dibuat • Data dating dari system mana • Siapapemlik data • Siapa yang memberikan data • User yang mana yang berhakmengakses data • Skema database operasional
IsidariDirektoriTeknikal… Data Target • Namadantipe field • Bagaimananilididefinisikandalam data warehouse • Dimanadtaditempatkandalam data warehouse • Versi • Tanggal update terakhir • Frekwensi update terakhir • Siapapemilik data • Siapa yang dapatmengakses data • Skema data dalam data warehouse • Cara end-user melakukanakses data
IsidariDirektoriTeknikal… Clean Up Rules • Record dan field yang akandibersihkan • Mapping antaraelemen data pada original data source dengan data warehouse • Rules yang digunakanuntukmengisinilaipada fields yang kosong • Rules untuk data integrity • Rules untukcekkonsistensi data
IsidariDirektoriTeknikal… Transformation Rules • Bagaimanamenentukanwaktudalammelakukantransformasi • Algoritma (business rules) untukmenentukannilai yang diambil (nilaiasal) • Bagaimanaringkasan data dibuat
IsidariDirektoriTeknikal… Mapping • Rules untukmelakukan filter data danuntukmelakukanpenggabungan data dari field atausumber data yang berbeda.
KomponenDirektoriBisnis. Berorientasipadamekanisme data warehouse, yang meliputi : • Istilahbisnis (business term) yang digunakanuntukmendeskripsikan data • Namateknis (alias) yang berhubungandengan business term yang dapatdigunakanuntukmengakses data • Data Sousedanrules yang digunakanuntukmendapatkan data dantanggaldimana data tersebutdibuat • Catatantetangreportdanquery yang ada • Informasitentangkeamanan data (siapa yang mempunyahakakses)
KomponenNavigasiInformasi Menjelaskan interface yang memungkinkan user untukmengaksesdirektoribisnisdan data warehouse. Denganmenggunakankompunenini, user dapatmelakukan : • Melakukanaksesdan drill down pada data warehouse • Melakukan query ke data warehouse • Meminta data barudari warehouse administrator • Melakukan transfer data dari warehouse kedatamartatau user lain