230 likes | 458 Views
KUALITAS DATA. Mengelola Kualitas Data. Data berkualitas tinggi: Akurat Konsisten Tersedia pada waktu yang tepat Fakta yang menunjukkan bahwa menjaga data yang berkualitas tinggi itu sulit: 2% record dalam data pelanggan kedaluarsa dalam satu bulan karena hal-hal seperti:
E N D
Mengelola Kualitas Data • Data berkualitas tinggi: • Akurat • Konsisten • Tersedia pada waktu yang tepat • Fakta yang menunjukkan bahwa menjaga data yang berkualitas tinggi itu sulit: • 2% record dalam data pelanggan kedaluarsa dalam satu bulan karena hal-hal seperti: • Pelanggan meninggal • Pelanggan berpindah lokasi • Pelangan bercerai dsb
Problem Kualitas Data • Sumber data eksternal • Data yang berasal dari pihak luar mungkin tidak akurat, salah, atau tidak lengkap • Penyimpanan data yang redundan • Data tersebar dalam berbagai bentuk (spreadsheet, database, dokumen) dan ada kemungkinan tidak konsisten dan tidak kompatibel • Kekurangan Komitmen Organisasi • Pemakai internal tidak patuh terhadap aturan-aturan yang telah ditetapkan dan organisasi membiarkannya
Usaha untuk Menjaga Kualitas Data • Membentuk komite yang menjamin bahwa kualitas data terjaga dengan baik • Menerapkan prinsip TQM untuk selalu meningkatkan kualitas data • Mengatasi hambatan-hambatan dalam organisasi
Data Dictionary dan Repository • Data dictionary merupakan istilah lama dan repository adalah istilah yang lebih baru • Data dictionary: Tempat penyimpanan informasi tentang database yang mendokumentasikan elemen-elemen data dalam database • Repository: Istilah baru yang fungsinya lebih kompleks daripada data dictionary
Repository • Repository atau dikenal dengan nama lengkap information repository tidak hanya mencakup metadata yang menjelaskan data dalam organisasi tetapi juga lingkungan pemrosesan informasi
IRDS • IRDS (Information Repository Dictionary System) : S/W yang digunakan untuk mengelola dan mengontrol akses terhadap information repository • IRDS menyediakan fasilitas untuk menyimpan dan memproses deskripsi data dan sumber pemrosesan data • Sistem yang mengikuti IRDS dapat mentransfer definisi data yang dihasilkan oleh berbagai produk • IRDS menjadi standar ISO (1990)
Mengatur Kinerja Database • Ada 5 hal yang perlu diperhatikan agar kinerja database terjaga dengan baik: • Pemasangan DBMS • Pemakaian memori • Penggunaan I/O • Penggunaan CPU • Tuning aplikasi
Pemasangan DBMS • Instalasi DBMS harus benar-benar sesuai dengan lingkungan • Biasanya tertera dalam file README • Penggunaan nilai default untuk parameter tertentu seringkali membuat kinerja yang tidak optimal • Sebelum melakukan instalasi DBMS, DBA harus memastikan ketersediaan ruang hard disk
Pemasangan DBMS (Lanjutan…) • Baca manual DBMS untuk menerjemahkan parameter ukuran database secara logis (seperti panjang field, jumlah baris tabel, dan perkiraan pertumbuhan data) ke dalam kebutuhan ruang fisik • Alokasi ruang disk untuk database perlu mendapat perhatian. Sistem backup pada sistem UNIX tertentu hanya mempunyai masalah pada file yang berukuran lebih dari 1 GB
Pemakaian Memori • Supaya efisien, penggunaan memori oleh DBMS perlu juga diperhatikan • Sebagai contoh, sistem Oracle menggunakan memori untuk menaruh data dictionary. • Bila memori tidak cukup, sistem akan sering membaca struktur tabel dari disk. Hal ini mempengaruhi kinerja sistem
Penggunaan I/O • Aplikasi database berpengaruh besar terhadap I/O • Walapun kecepatan CPU tinggi, I/O tidak bersifat proporsional • Suatu objek yang sering diakses secara bersamaan dapat dibagi ke dalam beberapa disk
Penggunaan CPU • Hampir semua operasi database memerlukan aktivitas CPU • Penggunaan CPU perlu dimonitor ketika melakukan tuning database • Pemakaian lebih dari CPU merupakan alternatif untuk memperbaiki kinerja sistem • Pemantauan perlu dilakukan pada saat beban puncak ataupun saat beban rendah
Tuning Aplikasi • Selain penyetelan DBMS, aplikasi pun perlu diatur • Memperhatikan dan memodifikasi SQL dalam aplikasi kadang perlu dilakukan • Perubahan SQL dalam aplikasi acapkali dapat meningkatkan kinerja sistem • Kadangkala penyelesaian dari masalah ini adalah dengan menggunakan denormalisasi
Tuning Aplikasi (lanjutan…) • Kadangkala DBA perlu melakukan tindakaan seperti reindexing, mengubah ukuran blok data, mengalokasikan file-file pada peranti penyimpan. • DBA juga mempunyai peran dalam mengarahkan pemrogram dengan memberikan teknik yang paling efektif dalam berinteraksi dengan database
Ketersediaan Data • Ketersedian data merupakan tuntutan dengan prioritas yang paling tinggi • Kegagalan dalam menyediakan ketersediaan data dapat menimbulkan keluhan/ketidaknyamanan bagi pemakai dan bahkan kerugian bisnis • Pengoperasian e-business menuntut ketersedian data dalam 24 x 7 x 365 • Tugas dari DBA adalah memastikan bahwa sampah dari downtime harus bisa diminimalkan
Penanganan untuk Menjaga Ketersediaan Data • Mengantisipasi kegagalan H/W penggunaan clustered server • Mengantisipasi data hilang atau rusak penggunaan disk mirroring • Menjaga downtime pemilihan waktu yang tepat • Beberapa DBMS menyediakan utilitas untuk melakukan pemeliharaan secara otomatis tanpa menghentikan sistem (nondisruptive utility) • Mengantisipasi masalah yang terkait dengan jaringan • Perlu strategi penanganan cepat manakala jaringan terganggu • Penggunaan teknologi terbaru firewall dan router