1 / 24

PENGANTAR DATA TERDISTRIBUSI

PENGANTAR DATA TERDISTRIBUSI. Distribusi Data. Pendahuluan. Konfigurasi dari pengolahan terdistribusi bergantung pada data yang akan dipindahkan dan apakah data harus didistribusikan atau tidak Data distributed atau lainnya dapat disimpan dalam salah satu dari dua bentuk berikut ini, yaitu:

Download Presentation

PENGANTAR DATA TERDISTRIBUSI

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. PENGANTAR DATA TERDISTRIBUSI Distribusi Data

  2. Pendahuluan • Konfigurasi dari pengolahan terdistribusi bergantung pada data yang akan dipindahkan dan apakah data harus didistribusikan atau tidak • Data distributed atau lainnya dapat disimpan dalam salah satu dari dua bentuk berikut ini, yaitu: • Database • Kumpulan file

  3. Host Host Host Host Host Host Host Host Kategori data distribusi • Ada beberapa jenis dimana data dapat didistribusikan dan digunakan. Gbr. 2 Gbr. 1 Central data, single host Central data, multiple host Gbr. 4 Gbr. 3 Dependent hierarchical data Independent hierarchical data

  4. keterangan • Gambar 1 dan 2 menunjukkan sistem data terpusat. Gambar 3 dan 4 menunjukkan sistem data hirarki • Pada gambar 3 dependent hirarchial data, data pada mesin tingkat bawah berhubungan dengan mesin pada tingkat di atasnya. Kadang-kadang mesin ini merupakan subset dari data pada tingkat di atasnya yang digunakan untuk aplikasi lokal. Copy master data harus disimpan pada mesin tingkat atas. Jika terjadi suatu pengubahan data pada mesin tingkat bawah pengubahan ini harus di-upload ke mesin yang lebih atas.

  5. Split-data Records for District B Records for District A • Karakteristik: • Struktur dan format data sama, namun datanya berbeda • Struktur data dan program aplikasi dibuat oleh satu team • Setiap bagian menyimpan data bagiannya saja. • Transaksi pada suatu bagian mungkin membutuhkan data dari bagian lain. • Transaksi atau data ditransmisikan melalui jaringan. Host Host Network Records for District C Host Split data

  6. Sistem separate-data Production • Karakteristik: • Data dan program berbeda • Mungkin diinstal oleh team yang berbeda • Terminal pemakai dapat dihubungkan ke semua sistem, untuk kebutuhan akan data. • Melayani perusahaan yang sama • Contoh: sistem untuk bagian produksi, pembelian, dan akuntansi umum • Sistem yang menggunakan komputer mini lebih terdistribusi, karena masing-masing sistem mempunyai komputer sendiri, dan juga file data • Menggunakan concentrata untuk pengiriman transaksi maupun data. General Accounting Host Host Network Puchasing Host Separate data

  7. Sistem data salinan (replicated-data) • Karakteristik: • Salinan data sama disetiap lokasi • Data di-update dari sistem pusat • Keuntungan • Menghindari kebutuhan transmisi data dalam jumlah besar sehingga lebih murah • Bila terjadi kerusakan, salinan duplikasi masih ada. • Kerugian • Biaya tempat penyimpanan • Update dan reorganisasi file harus dikerjakan beberapa kali Host Host Network Host XYZ XYZ XYZ Replicated data

  8. Sistem data heterogen • Karakteristik: • Sistem komputer independen satu sama lain • Data disimpan pada setiap sistem komputer • Tidak ada hubungan antar organisasi data yang berbeda • Pemakai dapat mengakses komputer manapun melalui jaringan, namun ia harus mengetahui bagaimana data diorganisasikan pada komputer yang diaksesnya. University system Stok market system Host Host Network Library system Newspaper Information retrieval system Heterogeneous data system Host Host

  9. Peng-Update-an pada salinan data berganda • Jika sistem terdistribusi mempunyai dua buah data yang sama atau salinan berganda (multiple copies) dari data yang sama, maka sangat perlu diperhatikan dalam perencanaan update dan recovery. • Restart dan recovery dapat menimbulkan masalah, jika data diupdate secara terus menerus.

  10. Beberapa alasan menggunakan salinan data berganda • Biaya transmisi • Biaya transmisi menjadi lebih murah dengan menggunakan salinan data berganda • Waktu tanggap • Akses terhadap lokal dapat ditingkatkan • Keberadaan (availability) • Akses terhadap data lokal atau mengubah salinan data dapat meningkatkan keberadaan data • Sekuriti • Jika salah satu salinan data rusak, maka salinan data yang lain dapat digunakan. • Organisasi data • Data yang sama dapat diorganisasikan secara berlainan pada mesin yang berbeda • Biaya konversi • File yang sama dapat dicadangkan atau dipelihara setelah database atau sistem terdistribusi diimplementasikan.

  11. Peng-update-an salinan master • Ada dua pendekatan untuk peng-update-an master file: • Seluruh transaksi langsung meng-update master • Master menerbitkan salinan yang baru dari record-record yang berubah ke prosesor lainnya secara periodik • Transaksi peng-update buka file master • Seluruh transaksi disimpan untuk peng-update-an periodik dari master

  12. Kriteria split • Pembagian secara geografis • Pembagian berdasarkan jenis data • Pembagian berdasarkan jenis pengguna

  13. Pembagian secara geografis • Alasan untuk memecah atau membagi secara geografis adalah: • Untuk mengurangi biaya total sistem • Untuk meningkatkan keberadaan sistem data yang dapat dijangkau oleh pemakai akhir. • Untuk meningkatkan keaksesan dari data • Memerikan waktu respon yang cepat • Memberikan authoritas kepada user lokal, untuk memelihara pengontrolan data mereka • Kerugian • Sistem menjadi kompleks dan membuang waktu untuk mencari atau memproses data secara keseluruhan • Prosesor sekuriti lebih baik dan aman hanya pada lokasi pusat saja • Data tidak kompatibel mungkin menjadi banyak menyebabkan keterpaduan menjadi sulit.

  14. Pembagian berdasarkan jenis data • Keuntungan • Implementasi dan kontrol lokal lebih baik. Kantor pusat tidak dapat mengerjakan sistem data pabrik. • Sederhana, menempatkan semua aplikasi pada satu mesin menjadi sangat kompleks. Lebih mudah mengimplementasikan sistem yang kecil • Manajemen lokal dapat mengontrol pemrosesan datanya sendiri. • sekuriti

  15. Pembagian berdasarkan jenis pengguna • Ada perbedaan antara sistem operasi atau produksi dengan sistem informasi. • Sistem operasi dirancang untuk kumpulan operasi yang ditetapkan sebelumnya dan terbatas. Volume transaksi yang akan ditangani dapat diketahui jika struktur datanya telah dirancang. Sedangkan pada sistem informasi dari query yang tidak perlu diketahui secara terperinci. Struktur datanya dirancang untuk menanyai query secara spontan.

  16. Pembagian berdasarkan jenis pengguna • Beberapa contoh sistem pengoperasian • Sistem perbankan dengan dilengkapi terminal yang bertindak sebagai kasir • Sistem pemesanan tiket pesawat terbang • Sistem pemasukkan dan inquery pesanan penjualan • Sistem pengontrol lalu lintas udara • Beberapa contoh sistem informasi • Sistem retrival informasi perpustakaan • Sistem informasi manajemen pemasaran • Sistem pencarian database pegawai • Sistem informasi detektif polisi

  17. Salinan Data Multiple (berganda) • Jika prosesor ditempatkan pada lebih satu lokasi maka diperlukan penggunaan data yang sama sehingga masing-masing lokasi menyimpan salinan data. • Ada beberapa keuntungan dengan memiliki lebih dari satu salinan data, yaitu: • Transmisi data menjadi berkurang. Pengurangan biaya komunikasi mungkin lebih besar dibandingkan peningkatan biaya penyimpanan dan pemrosesan. • Jika salinan data rusak akan muncul satu salinan duplikat • Keberadaan sistem yang dapat diterima oleh pemakai akhir mungkin dapat ditingkatkan • Waktu tanggap kepada pemakai akhir mungkin dapat ditingkatkan

  18. Salinan Data Multiple (berganda) • Kerugian dengan adanya lebih dari satu data • Biaya penyimpanan meningkat • Peng-update-an dan re-organisasi file harus dikerjakan berulang kali

  19. Masalah-masalah pada data terdistribusi • Ada penggunaan antara peng-update-an transaksi • Dua buah transaksi mungkin meng-update item data yang sama pada transaksi lainnya, sehingga menghasilkan data yang salah • Pembacaan yang tidak konsisten • Dengan mempunyai lebih dari satu salinan data dan kadang-kadang hanya satu salinan dari data terdistribusi dapat menghasilkan informasi yang tidak konsisten pada saat pembacaan data. • Timbulnya deadlock • Penguncian pada data terdistribusi untuk mencegah terjadinya gangguan up-date dapat menyebabkan timbulnya deadlock kecuali kalau digunakan protokol yang tepat.

  20. Masalah-masalah pada data terdistribusi • Recovery (pemulihan) • Pemulihan setelah terjadinya kegagalan perlu dikontrol sehingga peng-updetan tidak menjadi hilag atau diproses dua kali • Recovery dari salinan multiple • Pengauditan • Sangat sulit pada beberapa sistem untuk mengetahui siapa yang sedang mengerjakan data.dalam hal ini diperlukan rencana yang tepat untuk pengauditan • Pengamanan dan proteksi • Kontrol pengamanan dan produksi kadang-kadang lemah pada sistem terdistribusi.

  21. Gangguan Update (update interference) • Jika suatu sistem storege dimana record diupdate oleh transaksi multiple secara terus menerus, kemungkinan besar akan timbul maslah gangguan. Misal ada dua transaksi A dan B. kedua-duanya akan menjumlahkan sebuah total dari sebuah field tertentu. Berikut ini adalah urutan dari proses yang akan menghasilkan field yang keliru. • A membaca nilai field X0 • B membaca nilai field X0 • A mengupdate nilai tersebut menjadi Xo + Xa dan menuliskannya pada storage. • B mengupdate nilai tersebut menjadi Xo + Xb dan menuliskannya pada storage. • Hasil akhir seharusnya adalah Xo + Xa + Xb. Tetapi B telah menulis hasil dari peng-updatetan oileh A menjadi Xo + Xb • Untuk mencegah hal tersebut diperlukan mekanisme yang membolehkan suatu transaksi untuk mengunci record tersebut antara pembacaan dan penulisannya sehingga tidak ada transaksi yang dapat menyebabkan suatu kekeliruan update.

  22. Deadlock (Deadly embrance) • Keadaan yang sangat sulit untuk dikontrol timbul pada saat proses update membutuhkan dua record. Record Y dibaca tetapi tidak mungkin diupdate sampai record Z dibaca. Record Y harus dikunci selama proses update. Urutan prosesnya adalah sebagai berikut: • Transaksi A: • Kunci record Y • Baca record Y • Baca record Z • Update record Y • Buka kunci record Y • Keadaan deadlock akan timbul jika transaksi lain mengunci record Z dan tidak dibuka sampai transaksi ini telah membaca record Y. proses untuk transaksi B adalah sebvagai berikut: • Transaksi B • Kunci record Z • Baca record Z • Baca record Y • Update record Z • Buka kunci record Y

  23. Deadlock • Kedua transaksi membentuk deadlock sebagai berikut: • Transaksi A mengunci record Y • Transaksi A membaca record Y • Transaksi B mengunci record Z • Transaksi B membaca record Z • Transaksi A mencoba untuk membaca record Z tetapi record tersebut terkunci • Transaksi B mencoba untuk membaca record Y tetapi record tersebut terkunci • Kedua transaksi menunggu untuk record yang diinginkan tetapi ternyata record tersebut terkunci tidak ada program untuk membuka record yang terkunci.

  24. Deadlock • Ada dua cara untuk mengatasi deadlock: • Memudarkan kembali pemrosesan saat deadlock terjadi (backout) dan • Mencegah terjadinya deadlock secara keseluruhan.

More Related