430 likes | 823 Views
Manajemen Ketersediaan Layanan TI. Teknologi Infrastruktur. Sasaran. Memahami konsep Manajemen Ketersediaan ( Availability Management ) menurut IT Infrastructure Library . Mengenal teknik-teknik Manajemen Ketersediaan layanan TI. Ketersediaan.
E N D
Manajemen Ketersediaan Layanan TI Teknologi Infrastruktur
Sasaran • Memahami konsep Manajemen Ketersediaan (Availability Management) menurut IT Infrastructure Library. • Mengenal teknik-teknik Manajemen Ketersediaan layanan TI.
Ketersediaan • Ketergantungan bisnis modern pada TI menuntut ketersediaan layanan TI yang tinggi. • Fleksibilitas bisnis berkat teknologi internet menuntut ketersediaan layanan TI setiap saat. • Availability Management berorientasi kepada kebutuhan bisnis dan pengguna akan ketersediaan layanan TI.
Ketersediaan • Availability: kemampuan untuk menjalankan fungsi pada saat dibutuhkan atau dalam suatu periode waktu. • Ketersediaan layanan TI tergantung pada: • Ketersediaan komponen pendukung. • Ketahanan terhadap gangguan. • Kualitas pemeliharaan dan dukungan teknis. • Kualitas proses-proses dan prosedur pengelolaan. • Keamanan, integritas, dan ketersediaan data.
Ketersediaan • Faktor-faktor pendukung ketersediaan: • Keandalan (reliability) • Keandalan komponen dan adanya mekanisme penanggulangan gangguan. • Kemudahan pemeliharaan (maintainability) • Pemeliharaan untuk mencegah terjadinya gangguan. Termasuk deteksi tanda-tanda kerusakan. • Kemudahan perbaikan (servicability) • Adanya perjanjian/kontrak dukungan perbaikan dengan vendor atau pihak ketiga.
Availability Management • Tujuan: • Mendukung pencapaian tujuan bisnis dengan mengoptimasi pengerahan infrastruktur, layanan, dan SDM dalam menyediakan dan mempertahankan tingkat ketersediaan secara efisien. • Aktivitas utama: • Identifikasi persyaratan ketersediaan bisnis. • Menselaraskannya dengan kemampuan infrastruktur, layanan, dan SDM: identifikasi opsi-opsi penyempurnaan dan biayanya. • Mengukur/monitor realisasi ketersediaan layanan TI.
Ruang Lingkup • Lingkup Availability Management: • Semua layanan TI yang dikenai SLA atau SLR (Service Level Agreement & Requirement) • Layanan TI vital (tanpa SLA formal sekalipun). • Layanan pendukung layanan-layanan diatas yang disediakan oleh unit kerja internal maupun vendor. • Hal-hal lain yang memiliki dampak pada ketersediaan layanan-layanan diatas, seperti training, keahlian SDM, SOP, dan tools.
Prinsip Manajemen Ketersediaan • Prinsip 1: Ketersediaan adalah inti dari (persepsi) kepuasan pengguna dan bisnis.
Prinsip Manajemen Ketersediaan • Prinsip 2: Kecepatan menanggulangi gangguan ketersediaan berdampak besar pada kepuasan bisnis dan pengguna. • Menuntut adanya proses, prosedur, dan mekanisme penanggulangan gangguan. • Prinsip 3: Manajemen Ketersediaan yang efektif menuntut pemahaman tentang fungsi layanan TI dalam proses-proses bisnis. • Dapat memahami sumber gangguan dengan lebih baik dari pola utilisasi komponen-komponen sistem.
Kerawanan kapasitas akibat gangguan Capacity Management Service Level Management SLA final Availability Management Usulan SLA Rencana kapasitas Kerugian akibat ketidak-tersediaan Usulan mekanisme minimasi dampak gangguan IT Financial Management Service Continuity Management Pembiayaan perbaik- an ketersediaan Hasil analisa kevitalan layanan Peran Manajemen Ketersediaan • Sebagai penanggung-jawab dan pengambil keputusan yang berhubungan dengan tingkat ketersediaan. C B D A Peran AM sering di-bypass
A: Biaya Ketersediaan • Biaya investasi TI meningkat dengan dinaikannya tingkat ketersediaan.
Biaya redesign infrastruktur (termasuk dukungan teknis). Tingkat Ketersediaan Optimal • Idealnya: disesuaikan dengan kebutuhan dan biayanya setimpal dengan potensi kerugian. • Kebutuhan akan ketersediaan yang melebihi tingkat ketersediaan optimal infrastruktur dapat melambungkan biaya.
Biaya Ketersediaan • Prinsip: merencanakan ketersediaan sejak awal (dilibatkan dalam perancangan sistem) akan lebih murah. • Availability Management mengusulkan opsi-opsi pemenuhan persyaratan ketersediaan beserta biayanya. • Tidak semua masalah ketersediaan adalah masalah teknologi. • Faktor prosedur operasional dan pemeliharaan mungkin sangat berpengaruh.
Biaya Ketidak-tersediaan • Mengetahui biaya kerugian akibat ketidak-tersediaan penting dalam memutuskan tingkat investasi TI untuk memenuhi persyaratan ketersediaan. • Perkiraan dampak ketidak-tersediaan: • Jumlah layanan/transaksi bisnis yang terkena dampak. • Mudah dihitung tapi kurang bermanfaat. • Perkiraan nilai kerugian moneter akibat terhentinya layanan bisnis. • Kerugian tangible dan intangible.
Biaya Ketidak-tersediaan • Permasalahan: • Banyaknya faktor yang harus masuk dalam perhitungan. • Sulit mengkuantifikasi biaya intangible. • Data sulit diperoleh.
B: Perencanaan Ketersediaan • Ketersediaan umumnya adalah salah satu komponen utama SLA. • Availability Management merumuskan: • Kriteria layanan-layanan TI yang vital. • Kriteria “ketidak-tersediaan” (downtime). • Dampak ketidak-tersediaan pada bisnis. • Kebutuhan ketersediaan kuantitatif: batas toleransi bisnis terhadap downtime. • Jam-buka layanan yang diinginkan. • Prioritas waktu layanan (jam-jam sibuk, dsb.) • Kebutuhan spesifik lainnya (jika ada).
Perencanaan Ketersediaan • Evaluasi biaya untuk memenuhi kebutuhan akan ketersediaan: • Kuantifikasi dampak ketidak-tersediaan (nilai kerugian bisnis). • Identifikasi persyaratan ketersediaan, keandalan, dan kemudahan perawatan komponen-komponen yang terlibat. • Identifikasi kemudahan perbaikan komponen-komponen dari vendor eksternal. • Kalkulasi total biaya untuk memenuhi kebutuhan diatas. • Negosiasikan tingkat ketersediaan dengan biaya dan potensi kerugian yang berimbang.
C: Rancangan Proaktif • Tujuan: menghindari terjadinya ketidak-tersediaan layanan TI yang berdampak kerugian. • Prinsip: kegiatan yang tidak terencana (darurat) akan lebih besar biayanya.
Perancangan Infrastruktur • Availability Management merumuskan: • Spesifikasi keandalan dan serviceability komponen infrastruktur (hardware & software). • Baik yang menjadi tanggung-jawab internal maupun pihak eksternal (vendor). • Lokasi dan cara pengukuran ketersediaan. • Usulan perbaikan struktur dan prosedur pengelolaan sistem. • Validasi rancangan akhir mengenai terpenuhinya persyaratan minimum ketersediaan. • Analisa dengan model atau melalui testing/benchmarking.
Analisis Infrastruktur • Analisa SPOF (single point of failure) dengan CFIA (component failure impact analysis) • Tabulasi layanan dan komponen-komponen infrastruktur atau CI (configuration item). • Tandai ketergantungan layanan terhadap tiap CI: • Kosong jika tidak tergantung pada CI tsb. • X jika tergantung sepenuhnya pada CI tsb. • A jika tergantung tapi dapat dialihkan ke CI lain. • B jika dapat dialihkan ke CI lain tapi harus ada kegiatan perbaikan (recovery). • CI dengan banyak X adalah komponen kritis. • Layanan dengan banyak X adalah layanan kompleks: potensi keandalannya rendah.
CFIA • CI yang kritis harus: • Memiliki cadangan atau alternatif. • Memiliki prosedur pemulihan (recovery).
CFIA • Teknik lain: orientasi pada jumlah user yang terkena dampak. VBF: vital business function (proses bisnis vital) • Dapat ditambahkan kolom: • Kode CI-CI lain yang tergantung padanya. • Kerusakan pada CI akan berdampak pada CI-CI lain tsb. • Semakin banyak semakin kritis CI tsb.
CFIA Lanjut • … kolom-kolom tambahan: • Probabilitas kerusakan (dari statistik MTBF) atau dengan label kualitatif: rendah/sedang/tinggi. • Perkiraan waktu perbaikan: • Dari data perbaikan masa lalu, atau • Dari hasil uji-coba prosedur perbaikan.
Fault Tree Analysis • Struktur rantai penyebab ketidak-tersediaan layanan TI • Untuk mengidentifikasi mekanisme pencegahan. conditional event conditional gate resulting events OR gate basic events
D: Rancangan Reaktif • Elemen kunci: • Manajemen Insiden yang mapan • Prosedur eskalasi yang ketat. • Definisi peran dan tanggung-jawab dari tim penanggulangan gangguan yang jelas. • Adanya prosedur komunikasi yang jelas jika terjadi gangguan besar. • Fasilitas manajemen sistem • Tools untuk mendeteksi, mendiagnosa, dan memulihkan dampak gangguan sistem. • Prosedur pengumpulan data (log) untuk diagnosa yang efisien.
Rancangan Reaktif • … elemen kunci: • Identifikasi kebutuhan backup & recovery • Untuk data, software, maupun hardware (spare). • Pengembangan dan testing prosedur backup & recovery. • Waktu pemulihan (recovery) yang sesuai target dan predictable.
Tingkatan Investasi Ketersediaan • Base product & components • Paling mendasar: komponen-komponen yang memenuhi persyaratan keandalan. • Effective service management processes • Terselenggaranya Availability Management, Manajemen Insiden/Problem, dan Manajemen Perubahan.
Tingkatan Investasi Ketersediaan • System management • Mekanisme monitoring, deteksi, dan pemulihan gangguan otomatis. • High availability design • Eliminasi SPOF (titik rawan), penyediaan komponen alternatif/cadangan, dan mekanisme untuk mempersingkat downtime akibat kerusakan. • Full redundancy • Fasilitas dual/mirror site.
Rencana Peningkatan Ketersediaan • Alasan peningkatan ketersediaan: • Seringnya pelanggaran SLA ketersediaan. • Seringnya terjadi gangguan (downtime). • Hasil pengukuran ketersediaan menunjukkan trend penurunan. • Waktu perbaikan kerusakan yang melebihi batas toleransi. • Permintaan pengguna/bisnis untuk meningkatkan ketersediaan. • Gangguan ketersediaan akibat pertumbuhan/pengembangan bisnis. • Bagian dari rencana strategis TI.
Rencana Peningkatan Ketersediaan • Garis besar isi rencana: • Tingkat ketersediaan aktual saat ini (dalam bahasa pengguna/bisnis) dan tingkat ketersediaan ideal menurut SLA. • Aktivitas-aktivitas perbaikan yang sedang dilaksanakan dengan pertimbangan biaya/manfaat masing-masing. • Perubahan tingkat layanan beserta alasannya, dan opsi-opsi untuk memenuhinya beserta biayanya. • Rencana kegiatan analisa pencarian penyebab gangguan-gangguan ketersediaan atau SOA (system outage analysis). • Sosialisasi tentang potensi teknologi baru atau versi baru (upgrade) dalam memperbaiki tingkat ketersediaan layanan TI.
System Outage Analysis • SOA: kegiatan analisa dengan melibatkan berbagai data dari log-log proses (termasuk aktifitas dukungan teknis) untuk mencari penyebab gangguan. • Pelaksanaanya melibatkan administrator sistem & jaringan, staf dukungan teknis, user/ operator, analis sistem, vendor, manajemen bisnis. • Hasilnya dilaporkan beserta rekomendasi langkah-langkah perbaikan.
System Outage Analysis • Struktur kegiatan SOA: