170 likes | 537 Views
Fuzzy Clustering. Sistem Berbasis Fuzzy Materi 5. Eko Prasetyo Teknik Informatika Universitas Muhammadiyah Gresik 2012. Konsep Clustering. Klasifikasi melakukan pengelompokan data dimana setiap data sudah ada label kelasnya
E N D
Fuzzy Clustering SistemBerbasis Fuzzy Materi 5 Eko Prasetyo TeknikInformatika UniversitasMuhammadiyah Gresik 2012
Konsep Clustering • Klasifikasimelakukanpengelompokan data dimanasetiap data sudahada label kelasnya • Shinggapekerjaanberikutnyaadalahmembuat model untukdapatmelakukanprediksipada data baru yang kemudianmunculuntukdiketahuikelasnya. • Clustering (pengelompokan) melakukanpemisahan/pemecahan/segmentasi data kedalamsejumlahcluster (kelompok) menurutkarakteristiktertentu yang diinginkan. • Dalampekerjaan clustering label darisetiap data belumdiketahui, • Diharapkannantinyadapatdiketahuikelompok data untukkemudiandiberikan label sesuaikeinginan. • Bidangpenerapanteknik clustering: kedokteran, kesehatan, psikologi, hukum, statistik, astronomi, klimatologidansebagainya. • Kedokteran, teknik clustering dapatdigunakanuntukmengelompokkanjenis-jenispenyakitberbahayaberdasarkankarakteristik / sifat-sifatpenyakitpasien. • Kesehatan, dapatdigunakanuntukmengelompokkanjenis-jenismakananberdasarkankandungankalori, vitamin, protein.
Konsep Clustering Data asli • Cluster analysis adalahpekerjaan yang mengelompokkan data (obyek) yang didasarkanhanyapadainformasi yang ditemukandalam data yang menggambarkanobyektersebutdanhubungandiantaranya (Tan, 2006). • Tujuan: agar obyek-obyek yang bergabungdalamsebuahkelompok (cluster) merupakanobyek-obyek yang mirip (atauberhubungan) satusama lain danberbeda (atautidakberhubungan) denganobyekdalamkelompok yang lain. • Lebihbesarkemiripannya (atauhomogenitasnya) dalamkelompokdanlebihbesarperbedaannyadiantarakelompok yang lain, konsepini yang dibahasdalam clustering. Dua cluster Tiga cluster Empat cluster
Fuzzy C-Means • Clustering denganmetode Fuzzy C-Means (FCM) didasarkanpadateorilogika fuzzy. • Dalamteori fuzzy • Keanggotaansebuah data tidakdiberikannilaisecarategasdengannilai 1 (menjadianggota) dan 0 (tidakmenjadianggota) melainkandengansuatunilaiderajatkeanggotaan yang jangkauannilainya 0 sampai 1. • Nilaikeanggotaansuatu data dalamsebuah cluster: • Menjadi 0 ketikasamasekalitidakmenjadianggota cluster, • Menjadi 1 ketikamenjadianggotasecarapenuhdalamsuatu cluster. • Nilaikeangotaannyaantara 0 dan 1. • Semakintingginilaikeanggotaannyamakasemakintinggiderajatkeanggotaannya, dansemakinkecilmakasemakinrendahderajatkeanggotaannya. • Kaitannyadengan K-Means, FCM merupakanversi fuzzy dari K-Means denganbeberapamodifikasi yang membedakannyadengan K-Means.
Fuzzy C-Means • Asumsikanadasejumlah data dalam data set (X) yang berisim data: x1, x2, ..., xm, dinotasikanX = { x1, x2, ..., xn }, • dimanasetiap data mempunyaifiturndimensi: xi1, xi2, …, xin, dinotasikanxi = { xi1, xi2, …, xin }. • Adasejumlah cluster Cdengancentroid: c1, c2, …, ck, dimanakadalahjumlah cluster. • Setiap data mempunyaiderajatkeanggotaanpadasetiap cluster, • dinyatakandenganuij, dengannilaidiantara 0 dan 1, • imenyatakan data xidanjmenyatakan cluster cj. • Jumlahnilaiderajatkeanggotaansetiap data xiselalusamadengan 1, diformulasikan: • Untuksetiap cluster cj, berisi paling sedikitsatu data dengannilaikeanggotaantidaknol, tapitidakberisiderajatsatupadasemua data, diformulasikan:
Fuzzy C-Means • Dalam FCM, setiap data jugamenjadianggotapadasetiap cluster denganderajatkeanggotaanuij. • Nilaikeanggotaan data xipada cluster vj, diformulasikan: • Parameter cjadalahcentroid cluster ke-j, D() adalahjarakantara data dengancentroid. • Sedangkanwadalah parameter bobotpangkat (Weighting Exponent) yang diperkenalkandalam FCM, tidakadanilaiketetapan, biasanyanilaiw > 1, danumumnyadiberinilai 2. • Untukmenghitungcentroidpada cluster cipadafiturj, digunakan formula: • Parameter M adalahjumlah data, wadalahbobotpangkat, danuiladalahnilaiderajatkeanggotaan data xlke cluster ci. • Fungsiobyektif yang digunakan:
Algoritma FCM • Tentukaninisialisasi: • jumlah cluster, bobotpangkat, iterasimaksimal, threshold perubahanfungsiobyektif. • Berikannilaikeanggotaansetiap data padasetiap cluster secaraacak. • Hitungcentroid/rata-rata setiap cluster • Lakukanlangkah 5 dan 6, jika: • perubahannilaipadafungsiobyektifyang digunakandiatasnilaithreshold yang ditentukan, atau • iterasimaksimalbelumtercapai, atau • perubahannilaicentroidada yang diatasnilaithreshold yang ditentukan, atau • Hitungnilaikeanggotaanmasing-masing data kesemuacentroid. • Hitungcentroid/rata-rata setiap cluster.
Contoh • Dataset dengan 2 fitur: X dan Y. • Jumlah record data = 6 • Di-cluster denganFCM: C=2. • Bobotpangkat (w) = 2. • Threshold perubahannilaifungsiobyektif = 0.01
Inisialisasi C = 2 w = 2 MaxIter = 10 T = 0.01 pangkat = -2/(w-1) = -2
Iterasi 1 C = 2 w = 2 MaxIter = 10 T = 0.01 pangkat = -2/(w-1) = -2
Iterasi 2 C = 2 w = 2 MaxIter = 10 T = 0.01 pangkat = -2/(w-1) = -2
Iterasi 3 C = 2 w = 2 MaxIter = 10 T = 0.01 pangkat = -2/(w-1) = -2
Iterasi 4 C = 2 w = 2 MaxIter = 10 T = 0.01 pangkat = -2/(w-1) = -2