220 likes | 504 Views
Pengenalan Pola. Computer Vision Materi 8. Eko Prasetyo Teknik Informatika UBHARA 2012. Skenario Computer Vision. Citra Input. Perbaikan Kualitas. Segmentasi. Data latih. Training data latih dengan metode pengenalan pola. Ekstrasi Fitur Citra menjadi Data set.
E N D
PengenalanPola Computer Vision Materi 8 EkoPrasetyo TeknikInformatika UBHARA 2012
Skenario Computer Vision Citra Input PerbaikanKualitas Segmentasi Data latih Training data latihdenganmetodepengenalanpola EkstrasiFitur Citra menjadi Data set Pemecahan Data set Prediksikelas data ujidengan model daripengenalanpola Data uji Dapatdiketahui label kelas data uji
Kasus Citra Malaria • Ada 2 jenis : GametdanSchizonts • Gamet: 6 citra, Schizonts: 6 citra • Yang diinginkan: membuatsistem yang dapatmengenalijenis malaria berdasarkanbentuksel malaria. • MenggunakanfiturCompactnessdanCircularity • Lakukanpadasetiapcitra • Lakukansegmentasiuntukmendapatkanwilayah malaria dalam format gray. • Konversikancitratersegmentasitersebutkecitrabineruntukmendapatkan area (A). • Lakukanprosesmorfologi (boundary extraction) untukmendapatkantepi (P) • Hitung Compactness dan Circularity • Pecah data set menjadi 2: • Gamet: 5 data latih, 1 data uji • Schizonts: 5 data latih, 1 data uji • Prosesmenggunakanteknikpengenalanpola.
Penyiapan data set Citra RGB Perbaikancitra Citra tersegmentasi (format gray) Area = 9.5394 Perimeter = 1.3173 Data latihdarikelasGamet Data ujidarikelasGamet Data latihdarikelasSchizonts Data ujidarikelasSchizonts
Source Code EkstrasiFitur File: ekstraksi_gamet.m File: ekstraksi_schizonts.m namafile{1} = 'fgamet6-45.tif'; namafile{2} = 'fgamet6-90.tif'; namafile{3} = 'fgamet6-135.tif'; namafile{4} = 'fgamet6-180.tif'; namafile{5} = 'fgamet6-225.tif'; namafile{6} = 'fgamet6-270.tif'; for i=1:6 f = imread(namafile{i}); f = im2double(f); f2 = im2bw(f); f2 = imfill(f2, 'holes'); st = [0 1 0;1 1 1;0 1 0]; ftepi = f2 - imerode(f2,st); P = sum(sum(ftepi)); A = sum(sum(f2)); Comp = P^2/A; Circ = 4*pi*A / P^2; data_gamet(i,:) = [Comp Circ 1]; end; namafile{1} = 'fs-0.tif'; namafile{2} = 'fs-45.tif'; namafile{3} = 'fs-90.tif'; namafile{4} = 'fs-135.tif'; namafile{5} = 'fs-180.tif'; namafile{6} = 'fs-225.tif'; for i=1:6 f = imread(namafile{i}); f = im2double(f); f2 = im2bw(f, 0.01); f2 = imfill(f2, 'holes'); st = [0 1 0;1 1 1;0 1 0]; ftepi = f2 - imerode(f2,st); P = sum(sum(ftepi)); A = sum(sum(f2)); Comp = P^2/A; Circ = 4*pi*A / P^2; data_schizonts(i,:)=[Comp Circ 2]; end;
Source Code EkstrasiFitur File: persiapkan_data.m %Pisahkan data data_gamet_latih = data_gamet(1:5,1:2); kelas_gamet_latih = data_gamet(1:5,3); data_schizonts_latih = data_schizonts(1:5,1:2); kelas_schizonts_latih = data_schizonts(1:5,3); %data latihuntukpelatihan data_latih = [data_gamet_latih; data_schizonts_latih]; kelas_latih = [kelas_gamet_latih; kelas_schizonts_latih]; %data ujiuntukprediksi data_uji = [data_gamet(6,1:2); data_schizonts(6,1:2)]; kelas_uji_asli = [data_gamet(6,3); data_schizonts(6,3)];
K-Nearest Neighbor • Algoritma yang melakukanklasifikasiberdasarkankedekatanlokasi (jarak) suatu data dengan data yang lain. • Prinsipsederhana yang diadopsiolehalgoritma K-NN adalah: “Jikasuatuhewanberjalansepertibebek, bersuarakwek-kweksepertibebek, danpenampilannyasepertibebek, makahewanitumungkinbebek”. • Padaalgoritma K-NN, data berdimensiq, dapatdihitungjarakdari data tersebutke data yang lain, • Nilaijarakini yang digunakansebagainilaikedekatan/kemiripanantara data ujidengan data latih.
K-Nearest Neighbor 1 tetanggaterdekat (1-NN) 2 tetanggaterdekat (2-NN) 3 tetanggaterdekat (3-NN) 7 tetanggaterdekat (7-NN)
Algoritma K-NN • z = (x’,y’), adalah data ujidenganvektor x’ dan label kelas y’ yang belumdiketahui • Hitungjarak d(x’,x), jarakdiantara data uji z kesetiapvektor data latih, simpandalam D • PilihDz D, yaitu K tetanggaterdekatdari z
Contoh • Data uji 1: • Comp = 18.6939 • Circ = 0.6722 • Data uji 2: • Comp = 9.5394 • Circ = 1.3173 • Gunakan K-NNuntukmemprediksikelasnya • Gunakanjarak Euclidean • Gunakan K=1, K=3. • Bandingkandengankelas yang asli, apakahsamaatautidak ? Sedikitmodifikasidalamcontohini !
Untuk data uji 1 Untuk K=1 1 data terdekatdarikelasGamet (gamet 1), jumlah data kelasGamet > kelasSchizonts maka data uji (Comp = 18.6939, Circ = 0.6722) diprediksimasukkelas 1 (Gamet) Samadengankelasaslinya Untuk K=3 2 data terdekatdarikelasGamet , 1 data terdekatdarikelasSchizonts jumlah data kelasGamet > kelasSchizonts maka data uji (Comp = 18.6939, Circ = 0.6722) diprediksimasukkelas 1 (Gamet) Samadengankelasaslinya
Untuk data uji 2 Untuk K=1 1 data terdekatdarikelasSchizonts(schizonts 4), jumlah data kelasSchizonts > kelasGamet maka data uji (Comp = 9.5394, Circ = 1.3173) diprediksimasukkelas 2 (Schizonts ) Samadengankelasaslinya Untuk K=3 3 data terdekatdarikelasSchizonts jumlah data kelasSchizonts > kelasGamet maka data uji (Comp = 9.5394, Circ = 1.3173) diprediksimasukkelas 2 (Schizonts ) Samadengankelasaslinya
K-NNdimatlab • Class = knnclassify(Sample, Training, Group, k, distance, rule)
Contoh source prediksi K = 1; kelas_uji_hasil = knnclassify(data_uji, data_latih, kelas_latih, K); display(['Untuk K = ', num2str(K)]); display('KelasHasilPrediksi | KelasAsli'); [kelas_uji_hasilkelas_uji_asli] K = 3; kelas_uji_hasil = knnclassify(data_uji, data_latih, kelas_latih, K); display(['Untuk K = ', num2str(K)]); display('KelasHasilPrediksi | KelasAsli'); [kelas_uji_hasilkelas_uji_asli]
Contoh source prediksi >> prediksi_malaria Untuk K = 1 KelasHasilPrediksi | KelasAsli ans = 1 1 2 2 Untuk K = 3 KelasHasilPrediksi | KelasAsli ans = 1 1 2 2
Evaluasi K-NN • Algoritma yang menggunakanseluruh data latihuntukmelakukanprosesklasifikasi (complete storage). • Mengakibatkanuntuk data dalamjumlah yang sangatbesar, prosesprediksimenjadisangat lama. • Tidakmembedakansetiapfiturdengansuatubobot • Pada ANN (Artificial Neural Network) yang berusahamenekanfitur yang tidakpunyakontribusiterhadapklasifikasimenjadi 0 padabagianbobot, • NN tidakadabobotuntukmasing-masingfitur. • Menyimpansebagianatausemua data danhampirtidakadaprosespelatihan, • maka K-NN sangatcepatdalamproses training (karenamemangtidakada) tetapisangatlambatdalamprosesprediksi. • Hal yang rumitadalahmenentukannilai K yang paling sesuai • K-NN padaprinsipnyamemilihtetanggaterdekat, • Parameter jarakjugapentinguntukdipertimbangkansesuaidengankasusdatanya. Euclidean sangatcocokuntukmenggunakanjarakterdekat (lurus) antaradua data, tetapi Manhattan sangatrobustuntukmendeteksi outlier dalam data.
To Be Continued … Materi 9 – PengenalanPola (lanjut) ANY QUESTION ?