1 / 37

JST

JST. Jaringan Saraf Tiruan. Tahapan JST. Tahap pembelajaran Tahap implementasi / testing. Paradigma Pembelajaran. Terawasi (Supervised Learning) input dan output ditentukan , ada contoh untuk pelatihan . Tak Terawasi (Unsupervised Learning) tak ada contoh pelatihan .

trilby
Download Presentation

JST

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. JST JaringanSarafTiruan

  2. Tahapan JST • Tahappembelajaran • Tahapimplementasi / testing

  3. ParadigmaPembelajaran • Terawasi (Supervised Learning) input dan output ditentukan, adacontohuntukpelatihan. • TakTerawasi (Unsupervised Learning) takadacontohpelatihan. • Gabunganantara Supervised dan Unsupervised (Hybrid)

  4. Perceptron • Neuron: Selsyarafbiologis • Perceptron: Selsyarafbuatan • Fungsi Input • FungsiAktivasi • Output

  5. Perceptron

  6. Perceptron • Perceptron = MODEL SEDERHANA dari neuron • Apa yang bisadilakukanolehsatuperceptron? • Klasifikasi • Prediksi • Optimasi, …

  7. AND w = 1 y x1  y x2 θ = 1,5 w = 1

  8. OR w = 1 y x1  y θ = 0,5 x2 w = 1

  9. XOR θ = 0,5 w = -1 x1 w = 1 w = 1 y y y    y w = 1 θ = 0,5 w = 1 x2 w = -1 θ = 0,5

  10. Visualisasi 100 dimensi? Bisa dengan Perceptron?

  11. Multi-Layer Perceptron (MLP)

  12. Back Propagation (Propagasibalik)

  13. Algoritma BelajarPropagasi Balik • Definisikan masalah • Matriks pola masukan (P) • matriks target (T) • Inisialisasi parameter jaringan • Arsitektur jaringan (misalkan I-H-O) • Bobot acak (ataudenganmetodetertentu) • Learningrate (lr) lajubelajar • ThresholdMSE  untuk menghentikan learning

  14. PengenalanKarakter E, F, G, O Matriks P Matriks T

  15. Training W1 & W2: Random W1 W1 W2 W2 A1 A2 T E -0.54 0.71 -0.21 -0.52 9.5 0.9 1 0.1 0.15 -0.21 F2, G2, O2, … dan seterusnya hingga pola O5 0.91 -0.53 -0.49 0.33 0.87 0.68 0.1 4.3 0 -0.1 0.68 0.97 0.29 0.58 -0.24 -0.18 0.32 0.97 -0.18 0.25 0.62 -0.95 0.4 0 -0.4 -0.17 0.62 -0.37 0.55 0.88 -0.12 8.7 -0.93 0.55 0.3 0 -0.3 -0.12 0.89 -0.12 0.45 0.34 0.75

  16. Testing W1 & W2: Trained W1 W2 A2 Kelas 0.01 0.31 0.8 1 -0.83 -0.38 0.19 0.74 0.2 0 0.34 0.35 0.22 0.87 -0.18 0.62 0.1 0 0.30 0.60 0.98 0.03 0.2 0 -0.53 -0.09 -0.38

  17. Strategi penggunaan ANN • Cara memandang masalah: • Klasifikasi • Sekuriti • Prediksi • Optimasi • Teknik learning: Supervised/Unsupervised • Desain Arsitektur • Jumlah layer • Jumlah neuron • Pemetaan output • Strategi learning • Penyiapan data: filterisasi data, pembagian data (training, validasi, test) • Parameter: inisialisasi (acak atau memakai algoritma), laju belajar, dsb. • Penghentian learning

  18. Kasus 1Verifikasitandatangan • OFFLINE atau ONLINE? • Citra: 100 x 100 pixel grayscale • Satujutatandatangan? • Input & Output? • P dan T? • Strukturdan parameter MLP? • Perlupreprocessing?

  19. Kasus 2: Sistemkeamanan • Saturuanganhanya 10 orang yang bolehmasuk • Setiaporang yang akanmasukruanganharusmenempelkanibujariuntukdiverifikasisidikjarinya • Citra: 300 x 300 pixels • Input & Output? • P dan T? • Strukturdan parameter MLP? • Perlupreprocessing?

  20. Kasus 3: Prediksipelanggan PSTN • Data riildari PT Telkom • Jumlahpelangganbulananselama 7 tahun • Error harus < 1 % • Input & Output? • P dan T? • Strukturdan parameter MLP? • Perlupreprocessing?

  21. Kasus 4: Spam Filtering • Email spam • Email sampah atau email yang tidak diperlukan user • Contoh: • Instant messaging spam • Web search engine spam • Blogs spam • Mobile phone messagingspam, dsb. • Jumlahnya mencapai 90 milyar per hari

  22. Tujuan Spam • Penipuan (lotre, silahkan hubungi kami di alamat ...) • Money laundring (menawarkan transaksi pekerjaan yang berhubungan dengan rekening bank) • Promosi produk (seperti produk obat-obatan) • Menyebarkan virus, trojan, worm, dsb.

  23. From: DOUGLAS M ROBIN douglas_markrobin@yahoo.co.uk Subject: COMPLETE THE FORM WITH YOUR PASSPORT PHOTO ATTACHED The National Lottery PAYMENT/PROCESSING OFFICE, LONDON, UK. 3240 RIDGE-WAY,LONDON NW71RN. 00447040112422 Batch/074/05/ZY3 Ticket/ 5647600545188 Serial No /5073-11 Dear (), l acknowledge the receipt of your mail, as regard your request the reason is that over the years we have had cases of double claim of winnings and with the help of the verification form its earlier to detect the winners in various category. Your information is need to process other vital document before your cash prize can be release to you for claim.  l need those vital information alongside passport photo to proceed with the processing of your winnings.l need urgent response in 24 hrs because you have less 2 weeks .  Regards, Douglas Robin. (FIDUCIARY OFFICER)

  24. Discovery Challenge • Merupakankompetisi tingkat internasional tentang PersonalisedSpam Filtering yang diselengarakan di Humboldt-Universität zu Berlin, Jerman. • Menemukandaftar aturan atau strategi yang dapat membedakan suatu email sebagai spam atau bukan.

  25. Data • 4000 email sebagai training set untuk proses pelatihan (learning). 2000 spam dan 2000 non-spam. • 4000 email sebagai tune set (validation set) untuk proses validasi hasil learning. 2000 spam dan 2000 non-spam. • 2500 email sebagai validation set untuk proses validasi hasil learning. Data ini diambil dari suatu inbox pengguna yang berisi 1250 spam dan 1250 non-spam. • 7500 email sebagai test set yang belum ada labelnya: spam atau non-spam. Data ini diambil dari 3 inbox, dimana masing-masing inbox berisi 2500 email.

  26. Aturan • Agar kompetisi berjalan adil, 18.000 email tersebut dikodekan ke dalam angka-angka. • Pertama, dibuat daftar semua kata yang pernah muncul pada semua email tersebut (sering kita sebut dengan wordlist atau dictionary). Dari semua email tersebut, ternyata dihasilkan dictionary yang berisi lebih dari 200.000 kata. • Kedua, setiap email akan diparsing dan setiap kata yang ditemukan diganti dengan nomor kata pada dictionary yang sudah dibuat tadi dan dihitung juga frekuensi kemunculan setiap kata dalam email tersebut. • Emailspam diberi kode 1, emailnon-spam diberi kode -1, dan email yang belum diketahui spam atau non-spam diberi kode 0.

  27. Misal: Wordlist (Dictionary)

  28. From: DOUGLAS M ROBIN douglas_markrobin@yahoo.co.uk Subject: COMPLETE THE FORM WITH YOUR PASSPORT PHOTO ATTACHED The National Lottery PAYMENT/PROCESSING OFFICE, LONDON, UK. 3240 RIDGE-WAY,LONDON NW71RN. 00447040112422 Batch/074/05/ZY3 Ticket/ 5647600545188 Serial No /5073-11 Dear (), l acknowledge the receipt of your mail, as regard your request the reason is that over the years we have had cases of double claim of winnings and with the help of the verification form its earlier to detect the winners in various category. Your information is need to process other vital document before your cash prize can be release to you for claim.  l need those vital information alongside passport photo to proceed with the processing of your winnings.l need urgent response in 24 hrs because you have less 2 weeks .  Regards, Douglas Robin. (FIDUCIARY OFFICER)

  29. Contoh: Spam Email • 1 35:1 73:1 77:1 206:1 16176:1 • 1 2058:1 27162:1 49588:1 • 1 9:3 94:1 109:1 163:1 405:1 406:1 415:2 416:1 435:3 436:3 437:4 440:4 450:3 456:1 457:1 461:1 466:1 467:1 477:1 478:1 751:1 1015:1 1034:14 1041:1 1216:1 1226:1 1231:1 1666:1 2344:1 2345:1 2505:1 2528:1 3498:1 4339:1 4463:1 7480:1 8143:1 15050:1 17176:1 19051:1 20895:1 22963:1 35908:1 48253:1 49469:1 60004:1 78684:1 84924:1 85550:1 93429:1 95839:1 106782:1 106783:4 106784:2 106785:2 106786:1 106788:1 106802:1 106803:1

  30. Contoh: Non-Spam Email • -1 9:1 82:1 92:1 104:1 231:1 308:1 338:1 351:1 390:1 440:2 693:1 933:1 975:1 984:1 1631:1 2404:2 2560:2 2589:2 3361:1 3630:1 4042:1 4059:1 6515:1 7851:1 8762:1 10427:1 16178:1 37517:1 44973:1 53347:1 109089:2 109090:1 110944:1 111668:1 133323:1 140060:1 155590:1

  31. Contoh: Email Tak Berlabel • 0 94:1 204:1 257:1 582:1 4898:1 6371:1

  32. Teknik Klasifikasi? • ID3 • Bayesian Learning • Algoritma Genetika • Support Vector Machine • ANN: MLP • Atau teknik lainnya

  33. Training Set

  34. Supervised vs Unsupervised

  35. Supervised vs Unsupervised • Supervised  Klasifikasi • Jumlahkelasdiketahui • Tersedia data latih yang VALID • Unsupervised  Clustering • Jumlahkelasbisatidakdiketahui • Tidaktersediadata latih yang VALID User mengajari ANN ANN memberitahu user

  36. ANN • Klasifikasi atau Clustering • Mudahimplementasi • Akurasitinggi • Tahannoise • Implementasihardaware (CHIP) • Harus tersedia data latih dengan kelas yang jelas • Waktu training lama • Training ulang • Penalarannyatidakbisadijelaskan (Weights)

More Related