250 likes | 398 Views
Chapter 10 ALGORITME for ASSOCIATION RULES. Market Basket Analysis. Apriori. Case. Sulidar Fitri , M.Sc. REFERENCES. Budi Santosa . Data Mining: Teknik Pemanfaatan Data Untuk Keperluan Bisnis . 2007. Graha Ilmu Yogyakarta
E N D
Chapter 10ALGORITME for ASSOCIATION RULES Market Basket Analysis Apriori Case SulidarFitri, M.Sc
REFERENCES Budi Santosa. Data Mining: TeknikPemanfaatan Data UntukKeperluanBisnis. 2007. GrahaIlmu Yogyakarta Jiawei Han and Micheline Kamber. Data Mining: Concepts and Techniques. 2006. Department of Computer Science University of Illinois at Urbana-Champaign. www.cs.uiuc.edu/~hanj Ian H. Witten,Eibe Frank,Mark A. Hall. Data Mining Practical Machine Learning Tools and Techniques Third Edition.2011. Elsevier WEKA
INTNRODUCTION • DATA MINING • Proses untuk menemukan dataset baru pada dataset yang sangat besar. • TOPIK • ASSOCIATION RULES (ATURAN ASOSIASI) • FREQUENT ITEMSETS
ATURAN ASOSIASI Menggunakan algoritme klasik : IF - THEN
ATURAN ASOSIASI • Analisis Afinitas = “apa bersama apa” • Bisa digunakan untuk menentukan kebiasaan “ suatu produk apa akan dibeli bersama apa” • Market Basket Analysis • Contoh: • Studi transaksi di supermarket • Jika membeli Susu Bayi makan akan membeli Sabun Mandi
ATURAN ASOSIASI DALAM TRANSAKSI • Menemukan asosiasi produk dalam database transaksi suatu supermarket. (database Market Basket) • Contoh Kasus: • Para manajer ingin mengetahui kelompok items apa yang sering dibeli untuk membuat layout katalog belanja. • Solusi: • Gunakan aturan asosiasi dalam hubungan “if-then” atau “jika-maka”. • Aturan tersebut dihitung dari data yang sifatnya probabilistic berdasarkan data market basket
KASUS Suatu toko yang menjual pakaian olah raga, sedang melakukan promosi padapenjualan topi. Jika seorang pelanggan membeli lebih dari satu macam topi dari 6 pilihan yang ada akan mendapat diskon. Manajer toko tersebut ingin melihat warna apa yang dibeli bersama oleh pelanggan, mengumpulkan data dan menyimpan dalam database.
Data items Topi tersebut berupa: Catatantransaksipembelian
Ide dari Aturan Asosiasi: • Periksasemuakemungkinan“IF - THEN” • Pilih yang paling mungkin (most likely) sebagai indicator darihubunganketergantunganantar item. • Antecedent =“Jika” danconsequent = “maka” • Kemungkinanaturan: • “JikaMerah, makaPutih ” • {Merah, Putih} = {Biru}
Secara praktis,Hanya kombinasi yang terjadi dengan frekuensi yang sangat tinggi yang akan diperhatikanitu yang disebut:FREQUENT ITEM SET
FREQUENT ITEM SET • Berhubungan dengan SUPPORT • SUPPORT: jumlah transaksi yang mengandung item • Support digunakan untuk mengukur seberapa tingkat dukungan data terhadap validitas aturan yang dikembangkan. • Dinyatakan dalam prosentase (%) • Contoh: • {Merah, Putih} adalah 4/10 atau 40%
Contoh Confidence • Suatu supermarket memiliki 100.000 titik transaksi. Dari jml tersebut ada 1000 transaksi yang mengandung jeruk dan obat flu. Dari 1000 transaksi ada 800 yang mengandung mie instant. • Aturan asosiasi jika jeruk dan obat flu dibeli maka mie instant juga dibeli pada belanja yang bersamaan => • Support= 800/100.000 • Confidence = 800/1000
SUPPORT: Peluang transaksi yang dipilih secara random dari database akan mengandung semua item dalam antecendent maupun consequent atau P (antecedent dan consequent).
Susunlah aturan asosiasi dari set item {merah, putih, hijau} !!
JikakitaTerapkansyarat minimum confidence 75%, makahanyaaturan 2,3, dan 6 yang akanmemenuhi
Ada beberapa algoritme yang sudah dikembangkan mengenai aturan asosiasi, namun ada satu algoritme klasik yang sering dipakai yaitu algoritma apriori (Shmueli et al., 2007)
Apriori: A Candidate Generation-and-Test Approach • Apriori pruning principle: If there is any itemset which is infrequent, its superset should not be generated/tested! (Agrawal & Srikant @VLDB’94, Mannila, et al. @ KDD’ 94) • Method: • Initially, scan DB once to get frequent 1-itemset • Generate length (k+1) candidate itemsets from length k frequent itemsets • Test the candidates against DB • Terminate when no frequent or candidate set can be generated Data Mining: Concepts and Techniques
The Apriori Algorithm—An Example Supmin = 2 Database TDB L1 C1 1st scan C2 C2 L2 2nd scan L3 C3 3rd scan Data Mining: Concepts and Techniques