130 likes | 486 Views
Data mining. Pengantar data mining. THE ORIGIN OF DATA MINING. Apa itu data miining?. Penggalian data ( data mining ) adalah ekstraksi pola yang menarik, dari data dalam jumlah besar .
E N D
Data mining Pengantar data mining
Apa itu data miining? • Penggalian data(data mining) adalah ekstraksi pola yang menarik, dari data dalam jumlah besar. • Suatu pola dikatakan menarik apabila pola tersebut tidak sepele, implisit, tidak diketahui sebelumnya, dan berguna. • Pola yang disajikan haruslah mudah dipahami, berlaku untuk data yang akan diprediksi dengan derajat kepastian tertentu, berguna, dan baru.
Apa itu Data mining? • Data mining memiliki beberapa nama alternatif, meskipun definisi eksaknya berbeda, seperti: • KDD (knowledge discovery in database), • analisis pola, • arkeologi data, • pemanenan informasi, • intelegensia bisnis.
Kenapa butuh data mining • Perkembangan yang pesat di bidang pengumpulan data dan teknologi penyimpanan di berbagai bidang, menghasilkan basis data yang terlampau besar. • Namun, data yang dikumpulkan jarang dilihat lagi, karena terlalu panjang, membosankan, dan tidak menarik. • Dan intuisi yang yang digunakan untuk pembuatan keputusan sudah tidak dapat diterapkan.
Kenapa butuh data mining secara komersial • Banyak data yang sudah dikumpulkan dan disimpan • Web data, e-commerce • Data penjualan dan pembelian dan toko retail • Transaksi bank dan kartu kredit • Komputer lebih murah lebih powerful • Tekanan kompetisi sangat kuat
Kenapa butuh data mining dari sisi sains • Data dikumpulkan dan disimpan dalam kecepatan tinggi • Sensor remote pada satelit • Telescop scanner untuk langit • Simulasi sains penghasil data Terabytes • Membantu sains • Klasifikasi dan segmentasi data • Formasi hipotesis
Apa TUGAS DATA MINING? • Klasifikasi • Kluster • Asociation Rule • Sequential Pattern • Regressing • Deviation Detection
tugas • Buat dengan anggota berjumlah 5-7 orang / kelompok. Dikepalai oleh teman yang sering kali membawa laptop. Sebisa mungkin setiap orang membawa. • Cari software yang dapat digunakan untuk melakukan proses data mining boleh bersifat opensource, freeware, atau berbayar. • Misalnya: Rapid Mind, R, Tanagra, SPSS, Oracle, Wika (tidak boleh sama antar kelompok) • Cari data yang berkaitan / dapat diolah dengan data mining menurut anda. • Misalnya: data perusahaan atau bank atau kartu kredit, saham, medical record, gambar medis atau gambar scene, data kependudukan, data properti (tidak boleh sama antar kelompok) • Setiap minggunya data tersebut harus dibawa bersama laptop yang sudah diinstall perangkat lunak yang telah ditentukan. • Dipertemuan ke-9 dipresentasikan hasilnya • Pertemuan ke-12 laporan dikumpulkan, berupa modul tahap-tahap yang sudah dilakukan berdasarkan praktik sehari-hari.