1 / 12

PENGANTAR DATA MINING

PENGANTAR DATA MINING. Problem ledakan data Tool koleksi data otomatis dan perkembangan teknologi database menyebabkan banyak sekali data yang bisa dikumpulkan di dalam database, data warehouse, dan alat peyimpanan informasi lainnya, untuk dianalisa

abby
Download Presentation

PENGANTAR DATA MINING

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. PENGANTAR DATA MINING

  2. Problem ledakan data • Tool koleksi data otomatis dan perkembangan teknologi database menyebabkan banyak sekali data yang bisa dikumpulkan di dalam database, data warehouse, dan alat peyimpanan informasi lainnya, untuk dianalisa • Kita berkubang data tetapi kelaparan pengetahuan! Latarbelakang

  3. ApaItu Data Mining? • Pada dasarnya: Perolehan pengetahuan dari data • “Ekstraksi informasi atau pola yang menarik dari data didalam database yang besar" • Seringkali hanya: • “Memberitahu sesuatu yang menarik dari data ini", “Menguraikan data ini" • Penyelidikan: analisa data semi-otomatis atas sekumpulan data yang besar

  4. ApaItu Data Mining? • Istilah yang rada baku: • Data mining • Biasanya DM adalah salah satu proses KDD • Knowledge discovery in databases (KDD) • Istilah umum yang meliputi, preprocessing data, DM, dan postprocessing • Istilah yang tidak terlalu sering digunakan: • Ekstraksi pengetahuan, arkeologi data, pengerukan data, penuaian informasi, analisa data/pola

  5. Penggunaan DM • Analisis database dan dukungan keputusan: • Analisis dan manajemen pasar • Target pasar, manajemen relasi customer (CRM), analisis keranjang pasar, penjualan silang, segmentasi pasar • Analisis dan manajemen resiko • Peramalan, tindakan mempertahankan customer, peningkatan asuransi, kontrol kualitas, analisis kompetitif • Deteksi dan manajemen kecurangan

  6. Penggunaan DM • Aplikasi lain: • Text mining (news group, email, dokumen) dan Web mining • Stream data mining • Analisis DNA dan bio data

  7. Analisis dan Manajemen Pasar • Profil customer • Tipe customer apa membeli produk apa (pengelompokan atau klasifikasi) • Analisa kebutuhan customer • Mengenali produk terbaik untuk customer berbeda • Meramalkan faktor apa yang akan memikat customer baru • Penyediaan rangkuman informasi • Rangkuman laporan multidimensi • Rangkuman informasi statistik (kecenderungan data terpusat dan variasi)

  8. Data Mining: SuatuProses KDD Pengetahuan • Data mining—inti dari proses penemuan pengetahuan Evaluasi Pola Data Mining Task-relevant Data Pemilihan Data Warehouse Pembersihan Data Integrasi Data Databases

  9. Fungsionalitas Data Mining • Konsep deskripsi: karakterisasi & diskriminasi • Generalisasi, rangkuman, dan karakteristik data kontras • Asosiasi (korelasi dan hubungan sebab akibat)

  10. Fungsionalitas Data Mining • Klasifikasi dan prediksi • Membangun model (fungsi) yang menguraikan dan membedakan kelas(klasifikasi) atau konsep untuk peramalan kedepan(prediksi)

  11. Fungsionalitas Data Mining • Analisis cluster (analisis pengelompokan) • Label kelas tidak diketahui: kelompokkan data untuk membentuk kelas baru, misal mengelompokkan rumah untuk mendapatkan pola distribusi • Memaksimalkan kemiripan antar kelas dan meminimumkan kemiripan didalam kelas • Analisis outlier • Outlier: suatu objek data yang tidak mengikuti perilaku umum dari data • Gangguan atau pengecualian? Tidak! Berguna dalam deteksi kecurangan, analisis peristiwa yang jarang terjadi

  12. Fungsionalitas Data Mining • Analisis trend dan evolusi • Trend dan deviasi: analisis regresi • Penggalian pola sekuensial, analisis periodisitas • Analisis arah pola lain atau statistik

More Related