1 / 31

Apa dan untuk apa data mining

Apa dan untuk apa data mining. Dian Eka R. Kebutuhan dan Kesempatan untuk Data Mining. Kebutuhan akandata mining dikarenakan :

Download Presentation

Apa dan untuk apa data mining

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Apadanuntukapa data mining Dian Eka R

  2. KebutuhandanKesempatanuntuk Data Mining Kebutuhanakandata mining dikarenakan: 1.Ketersediaan data yang melimpah, kebutuhanakaninformasi(ataupengetahuan) sebagaipendukungpengambilankeputusanuntukmembuatsolusibisnisdandukunganinfrastrukturdibidangteknologiinformasi 2.Ketersediaan data transaksidalam volume yang besar 3.Informasi sebagaiasetperusahaan yang pentingsehinggamelahirkangudang data yang mengintegrasikaninformasidarisistem yang tersebaruntukmendukungpengambilankeputusan 4.Ketersediaan teknologiinformasidalamskala yang terjangkaudansudahdapatdiadopsisecaraluas

  3. Apa Data mining Data mining didefinisikansebagai • Eksplorasidananalisis , denganotomatisatau semi otomatisdari data yang besaruntukmenemukanpoladanaturan (rule) dari data • Data mining adalahproses yang menggunakansatuataulebihteknik-teknikpembelajarankomputer(machine learning) untukmenganalisisdanmengekstraksipengetahuan(knowledge) secaraotomatis

  4. Apa Data mining • Penguraian(yang tidaksederhana) informasipotensi implicit (tidaknyata/jelas) yang sebelumnyatidakdiketahuidarisekumpulan data • Penggaliandananalisis, denganmenggunakanperantiotomatisatau semi otomatis, darisejumlahbesar data yang bertujuanuntukmenemukanbentuk yang bermanfaat

  5. Apa Data mining • Data mining merupakanprosesiteratifdaninteraktifuntukmenemukanpolaatau model yang sahih, baru, bermanfaat, dandimengertidalamsuatu database yang sangatbesar(massive databases). • Data mining berupapengetahuan yang selamainitidakdiketahuisecara manual darisuatukumpulan data • Data mining menggunakanberbagaiperangkatlunakanalisis data untukmenemukanpoladanrelasi data agar dapatdigunakanuntukmembuatprediksidengantepat

  6. Data Mining • satuset teknik yang digunakan secara otomatisuntukmengeksplorasisecaramenyeluruhpada set data yang sangatbesar • Perangkatlunak yang digunakanuntukmenemukanpola-polatersembunyimaupunhubungan-hubungan yang terdapatdalam basis data yang besardanmenghasilkanaturan-aturan yang digunakanuntukmemperkirakanperilaku di masamendatang • Data miningseringdikatakanberurusandengan “penemuanpengetahuan” dalam basis data. Suatuaturan yang dihasilkanolehdata miningmisalnyasepertiberikut : “Kebanyakanpembelimobil Forsa adalahwanitaberusiadiatas 30 tahun”.

  7. Data Mining • Proses Data mining yaituprosesmencaripolaatauinformasimenarikdalam data terpilihdenganmenggunakanteknikataumetodetertentu. • Teknik, metode, ataualgoritmadalam data mining sangatbervariasi. Pemilihanmetodeataualgoritma yang tepatsangatbergantungpadatujuandanproses KDD secarakeseluruhan

  8. Apa yang (tidak) termasuk Data Mining? • Apa yang tidak termasuk Data Mining? • Mencari nomer telepon pada buku telepon • Melalukan query pada suatu search engine untuk informasi tentang “Amazon” • Apa yang termasuk Data Mining? • Nama tertentu lebih lazim dipakai di daerah Jawa (Sutinah, Suliyem, Ngatini, Paijo… di Jawa Tengah) • Mengelompokkan secara bersamaan dokumen-dokumen yang dihasilkan oleh search engine menurut hubungan kata-katanya (misal: Amazon rainforest, Amazon.com, etc)

  9. Asal Data Mining • Menggambarkan ide dari machine learning/AI, pattern recognition, statistics, dan database systems • Cara tradisional yang sesuai untuk • Data yang amat besar • Data dengan banyak dimensi • Data yang heterogen dan tersebarHeterogeneous, Machine Learning/ Pattern Recognition Statistics/AI Data Mining Database systems

  10. Prinsip Data Mining

  11. MengapaMelakukan Data Mining ? (1) Sudut Pandang Komersial: •Meledaknya volume data yang dihimpundandisimpandalam data warehouse •Proseskomputasi yang dapatdiupayakan •Kuatnyatekanankompetitif • ∼Dapatmenyediakan yang lebihbaik, • ∼Informasimenjadiproduk yang berarti

  12. MengapaMelakukan Data Mining ? (2) Sudut Pandang Keilmuan: • •Kecepatan data yang dihimpundandisimpan(Gbyte/hour) • ∼Remote sensor yang ditempatkanpadasuatusatelit • ∼Telescope yang digunakanuntuk men-scan langit • ∼Simulasisaintifik yang membangkitkan data dalamukuran terabytes • •Teknik-tekniktradisionaltidakfisibeluntukmengolah data mentah • •Data mining untukreduksi data ; • ∼Catalogging, klassifikasi, segmentasi data • ∼Membantuilmuwandalammelakukanformulasihipotesisi

  13. IlmuBerkaitan Data Mining • Database • Information science (ilmuinformasi) • Machine learning • Statistik • Neural networks (jaringansaraftiruan) • Pemodelanmatematika • Information retrieval • Information extraction dan • Pengenalanpola

  14. Aplikasi Data Mining

  15. AnalisaPasardanManajemen Beberapasolusidapatdiselesaikandengan data mining : • –Menebak target pasar • –Melihatpolabelipemakaidariwaktukewaktu • –Cross Market Analysis • –Profil Customer • –IdentifikasiKebutuhan Customer • –Menilailoyalitas customer • –Informasi summary

  16. Teknologi Untuk Data Mining • Statistik • Jaringan saraf (neural network) • Logika kabur (fuzzy logic) • Algoritma genetika • dan berbagai teknologi kecerdasan buatan yang lain

  17. Data Mining : Visualisasi Data • Pendekatan data mining juga ada yang melalui visualisasi data • Pada sistem seperti ini, pemakai akan dibantu untuk menemukan sendiri pola dari sejumlah data berukuran besar dengan didasarkan visualisasi oleh data mining

  18. Posisi data mining Statistics/AI Machine Learning/ Pattern Recognition Data Mining Database systems

  19. Data Mining Tasks • Prediction Methods • Classification • Clustering • Association Rule Discovery • Sequential Pattern Discovery From [Fayyad, et.al.] Advances in Knowledge Discovery and Data Mining, 1996

  20. Test Set Model Classification Example categorical categorical continuous class Learn Classifier Training Set

  21. Illustrating Clustering • Euclidean Distance Based Clustering in 3-D space. Intracluster distances are minimized Intercluster distances are maximized

  22. Association Rule Discovery: Definition • Given a set of records each of which contain some number of items from a given collection; • Produce dependency rules which will predict occurrence of an item based on occurrences of other items. Rules Discovered: {Milk} --> {Coke} {Diaper, Milk} --> {Beer}

  23. Aplikasi Data Mining • Beberapaaplikasidomein • Biomedical dananalisa data DNA • Analisa data keuangan • Industripenjualaneceran • Industritelekomunikasi Data Mining : Konsep dan Teknologi

  24. Data Mining pada Analisa Data Keuangan • Data keuangan yang dikumpulkan oleh bank dan lembaga keuangan relatif lebih lengkap, dapat dipercaya, dan bermutu tinggi • Disain dan konstruksi dari gudang data untuk multidimensional analisa data dan data mining • Gambaran dari hutang perbulan, perdaerah, persektor, dan faktor lain • Mengakses informasi statistik seperti maximum, minimum, total, rata-rata, kecenderungannya, dan lain lain • Analisa pembayaran peminjaman kebijakan kredit secara prediksi per pelanggan • Seleksi di masa depan dan perlunya penggolongan secara atribut • Pencapaian pembayaran peminjaman • Nilai kredit konsumen Data Mining : Konsep dan Teknologi

  25. Keuangan Data Mining • Penggolongan dan pengelompokan pelanggan untuk target pemasaran • Segmentasi multidimensional berdasarkan metode terdekat, penggolongan, alur keputusan, dan lain lain untuk mengidentifikasi penggolongan persediaan sekelompok pelanggan atau pelanggan baru • Mendeteksi pencucian uang dan kejahatan keuangan lain • pengintegrasian dari berbagai DBs ( sebagai contoh, transaksi bank, DBs sejarah kejahatan federal/negara) • Alat bantu: data gambar, analisa pertalian, penggolongan, alat penggabungan, analisa orang asing, dan analisa pola alat percontohan (ditemukan urutan akses secara tidak biasa) Data Mining : Konsep dan Teknologi

  26. Data Mining pada Industri Retail • Industri Retail: besarnya data penjualan, sejarah belanja pelanggan, dan lain-lain • Aplikasi dari Retail data mining • Mengidentifikasi perilaku pembelian pelanggan • Menentukan kecenderungan pola belanja pelanggan • Meningkatkan mutu dari layanan pelanggan • Mencapai kepuasan pelanggan • Tingkatkan perbandingan konsumsi barang-barang • Mendisain keefektifan distribusi dan transportasi barang Data Mining : Konsep dan Teknologi

  27. Contoh Data Mining pada Industri Retail • Disain dan konstruksi dari gudang data yang didasarkan keuntungan penggunaan data mining • Analisa multidimensional dari penjualan, pelanggan, produk, waktu, dan daerah • Analisa dari efektivitas dari kampanye penjualan • Ingatan pelanggan: Analisa dari kesetiaan pelanggan • Menggunakan informasi kartu kesetiaan pelanggan untuk mendaftarkan urutan dari pembelian dari pelanggan tertentu • Menggunakan pola mining untuk menyelidiki perubahan dalam konsumsi atau kesetiaan pelanggan • Menyarankan penyesuaian penetapan harga dan variasi barang-barang • Referensi pembelian dan perbandingan materi Data Mining : Konsep dan Teknologi

  28. Contoh Sistem Data Mining ( 1) • Miner IBM yang cerdas • Suatu cakupan luas dari algoritma data mining • Skala algoritma data mining • Alat bantu: algoritma jaringan neural, metode statistik, persiapan data, dan alat bantu penggambaran data gambar • Pengintegrasian yang ketat IBM dengan relational sistem database DB2 • Perusahaan SAS miner • Berbagai alat bantu analisa yang statistik • Alat bantu data gudang dan berbagai data algoritma mining • Microsoft SQLServer 2000 • Mengintegrasikan DB dan OLAP dengan mining • Mendukung OLEDB untuk DM standard Data Mining : Konsep dan Teknologi

  29. Contoh Sistem Data Mining ( 2) • Sgi Mineset • Berbagai algoritma dan statistik tingkat lanjut data mining • Alat bantu penggambaran tingkat lanjut • Clementine (SPSS) • Pengembangan lingkungan data mining yang terintegrasi untuk pengguna akhir dan pengembang • Berbagai algoritma data mining dan alat bantu penggambaran • DBMiner ( DBMiner Teknologi Inc.) • Berbagai modul data mining : analisa OLAP discovery-driven, asosiasi, penggolongan, dan pengelompokan • efisien, Asosiasi dan sequential-pattern fungsi mining, dan alat penggolongan visuil • Mining antara database relational dan data gudang Data Mining : Konsep dan Teknologi

  30. Visuallisasi Data Mining • Visualisasi: penggunaan grafik komputer untuk menciptakan gambaran visuil yang membantu pemahaman yang ruwet, penyajian presentasi data yang kokoh • Visualisasi Data mining: proses menemukan kandungan yang tersembunyi dapat menjadi pengetahuan yang bermanfaat khususnya dari data yang besar dengan menggunakan teknik visualisasi Data Mining : Konsep dan Teknologi

  31. Visualisasi • Tujuanvisualisasi • Memperolehmasukanruanginformasidenganmempetakan data kedalamgrafissederhana • Menyediakanikhtisar yang kwalitatifdari data yang besar • Mencaricontohpola, kecenderungan, struktur, ketidakteraturan, hubunganantar data. • Bantuanuntukmenemukandaerahmenarikdan parameter yang pantasuntukanalisiskuantitatif lebihlanjut. Data Mining : Konsep dan Teknologi

More Related