310 likes | 513 Views
Apa dan untuk apa data mining. Dian Eka R. Kebutuhan dan Kesempatan untuk Data Mining. Kebutuhan akandata mining dikarenakan :
E N D
Apadanuntukapa data mining Dian Eka R
KebutuhandanKesempatanuntuk Data Mining Kebutuhanakandata mining dikarenakan: 1.Ketersediaan data yang melimpah, kebutuhanakaninformasi(ataupengetahuan) sebagaipendukungpengambilankeputusanuntukmembuatsolusibisnisdandukunganinfrastrukturdibidangteknologiinformasi 2.Ketersediaan data transaksidalam volume yang besar 3.Informasi sebagaiasetperusahaan yang pentingsehinggamelahirkangudang data yang mengintegrasikaninformasidarisistem yang tersebaruntukmendukungpengambilankeputusan 4.Ketersediaan teknologiinformasidalamskala yang terjangkaudansudahdapatdiadopsisecaraluas
Apa Data mining Data mining didefinisikansebagai • Eksplorasidananalisis , denganotomatisatau semi otomatisdari data yang besaruntukmenemukanpoladanaturan (rule) dari data • Data mining adalahproses yang menggunakansatuataulebihteknik-teknikpembelajarankomputer(machine learning) untukmenganalisisdanmengekstraksipengetahuan(knowledge) secaraotomatis
Apa Data mining • Penguraian(yang tidaksederhana) informasipotensi implicit (tidaknyata/jelas) yang sebelumnyatidakdiketahuidarisekumpulan data • Penggaliandananalisis, denganmenggunakanperantiotomatisatau semi otomatis, darisejumlahbesar data yang bertujuanuntukmenemukanbentuk yang bermanfaat
Apa Data mining • Data mining merupakanprosesiteratifdaninteraktifuntukmenemukanpolaatau model yang sahih, baru, bermanfaat, dandimengertidalamsuatu database yang sangatbesar(massive databases). • Data mining berupapengetahuan yang selamainitidakdiketahuisecara manual darisuatukumpulan data • Data mining menggunakanberbagaiperangkatlunakanalisis data untukmenemukanpoladanrelasi data agar dapatdigunakanuntukmembuatprediksidengantepat
Data Mining • satuset teknik yang digunakan secara otomatisuntukmengeksplorasisecaramenyeluruhpada set data yang sangatbesar • Perangkatlunak yang digunakanuntukmenemukanpola-polatersembunyimaupunhubungan-hubungan yang terdapatdalam basis data yang besardanmenghasilkanaturan-aturan yang digunakanuntukmemperkirakanperilaku di masamendatang • Data miningseringdikatakanberurusandengan “penemuanpengetahuan” dalam basis data. Suatuaturan yang dihasilkanolehdata miningmisalnyasepertiberikut : “Kebanyakanpembelimobil Forsa adalahwanitaberusiadiatas 30 tahun”.
Data Mining • Proses Data mining yaituprosesmencaripolaatauinformasimenarikdalam data terpilihdenganmenggunakanteknikataumetodetertentu. • Teknik, metode, ataualgoritmadalam data mining sangatbervariasi. Pemilihanmetodeataualgoritma yang tepatsangatbergantungpadatujuandanproses KDD secarakeseluruhan
Apa yang (tidak) termasuk Data Mining? • Apa yang tidak termasuk Data Mining? • Mencari nomer telepon pada buku telepon • Melalukan query pada suatu search engine untuk informasi tentang “Amazon” • Apa yang termasuk Data Mining? • Nama tertentu lebih lazim dipakai di daerah Jawa (Sutinah, Suliyem, Ngatini, Paijo… di Jawa Tengah) • Mengelompokkan secara bersamaan dokumen-dokumen yang dihasilkan oleh search engine menurut hubungan kata-katanya (misal: Amazon rainforest, Amazon.com, etc)
Asal Data Mining • Menggambarkan ide dari machine learning/AI, pattern recognition, statistics, dan database systems • Cara tradisional yang sesuai untuk • Data yang amat besar • Data dengan banyak dimensi • Data yang heterogen dan tersebarHeterogeneous, Machine Learning/ Pattern Recognition Statistics/AI Data Mining Database systems
MengapaMelakukan Data Mining ? (1) Sudut Pandang Komersial: •Meledaknya volume data yang dihimpundandisimpandalam data warehouse •Proseskomputasi yang dapatdiupayakan •Kuatnyatekanankompetitif • ∼Dapatmenyediakan yang lebihbaik, • ∼Informasimenjadiproduk yang berarti
MengapaMelakukan Data Mining ? (2) Sudut Pandang Keilmuan: • •Kecepatan data yang dihimpundandisimpan(Gbyte/hour) • ∼Remote sensor yang ditempatkanpadasuatusatelit • ∼Telescope yang digunakanuntuk men-scan langit • ∼Simulasisaintifik yang membangkitkan data dalamukuran terabytes • •Teknik-tekniktradisionaltidakfisibeluntukmengolah data mentah • •Data mining untukreduksi data ; • ∼Catalogging, klassifikasi, segmentasi data • ∼Membantuilmuwandalammelakukanformulasihipotesisi
IlmuBerkaitan Data Mining • Database • Information science (ilmuinformasi) • Machine learning • Statistik • Neural networks (jaringansaraftiruan) • Pemodelanmatematika • Information retrieval • Information extraction dan • Pengenalanpola
AnalisaPasardanManajemen Beberapasolusidapatdiselesaikandengan data mining : • –Menebak target pasar • –Melihatpolabelipemakaidariwaktukewaktu • –Cross Market Analysis • –Profil Customer • –IdentifikasiKebutuhan Customer • –Menilailoyalitas customer • –Informasi summary
Teknologi Untuk Data Mining • Statistik • Jaringan saraf (neural network) • Logika kabur (fuzzy logic) • Algoritma genetika • dan berbagai teknologi kecerdasan buatan yang lain
Data Mining : Visualisasi Data • Pendekatan data mining juga ada yang melalui visualisasi data • Pada sistem seperti ini, pemakai akan dibantu untuk menemukan sendiri pola dari sejumlah data berukuran besar dengan didasarkan visualisasi oleh data mining
Posisi data mining Statistics/AI Machine Learning/ Pattern Recognition Data Mining Database systems
Data Mining Tasks • Prediction Methods • Classification • Clustering • Association Rule Discovery • Sequential Pattern Discovery From [Fayyad, et.al.] Advances in Knowledge Discovery and Data Mining, 1996
Test Set Model Classification Example categorical categorical continuous class Learn Classifier Training Set
Illustrating Clustering • Euclidean Distance Based Clustering in 3-D space. Intracluster distances are minimized Intercluster distances are maximized
Association Rule Discovery: Definition • Given a set of records each of which contain some number of items from a given collection; • Produce dependency rules which will predict occurrence of an item based on occurrences of other items. Rules Discovered: {Milk} --> {Coke} {Diaper, Milk} --> {Beer}
Aplikasi Data Mining • Beberapaaplikasidomein • Biomedical dananalisa data DNA • Analisa data keuangan • Industripenjualaneceran • Industritelekomunikasi Data Mining : Konsep dan Teknologi
Data Mining pada Analisa Data Keuangan • Data keuangan yang dikumpulkan oleh bank dan lembaga keuangan relatif lebih lengkap, dapat dipercaya, dan bermutu tinggi • Disain dan konstruksi dari gudang data untuk multidimensional analisa data dan data mining • Gambaran dari hutang perbulan, perdaerah, persektor, dan faktor lain • Mengakses informasi statistik seperti maximum, minimum, total, rata-rata, kecenderungannya, dan lain lain • Analisa pembayaran peminjaman kebijakan kredit secara prediksi per pelanggan • Seleksi di masa depan dan perlunya penggolongan secara atribut • Pencapaian pembayaran peminjaman • Nilai kredit konsumen Data Mining : Konsep dan Teknologi
Keuangan Data Mining • Penggolongan dan pengelompokan pelanggan untuk target pemasaran • Segmentasi multidimensional berdasarkan metode terdekat, penggolongan, alur keputusan, dan lain lain untuk mengidentifikasi penggolongan persediaan sekelompok pelanggan atau pelanggan baru • Mendeteksi pencucian uang dan kejahatan keuangan lain • pengintegrasian dari berbagai DBs ( sebagai contoh, transaksi bank, DBs sejarah kejahatan federal/negara) • Alat bantu: data gambar, analisa pertalian, penggolongan, alat penggabungan, analisa orang asing, dan analisa pola alat percontohan (ditemukan urutan akses secara tidak biasa) Data Mining : Konsep dan Teknologi
Data Mining pada Industri Retail • Industri Retail: besarnya data penjualan, sejarah belanja pelanggan, dan lain-lain • Aplikasi dari Retail data mining • Mengidentifikasi perilaku pembelian pelanggan • Menentukan kecenderungan pola belanja pelanggan • Meningkatkan mutu dari layanan pelanggan • Mencapai kepuasan pelanggan • Tingkatkan perbandingan konsumsi barang-barang • Mendisain keefektifan distribusi dan transportasi barang Data Mining : Konsep dan Teknologi
Contoh Data Mining pada Industri Retail • Disain dan konstruksi dari gudang data yang didasarkan keuntungan penggunaan data mining • Analisa multidimensional dari penjualan, pelanggan, produk, waktu, dan daerah • Analisa dari efektivitas dari kampanye penjualan • Ingatan pelanggan: Analisa dari kesetiaan pelanggan • Menggunakan informasi kartu kesetiaan pelanggan untuk mendaftarkan urutan dari pembelian dari pelanggan tertentu • Menggunakan pola mining untuk menyelidiki perubahan dalam konsumsi atau kesetiaan pelanggan • Menyarankan penyesuaian penetapan harga dan variasi barang-barang • Referensi pembelian dan perbandingan materi Data Mining : Konsep dan Teknologi
Contoh Sistem Data Mining ( 1) • Miner IBM yang cerdas • Suatu cakupan luas dari algoritma data mining • Skala algoritma data mining • Alat bantu: algoritma jaringan neural, metode statistik, persiapan data, dan alat bantu penggambaran data gambar • Pengintegrasian yang ketat IBM dengan relational sistem database DB2 • Perusahaan SAS miner • Berbagai alat bantu analisa yang statistik • Alat bantu data gudang dan berbagai data algoritma mining • Microsoft SQLServer 2000 • Mengintegrasikan DB dan OLAP dengan mining • Mendukung OLEDB untuk DM standard Data Mining : Konsep dan Teknologi
Contoh Sistem Data Mining ( 2) • Sgi Mineset • Berbagai algoritma dan statistik tingkat lanjut data mining • Alat bantu penggambaran tingkat lanjut • Clementine (SPSS) • Pengembangan lingkungan data mining yang terintegrasi untuk pengguna akhir dan pengembang • Berbagai algoritma data mining dan alat bantu penggambaran • DBMiner ( DBMiner Teknologi Inc.) • Berbagai modul data mining : analisa OLAP discovery-driven, asosiasi, penggolongan, dan pengelompokan • efisien, Asosiasi dan sequential-pattern fungsi mining, dan alat penggolongan visuil • Mining antara database relational dan data gudang Data Mining : Konsep dan Teknologi
Visuallisasi Data Mining • Visualisasi: penggunaan grafik komputer untuk menciptakan gambaran visuil yang membantu pemahaman yang ruwet, penyajian presentasi data yang kokoh • Visualisasi Data mining: proses menemukan kandungan yang tersembunyi dapat menjadi pengetahuan yang bermanfaat khususnya dari data yang besar dengan menggunakan teknik visualisasi Data Mining : Konsep dan Teknologi
Visualisasi • Tujuanvisualisasi • Memperolehmasukanruanginformasidenganmempetakan data kedalamgrafissederhana • Menyediakanikhtisar yang kwalitatifdari data yang besar • Mencaricontohpola, kecenderungan, struktur, ketidakteraturan, hubunganantar data. • Bantuanuntukmenemukandaerahmenarikdan parameter yang pantasuntukanalisiskuantitatif lebihlanjut. Data Mining : Konsep dan Teknologi