1 / 16

DATA MINING

DATA MINING. 1. Data Mining adalah usaha penemuan pengetahuan di intelejensia buatan ( bidang machine learning ) atau analisis statistik dengan mencari atau menemukan aturan-aturan , pola-pola dan struktur dari himpunan data yang besar. Fungsi Data Mining.

Download Presentation

DATA MINING

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. DATA MINING 1

  2. Data Mining adalahusahapenemuanpengetahuandiintelejensiabuatan (bidangmachine learning) atauanalisisstatistikdenganmencariataumenemukanaturan-aturan, pola-poladanstrukturdarihimpunan data yang besar.

  3. Fungsi Data Mining 1. Fungsi Minor ataufungsitambahan * Deskription (deskripsi) * Estimation (estimasi) * Prediction (prediksi) 2. Fungsi Mayor ataufungsiutama * Classification (klasifikasi) * Clustering (pengelompokan) * Association (asosiasi)

  4. Desciption • DeskripsiGrafis * Diagram Titik * Histogram • DeskripsiLokasi * Rata-rata * Median * Modus * Kuartil, DesildanPersentil • DeskripsiKeberagaman • Range (rentang • VariansdanStandarDeviasi

  5. Estimation • Rata-rata sampelsebagaiestimasi rata-rata populasi • Varianssampelsebagaiestimasivarianspopulasi • StandarDeviasisampelsebagaistandardeviasipopulasi

  6. Prediction • Regresi Linier Sederhana • Regresi Linier Berganda

  7. Classification • Dalamklasifikasi, terdapat target variabelkategori, misalpenggolonganpendapatandapatdipisahkandalambeberapakategori. • Beberapaalgoritmaklasifikasidiantaranyaadalah Mean Vector, K-Nearest Neighbour, C.45, danBayessian.

  8. Data Historis Data historisdisebutjuga data latihanatau data pengalaman, karenadari data tersebutakandidapatlatihanuntukmendapatkanpengetahuan. Data historisjugadisebut data lampau yang merupakan data pengalamanbagi user. Algoritmaklasifikasiakanmenggunakan data latihanuntukpengetahuan yang hendakdihasilkandalamklasifikasi data mining. Data terdiriatasduajenis, yaitu predictor variable/pemrediksidan target variable/tujuan.

  9. AlgoritmaKlasfikasi, CART (Classification and Regression Tres) Langkah-langkahAlgoritmaCART: • Susunlahcaloncabang (candidate split) yang dilakukanterhadapseluruhvariabelprediktor. Daftar yang berisicaloncabangdisebutcaloncabangmutakhir. • Berikanpenilaiankeseluruhancaloncabangmutakhirdenganmenghitungbesaran(s|t) • Tentukancabang yang memilikikesesuaian (s|t). Setelahnoktahkepuusantidakadalagi, algoritma CART dihentikan.

  10. Kesesuaian(goodness) (s|t)daricaloncabang s padanoktahkeputusan t tL = cabang kiri dari noktah keputusan t tR = calon cabang kanan dari noktah keputusan t

  11. Clustering • Pengklusteranmerupakanpengelompokan record, pengamatan, ataumemperhatikandanmembentukkelasobjek-objek yang memilikikemiripan. • Beberapaalgoritmapengelompokkandiantaranyaadalah EM dan Fuzzy C-Means

  12. AlgoritmaPengelompokan K-Means Langkah-langkahalgoritma K-Means: • Tentukanberapakelompok yang akandibuatsebanyak k kelompok. • Secarasembarangpilih k buahcatatan yang adasebagaipusat-pusatkeompokawal. • Setiapcatatanakanditentukanpusatkelompokterdekatnya. • Perbaruipusat-pusatkelompok. • Pusatkelompok yang terdekatpadasetiapcatatanakanditentukan, danseterusnyasampainilairasiotidakmembesarlagi.

  13. RumusJarakduatitik: Between Cluster Variation (BCV): BCV=d(m1,m2)+d(m1,3)+d(m2,m3) Dalamhalini, d(mi,j) menyatakanjarak mikemj Within Cluster Variation (WCV): WCV=(jarakpusattiap cluster yang paling minimum)2

  14. Assosiation • Tugasasosiasi data mining adalahmenemukanatribut yang munculdalamsatuwaktu.

  15. AlgoritmaAsosiasi MBA (Market Basket Analysis) Langkah-langkahalgoritma MBA: • Tetapkanbesaran darikonsepitemsetsering, nilai minimum besaran support danbesaran confidence yang diinginkan. • Menetapkansemuaitemsetsering, yaituitemset yang memilikifrekuensiitemset minimal sebesarbilangansebelumnya. • Dari semuaitemsetsering, hasilkanaturanasosiasi yang memenuhinilai minimum support dan confidence

  16. Support (AB) = P(AB) Confidence(AB) = P(B|A)

More Related