380 likes | 709 Views
Nama : AFIJAL, S.Kom, M.Kom NIDN : 0125088401 TTL : Pulau Kayu, 25 Agustus 1984 Alamat : Jl. Medan – B. Aceh Lr. Sawah Gampong Uteun Geulinggang Kec. Dewantara Kab. Aceh Utara No. HP : +62813 6058 8524 – PIN BB : 73EA1C50 Webblog : http://www.ijalnewbie.wordpress.com PENDIDIKAN
E N D
Nama : AFIJAL, S.Kom, M.Kom • NIDN : 0125088401 • TTL : Pulau Kayu, 25 Agustus 1984 • Alamat : Jl. Medan – B. Aceh Lr. Sawah Gampong Uteun Geulinggang Kec. Dewantara Kab. Aceh Utara • No. HP : +62813 6058 8524 – PIN BB : 73EA1C50 • Webblog : http://www.ijalnewbie.wordpress.com • PENDIDIKAN • SD Negeri 1 Blang Dalam Kab. Aceh Selatan • SMP Negeri 1 Kuala Batee Kab. Aceh Selatan • SMA Negeri 2 Lhokseumawe Kab. Aceh Utara • AMIK Logika Yos Sudarso Medan Diploma I • STMIK Bina Bangsa Lhokseumawe Sarjana Komputer Teknik Informatika • Universitas Putra Indonesia “YPTK” Padang Magister Komputer Sistem Informasi • PEKERJAAN SEKARANG • Dosen Tetap Universitas Almuslim Peusangan • Direktur LSM JADUP Bireuen • Tuha Peut Kualisi untuk Advokasi Laut Aceh (KuALA) • Ketua Pembina Yayasan RIPMA (Riset dan Pengembangan Masyarakat) DATA DIRI DOSEN
KDD vs Data Mining Definisi sederhana dari KDD adalah proses dalammengidentifikasi pola-pola didalam data secarayang valid, bergunadan tentunyadapatdimengerti. Sedangkan definisi daridata miningadalahekstraksi pola atau model dari data yang diamati. Meskipun data mining adapada inti dari proses discovery knowledge, tetapidata mining ini biasanya mengambil hanya sebagian kecil (diperkirakan 15% sampai 25%) dari prosessecara menyeluruh.
Lanjutan Tahapandalam KDD Pemilihan Data (Data Preprocessing/Cleaning) • Pemprosesanpendahuluandanpembersihan data merupakanoperasidasarsepertipenghapusan noise dilakukan. • Sebelumprosesdata miningdapatdilaksanakan, perludilakukanprosescleaningpada data yang menjadifokus KDD. • Prosescleaning mencakupantara lain membuangduplikasi data, memeriksa data yang inkonsisten, danmemperbaikikesalahanpada data, sepertikesalahancetak (tipografi). • Dilakukanprosesenrichment, yaituproses “memperkaya” data yang sudahadadengan data atauinformasi lain yang relevandandiperlukanuntuk KDD, seperti data atauinformasieksternal.
Lanjutan Tahapandalam KDD Transformasi Data • Pencarianfitur-fitur yang bergunauntukmempresentasikan data bergantungkepada goal yang ingindicapai. • Merupakanprosestransformasipada data yang telahdipilih, sehingga data tersebutsesuaiuntukprosesdata mining. Prosesinimerupakanproseskreatifdansangattergantungpadajenisataupolainformasi yang akandicaridalam basis data
Lanjutan Tahapandalam KDD Data Mining • Pemilihantugas data mining; pemilihan goal dariproses KDD misalnyaklasifikasi, regresi, clustering, dll. • Pemilihanalgoritma data mining untukpencarian (searching) • Proses Data miningyaituprosesmencaripolaatauinformasimenarikdalam data terpilihdenganmenggunakanteknikataumetodetertentu. Teknik, metode, ataualgoritmadalamdata miningsangatbervariasi. Pemilihanmetodeataualgoritma yang tepatsangatbergantungpadatujuandanproses KDD secarakeseluruhan.
Lanjutan Tahapandalam KDD Interpretasi/Evaluasi • Penerjemahanpola-pola yang dihasilkandaridata mining. • Polainformasi yang dihasilkandariprosesdata miningperluditampilkandalambentuk yang mudahdimengertiolehpihak yang berkepentingan. • Tahapinimerupakanbagiandariproses KDD yang mencakuppemeriksaanapakahpolaatauinformasi yang ditemukanbertentangandenganfaktaatauhipotesa yang adasebelumnya.
Pertanyaan dan Diskusi
Pengantar DATA WAREHOUSE
Mengapakitaperlu DATA WAREHOUSE?
Permasalahan DBMS SaatIni • Ketikaorganisasimemilikikantorlebihdarisatu, setiapkantorakanmembuat DBMS sendiri. • Jikalaudevelopment tidakdikontrolsecaraterpusat, coding untuk DBMS antarcabangakanberbeda. • Sangatsulitmengintegrasi database untukinformasitertentu
Lanjutan PermasalahanDBMS SaatIni • Walaupunsemuanama variable mengarahke attribute yang sama, integrasidari database tetapmenyulitkan • Permasalahan lain: unit dariukuran • Misal: unit untukmatauangdi database indonesiaadalah rupiah sedangkandi database disingaporemenggunakanmatauang dollar singapore • Jadiakses data dankonsolidasi data daridua database tidakdapatlgsgdilakukan • E-R model untuk data operasionalmenjadilebihkompleksdansangatsulituntukdipelajari
Karakteristik Data Warehouse 1. Subject Oriented Data warehouseberorientasisubjek, artinyadata warehouseberorientasiterhadapsubjek-subjekutamadalamsuatuperusahaan, sepertidata warehouseuntukcustomer, produk, dansebagainya. Dapatjugadikatakanbahwadata warehouse didesainuntukmembantudalammenganalisis data berdasarkansubjek-subjektertentusehinggahanya data yang benar-benardiperlukan yang dimasukkankedalamdata warehouse.
Lanjutan KarakteristikData Warehouse 2. Integrated Data warehousedapatmenyimpan data-data yang berasaldarisumber-sumber yang terpisahkedalamsuatuformat yang konsistendansalingterintegrasisatusama lain. Data tidakdapatdipecah-pecahkarena data yang adamerupakansuatukesatuan yang menunjangkeseluruhankonsepdata warehouseitusendiri.
Lanjutan KarakteristikData Warehouse 3. Non Volatile Data-data dalamsebuahData Warehousetidakdapatdiubah (tidakdapatdi-update). Data-data tersebutmerupakan data historis yang digunakanuntukmemenuhikebutuhananalisis, bukanuntukmenanganitransaksisepertipadabasis data transaksionalpadaumumnya. Hanyaadaduaoperasiinitial loading of data danaccess of data.
Lanjutan KarakteristikData Warehouse 4. Time Variant Data yang beradadidalamdata warehouse akuratdan valid padatitikwaktutertentuataudalam interval waktutertentu (hanyapadasaatproses ETL/update). Setiap data yang dimasukkankedata warehousepastimemilikidimensiwaktu. Dimensiwaktuiniakandipergunakansebagaipembandingdalamperhitunganuntukmenghasilkanlaporan yang diinginkan. Selainitu, denganmenggunakandimensiwaktu, pembuatkeputusandapatmengenalkecenderungandanpoladarisuatu data.
Arsitektur Data Warehouse Terdapatbeberapabentukarsitektur Data warehouse berdasarkanspesifikasidariorganisasi yang menggunakannya. Tigabentukarsitektur yang biasadigunakanadalahsebagaiberikut : 1. ArsitekturDasar Data Warehouse Gambarberikutmenampilkanarsitektursederhanadarisuatu Data Warehouse. User dapatsecaralangsungmengakses data yang diambildaribeberapa source melalui data warehouse.
Lanjutan ArsitekturData Warehouse Padagambardiatas metadata dan raw data dari OLTP (Online transaction processing) terdapatdidalamnya, dansebagaitambahandidalam Warehouse terdapat summary data. Summary data inisangatbergunadalam data Warehouse karenamerekamelakukanperhitungan yang komplekssebelumnya. Sebagaicontoh, data warehouse melakukan query untukmendapatkan data sales dibulanAgustus.
Lanjutan ArsitekturData Warehouse 2. Arsitektur Data Warehouse denganmenggunakan Staging Area Padaarsitekturdasar, andaharusmembersihkandanmemproses data operasionalsebelummemasukkannyakedalam warehouse. Andadapatmelakukannyadenganmenggunakan program, meskipunhampirsemua data warehouse menggunakan staging area didalamnya. Staging area menyederhanakanprosespembuatan summary dan management warehouse secaraumum
Lanjutan ArsitekturData Warehouse 3. Arsitektur Data Warehouse denganmenggunakan Staging Area dan Data Mart Dalammenggunakan data warehouse andadapatmengkustomisasiarsitekturnya yang disesuaikandengankebutuhanorganisasi. Hal inidimungkinkandenganmenambahkandatamart. Data mart merupakansubset dari data resource, biasanyaberorientasiuntuksuatutujuan yang spesifikatausubjek data yang didistribusikanuntukmendukungkebutuhanbisnis.Sebagaicontoh data purchasing, sales, dan inventory dapatdipisahkandalammasing-masing cube. Dalamcontohiniseoranganaliskeuangandapatmenganalisahistori data untuk purchases dan sales.
Keuntungan Data Warehouse • Data diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan transaksi. • Perbedaan diantara struktur data yang heterogen pada beberapa sumber yang terpisah dapat diatasi. • Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data apabila data dipindahkan dari database OLTP ke data warehouse. • Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah sistem produksi.
Sumber Data untukData Warehouse • Data operasionaldalamorganisasi, misalnya basis data pelanggandanproduk, dan • Sumbereksternal yang diperolehmisalnyamelalui Internet, basis data komersial, basis data pemasokataupelanggan
Sifat Data Warehouse • Multidimensional yang berartibahwaterdapatbanyaklapisankolomdanbaris (Iniberbedadengantabelpada model relasional yang hanyaberdimensidua) • Berdasarkansusunan data sepertiitu, amatlahmudahuntukmemperolehjawabanataspertanyaanseperti: “Berapakahjumlahproduk 1 terjualdiJawa Tengah padatahun n-3?”
Lanjutan SifatData Warehouse • Data warehousedapatdibangunsendiridenganmenggunakanperangkatpengembanganaplikasiataupundenganmenggunakanperangkatlunakkhusus yang ditujukanuntukmenanganihalini • Beberapacontohperangkatlunak yang digunakanuntukadministrasidanmanajemendata warehouse: • HP Intelligent Warehouse (Hewlett Packard) • FlowMark (IBM) • SourcePoint (Software AG)
PetunjukMembangunData Warehouse • Menentukanmisidansasaranbisnisbagipembentukandata warehouse • Mengidentifikasi data dari basis data operasionaldansumber lain yang diperlukanbagidata warehouse • Menentukan item-item data dalamperusahaandenganmelakukanstandarisasipenamaan data danmaknanya • Merancang basis data untukdata warehouse • Membangunkebijakandalammengarsipkan data lama sehinggaruangpenyimpanantakmenjaditerlalubesardan agar pengambilankeputusantidakmenjaditerlalulamban. • Menarik data produksi (operasional) danmeletakkanke basis data milikdata warehouse
Pemodelan Data • Skematabel yang seringdigunakanadalahskemabintang (star schema), yang digunakanpada OLAP • Skematabelinimembentukstrukturinformasimultidimensi yang kompatibeldengankebutuhanbisnis
Pertanyaan dan Diskusi
“Seseorang yang berhenti belajar adalah orang lanjut usia, meskipun umurnya masih remaja. Seseorang yang tidak pernah berhenti belajar akan selamanya menjadi pemuda” Kata-kata Bijak perangsang Otak