1 / 35

DATA DIRI DOSEN

Nama : AFIJAL, S.Kom, M.Kom NIDN : 0125088401 TTL : Pulau Kayu, 25 Agustus 1984 Alamat : Jl. Medan – B. Aceh Lr. Sawah Gampong Uteun Geulinggang Kec. Dewantara Kab. Aceh Utara No. HP : +62813 6058 8524 – PIN BB : 73EA1C50 Webblog : http://www.ijalnewbie.wordpress.com PENDIDIKAN

Download Presentation

DATA DIRI DOSEN

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Nama : AFIJAL, S.Kom, M.Kom • NIDN : 0125088401 • TTL : Pulau Kayu, 25 Agustus 1984 • Alamat : Jl. Medan – B. Aceh Lr. Sawah Gampong Uteun Geulinggang Kec. Dewantara Kab. Aceh Utara • No. HP : +62813 6058 8524 – PIN BB : 73EA1C50 • Webblog : http://www.ijalnewbie.wordpress.com • PENDIDIKAN • SD Negeri 1 Blang Dalam Kab. Aceh Selatan • SMP Negeri 1 Kuala Batee Kab. Aceh Selatan • SMA Negeri 2 Lhokseumawe Kab. Aceh Utara • AMIK Logika Yos Sudarso Medan Diploma I • STMIK Bina Bangsa Lhokseumawe Sarjana Komputer Teknik Informatika • Universitas Putra Indonesia “YPTK” Padang Magister Komputer Sistem Informasi • PEKERJAAN SEKARANG • Dosen Tetap Universitas Almuslim Peusangan • Direktur LSM JADUP Bireuen • Tuha Peut Kualisi untuk Advokasi Laut Aceh (KuALA) • Ketua Pembina Yayasan RIPMA (Riset dan Pengembangan Masyarakat) DATA DIRI DOSEN

  2. KNOWLEDGE DISCOVERY IN DATABASES (kdd) DAN Data Warehouse

  3. Beda KDD dan Data Mining?

  4. KDD vs Data Mining Definisi sederhana dari KDD adalah proses dalammengidentifikasi pola-pola didalam data secarayang valid, bergunadan tentunyadapatdimengerti. Sedangkan definisi daridata miningadalahekstraksi pola atau model dari data yang diamati. Meskipun data mining adapada inti dari proses discovery knowledge, tetapidata mining ini biasanya mengambil hanya sebagian kecil (diperkirakan 15% sampai 25%) dari prosessecara menyeluruh.

  5. Tahapandalam KDD

  6. Lanjutan Tahapandalam KDD Pemilihan Data (Data Preprocessing/Cleaning) • Pemprosesanpendahuluandanpembersihan data merupakanoperasidasarsepertipenghapusan noise dilakukan. • Sebelumprosesdata miningdapatdilaksanakan, perludilakukanprosescleaningpada data yang menjadifokus KDD. • Prosescleaning mencakupantara lain membuangduplikasi data, memeriksa data yang inkonsisten, danmemperbaikikesalahanpada data, sepertikesalahancetak (tipografi). • Dilakukanprosesenrichment, yaituproses “memperkaya” data yang sudahadadengan data atauinformasi lain yang relevandandiperlukanuntuk KDD, seperti data atauinformasieksternal.

  7. Lanjutan Tahapandalam KDD Transformasi Data • Pencarianfitur-fitur yang bergunauntukmempresentasikan data bergantungkepada goal yang ingindicapai. • Merupakanprosestransformasipada data yang telahdipilih, sehingga data tersebutsesuaiuntukprosesdata mining. Prosesinimerupakanproseskreatifdansangattergantungpadajenisataupolainformasi yang akandicaridalam basis data

  8. Lanjutan Tahapandalam KDD Data Mining • Pemilihantugas data mining; pemilihan goal dariproses KDD misalnyaklasifikasi, regresi, clustering, dll. • Pemilihanalgoritma data mining untukpencarian (searching) • Proses Data miningyaituprosesmencaripolaatauinformasimenarikdalam data terpilihdenganmenggunakanteknikataumetodetertentu. Teknik, metode, ataualgoritmadalamdata miningsangatbervariasi. Pemilihanmetodeataualgoritma yang tepatsangatbergantungpadatujuandanproses KDD secarakeseluruhan.

  9. Lanjutan Tahapandalam KDD Interpretasi/Evaluasi • Penerjemahanpola-pola yang dihasilkandaridata mining. • Polainformasi yang dihasilkandariprosesdata miningperluditampilkandalambentuk yang mudahdimengertiolehpihak yang berkepentingan. • Tahapinimerupakanbagiandariproses KDD yang mencakuppemeriksaanapakahpolaatauinformasi yang ditemukanbertentangandenganfaktaatauhipotesa yang adasebelumnya.

  10. Pertanyaan dan Diskusi

  11. Pengantar DATA WAREHOUSE

  12. Mengapakitaperlu DATA WAREHOUSE?

  13. Permasalahan DBMS SaatIni • Ketikaorganisasimemilikikantorlebihdarisatu, setiapkantorakanmembuat DBMS sendiri. • Jikalaudevelopment tidakdikontrolsecaraterpusat, coding untuk DBMS antarcabangakanberbeda. • Sangatsulitmengintegrasi database untukinformasitertentu

  14. Lanjutan PermasalahanDBMS SaatIni • Walaupunsemuanama variable mengarahke attribute yang sama, integrasidari database tetapmenyulitkan • Permasalahan lain: unit dariukuran • Misal: unit untukmatauangdi database indonesiaadalah rupiah sedangkandi database disingaporemenggunakanmatauang dollar singapore • Jadiakses data dankonsolidasi data daridua database tidakdapatlgsgdilakukan • E-R model untuk data operasionalmenjadilebihkompleksdansangatsulituntukdipelajari

  15. Karakteristik Data Warehouse 1. Subject Oriented Data warehouseberorientasisubjek, artinyadata warehouseberorientasiterhadapsubjek-subjekutamadalamsuatuperusahaan, sepertidata warehouseuntukcustomer, produk, dansebagainya. Dapatjugadikatakanbahwadata warehouse didesainuntukmembantudalammenganalisis data berdasarkansubjek-subjektertentusehinggahanya data yang benar-benardiperlukan yang dimasukkankedalamdata warehouse.

  16. Lanjutan KarakteristikData Warehouse 2. Integrated Data warehousedapatmenyimpan data-data yang berasaldarisumber-sumber yang terpisahkedalamsuatuformat yang konsistendansalingterintegrasisatusama lain. Data tidakdapatdipecah-pecahkarena data yang adamerupakansuatukesatuan yang menunjangkeseluruhankonsepdata warehouseitusendiri.

  17. Lanjutan KarakteristikData Warehouse 3. Non Volatile Data-data dalamsebuahData Warehousetidakdapatdiubah (tidakdapatdi-update). Data-data tersebutmerupakan data historis yang digunakanuntukmemenuhikebutuhananalisis, bukanuntukmenanganitransaksisepertipadabasis data transaksionalpadaumumnya. Hanyaadaduaoperasiinitial loading of data danaccess of data.

  18. Lanjutan KarakteristikData Warehouse 4. Time Variant Data yang beradadidalamdata warehouse akuratdan valid padatitikwaktutertentuataudalam interval waktutertentu (hanyapadasaatproses ETL/update). Setiap data yang dimasukkankedata warehousepastimemilikidimensiwaktu. Dimensiwaktuiniakandipergunakansebagaipembandingdalamperhitunganuntukmenghasilkanlaporan yang diinginkan. Selainitu, denganmenggunakandimensiwaktu, pembuatkeputusandapatmengenalkecenderungandanpoladarisuatu data.

  19. Arsitektur Data Warehouse Terdapatbeberapabentukarsitektur Data warehouse berdasarkanspesifikasidariorganisasi yang menggunakannya. Tigabentukarsitektur yang biasadigunakanadalahsebagaiberikut : 1. ArsitekturDasar Data Warehouse Gambarberikutmenampilkanarsitektursederhanadarisuatu Data Warehouse. User dapatsecaralangsungmengakses data yang diambildaribeberapa source melalui data warehouse.

  20. Lanjutan ArsitekturData Warehouse

  21. Lanjutan ArsitekturData Warehouse Padagambardiatas metadata dan raw data dari OLTP (Online transaction processing) terdapatdidalamnya, dansebagaitambahandidalam Warehouse terdapat summary data. Summary data inisangatbergunadalam data Warehouse karenamerekamelakukanperhitungan yang komplekssebelumnya. Sebagaicontoh, data warehouse melakukan query untukmendapatkan data sales dibulanAgustus.

  22. Lanjutan ArsitekturData Warehouse 2. Arsitektur Data Warehouse denganmenggunakan Staging Area Padaarsitekturdasar, andaharusmembersihkandanmemproses data operasionalsebelummemasukkannyakedalam warehouse. Andadapatmelakukannyadenganmenggunakan program, meskipunhampirsemua data warehouse menggunakan staging area didalamnya. Staging area menyederhanakanprosespembuatan summary dan management warehouse secaraumum

  23. Lanjutan ArsitekturData Warehouse

  24. Lanjutan ArsitekturData Warehouse 3. Arsitektur Data Warehouse denganmenggunakan Staging Area dan Data Mart Dalammenggunakan data warehouse andadapatmengkustomisasiarsitekturnya yang disesuaikandengankebutuhanorganisasi. Hal inidimungkinkandenganmenambahkandatamart. Data mart merupakansubset dari data resource, biasanyaberorientasiuntuksuatutujuan yang spesifikatausubjek data yang didistribusikanuntukmendukungkebutuhanbisnis.Sebagaicontoh data purchasing, sales, dan inventory dapatdipisahkandalammasing-masing cube. Dalamcontohiniseoranganaliskeuangandapatmenganalisahistori data untuk purchases dan sales.

  25. Lanjutan ArsitekturData Warehouse

  26. Keuntungan Data Warehouse • Data diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan transaksi. • Perbedaan diantara struktur data yang heterogen pada beberapa sumber yang terpisah dapat diatasi. • Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data apabila data dipindahkan dari database OLTP ke data warehouse. • Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah sistem produksi.

  27. Sumber Data untukData Warehouse • Data operasionaldalamorganisasi, misalnya basis data pelanggandanproduk, dan • Sumbereksternal yang diperolehmisalnyamelalui Internet, basis data komersial, basis data pemasokataupelanggan

  28. Sifat Data Warehouse • Multidimensional yang berartibahwaterdapatbanyaklapisankolomdanbaris (Iniberbedadengantabelpada model relasional yang hanyaberdimensidua) • Berdasarkansusunan data sepertiitu, amatlahmudahuntukmemperolehjawabanataspertanyaanseperti: “Berapakahjumlahproduk 1 terjualdiJawa Tengah padatahun n-3?”

  29. Lanjutan SifatData Warehouse • Data warehousedapatdibangunsendiridenganmenggunakanperangkatpengembanganaplikasiataupundenganmenggunakanperangkatlunakkhusus yang ditujukanuntukmenanganihalini • Beberapacontohperangkatlunak yang digunakanuntukadministrasidanmanajemendata warehouse: • HP Intelligent Warehouse (Hewlett Packard) • FlowMark (IBM) • SourcePoint (Software AG)

  30. PetunjukMembangunData Warehouse • Menentukanmisidansasaranbisnisbagipembentukandata warehouse • Mengidentifikasi data dari basis data operasionaldansumber lain yang diperlukanbagidata warehouse • Menentukan item-item data dalamperusahaandenganmelakukanstandarisasipenamaan data danmaknanya • Merancang basis data untukdata warehouse • Membangunkebijakandalammengarsipkan data lama sehinggaruangpenyimpanantakmenjaditerlalubesardan agar pengambilankeputusantidakmenjaditerlalulamban. • Menarik data produksi (operasional) danmeletakkanke basis data milikdata warehouse

  31. Pemodelan Data • Skematabel yang seringdigunakanadalahskemabintang (star schema), yang digunakanpada OLAP • Skematabelinimembentukstrukturinformasimultidimensi yang kompatibeldengankebutuhanbisnis

  32. LanjutanPemodelanData

  33. Pertanyaan dan Diskusi

  34. “Seseorang yang berhenti belajar adalah orang lanjut usia, meskipun umurnya masih remaja. Seseorang yang tidak pernah berhenti belajar akan selamanya menjadi pemuda” Kata-kata Bijak perangsang Otak

  35. Sampai Jumpa Pada Pertemuan Berikutnya....... !

More Related