1 / 25

Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507 SKS : 3. Materi Kuliah. Pengantar Web Mining Dasar-dasar data Mining Association Rules and Sequential Patterns Supervised Learning Unsupervised Learning Partially Supervised Learning

Download Presentation

Mata Kuliah :Web Mining Dosen Nama : Mulaab, Ssi, M.Kom Ruang : Puskom Contact : 0857 3321 5507

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Mata Kuliah :Web Mining • Dosen • Nama : Mulaab, Ssi, M.Kom • Ruang : Puskom • Contact : 0857 3321 5507 • SKS : 3

  2. Materi Kuliah • Pengantar Web Mining • Dasar-dasar data Mining • Association Rules and Sequential Patterns • Supervised Learning • Unsupervised Learning • Partially Supervised Learning • Information Retrieval and Web Search • Opinion Mining • Web Usage Mining

  3. Pengantar • Tantangan Web Mining • Dasar dasar Web Mining • Klasifikasi Web Minin

  4. Web Mining – The Idea • Banyaknya dokumen HTML, gambar dan file multimedia yang ada di internet, sehinggan menemukan content yang yang diinginkan adalah tugas yang sangat sulit

  5. Web Mining • Web adalah salah satu sumber data yang sangat besar • Berbagai bidang yang dipersiapakan: • data mining, machine learning, natural language • processing, statistics, databases, information • retrieval, multimedia, .

  6. Peluang dan Tantangan • Jumlah informasi di web sangat besar dan mudah diakses • Mencari informasi yang beragam. • Kita dapat menemukan berbagai macam informasi • Information/data dari berbagai bentuk tipe data., structured tables, texts, multimedia data, . • Ada banyak hyperlinks dalam website dan antar website • Banyak informasi Web information yang redundantis redundant.

  7. Peluand dan Tantangan • The Web is noisy. Informasi dari web berisi banyak berbagai macam informasi , content utama, iklan, panel navigasi dll. • The Web juga ada services. • The Web is dynamic. • the Web is a virtual society.

  8. Web Mining • Application dari data mining secara otomatis menemukan dan mengektrak informasi dari data web

  9. Data Mining vs. Web Mining • Traditional data mining • data terstruktur • tabel • Web data • Semi-structured and unstructured • kaya fitur dan pola

  10. Klasifikasi Teknik Web Mining • Web Content Mining • Web-Structure Mining • Web-Usage Mining

  11. Web Mining Web Content Mining Web Usage Mining Web Structure Mining Web-Structure Mining Menemukan hirarki dari hiperlink dalam website dan strukturnya.

  12. Web-Structure Mining cont… Menemukan informasi tentang relevansi dan kualitas dari web dari topik dan content

  13. Web Mining Web Content Mining Web Usage Mining Web Structure Mining Web-Usage Mining Menemukan pola navigasi dari data web : memprediksi interaksi user dengan web, membantu memperbaiki resources.

  14. Web-Usage Mining • Teknik Usage Mining Data Preparation Data Collection Data Selection Data Cleaning Data Mining Navigation Patterns Sequential Patterns

  15. A E B C D Web-Usage Mining cont… • Data Mining Techniques – Navigation Patterns

  16. Web-Usage Mining • Data Mining Techniques – Navigation Patterns Analysis:

  17. Web-Usage Mining cont… • Data Mining Techniques – Sequential Patterns Customer Transaction Time Purchased Items John 6/21/05 5:30 pm Beer John 6/22/05 10:20 pm Brandy Frank 6/20/05 10:15 am Juice, Coke Frank 6/20/05 11:50 am Beer Frank 6/20/05 12:50 am Wine, Cider Mary 6/20/05 2:30 pm Beer Mary 6/21/05 6:17 pm Wine, Cider Mary 6/22/05 5:05 pm Brandy Example: Supermarket Cont…

  18. Web-Usage Mining cont… • Data Mining Techniques – Sequential Patterns Contoh • In Google search, dalam minggu terakhir 30% pengguna telah mengunjungi /company/product/ had dengan ‘camera’ sebagai kunci pencarian

  19. Web Content Mining • Meneumukan informasi dari jutaan content dari berbagai sumber informasi World Wide Web • Misalkan, Web data contents: text, Image, audio, video, metadata and hyperlinks

  20. Web Content Mining • Pre-processing data sebelum web content mining: feature selection • Post-processing data untuk mengurangi kebingungan dari hasil pencarian • Search Engine Mining • Memperbaiki pencarian content.

  21. Web Content Mining • Web content mining terkaita dengan datamining dan text mining • Terkait daengan data mining karena teknik datamining digunakan dalam web content mining. • Terkait dengan text mining karena sebagian besar konten adalah text • Web data adalah semi-structured dan atau unstructured, karena data mining adalah terstruktur dan text adalah unstructured.

  22. Teknik untuk Web Content Mining • Classifications • Clustering • Association

  23. Document Classification • Supervised Learning • Klasifikasi dokumen • Techniques used are • Nearest Neighbor Classifier • Feature Selection • Decision Tree

  24. Feature Selection • Menghilang istilah-istilah dalam training documents which yang secara statistik tidak terkait dengan label kelas

  25. Thank You!

More Related