1 / 11

Khai phá dữ liệu (Data mining)

Khoa Khoa Học & Kỹ Thuật Máy Tính Trường Đại Học Bách Khoa Tp. Hồ Chí Minh. Khai phá dữ liệu (Data mining). Giáo trình điện tử. Học kỳ 1 – 2009-2010. Nội dung. Chương 1: Tổng quan về khai phá dữ liệu Chương 2: Các vấn đề tiền xử lý dữ liệu Chương 3: Hồi qui dữ liệu

cambree
Download Presentation

Khai phá dữ liệu (Data mining)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Khoa Khoa Học & Kỹ Thuật Máy Tính Trường Đại Học Bách Khoa Tp. Hồ Chí Minh Khai phá dữ liệu(Data mining) Giáo trình điện tử Học kỳ 1 – 2009-2010

  2. Nội dung • Chương 1: Tổng quan về khai phá dữ liệu • Chương 2: Các vấn đề tiền xử lý dữ liệu • Chương 3: Hồi qui dữ liệu • Chương 4: Phân loại dữ liệu • Chương 5: Gom cụm dữ liệu • Chương 6: Khai phá luật kết hợp • Chương 7: Phát triển ứng dụng khai phá dữ liệu • Chương 8: Các đề tài nghiên cứu trong khai phá dữ liệu

  3. Tài liệu tham khảo • [1] Jiawei Han, Micheline Kamber, “Data Mining: Concepts and Techniques”, Second Edition, Morgan Kaufmann Publishers, 2006. • [2] David Hand, Heikki Mannila, Padhraic Smyth, “Principles of Data Mining”, MIT Press, 2001. • [3] David L. Olson, Dursun Delen, “Advanced Data Mining Techniques”, Springer-Verlag, 2008. • [4] Graham J. Williams, Simeon J. Simoff, “Data Mining: Theory, Methodology, Techniques, and Applications”, Springer-Verlag, 2006. • [5] ZhaoHui Tang, Jamie MacLennan, “Data Mining with SQL Server 2005”, Wiley Publishing, 2005. • [6] Oracle, “Data Mining Concepts”, B28129-01, 2008. • [7] Oracle, “Data Mining Application Developer’s Guide”, B28131-01, 2008.

  4. Môn học trước • Phân tích - Thiết kế Giải thuật (501044) • Hệ Cơ sở dữ liệu (503002) • Trí tuệ nhân tạo (505004)

  5. Hiểu biết - Kỹ năng đạt được • Hiểu các bước trong quá trình khám phá tri thức • Mô tả được các khái niệm cơ bản, công nghệ, và ứng dụng của khai phá dữ liệu • Giải thích được các tác vụ khai phá dữ liệu phổ biến như hồi qui, phân loại, gom cụm, và khai phá luật kết hợp • Nhận dạng được các vấn đề về dữ liệu trong giai đoạn tiền xử lý cho các tác vụ khai phá dữ liệu • Hiểu cách sử dụng khai phá dữ liệu để có được các quyết định tốt hơn • Sử dụng được các giải thuật và công cụ khai phá dữ liệu để phát triển ứng dụng khai phá dữ liệu • Được chuẩn bị về kiến thức để có thể nghiên cứu trong lĩnh vực khai phá dữ liệu

  6. Đánh giá • Bài tập lớn: 40% • Thi cuối kỳ (thi viết): 60%  Đạt: 40%*Bài tập lớn + 60%*Thi cuối kỳ >= 5.0

  7. Yêu cầu đối với sinh viên • Sinh viên nên có mặt tại lớp hơn 75%. • Sinh viên nên đọc trước tài liệu tham khảo cho mỗi chương. • Sinh viên nên làm các bài tập của mỗi chương. • Sinh viên nên tham khảo thêm các tài liệu học tập khác, đặc biệt từ nguồn Internet.

  8. Thực hành • Oracle 10g/11g DBMS và Oracle 10g/11g Data Mining • [6, 7] • MS SQL Server 2005/2008 DBMS và Business Intelligence Development Studio • [5] • WEKA (the University of Waikato, New Zealand, www.cs.waikato.ac.nz/ml/weka)

  9. Bài tập lớn • Sinh viên làm việc nhóm gồm 2-3 thành viên. • Sinh viên nhận đề tài vào tuần thứ 1. • Sinh viên chốt đề tài và bắt đầu thực hiện từ tuần thứ 2. • Sinh viên nộp bài làm (bản word, slides, và sản phẩm nếu có) vào tuần thứ 13. • Sinh viên trình bày (tùy chọn) bài làm vào tuần thứ 13-14.

  10. Đề tài của Bài tập lớn • Tìm hiểu và thi công một công trình (có phản biện) trong lĩnh vực khai phá dữ liệu (2-3 sinh viên) • Tìm hiểu và thử nghiệm một công cụ khai phá dữ liệu khác với công cụ được thực hành (2-3 sinh viên) • Phát triển một đề án thực tế có áp dụng khai phá dữ liệu (2-3 sinh viên)

  11. Hỏi & Đáp …

More Related