200 likes | 711 Views
Khoa Khoa Học & Kỹ Thuật Máy Tính Trường Đại Học Bách Khoa Tp. Hồ Chí Minh. Khai phá dữ liệu (Data mining). Giáo trình điện tử. Học kỳ 1 – 2009-2010. Nội dung. Chương 1: Tổng quan về khai phá dữ liệu Chương 2: Các vấn đề tiền xử lý dữ liệu Chương 3: Hồi qui dữ liệu
E N D
Khoa Khoa Học & Kỹ Thuật Máy Tính Trường Đại Học Bách Khoa Tp. Hồ Chí Minh Khai phá dữ liệu(Data mining) Giáo trình điện tử Học kỳ 1 – 2009-2010
Nội dung • Chương 1: Tổng quan về khai phá dữ liệu • Chương 2: Các vấn đề tiền xử lý dữ liệu • Chương 3: Hồi qui dữ liệu • Chương 4: Phân loại dữ liệu • Chương 5: Gom cụm dữ liệu • Chương 6: Khai phá luật kết hợp • Chương 7: Phát triển ứng dụng khai phá dữ liệu • Chương 8: Các đề tài nghiên cứu trong khai phá dữ liệu
Tài liệu tham khảo • [1] Jiawei Han, Micheline Kamber, “Data Mining: Concepts and Techniques”, Second Edition, Morgan Kaufmann Publishers, 2006. • [2] David Hand, Heikki Mannila, Padhraic Smyth, “Principles of Data Mining”, MIT Press, 2001. • [3] David L. Olson, Dursun Delen, “Advanced Data Mining Techniques”, Springer-Verlag, 2008. • [4] Graham J. Williams, Simeon J. Simoff, “Data Mining: Theory, Methodology, Techniques, and Applications”, Springer-Verlag, 2006. • [5] ZhaoHui Tang, Jamie MacLennan, “Data Mining with SQL Server 2005”, Wiley Publishing, 2005. • [6] Oracle, “Data Mining Concepts”, B28129-01, 2008. • [7] Oracle, “Data Mining Application Developer’s Guide”, B28131-01, 2008.
Môn học trước • Phân tích - Thiết kế Giải thuật (501044) • Hệ Cơ sở dữ liệu (503002) • Trí tuệ nhân tạo (505004)
Hiểu biết - Kỹ năng đạt được • Hiểu các bước trong quá trình khám phá tri thức • Mô tả được các khái niệm cơ bản, công nghệ, và ứng dụng của khai phá dữ liệu • Giải thích được các tác vụ khai phá dữ liệu phổ biến như hồi qui, phân loại, gom cụm, và khai phá luật kết hợp • Nhận dạng được các vấn đề về dữ liệu trong giai đoạn tiền xử lý cho các tác vụ khai phá dữ liệu • Hiểu cách sử dụng khai phá dữ liệu để có được các quyết định tốt hơn • Sử dụng được các giải thuật và công cụ khai phá dữ liệu để phát triển ứng dụng khai phá dữ liệu • Được chuẩn bị về kiến thức để có thể nghiên cứu trong lĩnh vực khai phá dữ liệu
Đánh giá • Bài tập lớn: 40% • Thi cuối kỳ (thi viết): 60% Đạt: 40%*Bài tập lớn + 60%*Thi cuối kỳ >= 5.0
Yêu cầu đối với sinh viên • Sinh viên nên có mặt tại lớp hơn 75%. • Sinh viên nên đọc trước tài liệu tham khảo cho mỗi chương. • Sinh viên nên làm các bài tập của mỗi chương. • Sinh viên nên tham khảo thêm các tài liệu học tập khác, đặc biệt từ nguồn Internet.
Thực hành • Oracle 10g/11g DBMS và Oracle 10g/11g Data Mining • [6, 7] • MS SQL Server 2005/2008 DBMS và Business Intelligence Development Studio • [5] • WEKA (the University of Waikato, New Zealand, www.cs.waikato.ac.nz/ml/weka)
Bài tập lớn • Sinh viên làm việc nhóm gồm 2-3 thành viên. • Sinh viên nhận đề tài vào tuần thứ 1. • Sinh viên chốt đề tài và bắt đầu thực hiện từ tuần thứ 2. • Sinh viên nộp bài làm (bản word, slides, và sản phẩm nếu có) vào tuần thứ 13. • Sinh viên trình bày (tùy chọn) bài làm vào tuần thứ 13-14.
Đề tài của Bài tập lớn • Tìm hiểu và thi công một công trình (có phản biện) trong lĩnh vực khai phá dữ liệu (2-3 sinh viên) • Tìm hiểu và thử nghiệm một công cụ khai phá dữ liệu khác với công cụ được thực hành (2-3 sinh viên) • Phát triển một đề án thực tế có áp dụng khai phá dữ liệu (2-3 sinh viên)