CS313 - Khai thác dữ liệu và ứng dụng

Tài liệu môn học

Folder Drive

Mô tả môn học

Số tín chỉ: 4

  • Lí thuyết: 3
  • Thực hành: 1

Điều kiện đăng ký

Môn học trước Môn học tiên quyết
IT001 - Nhập môn lập trình
-
IT003 - Cấu trúc dữ liệu và giải thuật
-

Hệ số điểm

QT GK TH CK
0.35
-
0.15
0.5

Lý thuyết

  1. Course overview and introduction to data mining
  2. Data pre-processing
  3. Regression
  4. Statistical test for machine learning
  5. Classification
  6. Clustering
  7. Mining frequent patterns
  8. Anomaly detection
  9. XGBoost
  10. Variational AutoEncoder (VAE)
  11. Generative Adversarial Network (GAN)

Thực hành

Thực hành theo hình thức 2. Tuy nhiên khác với các môn học HT2 thường thấy khác, ở môn này giảng viên sẽ tạo 1 cái workshop và tài khoản cho sinh viên làm trên đó. Khi làm xong và nộp xác nhận qua email thì sẽ có 1 buổi vấn đáp với giảng viên. Vấn đáp sẽ gồm 3 câu hỏi với nội dung nằm trong workshop đã làm.

Đồ án

  • Làm theo nhóm từ 6 đến 7 người. Sẽ có hai lần làm đồ án.
  • Lần làm đồ án thứ nhất là sẽ trình bày về 1 chủ đề nào đó trong nội dung môn học, chi tiết các chủ đề có thể dùng nằm trong slide tại link drive phía trên.
  • Lần làm đồ án thứ hai, nhóm tự tìm bài toán cùng với dataset liên quan cho nhóm ở trên mạng. Sau đó sử dụng kiến thức đã học được để chắt lọc, khai thác dữ liệu ra. Qua đó sử dụng trên một ứng dụng hoàn chỉnh, tổng kết lại về dataset và kỹ thuật khai thác đã lựa chọn. Chi tiết yêu cầu của đồ án giảng viên sẽ nói trong buổi đầu tiên giới thiệu môn học.

Hình thức thi.

Không có thi giữa kỳ và cuối kỳ. Điểm quá trình và cuối kỳ sẽ lấy từ các điểm đồ án đã nói ở trên. Điểm giữa kỳ sẽ lấy từ workshop đã làm cùng với 3 câu hỏi vấn đáp.

Thông tin thêm

  • Chú ý nho nhỏ là thành viên nhóm sẽ là do giảng viên tự chọn nên trên tinh thần là sẽ làm chung với các sinh viên từ khoa khác (KHMT là chủ yếu).
  • Khuyến khích đối với các bạn nào hứng thú với AI ML các thứ mà muốn học hỏi thêm :v