Môn học mới
Machine Learning with Python

  • Khóa học cung cấp cho học viên các kiến thức quan trọng và cần thiết về Machine Learning, một phần rất “quan trọng” của Khoa học dữ liệu (Data Science).
  • Trang bị các kiến thức cơ bản về Toán được ứng dụng trong các thuật toán của Machine Learning.
  • Trang bị kiến thức và kỹ năng vận dụng các thuật toán thuộc nhóm Supervised Learning (Classification, Regression), Unsupervised Learning (Clustering, Dimensionality Reduction) thông qua việc sử dụng các bộ thư viện, công cụ mạnh mẽ, mã nguồn mở như Python, Jupyter Notebooks, Numpy, Pandas, Matplotlib, Seaborn, sklearn…
  • Xây dựng nền tảng vững chắc về Machine Learning với Python, tạo tiền đề cho việc tìm hiểu kiến thức về Deep Learning.
  • Là khóa học thứ năm trong chương trình “Data Science and Machine Learning Certificate (Khoa học dữ liệu và Máy học)
 
  • HV đã tham gia khóa Data Preprocessing & Analysis hoặc có kiến thức tương đương
  • Sinh viên các trường Đại học, Cao đẳng
  • HV có định hướng sẽ làm việc trong lĩnh vực Machine Learning/ Data Science
 
  • Hiểu các khái niệm cơ bản của Toán được vận dụng trong Machine Learning, bao gồm Đại số ma trận; Tối ưu hàm số với Gradient Descent; Xác suất và Thống kê.
  • Hiểu, áp dụng và triển khai các thuật toán trong nhóm Supervised Learning như Logistic Regression, Linear Regression, Naïve Bayes, K-Nearest Neighbors (KNN), Decision Tree, Random Forest, Support Vector Machine (SVM), Mạng Nơron;  Boosting và AdaBoost với Python.
  • Hiểu, áp dụng và triển khai các thuật toán trong nhóm Unsupervised Learning như K-Means clustering, Hierarchical Clustering, Gaussian Mixture Models (GMM)
  • Dimensionality Reduction với Principal Component Analysis (PCA) và  Linear Discriminant Analysis (LDA).
  • Time Series Analysis với ARIMA
  • Vận dụng các thuật toán Machine Learning trong việc giải quyết các vấn đề thực tế, cụ thể
  • Triển khai project theo Data Science process
  • Xây dựng nền tảng vững chắc về Machine Learning với Python
 
  • Thời gian: 5 tuần
  • Thời lượng: 48 giờ (64 tiết)
  • Học phí: 6.000.000 đ
 
  • Giới thiệu Machine Learning(3 giờ)
    • Giới thiệu
    • Tổng quan về Machine Learning
      • Định nghĩa
      • Lịch sử phát triển
      • Tầm quan trọng của ML trong thế giới hiện nay
    • Phân loại
      • Học có giám sát
      • Học không giám sát
      • Học tăng cường
    • Quy trình phát triển ML project (ôn lại)
    • Đánh giá mô hình
      • Đánh giá mô hình hồi quy (regression): MSE, MAE, R2
      • Đánh giá mô hình phân loại (classification): Accuracy score, TP, TF, FP, FN, ROC 
    • Hỏi đáp
  • KNN(3 giờ)
    • Vector - Ma trận
    • Các thao tác cơ bản với vector – ma trận
    • Thuật toán kNN
      • Khoảng các giữa 2 vector
      • Minh họa thuật toán KNN với Excel/Python (chat GPT)
      • Sử dụng thư viện sklearn
  • Tối ưu hàm số với Gradient Descent(3 giờ)
    • Giới thiệu đạo hàm
    • Một số đạo hàm cơ bản
    • Đạo hàm đa biến
    • Tim cực trị hàm số với phương pháp Gradient Descent 
    • Tối ưu hàm mất mát MSE
  • Mô hình hồi quy tuyến tính (Linear Regression)(3 giờ)
    • Giới thiệu thuật toán
      • Hàm mất mát (Loss function / Cost function) MSE
    • Sử dụng thư viện sklearn
    • Vấn đề đa công tuyến trong hồi quy đa biến.
    • Chọn lựa thuộc tính với SelectKBest
  • Mô hình hồi quy Logistic (Logistic Regression)(3 giờ)
    • Giới thiệu Binary classification
    • Hàm Sigmoid 
    • Hàm mất mát Cross-Entropy
    • Minh họa thuật toán Logistic (Excel/Python (Chat GPT hổ trợ))
    • Sử dụng thư viện sklearn trong bài toán hồi quy logistic đa biến.  
  • Naive Bayes(3 giờ)
    • Lý thuyết xác suất
    • Công thức Bayes
    • Phân phối dữ liệu và hàm phân phối xác suất 
    • Phân phối dữ liệu (Distribution)
    • Hàm phân phối xác suất và hàm mật độ xác suất 
    • Phân phối chuẩn (Standard distribution)
    • Phân phối nhị thức (Binomial distribution)
    • Ứng dụng công thức Bayes trong bài toán phân lớp (classification)
    • Minh họa thuật toán với Excel/Python   
    • Thực hành cài đặt mô hình với thư viện sklearn
  • Cây quyết định (Tree Decision) -  Rừng (Random Forest)(3 giờ)
    • Giới thiệu về cây quyết định
    • Hoạt đông tổ chức cây
      • Inpurity Gini
      • Entropy, Information gain 
    • Ưu & Khuyết điểm
    • Cài đặt ứng dụng với thư viện sklearn
    • Thuật toán Random Forest
      • Giới thiệu
      • Ensemble models
      • Ưu & khuyết điểm 
      • Thực hành cài đặt mô hình với thư viện sklearn 
    • Chọn lựa thuộc tính với FeaturesImportance 
  • Các kỹ thuật khác (3 giờ)
    • Lưu trữ và tái sử dụng model
    • Pipeline
    • Đánh giá và lựa chọn mô hình (Cross validation)
    • Tối ưu các giá trị tham số (Parameters tuning)
      • Grid search
      • Random search
  • SVM(1.5 giờ)
    • Cơ bản về  SVM
      • Tối đa hóa lề phân tách
        • Hard-margin
        • Soft-margin
      • Khái niệm support vector
      • Giới thiệu các Kernel trick
    • Thực hành cài đặt mô hình với sklearn
  • Ensemble Techniques: Boosting(3 giờ)
    • Tổng quan về Boosting
    • Các thuật toán Boosting phổ biến
      • AdaBoost
      • XGBoost
    • Thực hành cài đặt mô hình 
  • Các thuật toán giảm chiều dữ liệu  (3 giờ)
    • Phân tích thành phần chính (PCA)
      • Giới thiệu thuật toán
      • Ứng dụng PCA trong sklearn và các ví dụ cụ thể
    • Thuật toán LDA
      • Giới thiệu thuật toán
      • Ứng dụng LDA trong sklearn để giảm chiều dữ liệu
  • Phân cụm dữ liệu(3 giờ)
    • KMeans
      • Hoạt động của thuật toán 
      • Chọn số nhóm (Elbow method, Sihoute)
      • Ưu và khuyết điểm
      • Thực hành cài đặt mô hình. 
    • Gausian Mixture Model (GMM)
      • Phân phối chuẩn
      • Thuật toán GMM
      • Cài đặt ứng dụng GMM  
  • Time series analysis: ARIMA(3 giờ)
    • Tổng quan
    • Các thành phần
      • Trend, seasonality, cyclic patterns, and noise.
    • Stationarity.
      • Dickey-Fuller test.
    • Xác định tham số p,d,q , [P, D, Q]  m trong mô hình ARIMA và SARIMA
      • ACF và PACF 
    • Time Series Decomposition
    • Thực hành xây dựng mô hình với ARIMA, SARIMA và Auto Arima
  • Mạng nơron (Neuron network)(6 giờ)
    • Tổng quan về mạng nơron
    • Cấu trúc và hoạt động của mạng noron
      • Layers:  Input, Dense, Droput, RNN (LSTM), …
      • Activation functions: RELU, Sigmoid, Softmax
      • Feed forward process
      • Back propagation 
    • Giới thiệu các khái niệm
      • Optimizer
      • Epoch, batch_size
      • Loss, metrics 
    • Ứng dụng với bài toán Time-series
  • Đề thi cuối môn (Final Exam)(1.5 giờ)
  • Phần thời gian dự trữ (3 giờ)
 

Học viên thi đạt kết quả cuối môn học sẽ được cấp chứng nhận "Machine Learning with Python - Máy học với Python"

 
LỊCH KHAI GIẢNG Xem thêm
Môn học mới

Học phí: 6.000.000đ - Nhận ƯU ĐÃI HỌC PHÍ khi ghi danh online + hoàn tất ​đến ngày 16/12/2024

LớpThời gianNgày khai giảngĐịa điểm học 
DL05_300C7N5_ONThứ 7 + Chủ Nhật (13.30 - 17.00) & Thứ 5 (18.00 - 21.00)21/12/2024OnlineĐăng ký
CÁC MÔN HỌC LIÊN QUAN
ai
Trung Tâm Tin Học
ai
Trung Tâm Tin Học
Chào mừng bạn đến với Trung Tâm Tin Học.
Bạn đang cần hỗ trợ thông tin gì ạ? Hãy Chat ngay với chúng tôi nhé.