Môn học mới
Computer Vision with Deep Learning

  • Khóa học cung cấp cho học viên các kiến thức cần thiết về Deep Learning, một nhánh rất “hot” của Machine Learning và các kỹ thuật quan trọng trong việc xử lý các bài toán Computer Vision
  • Trang bị kiến thức và kỹ năng vận dụng các thuật toán quan trọng như Convolutional Neural Network (CNN), Transfer Learning từ Pre-trained model, Generative Adversarial Networks (GANs), Face detection, Object detection, Image segmentation… vào Computer Vision (thị giác máy tính) thông qua việc sử dụng các bộ thư viện, công cụ mạnh mẽ, mã nguồn mở như Python, Numpy, Pandas, Pytorch…
  • Thực hiện các project trong lĩnh vực Computer Vision với tính thực tế cao như Chấm công qua khuôn mặt, Khử nhiễu hình ảnh, Hình ảnh y tế, OCR…
  • Là nền tảng để tiếp tục tìm hiểu, áp dụng các nghiên cứu mới nhất trong lĩnh vực Computer Vision vào các ứng dụng trong công việc và cuộc sống
  • HV đã tham gia khóa “Machine Learning with Python”  hoặc có kiến thức tương đương
  • HV muốn áp dụng AI/Computer Vision vào công việc
  • HV có định hướng sẽ làm việc trong lĩnh vực Machine Learning/Computer Vision
Sau khi hoàn thành khóa học, học viên sẽ đạt được các kỹ năng:
  • Hiểu và vận dụng các thuật toán Deep Learning trong việc giải quyết các vấn đề Computer Vision thực tế, cụ thể
  • Triển khai ứng dụng 
  • Lựa chọn, áp dụng và triển khai các ứng dụng Computer Vision một cách phù hợp dựa trên yêu cầu công việc.
 

 

  • Tổng số giờ: 42 giờ
  • Học phí: 5.800.000đ (có chế độ miễn giảm của mỗi khóa, xem chi tiết trong Thời Khóa Biểu)
  • Tổng quan Deep Learning & Computer Vision
    • Giới thiệu Deep Learning
    • Lịch sử, sự phát triển của các phương pháp Deep Learning & Neural Network
    • Deep Learning & Computer Vision
    • Giới thiệu công cụ & môi trường phát triển Deep Learning
    • Các nhóm bài toán phổ biến trong lĩnh vực Computer Vision
  • Tổng quan Neural Network
    • Giới thiệu Neural Network
    • Thuật toán Backpropagation
    • Loss function, vai trò loss function
    • Optimizer
    • Hyperparameters trong Neural Network
  • CNN - Image Classification
    • Giới thiệu CNN và các loại layers
    • Các kĩ thuật huấn luyện: Regularization, LR Scheduler, Adaptive Optimizer, Focal Loss, Squeeze and Excitation, Data Augmentation pipeline with Albumentations, Class weight
    • Các kĩ thuật xử lý dữ liệu, xử lý mô hình, chuẩn hóa khác: Test time augmentation, Ensemble, Cutout, BatchNorm
  • Transfer learning và Pretrained model
    • Giới thiệu Transfer Learning
    • Các tình huống nên & không nên dùng transfer learning
    • Các mô hình pretrained: VGG Net,Resnet*,EfficientNet*,Vision Transformer*
    • Sử dụng transfer learning cho việc phân loại hình ảnh
    • Giới thiệu các metrics cho mô hình image classification
  • Object Detection với Deep Learning
    • Giới thiệu Object Detection và các khái niệm cơ bản trong object detections (ROI, anchors, …)
    • Giới thiệu các Object Detection model: Yolov8, Yolox, MaskRCNN…
    • Inference object detection models với ONNX*
  • Image Segmentation
    • Giới thiệu Segmentation, các loại Segmentation (Semantic vs Instance Segmentation)
    • Các mạng Segmentation phổ biến: UNet, Mask RCNN, 
    • Các kĩ thuật hay dùng trong huấn luyện Segmentation models: Focal loss, Dice loss, Watershed
    • Các metrics thường dùng để đánh giá segmentation models: IoU, Dice score,...
    • Các ứng dụng trong Segmentation
  • Real case project 1: Medical Imaging - giải pháp multimodel
    • Thực hành xây dựng giải pháp multimodel để giải quyết các bài toán thực tế (multimodel: stacking multiple models)
  • Real case project 2: Chấm công qua khuôn mặt
    • Giới thiệu bài toán
    • Các phương pháp xây dựng dataset: dựa trên loại camera - góc nhìn, dựa trên smartphone camera... 
    • Nhận diện gương mặt bằng phương pháp truyền thống: Haar-features & EigenFaces
    • Triển khai ứng dụng trên hệ thống AzureWebsites with Flask API
    • Các khó khăn trong thực tế triển khai: variants in pose, illumination, scale… (Face in the wild)
    • Giải pháp kết hợp giữa Face Detection -> Face Processing (Face alignment & preprocessing) -> Face Recognition
    • Nhận diện và align Face với MTCNN
    • Sử dụng ArcFace để ghép khớp gương mặt (Matching) trong face in the wild
    • Xử lý False positive, non-existing query, Multi-face
  • Generative AI
    • Giới thiệu GAN
    • Cơ chế hoạt động của GAN, cách huấn luyện mô hình GAN
    • Các kiến trúc GAN phổ biến: CycleGAN, StyleGAN, Vanilla GAN
    • Đánh giá kết quả GAN: Fréchet Inception Distance (FID), Inception Score (IS),Number of statistically-Different Bins (NDB)
    • Stable diffusion
  • Real case project 3: Deconvolution với Deep Learning
    • Khái niệm deconvolution
    • Ứng dụng deconvolution: image deblur, image uncensor, image inpainting
    • Xây dựng mạng deconvolution để giải mã ảnh bị mờ với mô hình Deblur GAN
    • Cách đánh giá mô hình deconvolution
    • Xây dựng mô hình giải mã hình ảnh bị mờ bằng Deblur GAN
  • Xây dựng ứng dụng Optical Character Recognition (OCR) / Text in the Wild bằng Deep Learning
    • Giới thiệu vấn đề
    • Xây dựng giải pháp multi-stage: Text detection, Text recognition
    • Triển khai ứng dụng thành API với Streamlit 
    • Các vấn đề trong OCR/Text in the Wild: Text correction, Text alignment
  • Triển khai ứng dụng AI (deployment & monitor) với Azure
    • Model-in-service
    • Xây dựng API từ model với Streamlit/Flask
    • Dependencies management với Docker
    • Concurrency management (Speed up model delivery services)
    • Thực hành với Azure
 

Học viên thi đạt kết quả cuối môn học sẽ được cấp chứng nhận "Computer Vision with Deep Learning - Thị giác máy tính với Học sâu" do Trung Tâm Tin Học - Trường ĐH Khoa Học Tự Nhiên cấp.

ai
Trung Tâm Tin Học
ai
Trung Tâm Tin Học
Chào mừng bạn đến với Trung Tâm Tin Học.
Bạn đang cần hỗ trợ thông tin gì ạ? Hãy Chat ngay với chúng tôi nhé.