Khóa học cung cấp cho học viên các kiến thức cần thiết về Deep Learning, một nhánh rất “hot” của Machine Learning và các kỹ thuật quan trọng trong việc xử lý các bài toán Computer Vision
Trang bị kiến thức và kỹ năng vận dụng các thuật toán quan trọng như Convolutional Neural Network (CNN), Transfer Learning từ Pre-trained model, Generative Adversarial Networks (GANs), Face detection, Object detection, Image segmentation… vào Computer Vision (thị giác máy tính) thông qua việc sử dụng các bộ thư viện, công cụ mạnh mẽ, mã nguồn mở như Python, Numpy, Pandas, Pytorch…
Thực hiện các project trong lĩnh vực Computer Vision với tính thực tế cao như Chấm công qua khuôn mặt, Khử nhiễu hình ảnh, Hình ảnh y tế, OCR…
Là nền tảng để tiếp tục tìm hiểu, áp dụng các nghiên cứu mới nhất trong lĩnh vực Computer Vision vào các ứng dụng trong công việc và cuộc sống
Lịch sử, sự phát triển của các phương pháp Deep Learning & Neural Network
Deep Learning & Computer Vision
Giới thiệu công cụ & môi trường phát triển Deep Learning
Các nhóm bài toán phổ biến trong lĩnh vực Computer Vision
Tổng quan Neural Network
Giới thiệu Neural Network
Thuật toán Backpropagation
Loss function, vai trò loss function
Optimizer
Hyperparameters trong Neural Network
CNN - Image Classification
Giới thiệu CNN và các loại layers
Các kĩ thuật huấn luyện: Regularization, LR Scheduler, Adaptive Optimizer, Focal Loss, Squeeze and Excitation, Data Augmentation pipeline with Albumentations, Class weight
Các kĩ thuật xử lý dữ liệu, xử lý mô hình, chuẩn hóa khác: Test time augmentation, Ensemble, Cutout, BatchNorm
Transfer learning và Pretrained model
Giới thiệu Transfer Learning
Các tình huống nên & không nên dùng transfer learning
Các mô hình pretrained: VGG Net,Resnet*,EfficientNet*,Vision Transformer*
Sử dụng transfer learning cho việc phân loại hình ảnh
Giới thiệu các metrics cho mô hình image classification
Object Detection với Deep Learning
Giới thiệu Object Detection và các khái niệm cơ bản trong object detections (ROI, anchors, …)
Giới thiệu các Object Detection model: Yolov8, Yolox, MaskRCNN…
Inference object detection models với ONNX*
Image Segmentation
Giới thiệu Segmentation, các loại Segmentation (Semantic vs Instance Segmentation)
Các mạng Segmentation phổ biến: UNet, Mask RCNN,
Các kĩ thuật hay dùng trong huấn luyện Segmentation models: Focal loss, Dice loss, Watershed
Các metrics thường dùng để đánh giá segmentation models: IoU, Dice score,...
Các ứng dụng trong Segmentation
Real case project 1: Medical Imaging - giải pháp multimodel
Thực hành xây dựng giải pháp multimodel để giải quyết các bài toán thực tế (multimodel: stacking multiple models)
Real case project 2: Chấm công qua khuôn mặt
Giới thiệu bài toán
Các phương pháp xây dựng dataset: dựa trên loại camera - góc nhìn, dựa trên smartphone camera...
Nhận diện gương mặt bằng phương pháp truyền thống: Haar-features & EigenFaces
Triển khai ứng dụng trên hệ thống AzureWebsites with Flask API
Các khó khăn trong thực tế triển khai: variants in pose, illumination, scale… (Face in the wild)
Giải pháp kết hợp giữa Face Detection -> Face Processing (Face alignment & preprocessing) -> Face Recognition
Nhận diện và align Face với MTCNN
Sử dụng ArcFace để ghép khớp gương mặt (Matching) trong face in the wild
Xử lý False positive, non-existing query, Multi-face
Generative AI
Giới thiệu GAN
Cơ chế hoạt động của GAN, cách huấn luyện mô hình GAN
Các kiến trúc GAN phổ biến: CycleGAN, StyleGAN, Vanilla GAN
Đánh giá kết quả GAN: Fréchet Inception Distance (FID), Inception Score (IS),Number of statistically-Different Bins (NDB)
Stable diffusion
Real case project 3: Deconvolution với Deep Learning
Khái niệm deconvolution
Ứng dụng deconvolution: image deblur, image uncensor, image inpainting
Xây dựng mạng deconvolution để giải mã ảnh bị mờ với mô hình Deblur GAN
Cách đánh giá mô hình deconvolution
Xây dựng mô hình giải mã hình ảnh bị mờ bằng Deblur GAN
Xây dựng ứng dụng Optical Character Recognition (OCR) / Text in the Wild bằng Deep Learning
Giới thiệu vấn đề
Xây dựng giải pháp multi-stage: Text detection, Text recognition
Triển khai ứng dụng thành API với Streamlit
Các vấn đề trong OCR/Text in the Wild: Text correction, Text alignment
Triển khai ứng dụng AI (deployment & monitor) với Azure
Model-in-service
Xây dựng API từ model với Streamlit/Flask
Dependencies management với Docker
Concurrency management (Speed up model delivery services)
Học viên thi đạt kết quả cuối môn học sẽ được cấp chứng nhận "Computer Vision with Deep Learning - Thị giác máy tính với Học sâu" do Trung Tâm Tin Học - Trường ĐH Khoa Học Tự Nhiên cấp.
data-science-machine-learning
Trung Tâm Tin Học
Trung Tâm Tin Học
Chào mừng bạn đến với Trung Tâm Tin Học.
Bạn đang cần hỗ trợ thông tin gì ạ? Hãy Chat ngay với chúng tôi nhé.