Môn học mới
Computer Vision with Deep Learning old

  • Kiến thức về lịch sử Thị giác máy tính (Computer Vision), các định dạng và diễn giải hình ảnh, các kỹ thuật lọc tuyến tính và xử lý hình ảnh trong miền tần số, lấy mẫu ảnh.
  • Phương pháp trích xuất đặc trưng hình ảnh: phát hiện cạnh, đốm màu, gốc; phương pháp dò tìm đặc trưng SIFT và các biến thể, các không gian đặc trưng
  • Kỹ năng phân đoạn hình ảnh và hệ thống hình ảnh con người.
  • Phương pháp biểu diễn và ghép đặc trưng hình ảnh: biến đổi Hough, biểu diễn Bag-of-Words, VLAD và các kỹ thuật ghép nối hình ảnh.
  • Kiến thức về mạng nơ-ron: mạng Nơ-ron Lan Truyền Tiến, thuật toán Backpropagation, giảm dần độ dốc và biến thể, quy chuẩn hoá và cải tiến quá trình đào tạo mạng nơ-ron.
  • Kiến thức nền tảng và cách vận dụng mạng nơ-ron tích chập (Convolutional Neural Networks,CNNs) để phát hiện đối tượng và phân đoạn hình ảnh, phát hiện gương mặt người, tư thế và đám đông..
  • Kiến thức và kỹ năng triển khai mạng nơ-ron hồi quy (RNNs), bao gồm LSTMs và GRUs, cách hiểu video với CNNs và RNNs, và các mô hình thị giác khác.
  • Hiểu biết về mô hình phái sinh sâu (Deep Generative Model, DGMs) như GANs và VAEs, DMG và các ứng dụng hình ảnh, video
  • Các phương pháp học Few-shot và Zero-shot, tự học giám sát, và các kỹ thuật tối ưu hóa mô hình như tỉa & nén mô hình và tìm kiếm kiến trúc thần kinh.
  • Xây dựng và triển khai các project thực tế trong lĩnh vực Thị giác máy tính như nhận dạng chữ số viết tay, phát hiện ghi chú trong bức ảnh, nhận diện đối tượng trong ảnh tĩnh (người, vật), tracking qua video camera theo thời gian thực…
  • Khoá học sẽ cung cấp kiến thức nền tảng cũng như tiềm năng của Học sâu trong Thị giác máy tính để đưa ra các quyết định chiến lược từ đó mở rộng khả năng hiểu biết và phát triển sự nghiệp cá nhân.
  • Kỹ sư và chuyên viên phát triển ứng dụng AI, chuyên viên dữ liệu, hoặc sinh viên khoa học máy tính, trí tuệ nhân tạo, hoặc các ngành liên quan khác như kỹ thuật điện tử, toán học ứng dụng... mong muốn mở rộng và nâng cao kiến thức trong lĩnh vực Thị giác máy tính (Computer Vision) với Học sâu hoặc muốn áp dụng kiến thức vào các vấn đề thực tế.
  • Bất kỳ ai khác (nhà quản lý, chuyên gia tư vấn công nghệ, giáo viên, hoặc giảng viên, những người có đam mê về kỹ thuật Học sâu, đặc biệt là Thị giác máy tính).
  • Điều kiện cần khi tham gia khóa học: HV có kiến thức lập trình Python và Machine Learning (hoặc đã tham gia khóa học tương đương)
 

Sau khi hoàn thành khóa học, học viên có thể:

  • Nắm vững các khái niệm cơ bản và nâng cao về Học sâu và Thị giác máy tính, bao gồm các loại mô hình mạng nơ-ron, kỹ thuật tiền xử lý dữ liệu, và các phương pháp huấn luyện mô hình hiệu quả.
  • Nắm rõ quy trình phát triển, huấn luyện, kiểm thử và triển khai các mô hình Học sâu cho các ứng dụng Thị giác máy tính
  • Phân tích, tiền xử lý và chuẩn bị dữ liệu cho các dự án Thị giác máy tính một cách hiệu quả.
  • Tối ưu hóa và đánh giá hiệu suất của các mô hình học sâu bằng cách sử dụng các kỹ thuật như điều chỉnh siêu tham số và kiểm tra tính khả thi của mô hình
  • Sử dụng thành thạo các công cụ và thư viện phổ biến như TensorFlow, PyTorch, OpenCV, Keras khi thực hiện các dự án thực tế
  • Phát triển kỹ năng lập trình giúp xây dựng và triển khai các mô hình Học sâu trong Thị giác máy tính, từ việc xử lý dữ liệu, xây dựng mô hình, đến triển khai và tối ưu hóa.
  • Tự tin thử nghiệm và triển khai các mô hình học sâu vào các bài toán thực tế.
  • Tự tìm hiểu và cập nhật các công nghệ và phương pháp mới trong lĩnh vực Học sâu và Thị giác máy tính
  • Phát triển kỹ năng giải quyết vấn đề và tìm kiếm giải pháp trong quá trình làm việc
  • Phát triển tư duy phản biện và tìm kiếm giải pháp sáng tạo cho các bài toán Thị giác máy tính.
  • Cải thiện kỹ năng làm việc nhóm, hợp tác và trao đổi thông tin trong các dự án liên ngành.
  • Trang bị kỹ năng nghiên cứu và tự học, giúp HV tiếp tục phát triển và nâng cao kiến thức sau khi khóa học kết thúc.
 

 

  • Tổng số giờ: 45 giờ
  • Học phí: 5.800.000đ (có chế độ miễn giảm của mỗi khóa, xem chi tiết trong Thời Khóa Biểu)
  • Tổng quan về Học sâu và Thị giác máy tính
    • Lịch sử Thị giác máy tính
    • Định dạng hình ảnh
    • Diễn giải hình ảnh
    • Lọc tuyến tính
    • Hình ảnh trong miền tần số
    • Lấy mẫu ảnh
  • Phương pháp trích xuất đặc trưng hình ảnh
    • Phát hiện cạnh
    • Phát hiện các đốm màu và gốc
    • Tỷ lệ không gian, hình ảnh kim tự tháp, ngân hàng lọc hình ảnh
    • Dò tìm đặc trưng: SIFT và các biến thể
    • Phân đoạn hình ảnh
    • Các không gian đặc trưng khác
    • Hệ thống hình ảnh con người
  • Phương pháp biểu diễn và ghép đặc trưng hình ảnh
    • Ghép đặc trưng hình ảnh
    • Biến đổi Hough
    • Biểu diễn Bag-of-Words và VLAD
    • Ghép nối mô tả hình ảnh
    • Ghép nối kim tự tháp
  • Nền tảng và cải tiến các mô hình mạng Nơ-ron
    • Mạng nơ-ron
    • Mạng nơ-ron: lan truyền tiến (forward propagation) và lan truyền ngược (back propagation)
    • Giảm dần độ dốc (Gradient Descent) và các biến thể
    • Quy chuẩn hoá mạng nơ-ron
    • Cải tiến quá trình đào tạo mạng nơ-ron
  • Mạng nơ-ron tích chập (Convolutional Neural Networks, CNNs)
    • Giới thiệu CNNs
    • Thuật toán lan truyền ngược trong CNNs
    • Đánh giá kiến trúc mạng CNNs cho phân lớp hình ảnh
    • Những kiến trúc mạng CNNs gần đây
    • Tinh chỉnh mạng CNNs
    • Giải thích CNNs
  • Ứng dụng CNNs
    • Phát hiện đối tượng
    • Phân đoạn hình ảnh
    • Phát hiện gương mặt
    • Phát hiện tư thế và đám đông
    • Những nhiệm vụ khác
  • Mạng nơ-ron hồi quy (Recurrent Neural Networks, RNNs)
    • Giới thiệu RNNs
    • Lan truyền ngược trong RNNs
    • LSTMs (long short-term memory network) và GRUs (Gated recurrent units)
    • Hiểu video với CNNs và RNNs
  • Thị giác máy tính
    • Lưu ý trong các mô hình thị giác
    • Chú thích hình ảnh
    • Bên ngoài chú thích hình ảnh: Trực quan QA và Hộp thư thoại
    • Các mô hình thị giác khác
    • Mô hình chuyển đổi (transformers) và tự chú ý (self-attention)
  • Mô hình phái sinh sâu (Deep Generative Models, DGMs)
    • Giới thiệu DGMs
    • Mạng đối nghịch tạo sinh (Generative Adversarial Networks, GANs)
    • Variational autoencoder, VAEs
    • Kết hợp VAEs và GANs
    • DGMs
  • Cải thiện mô hình DGMs
    • Cải thiện GANs
    • DGMs trên nhiều miền
    • VAEs và sự tách rời
    • DGMs và các ứng dụng hình ảnh
    • DGMs và các ứng dụng video
  • Các vấn đề mở rộng khác
    • Phương pháp học Few-shot và Zero-shot
    • Học tự giám sát
    • Sự mạnh mẽ của GANs
    • Cắt tỉa và nén mô hình
    • Phương pháp tìm kiếm kiến trúc thần kinh
  • Đồ án cuối khóa
    • Phân tích đề bài gợi ý cách thực hiện
    • Triển khai quy trình thực hiện dự án
    • Thực hiện dự án
    • Báo cáo kết quả
 

Học viên thi đạt kết quả cuối môn học sẽ được cấp chứng nhận "Computer Vision with Deep Learning - Thị giác máy tính với Học sâu" do Trung Tâm Tin Học - Trường ĐH Khoa Học Tự Nhiên cấp.

ai
Trung Tâm Tin Học
ai
Trung Tâm Tin Học
Chào mừng bạn đến với Trung Tâm Tin Học.
Bạn đang cần hỗ trợ thông tin gì ạ? Hãy Chat ngay với chúng tôi nhé.