Môn học mới
Database SQL and Data Collection for Data Science

  • Hiểu khái niệm cơ bản và các loại cơ sở dữ liệu (quan hệ, NoSQL), cài đặt và thiết lập cơ sở dữ liệu
  • Biết cách sử dụng các câu lệnh SQL cơ bản và nâng cao để truy vấn, sắp xếp, lọc, và tổng hợp dữ liệu.
  • Biết cách kết nối và xử lý dữ liệu từ cơ sở dữ liệu trong Python.
  • Biết cách sử dụng thư viện FugueSQL để thao tác với tập tin. Xây dựng hàm tự định nghĩa (UDF) để xử lý tập tin.
  • Thành thạo các thao tác với thư viện BeautifulSoup và Selenium để thu thập dữ liệu từ website. Xử lý các nội dung thu thập được và lưu trữ.
  • Là khóa học thứ ba trong chương trình “Data Science and Machine Learning Certificate (Khoa học dữ liệu và Máy học)
 
  • Hiểu và vận dụng ngôn ngữ truy vấn SQL trong việc truy xuất dữ liệu phục vụ cho Khoa học dữ liệu
  • Hiểu và vận dụng các kỹ thuật trích xuất dữ liệu để thu thập dữ liệu từ các trang web
 
  • Thời gian: 5 tuần
  • Thời lượng: 40 giờ
  • Học phí: 5.200.000 đ

 

  • Giới thiệu về Database và SQL
    • Các khái niệm về cơ sở dữ liệu
    • Các loại cơ sở dữ liệu (quan hệ, NoSQL)
    • Cài đặt và thiết lập cơ sở dữ liệu (MySQL Server, MySQL Workbench).
  • Truy vấn SQL cơ bản
    • Truy vấn dữ liệu: SELECT, FROM
    • Lọc dữ liệu: WHERE
    • Giới hạn kết quả: LIMIT
    • Sắp xếp dữ liệu: ORDER BY
    • Gom nhóm dữ liệu: GROUP BY, HAVING
    • Các Built-in function trong SQL (String, Number, Datetime, Aggregate)
  • Truy vấn SQL nâng cao
    • Truy vấn con
    • Truy vấn nhiều bảng: INNER JOIN, OUTER JOIN, CROSS JOIN
    • Kết hợp dữ liệu truy vấn: UNION
    • Common Table Expression (CTEs)
    • View (bảng ảo)
    • Window Function 
  • Truy cập cơ sở dữ liệu với Python
    • Giới thiệu tổng quan, ưu điểm và mô hình truy cập từ Python
    • Các loại kết nối database: DB-API, Magic SQL
    • Chuyển kết quả dữ liệu truy vấn thành DataFrame
    • Mở rộng: Thao tác với cơ sở dữ liệu SQLite và PostgreSQL
  • Làm việc với thư viện FugueSQL
    • Giới thiệu, cài đặt thư viện FugueSQL
    • Thao tác đọc/ghi tập tin
    • Truy vấn dữ liệu
    • Aggregate Function
    • Window Function
    • Hàm tự định nghĩa (UDF) 
  • Thu thập dữ liệu với thư viện BeautifulSoup
    • Tổng quan về WebScraping
    • Cấu trúc cơ bản của HTML
    • Giới thiệu và cài đặt thư viện BeautifulSoup
    • Các thao tác xử lý trích xuất dữ liệu từ các website
    • Lưu kết quả thu thập vào các loại tập tin (CSV, JSON, SQLite...) 
  • Thu thập dữ liệu với thư viện Selenium
    • Giới thiệu và cài đặt thư viện Selenium
    • Các thao tác xử lý trích xuất dữ liệu từ các website
    • Tương tác với các sự kiện trên website: click, nhập liệu,...
    • Lưu kết quả thu thập vào các loại tập tin (CSV, JSON, SQLite...)
 

Học viên thi đạt kết quả cuối môn học sẽ được cấp chứng nhận "Database SQL and Data Collection for Data Science - Truy vấn và thu thập dữ liệu cho Khoa học dữ liệu"

 
LỊCH KHAI GIẢNG Xem thêm
Môn học mới

Học phí: 5.200.000đ - Nhận ƯU ĐÃI HỌC PHÍ khi ghi danh online + hoàn tất ​đến ngày 14/02/2025

 

LớpThời gianNgày khai giảngĐịa điểm học 
DL03_301S7N4_ONThứ 7 + Chủ Nhật (08.00 - 11.00) & Thứ 4 (18.00 - 21.00)22/02/2025OnlineĐăng ký
CÁC MÔN HỌC LIÊN QUAN
ai
Trung Tâm Tin Học
ai
Trung Tâm Tin Học
Chào mừng bạn đến với Trung Tâm Tin Học.
Bạn đang cần hỗ trợ thông tin gì ạ? Hãy Chat ngay với chúng tôi nhé.