Môn học mới
Database SQL and Data Collection for Data Science

  • Hiểu sâu về cơ sở dữ liệu quan hệ và truy vấn SQL, giúp bạn tương tác với dữ liệu một cách chuyên nghiệp.
  • Viết truy vấn SQL phức tạp và sử dụng FugueSQL, giúp tối ưu hóa quy trình làm việc với dữ liệu.
  • Thu thập dữ liệu từ các trang web bằng BeautifulSoup, Selenium, giúp tiếp cận dữ liệu một cách linh hoạt, mở rộng phạm vi dữ liệu cho dự án của bạn.
  • Tích hợp dữ liệu đã thu thập vào quy trình phân tích dữ liệu Python – bạn sẽ biết cách kết hợp dữ liệu từ nhiều nguồn khác nhau tạo ra bức tranh tổng quan, vận dung Python để giải quyết vấn đề hiệu quả hơn.
  • Xử lý các lỗi thường gặp trong việc thu thập dữ liệu, giúp bạn tiết kiệm thời gian và tài nguyên tối ưu nhất.
  • Là khóa học thứ ba trong chương trình “Data Science and Machine Learning Certificate (Khoa học dữ liệu và Máy học)
 
  • Hiểu và vận dụng ngôn ngữ truy vấn SQL trong việc truy xuất dữ liệu phục vụ cho Khoa học dữ liệu
  • Hiểu và vận dụng các kỹ thuật trích xuất dữ liệu để thu thập dữ liệu từ các trang web
 
  • Thời gian: 5 tuần
  • Thời lượng: 40 giờ
  • Học phí: 5.200.000 đ

 

  • Giới thiệu về Database và SQL
    • Giới thiệu về cơ sở dữ liệu
    • Các loại cơ sở dữ liệu (Quan hệ, NoSQL)
    • Tổng quan về SQL và tầm quan trọng của nó trong Khoa học dữ liệu
    • Cài đặt và Thiết lập cơ sở dữ liệu (MySQL + WorkBench, Big Query console).
  • Truy vấn SQL cơ bản
    • Truy vấn dữ liệu với SELECT, FROM
    • Lọc dữ liệu với WHERE
    • Giới hạn dữ liệu với LIMIT
    • Sắp xếp dữ liệu với ORDER BY
    • Gom nhóm và Lọc dữ liệu nhóm với GROUP BY, HAVING
    • Sử dụng các hàm trong SQL (string, number, datetime, aggregate)
  • Truy vấn SQL nâng cao
    • Truy vấn con
    • Truy vấn trên nhiều bảng (cross join)
    • Kết hợp truy vấn với UNION
    • Sử dụng truy vấn con tạo bảng dẫn xuất
    • Common Table Expressions (CTEs)
    • Window Functions
  • Truy cập Database với Python
    • Giới thiệu tổng quan, Ưu điểm và mô hình truy cập database từ Python
    • Kết nối database thông qua DB-API (Local Database, Cloud Database)
    • Tạo Connection và Cursor để kết nối và thực hiện truy vấn với Database (MySQL)
    • Magic SQL
    • Tổ chức lưu trữ dữ liệu từ truy vấn vào DataFrame
  • Làm việc với FugueSQL
    • Giới thiệu FugueSQL
    • Cài đặt và cấu hình FugueSQL.
    • Đọc/Ghi dữ liệu từ tập tin
    • Truy vấn dữ liệu với FugueSQL.
    • Aggregate Functions và Window Functions trong FugueSQL.
    • Hàm tự định nghĩa trong FugueSQL
  • Thu thập dữ liệu với BeautifulSoup
    • Tổng quan về Web Scraping
    • Cấu trúc cơ bản của trang HTML.
    • Cài đặt BeautifulSoup
    • Trích xuất dữ liệu từ trang web với BeautifulSoup.
    • Các xử lý trích xuất dữ liệu nâng cao trong BeautifulSoup: các trang HTML sử dụng nội dung động với Javascript và Ajax, trang web có phân trang
    • Xử lý dữ liệu trích xuất và lưu vào file (CSV, Excel, JSON)
  • Thu thập dữ liệu với Selenium
    • Tổng quan về Selenium.
    • Cài đặt và thiết lập môi trường Selenium.
    • Điều hướng các trang web với Selenium
    • Tương tác với các thành phần web (click, input).
    • Xử lý popup, alert và iframe, chụp ảnh màn hình
    • Xử lý Cookie và Sessions.
    • Trích xuất dữ liệu từ các trang web động với Selenium: Javascript và Ajax, trang web có phân trang.
 

Học viên thi đạt kết quả cuối môn học sẽ được cấp chứng nhận "Database SQL and Data Collection for Data Science - Truy vấn và thu thập dữ liệu cho Khoa học dữ liệu"

 
LỊCH KHAI GIẢNG Xem thêm
Môn học mới

Học phí: 5.200.000đ - Nhận ƯU ĐÃI HỌC PHÍ khi ghi danh online + hoàn tất ​đến ngày 26/02/2024

LÌ XÌ TẾT 100K: Nhập mã "lixi100" - nhận lộc đầu năm khi đăng ký đến hết ngày 26/02/2024

 

LớpThời gianNgày khai giảngĐịa điểm học 
DL03_292S7N5_ONThứ 7 - Chủ Nhật (08.00 - 11.00) + Thứ 5 (18.00 - 21.00)02/03/2024OnlineĐăng ký
CÁC MÔN HỌC LIÊN QUAN
ai
Trung Tâm Tin Học
ai
Trung Tâm Tin Học
Chào mừng bạn đến với Trung Tâm Tin Học.
Bạn đang cần hỗ trợ thông tin gì ạ? Hãy Chat ngay với chúng tôi nhé.