Khóa học Combo Python cơ bản + Python for Machine Learning, Data Science and Data Visualization
Khóa học Data Science Online

Database SQL and Data Collection for Data Science

  • Khóa học cung cấp cho học viên (HV) các kiến thức và kỹ năng cần thiết khi làm việc với cơ sở dữ liệu (database)
  • Trang bị cho HV những kiến thức nền tảng vững chắc về ngôn ngữ truy vấn (SQL): các loại truy vấn rút trích, thêm, xóa, cập nhật dữ liệu trong môi trường Data Science.
  • Hướng dẫn HV cách xây dựng và làm việc với CSDL trên Cloud (đám mây), truy cập CSDL với Python sử dụng DB-API
  • Cung cấp cho HV kiến thức phân tích dữ liệu với Python
  • Cung cấp cho HV kỹ năng thao tác với các loại database thông dụng như MySQL, Sqlite, MariaDB, PostgreSQL, SQL Server…
  • Trang bị cho HV kỹ năng sử dụng FugueSQL để truy vấn và trực quan dữ liệu, làm nền tảng cho việc thao tác với dữ liệu lớn (Big Data)
  • Hướng dẫn HV cách thu thập dữ liệu từ Facebook APIs sử dụng Facebook SDK Python Package
  • Trang bị cho HV kỹ năng thu thập dữ liệu từ Internet (Web Scraping)
  • Là khóa học thứ tư của chương trình “Data Science and Machine Learning Certificate
Sau khi hoàn thành khóa học, học viên sẽ đạt được các kỹ năng:
  • Áp dụng kiến thức về ngôn ngữ SQL trong việc sắp xếp và rút trích thông tin từ CSDL
  • Thực hiện các truy vấn có chọn lọc, nhóm, thống kê dữ liệu
  • Cập nhật dữ liệu trên bảng như thêm, xóa, cập nhật
  • Làm việc với các loại CSDL phổ biến như: MySQL, Sqlite, MariaDB, PostgreSQL, SQL Server…
  • Truy vấn dữ liệu với với FugueSQL
  • Thu thập dữ liệu từ Facebook APIs sử dụng Facebook SDK Python Package
  • Làm việc với CSDL trên Cloud
  • Thu thập dữ liệu từ Internet (Web Scraping)
  • Làm việc với cơ sở dữ liệu, công cụ và bộ dữ liệu trong thế giới thực
 
  • Thời lượng: 64 tiết (5 tuần), học trực tiếp trên máy
  • Học phí: 5.200.000 đ

 

  • Database
    • Giới thiệu Database
    • Phân biệt DDL (Data Definition Language) và DML (Data Manipulation Language)
    • Tạo Database instance trên Cloud/máy tính
  • Basic SQL
    • CREATE/DROP TABLE
    • SELECT
    • COUNT/DISTINCT/LIMIT
    • INSERT
    • UPDATE
    • DELETE
    • CONSTRAINT
    • WHERE AND/OR/BETWEEN/IN
  • Advanced SQL
    • String Patterns (%), Ranges
    • ORDER BY
    • GROUP BY, HAVING
    • Built-in Function, Date, Timestamps
    • Sub-query, Nested-select
    • Multiple table: dùng sub-query, implicit JOIN, JOIN operators (INNER JOIN, OUTER JOIN)
    • Sử dụng operations để làm việc với multiple tables: INNER JOIN, LEFT OUTER JOIN, RIGHT OUTER JOIN, FULL OUTER JOIN
    • UNION 
    • Các hàm cửa sổ trong truy vấn SQL
    • Pattern Matching
    • CTE và View
  • Truy cập Database với Python
    • Python và DB
      •   i. Ưu điểm của Python khi làm việc với DB
      •  ii. Mô hình truy cập
      • iii. SQL API
      • iv. API của các SQL-Based DBMS system
    • Sử dụng DB API
      •   i. Khái niệm DB-API
      •  ii. Khái niệm Python DB-API: Connection Ojbect, Cursor Object
      • iii. Connection method
      • iv. Cusor method
      •  v. Khái niệm DB cursor
      • vi. Sử dụng DB-API
    • Python code tạo table, tải dữ liệu và truy vấn dữ liệu
      •   i. CREATE, INSERT, QUERY 
      •  ii. Sử dụng pandas nhận dữ liệu từ table thông qua ipython-sql
      • iii. Sử dụng Python Variables trong SQL Statements
  • Phân tích dữ liệu với Python
    • Tải csv file vào database warehouse trên cloud
    • Làm việc với SQLite/PostGre SQL
  • Truy vấn dữ liệu với FugueSQL
    • Cài đặt và cấu hình FugueSQL
    • Cú pháp và các hàm sử dụng trong FugueSQL
    • Truy vấn dữ liệu từ các tập tin dữ liệu và các đối tượng như DataFrame, List…
    • Kết xuất và trực quan hóa dữ liệu từ FugueSQL
  • Thu thập dữ liệu từ Internet (Web Scraping)
    • Selenium
    • Scrapy
    • Beautifulsoup
  • Facebook API
    • Truy cập Facebook API
    • Phân loại Facebook API
    • Facebook dạng JSON
    • Sử dụng Facebook SDK Python Package
 

Học viên thi đạt kết quả cuối môn học sẽ được cấp chứng nhận "Database SQL and Data Collection for Data Science" do Trung Tâm Tin Học - Trường ĐH Khoa Học Tự Nhiên cấp.

LỊCH KHAI GIẢNG Xem thêm
Database SQL and Data Collection for Data Science - 64 tiết (5 tuần)
Học phí : 5.200.000 đ
LớpThời gianNgày khai giảngĐịa điểm học 
MDS4_275C7N5_ONThứ 7 - Chủ Nhật (13.30 - 17.30) + Thứ 5 (18.00 - 21.00)14/05/2022OnlineĐăng ký
CÁC MÔN HỌC LIÊN QUAN
CHƯƠNG TRÌNH ĐÀO TẠO