Khóa học React Native
Khóa học Data Pre-Processing and Analysis
Khóa học Deep Learning với Python
Lịch khai giảng lập trình và CSDL
Tổng khai giảng khóa học Lập trình và CSDL
Khóa học lập trình viên Python
Khóa học Toán và thống kế
Khóa học Databases and SQL for Data Science - Trung Tâm Tin Học ĐH KHTN
Machine Learning Certificate

Python for Machine Learning, Data Science & Data Visualization (Python cho máy học, Khoa học dữ liệu và Trực quan hóa dữ liệu)

  • Khóa học cung cấp cho học viên (HV) kiến thức tổng quát về Data Science, một trong những chuyên ngành “hot” của thế kỷ 21.
  • Giúp HV trang bị những kiến thức lập trình và trực quan hóa dữ liệu nền tảng, quan trọng, làm tiền đề cho việc tìm hiểu các kiến thức Machine Learning, Data Science sau này.
  • Hướng dẫn HV cách thu thập dữ liệu, khám phá, phân tích, thống kê tạo ra các báo cáo thông qua việc sử dụng các bộ thư viện, công cụ mạnh mẽ, mã nguồn mở như Python, Jupyter Notebooks, Numpy, Pandas …
  • Hướng dẫn HV cách trích xuất và trình bày dữ liệu dưới dạng có ý nghĩa thông qua nhiều kỹ thuật trình bày dữ liệu một cách trực quan trong Python như Matplotlib, Seaborn và Folium. 
  • Ngoài ra học viên còn được giới thiệu các công cụ trực quan hóa dữ liệu khác như Google Charts, IBM Watson Analytics.
  • Thực hiện các project cụ thể trong bối cảnh giải quyết các vấn đề khoa học dữ liệu hấp dẫn
  • Là khóa học thứ hai trong chương trình “Machine Learning Certification
  • Là khóa học thứ hai trong chương trình “Data Science Certification
 
 
Sau khi hoàn thành khóa học, học viên sẽ đạt được các kỹ năng:
  • Nắm được quy trình làm việc cơ bản của Data Science
  • Vận dụng linh hoạt các bộ thư viện, công cụ như Python, Jupyter Notebooks, Numpy, Pandas, Matplotlib, Seaborn, Folium… trong việc giải quyết các bài toán thực tế
  • Hiểu và vận dụng cách tìm dữ liệu, xây dựng câu hỏi nghiên cứu, sử dụng các công cụ và kỹ thuật tìm ra câu trả lời
  • Thực hiện phân tích thống kê cơ bản 
  • Vận dụng công cụ để trực quan hóa dữ liệu: trích xuất thông tin, hiểu rõ hơn về dữ liệu và đưa ra quyết định hiệu quả hơn.
 

Tổng quan Data Science

  • Giới thiệu Data Science
  • Quy trình của Data Science
  • Giá trị của việc tìm hiểu Data Science
  • Lý do chọn ngôn ngữ lập trình Python

Jupyter Notebook

  • Giới thiệu, lý do sử dụng Jupyter Notebook
  • Cài đặt và cấu hình
  • Sử dụng Jupyter Notebook
  • Markdown Text: cách sử dụng, cú pháp

Numpy

  • Giới thiệu, lý do sử dụng Numpy
  • Ndarray: mảng một chiều, hai chiều, tạo mảng, index, data type, operation
  • Thao tác trên Ndarray: Statictical, sorting, set operation, broadcasting

Pandas

  • Giới thiệu, lý do sử dụng Pandas
  • Series
  • Dataframe
  • Panel
  • Thao tác trên Pandas
i. I/O – Đọc ghi dữ liệu (Data Ingestion)
ii. Làm sạch, tinh chỉnh dữ liệu (Data Cleaning)
iii. Trực quan hóa dữ liệu (Data Visualization)
iv. Thống kê dữ liệu (Descriptive Statistics)
v. Phương thức thao tác trên dữ liệu (Frequent Data Operations)
vi. Gộp dữ liệu (Merging Dataframe)
vii. Phương thức thao tác trên String (Frequent Data Operations)
viii. Đổi thời gian (Parsing Timestamps)

Data Visualization

  • Giới thiệu các công cụ trực quan
  • Vai trò của trực quan hóa dữ liệu (Data Visualization)
  • Quy trình tạo biểu đồ

Tổng quan Matplotlib

  • Giới thiệu Matplotlib
  • Line plot
  • Các thành phần trên biểu đồ: axes, text, legend, label, font, color, annotation…

Trực quan hóa cơ bản với Matplotlib

  • Area plot, Histogram
  • Bar chart, Pie chart
  • Box plot, Scatter plot
  • Plotting cell phone data
  • Waffle chart với pywaffle library
  • Word clouds

Trực quan hóa nâng cao với Seaborn

  • Giới thiệu Seaborn 
  • Seaborn style, Color, color palettes, axes, anotation
  • Multiple plot, Stripplot, Swarmplot
  • Boxplot, Violinplot, Lvplot
  • Barplot, pointplot, countplot
  • Distplot, Distribution plot
  • Rug plot và kde shading
  • Regression plot, Residual plot
  • Bining data
  • Matrix plot
  • Heat map
  • Vẽ biểu đồ trên Data Aware Grids
i. FaceGrid
ii. Factor plot và Lmplot
iii. PairGrid và Pairplot
iv. JointGrid và Jointplot
v. Jointplot và regression

Trực quan hóa không gian địa lý 

  • Giới thiệu Folium
  • GeoDataFrame
  • Geometry
  • GeoJSON
  • GeoSeries
  • Map và Marker
  • Heatmap
  • Choropleth
  • Tạo map và trực quan hóa không gian địa lý

Các công cụ trực quan hóa dữ liệu khác

  • Google Charts
  • IBM Watson Analytics
 

Học viên thi đạt kết quả cuối môn học sẽ được cấp chứng chỉ "Python for Machine Learning, Data Science & Data Visualization" do Trung Tâm Tin Học - Trường ĐH Khoa Học Tự Nhiên cấp.

LỊCH KHAI GIẢNG Xem thêm
Python for Machine Learning, Data Science & Data Visualization (Python cho máy học, Khoa học dữ liệu và Trực quan hóa dữ liệu) - 48 tiết (5 tuần)
Học phí : 4.100.000 đ
LớpThời gianNgày khai giảngĐịa điểm học 
LDS2_251S24Thứ 2 + Thứ 4 (08.00 - 11.30)22/07/2019137E Nguyễn Chí Thanh, Q.5Đăng ký
LDS2_251T26Thứ 2 + Thứ 6 (17.45 - 21.15)22/07/2019137E Nguyễn Chí Thanh, Q.5Đăng ký
LDS2_251S7NThứ 7 (07.30 - 11.30) + Chủ Nhật (07.30 - 11.30)27/07/2019137E Nguyễn Chí Thanh, Q.5Đăng ký
LDS2_251C7NThứ 7 (13.30 - 17.30) - Chủ Nhật (13.30 - 17.30)27/07/2019137E Nguyễn Chí Thanh, Q.5Đăng ký
CÁC MÔN HỌC LIÊN QUAN
CHƯƠNG TRÌNH ĐÀO TẠO