Khóa học Lập trình R cho Khoa học dữ liệu
Khóa học Big Data in Machine Learning - Trung Tâm Tin Học ĐH KHTN
Khóa học React Native
Khóa học Deep Learning với Python
Lịch khai giảng lập trình và CSDL
Khóa học lập trình viên Python
Khóa học Databases and SQL for Data Science - Trung Tâm Tin Học ĐH KHTN
Machine Learning Certificate

Data Science Certificate

  • Data Science (Khoa học dữ liệu) được xếp hạng là một trong những ngành nghề “hot” nhất trong Cách mạng công nghiệp 4.0 vì thế nhu cầu về nguồn nhân lực trong lĩnh vực này đang bùng nổ. Đây là một lĩnh vực mới và thú vị, đòi hỏi các cá nhân phải phù hợp với vai trò Data Science cụ thể và phải kết hợp được với nhau để giải quyết các vấn đề tiên tiến. Để đáp ứng các yêu cầu này, Trung Tâm Tin Học triển khai chương trình “Data Science Certificate”.
  • Chương trình được thiết kế bao gồm 8 khóa học cung cấp cho học viên (HV) các kiến thức và kỹ năng để sẵn sàng cho công việc mới bao gồm nhiều chủ đề Data Science như: Fundamentals of Python; Python for Machine Learning, Data Science and Data Visualization; Mathemetics and Statistics for Data Science; Databases and SQL for Data Science; Data Pre-processing and Analysis, Machine Learning with Python; R Programming Language for Data Science; Big Data in Machine Learning.
  • HV được hướng dẫn thực hành trên những bộ công cụ và thư viện mới nhất và các bộ dữ liệu thực tế.
  • HV được hướng dẫn làm việc trên Cloud (đám mây), Github, chia sẻ tài nguyên và phối hợp làm việc.
  • Cung cấp danh mục các dự án Data Science thực tế cho HV thực hành và trải nghiệm giúp HV tự tin để bắt đầu một nghề nghiệp thú vị trong Data Science.
  • Sau khi hoàn thành chương trình học, ngoài việc nhận được chứng chỉ “Applied Data Science Certificate” của ĐH Quốc Gia TP.HCM, HV còn có thể đăng ký và hoàn thành các khóa học online một cách dễ dàng và nhận được những chứng chỉ cũng như huy hiệu công nhận trình độ về Data Science có giá trị quốc tế.
  • Tự tin ứng tuyển vào các vị trí Data Science khác nhau của các doanh nghiệp, công ty trong và ngoài nước
  • Sinh viên các trường Đại học, Cao đẳng
  • Bất kỳ ai quan tâm đến việc phát triển các kỹ năng và kinh nghiệm để theo đuổi sự nghiệp trong lĩnh vực Data Science và Machine Learning.
  • Điều kiện cần khi tham gia khóa học: HV có kiến thức tin học văn phòng và sử dụng Internet

 

Sau khi hoàn thành khóa học, học viên sẽ đạt được các kỹ năng:

  • Lập trình bằng NNLT Python, R
  • Sử dụng thành thạo các tools, librarys, framework phục vụ cho Data Science
  • Hiểu và vận dụng được các bước trong quy trình triển khai dự án Data Science
  • Trích xuất thông tin, hiểu rõ hơn về dữ liệu, trình bày dữ liệu dưới dạng có ý nghĩa và đưa ra quyết định hiệu quả hơn.
  • Thu thập dữ liệu, tiền xử lý dữ liệu, khám phá, phân tích, thống kê tạo ra các báo cáo
  • Hiểu các kiến thức thức cần thiết về toán, xác suất thống kê dành cho Data Science
  • Vận dụng các thư viện toán, xác suất thống kê của Python để giải quyết các vấn đề Data Science
  • Nắm được các khái niệm CSDL quan hệ, hiểu và áp dụng kiến ​​thức nền tảng của ngôn ngữ SQL, thực hiện truy cập SQL trong môi trường Data Science
  • Làm việc với CSDL trên Cloud, thu thập dữ liệu từ APIs
  • Khám phá nhiều loại dữ liệu khác nhau
  • Linh hoạt áp dụng các kỹ thuật tiền xử lý dữ liệu cho từng bộ dữ liệu có đặc trưng khác nhau, yêu cầu khai thác khác nhau
  • Biết cách phân tích dữ liệu trong Python, dự đoán xu hướng trong tương lai từ dữ liệu
  • Hiểu và áp dụng các thuật toán Machine Learning cho các vấn đề, yêu cầu khác nhau
  • Vận dụng và triển khai các thuật toán quan trọng thuộc nhóm Supervised Learning và Unsupervised Learning trong việc giải quyết các vấn đề thực tế như phân loại, dự đoán các xu thế, xu hướng, phân cụm dữ liệu, gợi ý đề xuất…
  • Hiểu đặc điểm của các thuật toán, framework và công nghệ khác nhau.
  • Hiểu và vận dụng các công nghệ trong Big Data: cách lưu trữ, quản lý, xử lý và phân tích dữ liệu lớn để mang lại các số liệu theo yêu cầu của hoạt động doanh nghiệp
  • Làm việc với Spark, Big Data Technology mới nhất
  • Trang bị các kiến thức và kỹ năng làm việc với PySpark (Python package tích hợp Spark dùng để thực hiện tính toán song song với các bộ dữ liệu lớn) như PySpark RDD’s, PySpark DataFrame, PySpark SQL, PySpark Mllib, PySpark Streaming…
  • Làm việc trên Cloud, Github, HDFS files…

 

  • Thời gian: 1 năm 
  • Thời lượng: 437 tiết học trên máy + 67 tiết làm đồ án tốt nghiệp
  • Học phí: đóng trọn khóa là 29.000.000đ (tổng học phí đóng từng phần là 38.000.000 đ) 
  • Course 1: Fundamentals of Python (Lập trình Python cơ bản)
    • Kiến thức nền tảng về Python – một ngôn ngữ lập trình cấp cao, thông dịch, hướng đối tượng và đa mục đích
    • Sử dụng các cấu trúc trong ngôn ngữ lập trình Python để xây dựng ứng dụng
    • Nắm vững và sử dụng các kiểu dữ liệu, toán tử, cấu trúc điều khiển, cấu trúc lặp để giải quyết các bài toán
    • Sử dụng các thư viện Number, String, Date & Time để xử lý số, chuỗi và thời gian
    • Làm việc với List, Tuple và Dictionary để lưu trữ và xử lý danh sách các phần tử.
    • Tạo và sử dụng các phương thức, module/package giúp tái sử dụng code
    • Làm việc với tập tin và thư mục với File I/O
    • Rèn luyện và phát triển kỹ năng lập trình, tư duy logic.
    • Xây dựng nền tảng cơ bản vững chắc trong ngôn ngữ lập trình Python tạo tiền đề cho việc học các kiến thức lập trình
  • Course 2: Python For Machine Learning, Data Science and Data Visualization (Python cho Máy học, Khoa học dữ liệu và Trực quan hóa dữ liệu)
    • Kiến thức tổng quát về Data Science, một trong những chuyên ngành “hot” của thế kỷ 21.
    • Cách thu thập dữ liệu, khám phá, phân tích, thống kê tạo ra các báo cáo thông qua việc sử dụng các bộ thư viện, công cụ mạnh mẽ, mã nguồn mở như Python, Jupyter Notebooks, Numpy, Pandas …
    • Cách trích xuất và trình bày dữ liệu dưới dạng có ý nghĩa thông qua nhiều kỹ thuật trình bày dữ liệu một cách trực quan trong Python như Matplotlib, Seaborn và Folium.
    • Tìm hiểu các công cụ trực quan hóa dữ liệu khác như Google Chart, IBM Watson Analytics.
    • Vận dụng cách tìm dữ liệu, xây dựng câu hỏi nghiên cứu, sử dụng các công cụ và kỹ thuật tìm ra câu trả lời và đưa ra quyết định hiệu quả hơn
    • Thực hiện phân tích thống kê cơ bản
    • Thực hiện các project cụ thể trong bối cảnh giải quyết các vấn đề khoa học dữ liệu hấp dẫn
  • Course 3: Mathematics and Statistics for Data Science (Toán và Thống Kê cho Khoa học dữ liệu)
    • Các kiến thức cần thiết về toán dành cho Data Science như Đại số tuyến tính (Linear Algebra), Giải tính (Calculus), Gradient Descent, Phương trình vector ma trận (Matrix-Vector Equations), Matrix Factorization, Eigenvalues và Eigenvectors, Singular Value Decomposition (SVD), Phân tích thành phần chính (Principal Component Analysis - PCA)
    • Các kiến thức cần thiết xác suất thống kê dành cho Data Science như Thống kê mô tả (Descriptive Statistics), Xác suất (Probability), Thống kê suy luận (Inferential Statistics), Ước lượng (Estimation), Tương quan (Correlation)
    • Vận dụng các thư viện toán, xác suất thống kê của Python để giải quyết các vấn đề về khoa học dữ liệu.
    • Thực hiện phân tích thống kê, đưa ra nhận xét trên những bộ dữ liệu thực tế
  • Course 4: Databases and SQL for Data Science (Cơ sở dữ liệu và Truy vấn cho Khoa học dữ liệu)
    • Các kiến thức và kỹ năng cần thiết khi làm việc với cơ sở dữ liệu (database)
    • Kiến thức nền tảng vững chắc về ngôn ngữ truy vấn (SQL): các loại truy vấn rút trích, thêm, xóa, cập nhật… dữ liệu trong môi trường Data Science
    • Xây dựng và làm việc với CSDL trên Cloud (đám mây), truy cập CSDL với Python sử dụng DB-API
    • Thu thập dữ liệu từ Twitter APIs sử dụng Tweepy Python Package
    • Phân tích dữ liệu với Python
    • Làm việc với cơ sở dữ liệu thực, công cụ khoa học dữ liệu thực và bộ dữ liệu trong thế giới thực
  • Course 5: Data Pre-processing and Analysis (Tiền xử lý và phân tích dữ liệu)
    • Các kiến thức và kỹ năng cần thiết khi thực hiện việc tiền xử lý và phân tích dữ liệu.
    • Kỹ thuật khai thác dữ liệu, chuyển đổi dữ liệu thô thành dữ liệu có định dạng dễ hiểu
    • Cách chuẩn bị dữ liệu để phân tích, thực hiện thống kê, tạo trực quan hóa dữ liệu có ý nghĩa
    • Các thư viện tiền xử lý và phân tích dữ liệu mạnh mẽ và ưu việt của Python như Numpy, Scipy, Pandas, Matplotlib, Seaborn…
    • Quy trình quản lý phân tích dữ liệu hiệu quả
    • Sử dụng thư viện mã nguồn mở sklearn để triển khai một số thuật toán Machine Learning giúp xây dựng các mô hình thông minh và đưa ra các dự đoán tuyệt vời
    • Tích hợp kết quả thống kê để tạo các báo cáo, thuyết trình phân tích dữ liệu mạch lạc, thuyết phục
  • Course 6: Machine Learning with Python (Máy học với Python)
    • Kiến thức nền tảng, cần thiết về Machine Learning, một nhánh rất “hot” của Trí tuệ nhân tạo (AI)
    • Sử dụng các bộ thư viện, công cụ mạnh mẽ, mã nguồn mở như Python, Jupyter Notebooks, Numpy, Pandas, Matplotlib, sklearn… dành cho Machine Learning
    • Kiến thức và kỹ năng vận dụng và triển khai các thuật toán quan trọng thuộc nhóm Supervised Learning như Logistic Regression, Linear Regression, Naïve Bayes, K-Nearest Neighbors (KNN), Decision Tree, Random Forest, Support Vector Machine (SVM), Boosting và AdaBoost, XGBoost với Python
    • Kiến thức và kỹ năng vận dụng và triển khai các thuật toán quan trọng thuộc nhóm Unsupervised Learning như K-Means clustering, Hierarchical Clustering, Apriori, Equivalence Class Clustering and bottom up Lattice Traversal (ECLAT), Gaussian Mixture Models (GMM), Dimensionality Reduction với Principal Component Analysis (PCA), Locally Linear Embedding (LLE) với Python, Time Series với ARIMA, HoltWinters
    • Vận dụng các thuật toán Machine Learning trong việc giải quyết các vấn đề thực tế, cụ thể
    • Xây dựng nền tảng vững chắc về Machine Learning với Python, tạo tiền đề cho việc tìm hiểu kiến thức về Deep Learning.
  • Course 7: R programming language for Data Science (Lập trình R cho Khoa học dữ liệu)
    • Các kiến thức nền tảng và những kỹ năng cần thiết để có thể thực hiện việc phân tích, thống kê, biểu diễn đồ họa và báo cáo bằng R – một ngôn ngữ lập trình luôn đứng trong “TOP TEN” các ngôn ngữ lập trình được sử dụng nhiều và phổ biến nhất .
    • Sử dụng các cấu trúc trong ngôn ngữ lập trình R để giải quyết các bài toán
    • Vận dụng các cấu trúc điều kiện, cấu trúc lặp, function
    • Sử dụng các thư viện có sẵn của R để thực hiện các công việc tính toán, thống kê
    • Nắm vững và vận dụng các kiểu dữ liệu String, Vector, List, Matric, Array, Data Frame, Object và Class
    • Làm việc với các kiểu dữ liệu tập tin như txt file, CSV file, Excel file, XML file, JSON file
    • Thiết lập các Chart và Graph, trực quan hóa dữ liệu
    • Tiền xử lý dữ liệu (data preprocessing)
    • Lập trình thống kê và báo cáo với các built-in function trong R
    • Áp dụng một số thuật toán Machine Learning trong việc phân loại (classification), dự đoán (regression) và phân nhóm dữ liệu (clustering), dự đoán dữ liệu Time Series…
  • Course 8: Big Data in Machine Learning (Dữ liệu lớn trong Máy học)
    • Các công nghệ trong Big Data: cách lưu trữ, quản lý, xử lý và phân tích dữ liệu lớn để mang lại các số liệu theo yêu cầu của hoạt động doanh nghiệp
    • Làm việc với Spark, Big Data Technology mới nhất
    • Trang bị các kiến thức và kỹ năng làm việc với PySpark (Python package tích hợp Spark dùng để thực hiện tính toán song song với các bộ dữ liệu lớn) như PySpark RDD’s, PySpark DataFrame, PySpark SQL, PySpark Mllib, PySpark Streaming
    • Áp dụng Machine Learning với Big Data
  • Capstone Project – Đồ án tốt nghiệp (50 giờ)

Học viên thi đạt kết quả cuối môn học sẽ được cấp chứng chỉ "Applied Data Science" do ĐH Quốc gia TPHCM cấp.

LỊCH KHAI GIẢNG Xem thêm
Data Science Certificate - 437 tiết học+ 67 tiết đồ án
Học phí : 29.000.000 đ
  • Điều kiện cần khi tham gia khóa học: HV có kiến thức tin học văn phòng và sử dụng Internet
LớpThời gianNgày khai giảngĐịa điểm học 
DS00_256Liên hệ số Hotline 0914 024 357 để được tư vấn kỹ hơn về lịch học16/03/2020137E Nguyễn Chí Thanh, Q.5Đăng ký
CÁC MÔN HỌC LIÊN QUAN
CHƯƠNG TRÌNH ĐÀO TẠO