Báo cáo Đồ án Tốt nghiệp Data Science - Machine Learning Khóa 7

ngày 26-09-2021

Ngày 29/08/2021, Trung tâm Tin học – Trường Đại học Khoa học Tự nhiên tổ chức Báo cáo Đồ án Tốt nghiệp Data Science – Machine Learning khóa 7. Đây cũng là đợt hướng dẫn và bảo vệ đồ án online qua nền tảng Zoom lần thứ hai kể từ khi dịch Covid chuyển biến phức tạp tại TPHCM.
 
Với 5 tuần hướng dẫn online, có 18 đồ án được báo cáo. Hầu hết các đề tài đều có tính ứng dụng cao, là bài toán thực tế tại doanh nghiệp của các bạn học viên, bên cạnh đó cũng có một số bạn lựa chọn thử thách ở lĩnh vực mới.
 
Với bạn Nguyễn Hoàng Long, đề tài báo cáo tốt nghiệp khóa học Data Science của bạn cũng chính là khởi đầu cho dự án kinh doanh bạn đang ấp ủ. Bạn Long mong muốn tìm một địa điểm thích hợp để mở nhà hàng món ăn Việt Nam tại TPHCM, vì vậy bạn đã lựa chọn đề tài Ứng dụng Clustering và phân tích dữ liệu vào việc chọn địa điểm mở quán ăn Việt Nam tại TPHCM.
Bạn Hoàng Long có bước thực hiện thu thập và xử lý dữ liệu khá tốt, giúp cho đề tài cho ra kết quả tương đối chính xác. Đây cũng là một bài toán rất hay, dễ dàng ứng dụng thực tế, đồng thời cũng dễ dàng mở rộng với các mục tiêu kinh doanh khác. Một ý tưởng kinh doanh được phân tích đúng chất của thời đại công nghiệp số 4.0, chúc bạn Long thành công với dự án của mình và nhiều cơ hội mới trong lĩnh vực Data Science trong tương lai.
 
Báo cáo Đồ án tốt nghiệp Data Science - Machine Learning khóa 7
 
Bạn Hà Vũ Đình Khánh lựa chọn đề tài Dự đoán giá bất động sản tại khu vực TPHCM cho đợt Báo cáo Đồ án Tốt nghiệp Data Science của mình. Mục tiêu chính của đề tài giúp cho người mua nhà tìm kiếm được căn nhà phù hợp với tài chính, giúp người bán tham khảo nhằm tu sửa hay cải thiện một số chức năng của ngôi nhà để bán được với giá tốt hơn. 
Bạn Khánh đã tận dụng thời gian 5 tuần thực hiện đề tài khá tốt, làm đúng quy trình đã học với mô hình kết quả dự đoán khá chính xác.  
 
Báo cáo Đồ án tốt nghiệp Data Science - Machine Learning khóa 7
 
Bạn Đinh Trương Anh Phương thực hiện đề tài Phân loại khách hàng trả nợ vay, đây là đề tài được bạn lấy dữ liệu thực tế tại doanh nghiệp bạn công tác, dự định trong thời gian tới sẽ áp dụng vào mô hình doanh nghiệp của bạn. 
Thị trường vay tín chấp hiện nay phát triển rất nhanh chóng. Chính vì sự cạnh tranh mạnh mẽ mà các Công ty tài chính, Ngân hàng và các tổ chức tín dụng đã đưa ra các chính sách, hính thức cho vay dễ dàng, dẫn đến phát sinh nợ xấu. Bên cạnh đó, tình hình dịch bệnh kéo dài như hiện nay cũng góp phần gia tăng nợ xấu. Những điều này đã gây áp lực lên các tổ chức, cần phải đánh giá, phân loại khách hàng, đưa ra các chiến lược tác động nhằm đạt mục tiêu thu hồi nợ càng sớm càng tốt.
Nắm rõ những thách thức của bài toán thực tế, bạn Anh Phương đã đưa ra những tiêu chí rất cụ thể cho đề tài giúp dự đoán tiềm năng thanh toán của khách hàng với những kết quả rất khả quan, hoàn toàn có thể ứng dụng vào doanh nghiệp.
 
Báo cáo Đồ án tốt nghiệp Data Science - Machine Learning khóa 7
 
Bạn Đoàn Nguyễn Kim Cương lựa chọn đề tài Xây dựng Hệ thống gợi ý sản phẩm cho trang Thương mại điện tử để thực hiện báo cáo đồ án tốt nghiệp khóa học Data Science của mình. Một trong những chìa khóa thành công của sàn thương mại điện tử là mang lại trải nghiệm cá nhân hóa cho khách hàng khi mua hàng. Vì vậy đề tài này hết sức cần thiết và có tính ứng dụng thực tế cao. 
Mặc dù bạn Cương chỉ mới thực hiện đề tài trên nhóm sản phẩm PC-Laptop, đề tài vẫn được Hội đồng đánh giá có sự đầu tư, cộng với khả năng tự nghiên cứu tốt, đề tài của bạn đã cho ra kết quả gợi ý khá chính xác. Sau khi thực hiện đề tài này thành công, bạn Cương dự định sẽ mở rộng thêm với những nhóm ngành khác nhau.
 
Báo cáo Đồ án tốt nghiệp Data Science - Machine Learning khóa 7
 
Bạn Nguyễn Phúc Huy đang làm việc tại một doanh nghiệp khai thác dầu thô. Hiện nay, tại doanh nghiệp của bạn, việc kiểm tra sản lượng dầu ở từng giếng khoan không được diễn ra liên tục và tần suất không cố định, dẫn đến độ chính xác không cao. Trong khi đó, đối với công ty khai thác dầu khí, việc dự đoán sản lượng khai thác một cách chính xác là yếu tố tiên quyết để xây dựng kế hoạch làm việc và quản lý chi phí hiệu quả. 
Vì vậy, bạn Nguyễn Phúc Huy đã thực hiện đề tài Dự đoán sản lượng khai thác dầu, khí, nước bằng mô hình hồi quy và chuỗi thời gian để báo cáo tốt nghiệp cuối khóa Data Science. Mục tiêu đề tài là ước tính sản lượng khai thác ở từng giếng khoan, dự đoán sản lượng khai thác trong tương lai. 
Bạn đã có quá trình khai thác và xử lý dữ liệu hiệu quả, đưa ra nhiều mô hình để so sánh đối chiếu, chọn lựa được mô hình phù hợp nhất, giúp bài toán cho ra kết quả có độ chính xác cao, rất thích hợp để áp dụng vào doanh nghiệp. 
 
Báo cáo Đồ án tốt nghiệp Data Science - Machine Learning khóa 7
 
Bạn Hoàng Trung Kiên lựa chọn đề tài Ước tính thời gian vận chuyển của các đơn hàng trên sàn thương mại điện tử. Các nghiên cứu gần đây của nội bộ doanh nghiệp đã chỉ ra rằng, một trong những yếu tố làm ảnh hưởng đến trải nghiệm khách hàng khiến họ rời bỏ nền tảng chính là thời gian giao hàng. Bạn Trung Kiên thực hiện đề tài này với mong muốn giúp doanh nghiệp tìm ra những nhân tố ảnh hưởng đến thời gian giao hàng, từ đó giúp việc thông báo thời gian giao hàng dự kiến chính xác hơn.
Đề tài của Trung Kiên được Hội Đồng nhận xét biết cách đặt vấn đề và giải quyết vấn đề hiệu quả, phân tích rõ ràng chi tiết, kết quả đề tài được đánh giá khá tốt. Ngoài kiểm soát thời gian giao hàng thực tế, đề tài cũng có thể mở rộng một số ứng dụng khác như: ước tính và kiểm soát tỉ lệ hủy đơn, phát hiện và ngăn chặn đơn hàng gian lận, kiểm soát chi phí đơn hàng, kiểm soát chất lượng vận hành…
 
Báo cáo Đồ án tốt nghiệp Data Science - Machine Learning khóa 7
 
Bạn Ngô Quốc Bảo hiện đang làm tại công ty Gearvn - một doanh nghiệp chuyên kinh doanh các sản phẩm máy tính và thiết bị game, hàng ngày tiếp nhận và xử lý từ 300-400 đơn hàng gồm cả online và offline. Trung bình mỗi đơn hàng bị hủy gây tổn thất 78.000đ và nhiều chi phí cơ hội khác, thông kê một năm con số tổn thất sẽ lên đến hàng tỷ đồng.
Bạn Bảo thực hiện đề tài Successful order với mục tiêu dự đoán được đơn hàng có khả năng bị hủy, từ đó giúp Công ty chỉ tập trung nguồn lực vào các đơn hàng có khả năng thành công. Hơn nữa, dựa vào kết quả này có thể tìm hiểu nguyên nhân vì sao đơn hàng bị hủy và đề ra giải pháp cải thiện tình hình.
 
Báo cáo Đồ án tốt nghiệp Data Science - Machine Learning khóa 7
 
Bạn Võ Ngọc Đỗ Uyên đang làm việc cho một công ty chuyên về dinh dưỡng sữa cho người lớn và trẻ em. Từ trước đến nay vẫn luôn có một tỷ lệ khách hàng rời bỏ nhất định, làm ảnh hưởng đến doanh số chung của công ty.
Với mong muốn dự đoán khách hàng có thể rời bỏ nhãn hàng nhằm giữ chân khách hàng, bạn Đỗ Uyên đã thực hiện đề tài Customer Churn Prediction, dựa trên dữ liệu nhãn hàng sữa Ensure – một nhãn hàng đang chiếm tỷ trọng doanh số lớn nhất Công ty.
Đề tài được thực hiện dựa trên dữ liệu thực tế từ doanh nghiệp, cộng với khả năng tự nghiên cứu, tìm hiểu kỹ thuật mới của bạn Uyên đã giúp cho đề tài cho ra kết quả dự đoán khá chính xác. Đề tài là ứng dụng ban đầu mang lại nhiều kết quả khả quan, hứa hẹn có thể mở rộng ứng dụng trên những nhãn hàng khác, giữ chân khách hàng hiệu quả giúp Công ty tăng trưởng ổn định trên thị trường ngày càng cạnh tranh hiện nay.
 
Báo cáo Đồ án tốt nghiệp Data Science - Machine Learning khóa 7
 
Chúc mừng tất cả các bạn đã hoàn thành tốt chương trình Data Science – Machine Learning tại Trung tâm Tin học – Trường Đại học Khoa học Tự nhiên và bước tiếp với nhiều cơ hội mới, thành công trong tương lai.
 
Trung tâm Tin học - Trường Đai học Khoa học Tự nhiên