ngày 29-11-2021
Ngày 14/11/2021, Trung tâm Tin học – Trường Đại học Khoa học Tự nhiên tổ chức Báo cáo Đồ án Tốt nghiệp Data Science – Machine Learning khóa 8. Trong khóa này, tất cả học viên đều tham gia làm đồ án vào bảo vệ bằng hình thức Online qua Zoom.
Với 5 tuần hướng dẫn online, có 12 đồ án được báo cáo. Hầu hết các đề tài đều có tính ứng dụng cao, là những bài toán thực tế tại doanh nghiệp của học viên và những bài toán thử thách ở các lĩnh vực mới.
Đề tài Sentiment Analysis for E-Commer của bạn Lữ Hồng Châu là một trong những đề tài được Hội đồng chấm thi đánh giá khá cao. Dựa trên dữ liệu nhóm ngành Thời trang từ trang thương mại điện tử Shopee, Hồng Châu xây dựng hệ thống nhằm phân loại phản hồi của khách hàng thành 3 nhóm: tích cực, tiêu cực và trung tính. Những dữ liệu này sẽ giúp cho doanh nghiệp hiểu được ý kiến đánh giá khách hàng, cải thiện chất lượng sản phẩm, dịch vụ.
Đồ án của Hồng Châu có sự đầu tư, thu thập dữ liệu tương đối đầy đủ, xử lý dữ liệu kỹ càng, demo rõ ràng, cho ra kết quả khá chính xác.
Lựa chọn đề tài Sentiment Analysis for E-Commer giống với Hồng Châu, bạn Nguyễn Thị Kim Oanh cũng nhận được nhiều phản hồi tích cực từ Hội đồng chấm thi và Giáo viên hướng dẫn. Kim Oanh dựa trên dữ liệu nhóm ngành Thời trang nữ trên trang thương mại điện tử Tiki, phân loại phản hồi khách hàng thành 3 nhóm: Tích cực, tiêu cực và trung tính.
Nhờ xử lý dữ liệu kỹ càng kết hợp với sử dụng mô hình phù hợp, phần demo của đề tài cho kết quả khả quan, độ chính xác cao
Tiếp theo là đề tài Dự đoán doanh thu bán hàng theo giờ của bạn Phạm Thị Quỳnh Anh. Quỳnh Anh dựa trên dữ liệu thực tế từ doanh nghiệp bạn đang công tác. Đây là một công ty bán lẻ kinh doanh theo mô hình bán hàng trên truyền hình – TV Home Shopping. Công ty hợp tác với Đài truyền hình để sở hữu một kênh riêng, phát sóng 24/7 giới thiệu sản phẩm của công ty. Khách hàng sẽ mua hàng qua điện thoại.
Với đề tài này, Quỳnh Anh mong muốn dự đoán doanh số bán hàng của các sản phẩm theo từng giờ phát sóng, từ đó giúp cho Bộ phận Kế hoạch phát sóng lên kế hoạch hiệu quả, bộ phận kho hàng và logistic đẩy nhanh thời gian xuất kho, giảm thời gian giao hàng đến tay khách hàng.
Mặc dù dữ liệu được sử dụng trong thời gian ảnh hưởng của đại dịch Covid-19, nhưng kết quả đề tài khá khả quan, độ chính xác tương đối cao. Ngoài ra, trong tương lai, bạn sẽ mở rộng đề tài theo nhiều hướng khác nhau để tăng độ chính xác, dự đoán đúng doanh thu hơn.
Bạn Nguyễn Minh Nhật đang công tác trong một doanh nghiệp làm dịch vụ cung ứng nhiên liệu hàng không (Jet fuel), bạn lựa chọn đề tài MOPS Price Prediction – một đề tài rất cần thiết cho tình hình doanh nghiệp hiện tại của bạn, hỗ trợ doanh nghiệp có thêm thông tin để có những quyết định kinh doanh phù hợp.
MOPS là giá trung bình dựa trên giá dầu của thị trường Singapore được công bố bởi Platts – nhà cung cấp thông tin về năng lượng toàn cầu, dầu mỏ, khí đốt và nông nghiệp, cũng là một bộ phận của tập đoàn toàn cầu S&P Global. Việc dự đoán xu hướng giá MOPS giúp doanh nghiệp xây dựng giá bán cho khách hàng, đồng thời có những chiến lược mua nhiên liệu vào phù hợp.
Với nguồn dữ liệu từ doanh nghiệp và sự đầu tư cho đề tài, nghiên cứu thử nghiệm nhiều mô hình để chọn ra mô hình phù hợp nhất, Minh Nhật đã thu về kết quả dự đoán giá trong vòng 15 ngày làm việc tới khá chính xác, giúp ích được rất nhiều cho doanh nghiệp.
Ngoài các đề tài trên, các đề tài khác cũng đã nhận được nhiều phản hồi, góp ý từ Thầy Cô chuyên môn và các bạn tham dự buổi báo cáo online. Mỗi đề tài là một bài toán thử thách, các bạn có cơ hội hệ thống hóa kiến thức đã học và áp dụng trọn vẹn các bước vào một tình huống cụ thể, từ giai đoạn thu thập, xử lý đến phân tích và ứng dụng các mô hình Machine Learning.
Chúc mừng tất cả các bạn đã hoàn thành tốt chương trình Data Science – Machine Learning tại Trung tâm Tin học – Trường Đại học Khoa học Tự nhiên và bước tiếp với nhiều cơ hội mới, thành công trong tương lai.
Trung tâm Tin học - Trường Đại học Khoa học Tự nhiên