BÁO CÁO ĐỒ ÁN TỐT NGHIỆP DATA SCIENCE – MACHINE LEARNING KHÓA 1
ngày 19-07-2020
Ngày 12/07/2020 vừa qua Trung tâm Tin học – Trường Đại học Khoa học Tự nhiên tổ chức buổi Báo cáo Đồ án Tốt nghiệp cho những HV khóa đầu tiên chương trình Data Science – Machine Learning.
Đây là những Học viên đã hoàn tất 6-8 môn học trong 1 năm với 8 đề tài được báo cáo, trong đó có 5 đề tài Data Science và 3 đề tài Machine learning. Tất cả các đề tài đều có tính ứng dụng cao từ các bài toán cần giải quyết tại đơn vị công tác của HV hoặc các bài toán thực tế cuộc sống.
Hội đồng gồm có Cô Lại Thị Hạnh – Phó Giám đốc Trung tâm Tin học, Cô Khuất Thùy Phương – Phó phòng Lập trình & Mạng, Thầy Nguyễn Quan Liêm – Giáo viên hướng dẫn chính các đồ án.
Mở đầu buổi báo cáo là một chủ đề khá hấp dẫn về chứng khoán, dự đoán giá chứng khoán - Predict Stock Price, do Học viên Nguyễn Huy Khoa thực hiện.
Với sự am hiểu về thị trường chứng khoán cộng với kiến thức Data Science, bạn Huy Khoa thể hiện rất tốt đồ án của mình, đồ án đã đưa ra những kết quả dự đoán khá chính xác về xu hướng giá cổ phiếu trong tương lai bằng cách áp dụng các kỹ thuật phân tích – dự đoán theo Time Series. Đề tài cho thấy rất rõ quá trình rút trích - xử lý dữ liệu, phân tích dữ liệu và áp dụng các công nghệ Machine Learning để phân tích kỹ thuật xu hướng giá cổ phiếu một cách tự động giúp mang lại các thông tin tham khảo giá trị với những người mới tham gia thị trường trước các quyết định quan trọng.
Tiếp theo là đề tài Dự đoán doanh thu - Predict Future Sales được báo cáo bởi bạn Lê Quang Nhiên – học viên chương trình Data Science Certificate. Với yêu cầu dự đoán xu hướng của doanh thu trong thời gian tới theo từng nhóm sản phẩm, đề tài đã thực hiện phân tích dữ liệu bán hàng theo nhiều góc nhìn khác nhau và sử dụng các kỹ thuật của Machine Learning để giải quyết, bạn đã hoàn thành khá tốt đề tài của mình.
Đề tài được ứng dụng cho doanh nghiệp muốn dự đoán doanh số và tối ưu hóa hàng tồn kho nhằm tăng lợi nhuận cho doanh nghiệp.
Anh Trần Nam Phong là người duy nhất bảo vệ cùng lúc 2 đồ án. Đồ án Data Science đầu tiên là Dự đoán giá trị lợi nhuận - Predict TOI(Total Overall Income) of Customer.
Đây là đề tài dựa trên nguồn dữ liệu thực tế và thực trạng doanh nghiệp của anh Nam Phong. TOI (Total Overall Income) là giá trị lợi nhuận của một khách hàng mang lại cho ngân hàng hàng năm thông qua các hoạt động của khách hàng như gửi tiết kiệm, các gói cho vay tiêu dùng, vay mua nhà, thu phí dịch vụ khách hàng,… Đề tài xây dựng mô hình dự đoán TOI trong tương lai cho đối tượng Khách hàng Cá nhân phục vụ cho chiến lược kinh doanh và phát triển của phòng khách hàng cá nhân để có các chiến lược phù hợp sau này.
Tiếp theo là phần báo cáo của bạn Trần Ngọc Tài với đề tài Telecom Churn Prediction để dự đoán tỷ lệ khách hàng hủy/ngừng sử dụng dịch vụ.
Đây là bài toán rất được quan tâm tại thực tế các doanh nghiệp viễn thông và như anh chia sẻ, lời giải cho bài toán này có thể đem lại lợi nhuận hàng tỉ đồng cho các doanh nghiệp trong lĩnh vực này.
Khi người dùng hủy đăng ký hoặc đóng tài khoản của họ, đó là một tổn thất doanh thu tiềm năng cho doanh nghiệp. Việc giữ chân khách hàng là điều vô cùng quan trọng, người ta chứng minh giảm tỷ lệ khách hàng hủy dịch vụ 5% có thể làm tăng lợi nhuận từ 25% đến 125%, điều này được thừa nhận là một ước tính khá thô, nhưng nó cho thấy việc giữ chân khách hàng nên là mối quan tâm lớn đối với các doanh nghiệp.
Đề tài cũng có thể ứng dụng tại các công ty Thẻ tín dụng, nhà cung cấp dịch vụ truyền hình, giải trí, internet, các công ty viễn thông.
Tiếp theo là một đề tài về mạng xã hội Twitter, tự động gán nhãn trạng thái Tweet Sentiment Extraction, của bạn Lê Khánh Trung - học viên lớp Data Science Certificate.
Với đề tài này, các tweet sẽ được phân tích và gán nhãn một cách tự động vào 1 trong 3 giá trị: tích cực, tiêu cực và bình thường. Đề tài được ứng dụng trong phân tích thái độ người dùng với một sản phẩm mới của công ty, dành cho các công ty có nhu cầu phân tích phản hồi của khách hàng đối với sản phẩm mới, chiến dịch truyền thông ….
Trong nhóm đề tài Machine Learning, Anh Trần Nam Phong chọn đề tài “Phân tích cảm xúc bình luận tiếng Việt trên trang Foody.vn”
Đồ án được thực hiện dành cho các doanh nghiệp cung cấp dịch vụ bán thực phẩm online, giúp thống kê được các bình luận tiêu cực và tích cực về quán ăn, các món ăn để từ đó đưa ra các biện pháp cải thiện chất lượng món ăn hoặc lựa chọn đơn vị cung cấp tốt hơn.
Cùng lúc thực hiện hai đề tài, với kiến thức vững chắc và phong cách trình bày tự tin, anh Nam Phong lại một lần nữa hoàn thành rất tốt phần báo cáo của mình.
Một đề tài tốt nghiệp Machine Learning được đầu tư rất nhiều từ giai đoạn thu thập đến phân tích, áp dụng Machine Learning là Nhận diện biển báo giao thông -Vietnam Traffic Signs Recognition, của bạn Nguyễn Trần Thịnh.
Đề tài được ứng dụng trong việc hỗ trợ tài xế quan sát các biển báo và đưa ra các thông báo phù hợp, giúp người tập lái xe ô tô làm quen với các loại biển báo trong quá trình tham gia giao thông, đặc biệt đối với mô hình xe tự lái.
Mặc dù khởi đầu không phải là dân CNTT nhưng với quyết tâm và kiên trì, bạn Trần Thịnh đã hoàn thành rất tốt chương trình Machine Learning đúng tiến độ, ứng dụng tốt trong việc vận dụng kiến thức, thể hiện qua đồ án tốt nghiệp Data Science và đồ án tốt nghiệp ở Trường của mình.
Đề tài cuối trong buổi báo cáo Tốt nghiệp lần này là một đề tài thú vị về âm nhạc - Tự động phân loại âm nhạc Music genre classification - của nhóm học viên Đặng Đinh Hữu Trí và Trình Nguyễn Anh Tuấn.
Đề tài được đưa ra nhằm giúp các trang ứng dụng nghe nhạc trực tuyến có thể gợi ý bản nhạc tiếp theo cho người dùng một cách tự động dựa trên phân tích sóng âm có thể loại tương đương.
Xuất phát là chuyên về điện tử nên nhóm đã không ngần ngại tìm cách tối ưu sao cho có thể triển khai ứng dụng chạy trên các máy cấu hình gọn nhẹ, hệ thống nhúng để có thể ứng dụng được trong nhiều lĩnh vực khác nhau.
Đề tài đã đưa ra những dự đoán chính xác về thể loại nhạc với thời gian cực kỳ ngắn, thể hiện những hiểu biết về chuyên môn và việc ứng dụng Machine Learning để giải quyết bài toán một cách hiệu quả.
Buổi Báo cáo Đồ án diễn ra tốt đẹp, các đề tài đều thể hiện tính ứng dụng cao trong thực tế và sự am hiểu về công nghệ, kỹ thuật của các bạn. Tuy thời gian thực hiện khá ngắn - 5 tuần nhưng các bạn đều rất tập trung, thực hiện đầy đủ quy trình cần thiết của một dự án Data Science - Machine Learning thực tế, thử nghiệm nhiều giải pháp có thể, đánh giá và chọn ra giải pháp tốt nhất làm giải pháp báo cao. Kết quả của đề tài rất thuyết phục và gây nhiều ấn tượng với Hội đồng và tất cả những bạn tham gia buổi báo cáo.
Chúc mừng tất cả các bạn đã hoàn thành tốt chương trình Data Science – Machine Learning tại Trung tâm Tin học – Trường Đại học Khoa học Tự nhiên và bước tiếp với nhiều cơ hội mới trong tương lai!
Trung tâm Tin học - Trường Đại học Khoa học Tự nhiên