Báo cáo đồ án tốt nghiệp Data Science – Machine Learning Khóa 9
ngày 05-01-2022
Ngày 19/12/2021, Trung tâm Tin học – Trường Đại học Khoa học Tự nhiên tổ chức Báo cáo Đồ án Tốt nghiệp Data Science – Machine Learning khóa 9. Trong khóa này, tất cả học viên đều tham gia làm đồ án và bảo vệ bằng hình thức Online qua Zoom.
Với 5 tuần hướng dẫn online đã có 18 đồ án được trình bày trong buổi báo cáo. Hầu hết các đề tài đều có tính ứng dụng cao, là những bài toán thực tế tại doanh nghiệp của học viên hoặc là những bài toán thử thách ở các lĩnh vực mới.
Học viên Nguyễn Kim Thành thực hiện đề tài “Tích mã tự động của hệ thống quản lý cuộc gọi khách hàng”. Đây là đề tài vừa là Đồ án Tốt nghiệp Machine Learning tại Trung tâm, vừa là đề tài Kim Thành dự định sẽ áp dụng tại doanh nghiệp nơi bạn đang làm việc.
Hàng ngày, doanh nghiệp nhận trên 21.000 cuộc gọi đến tổng đài Chăm sóc khách hàng. Thông thường, sau mỗi cuộc gọi, tổng đài viên sẽ tích mã cuộc gọi để phục vụ công tác báo cáo và phân tích hành vi khách hàng. Bảng mã cuộc gọi gồm 18 chủ đề chính và 443 chủ đề con. Vì vậy doanh nghiệp mong muốn có một ứng dụng có thể tích mã tự động sau mỗi cuộc gọi nhằm tiết kiệm thời gian, tăng hiệu quả công việc và giảm chi phí.
Với đề tài này, Kim Thành tập trung phân tích dữ liệu văn bản từ cuộc gọi để tìm ra chủ đề của cuộc gọi. Đề tài của Kim Thành với nguồn dữ liệu thực tế đã giúp cho ra kết quả tương đối chính xác. Hi vọng khi áp dụng vào thực tế mô hình doanh nghiệp sẽ vận hành tốt và giúp ích được nhiều cho doanh nghiệp đúng như kỳ vọng của Kim Thành.
“Phát hiện Logo thương hiệu” là đề tài của học viên Khưu Cẩm Tú thực hiện. Việc ứng dụng công nghệ số vào thị trường thương mại điện tử luôn là đề tài hấp dẫn với các bạn học viên Data Science – Machine Learning. Phát hiện thương hiệu/logo được dùng để xác minh logo thương hiệu trong hình ảnh sản phẩm mà người bán đăng tải có trùng khớp với thương hiệu sản phẩm không để tiến hành từ chối các yêu cầu vi phạm một cách tự động.
Đồ án sử dụng Hệ thống Deep Learning để tiến hành xây dựng model phát hiện logo của 5 thương hiệu nổi tiếng gồm Adidas, Nike, Olay, CocaCola, Pepsi.
Đề tài kết hợp thực hiện 2 phương pháp với sự tỉ mỉ, tìm hiểu kỹ càng, kết quả đề tài của bạn Cẩm Tú cho ra kết quả có độ chính xác cao, demo rõ ràng, chi tiết, nhận được nhiều lời khen từ các Thầy Cô trong Hội đồng chấm thi. Trong tương lai, Cẩm Tú sẽ bổ sung thêm dữ liệu của nhiều thương hiệu, xem xét phương pháp tối ưu nhất để phát triển và tăng tính ứng dụng thực tế của đề tài.
Bạn Nguyễn Tấn Bửu lựa chọn đề tài “Age Gender Estimation” cho đồ án Tốt nghiệp Machine Learning của mình. Việc dự đoán giới tính và độ tuổi thông qua gương mặt đóng vai trò quan trọng trong các ứng dụng thông minh như kiểm soát truy cập, tương tác người dùng với máy tính, tiếp thị thông minh, giám sát trực quan.
Bằng việc xây dựng mô hình dự đoán Tuổi và Giới tính thông qua dữ liệu đầu vào là hình ảnh khuôn mặt, đề tài của Tấn Bửu cho kết quả với độ chính xác gần 90% đối với Độ tuổi, gần 100% đối với Giới tính. Có thể nói đây là kết quả có độ chính xác tương đối cao. Phần Demo được Tấn Bửu chuẩn bị chu đáo, kỹ càng, giúp Hội đồng chấm thi và các bạn học viên nhanh chóng thấy được kết quả của mô hình.
Học viên Đặng Trí Văn thực hiện đề tài “Sentiment Analysis for E-Commerce”. Với đề tài này, Trí Văn mong muốn nghiên cứu sẽ giúp các doanh nghiệp có công cụ để phân loại, đánh giá, hiểu được tâm lý khách hàng khi thực hiện mua hàng trên các sàn giao dịch TMĐT, từ đó có những hướng phát triển để đáp ứng nhu cầu người tiêu dùng và thu hút khách hàng mới hơn.
Nguồn dữ liệu được dùng để phân tích được thu thập từ sàn TMĐT Tiki, được xử lý kỹ càng, demo rõ ràng, mô hình cho ra kết quả với độ chính xác khá cao, đề tài nhận được đánh giá cao từ các Thầy Cô trong Hội đồng chấm thi.
“Vietnam Traffic Light“ là đề tài do Đỗ Văn Nam lựa chọn báo cáo Đồ án tốt nghiệp Machine Learning. Bạn Nam thực hiện đề tài này với mong muốn nhận diện tín hiệu đèn giao thông và số giây trên bảng tín hiệu đèn để hỗ trợ tài xế bằng cách hiển thị lên màn hình hoặc thông báo bằng âm thanh hoặc tích hợp đưa ra các tín hiệu xử lý phù hợp đối với hệ thống xe tự lái.
Đề tài của Nam với nguồn dữ liệu đầu vào đa dạng, tiền xử lý kỹ càng đã cho ra kết quả khá chính xác, có thể dễ dàng ứng dụng vào thực tế. Bên cạnh đó, bạn Nam đưa ra nhiều hướng phát triển đề tài trong tương lai, như thêm mô hình để dễ so sánh đánh giá, thêm nhiều hình ảnh với điều kiện thời tiết và ánh sáng khác nhau,… sẽ giúp cho đề tài ứng dụng trong thực tế được chính xác hơn.
Học viên Đỗ Minh Đức lựa chọn đề tài “Image Caption Generator” cho Đồ án Tốt nghiệp của mình. Image Caption Generator là chương trình tạo mô tả cho hình ảnh, liên quan đến thị giác máy tính và xử lý ngôn ngữ tự nhiên để nhận ra được ngữ cảnh hình ảnh và mô tả chúng bằng ngôn ngữ tự nhiên. Từ đây, Minh Đức mong muốn tạo ứng dụng giúp người khiếm thị có thể hình dung được khung cảnh xung quanh. Ứng dụng này sẽ thu hình ảnh, sau đó xử lý hình ảnh đưa ra mô tả, và cuối cùng chuyển sang giọng nói.
Mô hình cho ra kết quả khá chính xác và có thể dễ dàng ứng dụng thực tế nếu được cung cấp bộ dữ liệu đầu vào lớn hơn và đa dạng hơn.
Chúc mừng tất cả các bạn đã hoàn thành tốt chương trình Data Science – Machine Learning tại Trung tâm Tin học – Trường Đại học Khoa học Tự nhiên và bước tiếp với nhiều cơ hội mới, thành công trong tương lai.
Trung tâm Tin học - Trường Đại học Khoa học Tự nhiên