ngày 21-03-2024
Khi kết hợp nhiều nguồn dữ liệu, có nhiều khả năng dữ liệu sẽ bị trùng lặp hoặc dán nhãn sai. Nếu dữ liệu không chính xác sẽ dẫn đến kết quả của việc phân tích và thống kê dữ liệu không đáng tin cậy. Việc loại bỏ các giá trị trùng nhau là một trong các bước làm sạch dữ liệu, đảm bảo dữ liệu nhất quán và không có bất kỳ lỗi nào có thể gây ra trong quá trình sử dụng. Một bước quan trọng trước khi bạn tiến hành phân tích dữ liệu trên Excel.
Ở bài viết này Trung Tâm sẽ hướng dẫn bạn cách loại bỏ các giá trị trùng nhau ở 2 trường hợp thường gặp một cách nhanh chóng và hiệu quả nhất. Cùng thực hiện nhé!
Trong minh họa này, chúng ta loại bỏ các số điện thoại trùng nhau trong cột Số điện thoại.
Bước 1: Chọn khối vùng dữ liệu (hoặc chỉ chọn cột cần loại bỏ dữ liệu trùng nhau).
Bước 2: Chọn thẻ Data, chọn công cụ Remove Duplicates
Bước 3: Đánh dấu chọn cột muốn loại bỏ giá trị trùng nhau (chọn cột Số điện thoại).
Chọn nút OK.
Khi đó, tất cả những dữ liệu trùng nhau trên cột Số điện thoại sẽ được loại bỏ, chỉ giữ lại 1 giá trị duy nhất.
Thao tác thực hiện loại bỏ dữ liệu trùng nhau trên nhiều cột tương tự như trên 1 cột.
Thực hiện lại Bước 1 và Bước 2 như trên.
Tại Bước 3: Đánh dấu chọn nhiều cột muốn loại bỏ giá trị trùng nhau.
Chọn nút OK.
Khi đó, tất cả những dòng dữ liệu trùng nhau trên 3 cột Mã nhân viên, Tên nhân viên và Năm sinh sẽ được loại bỏ, chỉ giữ lại 1 dòng giá trị duy nhất.
Chúng ta đã thực hiện xong một thủ thuật phổ biến trong tiền xử lý dữ liệu với Excel, hy vọng sẽ giúp ích cho công việc của bạn. Theo dõi thêm nhiều bài viết về các thủ thuật và mẹo Excel tại đây hoặc tham gia các khóa học chuyên sâu về Excel để nâng cao kỹ năng văn phòng bạn nhé! Chúc bạn thành công.
Trung Tâm Tin Học Trường ĐH KHTN, ĐHQG-HCM