Cách phát hiện số liệu bất thường hoặc không chính xác của mẫu số liệu không ghép nhóm
Cách phát hiện số liệu bất thường trong mẫu số liệu
Trong quá trình thống kê, việc xử lý mẫu số liệu không ghép nhóm đòi hỏi sự chính xác cao. Tuy nhiên, thực tế cho thấy trong nhiều bộ dữ liệu thường tồn tại những số liệu bất thường hoặc không chính xác, gây ảnh hưởng đến kết quả phân tích. Ở Toán 10 – Chuyên đề Mẫu số liệu không ghép nhóm, học sinh được trang bị phương pháp để phát hiện và loại bỏ số liệu bất hợp lý, từ đó nâng cao độ tin cậy của kết quả thống kê. Bài viết này sẽ hướng dẫn chi tiết cách phát hiện số liệu bất thường hoặc sai lệch trong mẫu số liệu, kèm theo ví dụ minh họa dễ hiểu để bạn nắm vững và áp dụng hiệu quả.
Thế nào là giá trị bất thường?
Trong mẫu số liệu thống kê, có khi gặp những giá trị quá lớn hoặc quá nhỏ so với đa số các giá trị khác. Những giá trị này được gọi là giá trị bất thường. Chúng xuất hiện trong mẫu số liệu có thể do nhầm lẫn hay sai sót nào đó. Ta có thể dùng biểu đồ hộp để phát hiện những giá trị bất thường này.

Các giá trị lớn hơn
\(Q_{3} +
1,5.\Delta_{Q}\) hoặc bé hơn
\(Q_{1} -
1,5.\Delta_{Q}\) được xem là giá trị bất thường.
Ví dụ: Hàm lượng Natri (đơn vị mg) trong 100 g một số loại ngũ cốc được cho như sau:
| 0 | 340 | 70 | 140 | 200 | 180 | 210 | 150 | 100 | 130 |
| 140 | 180 | 190 | 160 | 290 | 50 | 220 | 180 | 200 | 210 |
Tìm giá trị bất thường trong mẫu số liệu trên bằng cách sử dụng biểu đồ hộp.
Hướng dẫn giải
Từ mẫu số liệu ta tính được
\(Q_{1} =
135\) và
\(Q_{3} = 205\). Do đó, khoảng tứ phân vị là:
\(\Delta_{Q} = 205 - 135 = 70\)
Biểu đồ hộp cho mẫu số liệu này là:

Ta có
\(Q_{1} - 1,5.\Delta_{Q} =
30\) và
\(Q_{3} + 1,5.\Delta_{Q} =
310\) nên trong mẫu số liệu có hai giá trị được xem là bất thường là 340 mg (lớn hơn 310 mg) và 0 mg (bé hơn 30 mg).
---------------------------------------------------------
Như vậy, qua bài viết, bạn đã được tìm hiểu rõ ràng về cách nhận diện số liệu bất thường hoặc không chính xác trong mẫu số liệu không ghép nhóm. Đây là kỹ năng quan trọng trong phân tích thống kê, giúp đảm bảo kết quả tính toán phản ánh đúng bản chất dữ liệu. Việc thành thạo kỹ năng này không chỉ hữu ích trong học tập Toán 10 mà còn mang lại giá trị ứng dụng cao trong thực tế khi làm việc với dữ liệu. Hãy luyện tập thêm nhiều ví dụ khác để củng cố kiến thức và tự tin khi giải các dạng bài tập thống kê.