Cách tính phương sai, độ lệch chuẩn
Công thức tính phương sai, độ lệch chuẩn Toán 10
Trong thống kê toán học, hai khái niệm quan trọng giúp đánh giá mức độ phân tán của dữ liệu chính là phương sai và độ lệch chuẩn. Đây là những công cụ không thể thiếu trong việc phân tích số liệu, từ các bài tập Toán phổ thông cho đến nghiên cứu khoa học và ứng dụng thực tiễn. Bài viết này sẽ hướng dẫn chi tiết cách tính phương sai, độ lệch chuẩn kèm ví dụ minh họa, giúp người học nắm vững công thức và áp dụng hiệu quả trong học tập cũng như thực tế.
Bản quyền thuộc về VnDoc.
Nghiêm cấm mọi hình thức sao chép nhằm mục đích thương mại.
1. Công thức tính phương sai
a. Phương sai
- Trong thống kê, phương sai được định nghĩa là thước đo độ biến thiên biểu thị khoảng cách các thành viên của một nhóm được lan truyền. Nó tìm ra mức độ trung bình mà mỗi quan sát khác nhau từ giá trị trung bình. Khi phương sai của tập dữ liệu nhỏ, nó cho thấy độ gần của điểm dữ liệu với giá trị trung bình trong khi giá trị phương sai lớn hơn biểu thị rằng các quan sát rất phân tán xung quanh trung bình số học và lẫn nhau.
b. Cách tính phương sai
Với mẫu số liệu
\(x_{1},x_{2},x_{3},...,x_{n}\) nếu gọi số trung bình là
\(\overline{x}\) thì với mỗi giá trị
\(x_{i}\), độ lệch của nó so với giá trị trung bình là
\(x_{i} -
\overline{x}\).
Phương sai của mẫu số liệu được kí hiệu là
\(S^{2}\)xác định bởi công thức:
\({\sigma ^2} = \frac{1}{n}{\sum\limits_{i = 1}^k {\left( {{x_i} - \overline x } \right)} ^2} = \frac{{\sum\limits_{i = 1}^k {{f_i}\left( {{x_i} - \overline x } \right)} }}{N}\)
Với
\(\overline x\) là số trung bình của bảng số liệu; n là các số liệu thống kê
Cụ thể hơn ta có phương trình được xác định như sau:
\(S^{2} = \frac{\left( x_{1} -
\overline{x} \right)^{2} + \left( x_{2} - \overline{x} \right)^{2} + ...
+ \left( x_{n} - \overline{x} \right)^{2}}{n}\)
Nếu mẫu số liệu được cho dưới dạng bảng tần số thì phương sai được tính bằng công thức:
\(S^{2} = \frac{n_{1}.\left( x_{1} -
\overline{x} \right)^{2} + n_{2}.\left( x_{2} - \overline{x} \right)^{2}
+ ... + n_{k}.\left( x_{k} - \overline{x} \right)^{2}}{n}\)
Phương sai hiệu chuẩn được tính bằng công thức:
\(S^{2} = \frac{\left( x_{1} -
\overline{x} \right)^{2} + \left( x_{2} - \overline{x} \right)^{2} + ...
+ \left( x_{n} - \overline{x} \right)^{2}}{n - 1}\)
2. Công thức tính độ lệch chuẩn
a. Độ lệch chuẩn là gì?
- Độ lệch chuẩn là thước đo định lượng mức độ phân tán của các quan sát trong bộ dữ liệu. Độ lệch chuẩn thấp là một chỉ số về độ gần của điểm số với giá trị trung bình số học và độ lệch chuẩn cao thể hiện; điểm số được phân tán trên một phạm vi giá trị cao hơn.
b. Công thức tính độ lệch chuẩn
Căn bậc hai của phương sai
\(S =
\sqrt{S^{2}}\) được gọi là độ lệch chuẩn.
\(\sigma = \sqrt {\frac{{\sum\limits_{i = 1}^k {{{\left( {{x_i} - \overline x } \right)}^2}} }}{n}} = \sqrt {\frac{{\sum\limits_{i = 1}^k {{f_i}\left( {{x_i} - \overline x } \right)} }}{N}}\)
c. Ý nghĩa phương sai và độ lệch chuẩn
- Phương sai là trung bình cộng của các bình phương độ lệch từ mỗi giá trị của mẫu số liệu đến số trung bình.
- Phương sai và độ lệch chuẩn được dùng để đo mức độ phân tán của các số liệu trong mẫu quanh số trung bình
- Phương sai và độ lệch chuẩn càng lớn thì các giá trị của mẫu càng cách xa nhau (có độ phân tán lớn).
3. Phân biệt phương sai và độ lệch chuẩn
| Cơ sở để so sánh | Phương sai | Độ lệch chuẩn |
| Định nghĩa | Phương sai là một giá trị số mô tả sự thay đổi của các quan sát từ giá trị trung bình số học của nó. | Độ lệch chuẩn là thước đo độ phân tán của các quan sát trong một tập dữ liệu. |
| Ý nghĩa | Đây là trung bình của độ lệch bình phương. | Nó là căn bậc trung bình lệch. |
| Kí hiệu | Sigma bình phương ( |
Sigma ( |
| Thể hiện | Đơn vị bình phương | Các đơn vị giống như các giá trị trong bộ dữ liệu. |
| Chỉ ra | Làm thế nào để các cá nhân trong một nhóm được trải ra. | Bao nhiêu quan sát của một tập dữ liệu khác với ý nghĩa của nó |
4. Bài tập ví dụ minh họa
Điểm kiểm tra học kì của một học sinh được thống kê trong bảng dữ liệu sau:
| Môn học | Toán | Ngữ Văn | Tiếng Anh | Vật Lý | Hóa Học |
| Điểm | 95 | 78 | 84 | 85 | 92 |
Tìm phương sai và độ lệch chuẩn.
Hướng dẫn giải
Điểm trung bình 5 môn học là:
\(\overline x = \frac{{95 + 78 + 84 + 85 + 92}}{5} = 86,8\)
| x | |||
| 95 | 86,8 | 8,2 | 67,24 |
| 78 | 86,8 | -8,8 | 77,44 |
| 84 | 86,8 | -2,8 | 7,84 |
| 85 | 86,8 | -1,8 | 3,24 |
| 92 | 86,8 | 5,5 | 30,25 |
Phương sai được tính như sau:
\({\sigma ^2} = \frac{{67,24 + 77,44 + 7,84 + 3,24 + 30,25}}{5} = 37,202\)
Độ lệch chuẩn là:
\(\sigma = \sqrt {37,2020} \approx 6,1\)
Ví dụ: Cho mẫu số liệu biểu thị số học sinh của 5 lớp khối 10 của một trường THPT:
|
43 |
45 |
46 |
41 |
40 |
Tìm phương sai và độ lệch chuẩn cho mẫu số liệu đã cho.
Hướng dẫn giải
Số trung bình của số liệu:
\(\overline{x} = \frac{43 + 45 + 46 + 41 +
40}{5} = 43\)
Ta có bảng số liệu như sau:
|
Giá trị |
Độ lệch
|
Bình phương độ lệch
|
|
43 |
43 - 43 = 0 |
0 |
|
45 |
45 - 43 = 2 |
4 |
|
46 |
46 - 43 = 3 |
9 |
|
41 |
41 - 43 = -2 |
4 |
|
40 |
40 - 43 = -3 |
9 |
|
Tổng |
26 |
|
Ta có: n = 5
=> Phương sai là:
\(S^{2} = \frac{26}{5}
= 5,2\)
=> Độ lệch chuẩn là:
\(S = \sqrt{S^{2}}
\approx 2,28\).
Ví dụ: Nhiệt độ (đơn vị: 0C) tại Mộc Châu trong một ngày sau một vài lần đo như sau:
\(21^{0}C;23^{0}C;25^{0}C;28^{0}C;30^{0}C;\)
\(32^{0}C;34^{0}C;31^{0}C;29^{0}C;26^{0}C.\)
Kết quả nào dưới đây gần nhất với độ lệch chuẩn của mẫu số liệu đã cho?
A.
\(3,91\) B.
\(4\) C.
\(3,8\) D.
\(3,9\)
Hướng dẫn giải
Ta có:
\(N = 10\)
Nhiệt độ trung bình trong ngày là:
\(\overline{x} = \frac{21 + 23 + 25 + 28 +
30 + 32 + 34 + 31 + 29 + 26}{10} = 27,9\)
Ta có bảng sau:
|
Giá trị |
Độ lệch |
Bình phương độ lệch |
|
21 |
47,61 |
|
|
23 |
24,01 |
|
|
25 |
8,41 |
|
|
28 |
0,01 |
|
|
30 |
4,41 |
|
|
32 |
16,81 |
|
|
34 |
37,21 |
|
|
31 |
9,61 |
|
|
29 |
1,21 |
|
|
26 |
3,61 |
|
|
Tổng |
152,9 |
|
Suy ra phương sai của mẫu số liệu là:
\(s^{2} = \frac{152,9}{10} =
15,29\)
Suy ra độ lệch chuẩn của mẫu số liệu là:
\(s = \sqrt{s^{2}} \approx
3,91\)
Ví dụ: Liệt kê sĩ số của từng lớp trong khối 10 ta được bảng số liệu như sau:
|
Lớp |
10A |
10B |
10C |
10D |
10E |
|
Sĩ số |
40 |
43 |
45 |
41 |
46 |
Xác định giá trị gần nhất với độ lệch chuẩn của mẫu số liệu?
A.
\(2,42\) B.
\(2,52\) C.
\(2,25\) D.
\(2,28\)
Hướng dẫn giải
Ta có:
\(N = 5\)
Số trung bình của mẫu số liệu là:
\(\overline{x} = \frac{40 + 43 + 45 + 42 +
46}{5} = 43\)
Phương sai của mẫu số liệu là:
\(s^{2} = \frac{(40 - 43)^{2} + (43 -
43)^{2} + (45 - 43)^{2} + (41 - 43)^{2} + (46 - 43)^{2}}{5} =
5,2\)
Suy ra độ lệch chuẩn của mẫu số liệu là:
\(s = \sqrt{s^{2}} = 2,28\)
Vậy độ lệch chuẩn của mẫu số liệu là 2,28.
Tham khảo thêm: Toán 12 Kết nối tri thức bài 10: Phương sai và độ lệch chuẩn
-------------------------------------------------------------
Việc thành thạo cách tính phương sai và độ lệch chuẩn không chỉ giúp học sinh làm tốt các dạng bài tập trong chương trình Toán phổ thông mà còn hỗ trợ tích cực trong các môn học khác như Vật lý, Hóa học, Kinh tế và cả nghiên cứu thực tiễn. Đây là công cụ quan trọng để phân tích dữ liệu, đánh giá độ ổn định và so sánh các tập hợp số liệu khác nhau.
👉 Để học hiệu quả hơn, bạn nên:
-
Hiểu rõ công thức và ý nghĩa thực tiễn của phương sai, độ lệch chuẩn.
-
Luyện tập với nhiều dạng bài tập từ cơ bản đến nâng cao.
-
Ứng dụng vào các tình huống thực tế như thống kê điểm số, dữ liệu kinh tế hay thí nghiệm khoa học.
Khi nắm chắc kiến thức này, bạn sẽ dễ dàng xử lý các bài toán thống kê, tự tin hơn trong học tập và có lợi thế lớn trong những kỳ thi quan trọng.