Số trung bình và mốt của mẫu số liệu ghép nhóm CTST
Mẫu số liệu ghép nhóm thường được trình bày dưới dạng bảng thống kê có dạng như sau:
|
Nhóm |
… |
… |
|||
|
Tần số |
… |
… |
Chú ý:
- Bảng trên có k nhóm
\(\left[ {{a_j};{a_{j + 1}}} \right)\) với
\(j \in \left[ {1;k} \right]\), mỗi nhóm gồm một số giá trị được ghép theo một tiêu chí xác định. - Cỡ mẫu
\(m = {m_1} + {m_2} + ... + {m_k}\) - Giá trị chính giữa mỗi nhóm được dùng làm giá trị đại diện của nhóm ấy.
- Hiệu
\({a_{j + 1}} - {a_j}\) là độ dài của nhóm
\(\left[ {{a_j};{a_{j + 1}}} \right)\).
Một số quy tắc ghép nhóm của mẫu số liệu
- Sử dụng từ
\(k = 5\) đến
\(k = 20\) nhóm. Cỡ mẫu càng lớn thì cần càng nhiều nhóm số liệu. - Các nhóm có cùng độ dài L thỏa mãn
\(R < k.L\), trong đó R là khoảng biến thiên, k là số nhóm. - Giá trị nhỏ nhất của mẫu thuộc vào nhóm
\(\left[ {{a_1};{a_2}} \right)\) và càng gần
\(a_1\) càng tốt. Giá trị lớn nhất của mẫu thuộc nhóm
\(\left[ {{a_k};{a_{k + 1}}} \right)\) và càng gần càng tốt.
Ví dụ: Thời gian xem tivi trong tuần của 30 học sinh tìm được như sau:
|
1 |
6 |
2 |
3 |
5 |
12 |
5 |
8 |
4 |
8 |
|
10 |
3 |
4 |
12 |
2 |
8 |
15 |
1 |
17 |
6 |
|
3 |
2 |
8 |
5 |
9 |
6 |
8 |
7 |
14 |
12 |
Chuyển dữ liệu về dạng mẫu dữ liệu theo nhóm, độ lớn các nhóm bằng nhau và bằng 5.
Hướng dẫn giải
Độ dài nhóm là
\(10 - 5 = 5\)
Khoảng biến thiên:
\(17 - 1 = 16\)
Ta có:
\(\frac{{16}}{5} = 3,2\) => Số nhóm tạo thành là 4 nhóm.
|
Số giờ |
Tần số |
|
[0; 5) |
10 |
|
[5; 10) |
13 |
|
[10; 15) |
5 |
|
[15; 20) |
2 |
|
Tổng cộng |
30 |
2. Số trung bình
Cho mẫu số liệu ghép nhóm
|
Nhóm |
… |
… |
|||
|
Giá trị đại diện |
… |
… |
|||
|
Tần số |
… |
… |
Số trung bình của mẫu số liệu ghép nhóm, kí hiệu là
\(\overline x\) được tính như sau:
\(\overline x = \frac{{{m_1}{c_1} + {m_2}{c_2} + ... + {m_k}{c_k}}}{m}\)
Trong đó:
\(m = {m_1} + {m_2} + ... + {m_k}\)
Ví dụ: Điểm kiểm tra khảo sát môn Tiếng Anh của lớp 11A được ghi trong bảng số liệu ghép nhóm như sau:
|
Điểm |
[0; 20) |
[20; 40) |
[40; 60) |
[60; 80) |
[80; 100) |
|
Số học sinh |
5 |
9 |
12 |
10 |
6 |
Tính số điểm trung bình của lớp 11A?
Hướng dẫn giải
Ta có:
|
Điểm |
[0; 20) |
[20; 40) |
[40; 60) |
[60; 80) |
[80; 100) |
|
|
Giá trị đại diện |
10 |
30 |
50 |
70 |
90 |
|
|
Số học sinh |
5 |
9 |
12 |
10 |
6 |
N = 42 |
Điểm trung bình của lớp 11A là:
\(\overline x = \frac{{10.5 + 30.9 + 50.12 + 70.10 + 90.6}}{{42}} = \frac{{360}}{7}\)
Ý nghĩa của số trung bình của mẫu số liệu ghép nhóm
Số trung bình của mẫu số liệu ghép nhóm là giá trị xấp xỉ cho số trung bình của mẫu số liệu gốc. Nó thường dùng để đo xu thế trung tâm của mẫu số liệu.
3. Mốt
Cho mẫu số liệu ghép nhóm:
|
Nhóm |
… |
… |
|||
|
Tần số |
… |
… |
Nhóm chứa mốt của mẫu số liệu ghép nhóm là nhóm có tần số lớn nhất.
Giả sử nhóm chứa mốt là
\(\left[ {{a_j};{a_{j + 1}}} \right)\) khi đó mốt của mẫu số liệu ghép nhóm, kí hiệu là
\({M_0}\) được tính bằng công thức:
\({M_0} = {a_j} + \frac{{{m_j} - {m_{j - 1}}}}{{\left( {{m_j} - {m_{j - 1}}} \right) + \left( {{m_j} - {m_{j + 1}}} \right)}}.\left( {{a_{j + 1}} - {a_j}} \right)\)
Chú ý: Nếu không có nhóm kề trước của nhóm chứa mốt thì
\({m_{j - 1}} = 0\). Nếu không có nhóm kề sau của nhóm chứa mốt thì
\({m_{j + 1}} = 0\).
Ví dụ: Điểm kiểm tra khảo sát môn Tiếng Anh của lớp 11A được ghi trong bảng số liệu ghép nhóm như sau:
|
Điểm |
[0; 20) |
[20; 40) |
[40; 60) |
[60; 80) |
[80; 100) |
|
Số học sinh |
5 |
9 |
12 |
10 |
6 |
Tìm mốt của mẫu số liệu ghép nhóm đã cho?
Hướng dẫn giải
Mốt
\({M_0}\) thuộc nhóm
\(\left[ {40;60} \right)\)
Ta có:
|
Điểm |
[0; 20) |
[20; 40) |
[40; 60) |
[60; 80) |
[80; 100) |
|
Số học sinh |
5 |
9 |
12 |
10 |
6 |
|
|
|
|
\(\Rightarrow l = 40;{f_0} = 9;{f_1} = 12;{f_2} = 10;c = 60 - 40 = 20\)
Khi đó mốt của dữ liệu được tính như sau:
\({M_0} = l + \frac{{{f_1} - {f_0}}}{{\left( {{f_1} - {f_0}} \right) + \left( {{f_1} - {f_2}} \right)}}.c\)
\(\Rightarrow {M_0} = 40 + \frac{{12 - 9}}{{12 - 9 + 12 - 10}}.20 = 52\)
Ý nghĩa của mốt của mẫu số liệu ghép nhóm
- Mốt của mẫu số liệu không ghép nhóm là giá trị có khả năng xuất hiện cao nhất khi lấy mẫu. Mốt của mẫu số liệu sau khi ghép nhóm
\({M_0}\) xấp xỉ với mốt của mẫu số liệu không ghép nhóm. Các giá trị nằm xung quanh
\({M_0}\) thường có khả năng xuất hiện cao hơn các giá trị khác. - Mốt của mẫu số liệu ghép nhóm có thể có nhiều nhóm chứa mốt và nhiều mốt.