Công thức tính mẫu số liệu ghép nhóm chuẩn nhất
Cách tính mẫu số liệu ghép nhóm
Công thức tính mẫu số liệu ghép nhóm là một phần quan trọng trong chương trình học Toán 11, đặc biệt là trong việc phân tích và xử lý dữ liệu thống kê. Đối với những học sinh đang chuẩn bị cho kỳ thi hoặc các bài tập về số liệu thống kê, việc nắm vững các công thức tính toán này là vô cùng cần thiết. Mẫu số liệu ghép nhóm giúp chúng ta tổ chức và phân tích dữ liệu một cách có hệ thống, từ đó đưa ra các kết luận chính xác hơn về đặc điểm phân bố của dữ liệu.
Trong bài viết này, chúng tôi sẽ hướng dẫn bạn cách tính mẫu số liệu ghép nhóm chuẩn nhất, cung cấp những công thức toán học cơ bản và chi tiết nhất để bạn có thể áp dụng vào các bài toán Toán 11 một cách hiệu quả. Những phương pháp được trình bày trong bài viết này sẽ giúp bạn giải quyết các vấn đề liên quan đến mẫu số liệu, tần suất, và phạm vi một cách chính xác và nhanh chóng.
A. Các số đặc trưng đo xu thế trung tâm cho mẫu số liệu ghép nhóm
1. Công thức số trung bình
Cho mẫu số liệu ghép nhóm như ở bảng:

Trung điểm
\(x_{i}\) của nửa khoảng (tính bằng trung bình cộng của hai đầu mút) ứng với nhóm
\(i\) là giá trị đại diện của nhóm đó.
Số trung binh cộng của mẫu số liệu ghép nhóm, kí hiệu
\(\overline{x}\), được tính theo công thức:
\(\overline{x} = \frac{n_{1}x_{1} +
n_{2}x_{2} + \ldots + n_{m}x_{m}}{n}\)
Ý nghĩa: Số trung bình cộng của mẫu số liệu ghép nhóm có thể làm đại diện cho vị trí trung tâm của mẫu số liệu đó khi các số liệu trong mẫu ít sai lệch với số trung bình cộng.
2. Công thức trung vị
Cho mẫu số liệu ghép nhóm như ở bảng:

Giả sử nhóm
\(k\) là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng
\(\frac{n}{2}\), tức là
\(cf_{k - 1} < \frac{n}{2}\) nhưng
\(cf_{k} \geq \frac{n}{2}\). Ta gọi
\(r,d,n_{k}\) lần lượt là đầu mút trái, độ dài, tần số của nhóm
\(k;cf_{k - 1}\) là tần số tích luỹ của nhóm
\(k -
1\).
Trung vị của mẫu số liệu ghép nhóm, kí hiệu
\(M_{e}\), được tính theo công thức sau:
\(M_{e} = r + \left( \frac{\frac{n}{2} -
cf_{k - 1}}{n_{k}} \right) \cdot d\)
Quy uớc:
\(cf_{0} = 0\).
Ý nghĩa: Trung vị của mẫu số liệu có thể dùng để đại diện cho mẫu số liệu đó.
3. Công thức Tứ phân vị
Cho mẫu số liệu ghép nhóm như ở bảng:

Giả sử nhóm
\(p\) là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng
\(\frac{n}{4}\), tức là
\(cf_{p - 1} < \frac{n}{4}\) nhưng
\(cf_{p} \geq \frac{n}{4}\).
Ta gọi
\(s,h,n_{p}\) lần lượt là đầu mút trái, độ dài, tần số của nhóm
\(p\);
\(cf_{p -
1}\)là tần số tích luỹ của nhóm
\(p -
1\).
Tú phân vị thứ nhất
\(Q_{1}\) được tính theo công thức sau:
\(Q_{1} = s + \left( \frac{\frac{n}{4} -
cf_{p - 1}}{n_{p}} \right) \cdot h\)
Tứ phân vị thúc hai
\(Q_{2}\) bằng trung vị
\(M_{e}\).
Giả sử nhóm
\(q\) là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng
\(\frac{3n}{4}\), tức là
\(cf_{q - 1} < \frac{3n}{4}\) nhưng
\(cf_{q} \geq \frac{3n}{4}\). Ta gọi
\(t,l,n_{q}\) lần lượt là đầu mút trái, độ dài, tần số của nhóm
\(q;cf_{q - 1}\) là tần số tích luỹ của nhóm
\(q -
1\).
Tứ phân vị thứ ba
\(Q_{3}\) được tính theo công thức sau:
\(Q_{3} = t + \left( \frac{\frac{3n}{4} -
cf_{q - 1}}{n_{q}} \right) \cdot l\)
Ý nghĩa: Tứ phân vị
\(Q_{1},Q_{2},Q_{3}\) của mẫu số liệu chia mẫu số liệu đó thành bốn phần, mỗi phần chứa
\(25\%\) giá trị.
4. Công thức tính Mốt
Cho mẫu số liệu ghép nhóm như ở bảng sau:

Giả sử nhóm
\(i\) là nhóm có tần số lớn nhất. Ta gọi
\(u,g,n_{i}\) lần lượt là đầu mút trái, độ dài, tần số của nhóm
\(i;n_{i - 1},n_{i + 1}\) lần lượt là tần số của nhóm
\(i - 1\), nhóm
\(i + 1\). Mốt của mẫu số liệu ghép nhóm, kí hiệu
\(M_{o}\), được tính theo công thức sau:
Quy ước:
\(n_{0} = 0;n_{m + 1} =
0\).
Công thức:
\(M_{o} = u + \left( \frac{n_{i} - n_{i -
1}}{2n_{i} - n_{i - 1} - n_{i + 1}} \right) \cdot g\)
Ý nghĩa: Mốt của mẫu số liệu ghép nhóm có thể dùng để đo xu thế trung tâm của mẫu số liệu đó.
B. Các số đặc trưng đo mức độ phân tán cho mẫu số liệu ghép nhóm
1. Khoảng biến thiên
Cho mẫu số liệu ghép nhóm như ở bảng dưới đây:

Trong đó
\(n_{1}\) và
\(n_{m}\) là các số nguyên dương.
Gọi
\(a_{1}\),
\(a_{m + 1}\) lần lượt là đầu mút trái của nhóm
\(1\), đầu mút phải của nhóm
\(m\).
Hiệu
\(R = a_{m + 1} - a_{1}\) được gọi là khoảng biến thiên của mẫu số liệu ghép nhóm đó.
Ý nghĩa
- Khoảng biến thiên của mẫu số liệu ghép nhóm đo mức độ phân tán cho mẫu số liệu đó. Khoảng biến thiên càng lớn thì mẫu số liệu càng phân tán.
- Trong các đại lượng đo mức độ phân tán của mẫu số liệu ghép nhóm, khoảng biến thiên là đại lượng dễ hiểu, dễ tính toán. Tuy nhiên, do khoảng biến thiên chỉ sử dụng hai giá trị
\(a_{1}\) và
\(a_{m
+ 1}\) của mẫu số liệu nên đại lượng đó dễ bị ảnh hưởng bởi các giá trị bất thường.
2. Khoảng tứ phân vị
Cho mẫu số liệu ghép nhóm như ở bảng:

Gọi
\(Q_{1},Q_{2},Q_{3}\) là tứ phân vị của mẫu số liệu đó. Ta gọi hiệu
\(\Delta Q
= Q_{3} - Q_{1}\) là khoảng tứ phân vị của mẫu số liệu đó.
Ý nghĩa: Khoảng tứ phân vị của mẫu số liệu ghép nhóm giúp xác định các giá trị bất thường của mẫu đó. Khoảng tứ phân vị thường được sử dụng thay cho khoảng biến thiên vì nó loại trừ hầu hết giá trị bất thường vủa mẫu số liệu và nó không bị ảnh hưởng bởi các giá trị bất thường đó.
3. Công thức Phương sai và độ lệch chuẩn của mẫu số liệu ghép nhóm
Cho mẫu số liệu ghép nhóm như ở bảng:

Gọi
\(\overline{x}\) là số trung bình cộng của mẫu số liệu đó.
Số
\(s^{2} = \frac{n_{1}\left( x_{1} -
\overline{x} \right)^{2} + n_{2}\left( x_{2} - \overline{x} \right)^{2}
+ ... + n_{m}\left( x_{m} - \overline{x} \right)^{2}}{n}\) được gọi là phương sai của mẫu số liệu đó.
Căn bậc hai (số học) của phương sai được gọi là độ lệch chuẩn của mẫu số liệu ghép nhóm, kí hiệu là
\(s\), nghĩa là
\(s
= \sqrt{s^{2}}\).
Ý nghĩa
- Phương sai (độ lệch chuẩn) của mẫu số liệu ghép nhóm được dùng để đo mức độ phân tán của mẫu số liệu ghép nhóm đó.
- Độ lệch chuẩn có cùng đơn vị với đơn vị của mẫu số liệu.
- Khi hai mẫu số liệu ghép nhóm có cùng đơn vị đo và có số trung trình cộng bằng nhau (hoặc xấp xỉ nhau), mẫu số liệu nào có độ lệch chuẩn nhỏ hơn thì mức độ phân tán (so với số trung bình cộng) của các số liệu trong mẫu đó sẽ thấp hơn.
C. Bài tập áp dụng công thức tính mẫu số liệu ghép nhóm.
Bài tập 1: Bảng số liệu dưới đây biểu diễn mẫu số liệu ghép nhóm về số tiền (đơn vị: nghìn đồng) mà
\(60\) khách hàng mua sách ở một cửa hàng trong một ngày.
|
Nhóm |
Tần số |
Tần số tích lũy |
|
[40; 50) |
5 |
5 |
|
[50; 60) |
8 |
13 |
|
[60; 70) |
25 |
38 |
|
[70; 80) |
20 |
58 |
|
[80; 90) |
2 |
60 |
|
|
N = 60 |
|
a) Số trung bình cộng của mẫu số liệu trên là 65 (nghìn đồng).
b) Trung vị của mẫu số liệu trên là 66,8 (nghìn đồng).
c) Tứ phân vị nhất
\(Q_{1}\) của mẫu số liệu trên là 60,8 (nghìn đồng).
d) Mốt của mẫu số liệu trên là 65 (nghìn đồng).
Hướng dẫn giải
|
Câu |
a) |
b) |
c) |
d) |
|
Kết quả |
Sai |
Đúng |
Đúng |
Sai |
a) Số trung bình cộng của mẫu số liệu ghép nhóm trên là
\(\overline{x} = \frac{5.45 + 8.55 + 25.65
+ 20.75 + 2.85}{60} = 66\) (nghìn đồng)
b) Số phần tứ của mẫu là
\(n = 60\).
Ta có:
\(\frac{n}{2} = \frac{60}{2} =
30\) mà
\(13 < 30 < 38\).
Suy ra nhóm 3 là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng 30.
Xét nhóm 3 có
\(r =
60\);
\(d = 10;\ \ n_{3} = 25\) và nhóm 2 có
\(cf_{2} = 13\).
Trung vị của mẫu số liệu đó là:
\(M_{e} = 60 +
\left( \frac{30 - 13}{25} \right) \cdot 10 = 66,8\) (nghìn đồng).
c) Ta có:
\(\frac{n}{4} = \frac{60}{4} =
15\) mà 13 < 15 < 38.
Suy ra nhóm 3 là nhóm đầu tiên có tần số tích luỹ lớn hơn hoặc bằng 15.
Xét nhóm 3 có
\(r = 60;\
\ d = 10;\ \ n_{3} = 25\) và nhóm 2 có
\(cf_{2} =
13\).
Tứ phân vị thứ nhất
\(Q_{1}\) của mẫu số liệu đó là:
\(Q_{1} = 60 + \left( \frac{15
- 13}{25} \right) \cdot 10 = 60,8\) (nghìn đồng).
d) Ta thấy nhóm 3 là nhóm có tần số lớn nhất với
\(u = 60;\ \ g = 10;\ \ n_{3} =
25\).
Nhóm 2 có tần số
\(n_{2} = 8\), nhóm 4 có tần số
\(n_{4} = 20\).
Mốt của mẫu số liệu đó là:
\(M_{o} = 60 +
\left( \frac{25 - 8}{2 \cdot 25 - 8 - 20} \right) \cdot 10 \approx
68\) (nghìn đồng).
Bài tập 2: Kết quả kiểm tra môn Tiếng Anh (cùng đề) của học sinh hai lớp 12A và 12B được cho lần lượt bởi mẫu số liệu ghép nhóm ở các bảng 6, bảng 7:

a) Số trung bình cộng của hai mẫu số liệu trên bằng nhau.
b) Độ lệch chuẩn của mẫu số liệu lớp 12A nhỏ hơn 2.
c) Phương sai của mẫu số liệu lớp 12B lớn hơn 3.
d) Điểm thi của học sinh lớp 12B đồng đều hơn lớp 12A.
Hướng dẫn giải
|
Câu |
a) |
b) |
c) |
d) |
|
Kết quả |
Đúng |
Sai |
Đúng |
Đúng |
a) Số trung bình cộng của mẫu số liệu lớp 12A là:
\(\ \overline{x_{A}} = \frac{3.1 + 5.3 +
5.5 + 25.7 + 2.9}{40} = 5,9.\)
Số trung bình cộng của mẫu số liệu lớp 12B là:
\(\overline{x_{B}} = \frac{1.1 + 4 \cdot 3
+ 15.5 + 16 \cdot 7 + 4.9}{40} = 5,9.\)
Suy ra số trung bình cộng của hai mẫu số liệu trên bằng nhau.
Phương sai của mẫu số liệu lớp 12A là:
\(s_{A}^{2} = \frac{3(1 - 5,9)^{2} + 5(3 -
5,9)^{2} + 5(5 - 5,9)^{2} + 25(7 - 5,9)^{2} + 2(9 - 5,9)^{2}}{40} =
4,19\)
Độ lệch chuẩn của mẫu số liệu lớp 12A là
\(\sqrt{4,19}\) và
\(\sqrt{4,19} > 2\).
Phương sai của mẫu số liệu lớp 12B là:
\(s_{B}^{2} = \frac{1(1 - 5,9)^{2} + 4(3 -
5,9)^{2} + 15(5 - 5,9)^{2} + 16(7 - 5,9)^{2} + 4(9 - 5,9)^{2}}{40} =
3,19\)
Và
\(3,19 > 3\).
Vì
\(s_{A}^{2} > s_{B}^{2}\) nên điểm thi của học sinh lớp 12B đồng đều hơn lớp 12A.
------------------------------------------
Như vậy, việc tính mẫu số liệu ghép nhóm chuẩn nhất không chỉ là một kỹ năng quan trọng trong chương trình Toán 11 mà còn là nền tảng vững chắc cho các bài toán phân tích dữ liệu trong các lĩnh vực khác như thống kê, kinh tế học, và các ngành khoa học xã hội. Bằng cách hiểu rõ và thành thạo các công thức toán học này, bạn sẽ có thể giải quyết các bài tập về dữ liệu thống kê một cách nhanh chóng và chính xác hơn.
Nếu bạn cần thêm thông tin hoặc có bất kỳ thắc mắc nào về cách tính mẫu số liệu ghép nhóm hay các công thức Toán 11 khác, đừng ngần ngại tham khảo các bài viết khác trên website của chúng tôi. Chúng tôi luôn cập nhật những kiến thức mới và chia sẻ các bài tập thực tế giúp bạn củng cố kiến thức và nâng cao khả năng giải quyết vấn đề.
Hy vọng bài viết này đã giúp bạn hiểu rõ hơn về công thức tính mẫu số liệu ghép nhóm và cách áp dụng chúng vào các bài tập Toán 11. Để không bỏ lỡ những bài viết hữu ích và những mẹo học tập khác, hãy tiếp tục theo dõi chúng tôi và để lại câu hỏi nếu bạn cần thêm sự trợ giúp.