Các số đặc trưng đo xu thế trung tâm cho mẫu số liệu ghép nhóm Cánh Diều
1. Bảng tần số ghép nhóm
- Mẫu số liệu ghép nhóm là mẫu số liệu cho dưới dạng bảng tần số ghép nhóm.
- Mỗi nhóm số liệu gồm một số giá trị của mẫu số liệu được ghép nhóm theo một tiêu chí xác định có dạng
\(\lbrack
a;b)\), trong đó
\(a\) là đầu mút trái,
\(b\) là đầu mút phải. - Độ dài nhóm là
\(b - a\). - Tần số của nhóm là số số liệu trong mẫu số liệu thuộc vào nhóm đó. Tần số của nhóm 1, nhóm 2, … nhóm m kí kiệu lần lượt là
\(n_{1},n_{2},...,n_{m}\).
Bảng tần số ghép nhóm được lập như bảng dưới đây. Trong đó mẫu số liệu gồm
\(n\) số liệu được chia thành
\(m\) nhóm tương ứng với
\(m\) nửa khoảng
\(\left\lbrack a_{1};a_{2} \right),\left\lbrack
a_{2};a_{3} \right)...,\left\lbrack a_{m};a_{m + 1} \right)\), ở đó
\(\left\{ \begin{matrix}
a_{1} < a_{2} < ... < a_{m} \\
n = n_{1} + n_{2} + ... + n_{m} \\
\end{matrix} \right.\).
|
Nhóm |
Tần số |
|
… |
… |
|
|
2. Ghép nhóm mẫu số liệu. Tần số tích lũy
Để chuyển mẫu số liệu không ghép nhóm thành mẫu số liệu ghép nhóm ta thực hiện như sau:
- Chia miền giá trị của mẫu số liệu thành một số nhóm theo tiêu chí cho trước.
- Đếm số giá trị của mẫu số liệu thuộc mỗi nhóm (tần số) và lập bảng tần số ghép nhóm.
Chú ý: Khi ghép nhóm số liệu, ta thường phân chia các nhóm có độ dài bằng nhau và đầu mút của các nhóm có thể không phải là giá trị của mẫu số liệu. Nhóm cuối cùng có thể là
\(\left\lbrack a_{m};a_{m + 1}
\right\rbrack\).
Tần số tích lũy của một nhóm là số số liệu trong mẫu số liệu có giá trị nhỏ hơn giá trị đầu mút phải của nhóm đó. Tần số tích lũy của nhóm 1, nhóm 2, …, nhóm m kí hiệu lần lượt là
\(cf_{1};cf_{2};...;cf_{m}\).
Ta có bảng sau:
|
Nhóm |
Tần số |
Tần số tích lũy |
|
… |
… |
… |
|
|
|
Ví dụ: Người ta kiểm tra chiều cao của các cây thân gỗ trong rừng (đơn vị: mét), kết quả được ghi trong bảng sau:
|
7,3 |
7,8 |
7,5 |
6,6 |
8,5 |
8,3 |
8,3 |
|
7,5 |
8,4 |
8,6 |
7,4 |
8,2 |
8,0 |
8,1 |
|
8,7 |
8,2 |
8,8 |
8,1 |
7,7 |
7,8 |
8,5 |
|
7,0 |
7,9 |
6,9 |
9,4 |
9,0 |
8,0 |
8,7 |
|
8,9 |
7,6 |
8,0 |
8,2 |
7,9 |
7,7 |
7,2 |
Chuyển mẫu số liệu trên thành mẫu số liệu ghép nhóm và tính tần số tích lũy của từng nhóm. Biết mẫu số liệu được chia thành 6 nhóm theo các nửa khoảng có độ dài như nhau.
Hướng dẫn giải
Khoảng biến thiên:
\(9,4 - 6,6 = 2,8\)
Ta chia thành các nhóm sau:
\(\lbrack 6,5;7),\lbrack 7;7,5),\lbrack7,5;8),\)
\(\lbrack 8;8,5),\lbrack 8,5;9),\lbrack 9;9,5)\)
Đếm số giá trị của mỗi nhóm ta có bảng ghép nhóm như sau:
|
Chiều cao (m) |
Tần số (số cây) |
Tần số tích lũy |
|
[6,5; 7) |
2 |
2 |
|
[7; 7,5) |
4 |
6 |
|
[7,5; 8) |
9 |
15 |
|
[8; 8,5) |
11 |
26 |
|
[8,5; 9) |
7 |
33 |
|
[9; 9,5) |
2 |
35 |
|
|
N = 35 |
|
B. Số trung bình cộng (số trung bình)
1. Định nghĩa số trung bình
Cho bảng số liệu ghép nhóm sau:
|
Nhóm |
Giá trị đại điện |
Tần số |
|
… |
… |
… |
|
|
|
- Giá trị đại diện của một nhóm bằng trung bình cộng hai đầu mút của nhóm đó.
- Số trung bình cộng của mẫu số liệu ghép nhóm, kí hiệu là
\(\overline{x}\) , được tính theo công thức:
\(\overline{x} = \frac{n_{1}x_{1} +
n_{2}x_{2} + ... + n_{m}x_{m}}{n}\)
Ví dụ: Tính số trung bình của mẫu số liệu ghép nhóm sau:
|
Nhóm |
Tần số |
|
[6,5; 7) |
2 |
|
[7; 7,5) |
4 |
|
[7,5; 8) |
9 |
|
[8; 8,5) |
11 |
|
[8,5; 9) |
7 |
|
[9; 9,5) |
2 |
|
|
N = 35 |
Hướng dẫn giải
Ta có:
|
Nhóm |
Giá trị đại diện |
Tần số |
|
[6,5; 7) |
6,75 |
2 |
|
[7; 7,5) |
7,25 |
4 |
|
[7,5; 8) |
7,75 |
9 |
|
[8; 8,5) |
8,25 |
11 |
|
[8,5; 9) |
8,75 |
7 |
|
[9; 9,5) |
9,25 |
2 |
|
|
|
N = 35 |
Số trung bình là:
\(\overline{x} = \frac{6,75.2 + 7,25.4 +
7,75.9 + 8,25.11 + 8,75.7 + 9,25.2}{35} \approx 8,14\)
2. Ý nghĩa của số trung bình
- Số trung bình của mẫu số liệu không ghép nhóm là giá trị trung bình cộng của các số trong mẫu số liệu đó, nó cho biết vị trí trung tâm của mẫu số liệu và có thể dùng để đại diện cho mẫu số liệu khi các số liệu trong mẫu ít sai lệch so với số trung bình cộng.
- Số trung bình cộng của mẫu số liệu sau khi ghép nhóm xấp xỉ với số trung bình cộng của mẫu số liệu không ghép nhóm ban đầu và có thể làm đại diện cho vị trí trung tâm của mẫu số liệu.
C. Trung vị
1. Định nghĩa trung vị
Giả sử nhóm
\(k\) là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng
\(\frac{n}{2}\) , tức là
\(cf_{k - 1} < \frac{n}{2}\) nhưng
\(cf_{k} \geq \frac{n}{2}\) . Ta gọi
\(r,d,n_{k}\) lần lượt là đầu mút trái, độ dài và tần số của nhóm
\(k\) ;
\(cf_{k - 1}\) là tần số tích lũy của nhóm
\(k - 1\) .
Trung vị của mẫu số liệu ghép nhóm, kí hiệu
\(M_{e}\) , được tính bởi công thức:
\(M_{e} = r + \left( \dfrac{\dfrac{n}{2} -cf_{k - 1}}{n_{k}} \right).d\)
Ví dụ: Tính trung vị của mẫu số liệu ghép nhóm sau:
|
Nhóm |
Tần số |
|
[6,5; 7) |
2 |
|
[7; 7,5) |
4 |
|
[7,5; 8) |
9 |
|
[8; 8,5) |
11 |
|
[8,5; 9) |
7 |
|
[9; 9,5) |
2 |
|
|
N = 35 |
Hướng dẫn giải
Ta có:
|
Chiều cao (m) |
Tần số (số cây) |
Tần số tích lũy |
|
[6,5; 7) |
2 |
2 |
|
[7; 7,5) |
4 |
6 |
|
[7,5; 8) |
9 |
15 |
|
[8; 8,5) |
11 |
26 |
|
[8,5; 9) |
7 |
33 |
|
[9; 9,5) |
2 |
35 |
|
|
N = 35 |
|
Lại có:
\(\frac{N}{2} = \frac{35}{2} =
17,5\)
=> Nhóm chứa trung vị là [8; 8,5)
Khi đó:
\(\left\{ \begin{matrix}r = 8;\dfrac{N}{2} = 17,5;cf_{k - 1} = 15 \\n_{k} = 11,d = 8,5 - 8 = 0,5 \\\end{matrix} \right.\)
Trung vị là:
\(M_{e} = 8 + \left( \frac{17,5 - 15}{11}
\right).0,5 = \frac{357}{44}\)
2. Ý nghĩa của trung vị
- Trung vị của mẫu số liệu sau khi ghép nhóm xấp xỉ với trung vị của mẫu số liệu không ghép nhóm ban đầu và có thể dùng để đại diện cho mẫu số liệu đã cho.
D. Tứ phân vị
1. Định nghĩa tứ phân vị
Tứ phân vị thứ hai
\(Q_{2}\) bằng trung vị
\(M_{e}\).
Giả sử nhóm
\(p\) là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng
\(\frac{n}{4}\) , tức là
\(cf_{p - 1} < \frac{n}{4}\) nhưng
\(cf_{p} \geq \frac{n}{4}\) . Ta gọi
\(s,h,n_{p}\) lần lượt là đầu mút trái, độ dài và tần số của nhóm
\(p\) ;
\(cf_{p - 1}\) là tần số tích lũy của nhóm
\(p - 1\) .
Tứ phân vị thứ nhất
\(Q_{1}\) của mẫu số liệu ghép nhóm được tính bởi công thức:
\(Q_{1} = s + \left( \dfrac{\dfrac{n}{4} -cf_{p - 1}}{n_{p}} \right).h\)
Giả sử nhóm
\(q\) là nhóm đầu tiên có tần số tích lũy lớn hơn hoặc bằng
\(\frac{3n}{4}\) , tức là
\(cf_{q - 1} < \frac{3n}{4}\) nhưng
\(cf_{q} \geq \frac{3n}{4}\) . Ta gọi
\(t,l,n_{q}\) lần lượt là đầu mút trái, độ dài và tần số của nhóm
\(p\) ;
\(cf_{q - 1}\) là tần số tích lũy của nhóm
\(q - 1\) .
Tứ phân vị thứ ba
\(Q_{3}\) của mẫu số liệu ghép nhóm được tính bởi công thức:
\(Q_{3} = t + \left( \dfrac{\dfrac{3n}{4} -cf_{q - 1}}{n_{q}} \right).l\)
Ví dụ: Cho mẫu số liệu ghép nhóm sau:
|
Nhóm |
Tần số |
|
[6,5; 7) |
2 |
|
[7; 7,5) |
4 |
|
[7,5; 8) |
9 |
|
[8; 8,5) |
11 |
|
[8,5; 9) |
7 |
|
[9; 9,5) |
2 |
|
|
N = 35 |
Tính các giá trị
\(Q_{1},Q_{3}\) ?
Hướng dẫn giải
Ta có:
|
Chiều cao (m) |
Tần số (số cây) |
Tần số tích lũy |
|
[6,5; 7) |
2 |
2 |
|
[7; 7,5) |
4 |
6 |
|
[7,5; 8) |
9 |
15 |
|
[8; 8,5) |
11 |
26 |
|
[8,5; 9) |
7 |
33 |
|
[9; 9,5) |
2 |
35 |
|
|
N = 35 |
|
Ta có:
\(\frac{N}{4} = \frac{35}{4} =
8,75\)
=> Nhóm chứa
\(Q_{1}\) là [7,5; 8)
Khi đó:
\(\left\{ \begin{matrix}s = 7,5;\dfrac{N}{4} = 8,75;cf_{p - 1} = 6 \\n_{k} = 9,d = 8 - 7,5 = 0,5 \\\end{matrix} \right.\)
\(\Rightarrow Q_{1} = 7,5 + \left(
\frac{8,75 - 6}{9} \right).0,5 = \frac{551}{72}\)
Ta có:
\(\frac{3N}{4} = \frac{3.35}{4} =
26,25\)
=> Nhóm chứa
\(Q_{3}\) là [8,5; 9)
Khi đó:
\(\left\{ \begin{matrix}t = 8,5;\dfrac{3N}{4} = 26,25;cf_{q - 1} = 26 \\n_{q} = 7,l = 9 - 8,5 = 0,5 \\\end{matrix} \right.\)
\(\Rightarrow Q_{3} = 8,5 + \left(
\frac{26,25 - 26}{7} \right).0,5 = \frac{477}{56}\)
2. Ý nghĩa của tứ phân vị
- Bằng cách ghép nhóm mẫu số liệu và tính toán tứ phân vị của mẫu số liệu ghép nhóm, ta nhận được ba giá trị mới cũng có thể dùng để đại diện cho mẫu số liệu đã cho.
- Bộ ba giá trị
\(Q_{1};Q_{2};Q_{3}\) trong tứ phân vị của mẫu số liệu sau khi ghép nhóm xấp xỉ với bộ ba giá trị trong tứ phân vị của mẫu số liệu không ghép nhóm ban đầu.
E. Mốt
1. Định nghĩa mốt
Giả sử nhóm
\(i\) là có tần số lớn nhất. Ta gọi
\(u;g;n_{i}\) lần lượt là đầu mút trái, độ dài, tần số của nhóm
\(i\) ;
\(n_{n -
1};n_{i + 1}\) lần lượt là tần số của nhóm
\(i - 1\) và
\(i +
1\)
Mốt của mẫu số liệu ghép nhóm
\(M_{0}\) của mẫu số liệu ghép nhóm được tính bởi công thức:
\(M_{0} = u + \left( \frac{n_{i} - n_{i -
1}}{2n_{i} - n_{i - 1} - n_{i + 1}} \right).g\)
Ví dụ: Cho mẫu số liệu ghép nhóm sau:
|
Nhóm |
Tần số |
|
[6,5; 7) |
2 |
|
[7; 7,5) |
4 |
|
[7,5; 8) |
9 |
|
[8; 8,5) |
11 |
|
[8,5; 9) |
7 |
|
[9; 9,5) |
2 |
|
|
N = 35 |
Tìm mốt của mẫu số liệu ghép nhóm đã cho?
Hướng dẫn giải
Nhóm chứa mốt là: [8; 8,5)
Suy ra
\(\left\{ \begin{matrix}n_{i - 1} = 9;n_{i} = 11;n_{i + 1} = 7 \\u = 8;g = 0,5 \\\end{matrix} \right.\)
Khi đó mốt của mẫu số liệu là:
\(M_{0} = 8,5 + \left( \frac{11 - 9}{2.11
- 9 - 7} \right).0,5 = \frac{26}{3}\)
2. Ý nghĩa của mốt
- Mốt của mẫu số liệu không ghép nhóm đặc trưng cho số lần lặp đi lặp lại nhiều nhất tại một giá trị của mẫu số liệu đó. Vì thế có thể dùng mốt để đo xu thế trung tâm của mẫu số liệu khi mẫu số liệu có nhiều giá trị trùng nhau.
- Bằng cách ghép nhóm mẫu số liệu và tính toán mốt của mẫu số liệu ghép nhóm, ta nhận được giá trị mới cũng có thể dùng để đo xu thế trung tâm của mẫu số liệu đã cho.
- Mốt của mẫu số liệu sau khi ghép nhóm xấp xỉ với mốt của mẫu số liệu không ghép nhóm ban đầu. Một mẫu số liệu ghép nhóm có thể có nhiều mốt.