Các số đặc trưng đo xu thế trung tâm cho mẫu số liệu không ghép nhóm
Số trung bình của mẫu số liệu
\(x_1,x_2,...,x_n\) kí hiệu là
\(\overline x\) được tính bằng công thức:
\(\overline x=\frac{x_1+x_2+...+x_n}{n}\)
Trong trường hợp mẫu số liệu cho dưới dạng bảng tần số thì số trung bình được tính theo công thức:
\(\overline x=\frac{m_1x_1+m_2x_2+...+m_nx_n}{n}\)
trong đó
\(m_k\) là tần số của giá trị
\(x_k\) và
\(n=m_1+m_2+...+m_k\).
Ý nghĩa: Số trung bình là giá trị trung bình cộng của các số trong mẫu số liệu, nó cho biết vị trí trung tâm của mẫu số liệu và có thể dùng để đại diện cho mẫu số liệu.
Ví dụ 1: Thống kê số sách mỗi bạn trong nhóm đã đọc trong năm 2022, Bình thu được kết quả như bảng dưới đây. Hỏi trong năm 2022, trung bình mỗi bạn trong nhóm đọc bao nhiêu cuốn sách. (kết quả làm tròn đến hàng phần mười)
Hướng dẫn giải
Số bạn trong lớp là:
\(n=5+3+3+2+1=14\) (bạn).
Trong năm 2022, trung bình mỗi bạn đọc số cuốn sách là:
\(\frac{5.1+3.2+3.3+2.4+1.5}{14}=2,4\) (cuốn sách).
2. Số trung vị và tứ phân vị
Số trung vị
Trung vị kí hiệu là
\(M_e\) là giá trị chia đôi mẫu số liệu, nghĩa là trong dãy số liệu được sắp xếp theo thứ tự tăng dần thì trung vị ở vị trí chính giữa.
Để tìm trung vị của một mẫu số liệu, ta làm như sau:
- Sắp xếp các giá trị của mẫu số liệu theo thứ tự không giảm.
- Nếu số giá trị của mẫu số liệu là số lẻ thì giá trị chính giữa của dãy là trung vị, còn nếu là số chẵn thì trung vị là trung bình cộng của hai giá trị chính giữa của dãy.
Ý nghĩa: Trung vị không bị ảnh hưởng bởi giá trị bất thường trong khi số trung bình bị ảnh hưởng bởi giá trị bất thường.
Ví dụ 1: Cho dãy số liệu như sau:
\(3;1;4;5;0;8;7;8;1\). Tìm trung vị của dãy số liệu này.
Hướng dẫn giải
Sắp xếp số liệu theo thứ tự không giảm:
\(0;1;1;3;4;5;7;8;8\).
Dãy trên có giá trị chính giữa là
\(4\). Vì vậy trung vị
\(M_e=4\).
Ví dụ 2: Cho dãy số liệu như sau:
\(1;0;5;4;7;7;6;9\). Tìm trung vị của dãy số liệu này.
Hướng dẫn giải
Sắp xếp số liệu theo thứ tự không giảm:
\(0;1;4;5;6;7;7;9\).
Dãy trên có hai giá trị chính giữa là
\(5\) và
\(6\). Vì vậy trung vị
\(M_e= \frac{5+6}2=5,5\).
Tứ phân vị
Các điểm
\(Q_1,Q_2,Q_3\) chia dãy dữ liệu đã sắp xếp theo thứ tự không giảm thành bốn phần, mỗi phần đều chứa 25% giá tri được gọi là các tứ phân vị.
![]()
Để tìm các tứ phân vị của mẫu số liệu có
\(n\) giá trị, ta thực hiện như sau:
- Sắp xếp mẫu số liệu theo thứ tự không giảm. Tìm trung vị. Giá trị này chính là
\(Q_2\). - Tìm trung vị của nửa số liệu bên trái
\(Q_2\) (không bao gồm
\(Q_2\) nếu
\(n\) lẻ). Giá trị này chính là
\(Q_1\). - Tìm trung vị của nửa số liệu bên phải
\(Q_2\) (không bao gồm
\(Q_2\) nếu
\(n\) lẻ). Giá trị này chính là
\(Q_3\)
Ví dụ 3: Tìm tứ phân vị của dãy số liệu sau:
\(3;7;5;12;14;9;9;7;10\).
Hướng dẫn giải
Sắp xếp mẫu số liệu theo thứ tự không giảm:
\(3;5;7;7;9;9;10;12;14\).
Trung vị
\(Q_2\) là giá trị chính giữa của mẫu số liệu trên là:
\(9\).
Trung vị của nửa số liệu bên trái
\(Q_2\), tức dãy số liệu:
\(3;5;7;7\) là
\(\frac{5+7}2=6\). Đây chính là
\(Q_1\).
Trung vị của nửa số liệu bên phải
\(Q_2\), tức dãy số liệu
\(9;10;12;14\) là
\(\frac{10+12}2=11\). Đây chính là
\(Q_3\).
3. Mốt
Mốt của mẫu số liệu là giá trị hoặc những giá trị xuất hiện với tần số lớn nhất. Người ta thường dùng mốt để đo xu thế trung tâm của mẫu số liệu khi mẫu số liệu có nhiều giá trị trùng nhau. Mốt có thể không là duy nhất.
Ví dụ: Cho dãy số liệu
\(1;3;2;5;7;8;2;9;2\). Mốt của mẫu số liệu này là số
\(2\).