Công thức tính tứ phân vị
Công thức tứ phân vị
Tứ phân vị là một khái niệm quan trọng trong thống kê thành phần dữ liệu tập các phần sử dụng để phân bố cục. Tài liệu dưới đây là một khái niệm quan trọng trong thống kê, giúp chia dữ liệu thành bốn thành phần để phân tích bố cục. Bài viết dưới đây sẽ giới thiệu chi tiết công thức tứ phân vị, cách tính và ý nghĩa của từng phần trong thực tế.
A. Tứ phân vị là gì?
Tứ phân vị (tiếng Anh: quartiles) là các giá trị chia một tập hợp số liệu thành bốn phần bằng nhau theo thứ tự tăng dần, mỗi phần chiếm 25% số liệu. Chúng giúp mô tả sự phân bố và mức độ phân tán của dữ liệu.
Có 3 tứ phân vị chính:
Tứ phân vị thứ nhất (Q1) – Còn gọi là phân vị thứ 25: Là giá trị mà 25% số liệu nhỏ hơn hoặc bằng nó.
Tứ phân vị thứ hai (Q2) – Chính là trung vị (median): Là giá trị chia dữ liệu thành hai nửa bằng nhau (50% nhỏ hơn, 50% lớn hơn).
Tứ phân vị thứ ba (Q3) – Phân vị thứ 75: Là giá trị mà 75% số liệu nhỏ hơn hoặc bằng nó.
B. Cách tính tứ phân vị của mẫu dữ liệu ghép nhóm
Cho mẫu số liệu ghép nhóm:
Nhóm |
![]() |
… |
![]() |
… |
![]() |
Tần số |
![]() |
… |
![]() |
… |
![]() |
Công thức Tứ phân vị thứ nhất
Để tìm tứ phân vị thứ nhất
Trong đó n là cỡ mẫu,
Công thức tính tứ phân vị thứ ba
Để tìm tứ phân vị thứ ba
Trong đó n là cỡ mẫu,
Tứ phân vị thứ hai
Công thức tính khoảng tứ phân vị
Khoảng tứ phân vị, kí hiệu là
C. Bài tập tính tứ phân vị
Ví dụ. Cho bảng thống kê chiều cao (đơn vị: cm) của học sinh lớp 12A và lớp 12B như sau:
Chiều cao |
[155; 160) |
[160; 165) |
[165; 170) |
[170; 175) |
[175; 180) |
[180; 185) |
12A |
2 |
7 |
12 |
3 |
0 |
1 |
12B |
5 |
9 |
8 |
2 |
1 |
0 |
Em có nhận xét gì về độ phân tán của hai lớp 12A và 12B?
Hướng dẫn giải
Ta có:
Chiều cao |
[155; 160) |
[160; 165) |
[165; 170) |
[170; 175) |
[175; 180) |
[180; 185) |
12A |
2 |
7 |
12 |
3 |
0 |
1 |
Tần số tích lũy |
2 |
9 |
21 |
24 |
24 |
25 |
Cỡ mẫu
Tứ phân vị thứ nhất của mẫu số liệu gốc là
Tứ phân vị thứ nhất của mẫu số liệu gốc là
Do đó khoảng tứ phân vị
Chiều cao |
[155; 160) |
[160; 165) |
[165; 170) |
[170; 175) |
[175; 180) |
[180; 185) |
12B |
5 |
9 |
8 |
2 |
1 |
0 |
Tần số tích lũy |
5 |
14 |
22 |
24 |
25 |
25 |
Cỡ mẫu
Tứ phân vị thứ nhất của mẫu số liệu gốc là
Tứ phân vị thứ nhất của mẫu số liệu gốc là
Do đó khoảng tứ phân vị
Vậy nửa giữa mẫu số liệu chiều cao của học sinh lớp 12A có độ phân tán nhỏ hơn lớp 12B.
Ví dụ: Cho biểu đồ thống kê thời gian tập thể dục buổi sáng của hai người A và B
Gọi khoảng tứ phân vị của mẫu số liệu về thời gian tập thể dục của A và B lần lượt là
Hướng dẫn giải
Ta có:
Đối tượng |
[15; 20) |
[20; 25) |
[25; 30) |
[30; 35) |
[35; 40) |
A |
5 |
12 |
8 |
3 |
2 |
Tần số tích lũy |
5 |
17 |
25 |
28 |
30 |
Cỡ mẫu
=> Nhóm chứa
Khi đó ta tìm được các giá trị:
Cỡ mẫu
=> Nhóm chứa
Khi đó ta tìm được các giá trị:
Vậy khoảng tứ phân vị của mẫu số liệu về thời gian tập thể dục của A là:
Đối tượng |
[15; 20) |
[20; 25) |
[25; 30) |
[30; 35) |
[35; 40) |
B |
0 |
25 |
5 |
0 |
0 |
Tần số tích lũy |
0 |
25 |
30 |
0 |
0 |
Cỡ mẫu
=> Nhóm chứa
Khi đó ta tìm được các giá trị:
Cỡ mẫu
=> Nhóm chứa
Khi đó ta tìm được các giá trị:
Vậy khoảng tứ phân vị của mẫu số liệu về thời gian tập thể dục của B là:
Vậy kết luận đúng là: