Công thức tính tứ phân vị
Công thức tứ phân vị
Tứ phân vị là một khái niệm quan trọng trong thống kê thành phần dữ liệu tập các phần sử dụng để phân bố cục. Tài liệu dưới đây là một khái niệm quan trọng trong thống kê, giúp chia dữ liệu thành bốn thành phần để phân tích bố cục.
A. Tứ phân vị là gì?
Tứ phân vị (tiếng Anh: quartiles) là các giá trị chia một tập hợp số liệu thành bốn phần bằng nhau theo thứ tự tăng dần, mỗi phần chiếm 25% số liệu. Chúng giúp mô tả sự phân bố và mức độ phân tán của dữ liệu.
Có 3 tứ phân vị chính:
- Tứ phân vị thứ nhất (Q1) – Còn gọi là phân vị thứ 25: Là giá trị mà 25% số liệu nhỏ hơn hoặc bằng nó.
- Tứ phân vị thứ hai (Q2) – Chính là trung vị (median): Là giá trị chia dữ liệu thành hai nửa bằng nhau (50% nhỏ hơn, 50% lớn hơn).
- Tứ phân vị thứ ba (Q3) – Phân vị thứ 75: Là giá trị mà 75% số liệu nhỏ hơn hoặc bằng nó.
B. Cách tính tứ phân vị của mẫu dữ liệu ghép nhóm
Cho mẫu số liệu ghép nhóm:
|
Nhóm |
… |
… |
|||
|
Tần số |
… |
… |
Công thức Tứ phân vị thứ nhất
Để tìm tứ phân vị thứ nhất
của mẫu số liệu ghép nhóm, trước hết ta xác định nhóm chứa
, giả sử đó là nhóm thứ p:
. Khi đó:

Trong đó n là cỡ mẫu,
là tần số nhóm p, với p = 1 ta quy ước
.
Công thức tính tứ phân vị thứ ba
Để tìm tứ phân vị thứ ba
của mẫu số liệu ghép nhóm, trước hết ta xác định nhóm chứa
, giả sử đó là nhóm thứ p:
. Khi đó:

Trong đó n là cỡ mẫu,
là tần số nhóm p, với p = 1 ta quy ước
.
Tứ phân vị thứ hai
chính là trung vị
.
Công thức tính khoảng tứ phân vị
Khoảng tứ phân vị, kí hiệu là
là hiệu số giữa tứ phân vị thứ ba và tứ phân vị thứ nhất, tức là: ![]()
C. Bài tập tính tứ phân vị
Ví dụ. Cho bảng thống kê chiều cao (đơn vị: cm) của học sinh lớp 12A và lớp 12B như sau:
|
Chiều cao |
[155; 160) |
[160; 165) |
[165; 170) |
[170; 175) |
[175; 180) |
[180; 185) |
|
12A |
2 |
7 |
12 |
3 |
0 |
1 |
|
12B |
5 |
9 |
8 |
2 |
1 |
0 |
Em có nhận xét gì về độ phân tán của hai lớp 12A và 12B?
Hướng dẫn giải
Ta có:
|
Chiều cao |
[155; 160) |
[160; 165) |
[165; 170) |
[170; 175) |
[175; 180) |
[180; 185) |
|
12A |
2 |
7 |
12 |
3 |
0 |
1 |
|
Tần số tích lũy |
2 |
9 |
21 |
24 |
24 |
25 |
Cỡ mẫu
. Gọi
là mẫu số liệu gốc
Tứ phân vị thứ nhất của mẫu số liệu gốc là
thuộc nhóm [160; 165)

Tứ phân vị thứ nhất của mẫu số liệu gốc là
thuộc nhóm [165; 170)

Do đó khoảng tứ phân vị ![]()
|
Chiều cao |
[155; 160) |
[160; 165) |
[165; 170) |
[170; 175) |
[175; 180) |
[180; 185) |
|
12B |
5 |
9 |
8 |
2 |
1 |
0 |
|
Tần số tích lũy |
5 |
14 |
22 |
24 |
25 |
25 |
Cỡ mẫu
. Gọi
là mẫu số liệu gốc
Tứ phân vị thứ nhất của mẫu số liệu gốc là
thuộc nhóm [160; 165)

Tứ phân vị thứ nhất của mẫu số liệu gốc là
thuộc nhóm [165; 170)

Do đó khoảng tứ phân vị ![]()
Vậy nửa giữa mẫu số liệu chiều cao của học sinh lớp 12A có độ phân tán nhỏ hơn lớp 12B.
Ví dụ: Cho biểu đồ thống kê thời gian tập thể dục buổi sáng của hai người A và B

Gọi khoảng tứ phân vị của mẫu số liệu về thời gian tập thể dục của A và B lần lượt là
. So sánh
?
Hướng dẫn giải
Ta có:
|
Đối tượng |
[15; 20) |
[20; 25) |
[25; 30) |
[30; 35) |
[35; 40) |
|
A |
5 |
12 |
8 |
3 |
2 |
|
Tần số tích lũy |
5 |
17 |
25 |
28 |
30 |
Cỡ mẫu ![]()
=> Nhóm chứa
là: [20; 25)
Khi đó ta tìm được các giá trị:
![]()

![]()
Cỡ mẫu ![]()
=> Nhóm chứa
là [25; 30)
Khi đó ta tìm được các giá trị:
![]()

.
Vậy khoảng tứ phân vị của mẫu số liệu về thời gian tập thể dục của A là:
.
|
Đối tượng |
[15; 20) |
[20; 25) |
[25; 30) |
[30; 35) |
[35; 40) |
|
B |
0 |
25 |
5 |
0 |
0 |
|
Tần số tích lũy |
0 |
25 |
30 |
0 |
0 |
Cỡ mẫu ![]()
=> Nhóm chứa
là: [20; 25)
Khi đó ta tìm được các giá trị:
![]()

![]()
Cỡ mẫu ![]()
=> Nhóm chứa
là: [20; 25)
Khi đó ta tìm được các giá trị:
![]()

.
Vậy khoảng tứ phân vị của mẫu số liệu về thời gian tập thể dục của B là:
.
Vậy kết luận đúng là:
.
Ví dụ. Thời gian truy cập internet mỗi buổi trưa của một số học sinh được cho trong bảng sau:
|
Thời gian (phút) |
|||||
|
Số học sinh |
3 |
12 |
15 |
24 |
2 |
Tìm tứ phân vị thứ nhất và tứ phân vị thứ ba của dãy số liệu trên. (Kết quả làm tròn đến hàng phần chục)
Hướng dẫn giải
Cỡ mẫu là:
.
Gọi
là thời gian truy cập internet của 56 học sinh và giả sữ dãy này đã được sắp xếp theo thứ tự tăng dần.
Khi đó, tứ phân vị thứ nhất là
.
Do
nên ![]()
Tứ phân vị thứ ba là
.
Do
nên ![]()
Vậy tứ phân vị thứ nhất của mẫu số liệu đã cho là 15,3
Tứ phân vị thứ nhất của mẫu số liệu đã cho là 20.
Ví dụ 3. Điểm kiểm tra khảo sát môn Tiếng Anh của lớp 11A được ghi trong bảng số liệu ghép nhóm như sau:
|
Điểm |
[0; 20) |
[20; 40) |
[40; 60) |
[60; 80) |
[80; 100) |
|
Số học sinh |
5 |
9 |
12 |
10 |
6 |
Khi đó giá trị tứ phân vị thứ ba bằng bao nhiêu?
Hướng dẫn giải:
Ta có:
|
Điểm |
[0; 20) |
[20; 40) |
[40; 60) |
[60; 80) |
[80; 100) |
|
|
Số học sinh |
5 |
9 |
12 |
10 |
6 |
N = 42 |
|
Tần số tích lũy |
5 |
14 |
26 |
36 |
42 |
|
Cỡ mẫu ![]()
=> Nhóm chứa
là [60; 80)
(Vì 31,5 nằm giữa hai tần số tích lũy 26 và 36)
Khi đó ta tìm được các giá trị:
![]()
![]()
Ví dụ 4. Thực hiện khảo sát chi phí thanh toán cước điện thoại trong 1 tháng của cư dân trong một chung cư thu được kết quả ghi trong bảng sau:
|
Số tiền (nghìn đồng) |
Số người |
|
[0; 50) |
5 |
|
[50; 100) |
12 |
|
[100; 150) |
23 |
|
[150; 200) |
17 |
|
[200; 250) |
3 |
Tính
? (Kết quả ghi dưới dạng số thập phân làm tròn đến chữ số thập phân thứ nhất)
Hướng dẫn giải:
Ta có:
|
Số tiền (nghìn đồng) |
Số người |
Tần số tích lũy |
|
[0; 50) |
5 |
5 |
|
[50; 100) |
12 |
17 |
|
[100; 150) |
23 |
40 |
|
[150; 200) |
17 |
57 |
|
[200; 250) |
3 |
60 |
|
|
N = 60 |
|
Cỡ mẫu là: ![]()
=> Nhóm chứa tứ phân vị thứ ba là [150; 200) (vì 45 nằm giữa hai tần số tích lũy 40 va 57)
Khi đó 
![]()
![]()