Giao diện mới của VnDoc Pro: Dễ sử dụng hơn - chỉ tập trung vào lớp bạn quan tâm. Vui lòng chọn lớp mà bạn quan tâm: Lưu và trải nghiệm

Công thức tính tứ phân vị

Tứ phân vị là một khái niệm quan trọng trong thống kê thành phần dữ liệu tập các phần sử dụng để phân bố cục. Tài liệu dưới đây là một khái niệm quan trọng trong thống kê, giúp chia dữ liệu thành bốn thành phần để phân tích bố cục. Bài viết dưới đây sẽ giới thiệu chi tiết công thức tứ phân vị, cách tính và ý nghĩa của từng phần trong thực tế.

A. Tứ phân vị là gì?

Tứ phân vị (tiếng Anh: quartiles) là các giá trị chia một tập hợp số liệu thành bốn phần bằng nhau theo thứ tự tăng dần, mỗi phần chiếm 25% số liệu. Chúng giúp mô tả sự phân bố và mức độ phân tán của dữ liệu.

Có 3 tứ phân vị chính:

Tứ phân vị thứ nhất (Q1) – Còn gọi là phân vị thứ 25: Là giá trị mà 25% số liệu nhỏ hơn hoặc bằng nó.

Tứ phân vị thứ hai (Q2) – Chính là trung vị (median): Là giá trị chia dữ liệu thành hai nửa bằng nhau (50% nhỏ hơn, 50% lớn hơn).

Tứ phân vị thứ ba (Q3) – Phân vị thứ 75: Là giá trị mà 75% số liệu nhỏ hơn hoặc bằng nó.

B. Cách tính tứ phân vị của mẫu dữ liệu ghép nhóm

Cho mẫu số liệu ghép nhóm:

Nhóm

\left\lbrack a_{1};a_{2}
\right)[a1;a2)

\left\lbrack a_{i};a_{i + 1}
\right)[ai;ai+1)

\left\lbrack a_{k};a_{k + 1}
\right)[ak;ak+1)

Tần số

m_{1}m1

m_{i}mi

m_{k}mk

Công thức Tứ phân vị thứ nhất

Để tìm tứ phân vị thứ nhất Q_{1}Q1 của mẫu số liệu ghép nhóm, trước hết ta xác định nhóm chứa Q_{1}Q1, giả sử đó là nhóm thứ p: \left\lbrack a_{p};a_{p + 1} \right)[ap;ap+1). Khi đó:

Q_{1} = a_{p} + \dfrac{\dfrac{n}{4} -
\left( m_{1} + ... + m_{p - 1} \right)}{m_{p}}.\left( a_{p + 1} - a_{p}
\right)Q1=ap+n4(m1+...+mp1)mp.(ap+1ap)

Trong đó n là cỡ mẫu, m_{p}mp là tần số nhóm p, với p = 1 ta quy ước m_{1} +
... + m_{p - 1} = 0m1+...+mp1=0.

Công thức tính tứ phân vị thứ ba

Để tìm tứ phân vị thứ ba Q_{3}Q3 của mẫu số liệu ghép nhóm, trước hết ta xác định nhóm chứa Q_{3}Q3, giả sử đó là nhóm thứ p: \left\lbrack a_{p};a_{p + 1} \right)[ap;ap+1). Khi đó:

Q_{3} = a_{p} + \dfrac{\dfrac{3n}{4} -
\left( m_{1} + ... + m_{p - 1} \right)}{m_{p}}.\left( a_{p + 1} - a_{p}
\right)Q3=ap+3n4(m1+...+mp1)mp.(ap+1ap)

Trong đó n là cỡ mẫu, m_{p}mp là tần số nhóm p, với p = 1 ta quy ước m_{1} +
... + m_{p - 1} = 0m1+...+mp1=0.

Tứ phân vị thứ hai Q_{2}Q2 chính là trung vị M_{e}Me.

Công thức tính khoảng tứ phân vị

Khoảng tứ phân vị, kí hiệu là \Delta_{Q}ΔQ là hiệu số giữa tứ phân vị thứ ba và tứ phân vị thứ nhất, tức là: \Delta_{Q} = Q_{3} - Q_{1}ΔQ=Q3Q1

C. Bài tập tính tứ phân vị

Ví dụ. Cho bảng thống kê chiều cao (đơn vị: cm) của học sinh lớp 12A và lớp 12B như sau:

Chiều cao

[155; 160)

[160; 165)

[165; 170)

[170; 175)

[175; 180)

[180; 185)

12A

2

7

12

3

0

1

12B

5

9

8

2

1

0

Em có nhận xét gì về độ phân tán của hai lớp 12A và 12B?

Hướng dẫn giải

Ta có:

Chiều cao

[155; 160)

[160; 165)

[165; 170)

[170; 175)

[175; 180)

[180; 185)

12A

2

7

12

3

0

1

Tần số tích lũy

2

9

21

24

24

25

Cỡ mẫu N = 25N=25. Gọi x_{1};x_{2};...;x_{25}x1;x2;...;x25 là mẫu số liệu gốc

Tứ phân vị thứ nhất của mẫu số liệu gốc là \frac{1}{2}\left( x_{6} + x_{7} \right)12(x6+x7) thuộc nhóm [160; 165)

Q_{1} = 160 + \dfrac{\dfrac{25}{4} -2}{7}(165 - 160) = \dfrac{4565}{28}Q1=160+25427(165160)=456528

Tứ phân vị thứ nhất của mẫu số liệu gốc là \frac{1}{2}\left( x_{19} + x_{20} \right)12(x19+x20) thuộc nhóm [165; 170)

Q_{3} = 165 + \dfrac{3.\dfrac{25}{4} -9}{12}(170 - 165) = \dfrac{2705}{16}Q3=165+3.254912(170165)=270516

Do đó khoảng tứ phân vị \Delta_{Q} =
Q_{3} - Q_{1} = \frac{675}{112} \approx 6,03ΔQ=Q3Q1=6751126,03

Chiều cao

[155; 160)

[160; 165)

[165; 170)

[170; 175)

[175; 180)

[180; 185)

12B

5

9

8

2

1

0

Tần số tích lũy

5

14

22

24

25

25

Cỡ mẫu N = 25N=25. Gọi x_{1};x_{2};...;x_{25}x1;x2;...;x25 là mẫu số liệu gốc

Tứ phân vị thứ nhất của mẫu số liệu gốc là \frac{1}{2}\left( x_{6} + x_{7} \right)12(x6+x7) thuộc nhóm [160; 165)

Q_{1} = 160 + \dfrac{\dfrac{25}{4} -5}{9}(165 - 160) = \dfrac{5785}{36}Q1=160+25459(165160)=578536

Tứ phân vị thứ nhất của mẫu số liệu gốc là \frac{1}{2}\left( x_{19} + x_{20} \right)12(x19+x20) thuộc nhóm [165; 170)

Q_{3} = 165 + \dfrac{3.\dfrac{25}{4} -14}{8}(170 - 165) = \dfrac{5375}{32}Q3=165+3.254148(170165)=537532

Do đó khoảng tứ phân vị \Delta_{Q} =
Q_{3} - Q_{1} = 7,27ΔQ=Q3Q1=7,27

Vậy nửa giữa mẫu số liệu chiều cao của học sinh lớp 12A có độ phân tán nhỏ hơn lớp 12B.

Ví dụ: Cho biểu đồ thống kê thời gian tập thể dục buổi sáng của hai người A và B

Gọi khoảng tứ phân vị của mẫu số liệu về thời gian tập thể dục của A và B lần lượt là \Delta_{Q_{A}};\Delta_{Q_{B}}ΔQA;ΔQB. So sánh \Delta_{Q_{A}};\Delta_{Q_{B}}ΔQA;ΔQB?

Hướng dẫn giải

Ta có:

Đối tượng

[15; 20)

[20; 25)

[25; 30)

[30; 35)

[35; 40)

A

5

12

8

3

2

Tần số tích lũy

5

17

25

28

30

Cỡ mẫu N = 30 \Rightarrow \frac{N}{4} =
7,5N=30N4=7,5

=> Nhóm chứa Q_{1}Q1 là: [20; 25)

Khi đó ta tìm được các giá trị:

\Rightarrow l = 20;m = 5,f = 12;c = 25 -
20 = 5l=20;m=5,f=12;c=2520=5

\Rightarrow Q_{1} = l +
\dfrac{\dfrac{N}{4} - m}{f}.cQ1=l+N4mf.c= 20 + \dfrac{7,5 - 5}{12}.5 =
\dfrac{505}{24}=20+7,5512.5=50524

Cỡ mẫu \frac{3N}{4} = 22,53N4=22,5

=> Nhóm chứa Q_{3}Q3 là [25; 30)

Khi đó ta tìm được các giá trị:

\Rightarrow l = 25;m = 17,f = 8;c =
5l=25;m=17,f=8;c=5

\Rightarrow Q_{3} = l +
\dfrac{\dfrac{3N}{4} - m}{f}.cQ3=l+3N4mf.c= 25 + \dfrac{22,5 - 17}{8}.5 =\dfrac{455}{16}=25+22,5178.5=45516.

Vậy khoảng tứ phân vị của mẫu số liệu về thời gian tập thể dục của A là:

\Delta_{Q_{A}} = Q_{3} - Q_{1} =
\frac{355}{48} \approx 7,4ΔQA=Q3Q1=355487,4.

Đối tượng

[15; 20)

[20; 25)

[25; 30)

[30; 35)

[35; 40)

B

0

25

5

0

0

Tần số tích lũy

0

25

30

0

0

Cỡ mẫu N = 30 \Rightarrow \frac{N}{4} =
7,5N=30N4=7,5

=> Nhóm chứa Q_{1}Q1 là: [20; 25)

Khi đó ta tìm được các giá trị:

\Rightarrow l = 20;m = 0,f = 25;c = 25 -
20 = 5l=20;m=0,f=25;c=2520=5

\Rightarrow Q_{1} = l +
\dfrac{\dfrac{N}{4} - m}{f}.cQ1=l+N4mf.c= 20 + \dfrac{7,5 - 0}{25}.5 =
\dfrac{43}{2}=20+7,5025.5=432

Cỡ mẫu \frac{3N}{4} = 22,53N4=22,5

=> Nhóm chứa Q_{1}Q1 là: [20; 25)

Khi đó ta tìm được các giá trị:

\Rightarrow l = 20;m = 0,f = 25;c = 25 -
20 = 5l=20;m=0,f=25;c=2520=5

\Rightarrow Q_{3} = l +
\dfrac{\dfrac{3N}{4} - m}{f}.cQ3=l+3N4mf.c= 20 + \dfrac{22,5 - 0}{25}.5 =
\dfrac{49}{2}=20+22,5025.5=492.

Vậy khoảng tứ phân vị của mẫu số liệu về thời gian tập thể dục của B là:

\Delta_{Q_{B}} = Q_{3} - Q_{1} =
3ΔQB=Q3Q1=3.

Vậy kết luận đúng là: \Delta_{Q_{A}} >
\Delta_{Q_{B}}ΔQA>ΔQB.

Chia sẻ, đánh giá bài viết
1
Đóng Chỉ thành viên VnDoc PRO/PROPLUS tải được nội dung này!
Đóng
79.000 / tháng
Đặc quyền các gói Thành viên
PRO
Phổ biến nhất
PRO+
Tải tài liệu Cao cấp 1 Lớp
Tải tài liệu Trả phí + Miễn phí
Xem nội dung bài viết
Trải nghiệm Không quảng cáo
Làm bài trắc nghiệm không giới hạn
Mua cả năm Tiết kiệm tới 48%
Xác thực tài khoản!

Theo Nghị định 147/2024/ND-CP, bạn cần xác thực tài khoản trước khi sử dụng tính năng này. Chúng tôi sẽ gửi mã xác thực qua SMS hoặc Zalo tới số điện thoại mà bạn nhập dưới đây:

Số điện thoại chưa đúng định dạng!
Số điện thoại này đã được xác thực!
Bạn có thể dùng Sđt này đăng nhập tại đây!
Lỗi gửi SMS, liên hệ Admin
Sắp xếp theo
🖼️

Gợi ý cho bạn

Xem thêm
🖼️

Lý thuyết Toán 11

Xem thêm
Chia sẻ
Chia sẻ FacebookChia sẻ TwitterSao chép liên kếtQuét bằng QR Code
Mã QR Code
Đóng