Công Thức Tính Khoảng Biến Thiên, Khoảng Tứ Phân Vị và Giá Trị Ngoại Lệ: Chi Tiết và Dễ Hiểu

Trong thống kê mô tả, Tính Khoảng Biến Thiên và các khái niệm liên quan như khoảng tứ phân vị, giá trị ngoại lệ đóng vai trò quan trọng trong việc phân tích và hiểu rõ sự phân tán của dữ liệu. Bài viết này sẽ trình bày chi tiết các công thức, ví dụ minh họa và bài tập tự luyện để giúp bạn nắm vững kiến thức này.

1. Công Thức Tính Khoảng Biến Thiên và Các Khái Niệm Liên Quan

Cho một mẫu số liệu: x1, x2, …, xn.

a) Khoảng Biến Thiên (Range):

Khoảng biến thiên là thước đo đơn giản nhất về độ phân tán của dữ liệu. Nó được tính bằng hiệu giữa giá trị lớn nhất và giá trị nhỏ nhất trong mẫu.

Công thức: R = xmax – xmin

Trong đó:

  • R: Khoảng biến thiên
  • xmax: Giá trị lớn nhất trong mẫu
  • xmin: Giá trị nhỏ nhất trong mẫu

b) Khoảng Tứ Phân Vị (Interquartile Range – IQR):

Khoảng tứ phân vị đo lường sự phân tán của 50% dữ liệu trung tâm. Nó ít bị ảnh hưởng bởi các giá trị ngoại lệ hơn so với khoảng biến thiên.

Công thức: ∆Q = Q3 – Q1

Trong đó:

  • ∆Q: Khoảng tứ phân vị
  • Q3: Tứ phân vị thứ ba (percentile thứ 75)
  • Q1: Tứ phân vị thứ nhất (percentile thứ 25)

Để tính Q1 và Q3, cần sắp xếp mẫu số liệu theo thứ tự tăng dần.

c) Giá Trị Ngoại Lệ (Outliers):

Giá trị ngoại lệ là những điểm dữ liệu quá lớn hoặc quá nhỏ so với phần còn lại của mẫu. Chúng có thể ảnh hưởng đáng kể đến các thống kê mô tả khác như trung bình và độ lệch chuẩn.

Một giá trị x được xem là ngoại lệ nếu:

  • x > Q3 + 1.5 * ∆Q
  • hoặc x < Q1 – 1.5 * ∆Q

Ảnh: Minh họa khoảng tứ phân vị và các giá trị Q1, Q2 (Me), Q3 trên biểu đồ hộp, giúp xác định các giá trị ngoại lệ.

2. Ví Dụ Minh Họa

Ví dụ 1: Cho mẫu số liệu sau về chiều cao (cm) của 10 học sinh: 150, 152, 155, 158, 160, 162, 165, 168, 170, 175.

Tính khoảng biến thiên và khoảng tứ phân vị.

Giải:

  • Sắp xếp dữ liệu (đã sắp xếp).
  • Khoảng biến thiên: R = 175 – 150 = 25 cm
  • Để tìm Q1 và Q3, ta xác định vị trí của chúng:
    • Q1 là trung vị của nửa dưới: 150, 152, 155, 158, 160. Vậy Q1 = 155 cm.
    • Q3 là trung vị của nửa trên: 162, 165, 168, 170, 175. Vậy Q3 = 168 cm.
  • Khoảng tứ phân vị: ∆Q = 168 – 155 = 13 cm

Ví dụ 2: Cho bảng số liệu sau về số giờ tự học mỗi tuần của sinh viên:

Số giờ 0 2 4 6 8 10 12
Số sinh viên 5 10 15 20 15 10 5

Tính khoảng biến thiên và khoảng tứ phân vị.

Giải:

Dữ liệu được viết lại: 0, 0, 0, 0, 0, 2, 2, …, 2 (10 lần), 4, …, 4 (15 lần), …, 12, …, 12 (5 lần).

  • Khoảng biến thiên: R = 12 – 0 = 12 giờ.
  • Tổng số sinh viên: n = 5 + 10 + 15 + 20 + 15 + 10 + 5 = 80
  • Q2 (trung vị) = (x40 + x41)/2 = (6 + 6)/2 = 6
  • Q1 là trung vị của nửa dưới (40 giá trị đầu): Q1 = (x20 + x21)/2 = (4 + 4)/2 = 4
  • Q3 là trung vị của nửa trên (40 giá trị sau): Q3 = (x60 + x61)/2 = (8 + 8)/2 = 8
  • Khoảng tứ phân vị: ∆Q = 8 – 4 = 4 giờ.

Ví dụ 3: Xác định giá trị ngoại lệ trong ví dụ 2.

Giải:

  • Q1 = 4
  • Q3 = 8
  • ∆Q = 4
  • Q1 – 1.5 ∆Q = 4 – 1.5 4 = -2
  • Q3 + 1.5 ∆Q = 8 + 1.5 4 = 14

Vậy không có giá trị ngoại lệ nào trong mẫu số liệu này vì không có giá trị nào nhỏ hơn -2 hoặc lớn hơn 14.

Ảnh: Bảng thống kê điểm số và số lượng sinh viên, hỗ trợ tính toán khoảng biến thiên và khoảng tứ phân vị.

3. Bài Tập Tự Luyện

Bài 1: Điểm kiểm tra môn Toán của một nhóm học sinh: 5, 6, 7, 8, 9, 10, 4, 5, 6, 7. Tính khoảng biến thiên và khoảng tứ phân vị của mẫu số liệu này.

Bài 2: Nhiệt độ trung bình hàng tháng (độ C) trong một năm tại Hà Nội: 16, 17, 20, 24, 28, 30, 32, 31, 29, 25, 22, 18. Tính khoảng biến thiên và khoảng tứ phân vị.

Bài 3: Số lượng khách hàng đến một cửa hàng mỗi ngày trong một tuần: 20, 22, 25, 28, 30, 23, 21. Tính khoảng biến thiên và khoảng tứ phân vị.

Bài 4: Cho mẫu số liệu: 1, 2, 3, 4, 5, 6, 7, 8, 9, 100. Tìm các giá trị ngoại lệ (nếu có).

Bài 5: Thời gian (phút) hoàn thành một bài kiểm tra của một nhóm học sinh: 10, 12, 15, 18, 20, 22, 25, 11, 13, 60. Tìm các giá trị ngoại lệ (nếu có).

Kết luận:

Hiểu rõ và vận dụng thành thạo các công thức tính khoảng biến thiên, khoảng tứ phân vị và xác định giá trị ngoại lệ là rất quan trọng trong việc phân tích dữ liệu. Hy vọng bài viết này đã cung cấp cho bạn kiến thức và công cụ cần thiết để làm chủ các khái niệm này. Luyện tập thường xuyên với các bài tập sẽ giúp bạn nắm vững kiến thức và áp dụng vào thực tế một cách hiệu quả.

Comments

No comments yet. Why don’t you start the discussion?

Leave a Reply

Your email address will not be published. Required fields are marked *