|
 Thuật ngữ VietnamBiz
Kiến thức Kinh tế

Qui tắc đã kiểm chứng (Empirical Rule) là gì? Ví dụ về Qui tắc đã kiểm chứng

09:58 | 08/01/2020
Chia sẻ
Qui tắc đã kiểm chứng (tiếng Anh: Empirical Rule) là qui tắc thống kê qui định rằng đối với phân phối chuẩn, hầu hết tất cả dữ liệu nằm trong ba độ lệch chuẩn (kí hiệu là σ) của giá trị trung bình (kí hiệu là µ).
Qui tắc đã kiểm chứng (Empirical Rule) là gì? Ví dụ về Qui tắc đã kiểm chứng - Ảnh 1.

Hình minh họa. Nguồn: Datascienceupskill.com

Qui tắc đã kiểm chứng

Khái niệm

Qui tắc đã kiểm chứng trong tiếng Anh là Empirical Rule.

Qui tắc đã kiểm chứng, còn được gọi là qui tắc ba sigma hay qui tắc 68-95-99.7, là qui tắc thống kê qui định rằng đối với phân phối chuẩn, hầu hết tất cả dữ liệu nằm trong ba độ lệch chuẩn (kí hiệu là σ) của giá trị trung bình (kí hiệu là µ). 

Qui tắc đã kiểm chứng (Empirical Rule) là gì? Ví dụ về Qui tắc đã kiểm chứng - Ảnh 2.

Hình minh họa. Nguồn: Brainly.in

Qui tắc đã kiểm chứng cho rằng 68% quan sát nằm trong độ lệch chuẩn đầu tiên (µ ± σ), 95% quan sát nằm trong hai độ lệch chuẩn đầu tiên (µ ± 2σ) và 99,7% nằm trong ba độ lệch chuẩn đầu tiên (µ ± 3 σ).

Đặc điểm Qui tắc đã kiểm chứng

Qui tắc đã kiểm chứng thường được sử dụng trong thống kê để dự báo các kết quả cuối cùng. 

Sau khi tính toán độ lệch chuẩn và trước khi thu thập dữ liệu thực tế, qui tắc này có thể được sử dụng để ước lượng cơ bản về kết quả hay dữ liệu thực tế sắp xảy ra. 

Xác suất ước lượng này được sử dụng do việc thu thập dữ liệu phù hợp thường tốn thời gian, thậm chí trong một số trường hợp việc thu thập dữ liệu đầy đủ là không thể.

Qui tắc đã kiểm chứng cũng được sử dụng như một công cụ kiểm tra tính chuẩn tắc cơ bản của phân phối. 

Nếu có quá nhiều điểm dữ liệu nằm ngoài ranh giới ba độ lệch chuẩn, cho thấy phân phối đang được quan sát không phải là phân phối chuẩn.  

Ví dụ về Qui tắc đã kiểm chứng 

Giả sử một quần thể động vật trong vườn thú được cho là theo phân phối chuẩn. Mỗi con vật sống trung bình 13,1 tuổi (giá trị trung bình) và độ lệch chuẩn tuổi thọ của chúng là 1,5 năm. 

Nếu muốn biết xác suất một con vật sẽ sống lâu hơn 14,6 năm, họ có thể sử dụng qui tắc đã kiểm chứng. Biết giá trị trung bình của phân phối là 13,1 tuổi, các độ tuổi sau đây đại diện cho mỗi độ lệch chuẩn:  

- Một độ lệch chuẩn (µ ± σ): từ (13.1 - 1.5) đến (13.1 + 1.5) hay từ 11.6 đến 14.6 tuổi. 

- Hai độ lệch chuẩn (µ ± 2σ): từ 13.1 - (2 x 1.5) đến 13.1 + (2 x 1.5) hay từ 10.1 đến 16.1 tuổi. 

- Ba độ lệch chuẩn (µ ± 3σ): từ 13,1 - (3 x 1,5) đến 13,1 + (3 x 1,5), hay từ 8,6 đến 17,6 tuổi. 

Để biết xác suất một con vật sẽ sống lâu hơn 14,6 năm, cần tính tổng xác suất các con vật sống được 14,6 năm hoặc lâu hơn.

Qui tắc đã kiểm chứng cho thấy 68% phân phối nằm trong một độ lệch chuẩn, trong ví dụ này là từ 11,6 đến 14,6 năm. Do đó, 32% còn lại của phân phối nằm ngoài phạm vi này, một nửa nằm trên mức 14,6 tuổi và một nửa nằm dưới mức 11,6 tuổi.

Vì vậy, xác suất con vật sống hơn 14,6 tuổi là 16% (bằng 32% chia 2).   

Giả sử thay một số thông số như sau, giá trị tuổi trung bình của sở thú là 10 tuổi, độ lệch chuẩn là 1,4 năm. Để tìm ra xác suất một con vật sống hơn 7,2 năm, đầu tiên xác định phân phối này có dạng như sau:  

- Một độ lệch chuẩn (µ ± σ): từ 8,6 đến 11,4 năm.

- Hai độ lệch chuẩn (µ ± 2σ): từ 7,2 đến 12,8 năm.

- Ba độ lệch chuẩn (µ ± 3σ): từ 5,8 đến 14,2 năm.

Qui tắc đã kiểm chứng cho biết 95% phân phối nằm trong hai độ lệch chuẩn. Do đó, có 5% phân phối nằm ngoài hai độ lệch chuẩn, một nửa trên 12,8 năm và một nửa dưới 7,2 năm. 

Vì vậy xác suất một con vật sống hơn 7,2 năm là: 95% + (5%/2) = 97,5%   

(Theo Investopedia)

Lê Thảo