|
 Thuật ngữ VietnamBiz
Kiến thức Kinh tế

Khoảng tin cậy (Confidence Interval) là gì? Những quan niệm sai lầm về Khoảng tin cậy

16:25 | 07/11/2019
Chia sẻ
Khoảng tin cậy (tiếng Anh: Confidence Interval) là khái niệm trong thống kê biểu diễn xác suất tham số tổng thể sẽ nằm giữa hai giá trị được đặt trong một tỉ lệ thời gian nhất định.
image5

Hình minh họa. Nguồn: 365datascience.com

Khoảng tin cậy

Khái niệm

Khoảng tin cậy trong tiếng Anh là Confidence Interval.

Khoảng tin cậy là khái niệm trong thống kê biểu diễn xác suất tham số tổng thể sẽ nằm giữa hai giá trị được đặt trong một tỉ lệ thời gian nhất định.

Khoảng tin cậy đo lường mức độ không chắc chắn hoặc chắc chắn trong phương pháp lấy mẫu. Khoảng tin cậy có thể có bất kì con số xác suất nào, trong đó phổ biến nhất là độ tin cậy 95% hoặc 99%.

Khoảng tin cậy và độ tin cậy có liên quan đến nhau nhưng không hoàn toàn giống nhau.

Hiểu về Khoảng tin cậy

Các nhà thống kê sử dụng khoảng tin cậy để đo lường sự không chắc chắn. Ví dụ, một nhà nghiên cứu chọn ngẫu nhiên các mẫu khác nhau từ cùng một tổng thể và tính khoảng tin cậy cho mỗi mẫu. Các bộ dữ liệu kết quả cho ra là khác nhau, một số khoảng bao gồm tham số tổng thể thực tế và một số khác thì không.

Khoảng tin cậy là một phạm vi các giá trị có khả năng chứa một tham số tổng thể không xác định. Mức độ tin cậy đề cập đến tỉ lệ phần trăm của xác suất hay độ chắc chắn khoảng tin cậy sẽ chứa tham số tổng thể thực tế khi lấy ra một mẫu ngẫu nhiên nhiều lần. Hoặc, theo qui chuẩn chung, "Chúng ta chắc chắn 99% (độ tin cậy) rằng hầu hết các bộ dữ liệu này (các khoảng tin cậy) có chứa tham số tổng thực tế."

Ví dụ về Khoảng tin cậy

Giả sử một nhóm các nhà nghiên cứu đang nghiên cứu về chiều cao của các cầu thủ bóng rổ ở trường trung học. Các nhà nghiên cứu lấy một mẫu ngẫu nhiên từ tổng thể và thiết lập chiều cao trung bình là 188cm. Giá trị trung bình 188cm là giá trị được ước tính từ trung bình dân số. 

Giá trị ước tính có hạn chế là nó không cho biết sự không chắc chắn của việc ước tính, hay nhóm nhà nghiên cứu không ý thức rõ về mẫu cho giá trị trung bình 188cm này có thể cách xa giá trị trung bình của tổng thể như thế nào.

Thiết lập khoảng tin cậy 95% bằng cách sử dụng giá trị trung bình và độ lệch chuẩn của mẫu với giả định là phân phối chuẩn, giả sử các nhà nghiên cứu tìm ra được điểm giới hạn trên và dưới có chứa giá trị trung bình thực tế trong 95% tổng thời gian hay khoảng tin cậy là giữa 183cm và 193cm. Nếu các nhà nghiên cứu lấy 100 mẫu ngẫu nhiên trong toàn bộ số người chơi bóng rổ ở trường trung học, thì giá trị trung bình sẽ nằm trong khoảng từ 183cm đến 193cm trong 95 mẫu được lấy.

Nếu các nhà nghiên cứu muốn độ tin cậy cao hơn nữa, họ có thể mở rộng khoảng tin cậy lên 99%. Làm như vậy sẽ luôn tạo ra một khoảng tin cậy lớn hơn, vì nó bao hàm số mẫu lớn hơn. Nếu họ thiết lập khoảng tin cậy 99% là từ 178cm đến 198cm, họ có thể mong đợi 99 trong số 100 mẫu được xem xét có chứa giá trị trung bình giữa các con số này. Độ tin cậy 90% có nghĩa là chúng ta mong đợi 90% các khoảng ước tính có bao hàm tham số tổng thể. Tương tự, độ tin cậy 99% có nghĩa là 95% các khoảng sẽ bao gồm tham số.

Những quan niệm sai lầm về Khoảng tin cậy

Quan niệm sai lầm lớn nhất về khoảng tin cậy là chúng đại diện cho tỉ lệ phần trăm số liệu từ một mẫu nhất định nằm giữa giới hạn trên và dưới. Ví dụ, người ta có thể hiểu sai khoảng tin cậy 99% đã nói ở trên từ 178cm đến188cm cho biết 99% dữ liệu trong một mẫu ngẫu nhiên nằm giữa các con số này. Điều này là không chính xác và có một phương pháp phân tích thống kê riêng biệt tồn tại để xác định điều này. 

Các ý chính

- Khoảng tin cậy là khoảng xác suất tham số tổng thể sẽ nằm giữa hai giá trị được xác định.

- Khoảng tin cậy đo lường mức độ không chắc chắn hoặc chắc chắn trong phương pháp lấy mẫu.

- Thông thường, khoảng tin cậy phản ánh mức độ tin cậy 95% hoặc 99%.

(Theo Investopedia)

Lê Thảo