|
 Thuật ngữ VietnamBiz
Kiến thức Kinh tế

Phân phối T (T Distribution) là gì? Sự khác biệt giữa Phân phối T và Phân phối chuẩn

16:42 | 07/11/2019
Chia sẻ
Phân phối T (tiếng Anh: T Distribution) còn được gọi là phân phối T Student là một loại phân phối xác suất tương tự như phân phối chuẩn hay phân phối hình chuông nhưng có đuôi "nặng" hơn.
maxresdefault

Hình minh họa. Nguồn: Youtube.com

Phân phối T

Khái niệm

Phân phối T còn được gọi là phân phối T Student trong tiếng Anh là T Distribution hay Student's t-distribution.

Phân phối T là một loại phân phối xác suất tương tự như phân phối chuẩn hay phân phối hình chuông nhưng có đuôi "nặng" hơn.

Các phân phối T có các giá trị cực trị cơ hội xuất hiện thường xuyên hơn so với phân phối chuẩn do đó đuôi của phân phối T nặng hơn.

Độ nặng của đuôi được xác định bởi một tham số của phân phối T được gọi là bậc tự do, các giá trị càng nhỏ thì đuôi càng nặng và các giá trị càng cao làm cho phân phối T càng giống với phân phối chuẩn với giá trị trung bình là 0 và độ lệch chuẩn là 1. 

Khi một mẫu của n quan sát được lấy từ một tổng thể có phân phối chuẩn và giá trị trung bình là M và độ lệch chuẩn là D thì giá trị trung bình của mẫu là m và độ lệch chuẩn của mẫu là d, sẽ khác với M và D do tính chất ngẫu nhiên của mẫu.

Điểm z có thể được tính với độ lệch chuẩn tổng thể là:

Z = (m - M) / (D/n2)

Giá trị này có phân phối chuẩn với trung bình bằng 0 và độ lệch chuẩn bằng 1. Nhưng khi điểm z được tính bằng độ lệch chuẩn ước tính từ mẫu ngẫu nhiên, ta có:

T = (m - M) / (d/n2)

Sự khác biệt giữa d và D làm cho phân phối T có (n - 1) bậc tự do thay vì phân phối chuẩn với trung bình bằng 0 và độ lệch chuẩn bằng 1.

Ví dụ về Phân phối T

Lấy ví dụ sau đây để tìm hiểu cách phân phối T được sử dụng trong phân tích thống kê. Đầu tiên, hãy nhớ rằng khoảng tin cậy cho giá trị trung bình là một phạm vi các giá trị được tính toán từ dữ liệu, được dùng để tính trung bình tổng thể. Khoảng này được xác định bằng m + hoặc - t*d/n2, trong đó t là giá trị tới hạn của phân phối T.

Chẳng hạn, khoảng tin cậy 95% cho lợi nhuận trung bình của Chỉ số Trung bình công nghiệp Dow Jones trong 27 ngày giao dịch trước ngày 9/11/2001 là -0.33%, (+/- 2.055) * 1.07 / sqrt (27), cho giá trị trung bình lợi nhuận (liên tục) là một số từ -0.75% đến +0.09%. Giá trị 2.055 là giá trị sai số tiêu chuẩn để điều chỉnh của phân phối T.

Bởi vì phân phối T có đuôi mập hơn phân phối chuẩn, nên nó có thể được sử dụng như một mô hình lợi nhuận tài chính có độ nhọn quá cao, điều này sẽ cho phép việc tính toán giá trị chịu rủi ro (VaR) thực tế hơn.

Sự khác biệt giữa Phân phối T và Phân phối chuẩn

Phân phối chuẩn được sử dụng khi phân phối tổng thể được coi là chuẩn. Phân phối T tương tự như phân phối chuẩn với đuôi mập hơn. Cả hai đều giả định một tổng thể có phân phối chuẩn. Phân phối T có độ nhọn lớn hơn so với phân phối chuẩn. Xác suất nhận được các giá trị xa giá trị trung bình của phân phối T là lớn hơn so với phân phối chuẩn.

Hạn chế của Phân phối T

Phân phối T có thể có sai lệch độ chính xác lớn hơn so với phân phối chuẩn. Sự thiếu sót này chỉ xuất hiện khi có cần có độ chuẩn hoàn hảo. Tuy nhiên, sự khác biệt giữa việc sử dụng phân phối chuẩn và phân phối T là tương đối nhỏ.

Các ý chính

- Phân phối T là phân phối xác suất liên tục của điểm z khi sử dụng độ lệch chuẩn mẫu thay cho độ lệch chuẩn tổng thể.

- Phân phối T giống như phân phối chuẩn có dạng hình chuông và đối xứng, nhưng nó có đuôi nặng hơn nghĩa là nó có xu hướng có các giá trị nằm xa giá trị trung bình của nó.

- T-test được sử dụng trong thống kê để ước tính mức ý nghĩa.

(Theo Investopedia)

Lê Thảo