Độ lệch (Skewness) là gì? Công thức tính độ lệch
Hình minh họa. Nguồn: 365datascience.com
Độ lệch
Khái niệm
Độ lệch trong tiếng Anh là Skewness.
Nếu phân hối hình chuông bị dịch chuyển sang trái hoặc sang phải, nó được cho là bị lệch. Độ lệch được coi là một đại diện cho mức độ khác biệt của một phân phối nhất định so với phân phối chuẩn. Một phân phối chuẩn có độ lệch bằng 0, trong khi phân phối phân phối xác suất loga chuẩn sẽ có lệch về phía bên phải.
Ba phân phối xác suất được minh họa dưới đây có độ lệch dương (hoặc lệch phải) ở mức độ ngày càng tăng. Phân phối lệch âm còn được gọi là phân phối lệch trái. Độ lệch được sử dụng cùng với độ nhọn để đánh giá khả năng các biến cố rơi vào đuôi của phân phối xác suất tốt hơn.
Hình minh họa về độ lệch. Nguồn: Investopedia
Hiểu về Độ lệch
Bên cạnh độ lệch dương và âm, phân phối cũng có thể được cho là không có độ lệch hoặc không xác định được độ lệch. Số liệu ở phía bên phải của đường cong phân phối có thể giảm dần với mức độ khác với số liệu ở phía bên trái. Độ lệch âm (negative skewness) có đuôi dài hơn hoặc rộng hơn ở phía bên trái của phân phối, trong khi độ lệch dương (positive skewness) có đuôi dài hơn hoặc rộng hơn ở bên phải.
Độ lệch âm và độ lệch dương. Nguồn: Wikipedia
Giá trị trung bình của dữ liệu có độ lệch dương sẽ lớn hơn trung vị. Trong một phân phối bị lệch âm là trường hợp hoàn toàn ngược lại, giá trị trung bình của dữ liệu bị lệch âm sẽ nhỏ hơn giá trị trung vị. Nếu biểu đồ dữ liệu đối xứng, phân phối có độ lệch bằng 0 bất kể đuôi dài hay rộng.
Có một số cách để đo độ lệch. Hệ số độ lệch thứ nhất và thứ hai của Pearson là hai công cụ phổ biến nhất. Hệ số độ lệch đầu tiên của Pearson, hay độ lệch yếu vị Pearson, được tính bằng cách trừ giá trị trung bình cho yếu vị và chia kết quả cho độ lệch chuẩn. Hệ số độ lệch thứ hai của Pearson hay độ lệch trung vị Pearson được tính bằng cách trừ trung vị từ giá trị trung bình, nhân với 3 và chia kết quả cho độ lệch chuẩn.
Công thức tính độ lệch của Pearson
SK1 = (Giá trị trung bình - yếu vị)/ Độ lệch chuẩn
SK2 = (Giá trị trung bình - trung vị)/ Độ lệch chuẩn
Trong đó:
SK1 là Hệ số độ lệch đầu tiên của Pearson, hay độ lệch yếu vị Pearson
SK2 là Hệ số độ lệch thứ hai của Pearson, hay độ lệch trung vị Pearson
Hệ số độ lệch đầu tiên của Pearson hữu dụng hơn nếu tập dữ liệu có yếu vị mạnh. Nếu tập dữ liệu có yếu vị yếu hoặc nhiều yếu vị, hệ số độ lệch thứ hai của Pearson có thể thích hợp hơn vì nó không dựa vào yếu vị để đo của xu hướng tập trung của tập dữ liệu.
Độ lệch cho biết điều gì
Các nhà đầu tư chú ý đến độ lệch khi quan sát phân phối lợi nhuận vì nó, giống như độ nhọn, xem xét các điểm cực trị của tập dữ liệu thay vì chỉ tập trung vào giá trị trung bình. Các nhà đầu tư ngắn hạn và trung hạn đặc biệt cần xem xét các điểm cực trị bởi vì họ ít có khả năng giữ một chứng khoán trong thời gian dài.
Các nhà đầu tư thường sử dụng độ lệch chuẩn để dự đoán lợi nhuận trong tương lai, nhưng độ lệch chuẩn có giả định là phân phối chuẩn. Tuy nhiên có ít phân phối lợi nhuận gần với phân phối chuẩn, độ lệch là một thước đo tốt hơn để dựa vào đó dự đoán hiệu suất.
Rủi ro độ lệch là rủi ro gia tăng trong việc tăng một điểm dữ liệu có độ lệch cao trong phân phối lệch. Nhiều mô hình tài chính cố gắng dự đoán hiệu suất trong tương lai của một tài sản với giả định là phân phối chuẩn. Nếu dữ liệu bị sai lệch, mô hình này sẽ luôn đánh giá thấp rủi ro sai lệch trong dự đoán của nó. Dữ liệu càng sai lệch, mô hình tài chính này càng kém chính xác.
(Theo Investopedia)