Chọn mẫu ngẫu nhiên hệ thống (Systematic Sampling) trong thống kê là gì?
Hình minh họa. Nguồn: Analytics Vidhya
Chọn mẫu ngẫu nhiên hệ thống
Khái niệm
Chọn mẫu ngẫu nhiên hệ thống trong tiếng Anh là systematic sampling.
Chọn mẫu ngẫu nhiên hệ thống là phương pháp chọn mẫu mà mỗi đơn vị mẫu được chọn căn cứ vào từng khoảng cách nhất định từ danh sách đã được sắp xếp sẵn của tổng thể chung.
Các bước thực hiện chọn mẫu ngẫu nhiên hệ thống
Trình tự được tiến hành như sau:
- Trước hết sắp xếp các đơn vị tổng thể theo trình tự nào đó, sau đó đánh số thứ tự các đơn vị trong danh sách (Ví dụ: tăng dần hoặc giảm dần của lượng biến theo tiêu thức cần nghiên cứu; hoặc theo vần A, B, C,...).
- Căn cứ vào trật tự sắp xếp này, sau một khoảng cách nhất định lại chọn ra một đơn vị mẫu, sau đó cứ cách đều d đơn vị lại chọn ra 1 đơn vị vào mẫu,…cứ như thế cho đến khi chọn đủ số đơn vị của mẫu. Khoảng cách để chọn ra đơn vị mẫu được tính là:
d = N / n (trong đó: N là số đơn vị tổng thể chung, n là số đơn vị của tổng thể mẫu).
Ví dụ: Chẳng hạn chúng ta tiến hành chọn ra 293 doanh nghiệp trong một địa phương có 3000 doanh nghiệp, theo phương pháp chọn mẫu ngẫu nhiên hệ thống, việc đầu tiên chúng ta sẽ tính khoảng cách d.
d = N / n = 3000 / 293 = 10,23
Chúng ta sẽ làm tròn xuống, khoảng cách chọn được xác định d = 10.
Tiếp theo, chúng ta sắp xếp danh sách các doanh nghiệp này theo tiêu thức nào đó (chẳng hạn theo tên doanh nghiệp hay theo phương hướng,...).
Trong nhóm 10 doanh nghiệp đầu tiên sẽ lấy ngẫu nhiên một doanh nghiệp nào đó, (chẳng hạn lấy được doanh nghiệp thứ 6, tiến hành chọn các doanh nghiệp tiếp theo là doanh nghiệp thứ 16, 26, 36, 46,... cho đến khi lấy đủ 293 doanh nghiệp).
Ưu, nhược điểm của phương pháp chọn mẫu ngẫu nhiên hệ thống
Phương pháp chọn mẫu này có thủ tục đơn giản, rút ngắn được thời gian cũng như chi phí, khi các đơn vị rải đều ra trong toàn bộ tổng thể thì tính chất đại biểu của mẫu cao. Nhưng ngược lại cũng có khả năng xảy ra sai số hệ thống, là sai số luôn lệch về một phía đối với trị số thực tế, thấp hơn hoặc cao hơn so với giá trị đó.
(Theo Giáo trình Thống kê doanh nghiệp, NXB Đại học Kinh tế quốc dân)