Nhận dạng và xử lý hiện tượng tự tương quan (autocorrelation) trong OLS

0
Khuyến mãi mới

Tự tương quan (autocorrelation) là hiện tượng các thành phần trong chuỗi các quan sát được sắp xếp theo thời gian hoặc không gian có mối quan hệ với nhau. Đây là một định nghĩa hơi hàn lâm và hơi khó hiểu. Để giải thích cho khái niệm này, tôi lấy ví dụ như sau: Giả sử hôm qua bạn chi tiêu hết 200k, hôm nay bạn chi hết 230k, ngày mai bạn chi hết 210k (chứ không phải là 50k). Bạn cảm thấy số tiền bạn tiêu xài giữa các ngày có mối quan hệ mật thiết với nhau. Mối quan hệ này được ký hiệu theo toán học là E(Ui,Ụj).  Đây là một ví dụ điển hình cho trường hợp tự tương quan đối với dữ liệu chuỗi thời gian.

Hiện tượng tự tương quan trong một số tài liệu có tên gọi khác là tương quan chuỗi (serial correlation). Có một số quan điểm cho rằng hai khái niệm này khác nhau. Tương quan chuỗi là hiện tượng tương quan giữa các dữ liệu chuỗi thời gian với nhau. Tự tương quan là hiện tượng các quan sát trong một chuỗi thời gian có tương quan với nhau. Theo tôi thì nên phân biệt rõ ràng giữa hai khái niệm này. Trong các bài viết sau tôi sẽ sử dụng tự tương quan chứ không dùng tương quan chuỗi.

Trong các mô hình nghiên cứu sử dụng OLS, hiện tượng tự tương quan và phương sai sai số thay đổi đôi khi xuất hiện đồng thời. Bạn không cần phải lo lắng về điều này vì khi khắc phục phương sai sai số thay đổi sẽ khắc phục luôn cả tự tương quan. Xem thêm: Nhận dạng và xử lý hiện tượng phương sai sai số thay đổi.

Hậu quả của tự tương quan

Hậu quả của tự tương quan thì cũng tương tự như hiện tượng phương sai sai số thay đổi. Các hàm ước lượng thông thường OLS mặc dù không chệch (biased) nhưng không phải là ước lượng có phương sai nhỏ nhất giữa các ước lượng không chệch. Nói tóm lại nó không còn là ước lượng không chệch tuyến tính tốt nhất (Best Linear Unbiased Estimation, BLUE) nữa.

Nguyên nhân của tự tương quan

#1 Tính ì của dữ liệu

Như ví dụ ở trên, chi tiêu đã trở thành thói quen thì rất khó thay đổi, vì thế dữ liệu trong quá khứ hay có tương quan với dữ liệu trong hiện tại. Điều này được gọi là hành vi có quán tính.

#2 Lập mô hình sai

Dạng hàm của mô hình không phụ hợp với dữ liệu hoặc mô hình của bạn bị thiếu biến.

#3 "Nhào nặn" dữ liệu

Ví dụ dữ liệu của bạn có khung thời gian theo tháng nhưng muốn thu thập theo quý, bạn tạo ra biến mới bằng cách tính trung bình cộng của 3 tháng lại. Khi đó các giá trị trung bình này rất dễ bị tự tương quan.

Nhận dạng tự tương quan

#1 Phương pháp đồ thị

Nếu đồ thị của phần dư xuất hiện một chiều hướng nào đó thì có khả năng xảy ra hiện tượng tự tương quan. Tuy nhiên phương pháp đồ thị chỉ là phương pháp để tham khảo (tại sao?).

 

#2 Phương pháp thống kê

Vui lòng  đăng nhập hoặc đăng ký để đọc tiếp

Leave A Reply