Mô hình hồi quy theo biến giả (Qualitative Response Regression Model) – Phần 1

0
Khuyến mãi mới

Mô hình hồi quy theo biến giả (Qualitative Response Regression Model) là mô hình có biến phụ thuộc là biến giả (dummy variable). Đây là một dạng của mô hình xác suất. Mô hình này khác với mô hình hồi quy tuyến tính cổ điển là biến phụ thuộc là biến định lượng. Các biến giả sẽ nhận giá trị là 1 hoặc 0 tương ứng với đặc điểm mà nó biểu hiện. Ví dụ biến giả là quyết định đi học cao học, nó sẽ nhận giá trị là 1 nếu người được hỏi có đi học và ngược lại sẽ nhận giá trị 0. Biến này còn được gọi là biến nhị phân (binary hay dichotomous).

Mục tiêu của mô hình

Vì giá trị của biến phụ thuộc là 0 và 1 nên chúng ta không thể ước tính giá trị trung bình như các mô hình hồi quy OLS. Mô hình này nhằm mục tiêu tìm kiếm xác suất của một sự kiện như tỷ lệ bỏ phiếu của cử tri, xác suất mua nhà... Do đó mô hình này còn được gọi là mô hình xác suất (probability model)

Phân loại mô hình

Mô hình dạng này có thể chia làm 3 loại như sau:

  1. Mô hình xác suất tuyến tính
  2. Logit model
  3. Probit model

Mô hình xác suất tuyến tính

Phương trình này có dạng Yi = β1 + β2Xi + ui . Giá trị của Y là kỳ vọng có điều kiện của X nên mô hình này còn được gọi là mô hình xác suất có điều kiện. Khác với OLS, Y tuân theo quy luật phân phối xác suất Bernoulli. Mô hình này được ước lượng tương tự như OLS nhưng nó có một số nhược điểm sau:

1. Sai số không có phân phối chuẩn

Sai số trong mô hình này không tuân theo phân phối chuẩn mà theo Bernoulli do Y tuân theo quy luật này. Tuy nhiên việc sai số không tuân theo quy luật phân phối chuẩn không phải là vấn đề nghiêm trọng đối với OLS.

Xem thêm: Trường hợp phần dư không có phân phối chuẩn

2. Phương sai sai số thay đổi

Phương sai của sai số trong mô hình này không đồng nhất do giá trị của sai số phụ thuộc vào X. Để khắc phục cái này, bạn có thể sử dụng hồi quy WLS (weighted least square).

Xem thêm: Xử lý hiện tượng phương sai sai số thay đổi

3. Giá trị kỳ vọng của Y nằm ngoài [0:1]

Mô hình này có dạng xác suất nên giá trị kỳ vọng của Y nên nằm trong khoảng [0:1] tuy nhiên không có gì đảm bảo điều này.

4. Độ phù hợp của mô hình

Các giá trị của Y không nằm gần đồ thị của phương trình nên trong mô hình này, hệ số xác định không thể sử dụng được.

Để lại bình luận bên dưới nếu bạn có thắc mắc về mô hình xác suất nhé.

Leave A Reply