Home » HỌC » Mô hình hồi quy theo biến giả – Phần 3 (Mô hình probit)
Mô hình logit

Mô hình hồi quy theo biến giả – Phần 3 (Mô hình probit)

Khuyến mãi mới

Mô hình probit hay còn có tên gọi là mô hình normit. Tên gọi probit bắt nguồn từ chữ Probability và unit. Mô hình này áp dụng đối với các biến phụ thuộc có dạng nhị phân. Ví dụ biến phụ thuộc là khả năng kết hôn của một người. Nếu người này kết hôn thì sẽ nhận giá trị là 1 và ngược lại là 0.

Xem thêm: Giới thiệu về mô hình Logit

Ý tưởng của mô hình probit

Mô hình probit cho rằng quyết định kết hôn bị tác động bởi một biến tiềm ẩn nào đó. Biến tiềm ẩn này được gọi là chỉ số hữu dụng utility index I. Biến chỉ số này bị ảnh hưởng bởi các biến giải thích:

I_{i}=\beta _{1}+\beta _{2}X_{i}

Một người sẽ quyết định kết hôn khi giá trị I này vượt qua một ngưỡng nào đó tạm gọi là I*. Giá trị I* này chúng ta không thể biết được nhưng giả định nó có phân phối chuẩn. Xác suất để người đó không kết hôn sẽ có dạng:

P_{i}=P(I_{i}^{*}\leq I_{i})=P(Z_{i}\leq \beta _{1}+\beta _{2}X_{i})=F(\beta _{1}+\beta _{2}X_{i})

Hàm F là hàm phân phối tích lũy chuẩn (CDF). Vì P là xác suất người đó kết hôn nên bạn phải tính nghịch đảo của F, do đó ta có công thức:

Ii = F-1(Pi)=β12Xi

Ước lượng biến tiềm ẩn

Đối với dữ liệu theo nhóm

Từ thông tin từ mẫu, bạn có thể xác định được \widehat{P_{i}}. Ví dụ khảo sát 100 người và có 40 người kết hôn thì \widehat{P_{i}}=0.4. Ii được ước lượng thông qua hàm CDF.

Đối với dữ liệu cá biệt

Tương tự như mô hình xác suất tuyến tính, bạn vẫn phải sử dụng phương pháp ước lượng xác suất cực đại.

Xem thêm: Mô hình xác suất tuyến tính

Ý nghĩa của hệ số hồi quy

Trong mô hình logit, hệ số hồi quy giải thích sự ảnh hưởng của biến giải thích đối với log tỷ lệ nguy cơ. Trong mô hình logit, tỷ lệ thay đổi của xác suất một sự kiện được xác định bởi βjPi(1 − Pi) trong đó βlà hệ số ước lượng từng phần của biến giải thích thứ j. Đối với mô hình probit thì phức tạp hơn, tỷ lệ thay đổi xác suất bị ảnh hưởng bởi βjf(Zi), trong đó f(Zi) là hàm mật độ của các biến được chuẩn hóa.

Trong những phần tiếp theo; tôi sẽ trình bày cách chạy mô hình probit và giải thích ý nghĩa của nó.

 

Bài viết liên quan

Mô hình hồi quy theo biến giả (Qualitative Respons... Mô hình hồi quy theo biến giả (Qualitative Response Regression Model) là mô hình có biến phụ thuộc là biến giả (dummy variable). Đây là một dạng của mô hình xác suất. Mô hình này khác với mô hình hồi ...
Ước lượng mô hình phân phối trễ theo phương pháp K... Trong bài viết trước về Giới thiệu mô hình phân phối trễ, tôi có đề cập đến hạn chế theo phương pháp ước lượng OLS là tính không chắc chắn về số lượng độ trễ, bậc tự do bị giảm và đặc tính chuỗi thời ...
Tương quan hai biến (bivariate), từng phần (partia... Trong phân tích tương quan, bạn đọc thường hay dễ bị nhầm lẫn giữa hai khái niệm là part correlation và partial correlation. Tương quan từng phần (partial correlation) hay còn được gọi là tương quan r...
Giới thiệu về mô hình phân phối trễ (Distributed-L... Trong nghiên cứu về kinh tế, mối quan hệ giữa biến phụ thuộc và biến độc lập thường hiếm khi xảy ra đồng thời. Sự tác động của biến X đòi hỏi một thời gian sau mới tác động đến biến Y. Khi chính phủ g...