Hướng dẫn thực hành mô hình Logit bằng phần mềm STATA

0
Khuyến mãi mới

Mô hình Logit và Probit về cơ bản thì giống nhau, chỉ có sự khác biệt về phân phối. Mô hình logit thì tuân theo phân phối logistic chuẩn tích lũy (F) còn mô hình Probit thì tuân theo phân phối chuẩn tích lũy (Φ). Trong bài viết này tôi sẽ hướng dẫn chạy mô hình logit bằng STATA và giải thích ý nghĩa của từng tham số trong mô hình. Mô hình probit sẽ được đề cập đến trong các bài viết tiếp theo.

Xem thêm: Giới thiệu mô hình Logistic

Thực hành ước lượng mô hình Logit theo tỷ số nguy cơ (odds ratio)

Mô hình logit khi biến phụ thuộc có hơn 2 lựa chọn 

Chạy mô hình

Đầu tiên, bạn chạy lệnh sau:

logit depvar indepvars [if][in][weight][, options] 

Trong đó:

  • depvar: biến phụ thuộc
  • indepvars: các biến độc lập
  • [if][in][weight][, options]: các thông số phụ của mô hình, bạn có thể bỏ qua các thông số này nếu thấy không cần thiết.

Hoặc bạn có thể chạy mô hình Logistic từ Menu của STATA: Statistics > Binary outcomes > Logistic regression

Lệnh logit trong STATA sẽ tạo ra mô hình logit với biến phụ thuộc nhị phân theo phương pháp xác suất cực đại (maximum likelihood). Biến phụ thuộc bằng 1 nếu kết quả của nó thể hiện sự tích cực (positive) và ngược lại nhận giá trị bằng 0.

Ví du: Tôi có dữ liệu về số lượng xe hơi trong kho là 74 chiếc, trong đó 52 là nhập khẩu và 22 là sản xuất trong nước. Tôi cần lập mô hình logit để tính được khi nào chiếc xe đó là sản xuất trong nước hay nhập khẩu với thông số về khối lượng (weight) và quãng đường xe có thể chạy (mpg).

Làm sạch dữ liệu

Đầu tiên, bạn chạy lệnh:

keep mpg weight foreign

  • foreign ở đây là biến phụ thuộc thể hiện xuất xứ của xe, weight và mpg là biến độc lập.
  • Lệnh (keep) này là bước để làm sạch dữ liệu, những biến không có trong danh sách sẽ bị loại bỏ. Tôi thực hiện thao tác này cho gọn dữ liệu trong trường hợp bộ dữ liệu có quá nhiều biến.

Phương trình

Biến foreign sẽ nhận giá trị là 1 nếu là xe nhập khẩu và 0 nếu là xe sản xuất trong nước.

Ví dụ này sẽ có phương trình như sau:

Pr(foreign = 1) = F(β0 + β1weight + β2mpg)

Chạy lệnh trong STATA:

logit foreign weight mpg

Giải thích kết quả

Mô hình logit

  • Prob > chi2 = 0.0000 cho thấy tất cả hệ số của các biến trong mô hình có kết quả khác 0 và mô hình phù hợp
  • Giá trị P>|z| đều nhỏ hơn 10% cho thấy các hệ số có ý nghĩa thống kê
  • Hệ số Coef. ở dạng log-odds nên không thể giải thích theo cách thông thường của hồi quy OLS. Hệ số hồi quy cho thấy nếu khối lượng xe và mpg càng lớn thì xác suất để xe đó là xe nhập càng thấp, tuy nhiên  để giải thích ý nghĩa con số của chúng thì bạn phải ước lượng xác suất của foreign=1

Tiếp theo, bạn gõ lệnh:

Vui lòng nâng cấp tài khoản V.I.P để đọc tiếp

Leave A Reply