Home » HỌC » Thực hành mô hình hồi quy dữ liệu bảng bằng phần mềm STATA
dữ liệu bảng

Thực hành mô hình hồi quy dữ liệu bảng bằng phần mềm STATA

Trong những năm gần đây, tôi nhận thấy số lượng các luận văn thạc sĩ ngành tài chính sử dụng dữ liệu bảng (panel data) ngày càng nhiều. Phần lớn các đề tài xoay quanh chủ đề điều hành doanh nghiêp (corporate governance) hay thành quả tài chính (financial performance) của công ty... Xu hướng làm đề tài loại này trở nên phổ biến là do số lượng các doanh nghiêp niêm yết ngày càng nhiều kể từ khi thị trường chứng khoán Việt Nam được thành lập (2000). Những doanh nghiêp niêm yết từ 5 năm trở lên cũng chiếm đến vài trăm trong tổng số hơn 700 doanh nghiệp ở 2 sàn. Với dữ liệu bảng, số lượng quan sát được nhân lên nhiều lần, đáp ứng được yêu cầu về cỡ mẫu của luận văn.

Hướng dẫn thực hành

Trong bài viết này tôi sẽ trình bày về cách chạy mô hình dữ liệu bảng trên STATA. Phần mềm STATA phù hợp hơn so với Eviews trong việc xử lý các vấn đề của mô hình dữ liệu bảng. Có lẽ vì dễ sử dụng mà phần lớn các trường đại học tại Việt Nam vẫn dạy Eviews cho sinh viên như một chương trình duy nhất.

Có hai kỹ thuật để phân tích dữ liệu bảng đó là phân tích tác động cố định (fixed effect) và tác động ngẫu nhiên (random effect). Để xác định sử dụng mô hình nào thì cần phải thực hiện kiểm định Hausman.

Trước tiên, để nhập dữ liệu vào STATA thì bạn cứ copy nguyên cột và dòng từ file excel dữ liệu ra như cách làm trong SPSS hay Eviews (hoặc nhập bằng cách import từ file Excel như sau: File > Import > Excel spreadsheet ). Để khai báo dữ liệu bảng, bạn dùng lệnh xset.

Ví dụ: xset firm year (firm phải là dữ liêu chéo hay cross-section và year là dữ liệu thời gian hay period). Nếu xuất hiện lỗi string variable not allowed thì bạn cần chuyển các biến từ dạng chuỗi ký tự (string) về dạng số (num) như sau: encode firm, gen (firm1). Kể từ sau đó, bạn sử dụng firm1 thay cho firm.

Lệnh để chạy mô hình tác động cố định (FE effect): xtreg y x1, fe

Mô hình ngẫu nhiên (random effect): xtreg y x1, re

Trong đó x1 là biến độc lập, y là biết phụ thuộc; re và fe là tham số của lệnh.

Kiểm định Hausman

Mục tiêu của kiểm định Hausman là xác định mô hình FE hay RE là phù hợp với dữ liêu. Thứ tự các lệnh như sau:

Vui lòng  đăng nhập hoặc đăng ký để đọc tiếp

Bài viết liên quan

Hướng dẫn thực hành chạy mô hình dữ liệu bảng trên... Mặc dù Eviews xử lý không tốt đối với dữ liệu bảng nhưng tôi vẫn muốn viết riêng một bài cho nó. Một số bạn sinh viên khi lần đầu học thực hành kinh tế lượng thì việc bắt đầu bằng Eviews là một lựa ch...
Khắc phục hiện tượng phương sai sai số thay đổi tr... Dữ liệu bảng là loại dữ liệu kết hợp giữa hai chiều: chiều không gian (cross-section) và chiều thời gian (period). Khi chạy mô hình dữ liệu bảng bằng STATA, bạn sử dụng kiểm định Hausman để lựa chọn m...
Thực hành mô hình logit khi biến phụ thuộc có nhiề... Trong trường hợp bạn muốn chạy mô hình logit mà biến phụ thuộc có nhiều hơn 2 lựa chọn, công thức lệnh sẽ khác đi một chút:   Như ví dụ ở trên, biến phụ thuộc có 3 lựa chọn: Không đồng ý, Đ...
Mô hình hồi quy dữ liệu bảng – Phần 1 (tác đ... Mô hình hồi quy dữ liệu bảng (Panel Data Regresion Model) là mô hình phân tích hồi quy mà dữ liệu của nó có dạng chuỗi thời gian (time-series) kết hợp với dữ liệu chéo (cross-section). Dữ liệu bảng gi...