Phân tích nhân tố khám phá – Phần 4 (Cần bao nhiêu nhân tố?)

0
Khuyến mãi mới

Một trong những câu hỏi nhức đầu trong phân tích nhân tố khám phá đó là chúng ta cần bao nhiêu nhân tố cho mô hình? Trong thời gian hướng dẫn các đề tài luận văn, tôi nhận thấy có nhiều trường hợp số lượng các nhân tố trích ra không giống như trong lý thuyết đã đề cập. Đôi khi còn có tình huống biến số này lại chạy vào nhân tố kia hoặc ngược lại. Nói chung, những tình huống quái gở như vậy bạn sẽ gặp như cơm bữa. Đừng lo, mọi chuyện đều có cách của nó. Tôi sẽ trình bày nó ở phần cuối bài viết. Để bắt đầu, tôi sẽ đề cập đến một số phương pháp giúp bạn xác định được số lượng nhân tố cần thiết cho mô hình.

#1 Giá trị đặc trưng Eigenvalue lớn hơn 1

Các chương trình thường mặc định giữ lại những nhân tố có giá trị eigenvalue lớn hơn hoặc bằng 1. Những nhân tố có eigenvalue lớn hơn 1 có thể giải thích phương sai nhiều hơn so với 1 biến đơn lẻ. Do đó, về mặt logic, những nhân tố có giá trị eigenvalue nhỏ hơn 1 thì không cần phải giữ lại. Việc lựa chọn theo tiêu chí này có thể nảy sinh quá nhiều nhân tố hoặc bỏ sót một vài nhân tố quan trọng nào đó nếu giá trị eigenvalue của nó nhỏ hơn 1. Vậy nên bạn cần phải cực kỳ cân nhắc khi chỉ lựa chọn theo tiêu chí này.

#2 Sử dụng đồ thị độ dốc (scree plot)

Đồ thị độ dốc thể hiện giá trị eigenvalue trên trục y và số lượng nhân tố trên trục x. Đồ thị này thường được thể hiện dưới dạng đường cong dốc xuống. Thời điểm mà đường cong chuyển hướng đột ngột thì đó là số lượng các nhân tố cần được lựa chọn.

 

Tuy nhiên, cả hai cách làm này có thể tạo ra quá nhiều nhân tố không hợp lý. Như ví dụ trên tiêu chuẩn eigenvalue lớn hơn 1 sẽ đưa ra kết luận về 7 nhân tố. Đồ thị độ dốc đưa ra số lượng nhân tố thấp hơn: 3 hoặc 5 nhân tố. Bạn cần lưu ý rằng lý do chúng ta chạy phân tích nhân tố khám phá là để giảm bớt số lượng biến và qua đó có thể dễ dàng giải thích các khái niệm phức tạp (như sự hài lòng, tính vị chủng hay địa vị kinh tế xã hội). Nói cách khác, bạn cần tìm ra ít nhất nhân tố có thể giải thích được sự biến động tốt nhất của dữ liệu.

#3 Tổng phương sai được giải thích (Total percent variance explained)

Các phần mềm thường sắp xếp theo thứ tự khả năng giải thích phương sai của từng nhân tố. Các nhân tố càng ở phía dưới danh sách thì phần giải thích thêm của nó càng thấp và có khi không đáng kể. Nếu ba nhân tố đầu tiên giải thích sự biến thiên của 10 biến đầu tiên thì các nhân tố này khá tốt và có thể đại diện cho các biến. Bạn có thể bỏ qua các nhân tố còn lại mà không làm ảnh hưởng tới khả năng giải thích của các nhân tố. Ngược lại, trong trường hợp 7 nhân tố giải thích tốt nhất phương sai của 10 biến thì bạn nên sử dụng 10 biến hơn là 7 nhân tố.

Số lượng nhân tố không như kỳ vọng

Kết quả phân tích nhân tố cho ra số lượng không được như kỳ vọng, nó có thể cho ra nhiều hơn hoặc ít hơn số nhân tố mà bạn mong đợi. Việc sử dụng quá nhiều hoặc quá ít nhân tố đều ảnh hưởng đến kết quả nghiên cứu. Khi lựa chọn số lượng các nhân tố, bạn phải cân bằng giữa yêu cầu về tính phân biệt (mô hình cần ít nhân tố ) và tính hợp lý (có đủ nhân tố để giải thích). Tuy nhiên việc sử dụng nhiều nhân tố (overfactoring) tốt hơn là sử dụng ít nhân tố (underfactoring). Càng nhiều nhân tố giúp cho mô hình có thể đại diện chính xác hơn về dữ liệu nhưng nó cũng có một số hạn chế.

Vui lòng nâng cấp tài khoản V.I.P để đọc tiếp 

Leave A Reply