Tổng hợp các kiến thức quan trọng, cần lưu ý khi học Module 3 môn Quantitative Methods trong chương trình CFA level 2
Trong Module 2 của môn Quantitative, người học cần phải nắm được các kiến thức liên quan đến vấn đề đặc tả sai mô hình đối với mô hình hồi quy đa biến. Bài đọc này sẽ khái quát về các khuyết tật mô hình phổ biến, khái niệm, dấu hiệu nhận biết, ảnh hưởng và cách tránh hoặc khắc phục những khuyết tật còn tồn động trong mô hình.
1. Đặc tả mô hình
Đặc tả mô hình hồi quy (Regression model specification) là việc lựa chọn các biến độc lập hoặc các dạng thay đổi của biến (nếu có) để đưa vào mô hình hồi quy.
Để được đặc tả đúng nhất, mô hình cần đảm bảo:
Nguyên lý | Giải thích |
Mô hình nên được căn cứ vào lý luận kinh tế | Cung cấp được lý do kinh tế đằng sau việc lựa chọn các biến |
Mô hình đơn giản súc tích | Mỗi biến trong mô hình nên đóng vai trò quan trọng |
Mô hình có thể áp dụng tốt với dữ liệu ngoài mẫu | Nếu mô hình chỉ có thể giải thích được dữ liệu mẫu, mô hình này đang bị quá khớp |
Dạng hàm mô hình phải phù hợp | Nếu có tồn tại mối quan hệ phi tuyến tính giữa các biến, mô hình nên tính đến cả những yếu tố phi tuyến tính đó |
Mô hình nên thỏa mãn các giả định hồi quy | Nếu mô hình gặp các vấn đề phương sai thay đổi, tương quan chuỗi, đa cộng tuyến, cần phải xem xét lại các biến hồi quy và/hoặc dạng hàm của mô hình |
2. Đặc tả sai dạng hàm của mô hình
2.1. Thiếu các biến quan trọng
Mô hình bị thiếu biến so với các lý thuyết kinh tế. Các hệ số ước lượng của mô hình có thể bị thiên lệch nếu biến bị thiếu có tương quan với biến phụ thuộc hoặc với một hay các biến độc lập khác. Từ đó, các kiểm định giả thuyết và dự báo từ mô hình sẽ thiếu tin cậy.
2.2. Sai dạng của biến hồi quy
Mối quan hệ của biến độc lập và biến phụ thuộc có thể không phải tuyến tính → Hiện tượng tự tương quan và phương sai sai số thay đổi.
2.3. Chia tỷ lệ các biến không phù hợp
Không thay đổi những biến số cần được thay đổi để phù hợp với các biến còn lại trong mô hình → Hiện tượng phương sai sai số thay đổi và đa cộng tuyến.
2.4. Tổng hợp dữ liệu chưa phù hợp
Các thành phần trong mẫu được gộp từ các môi trường kinh tế khác nhau → Mô hình không có tính dự báo cao, hiện tượng phương sai sai số thay đổi và tự tương quan.
3. Các khuyết tật mô hình do vi phạm giả định hồi quy
3.1. Phương sai sai số thay đổi (Heteroskedasticity)
Phương sai sai số thay đổi (PSSSTĐ) xảy ra khi phương sai của các phần dư (sai số) không đồng nhất trên toàn bộ các quan sát trong một mẫu.
Có 2 trường hợp phương sai sai số thay đổi:
-
Không có điều kiện: PSSSTĐ không có sự liên quan đến các biến độc lập → Không gây ra sai lệch lớn trong phân tích hồi quy.
-
Có điều kiện: PSSSTĐ phụ thuộc vào quy mô của các biến độc lập → Gây ra sai lệch lớn trong phân tích hồi quy.
Hệ quả của PSSSTĐ bao gồm:
- Sai số chuẩn được sử dụng trong tính toán không đáng tin cậy: Nếu sai số chuẩn quá nhỏ, nhưng các hệ số ước lượng không bị ảnh hưởng → T-statistic tính ra quá lớn, H0 bị bác bỏ quá thường xuyên (Lỗi loại I). Ngược lại nếu sai số chuẩn quá lớn, H0 không thể bị bác bỏ dẫn đến lỗi loại II.
- Kiểm định F không đáng tin cậy: Nếu MSE quá nhỏ, MSR không đổi → F-statistics quá lớn → Lỗi loại I; Nếu MSE quá lớn, MSR không đổi → F-statistics quá nhỏ → Lỗi loại II.
Dấu hiệu nhận biết PSSSTĐ:
- Phương pháp 1: Vẽ biểu đồ điểm cho các phần dư với giá trị ước lượng của các quan sát
- Phương pháp 2: Sử dụng kiểm định Breusch-Pagan
Kiểm định Breusch-Pagan hồi quy bình phương phần dư của các biến độc lập theo phương trình:
Giả thuyết:
(không có hiện tượng PSSSTĐ có điều kiện)
(có hiện tượng PSSSTĐ có điều kiện)
Đại lượng kiểm định:
Trong đó:
n: số quan sát
trong phép hồi quy (1), SSR (1) là tổng bình phương hồi quy từ phép hồi quy (1), SST (1) là tổng số bình phương từ phép hồi quy (1)
Quy tắc ra quyết định: Bác bỏ H0 nếu với → Có hiện tượng PSSSTĐ.
Khắc phục lỗi PSSSTĐ: Sử dụng mô hình sai số chuẩn được điều chỉnh (robust standard errors hay White-correted standard errors) để tính toán lại kiểm định t sử dụng các hệ số góc ban đầu.
3.2. Tương quan chuỗi (Serial correlation)
Tự tương quan là hiện tượng các phần dư có tương quan lẫn nhau. Có hai dạng tự tương quan:
-
Tự tương quan dương: Phần dư dương tăng xác suất dương của phần dư tiếp theo.
-
Tự tương quan âm: Phần dư dương tăng xác suất âm của phần dư tiếp theo.
Hệ quả của hiện tượng tương quan chuỗi: Tự tương quan dẫn đến ước lượng sai độ lệch chuẩn và MSE:
-
Ước lượng sai độ lệch chuẩn (quá nhỏ)→ t-statistics quá lớn → Lỗi loại I.
-
Ước lượng sai MSE (quá nhỏ) → F-statistics quá lớn → Lỗi loại I.
Dấu hiệu nhận biết tương quan chuỗi:
- Phương pháp 1: Kiểm định Breusch-Godfrey (BG) (được dùng phổ biến)
Hồi quy phần dư với tập hợp biến độc lập ban đầu, kèm thêm m biến bổ sung đại diện cho các phần dư trễ (lagged residual). Kiểm định xem hệ số góc của ít nhất một phần dư trễ nào đó có khác 0 hay không.
Giả thuyết:
(không có hiện tượng tương quan chuỗi)
(có hiện tượng tương quan chuỗi)
Đại lượng kiểm định: Kiểm định BG được tích hợp trong hầu hết các phần mềm thống kê.
Quy tắc ra quyết định: Bác bỏ H0 nếu với
- Phương pháp 2: Kiểm định Durbin-Watson
Giả thuyết:
: Không có hiện tượng tự tương quan
: Có hiện tượng tự tương quan
Đại lượng kiểm định:Kiểm định DW được tích hợp trong hầu hết các phần mềm thống kê.
Nếu mẫu rất lớn: DW ≈ 2(1 – r)
Quy tắc ra quyết định: So sánh DW với các giá trị tới hạn trên và dưới của DW (dU, dL)
-
DW < dL: Bác bỏ , tự tương quan dương
-
dL < DW < dU: Không thể kết luận
-
dU < DW < 4 – dU: Không thể bác bỏ , không có hiện tượng tự tương quan
-
4 – dU < DW < 4 – dL: Không thể kết luận
-
4 – dL < DW: Bác bỏ , tự tương quan âm.
Khắc phục lỗi tương quan chuỗi: Sử dụng sai số chuẩn điều chỉnh (robust standard errors) để tính toán lại kiểm định t sử dụng các hệ số góc ban đầu.
3.3. Đa cộng tuyến (Multicollinearity)
Đa cộng tuyến là hiện tượng các biến độc lập trong mô hình có mối quan hệ tương quan cao với nhau.
Hệ quả của đa cộng tuyến:
- Hệ số góc có tính ổn định nhưng không đáng tin cậy
- Sai số chuẩn của hệ số góc quá lớn → Không bác bỏ được H0 (lỗi loại II)
Dấu hiệu nhận biết đa cộng tuyến:
- Phương pháp 1: Nếu có các dấu hiệu sau
-
Kiểm định t cho thấy không có hệ số nào quá lớn hơn 0 (các hệ số này không có ý nghĩa về mặt thống kê)
-
Kiểm định F có ý nghĩa thống kê và cao
-
- Phương pháp 2: Sử dụng hệ số VIF
Hồi quy một biến j theo các biến còn lại:
Giả thuyết:
: Không có hiện tượng đa cộng tuyến
: Có hiện tượng đa cộng tuyến
Đại lượng kiểm định:
Trong đó: là những biến động của biến được giải thích bởi k biến khác.
Quy tắc ra quyết định: Bác bỏ H0 nếu đủ lớn, vì VIF tăng khi tính tương quan tăng:
-
- cần xem xét kĩ lưỡng hơn về các biến độc lập
- xảy ra hiện tượng đa cộng tuyến nghiêm trọng, cần khắc phục
Khắc phục hiện tượng đa cộng tuyến:
-
Loại bớt biến độc lập ra khỏi mô hình
-
Sử dụng dạng khác của biến độc lập
-
Tăng kích thước mẫu
Nếu bạn cần thêm thông tin, đừng quên liên hệ với chúng tôi: