Tổng hợp các kiến thức quan trọng, cần lưu ý khi học Module 4 môn Quantitative Methods trong chương trình CFA level 2
1. Quan sát có tác động đặc biệt đến mô hình
1.1. Khái niệm
Một biến quan sát có tác động đặc biệt đến mô hình là một biến mà khi thêm vào mô hình có thể dẫn đến sự thay đổi lớn.
Một biến quan sát có tác động đặc biệt có thể có:
-
Yếu tố đòn bẩy cao (high leverage point): điểm có X đột biến so với các X khác.
-
Điểm ngoại lệ (outlier): điểm có Y đột biến so với các Y khác
Đường nét đứt thể hiển mẫu hồi quy đã bao gồm yếu tố đòn bẩy cao và điểm ngoại lệ. Đường nét liền không bao gồm yếu tố đòn bẩy cao và điểm ngoại lệ.
1.2. Hệ quả của biến có tác động đặc biệt
Nếu điểm đòn bẩy cao và điểm ngoại lệ tách biệt so với phần còn lại của mẫu và tách biệt so với đường hồi quy, chúng có thể gây ảnh hưởng đến các hệ số góc và tính chính xác của mô hình.
1.3. Sử dụng hệ số Leverage để phát hiện điểm có yếu tố đòn bẩy cao
Hệ số Leverage (0 < < 1) được dung để đo khoảng cách giữa quan sát thứ i của một trong các biến độc lập với trung bình mẫu của biến đó.
→ Biến quan sát có khả năng là biến có tác động lớn đến mô hình.
1.4. Sử dụng Studentized residuals để phát hiện điểm ngoại lai
Studentized residuals là một dạng kiểm định t được tính bằng cách lấy một phần dư chia cho độ lệch chuẩn của nó.
Bước 1: Ước lượng mô hình hồi quy với n quan sát, lần lượt loại từng quan sát một, mỗi lần đều ước lượng một mô hình hồi quy mới với n - 1 quan sát.
Bước 2: Với quan sát i, tính toán phần dư giữa giá trị thực với giá trị tính từ mô hình với quan sát, từ đó ta có .
Bước 3: Tính studentized residual
Trong đó:
là phần dư với quan sát thứ i bị loại bỏ
là độ lệch chuẩn của phần dư
k là số biến độc lập
là trung bình bình phương sai số của mô hình hồi quy sau khi loại bỏ quan sát thứ i
là giá trị leverage của quan sát thứ i
Bước 4: So sánh với giá trị tới hạn từ phân bố t với df = n - k - 2. Nếu > giá trị tới hạn của kiểm định t → biến quan sát có khả năng là biến có tác động lớn đến mô hình.
1.5. Sử dụng chỉ số Cook’s D để phát hiện quan sát có tác động đặc biệt
Chỉ số Cook’s D () là một chỉ số dung để phát hiện điểm có tác động đăng biệt. Chỉ số này đo lường mức độ thay đổi của giá trị ước lượng hồi quy nếu quan sát i bị xóa khỏi mẫu.
Trong đó:
: phần dư của quan sát i
MSE là trung bình bình phương sai số của mô hình hồi quy ước lượng
-
Nếu > 0.5, quan sát thứ i có thể có tác động đặc biệt, cần tính toán thêm để kết luận.
-
Nếu > 1.0, quan sát thứ i rất có thể là một điểm có tác động đặc biệt.
-
Nếu , quan sát thứ i rất có thể là một điểm có tác động đặc biệt.
2. Biến giả (Dummy variables)
Biến giả, hay còn gọi là các biến định tính, là công cụ để đưa vào mô hình hồi quy những biến mà không thể lượng hóa ngay được, ví dụ như giới tính, tôn giáo, nhưng lại tác động tới giá trị của biến phụ thuộc. Biến giả có thể nhận một trong hai giá trị, 0, hoặc 1.
Để phân biệt giữa n phân loại, ta cần n-1 biến giả
Ví dụ: Để biểu thị các doanh nghiệp thuộc 1 trong 5 lĩnh vực Technology, Financial Services, Health Care, Energy, Food & Beverage, ta cần 4 biến giả tương ứng với Technology, Financial Services, Health Care, Energy. Ngành Food & Beverage không được chỉ định sẽ trở thành nhóm “cơ sở” hoặc “kiểm soát” và độ dốc của từng biến giả được diễn giải tương ứng với nhóm cơ sở.
Industry sector |
Dummy variables |
|||
Technology |
Financial Services |
Health Care |
Energy |
|
Technology |
1 |
0 |
0 |
0 |
Financial Services |
0 |
1 |
0 |
0 |
Health Care |
0 |
0 |
1 |
0 |
Energy |
0 |
0 |
0 |
1 |
Food & Beverage |
0 |
0 |
0 |
0 |
2.1. Biến giả có hệ số tự do
Với biến giả có hệ số tự do , đường hồi quy nếu D = 1 sẽ di chuyển song song một khoảng cách bằng .
Diễn giải: Giữ nguyên X không đổi, giá trị Y khi thuộc nhóm 2 sẽ cao hơn giá trị Y khi thuộc nhóm 1 một lượng bằng đơn vị.
2.2. Biến giả có hệ số góc
Với biến giả có hệ số góc , đường hồi quy nếu D = 1 sẽ di chuyển theo một góc với .
Diễn giải: Khi X tăng 1 đơn vị, nhóm 2 làm cho Y tăng nhiều hơn nhóm 1 một lượng bằng đơn vị.
2.3. Kiểm định ý nghĩa thống kê của biến giả
Sử dụng các kiểm định t và kiểm định F để kiểm tra các giả thuyết:
- : Nhóm biến này không có ý nghĩa về mặt thống kê.
- : Nhóm biến này có ý nghĩa về mặt thống kê.
Đại lượng kiểm định t và F tương tự mô hình hồi quy đa biến thông thường.
3. Biến phụ thuộc định tính
Biến phụ thuộc định tính (Qualitative dependent variables) là biến có vai trò phân loại kết quả vào các nhóm khác nhau. Đối với hồi quy tuyến tính thông thường, giá trị dự báo Y có thể nhận giá trị lớn hơn 1 hoặc nhỏ hơn 0, trong khi xác suất chỉ nhận giá trị từ 0 đến 1. Ta cần sử dụng phép biến đổi logistic để biến đổi giá trị Y.
Biến đổi logistic là một phương trình toán học sử dụng để biến đổi các xác suất hoặc tỉ lệ thành giá trị trên một thang đo liên tiếp, thường là từ âm đến dương vô cùng. Quy trình biến đổi logistic gồm 3 bước:
Bước 1: Đặt p là xác suất điều kiện được thỏa mãn, hay xác suất sự kiện xảy ra
Bước 2: Lấy là tỷ lệ odd của một sự kiện
Bước 3: Lấy là log odds hay hàm logit
Ta có kết quả của biến đổi logistic:
Mô hình hồi quy logistic: là mô hình sử dụng biến đổi logistic của xác suất xảy ra sự kiện (p) sang dạng log odds làm biến phụ thuộc, từ đó ước lượng xác suất của một kết quả rời rạc dựa trên giá trị của các biến độc lập.
So sánh mô hình logit và mô hình tuyến tính:
Mô hình tuyến tính | Mô hình logit | |
Phương pháp ước lượng | Bình phương tối thiểu (OLS) | Ước lượng hợp lý tối đa (MLE) |
Diễn giải hệ số hồi quy | Sự thay đổi của biến phụ thuộc trên một đơn vị thay đổi của biến độc lập, với tất cả các biến độc lập khác không đổi | Sự thay đổi trong “log Odds” của một sự kiện xảy ra trên mỗi đơn vị thay đổi của biến độc lập, với tất cả các biến độc lập khác không đổi |
Kiểm định 1 biến độc lập | Sử dụng t-test | |
Kiểm định toàn bộ mô hình | Sử dụng F-test | Sử dụng tỷ số khả dĩ (LR) với phân phối Chi bình phương |
Hệ số xác định | Hệ số Pseudo |
Nếu bạn cần thêm thông tin, đừng quên liên hệ với chúng tôi: