[Level II] Quantitative Methods

[Tổng hợp các kiến thức cơ bản] Module 4: Các dạng mở rộng của hồi quy đa biến (Extensions of Multiple Regression)

Tổng hợp các kiến thức quan trọng, cần lưu ý khi học Module 4 môn Quantitative Methods trong chương trình CFA level 2

1. Quan sát có tác động đặc biệt đến mô hình

1.1. Khái niệm

Một biến quan sát có tác động đặc biệt đến mô hình là một biến mà khi thêm vào mô hình có thể dẫn đến sự thay đổi lớn.

Một biến quan sát có tác động đặc biệt có thể có:

  • Yếu tố đòn bẩy cao (high leverage point): điểm có X đột biến so với các X khác.

  • Điểm ngoại lệ (outlier): điểm có Y đột biến so với các Y khác

Đường nét đứt thể hiển mẫu hồi quy đã bao gồm yếu tố đòn bẩy cao và điểm ngoại lệ. Đường nét liền không bao gồm yếu tố đòn bẩy cao và điểm ngoại lệ.

1.2. Hệ quả của biến có tác động đặc biệt

Nếu điểm đòn bẩy cao và điểm ngoại lệ tách biệt so với phần còn lại của mẫu  tách biệt so với đường hồi quy, chúng có thể gây ảnh hưởng đến các hệ số góc và tính chính xác của mô hình.

1.3. Sử dụng hệ số Leverage để phát hiện điểm có yếu tố đòn bẩy cao

Hệ số Leverage (0 < < 1) được dung để đo khoảng cách giữa quan sát thứ i của một trong các biến độc lập với trung bình mẫu của biến đó.

→ Biến quan sát có khả năng là biến có tác động lớn đến mô hình.

1.4. Sử dụng Studentized residuals để phát hiện điểm ngoại lai

Studentized residuals là một dạng kiểm định t được tính bằng cách lấy một phần dư chia cho độ lệch chuẩn của nó.

Bước 1: Ước lượng mô hình hồi quy với n quan sát, lần lượt loại từng quan sát một, mỗi lần đều ước lượng một mô hình hồi quy mới với n - 1 quan sát.

Bước 2: Với quan sát i, tính toán phần dư giữa giá trị thực với giá trị tính từ mô hình với quan sát, từ đó ta có .

Bước 3: Tính studentized residual

Trong đó:

là phần dư với quan sát thứ i bị loại bỏ

là độ lệch chuẩn của phần dư

là số biến độc lập

là trung bình bình phương sai số của mô hình hồi quy sau khi loại bỏ quan sát thứ i

là giá trị leverage của quan sát thứ i

Bước 4: So sánh  với giá trị tới hạn từ phân bố t với df = n - k - 2. Nếu  > giá trị tới hạn của kiểm định t → biến quan sát có khả năng là biến có tác động lớn đến mô hình.

2. Biến giả (Dummy variables)

Biến giả, hay còn gọi là các biến định tính, là công cụ để đưa vào mô hình hồi quy những biến mà không thể lượng hóa ngay được, ví dụ như giới tính, tôn giáo, nhưng lại tác động tới giá trị của biến phụ thuộc. Biến giả có thể nhận một trong hai giá trị, 0, hoặc 1.

Để phân biệt giữa n phân loại, ta cần n-1 biến giả

Ví dụ: Để biểu thị các doanh nghiệp thuộc 1 trong 5 lĩnh vực Technology, Financial Services, Health Care, Energy, Food & Beverage, ta cần 4 biến giả tương ứng với Technology, Financial Services, Health Care, Energy. Ngành Food & Beverage không được chỉ định sẽ trở thành nhóm “cơ sở” hoặc “kiểm soát” và độ dốc của từng biến giả được diễn giải tương ứng với nhóm cơ sở.

Industry sector

Dummy variables

Technology

Financial Services

Health Care

Energy

Technology

1

0

0

0

Financial Services

0

1

0

0

Health Care

0

0

1

0

Energy

0

0

0

1

Food & Beverage

0

0

0

0

2.1. Biến giả có hệ số tự do

Với biến giả có hệ số tự do , đường hồi quy nếu D = 1 sẽ di chuyển song song một khoảng cách bằng .

Diễn giải: Giữ nguyên X không đổi, giá trị Y khi thuộc nhóm 2 sẽ cao hơn giá trị Y khi thuộc nhóm 1 một lượng bằng đơn vị.

2.2. Biến giả có hệ số góc

Với biến giả có hệ số góc , đường hồi quy nếu D = 1 sẽ di chuyển theo một góc với .

Diễn giải: Khi X tăng 1 đơn vị, nhóm 2 làm cho Y tăng nhiều hơn nhóm 1 một lượng bằng đơn vị.

2.3. Kiểm định ý nghĩa thống kê của biến giả

Sử dụng các kiểm định t và kiểm định F để kiểm tra các giả thuyết:

  • : Nhóm biến này không có ý nghĩa về mặt thống kê.
  • : Nhóm biến này có ý nghĩa về mặt thống kê.

Đại lượng kiểm định t và F tương tự mô hình hồi quy đa biến thông thường.

3. Biến phụ thuộc định tính

Biến phụ thuộc định tính (Qualitative dependent variables) là biến có vai trò phân loại kết quả vào các nhóm khác nhau. Đối với hồi quy tuyến tính thông thường, giá trị dự báo Y có thể nhận giá trị lớn hơn 1 hoặc nhỏ hơn 0, trong khi xác suất chỉ nhận giá trị từ 0 đến 1. Ta cần sử dụng phép biến đổi logistic để biến đổi giá trị Y.

Biến đổi logistic là một phương trình toán học sử dụng để biến đổi các xác suất hoặc tỉ lệ thành giá trị trên một thang đo liên tiếp, thường là từ âm đến dương vô cùng. Quy trình biến đổi logistic gồm 3 bước:

Bước 1: Đặt p là xác suất điều kiện được thỏa mãn, hay xác suất sự kiện xảy ra

Bước 2: Lấy là tỷ lệ odd của một sự kiện

Bước 3: Lấy là log odds hay hàm logit

Ta có kết quả của biến đổi logistic:

Mô hình hồi quy logistic: là mô hình sử dụng biến đổi logistic của xác suất xảy ra sự kiện (p) sang dạng log odds làm biến phụ thuộc, từ đó ước lượng xác suất của một kết quả rời rạc dựa trên giá trị của các biến độc lập.

So sánh mô hình logit và mô hình tuyến tính:

  Mô hình tuyến tính Mô hình logit
Phương pháp ước lượng Bình phương tối thiểu (OLS) Ước lượng hợp lý tối đa (MLE)
Diễn giải hệ số hồi quy Sự thay đổi của biến phụ thuộc trên một đơn vị thay đổi của biến độc lập, với tất cả các biến độc lập khác không đổi Sự thay đổi trong “log Odds” của một sự kiện xảy ra trên mỗi đơn vị thay đổi của biến độc lập, với tất cả các biến độc lập khác không đổi
Kiểm định 1 biến độc lập Sử dụng t-test
Kiểm định toàn bộ mô hình Sử dụng F-test Sử dụng tỷ số khả dĩ (LR) với phân phối Chi bình phương
Hệ số xác định Hệ số Pseudo

 

Nếu bạn cần thêm thông tin, đừng quên liên hệ với chúng tôi:

Bộ phận trải nghiệm học viên tại SAPP
Hotline: 1900 2225 (nhánh số 2)
Email: support@sapp.edu.vn