Tổng hợp các kiến thức quan trọng, cần lưu ý khi học Module 6 môn Quantitative Methods trong chương trình CFA level 2
Ở phần trước, ta đã tổng hợp kiến thức mô hình xu hướng tuyến tính, mô hình xu hướng dạng loga tuyến tính, và mô hình tự hồi quy (autoregressive model). Ở bài đọc này, ta tiếp tục tìm hiểu về chủ đề phân tích theo chuỗi thời gian, với những vấn đề phổ biến của mô hình tự hồi quy như bước đi ngẫu nhiên, nghiệm đơn vị, tính thời vụ, tính không đồng nhất có điều kiện tự hồi quy.
1. Bước đi ngẫu nhiên (Random walk)
1.1. Khái niệm
Bước đi ngẫu nhiên đơn giản (Simple random walk) là một chuỗi thời gian trong đó giá trị của chuỗi trong một khoảng thời gian là giá trị của chuỗi trong khoảng thời gian trước đó cộng với một biến lỗi ngẫu nhiên không thể đoán trước.
Trong đó, dự báo tốt nhất về chính là và
- : Giá trị kỳ vọng của mỗi phần tử dư là bằng không.
- : Phương sai của phần tử dư là không đổi
- , nếu i ≠ j: Không có mối tương quan chuỗi trong các phần tử dư.
Bước đi ngẫu nhiên có độ lệch (random walk with drift) có , so với bước đi ngẫu nhiên đơn giản có .
Trong đó: là hằng số độ lệch
1.2. Nghiệm đơn vị (Unit root)
Bước đi ngẫu nhiên được biểu diễn tổng quát dưới dạng:
Trong đó:
(đối với bước đi ngẫu nhiên không có độ lệch)
(đối với bước đi ngẫu nhiên có độ lệch)
(đối với bước đi ngẫu nhiên có hoặc không có độ lệch)
Như chúng ta đã tìm hiểu về mức hoàn nguyên trung bình, trong cả hai trường hợp (có hoặc không có độ lệch), mức hoàn nguyên trung bình là:
→ Không xác định
Tuy nhiên, chuỗi thời gian phải có mức hoàn nguyên trung bình hữu hạn (Giá trị kỳ vọng không đổi và hữu hạn) để có tính dừng hiệp phương sai (Covariance stationary). Vậy bước đi ngẫu nhiên, có hoặc không có độ lệch, không mang tính dừng hiệp phương sai và thể hiện nghiệm đơn vị (unit root) .
Kết luận:
Nếu giá trị của hệ số trễ bằng 1 , chuỗi thời gian được cho là có nghiệm đơn vị và sẽ tuân theo quy trình bước đi ngẫu nhiên.
Do chuỗi thời gian theo bước đi ngẫu nhiên không mang tính dừng hiệp phương sai, nên việc lập mô hình chuỗi thời gian như vậy trong mô hình AR có thể dẫn đến những suy luận không chính xác.
2. Kiểm định nghiệm đơn vị cho tính không cố định (Nonstationary)
Để xác định xem một chuỗi thời gian có mang tính dừng hiệp phương sai hay không, chúng ta có thể chạy mô hình AR và kiểm tra các mối tương quan chuỗi hoặc thực hiện kiểm tra Dickey Fuller.
2.1. Chạy mô hình AR và kiểm tra mối tương quan chuỗi
Một mô hình AR sẽ được ước tính và ý nghĩa thống kê của các mối tương quan chuỗi ở các độ trễ khác nhau sẽ được kiểm tra.
Một tính dừng thường sẽ có các kết quả phần tử dư tự tương quan không có ý nghĩa về mặt thống kê (khác 0) ở mọi độ trễ hoặc kết quả phần tử dư tự tương quan giảm dần về 0 khi số lượng độ trễ tăng lên.
Cách tiếp cận này ít rõ ràng hơn so với một phép kiểm tra phổ biến hiện nay về tính không cố định được gọi là phép kiểm tra Dickey Fuller đối với nghiệm đơn vị.
2.2. Thực hiện kiểm định Dickey Fuller
Kiểm định Dickey Fuller đã biến đổi mô hình AR(1) để chạy hồi quy đơn giản:
Từ mô hình cơ bản của AR(1):
↓
Trừ ở cả 2 vế:
↓
Kiểm tra xem hệ số mới khác 0 hay không bằng cách sử dụng t-test đã sửa đổi (modified t-test)
Các bước chi tiết như sau:
Lập các giả thuyết: Chuỗi thời gian AR(1) sẽ có mức hoàn nguyên trung bình hữu hạn khi giá trị tuyệt đối của hệ số trễ nhỏ hơn 1. Do đó, kiểm định Dickey Fuller là kiểm định t một đuôi và các giả thuyết được cấu trúc như sau:
(Chuỗi thời gian có nghiệm đơn vị)
(Chuỗi thời gian không có nghiệm đơn vị)
Đại lượng kiểm định:
Trong đó: là sai số chuẩn của hệ số
Quy tắc ra quyết định: Bác bỏ H0 nếu với
→ Chuỗi dữ liệu không có nghiệm đơn vị.
→ Chuỗi dữ liệu tồn tại tính dừng hiệp phương sai.
Ngược lại, nếu H0 không bị bác bỏ:
→ Chuỗi dữ liệu có nghiệm đơn vị.
→ Chuỗi dữ liệu tồn tại tính không ổn định (nonstationary)
3. Vi phân bậc I (First differencing)
Nếu ta cho rằng chuỗi thời gian là một bước đi ngẫu nhiên (tức là có nghiệm đơn vị), ta có thể chuyển đổi dữ liệu thành chuỗi thời gian có tính dừng hiệp phương sai bằng cách sử dụng quy trình Vi phân bậc 1 (First differencing): Trừ giá trị của chuỗi thời gian trong kỳ liền trước ra khỏi giá trị hiện tại để xác định biến phụ thuộc mới, y.
Nếu chuỗi thời gian x có hiện tượng nghiệm đơn vị:
↓
Trình bày y dưới dạng mô hình AR(1):
( với )
↓
Giá trị hoàn nguyên trung bình:
(giá trị hữu hạn)
Chuỗi thời gian được biến đổi này có tính dừng hiệp phương sai.
4. Tính thời vụ (Seasonality)
4.1. Khái niệm
Tính thời vụ (Seasonality) trong một chuỗi thời gian là mẫu hình thời gian có xu hướng lặp lại từ năm này sang năm khác.
→ Khi có tính thời vụ, việc lập mô hình dữ liệu chuỗi thời gian liên quan sẽ bị xác định sai trừ khi mô hình AR kết hợp các tác động của tính thời vụ.
→ Cần phải đưa biến thời vụ vào mô hình để làm cho mô hình chính xác hơn.
4.2. Điều chỉnh cho tính thời vụ
Để điều chỉnh tính thời vụ trong mô hình AR, ta thêm vào mô hình ban đầu một biến trễ (tương ứng với cùng kỳ năm trước) dưới dạng một biến độc lập khác.
Giả sử mô hình có mối tương quan giữa các phầ tử dư đáng kể ở kỳ trễ thứ 4 cho thấy tính thời vụ trong chuỗi thời gian hàng quý.
→ Thêm giá trị trễ của biến phụ thuộc vào mô hình AR(1) ban đầu tương ứng với mẫu hình theo mùa:
Lưu ý rằng việc đưa vào biến độ trễ theo mùa không dẫn đến mô hình AR(2). Nó dẫn đến mô hình AR(1) kết hợp với biến độ trễ theo mùa.
5. Tính không đồng nhất có điều kiện tự hồi quy (Autoregressive conditional heteroskedasticity - ARCH)
5.1. Định nghĩa
Khi kiểm tra một chuỗi thời gian, chẳng hạn như mô hình AR, nếu phương sai của các phần tử dư trong kỳ (t) phụ thuộc vào phương sai các phần tử dư kỳ trước (t-1) → tồn tại ARCH.
→ Sai số chuẩn của các hệ số hồi quy trong mô hình AR và kiểm định giả thuyết của các hệ số này đều không hợp lệ.
5.2. Kiểm tra tính không đồng nhất có điều kiện tự hồi quy
Mô hình ARCH được sử dụng để thể hiện tính không đồng nhất có điều kiện tự hồi quy, trong đó phương sai của các phần tử dư trong một kỳ phụ thuộc vào phương sai của các phần tử dư trong kỳ trước.
Mô hình hồi quy ARCH(1) được biểu diễn dưới dạng:
Trong đó: là hằng số và là phần tử dư
Ta sử dụng t-test để kiểm tra ARCH. Nếu hệ số khác 0 về mặt thống kê thì chuỗi thời gian là ARCH(1) và ngược lại. Các bước thực hiện:
Lập giả thuyết:
(chuỗi thời gian không phải ARCH(1))
(chuỗi thời gian là ARCH(1))
Đại lượng kiểm định:
Trong đó: là sai số chuẩn của
Quy tắc ra quyết định: Bác bỏ H0 nếu với
→ Chuỗi thời gian là ARCH(1).
Cách chữa ARCH: Sử dụng các quy trình hồi quy để điều chỉnh độ không đồng nhất (chẳng hạn như bình phương tối thiểu tổng quát) để ước tính sai số chuẩn của các tham số.
5.3. Dự báo phương sai của chuỗi thời gian
Nếu chuỗi thời gian có lỗi ARCH, ta có thể sử dụng mô hình ARCH đó để dự đoán phương sai của phần tử dư trong các giai đoạn tương lai:
6. Các vấn đề cần cân nhắc trước khi hồi quy chuỗi thời gian
6.1. Đồng liên kết (Cointegration)
Đồng liên kết (Cointegration) có nghĩa là hai chuỗi thời gian được liên kết về mặt kinh tế (liên quan đến cùng các biến vĩ mô) hoặc theo cùng một xu hướng và mối quan hệ đó dự kiến sẽ không thay đổi. Để kiểm tra xem hai chuỗi thời gian có được đồng liên kết hay không, ta hồi quy một biến trên biến kia bằng mô hình sau:
Trong đó:
= giá trị của chuỗi thời gian y tại thời điểm t
= giá trị của chuỗi thười gian x tại thời điểm t
Ta sử dụng t-test Dickey Fuller để kiểm tra nghiệm đơn vị của mô hình dạng phần tử dư (*).
Nếu kiểm định bác bỏ giả thuyết tồn tại nghiệm đơn vị:
→ Các phần tử dư sinh ra bởi 2 chuỗi thời gian có tính hiệp phương sai dừng và 2 chuỗi là đồng liên kết.
→ Phương pháp hồi quy có thể được sử dụng để mô hình hóa mối quan hệ của chúng và ngược lại.
Đôi khi, ta sẽ tiến hành hồi quy sử dụng hai chuỗi thời gian (ví dụ: chuỗi thời gian sử dụng hai biến khác nhau). Mô hình:
Một hoặc cả hai chuỗi thời gian này có thể dễ bị ảnh hưởng bởi tính không cố định à Chạy các thử nghiệm DF riêng biệt để kiểm tra xem chuỗi hai thời gian có nghiệm đơn vị (unit roots) hay không → 5 kết quả có thể xảy ra:
5 kết quả có thể xảy ra: |
Có thể sử dụng hồi quy tuyến tính? |
|
1 |
Cả hai chuỗi thời gian đều có tính dừng hiệp phương sai |
Có, các hệ số phải đáng tin cậy về mặt thống kê |
2 |
Chỉ có chuỗi thời gian biến phụ thuộc là có tính dừng hiệp phương sai |
Không, các hệ số sẽ không đáng tin cậy |
3 |
Chỉ có chuỗi thời gian biến độc lập là có tính dừng hiệp phương sai |
|
4 |
Cả hai chuỗi thời gian đều không có tính hiệp phương sai và hai chuỗi này không đồng liên kết |
Không |
5 |
Cả hai chuỗi thời gian đều không có tính hiệp phương sai và hai chuỗi này đồng liên kết |
Có |
7. Xác định mô hình chuỗi thời gian thích hợp
Để xác định loại mô hình nào phù hợp nhất để đáp ứng nhu cầu phần tích, ta làm theo các nguyên tắc sau để đảm bảo rằng mô hình được xác định chính xác:
Bước 1: Xác định mục tiêu:
Mối quan hệ của một biến với các biến khác (ví dụ: chuỗi thời gian đồng tích hợp, hồi quy bội cắt ngang) (cross-sectional multiple regression) hoặc biến theo thời gian (ví dụ: mô hình xu hướng) (trend model) có đang được cố gắng mô hình hóa không?
Bước 2: Nếu một biến riêng lẻ được mô hình hóa, hãy vẽ đồ thị các giá trị của biến đó theo thời gian và tìm kiếm các đặc điểm cho thấy tính không cố định (nonstationary):
Sự thay đổi về cấu trúc (Structural change) được biểu thị bằng sự thay đổi đáng kể trong dữ liệu được vẽ tại một thời điểm dường như chia dữ liệu thành hai hoặc nhiều mẫu riêng biệt.
→ Nên sử dụng hai mô hình khác nhau để kiểm tra xem chuỗi thời gian có thực sự dịch chuyển hay không.
→ Nếu chuỗi thời gian thay đổi đáng kể thì một chuỗi thời gian duy nhất bao trùm toàn bộ thời kỳ có thể sẽ tạo ra kết quả không đáng tin cậy.
Bước 3: Nếu không có tính thời vụ hoặc sự thay đổi cơ cấu, hãy sử dụng mô hình xu hướng (trend model).
→ Nếu biểu đồ dữ liệu theo đường thẳng có độ dốc lên hoặc xuống thì sử dụng mô hình xu hướng tuyến tính (linear trend model).
→ Nếu biểu đồ dữ liệu theo đường cong, hãy sử dụng mô hình xu hướng log-tuyến tính. (log-linear trend model).
Bước 4: Chạy phân tích xu hướng, tính toán phần tử dư và kiểm tra mối tương quan nối tiếp bằng cách sử dụng thử nghiệm Durbin Watson.
→ Nếu không có tương quan chuỗi thì có thể sử dụng mô hình.
→ Nếu có tương quan chuỗi thì có thể sử dụng mô hình khác (ví dụ: mô hình AR).
Bước 5: Nếu dữ liệu có mối tương quan nối tiếp, hãy kiểm tra lại tính dừng của dữ liệu trước khi chạy mô hình AR.
Nếu dữ liệu không cố định, hãy xử lý dữ liệu để sử dụng trong mô hình AR như sau:
→ Nếu dữ liệu có xu hướng tuyến tính, hãy thực hiện vi phân bậc nhất.
→ Nếu dữ liệu có xu hướng hàm mũ, hãy lấy vi phân bậc nhất log tự nhiên của dữ liệu.
→ Nếu có sự thay đổi cấu trúc trong dữ liệu, hãy chạy hai mô hình riêng biệt như đã thảo luận ở trên.
→ Nếu dữ liệu có thành phần theo mùa, hãy kết hợp tính thời vụ trong mô hình AR.
Bước 6: Sau lần vi phần bậc nhất, nếu chuỗi có tính dừng hiệp phương sai, hãy chạy mô hình AR(1) và kiểm tra mối tương quan chuỗi và tính thời vụ.
→ Nếu không còn tương quan chuỗi thì có thể sử dụng mô hình.→ Nếu vẫn còn tương quan chuỗi, hãy kết hợp các giá trị trễ của biến vào mô hình AR cho đến khi loại bỏ mọi tương quan chuỗi.
Bước 7: Kiểm tra ARCH: Hồi quy bình phương của phần tử dư trên bình phương giá trị trễ của phần dư.
→ Nếu hệ số không khác biệt đáng kể so với 0 về mặt thống kê thì có thể sử dụng mô hình.
→ Nếu hệ số khác 0 đáng kể về mặt thống kê thì có ARCH. Ta có thể chỉnh sửa bằng cách sử dụng bình phương tối thiểu tổng quát (generalized least squares).
Bước 8: Nếu hai mô hình đáng tin cậy về mặt thống kê đã được phát triển và cần xác định mô hình nào dự báo tốt hơn, hãy tính RMSE ngoài mẫu của chúng.
Nếu bạn cần thêm thông tin, đừng quên liên hệ với chúng tôi: