Bài viết cung cấp cho người đọc kiến thức về Module 8 môn Quantitative Methods của chương trình CFA level I
[LOS 8.a] Định nghĩa giả thuyết và các cấu phần của chúng, bao gồm lỗi loại I và loại II, mức ý nghĩa, cách sử dụng mức ý nghĩa trong kiểm định giả thuyết và lực kiểm định
1. Kiểm định giả thuyết (Hypothesis testing)
Đánh giá thống kê về một tuyên bố hoặc ý tưởng liên quan đến tổng thể. Quy trình kiểm định giả thuyết sẽ bao gồm các bước sau:
-
Bước 1: Nêu giả thuyết
-
Bước 2: Xác định thống kê thử nghiệm thích hợp
-
Bước 3: Chỉ định mức ý nghĩa
-
Bước 4: Phát biểu quy tắc quyết định
-
Bước 5: Thu thập dữ liệu và tính toán thống kê thử nghiệm
-
Bước 6: Đưa ra quyết định liên quan đến giả thuyết
2. Giả thuyết không và giả thuyết thay thế
Null hypothesis: Là giả thuyết mà nhà nghiên cứu muốn bác bỏ.
Ký hiệu: . có thể phát biểu dưới 3 dạng sau:
Alternative hypothesis: Là giả thuyết được kết luận nếu bị bác bỏ.
Ký hiệu: . có thể được phát biểu dưới 3 dạng sau:
3. So sánh và đối chiếu giữa kiểm định một phía và kiểm định hai phía
Cấu trúc kiểm định của One-tailed test:
-
Right tail -
-
Left tail -
Cấu trúc kiểm định Two-tailed test:
4. Giải thích thống kê kiểm định, lỗi loại I và loại II, mức ý nghĩa, cách sử dụng mức ý nghĩa trong kiểm định giả thuyết và lực kiểm định
4.1. Thống kê kiểm định (Test statistic)
Là một giá trị được tính toán dựa trên dữ liệu thống kê của mẫu, là cơ sở để quyết định cho việc có bác bỏ giả thuyết hay không.
Công thức:
4.2. Kiểm tra lỗi (Testing errors)
Quyết định | Tình huống thực tế | |
Ho đúng |
Ho sai |
|
---|---|---|
Không bác bỏ được Ho |
Quyết định đúng P = 1 - α |
Quyết định sai: Lỗi loại II P = β |
Bác bỏ Ho |
Quyết định sai: Lỗi loại I P = α |
Quyết định đúng P = 1 - β |
5. Giải thích quy tắc quyết định, mối quan hệ giữa khoảng tin cậy và kiểm định giả thuyết; xác định một kết quả có ý nghĩa thống kê và ý nghĩa kinh tế hay không
5.1. Quy tắc quyết định cho kiểm định một phía và hai phía
One-tailed test bao gồm:
Right tail -
-
Bác bỏ nếu: Test statistic > Upper critical value
-
Không bác bỏ nếu: Test statistic ≤ Upper critical value
Left tail -
-
Bác bỏ nếu: Test statistic < Lower critical value
-
Không bác bỏ nếu: Test statistic ≥ Lower critical value
Two-tailed test -
-
Bác bỏ nếu Test statistic > Upper critical value hoặc Test statistics < Lower critical value
-
Không bác bỏ nếu Lower critical value ≤ Test statistics ≤ Upper critical value
5.2. Phân biệt quyết định thống kê và quyết định kinh tế
Statistical decision (Quyết định thống kê): Nếu tính toán giá trị của test statistic lớn hơn critical value, thì quyết định thống kê là có đủ cơ sở để bác bỏ giả thuyết Ho.
Economic decision (Quyết định kinh tế): Quyết định kinh tế không chỉ xem xét quyết định thống kê mà còn xem xét tất cả các vấn đề kinh tế thích hợp.
[LOS 8.b] Xây dựng giả thuyết và xác định liệu kiểm định có mang ý nghĩa thống kê, liên quan đến lỗi loại I và loại II và lực kiểm định dựa trên mức ý nghĩa đã cho
1. Giải thích và diễn giải p-value liên quan đến kiểm định giả thuyết
P-values: Là mức ý nghĩa nhỏ nhất mà giả thuyết có thể bị bác bỏ
Đối với kiểm định 1 phía:
Đối với kiểm định hai phía:
-
Bác bỏ khi p-value < significance level.
-
Không bác bỏ khi p-value > significance level.
2. Giải thích mức ý nghĩa thống kê khi kiểm định nhiều lần
Quy trình của phương pháp tiếp cận phát hiện sai được trình bày theo các bước sau:
-
Bước 1: Xếp hạng các p-value từ các kiểm định khác nhau từ thấp đến cao
-
Bước 2: Tính p-value theo tiêu chí BH:
-
Bước 3: So sánh p-value gốc với p-value theo tiêu chí BH.
3. Xác định mức thống kê kiểm định phù hợp và giải thích kết quả của kiểm định giả thuyết trong các trường hợp trung bình tổng thể có mẫu lớn và nhỏ khi tổng thể phân phối chuẩn hoặc gần chuẩn và phương sai (1) biết và (2) chưa biết
Áp dụng 6 bước cơ bản của kiểm định để đánh giá thống kê liên quan. Quy trình cụ thể bao gồm như sau:
-
Bước 1: Nêu giả thuyết
-
Bước 2: Xác định thống kê thử nghiệm thích hợp
-
Bước 3: Chỉ định mức ý nghĩa
-
Bước 4: Phát biểu quy tắc quyết định
-
Bước 5: Thu thập dữ liệu và tính toán thống kê thử nghiệm
-
Bước 6: Đưa ra quyết định liên quan đến giả thuyết
Thống kê thử nghiệm của kiểm định này có thể tuân theo phân phối T (t-distribution) hoặc Z (z-distribution).
T-test |
Z-test |
---|---|
Các trường hợp sử dụng t-statistic hoặc z-statistic:
Khi lấy mẫu từ |
Test statistic |
|
Mẫu nhỏ (n < 30) |
Mẫu lớn (n ≥ 30) |
|
Tổng thể là một phân phối chuẩn đã biết phương sai |
z-statistic |
z-statistic |
Tổng thể là một phân phối chuẩn chưa biết phương sai |
t-statistic |
t-statistic |
Tổng thể không phải là một phân phối chuẩn đã biết phương sai |
Not available |
z-statistic |
Tổng thể không phải là một phân phối chuẩn chưa biết phương sai |
Not available |
t-statistic |
[LOS 8.b] Xây dựng giả thuyết và xác định liệu kiểm định có mang ý nghĩa thống kê, liên quan đến lỗi loại I và loại II và lực kiểm định dựa trên mức ý nghĩa đã cho
Áp dụng 6 bước cơ bản của kiểm định để đánh giá thống kê liên quan. Quy trình cụ thể bao gồm như sau:
-
Bước 1: Nêu giả thuyết
-
Bước 2: Xác định thống kê thử nghiệm thích hợp
-
Bước 3: Chỉ định mức ý nghĩa
-
Bước 4: Phát biểu quy tắc quyết định
-
Bước 5: Thu thập dữ liệu và tính toán thống kê thử nghiệm
-
Bước 6: Đưa ra quyết định liên quan đến giả thuyết
Nội dung bài học trong Module này bao gồm các kiểm định sau:
What we want to test |
Test statistic |
Probability distribution of the statistic |
Degree of Freedom |
---|---|---|---|
Test of the difference in means (kiểm định giả thuyết liên quan tới kiểm định trung bình bằng nhau của hai tổng thể dựa trên hai mẫu ngẫu nhiên độc lập có phân phối chuẩn và phương sai bằng nhau) |
t-distributed |
||
Test of the means of difference (kiểm định giả thuyết liên quan tới kiểm định trung bình của chênh lệch giữa hai tổng thể có phân phối chuẩn) |
t-distributed |
n - 1 |
|
Test of single variance (kiểm định giả thuyết liên quan tới kiểm định phương sai của một tổng thể phân phối chuẩn) |
Chi-squared distributed |
n - 1 |
|
Test of the difference in variances (kiểm định giả thuyết liên quan tới kiểm định phương sai của hai tổng thể phân phối chuẩn dựa trên các mẫu ngẫu nhiên độc lập) |
F-distributed |