Bài giảng Kinh tế lượng - Chương 7: Hiện tượng phương sai của sai số (số dư) thay đổi (heteroscedasticity)

MỤC
TIÊU 
1. Hiểu bản chất và hậu quả của
phương sai sai số thay đổi
2. Biết cách phát hiện phương
sai sai số thay đổi và biện pháp
khắc phục 
NỘI DUNG
1 Bản chất hiện tượng phương sai sai số thay đổi
2 Hậu quả
3 Cách phát hiện phương sai sai số thay đổi 
4 Cách khắc phục phương sai sai số thay đổi

pdf 83 trang hoanghoa 08/11/2022 9620
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Kinh tế lượng - Chương 7: Hiện tượng phương sai của sai số (số dư) thay đổi (heteroscedasticity)", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfbai_giang_kinh_te_luong_chuong_7_hien_tuong_phuong_sai_cua_s.pdf

Nội dung text: Bài giảng Kinh tế lượng - Chương 7: Hiện tượng phương sai của sai số (số dư) thay đổi (heteroscedasticity)

  1. 7.1 Hậu quả của phương sai thay đổi 1. Ước lượng OLS vẫn tuyến tính, không chệch 2. Tuy nhiên, chúng sẽ không còn có phương sai nhỏ nhất nữa, nghĩa là, chúng sẽ không còn hiệu quả nữa. 3. Ước lượng phương sai của ước lượng OLS, nhìn chung, sẽ bị chệch. 11
  2. 7.1 Hậu quả của phương sai thay đổi 5. Do đó, các khoảng tin cậy và kiểm định giả thuyết thông thường dựa trên phân phối t và F sẽ không còn đáng tin cậy nữa. Do vậy, nếu chúng ta áp dụng các kỹ thuật kiểm định giả thuyết thông thường sẽ cho ra kết quả sai. Chẳng hạn thống kê t xác định bởi công thức bˆ b * t 2 2 ˆ SE ( b 2 ) 12
  3. 7.1 Hậu quả của phương sai thay đổi ˆ Do sử dụng ước lượng của SE ( b i ) là SE ( b i ) nên không đảm bảo t tuân theo quy luật phân phối t-student =>kết quả kiểm định không còn tin cậy 6. Kết quả dự báo không còn hiệu quả nữa khi sử dụng các ước lượng OLS có phương sai không nhỏ nhất. 13
  4. 7.2 Phương pháp phát hiện phương sai thay đổi Phương pháp định tính 1. Dựa vào bản chất vấn đề nghiên cứu 2. Xem xét đồ thị của phần dư Phương pháp định lượng 1. Kiểm định Park 2. Kiểm định Glejser 3. Kiểm định Goldfeld – Quandt 4. Kiểm định White 14
  5. 1. Dựa vào bản chất vấn đề nghiên cứu VD: nghiên cứu quan hệ giữa chi tiêu tiêu dùng so với thu nhập, phương sai phần dư của chi tiêu tiêu dùng có xu hướng tăng theo thu nhập. Do đó đối với các mẫu điều tra tương tự, người ta có khuynh hướng giả định phương sai của nhiễu thay đổi 15
  6. 2. Xem xét đồ thị của phần dư Biến phụ thuộc Đường hồi qui ước lượng Biến độc lập 16
  7. 2. Xem xét đồ thị của phần dư u u Hình a cho Hình b,c,d thấy cho biến đổi thấy các 2 của các ei thay 2 ei đổi khi không Y tăng có tính hệ Y Y thống u (a) (b) u Y Y (c) (d) 17
  8. 3. Kiểm định Park 2 • Park cho rằng i là một hàm số nào đó của biến giải thích X 2 i = B1 + B2ln|Xi |+ vi trong đó vi là phần sai số ngẫu nhiên. 2 2 • Vì i chưa biết, Park đề nghị sử dụng lnei 2 thay cho i và chạy mô hình hồi qui sau 2 lnei = B1 + B2 ln|Xi|+ vi (*) 2 ei được thu thập từ mô hình hồi qui gốc 18
  9. 3. Kiểm định Park • Các bước của kiểm định Park: 1) Chạy hàm hồi qui gốc Yi = b1 + b2Xi + Ui ˆ 2) Từ hàm hồi qui, tính Yi , phần dư ei và 2 lnei 3. Chạy hàm hồi qui (*), sử dụng biến giải thích của hàm hồi qui ban đầu. Nếu có nhiều biến giải thích, chạy hồi qui cho từng biến giải thích đó. Hay, chạy hồi qui mô ˆ hình với biến giải thích là Yi 19
  10. 3. Kiểm định Park 4) Kiểm định giả thuyết H0: β2 = 0,tức, không có phương sai của sai số thay đổi. Nếu giả thuyết H0 bị bác bỏ, mô hình gốc có phương sai của sai số thay đổi. 5) Nếu giả thuyết H0 được chấp nhận, B1 trong mô hình (*) có thể được xem là giá trị chung của phương sai của sai số không đổi, 2. 20
  11. 4. Kiểm định Glejser • Tương tự như kiểm định Park: Sau khi thu thập được phần dư từ mô hình hồi qui gốc, Glejser đề nghị chạy hồi qui | ei | theo biến X nào mà có quan hệ chặt chẽ 2 với i . • Glejser đề xuất một số dạng hàm hồi qui sau: |ei| = B1 + B2Xi + vi ei = B1 + B2 X i + vi 1 ei = B1 + B2 + vi X i 21
  12. 4. Kiểm định Glejser 1 ei = B1 + B 2 + vi X i ei = B1 + B2 X i + vi 2 ei = B1 + B 2 X i + v i • Nếu giả thuyết H0: β2 = 0 bị bác bỏ thì có thể có hiện tượng phương sai sai số thay đổi. 22
  13. 4. Kiểm định Glejser • Kiểm định Glejser có một số vấn đề như kiểm định Park như sai số vi trong các mô hình hồi qui có giá trị kỳ vọng khác không, nó có tương quan chuỗi. – 4 mô hình đầu cho kết quả tốt khi sử dụng OLS – 2 mô hình sau (phi tuyến tính tham số) không sử dụng OLS được • Do vậy, kiểm định Glejser được dùng để chẩn đoán đối với những mẫu lớn. 23
  14. 5. Kiểm định Goldfeld - Quandt • Xét mô hình hồi qui sau: Yi = b1 + b2Xi + ui 2 Giả sử i có quan hệ dương với biến X theo cách sau: 2 2 2 2 i =  Xi trong đó  là hằng số. • Các bước thực hiện kiểm định Goldfeld - Quandt như sau: 1. Sắp xếp các quan sát theo thứ tự tăng dần về giá trị của biến X. 24
  15. 5. Kiểm định Goldfeld - Quandt 2. Bỏ qua quan sát ở giữa theo cách sau: Đối với mô hình 2 biến: c = 4 nếu cỡ mẫu khoảng n = 30; c = 10 nếu cỡ mẫu khoảng n = 60. và chia số quan sát còn lại thành 2 nhóm, trong đó mỗi nhóm có (n – c)/2 quan sát. 25
  16. 5. Kiểm định Goldfeld - Quandt 3. Sử dụng phương pháp OLS để ước lượng tham số của các hàm hồi qui đối với (n – c)/2 quan sát đầu và cuối; tính RSS1 và RSS tương ứng. 2 n c k Bậc tự do tương ứng là 2 (k là các tham số được ước lượng kể cả hệ số chặn). 26
  17. 5. Kiểm định Goldfeld - Quandt 4. Tính tỷ số RSS / df λ = 2 RSS1 / df  tuân theo phân phối F với bậc tự do ở tử số và mẫu số là n c 2k 2 Nếu  > F ở mức ý nghĩa α thì bác bỏ giả thuyết H0, nghĩa là phương sai của sai số thay đổi. 27
  18. 6. Kiểm định White • White đã đề nghị một phương pháp không cần đòi hỏi u có phân phối chuẩn. • Xét mô hình hồi qui sau: Yi = b1 + b2X2i + b3X3i + ui Bước 1: Ước lượng mô hình trên bằng OLS, thu được các phần dư ei. Bước 2: Ước lượng một trong các mô hình sau 2 2 2 ei = 1 + 2X2i + 3X3i + 4X2i + 5X3i + v2i (1) 28
  19. 6. Kiểm định White hay 2 2 2 ei = 1 + 2X2i + 3X3i + 4X2i + 5X3i + 6X2iX3i + V2i (2) (1) và (2) có thể có số mũ cao hơn và nhất thiết phải có hệ số chặn bất kể mô hình gốc có hay không. R2 là hệ số xác định bội, thu được từ (1) với mô hình không có số hạng chéo hay (2) với mô hình có số hạng chéo. 29
  20. 6. Kiểm định White • Bước 3 Đặt GT Ho: 2 = 3 = 4 = 5 = 0 (1) 2 = 3 = 4 = 5 = 6 = 0 (2) Tương đương H0: phương sai của sai số không đổi. • nR2 có phân phối xấp xỉ 2(df), với df bằng số hệ số của mô hình (1) và (2) không kể hệ số chặn. 30
  21. 6. Kiểm định White • Bước 4 Quy tắc quyết định • nR2 2(df): bác bỏ Ho, hay có hiện tượng phương sai sai số thay đổi. 31
  22. 7. Phương pháp bình phương nhỏ nhất tổng quát • 1. Phương pháp bình phương nhỏ nhất có trọng số • 2. Phương pháp bình phương nhỏ nhất tổng quát 29/11/2010 701003- Phương sai của sai số thay đổi 32
  23. 8. Biện pháp khắc phục • 1. Phương pháp bình phương bé nhất có trọng 2 số (trường hợp đã biết i ) • 2. Phương pháp bình phương bé nhất tổng 2 quát (trường hợp chưa biết i ) • 3. Chuyển đổi dạng hàm (trường hợp chưa 2 biết i ) 29/11/2010 701003- Phương sai của sai số thay đổi 33
  24. 8. Biện pháp khắc phục 1. Ước lượng bình phương bé nhất có trọng số 2) (trường hợp đã biết i Có mô hình hồi qui mẫu 2 biến: Yi 1 2 Xi ei 2 giả sử rằng phương sai sai số i đã biết; nghĩa là phương sai sai số của mỗi quan sát đã biết, chia hai vế của mô hình cho i đã biết. hay Y 1 X e i i i 1 2 i i i  i * * * * * Yi 1 2 Xi ei 34
  25. Ước lượng bình phương bé nhất có trọng số • Phương pháp OLS 2 2 e Y 1 X i i i   1 2 min  i i i i w w X Y w X w X *  i  i i i  i i  i i 2 2 2 wi wi Xi wi Xi wi 1/ i 35
  26. Ước lượng bình phương bé nhất có trọng số 36
  27. 2 1. Trường hợp đã biết i Khi đó e Var(e )  2 Var i i i 1,i 2 2 i  i  i Trong thực tế, chia mỗi quan sát Yi và Xi cho i đã biết và chạy hồi qui OLS cho dữ liệu đã được chuyển đổi này. Ước lượng OLS của 1 và 2 được tính theo cách này được gọi là ước lượng bình phương bé nhất có trọng số (WLS); mỗi quan sát Y và X được chia cho trọng số (độ lệch chuẩn) của riêng nó, i. 37
  28. 2 2. Trường hợp chưa biết i Trường hợp 1: Phương sai sai số tỷ lệ với biến giải thích. Sau khi ước lượng hồi qui OLS thông thường, chúng ta vẽ đồ thị phần dư từ ước lượng này theo biến giải thích X và quan sát hình ảnh của nó. Nếu hình ảnh của phần dư tương tự như hình sau: 38
  29. 2 2. Trường hợp chưa biết i 39
  30. 2 2. Trường hợp chưa biết i Như vậy, phương sai sai số có quan hệ tuyến tính với biến giải thích 2 2 Var(ui ) = E(ui ) =  Xi Chúng ta chia hai vế của mô hình cho căn bậc hai của Xi , với Xi 0 Yi 1 X i ui 1 2 X i X i X i X i 1 1 2 X i vi X i 40
  31. 2 2. Trường hợp chưa biết i • Khi đó u Var(u ) Var i i  2 ,i X Xi i • Một điều quan trọng mà chúng ta cần lưu ý là để ước lượng mô hình trên, chúng ta phải sử dụng mô hình hồi qui qua gốc. 41
  32. 2 2. Trường hợp chưa biết i Trường hợp 2: Phương sai sai số tỷ lệ với bình phương của biến giải thích. 2 2 2 Var(ui ) =E(ui ) =  Xi Nếu hình ảnh của phần dư tương tự như hình bên dưới, phương sai sai số có quan hệ tuyến tính với bình phương của Xi Chúng ta chia hai vế của mô hình cho Xi với Xi ≠0 Y 1 u 1 i i 1 2 1 2 vi X i X i X i X i 42
  33. 2 2. Trường hợp chưa biết i 43
  34. 2 2. Trường hợp chưa biết i Khi đó: u Var(u ) Var i i  2,i 2 Xi X i Trường hợp 3: Phương sai sai số tỷ lệ với bình phương của giá trị kỳ vọng của Y. 2 2 2 Var(ui ) = E(ui ) =  [E(Yi)] . Chia hai vế của mô hình cho E(Yi) với ˆ E(Yi)= Yi ˆ 1 ˆ 2 X i 44
  35. 2 2. Trường hợp chưa biết i Tiến hành theo 2 bước sau: Bước 1: Ước lượng mô hình hồi qui: Yi = 1 + 2Xi + ui bằng phương pháp OLS thông thường, từ đó ta ˆ thu được Y i Biến đổi mô hình gốc về dạng như sau: Y 1 X i i v ˆ 1 ˆ 2 ˆ i Yi Yi Yi 45
  36. 2 2. Trường hợp chưa biết i ˆ Bước 2: Ước lượng hồi qui trên dù Yi không chính xác là E(Yi\Xi), nhưng chúng là ước lượng vững, nghĩa là khi cỡ mẫu tăng lên vô hạn thì chúng hội tụ về E(Yi|Xi). Do vậy, phép biến đổi trên có thể dùng được khi cỡ mẫu tương đối lớn. Khi đó u Var(u )  2.E Y 2 Var i i i  2,i ^ ^ 2 ^ 2 Y i Y i Y i 46
  37. 2 2. Trường hợp chưa biết i Trường hợp 4: Định dạng lại mô hình. Thay vì ước lượng mô hình hồi qui gốc, ta có thể ước lượng mô hình hồi qui: lnYi = 1 + 2lnXi + ui Tình trạng phương sai sai số không đồng nhất sẽ bớt nghiêm trọng hơn so với mô hình gốc bởi vì khi được logarit hóa, độ lớn các biến bị ‘nén lại’. Một ưu thế của phép biến đổi này là hệ số 2 sẽ đo lường hệ số co giãn của Y theo X, nghĩa là, nó cho biết % thay đổi của Y khi X thay đổi 1%. 47
  38. Lưu ý: • Khi nghiên cứu mô hình có nhiều biến giải thích thì việc chọn biến nào để biến đổi cần phải được xem xét cẩn thận. • Phép biến đổi logarit không dùng được khi các giá trị của các biến âm. 2 • Khi i chưa biết, nó sẽ được ước lượng từ một trong các cách biến đổi trên. Các kiểm định t, F mà chúng ta sử dụng chỉ đáng tin cậy khi cỡ mẫu lớn, do đó chúng ta phải cẩn thận khi giải thích các kết quả dựa trên các phép biến đổi khác nhau trong các mẫu nhỏ. 48
  39. Ví dụ • Cho số liệu quan sát như sau: Y: thu nhập trung bình (USD/giờ) X1: số năm kinh nghiệm (năm) X2: số năm được đào tạo (năm) 1. Ước lượng mô hình hồi quy Y= β0 + β1. X1 + β2.X2 +U 2. Mô hình có phương sai thay đổi không? Vì sao? 3. Nếu xảy ra phương sai thay đổi, hãy tìm cách khắc phục. 49
  40. 1. Ước lượng mô hình 50
  41. 2. Phát hiện phương sai thay đổi • 1. Vẽ đồ thị phần dư 51
  42. b. Kiểm định Park • B1. Tạo biến mới umu=resid • B2: Chạy hồi quy theo từng Xi hoặc theo Y^ theo mô hình: LOG(umu^2) c LOG(X2) Hoặc LOG(umu^2) c LOG(X3) Hoặc LOG(umu^2) c LOG(Ymu) 3. Đặt giả thuyết H0: β2 = 0, hay “không có phương sai thay đổi” 52
  43. b. Kiểm định Park LOG(umu^2) c LOG(Ymu) 53
  44. b. Kiểm định Glejser 1. Hồi quy theo mô hình sau ABS(umu) c X2 Hoặc ABS(umu) c X3 2. Đặt giả thuyết H0: β2 = 0, hay không có phương sai thay đổi 54
  45. c. Kiểm định White B1. Mở eq01 B2. View\ Residual Tests\ White Heteroskedasticity (cross terms) GT Ho: 2 = 3 = 4 = 5 = 6 = 0 Hoặc • View\ Residual Tests\ White Heteroskedasticity (no cross terms) GT Ho: 2 = 3 = 4 = 5 = 0 Ta có kết quả sau 56
  46. Kết quả • Theo kết quả bảng trên, ta thấy n*R2 (Obs*R- squared) = 14,70020. • Với mức ý nghĩa 5%, 2(df)= 2(5)= 11,0705. Ta thấy n*R2 > 2(5) =>bác bỏ Ho 2 = 3 = 4 = 5 = 6 = 0 Cách 2: n*R2 có xác suất p-value= 0,011724 < α =5%. Vậy bác bỏ giả thiết Ho: phương sai không đổi. Tức mô hình hồi quy của Y theo X1 và X2 có phương sai thay đổi. 58
  47. 3. Biện pháp khắc phục B1. Hồi quy Y, X1, X2 dựa vào các giả thiết B2: Kiểm định tiếp xem có phương sai thay đổi không Thực hành: 2 B1: Do ta chưa biết các i nên theo các giả thiết sau: 2 2 2 • a. E(ui ) =  Xi Chạy hồi quy (Y/X1 ) (1/X1 ) c (X2 / X1 ) 59
  48. • Dùng kiểm định White có số hạng tích chéo (cross terms) 60
  49. 2 2 • b. E(ui ) =  Xi Chạy hồi quy (Y/SQR(X1 )) 1/SQR(X1 ) SQR(X1 ) (X2 / SQR(X1 ) ) 61
  50. Dùng kiểm định White có số hạng tích chéo (cross terms) 62
  51. c. Dùng phép biến đổi logarit • Chạy hồi quy LOG(Y) C LOG(X1) LOG(X2) 63
  52. Dùng kiểm định White có số hạng tích chéo (cross terms) 64
  53. Vd2 • Hồi quy lương (W, $) theo số lượng nhân viên (N) tại 30 công ty có các kết quả sau W=7.5 + 0.009N +e R2=0.9 (1) t na (16.10) W/N=0.008 + 7/8(1/N) +e R2=0.99 (2) t (14.43) (76.58) 1. Giải thích ý nghĩa các hệ số hồi quy. 2. Tại sao tác giả chuyển từ mô hình 1 sang mô hình 2? 3. Hệ số tự do và hệ số góc của hai mô hình có liên hệ như thế nào? 65
  54. Ví dụ • Cho số liệu quan sát như sau: Y: thu nhập trung bình (USD/giờ) X1: số năm kinh nghiệm (năm) X2: số năm được đào tạo (năm) 1. Ước lượng mô hình hồi quy Y= β0 + β1. X1 + β2.X2 +U 2. Mô hình có phương sai thay đổi không? Vì sao? 3. Nếu xảy ra phương sai thay đổi, hãy tìm cách khắc phục. 66
  55. STT X1 X2 Y 1 0 6 4.71 26 25 2 12.8 2 1 3 3.6 27 25 0 5.2 3 2 0 4.37 28 27 4 8.12 4 2 4 4.64 29 28 7 17.54 5 3 1 3.27 30 28 4 22.52 6 5 0 4.26 31 30 3 5.47 7 6 7 6.14 32 31 1 13.67 8 7 5 6.74 33 32 0 4.84 9 8 0 6.11 34 34 5 38.52 10 8 2 5.53 35 34 2 9.98 11 8 6 5.53 36 37 6 27.73 12 10 1 5.36 37 37 0 5.06 13 11 7 8.73 38 37 1 4.36 14 13 0 5.85 39 38 7 23.96 15 15 0 6.88 40 38 4 30.77 16 15 2 7.17 41 39 0 20.68 17 15 7 10.8 42 40 2 50.9 18 18 0 5.06 43 42 3 3.96 19 19 6 13.69 44 42 0 7.58 20 21 0 8.01 45 43 4 6.18 21 21 2 17.13 46 44 3 43.25 22 23 1 7.75 47 44 1 32.04 23 24 0 6.2 48 45 0 3.35 24 24 5 17.72 49 45 2 18.35 25 24 3 8.8 50 46 0 4.95 67
  56. 1. Ước lượng mô hình 68
  57. • Nhìn đồ thị ta thấy độ rộng của phần dư tăng khi Yi^ tăng. Vậy mô hình ước lượng ở câu 1 có thể có phương sai thay đổi. 69
  58. b. Kiểm định Park • B1. Tạo biến mới umu=resid • B2: Chạy hồi quy theo từng Xi hoặc theo Y^ theo mô hình: LOG(umu^2) c LOG(X2) Hoặc LOG(umu^2) c LOG(X3) Hoặc LOG(umu^2) c LOG(Ymu) 3. Đặt giả thiết H0: β2 = 0, hay “không có phương sai thay đổi” 70
  59. LOG(umu^2) c LOG(Ymu) 71
  60. b. Kiểm định Glejser 1. Hồi quy theo mô hình sau ABS(umu) c X2 Hoặc ABS(umu) c X3 2. Đặt giả thiết H0: β2 = 0, hay không có phương sai thay đổi 72
  61. c. Kiểm định White B1. Mở eq01 B2. View\ Residual Tests\ White Heteroskedasticity (cross terms) GT Ho: 2 = 3 = 4 = 5 = 6 = 0 Hoặc • View\ Residual Tests\ White Heteroskedasticity (no cross terms) GT Ho: 2 = 3 = 4 = 5 = 0 Ta có kết quả sau 74
  62. • Theo kết quả bảng trên, ta thấy n*R2 (Obs*R- squared) = 14,70020. • Với mức ý nghĩa 5%, 2(df)= 2(5)= 11,0705. Ta thấy n*R2 > 2(5) =>bác bỏ Ho 2 = 3 = 4 = 5 = 6 = 0 Cách 2: n*R2 có xác suất p-value= 0,011724 < α =5%. Vậy bác bỏ giả thiết Ho: phương sai không đổi. Tức mô hình hồi quy của Y theo X1 và X2 có phương sai thay đổi. 76
  63. 3. Biện pháp khắc phục B1. Hồi quy Y, X1, X2 dựa vào các giả thiết B2: Kiểm định tiếp xem có phương sai thay đổi không Thực hành: 2 B1: Do ta chưa biết các i nên theo các giả thiết sau: 2 2 2 • a. E(ui ) =  Xi Chạy hồi quy (Y/X1 ) (1/X1 ) c (X2 / X1 ) 77
  64. • Dùng kiểm định White có số hạng tích chéo (cross terms) 78
  65. • Ta thấy Obs*R-squared có p = 0,515373> 5% nên chấp nhận Ho. Vậy không còn phương sai thay đổi. • Ta có hàm hồi quy mới như sau: ^ Y 2,782082 0,209166.X i 0,353691 2i X1i X1i X1i 79
  66. 2 2 • b. E(ui ) =  Xi Chạy hồi quy (Y/SQR(X1 )) 1/SQR(X1 ) SQR(X1 ) (X2 / SQR(X1 ) ) 80
  67. Dùng kiểm định White có số hạng tích chéo (cross terms) • Ta thấy Obs*R-squared có p = 0,174148 > 5% nên chấp nhận Ho. Vậy không còn phương sai thay đổi. Vậy mô hình là ^ Yi 1,447035 X2i 0,36838. X1i 0,674817. X1i X1i X1i 81
  68. c. Dùng phép biến đổi logarit • Chạy hồi quy LOG(Y) C LOG(X1) LOG(X2) 82
  69. Dùng kiểm định White có số hạng tích chéo (cross terms) • Ta thấy Obs*R-squared có p = 0,024228 < α = 5% nên bác bỏ Ho. Vậy vẫn còn phương sai thay đổi. • Vậy mô hình này không phù hợp. 83