Bài giảng Kinh tế lượng - Chương 6: Hiện tượng đa cộng tuyến

MỤC
TIÊU 
1. Hiểu bản chất và hậu quả của
đa cộng tuyến
2. Biết cách phát hiện đa cộng
tuyến và biện pháp khắc phục 
NỘI DUNG
1 Bản chất, nguyên nhân của đa cộng tuyến
2 Ước lượng các tham số 

3 Hậu quả 
4 Phát hiện đa cộng tuyến
5 Khắc phục đa cộng tuyến 



 

pdf 42 trang hoanghoa 08/11/2022 4580
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Kinh tế lượng - Chương 6: Hiện tượng đa cộng tuyến", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfbai_giang_kinh_te_luong_chuong_6_hien_tuong_da_cong_tuyen.pdf

Nội dung text: Bài giảng Kinh tế lượng - Chương 6: Hiện tượng đa cộng tuyến

  1. 6.1 Bản chất của đa cộng tuyến Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến 11
  2. 6.1 Bản chất của đa cộng tuyến Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến 12
  3. 6.1 Nguyên nhân của đa cộng tuyến Một số nguyên nhân gây ra hiện tượng đa cộng tuyến - Khi chọn các biến độc lập mối quan có quan hệ nhân quả hay có tương quan cao vì đồng phụ thuộc vào một điều kiện khác. - Khi số quan sát nhỏ hơn số biến độc lập. - Cách thu thập mẫu: mẫu không đặc trưng cho tổng thể - Chọn biến Xi có độ biến thiên nhỏ. 13
  4. 6.2 Ước lượng khi có đa cộng tuyến 1. Trường hợp có đa cộng tuyến hoàn hảo Xét mô hình hồi qui 3 biến dưới dạng sau: Yi = b2 X2i + b3 X3i + ei giả sử X3i = X2i, mô hình được biến đổi thành: Yi = (b2+ b3)X2i + ei = b0 X2i + ei Phương pháp OLS x y ˆ ˆ ˆ  2i i bo (b2 b3 ) 2  x2i ˆ ˆ  Không thể tìm được lời giải duy nhất cho b2 , b3 14
  5. 6.2 Ước lượng khi có đa cộng tuyến y x x 2 y x x x ˆ  i 2i  3i  i 3i  2i 3i b 2 2 2 2  x2i  x3i ( x2i x3i )  y x x2  y x x x ˆ  i 3i  3i  i 3i  3i 3i 0 b2 2 2 2 2 2 2   x3i  x3i   x3i  x3i 0  Các hệ số ước lượng không xác định  Phương sai và sai số chuẩn của b2 và b3 là vô hạn 15
  6. 6.2 Ước lượng các tham số khi có đa cộng tuyến y x x 2 y x x x ˆ  i 2i  3i  i 3i  2i 3i b 2 2 2 2  x2i  x3i ( x2i x3i )  y x x2  y x x x ˆ  i 3i  3i  i 3i  3i 3i 0 b2 2 2 2 2 2 2   x3i  x3i   x3i  x3i 0 Các hệ số ước lượng không xác định: chúng ta không tách rời tác động của từng biến Xi lên Y do không thể giả định X2 thay đổi trong khi X3 không đổi. 16
  7. 6.2 Ước lượng các tham số khi có đa cộng tuyến 2. Trường hợp có đa cộng tuyến không hoàn hảo • Đa cộng tuyến hoàn hảo thường không xảy ra trong thực tế. • Xét mô hình hồi qui 3 biến dưới dạng sau: yi = b2 x2i + b3 x3i + ei Giả định x3i =  x2i + vi Với  0 và vi là sai số ngẫu nhiên. • Trong trường hợp này, các hệ số hồi qui b2 và b3 có thể ước lượng được: 17
  8. 6.2 Ước lượng các tham số khi có đa cộng tuyến Ta có thể ước lượng được các bˆ này nhưng s.e. sẽ rất lớn. 18
  9. 6.3 Hậu quả của đa cộng tuyến Nếu có cộng tuyến gần hoàn hảo: • Các ước lượng vẫn BLUE, nhưng: 1. Phương sai và hiệp phương sai của các ước lượng OLS lớn. r23 là hệ số tương quan giữa X2 và X3. Khi r23 1, các giá trị trên 19
  10. 6.3 Hậu quả của đa cộng tuyến Nếu có cộng tuyến gần hoàn hảo: 2. Khoảng tin cậy rộng hơn. • Khoảng tin cậy của b2 và b3 (với độ tin cậy 1 – ) là: ^ b b^ b2 = 2 t /2 se ( 2); ^ ^ b 3 b b3 = t /2 se ( 3); trong đó:   b^ ^ se ( 2) = 2 2 se ( b 3) = 2 2 (1 r23)x2i (1 r23)x3i 20
  11. Giá trị của r23 Khoảng tin cậy 95% của B2 bˆ 1.96*A 0 2 bˆ 1.96* 1.33*A 0.5 2 bˆ 1.96* 10.26*A 0.95 2 bˆ 1.96* 100*A 0.995 2 bˆ 1.96* 500*A 0.999 2  2 A 2  x2i 21
  12. 6.3 Hậu quả của đa cộng tuyến Nếu có cộng tuyến gần hoàn hảo: 3. Tỉ số t "không có ý nghĩa". Khi kiểm định giả thuyết H0: b2 = 0, chúng ta sử dụng tỷ số t. bˆ t 2 se ( bˆ ) và so sánh giá trị ước lượng2 của t với giá trị tra bảng (tới hạn) của t. Trong trường hợp cộng tuyến cao thì sai số chuẩn sẽ rất lớn và do đó làm cho giá trị t sẽ nhỏ đi, kết quả là sẽ làm tăng chấp nhận giả thuyết H0. 22
  13. 6.3 Hậu quả của đa cộng tuyến Nếu có cộng tuyến gần hoàn hảo: 4. R2 cao nhưng tỉ số t ít có ý nghĩa. • Đa cộng tuyến cao: • - một hoặc một số tham số tương quan (hệ số góc riêng) không có ý nghĩa về mặt thống kê • - R2 trong những trường hợp này lại rất cao (trên 0,9). • - kiểm định F thì có thể bác bỏ giả thuyết cho rằng b2 = b3 = = bk = 0. 23
  14. 6.3 Hậu quả của đa cộng tuyến Nếu có cộng tuyến gần hoàn hảo: 5. Các ước lượng OLS và sai số chuẩn của chúng trở nên rất nhạy với những thay đổi nhỏ trong dữ liệu. 6. Dấu của các ước lượng của các hệ số hồi qui có thể sai 7. Thêm vào hay bớt đi các biến cộng tuyến với các biến khác, mô hình sẽ thay đổi về dấu hoặc thay đổi về độ lớn của các ước lượng. 24
  15. Ví dụ: Bảng 2 do nhập sai số liệu nên xảy ra đa cộng tuyến Bảng 1 Bảng 2 Y X2 X3 Y X2 X3 1 2 4 1 2 4 2 0 2 2 0 2 3 4 12 3 4 0 4 6 0 4 6 12 5 8 16 5 8 16 ˆ ˆ Yi 1.193 0.446 X 2i 0.003 X 3i Yi 1.210 0.401X2i 0.027X3i 2 ˆ ˆ 2 ˆ ˆ R 0.81; r23 0.5523; cov( b 2 , b 3 ) 0.00868 R 0.81;r23 0.8285;cov(b2,b3) 0.0282 Se (0.7736) (0.1848) (0.0850) Se (0.7480) (0.2720) (0.1252) t (1.543) (2.415) (0.0358) t (1.618) (1.4752) (0.2152) 25
  16. Đa cộng tuyến là một hiện tượng theo mẫu, nghĩa là cho dù các biến độc lập Xi không tương quan tuyến tính trong tổng thể nhưng chúng có thể tương quan tuyến tính trong một mẫu cụ thể nào đó. Do đó cỡ mẫu lớn thì hiện tượng đa cộng tuyến ít nghiêm trọng hơn cỡ mẫu nhỏ 26
  17. 6.4 Cách phát hiện đa cộng tuyến 1. Hệ số R2 lớn nhưng tỷ số t nhỏ 2. Tương quan cặp giữa các biến giải thích cao 3. Sử dụng mô hình hồi qui phụ 4. Sử dụng yếu tố phóng đại phương sai (VIF) 27
  18. 6.4 Cách phát hiện đa cộng tuyến 1. R2 lớn nhưng tỷ số t nhỏ Nếu R2 cao, chẳng hạn, >0,8 và F test bác bỏ giả thuyết b2 = b3 = = bk = 0, nhưng t test cho từng bi lại chấp nhận H0. 2. Tương quan cặp giữa các biến giải thích cao ( X X )(Z Z ) r  i i XZ 2 2  ( X i X ) (Z i Z ) Trong đó X, Z là 2 biến giải thích trong mô hình 28
  19. 6.4 Cách phát hiện đa cộng tuyến 3. Sử dụng mô hình hồi quy phụ Hồi qui một biến giải thích X nào đó theo các biến còn lại. ˆ ˆ ˆ ˆ X 2i b1 b3 X 3i bk X mi Tính R2 và F cho mỗi mô hình theo công thức: R 2 ( n m ) F (1 R 2 )( m 1) 2 Lập giả thiết H0: R = 0 ~ H0: không có đa cộng tuyến Nếu F > F (m-1,n-m): bác bỏ H0 => có đa cộng tuyến Nếu F không có đa cộng tuyến 29
  20. 6.4 Cách phát hiện đa cộng tuyến VD: Cho doanh số bán (Y), chi phí chào hàng (X2) và chi phí quảng cáo (X3) trong năm 2001 ở 12 khu vực bán hàng của 1 công ty. Có hiện tượng đa cộng tuyến không? Hồi quy biến chi phí chào hàng với chi phí quảng cáo, ta có kết quả X2 =42,012 + 0,387 *X3 R2 = 0,22922 F= 2,9738 Với mức ý nghĩa α=5%, tra bảng F0.05 (1,10)= 4,96. Ta thấy F < F0.05 (1,10) nên chấp nhận Ho hay không có đa cộng tuyến. 30
  21. 6.4 Cách phát hiện đa cộng tuyến 4. Sử dụng nhân tử phóng đại phương sai (VIF) Đối với hàm hồi quy 2 biến giải thích, VIF được định nghĩa như sau: 1 VIF 2 (1 r23 ) Đối với trường hợp tổng quát, có (k-1) biến giải thích thì: 1 VIF 2 (1 R j ) 2 2 R j: là giá trị R trong hàm hồi quy của Xj theo (k-1) biến giải thích còn lại. Thông thường khi VIF > 10, thì biến này được coi là có cộng tuyến cao 2 ˆ  var( b 2 ) 2 .VIF  x2i 31
  22. ˆ ˆ ˆ Giá trị của r23 VIF Var (b 2 ) Cov (b 2 , b 3 ) 0 1 1A 0 0.5 1.33 1.33A 0.67B 0.7 1.96 1.96A 1.37B 0.8 2.78 2.78A 2.22B 0.9 5.76 5.76A 4.73B 0.95 10.26 10.26A 9.74B 0.97 16.26 16.92A 16.4B 0.99 50.25 50.25A 49.75B 0.995 100 100A 99.5B 0.999 500 500A 499.5B  2  2 A ; B x 2 2 2  2i  x2i  x3i 32
  23. 6.5 Cách khắc phục 1. Dùng thông tin tiên nghiệm Ví dụ khi hồi quy mô hình sản xuất Cobb-Douglas b 3 b 2 u i Yi AL i K i e Ln(Yi)=b1 + b2ln(Ki)+ b3ln(Li) + ui Có thể gặp hiện tượng đa cộng tuyến do K và L cùng tăng theo quy mô sản xuất. Nếu ta biết là hiệu suất không đổi theo quy mô tức là b2+b3=1. Ln(Yi)=b1 + b2ln(Ki)+ (1-b2)ln(Li) + ui Ln(Yi) – Ln(Li) = b1 + b2[ln(Ki) - ln(Li)] + ui Ln(Yi /Li ) = b1 + b2ln(Ki /Li) + ui => mất đa cộng tuyến (vì đây là mô hình hồi quy đơn). 33
  24. 6.5 Cách khắc phục 1. Dùng thông tin tiên nghiệm Ví dụ Yi=b1 + b2X2i+ b3X3i + ui Biết b3=0.1b2 Biến đổi Yi=b1 + b2X2i+ 0.1b2X3i + ui Yi=b1 + b2Xi+ ui Với Xi=X2i+ 0.1X3i 34
  25. 6.5 Cách khắc phục 2. Loại trừ một biến giải thích ra khỏi mô hình B1: Xem cặp biến giải thích nào có quan hệ chặt chẽ. Giả sử X2, X3 Xk là các biến độc lập, Y là biến phụ thuộc và X2, X3 có tương quan chặt chẽ với nhau. B2: Tính R2 đối với các hàm hồi quy: có mặt cả 2 biến; không có mặt một trong 2 biến B3: Loại biến mà giá trị R2 tính được khi không có mặt biến đó là lớn hơn. 35
  26. 6.5 Cách khắc phục 3. Bổ sung thêm dữ liệu hoặc chọn mẫu mới 36
  27. 6.5 Cách khắc phục 4. Dùng sai phân cấp 1 Ví dụ từ hàm hồi qui: yt = 1 + b1x1t + b2x2t + ut ta suy ra yt-1 = 1 + b1x1,t-1 + b2x2,t-1 + ut-1 Trừ hai vế cho nhau, ta được: yt – yt – 1 = b1(x1,t – x1,t – 1) + b2(x2,t – x2,t – 1) + (ut – ut – 1) Hay: yt = b1 x1,t + b2 x2,t + et, Mặc dù, x1 và x2 có quan hệ tuyến tính, nhưng không có nghĩa sai phân của chúng cũng như vậy. 37
  28. 6.5 Cách khắc phục 5. Đổi biến Ví dụ : yt = 1 + b1x1t + b2x2t + ut Với Y: tiêu dùng X1: GDP X2: dân số Vì GDP và dân số theo thời gian có xu hướng tăng nên có thể cộng tuyến. Biện pháp: chia các biến cho dân số Yt 1 b1 ut b2 X 2t X 2t X 2t X 2t 38
  29. Ví dụ 1 Khảo sát chi tiêu tiêu dùng, thu nhập và sự giàu có, ta có bảng số liệu sau. Gọi Y: chi tiêu tiêu dùng (USD) X2: thu nhập (USD) X3: sự giàu có (USD) Yêu cầu: 1. Ước lượng mô hình hồi quy Y= β1 + β2. X2 + β3.X3 +U 2. Mô hình có xảy ra đa cộng tuyến không? Vì sao? 3. Nếu xảy ra đa cộng tuyến, hãy tìm cách khắc phục. 39
  30. X2 X3 Y 80 810 70 100 1009 65 120 1273 90 140 1425 95 160 1633 110 180 1876 115 200 2052 120 220 2201 140 240 2435 155 260 2686 150 Nguồn: Ramu Ramanathan 40
  31. 1. Ước lượng mô hình hồi quy Y= β1 + β2. X2 + β3.X3 +U Nhận xét ban đầu: Theo lý thuyết kinh tế thì chi tiêu cho tiêu dùng (Y) có xu hướng tăng theo thu nhập (X2) và sự giàu có (X3) nên dấu của các hệ số hồi quy riêng là dương. Kết quả hồi quy trên Eviews như sau: 41