Bài giảng Nhập môn Kinh tế lượng - Chương 4: Phân tích hồi quy bội "Vấn đề suy diễn thống kê"

Suy diễn thống kê trong mô hình hồi quy
Kiểm định giả thuyết về tham số tổng thể
Xây dựng các khoảng tin cậy (đối xứng)
4.1 Phân phối mẫu của ước lượng OLS
Ước lượng OLS là các biến ngẫu nhiên
Chúng ta đã biết về kỳ vọng và phương sai của các ước lượng này
Tuy nhiên, chúng ta cần biết về phân phối của chúng để kiểm định giả
thuyết thống kê
Để suy luận về phân phối, chúng ta cần thêm giả thiết
Giả thiết về phân phối của sai số: sai số có phân phối chuẩn 
Định lý giới hạn trung tâm (CLT)
• Biến ngẫu nhiên tổng x = x1+…+xk
với x1,..., xk là các biến ngẫu nhiên
Nếu các điều kiện sau thỏa:
• Các xi là độc lập
• Các xi có cùng phân phối xác suất
• Các xi có cùng kỳ vọng và phương sai (hữu hạn)
• k lớn (thường k  30)
• thì x sẽ có phân phối xấp xỉ chuẩn 
pdf 17 trang hoanghoa 10/11/2022 5420
Bạn đang xem tài liệu "Bài giảng Nhập môn Kinh tế lượng - Chương 4: Phân tích hồi quy bội "Vấn đề suy diễn thống kê"", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfbai_giang_nhap_mon_kinh_te_luong_chuong_4_phan_tich_hoi_quy.pdf

Nội dung text: Bài giảng Nhập môn Kinh tế lượng - Chương 4: Phân tích hồi quy bội "Vấn đề suy diễn thống kê"

  1. Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. 10.12.2017 Wooldridge PHÂN TÍCH HỒI QUY BỘI Phân tích hồi quy bội VẤN ĐỀ SUY DIỄN Vấn đề suy diễn Dependent Variable: LWAGE (EQ02) 4.5 Kiểm định nhiều ràng buộc tuyến tính: Kiểm định F Method: Least Squares Included observations: 6763 Kiểm định các ràng buộc loại trừ Tiền lương của các Variable Coefficient Std. Error t-Statistic Prob. cầu thủ bóng chày Số năm thi đấu Số trận tham gia thi ở giải nhà nghề chuyên nghiệp đấu trung bình mỗi C 1.472326 0.021060 69.91020 0.0000 năm JC -0.010180 0.006936 -1.467657 0.1422 JC+UNIV 0.076876 0.002309 33.29808 0.0000 EXPER 0.004944 0.000157 31.39717 0.0000 4.28 R-squared 0.222442 Mean dependent var 2.248096 Điểm đánh Số lần đánh bóng Số lần đánh bóng ghi bóng trung bình ghi điểm trực tiếp điểm mỗi năm • p-value(2p) = 0,1422 p-value(1p) = 0,0711 trung bình mỗi năm 4.29 với H1: H0 là sai 4.30 Kiểm định việc các đại lượng đo lường hiệu quả thi đấu của cầu thủ không tác động đến tiền lương/ hoặc có thể loại bỏ khỏi phương trình hồi quy. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Phân tích hồi quy bội Phân tích hồi quy bội Vấn đề suy diễn Vấn đề suy diễn Ước lượng mô hình chưa gán ràng buộc (UR) Ước lượng mô hình đã gán ràng buộc (R) 4.33 4.31 RSS sẽ tăng lên, nhưng liệu sự gia tăng này có ý nghĩa thống kê hay không? Không có biến nào trong số các biến này có ý nghĩa thống kê khi kiểm định đơn lẻ. t = 0,89 ; t = 0,89 ; t = 1,50 bavg hrunsyr rbisyr Thống kê kiểm định Số các ràng buộc Sự tăng lên tương đối của tổng bình phương phần dư khi đi từ H1 đến H0 Gợi ý: Mức độ phù hợp của mô hình sẽ ra sao nếu các biến trên bị loại bỏ ra khỏi mô hình? tuân theo một phân phối F (nếu H0 là đúng ) 4.37 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 11
  2. Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. 10.12.2017 Wooldridge Phân tích hồi quy bội Phân tích hồi quy bội Vấn đề suy diễn Vấn đề suy diễn Quy tắc bác bỏ (Hình 4.7) Số các ràng buộc cần kiểm định Kiểm định vấn đề trong ví dụ 4.41 (0,6278 0,5971) / 3 F 9,55 (1 0,6278) / 347 Một biến ngẫu nhiên có phân phối F chỉ Bậc tự do của mô hình có thể nhận giá trị dương. Điều này tương F ~ F3,347 ; = 1% F0,01(3,347)= 3,78 chưa gán ràng buộc (UR) ứng với việc tổng bình phương phần dư chỉ có thể tăng thêm khi đi từ H đến H . 1 0 Bằng chứng bác bỏ giả thuyết p-value= không là rất mạnh (thậm chí ở mức ý nghĩa rất nhỏ). Chọn giá trị tới hạn sao cho giả thuyết không sẽ Thảo luận bị bác bỏ, ví dụ, trong 5% số trường hợp mặc dù nó đúng. F= 9,55 > F0,01(3,347)= 3,78 Ba biến được kiểm định là “có ý nghĩa đồng thời“ hay Với mức ý nghĩa 5% ; q = 3 ; dfur = n-k-1 = 60 : Chúng không có ý nghĩa khi kiểm định riêng lẻ từng biến p-value= 0,000 F (q,n-k-1): bác bỏ H0 4.40 Nếu F > F0,05(3,60) : bác bỏ H0 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. PHÂN TÍCH HỒI QUY BỘI PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN VẤN ĐỀ SUY DIỄN • Tập tin mlb1.wf1 Dependent Variable: LOG(SALARY) (UR) Dependent Variable: LOG(SALARY) (R) Method: Least Squares Method: Least Squares Included observations: 353 Included observations: 353 Variable Coefficient Std. Error t-Statistic Prob. Variable Coefficient Std. Error t-Statistic Prob. C 11.19242 0.288823 38.75184 0.0000 YEARS 0.068863 0.012115 5.684295 0.0000 C 11.22380 0.108312 103.6247 0.0000 GAMESYR 0.012552 0.002647 4.742440 0.0000 YEARS 0.071318 0.012505 5.703152 0.0000 BAVG 0.000979 0.001104 0.886811 0.3758 GAMESYR 0.020174 0.001343 15.02341 0.0000 HRUNSYR 0.014429 0.016057 0.898643 0.3695 RBISYR 0.010766 0.007175 1.500458 0.1344 R-squared 0.597072 Mean dependent var 13.49218 Adjusted R-squared 0.594769 S.D. dependent var 1.182466 R-squared 0.627803 Mean dependent var 13.49218 S.E. of regression 0.752731 Akaike info criterion 2.278245 Adjusted R-squared 0.622440 S.D. dependent var 1.182466 Sum squared resid 198.3115 Schwarz criterion 2.311105 S.E. of regression 0.726577 Akaike info criterion 2.215907 Sum squared resid 183.1863 Schwarz criterion 2.281626 12
  3. Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. 10.12.2017 Wooldridge PHÂN TÍCH HỒI QUY BỘI PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN VẤN ĐỀ SUY DIỄN Wald Test: Equation: UR Phaân phoái Fisher F Test Statistic Value df Probability  Trong EXCEL: F-statistic 9.550257 (3, 347) 0.0000 Ñeå tính F0,05(1,6) = 5.987 Chi-square 28.65077 3 0.0000 goõ coâng thöùc sau: =FINV(0.05,1,6) Null Hypothesis: C(4)=0, C(5)=0,C(6)=0 p–value cuûa phaân phoái F ñöôïc tính theo coâng thöùc: Null Hypothesis Summary: p–value= P( >F) F Normalized Restriction (= 0) Value Std. Err. goõ coâng thöùc =FDIST(5.987,1,6) ta ñöôïc p–value = 0.05 C(4) 0.000979 0.001104 C(5) 0.014429 0.016057 C(6) 0.010766 0.007175  Trong Eviews: Restrictions are linear in coefficients. @QFDIST(0.95,1,6)= 5.987 F0,05(1,6) = 5.987 @CFDIST(5.987378,1,6)= 0.95 p–value = 0.05 • p-value = 0,0000 < 0,05 : bác bỏ H0 Phân tích hồi quy bội PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN Vấn đề suy diễn Tập tin mlb1.wf1 Dependent Variable: LOG(SALARY) Method: Least Squares Kiểm định ý nghĩa toàn bộ của mô hình hồi quy Included observations: 353 4.34 Variable Coefficient Std. Error t-Statistic Prob. C 11.19242 0.288823 38.75184 0.0000 Giả thuyết không phát biểu rằng các biến YEARS 0.068863 0.012115 5.684295 0.0000 4.44 giải thích hoàn toàn không có tác dụng GAMESYR 0.012552 0.002647 4.742440 0.0000 giải thích cho biến phụ thuộc BAVG 0.000979 0.001104 0.886811 0.3758 HRUNSYR 0.014429 0.016057 0.898643 0.3695 4.45 Mô hình đã gán ràng buộc RBISYR 0.010766 0.007175 1.500458 0.1344 (hồi quy với hệ số chặn) 4.46 R-squared 0.627803 Mean dependent var 13.49218 Adjusted R-squared 0.622440 S.D. dependent var 1.182466 S.E. of regression 0.726577 Akaike info criterion 2.215907 Sum squared resid 183.1863 Schwarz criterion 2.281626 Log likelihood -385.1076 Hannan-Quinn criter. 2.242057 F-statistic 117.0603 Durbin-Watson stat 1.265390 Kiểm định ý nghĩa toàn bộ của mô hình hồi quy được trình bày trong Prob(F-statistic) 0.000000 hầu hết các phần mềm hồi quy. Giả thuyết không thường bị bác bỏ • H0: β1 = = β5 = 0 ; H1: H0 sai 2 4.44 H0: R = 0 (Hàm hồi quy mẫu SRF không phù hợp với mẫu khảo sát) • p-value = 0,0000 < 0,05 : bác bỏ H © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 0 13
  4. Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. 10.12.2017 Wooldridge Phân tích hồi quy bội Phân tích hồi quy bội Vấn đề suy diễn Vấn đề suy diễn Kiểm định ràng buộc tuyến tính tổng quát với kiểm định F Mô hình chưa gán ràng buộc (UR) Ví dụ: Kiểm định sự hợp lý của việc định giá nhà 4.49 Giá dự kiến (giá được định ra Kích thước lô đất Giá nhà thực tế Mô hình đã gán ràng buộc thực trước khi căn nhà được bán) (tính bằng feet) Mô hình đã gán ràng buộc (R) chất là mô hình hồi quy [y-x1] theo một hằng số 4.50 4.47 Thống kê kiểm định Diện tích bình phương Số phòng ngủ Hơn nữa, các yếu tố khác nhất thiết 4.48 không có tác động đến giá thực tế một khi đã kiểm soát giá dự kiến. F ~ F4,83 ; = 5% F0,05(4,83)= 2,50 Nếu căn nhà được định giá hợp lý, thì 1% sự thay đổi trong giá dự kiến sẽ tương ứng với 1% thay đổi trong giá thực tế. F= 0,661 < F0,05(4,83)= 2,50 : chấp nhận H0 với mức ý nghĩa 5% © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. PHÂN TÍCH HỒI QUY BỘI PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN VẤN ĐỀ SUY DIỄN • Tập tin hprice1.wf1 Dependent Variable: LOG(PRICE)-LOG(ASSESS) (R) Method: Least Squares Dependent Variable: LOG(PRICE) (UR) Included observations: 88 Method: Least Squares Included observations: 88 Variable Coefficient Std. Error t-Statistic Prob. Variable Coefficient Std. Error t-Statistic Prob. C -0.084814 0.015671 -5.412151 0.0000 C 0.263743 0.569665 0.462980 0.6446 R-squared 0.000000 Mean dependent var -0.084814 LOG(ASSESS) 1.043065 0.151446 6.887372 0.0000 Adjusted R-squared 0.000000 S.D. dependent var 0.147006 LOG(LOTSIZE) 0.007438 0.038561 0.192884 0.8475 S.E. of regression 0.147006 Akaike info criterion -0.985381 LOG(SQRFT) -0.103238 0.138430 -0.745778 0.4579 Sum squared resid 1.880149 Schwarz criterion -0.957230 BDRMS 0.033839 0.022098 1.531303 0.1295 R-squared 0.772809 Mean dependent var 5.633180 Adjusted R-squared 0.761860 S.D. dependent var 0.303573 S.E. of regression 0.148142 Akaike info criterion -0.926147 Sum squared resid 1.821529 Schwarz criterion -0.785389 14
  5. Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. 10.12.2017 Wooldridge PHÂN TÍCH HỒI QUY BỘI Phân tích hồi quy bội VẤN ĐỀ SUY DIỄN Vấn đề suy diễn Wald Test: Equation: (UR) Test Statistic Value df Probability Kết quả hồi quy của mô hình chưa gán ràng buộc (UR) F-statistic 0.667773 (4, 83) 0.6162 Chi-square 2.671090 4 0.6143 Null Hypothesis: C(2)=1,C(3)=0,C(4)=0,C(5)=0 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. Khi kiểm định riêng rẽ, không có bằng chứng -1 + C(2) 0.043065 0.151446 chống lại sự hợp lý của C(3) 0.007438 0.038561 việc định giá nhà C(4) -0.103238 0.138430 C(5) 0.033839 0.022098 Kiểm định F áp dụng được với dạng tổng quát của các giả thuyết bội và tuyến tính Restrictions are linear in coefficients. Với tất cả các kiểm định và các khoảng tin cậy, các giả thiết MLR.1 – MLR.6 được giả định là thỏa mãn; nếu không các kiểm định sẽ không còn đáng tin cậy. • p-value = 0,6162 > 0,05 : chấp nhận H0 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. PHÂN TÍCH HỒI QUY BỘI PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN VẤN ĐỀ SUY DIỄN • Mối liên hệ giữa thống kê t và F: Kiểm định ràng buộc tuyến tính tổng quát với kiểm định F Kiểm định giả thiết đối 2 phía thì kết quả theo t và F là như nhau. Lưu ý: • Tập tin wage2.wf1 • Mô hình chưa gán ràng buộc (UR) Dependent Variable: WAGE (EQ01) y = β0 + β1x1 + β2x2 + β3x3 + β4x4 + β5x5 + β6x6 + u Method: Least Squares • H0: β2 = 2, β4 = 0, β5 = -3 ; H1: H0 sai Included observations: 935 • Mô hình đã gán ràng buộc (R) Variable Coefficient Std. Error t-Statistic Prob. y = β0 + β1x1 + 2x2 + β3x3 -3x5 + β6x6 + u (không chạy được) C -276.2405 106.7018 -2.588901 0.0098 EDUC 74.41486 6.286993 11.83632 0.0000 y - 2x2 + 3x5 = β0 + β1x1 + β3x3 + β6x6 + u (chạy được) EXPER 14.89164 3.252920 4.577929 0.0000 TENURE 8.256811 2.497628 3.305861 0.0010 Chỉ dùng công thức (4.37), không dùng được công thức (4.41) R-squared 0.145880 Mean dependent var 957.9455 15
  6. Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. 10.12.2017 Wooldridge PHÂN TÍCH HỒI QUY BỘI PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN VẤN ĐỀ SUY DIỄN • Mối liên hệ giữa thống kê t và F: • Mối liên hệ giữa thống kê t và F: 1) H0: βeduc = 63 ; H0: βeduc ≠ 63 Wald Test: 74,41486 63 Equation: (EQ01) t 1,815631 ; = 5% 6,286993 Test Statistic Value df Probability t-statistic 1.815632 931 0.0697 |t| = 1,815631 1,815631) = 0,0697 Chi-square 3.296518 1 0.0694 Null Hypothesis: C(2)=63 p-value(2p) > 0,05 : chấp nhận H0 Null Hypothesis Summary: 2) H0: βeduc = 63 ; H0: βeduc > 63 Normalized Restriction (= 0) Value Std. Err. t = 1,815631 > t0,05( ) = 1,645 : bác bỏ H0 -63 + C(2) 11.41486 6.286993 Hay: p-value(1p) = 0,0697/2 = 0,0349 < 0,05 : bác bỏ H0 Restrictions are linear in coefficients. PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN • 4.6 Trình bày kết quả hồi quy (bằng tay) • Ví dụ 4.10 Sự đánh đổi Giữa tiền Lương và Phụ cấp của Giáo viên • Ví dụ 4.10 Sự đánh đổi Giữa tiền Lương và Phụ cấp của Giáo viên • salary lương của giáo viên • b/s là viết tắt của “tỷ lệ phụ cấp trên lương” • enroll quy mô của trường • staff số giáo viên trên một nghìn học sinh • droprate tỷ lệ học sinh bỏ học • gradrate tỷ lệ học sinh tốt nghiệp • totcomp tổng thu nhập hàng năm trung bình cho một giáo viên, bao gồm lương và các phụ cấp (lương hưu, bảo hiểm y tế và các khoản khác) • 16
  7. Chương 4 - Nhập môn Kinh tế lượng * Jeffrey M. 10.12.2017 Wooldridge PHÂN TÍCH HỒI QUY BỘI VẤN ĐỀ SUY DIỄN Môøi gheù thaêm trang web: • 4.6 Trình bày kết quả hồi quy mô hình 3 (bằng Eviews) Dependent Variable: LOG(SALARY) Method: Least Squares Date: 10/25/17 Time: 20:26   Sample: 1 408 Included observations: 408 Variable Coefficien Std. Error t-StatisticProb. BENEFITS/SALARY-0.589320 0.164874-3.574366 0.0004 LOG(ENROLL) 0.0881200.007324 12.03171 0.0000 LOG(STAFF) -0.2182780.049950 -4.369893 0.0000 DROPRATE-0.000283 0.001615 -0.175071 0.8611 GRADRATE0.000967 0.000663 1.4601420.1450 C10.738460.258265 41.579220.0000 R-squared 0.361030 Mean dependent var10.35439 Adjusted R-squared 0.353083 S.D. dependent var0.154316 S.E. of regression 0.124118 Akaike info criterion-1.320572 Sum squared resid 6.192919 Schwarz criterion-1.261583 Log likelihood 275.3966 Hannan-Quinn criter.-1.297230 F-statistic 45.42754 Durbin-Watson stat1.837378 Prob(F-statistic) 0.000000 17