Giáo trình Nhập môn kinh tế lượng và ứng dụng - Chương 3: Mô hình hồi quy tuyến tính đơn

Số hạng sai số ut (hay còn gọi là số hạng ngẫu nhiên) là thành phần ngẫu
nhiên không quan sát được và là sai biệt giữa Yt và phần xác định a + ßXt.
Sau đây một tổ hợp của bốn nguyên nhân ảnh hưởng khác nhau:
1. Biến bỏ sót. Giả sử mô hình thực sự là Yt = a + ßXt + ?Zt +vt trong đó, Zt là
một biến giải thích khác và vt là số hạng sai số thực sự, nhưng nếu ta sử
dụng mô hình là Y = a + ßXt +ut thì ut = ?Zt +vt. Vì thế, ut bao hàm cả ảnh
hưởng của biến Z bị bỏ sót. Trong ví dụ về địa ốc ở phần trước, nếu mô
hình thực sự bao gồm cả ảnh hưởng của phòng ngủ và phòng tắm và chúng
ta đã bỏ qua hai ảnh hưởng này mà chỉ xét đến diện tích sử dụng thì số
hạng u sẽ bao hàm cả ảnh hưởng của phòng ngủ và phòng tắm lên giá bán
nhà.
2. Phi tuyến tính. ut có thể bao gồm ảnh hưởng phi tuyến tính trong mối quan
hệ giữa Y và X. Vì thế, nếu mô hình thực sự là Yt =a + ßX t +?X t2 +ut , 
nhưng lại được giả định bằng phương trình Y = a + ßXt +ut , thì ảnh hưởng
của 2
X t sẽ được bao hàm trong ut.
3. Sai số đo lường. Sai số trong việc đo lường X và Y có thể được thể hiện qua
u. Ví dụ, giả sử Yt giá trị của việc xây dựng mới và ta muốn ước lượng hàm
Yt = a + ßrt +vt trong đó rt là lãi suất nợ vay và vt là sai số thật sự (để đơn
giản, ảnh hưởng của thu nhập và các biến khác lên đầu tư đều được loại
bỏ). Tuy nhiên khi thực hiện ước lượng, chúng ta lại sử dụng mô hình Yt =
a + ßXt +ut trong đó Xt = rt +Zt là lãi suất căn bản. Như vậy thì lãi suất
được đo lường trong sai số Zt thay rt = Xt – Zt vào phương trình ban đầu, ta
sẽ được
Yt = a +ß(Xt – Zt) +vt = a + ßXt – ßZt + vt = a + ßXt + ut
Cần luôn lưu ý rằng tính ngẫu nhiên của số hạng ut bao gồm sai số khi đo
lường lãi suất nợ vay một cách chính xác.
4. Những ảnh hưởng không thể dự báo. Dù là một mô hình kinh tế lượng tốt
cũng có thể chịu những ảnh hưởng ngẫu nhiên không thể dự báo được.
Những ảnh hưởng này sẽ luôn được thể hiện qua số hạng sai số ut. 
pdf 70 trang hoanghoa 10/11/2022 6420
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Nhập môn kinh tế lượng và ứng dụng - Chương 3: Mô hình hồi quy tuyến tính đơn", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfgiao_trinh_nhap_mon_kinh_te_luong_va_ung_dung_chuong_3_mo_hi.pdf

Nội dung text: Giáo trình Nhập môn kinh tế lượng và ứng dụng - Chương 3: Mô hình hồi quy tuyến tính đơn

  1. Chương trình Giảng dạy Kinh tế Fulbright Phương pháp phân tích Nhập môn kinh tế lượng với các ứng dụng Niên khóa 2003-2004 Bài đọc Chương 3: Mô hình hồi quy tuyến tính đơn rằng dữ liệu này không đầy đủ cho việc ước lượng đường hồi quy tổng thể α +βX. HÌNH 3.3 Ví Dụ về Giá Trị X Không Đổi Y X 0 1,500 Ví dụ 3.1 Theo thuật ngữ đượïc dùng phổ biến trong kinh tế lượng, nếu ta sử dụng dữ liệu trong Bảng 3.1 và thực hiện “hồi quy Y (GIÁ) theo số hạng hằng số và X (SQFT)”, ta có thể xác định được mối quan hệ ước lượng (hay hàm hồi quy ˆ ˆ của mẫu) là Yt = 52,351+ 0,13875351X t . Yt là giá ước lượng trung bình (ngàn đô la) tương ứng với Xt. (xem Bảng 3.1). Hệ số hồi quy của Xt là ảnh hưởng cận biên ước lượng của diện tích sử dụng đến giá nhà, ở mức trung bình. Do vậy, nếu diện tích sử dụng tăng lên một đơn vị, giá trung bình ước lượng kỳ vọng sẽ tăng thêm 0,13875 ngàn đô la ($138.75). Một cách thực tế, cứ mỗi 100 mét vuông tăng thêm diện tích sử dụng, giá bán ước lượng được kỳ vọng tăng thêm, mức trung bình, $ 13.875. Hàm hồi quy của mẫu có thể được dùng để ước lượng giá nhà trung bình dựa trên diện tích sử dụng cho trước (Bảng 3.1 có trình bày giá trung bình ở cột cuối.) Do đó, một căn nhà có diện tích 1.800 mét vuông thì giá bán kỳ vọng trung bình là $302.551[ = 52,351 + (0,139 × 1.800)]. Nhưng giá bán thực sự của căn nhà là $285.000. Mô hình đã ước lượng giá bán vượt quá $17.551. Ngược lại, đối với một căn nhà có diện tích sử dụng là 2.600 mét vuông, giá bán trung bình ước lượng là $413.751, thấp hơn giá bán thực sự $505.000 một cách đáng kể. Sự khác biệt này có thể xảy ra bởi vì chúng ta đã bỏ qua các yếu tố ảnh hưởng khác lên giá bán nhà. Ví dụ, một ngôi nhà có sân vườn rộng và/ hay hồ bơi, sẽ có giá cao hơn giá trung bình. Điều này nhấn mạnh tầm quan trọng trong việc nhận diện được các biến giải thích có thể ảnh hưởng đến giá trị của biến phụ thuộc và đưa các ảnh hưởng này vào mô hình được thiết lập. Ngoài ra, rất cần thiết trong việc phân tích độ tin cậy của các ước Ramu Ramanathan 11 Thục Đoan/Hào Thi
  2. Chương trình Giảng dạy Kinh tế Fulbright Phương pháp phân tích Nhập môn kinh tế lượng với các ứng dụng Niên khóa 2003-2004 Bài đọc Chương 3: Mô hình hồi quy tuyến tính đơn lượng của tung độ và hệ số độ dốc trong Phương trình (3.1), và mức độ “thích hợp” của mô hình đối với dữ liệu thực tế. BÀI TẬP 3.2 Sao chép hai cột số liệu trong Bảng 3.1 vào một bảng mới. Trong cột đầu tiên của bảng tính sao chép các giá trị về Yt (GIÁ) và Xt (SQFT) trong cột thứ hai. Sử dụng máy tính và tính thêm giá trị cho hai cột khác. Bình phương từng giá trị trong cột thứ hai và điền giá trị đó vào cột thứ ba (x). Nhân lần lượt từng giá trị ở cột thứ nhất với giá trị tương ứng ở cột hai và điền kết qua vào cột thứ tư (XtYt). Tiếp theo, tính tổng của từng cột và đánh giá các tổng sau đây: X 2 = 55 .462 .515 ∑ X t = 26.753 ∑ t Y 2 = 9.095 .985 ,5 ∑ Yt = 4.444 ,9 ∑ t Để tránh tình trạng quá nhiều và sai số làm tròn, cần sử dụng càng nhiều số thập phân càng tốt. Sau đó, tính Sxy từ Phương trình (3.12) và Sxx từ Phương trình (3.11). Cuối cùng, tính βˆ theo (3.10) và αˆ theo (3.9) và kiểm tra lại những giá trị đã trình bày ban đầu. 3.3 Tính chất của các ước lượng Mặc dù phương pháp bình phương cho ra kết quả ước lượng về mối quan hệ tuyến tính có thể phù hợp với dữ liệu sẵn có, chúng ta cần trả lời một số câu hỏi sau. Ví dụ, Đặc tính thống kê của αˆ và βˆ ? Thông số nào được dùng để đo độ tin cậy của αˆ và βˆ ? Bằng cách nào để có thể sử dụng αˆ và βˆ để kiểm định giả thuyết thống kê và thực hiện dự báo? Sau đây chúng ta sẽ đi vào thảo luận từng vấn đề trên. Sẽ rất hữu ích nếu bạn ôn lại Phần 2.6, phần này đưa ra tóm tắt về những tính chất cần thiết của thông số ước lượng. Tính chất đầu tiên cần xem xét là độ không thiên lệch. Cần lưu ý rằng trong Phần 2.4 các thông số ước lượng αˆ và βˆ ? tự thân chúng là biến ngẫu nhiên và do đó tuân theo phân phối thống kê. Nguyên nhân là vì những lần thử khác nhau của một cuộc nghiên cứu sẽ cho các kết quả ước lượng thông số khác nhau . Nếu chúng ta lặp lại nghiên cứu với số lần thử lớn, ta có thể đạt được nhiều giá trị ước lượng. Sau đó chúng ta có thể tính tỷ số số lần mà những ước lượng này rơi vào một khoảng giá trị xác định. Kết quả sẽ sẽ cho ra phân phối của các ước lượng của mẫu. Phân phối này có giá trị trung bình Ramu Ramanathan 12 Thục Đoan/Hào Thi
  3. Chương trình Giảng dạy Kinh tế Fulbright Phương pháp phân tích Nhập môn kinh tế lượng với các ứng dụng Niên khóa 2003-2004 Bài đọc Chương 3: Mô hình hồi quy tuyến tính đơn và phương sai. Nếu trung bình của phân phối mẫu là thông số thực sự (trong trường hợp này là α hoặc β), thì đây là ước lượng không thiên lệch. Độ không thiên lệch rõ ràng là điều luôn được mong muốn bởi vì, điều đó có nghĩa là, ở mức trung bình, giá trị ước lượng sẽ bằng với giá trị thực tế, mặc dù trong một số trường hợp cá biệt thì điều này có thể không đúng. Có thể nói rằng thông số ước lượng OLS của α và β đưa ra trong Phần 3.2 có tính chất không thiên lệch. Tuy nhiên, để chứng minh điều này, chúng ta cần đặt ra một số giả thuyết bổ sung về Xt và ut. Cần nhớ rằng, mặc dù Giả thiết 3.1 có thể và được giảm nhẹ ở phần sau, nhưng Giả thuyết 3.2 và 3.3 là luôn luôn cần thiết và phải tuân theo. Sau đây là các giả thiết bổ sung cần thiết. GIẢ THIẾT 3.3 (Sai Số Trung Bình bằng Zero) Mỗi là u một biến ngẫu nhiên với E(u) = 0 Trong Hình 3.1 cần lưu ý rằng một số điểm quan sát nằm trên đường α + βX và một số điểm nằm dưới. Điều này có nghĩa là có một giá trị sai số mang dấu dương và một số sai số mang dấu âm. Do α + βX là đường trung bình, nên có thể giả định rằng các sai số ngẫu nhiên trên sẽ bị loại trừ nhau, ở mức trung bình, trong tổng thể. Vì thế, giả định rằng ut là biến ngẫu nhiên với giá trị kỳ vọng bằng 0 là hoàn toàn thực tế. GIẢ THIẾT 3.4 (Các Giá Trị X Được Cho Trước và Không Ngẫu Nhiên) Mỗi giá trị Xt được cho trước và không là biến ngẫu nhiên. Điều này ngầm chỉ rằng đồng phương sai của tổng thể giữa Xt và ut, Cov(Xt, ut) = E(Xt, ut) – E(Xt)E(ut) = XtE(ut) – XtE(ut) = 0. Do đó giữa Xt và ut không có mối tương quan (xem Định nghĩa 2.4 và 2.5). Theo trực giác, nếu X và u có mối tương quan, thì khi X thay đổi, u cũng sẽ thay đổi. Trong trường hợp này, giá trị kỳ vọng của Y sẽ không bằng α + βX. Nếu giá trị X là không ngẫu nhiên thì giá trị kỳ vọng có điều kiện của Y theo giá trị X sẽ bằng α + βX. Kết quả của việc vi phạm Giả thiết 3.4 sẽ được trình bày trong phần sau, đặc biệt là khi nghiên cứu mô hình hệ phương trình (Chương 13). Tính chất 3.3 phát biểu rằng khi hai giả thiết được bổ sung, thông số ước lượng OLS là không thiên lệch. TÍNH CHẤT 3.3 (Độ Không Thiên Lệch) Ramu Ramanathan 13 Thục Đoan/Hào Thi
  4. Chương trình Giảng dạy Kinh tế Fulbright Phương pháp phân tích Nhập môn kinh tế lượng với các ứng dụng Niên khóa 2003-2004 Bài đọc Chương 3: Mô hình hồi quy tuyến tính đơn Trong hai giả thiết bổ sung 3.3 và 3.4, [E(ut) = 0, Cov(Xt, ut) = 0], thông số ước lượng, thông số ước lượng bình phương tối thiểu αˆ và βˆ là không thiên lệch; nghĩa là E()αˆ = α , và E(βˆ )= βˆ ø. CHỨNG MINH (Nếu độc giả không quan tâm đến chứng minh, có thể bỏ qua phần). ˆ Từ Phương trình (3.10), E(β )= E(Sxy Sxx ). Nhưng theo Giả thuyết 3.4, Xt là không ngẫu nhiên và do đó Sxx cũng không ngẫu nhiên. Điều này có nghĩa là khi tính giá trị kỳ vọng, các số hạng liên quan đến Xt có thể được đưa ra ngoài ˆ 1 giá trị kỳ vọng. Vì vậy, ta có E(β )= E(Sxy ). Trong Phương trình (3.12), Sxx thay Yt từ Phương trình (3.1) và thay ∑α bằng nα . (∑ X t )(nα + β ∑ X t + ∑ut ) S xy = ∑ X t ()α + βX t + ut −   (3.15)  n   2    2 (∑ X t ) ()()∑ X t ∑ut = α X t + β X t + X tut −α X t − β   −   ∑ ∑ ∑ ∑ n n      2  ()∑ X t  (∑ X t )(∑ut ) = β  X t −  +  X tut −  ∑ n ∑ n     = βSxx + Sxu trong đó Sxx được cho bởi Phương trình (3.13) và ( X )( u ) S = X u − ∑ t ∑ t (3.16) xu ∑ t t n = ∑ X t ut − X ∑ut = ∑(X t − X )ut X là trung bình mẫu của X, Xt là không ngẫu nhiên, X xuất hiện ở mọi số hạng, và kỳ vọng của tổng các số hạng thì bằng tổng các giá trị kỳ vọng. Do vậy, E()Sxu = ∑ E (X tut )− X ∑ E(ut ) = ∑ X t E(ut )− X ∑ E(ut ) = 0 Ramu Ramanathan 14 Thục Đoan/Hào Thi
  5. Chương trình Giảng dạy Kinh tế Fulbright Phương pháp phân tích Nhập môn kinh tế lượng với các ứng dụng Niên khóa 2003-2004 Bài đọc Chương 3: Mô hình hồi quy tuyến tính đơn ˆ theo Giả thiết 3.3. Do đó, E(Sxy) = βSxx, nghĩa là E(β )= E(S xy ) S xx = β . Như vậy β là ước lượng không thiên lệch của β. Chứng minh tương tự cho α^ . Cần nhận thấy rằng việc chứng minh độ không thiên lệch phụ thuộc chủ yếu vào ˆ Giả thiết 3.4. Nếu E(Xtut) ≠ 0, β có thể bị thiên lệch. BÀI TẬP 3.3 Sử dụng Phương trình (3.9) để chứng minh rằng αˆ là không thiên lệch. Nêu rõ các giả thuyết cần thiết khi chứng minh. Mặc dầu độ không thiên lệch luôn là một tính chất luôn được mong muốn, nhưng tự bản thân độ không thiên lệch không làm cho thông số ước lượng “tốt”, và một ước lượng không thiên lệch không chỉ là trường hợp cá biệt. ~ Hãy xem xét ví dụ sau về một thông số ước lượng khác là β = (Y2 – Y1)/(X2 – ~ X1). Lưu ý rằng β đơn giản là độ dốc của đường thẳng nối hai điểm (X1, Y1) ~ và (X2, Y2). Rất dễ nhận thấy rằng β là không thiên lệch ~ Y − Y ()α + βX + u − (α + βX + u ) u − u β = 2 1 = 2 2 1 1 = β + 2 1 X 2 − X 1 X 2 − X 1 X 2 − X 1 Như đã nói trước đây, các giá trị X là không ngẫu nhiên và E(u2) = E(u1) = 0. ~ Do đó, β là không thiên lệch. Thực ra, ta có thể xây dựng một chuỗi vô hạn ~ của các thông số ước lượng không thiên lệch như trên. Bởi vì β loại bỏ các giá trị quan sát từ 3 đến n, một cách trực quan đây không thể là một thông số ước lượng “tốt”. Trong Bài tập 3.6, tất cả các giá trị quan sát được sử dụng thể thiết lập các thông số ước lượng không thiên lệch khác, nhưng tương tự như trên đây không phải là là thông số ước lượng không thiên lệch tốt nhất. Do đó, rất cần có những tiêu chuẩn bổ sung để đánh giá “độ tốt” của một thông số ước lượng. Tiêu chuẩn thứ hai cần xem xét là tính nhất quán, đây là một tính chất của mẫu lớn đã được định nghĩa trong Phần 2.6 (Định nghĩa 2.10). Giả sử ta chọn ngẫu nhiên một mẫu có n phần tử và đi tìm αˆ và βˆ . Sau đó chọn một mẫu lớn hơn và ước lượng lại các thông số này. Lặp lại quá trình này nhiều lần để có được một chuỗi những thông số ước lượng. Tính nhất quán là tính chất đòi hỏi các thông số ước lượng vẫn phù hợp khi cỡ mẫu tăng lên vô hạn. Ước ~ lượng β được trình bày ở trên rõ ràng là không đạt được tính nhất quán bởi vì khi cỡ mẫu tăng lên không ảnh hưởng gì đến thông số này. Tính chất 3.4 phát biểu các điều kiện để một ước lượng có tính nhất quán. Ramu Ramanathan 15 Thục Đoan/Hào Thi
  6. Chương trình Giảng dạy Kinh tế Fulbright Phương pháp phân tích Nhập môn kinh tế lượng với các ứng dụng Niên khóa 2003-2004 Bài đọc Chương 3: Mô hình hồi quy tuyến tính đơn TÍNH CHẤT 3.4 (Tính Nhất Quán) Theo Giả thiết (3.2), (3.3) và (3.4), ước lượng bình phương tối thiểu có tính chất nhất quán. Do đó, điều kiện để đạt được tính nhất quán là E(ut) = 0, Cov(Xt, ut) = 0 và Var(Xt) ≠ 0. CHỨNG MINH (Nếu độc giả không quan tâm, có thể bỏ qua phần này.) Từ Phương trình (3.15) và (3.10) S / n βˆ = β + xu (3.17) S xx / n Theo quy luật số lớn (Tính chất 2.7a), Sxu/n đồng quy với kỳ vọng của chính nó, đó là Cov(X, u). Tương tự, Sxx/n đồng quy với Var(X). Do vậy dẫn tới điều, nếu n hội tụ đến vô cùng, β sẽ đồng quy với β + [Cov(X,u)/Var(X), và sẽ bằng β nếu Cov(X,u) = 0 – nghĩa là nếu X và u không tương quan. Như vậy, βˆ là ước lượng nhất quán của β. Mặc dù βˆ là không thiên lệch và nhất quán, vẫn có những tiêu chuẩn cần bổ sung bởi để có thể xây dựng ước lượng nhất quán và không thiên lệch khác. Bài tập 3.6 là một ví dụ về loại ước lượng đó. Tiêu chuẩn sử dụng tiếp theo là tính hiệu quả (định nghĩa trong Phần 2.6). Nói một cách đơn giản, ước lượng không thiên lệch có tính hiệu quả hơn nếu ước lượng này có phương sai nhỏ hơn. Để thiết lập tính hiệu quả, cần có các giả thiết sau về ut. GIẢ THIẾT 3.5 (Phương sai của sai số không đổi) 2 Tất cả giá trị u được phân phối giống nhau với cùng phương sai σ , sao cho 2 2 Var(ut ) = E(ut )= σ . Điều này được gọi là phương sai của sai số không đổi (phân tán đều). GIẢ THIẾT 3.6 (Độc Lập Theo Chuỗi) Giá trị u được phân phối độc lập sao cho Cov(ut, us) = E(utus) = 0 đối với mọi t ≠ s. Đây được gọi là chuỗi độc lập. Các giả thiết trên ngầm chỉ rằng các phần dư phân có phân phối giống nhau và phân phối độc lập (iid). Từ Hình 1.2 ta thấy rằng ứng với một giá trị Ramu Ramanathan 16 Thục Đoan/Hào Thi
  7. Chương trình Giảng dạy Kinh tế Fulbright Phương pháp phân tích Nhập môn kinh tế lượng với các ứng dụng Niên khóa 2003-2004 Bài đọc Chương 3: Mô hình hồi quy tuyến tính đơn X sẽ có một giá trị phân phối Y để xác định phân phối có điều kiện. Sai số ut là độ lệch từ trung bình có điều kiện α + βXt. Giả thiết 3.5 ngầm định rằng 2 phân phối của ut có cùng phương sai (σ ) với phân phối của us cho một quan sát khác s. Hình 3.4a là một ví dụ về phương sai của sai số thay đổi (hoặc không phân tán đều) khi phương sai thay đổi tăng theo giá trị quan sát X. Giả thuyết 3.5 được giảm nhẹ trong Chương 8. Phần 3.6 Phụ chương có trình bày mô tả ba chiều của giả thuyết này. Giả thiết 3.6 (sẽ được giảm nhẹ trong Chương 9) ngầm định rằng là ut và us độc lập và do vậy không có mối tương quan. Cụ thể là, các sai số liên tiếp nhau không tương quan nhau và không tập trung. Hình 3.4b là một ví dụ về tự tương quan khi giả thuyết trên bị vi phạm. Chú ý rằng khi các giá trị quan sát kế tiếp nhau tập trung lại, thì có khả năng các sai số sẽ có tương quan. HÌNH 3.4 Ví Dụ về Phương Sai Của Sai Số Thay Đổi và Tự Hồi Quy Y X a. Phương sai của sai số thay đổi Y X b. Tự hồi quy TÍNH CHẤT 3.5 (Hiệu quả, BLUE và Định lý Gauss-Markov) Ramu Ramanathan 17 Thục Đoan/Hào Thi
  8. Chương trình Giảng dạy Kinh tế Fulbright Phương pháp phân tích Nhập môn kinh tế lượng với các ứng dụng Niên khóa 2003-2004 Bài đọc Chương 3: Mô hình hồi quy tuyến tính đơn Theo Giả thiết 3.2 đến 3.6, ước lượng bình phương tối thiểu thông thường (OLS) là ước lượng tuyến tính không thiên lệch có hiệu quả nhất trong các ước lượng. Vì thế phương pháp OLS đưa ra Ước Lượng Không Thiên lệch Tuyến Tính Tốt Nhất (BLUE). Kết quả này (được chứng minh trong Phần 3.A.4) được gọi là Định lý Gauss–Markov, theo lý thuyết này ước lượng OLS là BLUE; nghĩa là trong tất cả các tổ hợp tuyến tính không thiên lệch của Y, ước lượng OLS của α và β có phương sai bé nhất. Tóm lại, áp dụng phương pháp bình phương tối thiểu (OLS) để ước lượng hệ số hồi quy của một mô hình mang lại một số tính chất mong muốn sau: ước lượng là (1) không thiên lệch, (2) có tính nhất quán và (3) có hiệu quả nhất. Độ không thiên lệch và tính nhất quán đòi hỏi phải kèm theo Giả thuyết E(ut) = 0 và Cov(Xt, ut) = 0. Yêu cầu về tính hiệu quả và BLUE, thì cần có thêm 2 giả thuyết, Var(ut) = σ và Cov(ut, us) = 0, với mọi t ≠ s. 3.4 Độ Chính Xác của Ước Lượng và Mức Độ Thích Hợp của Mô Hình Sử dụng các dữ liệu trong ví dụ về địa ốc ta ước lượng được thông số như sau αˆ = 52.351và βˆ = 0,13875. Câu hỏi cơ bản là các ước lượng này tốt như thế ˆ nào và mức độ thích hợp của hàm hồi quy mẫu Yt = 52,351 + 0,13875351 X với dữ liệu ra sao. Phần này sẽ thảo luận phương pháp xác định thông số đo lường độ chính xác của các ước lượng cũng như độ phù hợp. Độ Chính Xác của Các Ước Lượng Từ lý thuyết xác suất ta biết rằng phương sai của một biến ngẫu nhiên đo lường sự phân tán xung quanh giá trị trung bình. Phương sai càng bé, ở mức trung bình, từng giá trị riêng biệt càng gần với giá trị trung bình. Tương tự, khi đề cập đến khoảng tin cậy, ta biết rằng phương sai của biến ngẫu nhiên càng nhỏ, khoảng tin cậy của các tham số càng bé. Như vậy, phương sai của một ước lượng là thông số để chỉ độ chính xác của một ước lượng. Do đó việc tính toán phương sai của αˆ và βˆ là luôn cần thiết. Do αˆ và βˆ thuộc vào các giá trị Y, mà Y lại phụ thuộc vào các biến ngẫu nhiên u1, u2, , un, nên chúng cũng là biến ngẫu nhiên với phân phối tương ứng. Sau đây các phương trình được rút ra trong Phần 3.A.6 ở phần phụ lục của chương này. 2 2 σ Var(βˆ) = σ 2 = E βˆ − β  = (3.18) β&& ( )    S xx Ramu Ramanathan 18 Thục Đoan/Hào Thi
  9. Chương trình Giảng dạy Kinh tế Fulbright Phương pháp phân tích Nhập môn kinh tế lượng với các ứng dụng Niên khóa 2003-2004 Bài đọc Chương 3: Mô hình hồi quy tuyến tính đơn 2 2 2 ∑ X t 2 Var (αˆ ) = σ αˆ = E[()αˆ − α ]= σ (3.19) nS xx X ˆ ˆ ˆ ˆ 2 (3.20) Cov (α , β ) = σ αˆβˆ = E [()α − α (β − β )]= − σ S xx 2 trong đó Sxx được định nghĩa theo Phương trình (3.11) và σ là phương sai của sai số. Cần lưu ý rằng nếu Sxx tăng, giá trị phương sai và đồng phương sai (trị tuyệt đối) sẽ giảm. Điều này cho thấy sự biến thiên ở X càng cao và cỡ mẫu càng lớn thì càng tốt bởi vì điều đó cho chứng tỏ độ chính của các thông số được ước lượng. Các biểu thức trên là phương sai của tổng thể và là ẩn số bởi vì σ2 là ẩn số. Tuy nhiên, các thông số này có thể được ước lượng bởi vì σ2 có thể được ˆ ˆ ước lượng dựa trên mẫu. Lưu ý rằng Yt =αˆ + βX t là đường thẳng ước lượng. ˆ ˆ Do đó, uˆt = Yt −αˆ − βX t là một ước lượng của ut, và là phần dư ước lượng. 2 ˆ 2 Một ước lượng dễ thấy của σ là ∑ut / n nhưng ước lượng này ngẫu nhiên bị thiên lệch. Một ước lượng khác của σ2 được cho sau đây (xem chứng minh ở Phần 3.A.7) uˆ 2 s 2 = σˆ 2 = ∑ t (3.21) n − 2 Lý do chia tử số cho n – 2 thì tương tự như trường hợp chia chi-square cho n – 1, đã được thảo luận trong Phần 2.7. n – 1 được áp dụng do ∑()xi − x có điều kiện là bằng 0. Để áp dụng chia cho n – 2, cần có hai điều kiện bởi Phương trình (3.4) và (3.5). Căn bậc hai của phương sai ước lượng được gọi là sai số chuẩn của phần dư hay sai số chuẩn của hồi quy. Sử dụng ước lượng này, ta tính được các ước lượng của phương sai và đồng phương sai của αˆ và βˆ . Căn bậc hai của phương sai được gọi là sai số chuẩn của hệ số hồi quy và ký hiệu sαˆ và sβˆ . Phương sai ước lượng và đồng phương sai của hệ số hồi quy ước lượng bằng 2 2 σˆ sβˆ = (3.22) S xx X 2 2 ∑ t 2 sαˆ = σˆ (3.23) nS xx X ˆ 2 sαˆβˆ = − σ (3.24) S xx Ramu Ramanathan 19 Thục Đoan/Hào Thi