Giáo trình Kinh tế lượng - Trường Đại học Bách Khoa Hà Nội

Giới thiệu về kinh tế lượng
Thuật ngữ tiếng Anh là Econometrics, nó được ghép từ 2 từ “Econo” có nghĩa là kinh tế
và “Metrics” có nghĩa là đo lường- Vậy đó là “đo lường kinh tế”.
Theo nghĩa đơn giản, kinh tế lượng, liên quan đến việc áp dụng các phương pháp
thống kê trong kinh tế. Không như thống kê kinh tế, trong đó các dữ liệu thống kê là
chính yếu, kinh tế lượng được phân biệt bằng sự hợp nhất của lý thuyết kinh tế, công cụ
toán học và các phương pháp luận thống kê. Mở rộng hơn, kinh tế lượng quan tâm đến
(1) ước lượng các mối quan hệ kinh tế, (2) đối chiếu lý thuyết kinh tế với thực tế và
kiểm định các giả thuyết liên quan đến hành vi kinh tế, và (3) dự báo các hành vi của
các biến số kinh tế.
Người ta có để định nghĩa như sau:
+ Kinh tế lượng bao gồm việc áp dụng thống kê toán cho các số liệu kinh tế để
củng cố về mặt thực nghiệm cho các mô hình do các nhà kinh tế toán đề xuất
và để tìm ra lời giải bằng số.
+ Kinh tế lượng có thể được định nghĩa như là sự phân tích về lượng các vấn
đề kinh tế hiện thời, dựa trên việc vận dụng đồng thời lý thuyết và thực tế
được thực hiện bằng các phương pháp suy đoán thích hợp.
Ví dụ về ứng dụng của kinh tế lượng trong:
Ước lượng các mối quan hệ kinh tế
Kinh tế học thực nghiệm cung cấp rất nhiều ví dụ nhằm ước lượng các mối quan hệ
kinh tế như:
1. Ước lượng cầu/cung của các sản phẩm, dịch vụ.
2. Ước lượng ảnh hưởng của chi phí bán hàng/quảng cáo đến doanh thu và lợi nhuận.
3. Giá của cổ phiếu với các đặc trưng của công ty phát hành cổ phiếu đó, cũng như với
tình hình chung của nền kinh tế.
4. Đánh giá tác động của các chính sách tiền tệ và tài chính đến các biến như việc làm
hoặc thất nghiệp, thu nhập, xuất khẩu và nhập khẩu, lãi suất, tỷ lệ lạm phát, và thâm hụt
ngân sách. 
pdf 112 trang hoanghoa 7680
Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Kinh tế lượng - Trường Đại học Bách Khoa Hà Nội", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfgiao_trinh_kinh_te_luong_truong_dai_hoc_bach_khoa_ha_noi.pdf

Nội dung text: Giáo trình Kinh tế lượng - Trường Đại học Bách Khoa Hà Nội

  1. Ưu điểm của dạng hàm bậc hai là khi X tăng thêm một đơn vị thì Y tăng thêm β12+ 2β X đơn vị. (Dễ dàng thấy được điều này bằng cách tính dY/ dX từ phương trình nói trên.) Nếu β 2>0, thì khi X tăng lên, tác động bổ sung của X đến Y cũng tăng lên; nếu β 2 0, thì ta có chi phí biên tăng dần; nếu β 2 0 (hay β 2 = 0) để kiểm định lý thuyết này. 1.4.3. Dạng Hàm Logarít. Dạng hàm này có phương trình: logYX=+β01βε log + . Đồ thị của dạng hàm này có thể được mô tả ở dạng như sau: Có hai cách để nghĩ về dạng hàm này. Một cách để giải thích dạng hàm này là nếu X thay đổi 1% thì Y sẽ thay đổi β 1%; đây là tính chất đặc biệt của quan hệ lôgarít. Cách giải thích thứ hai về dạng hàm này là β 1 là độ co giãn của Y theo X; điều này suy ra từ định nghĩa của độ co giãn (chúng ta dễ dàng chứng minh điều này bằng một số biến đổi, bắt đầu từ dYdX(log ) / (log ) bằng với (/)(/)dY dX X Y và sắp xếp các số hạng lại). Dạng hàm này thường được sử dụng khi chúng ta quan tâm đến việc ước lượng một loại độ co giãn nào đó. Người ta cũng sử dụng dạng hàm này phổ biến khi chúng ta sử dụng hàm Cobb Douglas; hàm Cobb-Douglas có dạng YAXe= β1 ε . và nếu lấy log ở cả hai vế, chúng ta được: LnY = Ln(A) + β1LnX + ε (Trong Eviews hàm này được viết dưới dạng logY = log(A) + β1 log X + ε ) và ta có thể đặt β 0 = log(A) . Vì thế cho nên dạng hàm lôgarít thường được sử dụng cho các hàm chi phí, các hàm sản xuất, các hàm hữu dụng, và các hàm khác mà chúng thường được mô tả dưới dạng hàm Cobb-Douglas. 10
  2. Ví dụ về Hàm sản xuất Cobb-Douglas β2 β3 ε Y = β1 K L e Y = sản lượng K = nhập lượng vốn L = nhập lượng lao động Đây là mối quan hệ phi tuyến, nhưng chúng ta có thể biến đổi quan hệ này: Như thế: lnY = ln β1+ β2lnK + β3lnL+e Đây là mô hình tuyến tính trong các tham số nhưng không tuyến tính trong các biến số. Mô hình này tuyến tính theo lôgarít của các biến số. Mô hình này được gọi là mô hình lôgarít-lôgarít, lôgarít kép hay tuyến tính lôgarít Hệ số độ dốc của một mô hình tuyến tính lôgarít đo lường độ co giãn của Y theo X. Như thế, hệ số nói trên là độ co giãn. Độ co giãn này không đổi đối với X&Y + β2+ β3 đo lường hiệu quả theo qui mô. Đáp ứng của sản lượng đối với thay đổi tương xứng trong các nhập lượng. + Nếu β2 + β3 =1: hiệu quả không đổi. Tăng gấp đôi nhập lượng thì sản lượng sẽ tăng gấp đôi. + Nếu β2 + β3 1: hiệu quả tăng dần Ví dụ khi hồi qui theo dạng hàm này với dữ liệu về nông nghiệp của Đài Loan từ 16 quan sát, người ta thu được kết quả nhe sau: lnY = -3.34 + 0.49 lnK + 1.50 lnL t (-1.36) (4.80) (0.54) R2 = 0.89 Y GNP tính bằng triệu đô la K là vốn thực tính bằng triệu đô la L tính bằng triệu ngày công lao động Độ co giãn của sản lượng theo vốn là 0,49. Giữ nhập lượng lao động không đổi, gia tăng 1% nhập lượng vốn dẫn đến gia tăng 0,49% sản lượng. Độ co giãn của sản lượng theo lao động là 1,50. Giữ nhập lượng vốn không đổi, gia tăng 1% nhập lượng lao động dẫn đến gia tăng 1,5% sản lượng. Hiệu quả tăng theo qui mô bởi vì β2 + β3 = 1,99. 11
  3. R2 có nghĩa là 89% biến thiên trong lôgarít của sản lượng được giải thích bởi lôgarít của lao động và vốn. Hay ví dụ chúng ta có thể lập mô hình cầu như một mô hình tuyến tính lôgarít và từ đó ước lượng độ co giãn của cầu tiêu dùng cà phê mỗi ngày: Giả sử kết quả thu được như sau: lnQ=0.78 -0.25lnPCoffee+ 0.38lnPtea + Q là mức tiêu dùng cà phê mỗi ngày + Pcoffee là giá cà phê mỗi cân Anh + Ptea là giá trà mỗi cân Anh Độ co giãn theo giá riêng là – 0,25. + Giữ các yếu tố khác không đổi, nếu giá gia tăng 1% thì lượng cầu sẽ giảm 0,25%. + Đây là không co giãn - giá trị tuyệt đối nhỏ hơn 1. Độ co giãn theo giá-chéo là 0,38. + Giữ các yếu tố khác không đổi, nếu giá trà gia tăng 1%, thì lượng cầu cà phê sẽ gia tăng 0,38% + Nếu độ co giãn theo giá-chéo dương, thì cà phê và trà là các sản phẩm thay thế. + Nếu độ co giãn theo giá-chéo âm, thì đó là các sản phẩm bổ trợ. 1.4.4. Dạng Hàm Translog. Phương trình của dạng hàm này là: 2 logYXX=+β01ββ log + 2 (log ) + ε . Dạng hàm này có mối quan hệ với dạng hàm lôgarít giống như mối quan hệ giữa hàm bậc hai và hàm tuyến tính; nó đưa thêm một số hạng bình phương vào phương trình. Trong dạng hàm này, độ co giãn của Y theo X là β 1 + 2 β 2 log X. 1.4.5. Dạng Hàm bán-lôgarít (Semilog). Dạng hàm này có phương trình sau: logYX=+β01βε + . Sử dụng mô hình này khi chúng ta quan tâm đến tốc độ tăng trưởng của biến nào đó như GNP hay mức việc làm. 12
  4. Dạng hàm bán-lôgarít có tính chất là nếu X tăng thêm 1 đơn vị thì Y tăng thêm [ β 1*100] %. Đây không phải là một tính chất được mong muốn một cách phổ biến, nhưng có một số ứng dụng hữu ích cho dạng hàm này. Ví dụ, quan hệ giữa tiền lương và trình độ giáo dục hầu như luôn luôn được biểu hiện dưới dạng hàm này như là log(SAL ) = β01++βε ED . Điều này có nghĩa là nếu trình độ giáo dục của một người tăng 1 năm thì tiền lương của người đó tăng [ β 1*100] %. Thí dụ, nếu β 1= 0,08, nó có nghĩa là một năm tăng thêm trong trình độ giáo dục làm tăng tiền lương thêm 8%. Khi X tăng lên thì độ dốc của đường biểu diễn sẽ trở nên rất lớn, bởi vì khi X tăng lên thì tỷ lệ phần trăm gia tăng của X cũng lớn hơn. Chúng ta cũng có thể đặt lôgarít cho X, nghĩa là dạng hàm trên trở thành, Y = β 0 + β 1* log X+ ε và điều này có nghĩa là khi X tăng 1%, thì Y tăng [ β 1/100] đơn vị. Trong trường hợp này, khi X càng lớn thì độ dốc càng nhỏ, bởi vì X cần gia tăng nhiều hơn mới tạo ra được 1% gia tăng. Dạng hàm này không được sử dụng rộng rãi; dưới đây là đồ thị của nó. 1.4.6. Dạng Hàm Nghịch đảo. Dạng hàm này có phương trình như sau: 1 Y =+β βε() + . 01X Đồ thị của dạng hàm này có thể được mô tả ở dạng như sau: 13
  5. Dạng hàm nghịch đảo thường được sử dụng khi Y và X đều dương và khi đường biểu diễn quan hệ giữa chúng có lẽ dốc xuống (nghĩa là, β 0>0 và β 1>0). Trong trường hợp này, dạng hàm tuyến tính không được tốt bởi vì đường biểu diễn sẽ cắt trục tọa độ và Y sẽ trở nên âm đối với các giá trị X đủ lớn. Dạng hàm này thường được sử dụng cho các đường (cong) như đường cầu hay đường chi phí cố định (chi phí cố định trung bình trong sản xuất giảm xuống liên tục khi sản lượng tăng lên) cần có tính chất này. Nếu chúng ta có nhiều biến độc lập, thì dạng quan hệ giữa Y và mỗi biến có thể giống nhau hoặc có thể khác nhau. Chúng ta có thể sử dụng cùng một dạng hàm như nhau cho mỗi biến; ví dụ, nếu chúng ta nghĩ rằng sản lượng phụ thuộc vào ba nhập lượng khác nhau thì có thể sử dụng dạng hàm tuyến tính cho mỗi nhập lượng: YXXX=+β0112233ββ + + βε +. Hay dạng hàm translog cho mỗi nhập lượng: 22 logYXXXX=+β01ββ log 12 + (log 1 ) + β 3 log 24 + β (log 2 ) + ε . Hay tổng quát hơn: kkk logYX=+β0 ∑∑∑βγii + ij (log XX i )(log j ) + ε . iij===111 Chúng ta cũng có thể kết hợp vài dạng hàm khác nhau trong một hồi qui, thí dụ: 2 1 YXXX=+β01ββββεlog + 22324 + + ( ) + . X 3 mặc dù, nếu làm thế, chúng ta thường phải có các lý do thỏa đáng để nghĩ rằng hình dạng của quan hệ giữa Y và X1 là khác với các hình dạng của quan hệ giữa Y và X 2 , và Y và X 3 . 14
  6. 1.5. Các loại dữ liệu cho phân tích kinh tế lượng Để ước lượng mô hình kinh tế đã đưa ra, cần có mẫu dữ liệu về các biến phụ thuộc và biến độc lập. Có 3 loại số liệu được sử dụng để phân tích: 1. Các số liệu theo thời gian (chuỗi thời gian) 2. Các số liệu chéo 3. Các số liệu hỗn hợp của hai loại trên. Các số liệu có thể dạng số lượng (như. GDP, tỷ giá hối đoái, Giá chứng khoán), hay dạng chất lượng (như. Nam/ nữ; có gia đình/ chưa có gia đình; Quá trình sản xuất A/qúa trình sản xuất B). 1.5.1. Số liệu theo thời gian: Là số liệu được thu thập trong một thời kỳ, như: − Quan sát mức lạm phát và thất nghiệp của Mỹ từ 1962-1995 − Quan sát GDP của Mỹ từ 1960-1992 − Quan sát khả năng sinh lời của một công ty trong hơn 20 năm − Quan sát giá vàng hàng ngày lúc đóng cửa trong hơn 30 năm. Ví dụ, giả sử một thành phố muốn dự báo nhu cầu nhà ở cho năm hoặc mười năm trong tương lai. Việc này đòi hỏi phải xác định các biến có ảnh hưởng đến nhu cầu nhà ở của thành phố đó trong quá khứ, có được chuỗi dữ liệu theo thời gian trong nhiều năm ở quá khứ, và sử dụng chúng vào một mô hình thích hợp để tạo các giá trị dự báo của nhu cầu tương lai. Khoảng thời gian hoặc thời đoạn của chuỗi thời gian sẽ là hàng năm, hàng quý hoặc hàng tháng, tùy theo thành phố đó muốn xem xét thay đổi trong nhu cầu nhà ở hàng năm, hàng quý hay hàng tháng. Loại dữ liệu sẵn có thường sẽ quyết định thời đoạn của dữ liệu thu thập. 1.5.2. Số liệu chéo: Là số liệu về một hay nhiều biến được thu thập tại một thời điểm ở nhiều địa phương, đơn vị khác nhau. − Quan sát chiều cao và cân nặng của 1000 người − Quan sát thu nhập, trình độ học vấn, và cân nặng của 1000 người − Quan sát khả năng sinh lời của 20 công ty − Quan sát GDP trên đầu người, dân số, và chi phí quốc phòng thực tế của 80 quốc gia. 15
  7. Ví dụ, khi chúng ta muốn xem xét thu nhập ảnh hưởng như thế nào đến tiêu dùng của một người. Việc này đòi hỏi phải quan sát thu nhập và tiêu dùng của nhiều người trong một khoảng thời gian xác định. 1.5.3. Số liệu hỗn hợp: Số liệu hỗn hợp theo không gian và thời gian, ví dụ như: − Quan sát tỷ lệ lạm phát và mức tăng trưởng của 15 quốc gia trong khoảng thòi gian từ 1970-1995 − Quan sát mức sản lượng và mức giá của 100 ngành trong hơn 12 quý − Quan sát khả năng sinh lời của 20 công ty trong hơn 20 năm Số liệu chuỗi thời gian thường người ta ký hiệu là t và tổng số quan sát là T, còn đối với số liệu chéo ta ký hiệu quan sát là i và tổng số quan sát là N. Dữ liệu có thể thu thập được tại những nguồn sẵn có. Tuy nhiên, trong nhiều trường hợp những nguồn này không đủ để giải quyết vấn đề đặt ra hoặc những dữ liệu này không có sẵn. Trong trường hợp như vậy, cần tiến hành những khảo sát để thu thập các thông tin cần thiết. Ví dụ, chúng ta muốn quan tâm đến việc nghiên cứu xem người tiêu dùng sẽ phản ứng như thế nào đối với chính sách giá điện. Chính sách giá điện trong ngày là giá điện sẽ thay đổi theo những giờ khác nhau trong ngày, với giá cao trong những giờ cao điểm và giá thấp trong những giờ thấp điểm. Để có được dữ liệu phù hợp người ta chọn một số khách hàng và lắp đặt đồng hồ để ghi lại lượng điện sử dụng từng giờ trong ngày. Lượng điện tiêu thụ được thu thập trong vòng một năm, như vậy có được dữ liệu theo chuỗi thời gian cho một nhóm các hộ tiêu thụ nào đó. TÓM TẮT Kinh tế lượng liên quan đến ước lượng các mối liên hệ kinh tế, kiểm định giả thuyết các lý thuyết kinh tế, và dự báo các biến kinh tế hoặc các biến số khác. Khi nghiên cứu, chúng ta thường phải bắt đầu với một tập hợp các lý thuyết kinh tế, sau đó kết hợp chúng với những nhận định trực giác (hoặc kinh nghiệm, nghiên cứu trong quá khứ) để xây dựng một mô hình kinh tế lượng. Quá trình này liên quan đến quyết định chọn một hay nhiều biến phụ thuộc và xác định các biến độc lập có ảnh hưởng đến các biến phụ thuộc. Bước tiếp theo là thu thập dữ liệu tương ứng. Khi có được các dữ liệu này, chúng ta sẽ ước lượng các thông số của một hoặc nhiều mô hình sơ bộ. Các mô hình này sẽ được kiểm định nhiều lần, dựa vào những kiểm định này, các mô hình được thiết lập lại và ước lượng lại cho đến khi thỏa mãn. Mô hình cuối cùng có thể được dùng để xây dựng các chính sách hoặc để dự báo các giá trị của các biến phụ thuộc trong nhiều tình huống khác nhau. 16
  8. CHƯƠNG II MÔ HÌNH HỒI QUI HAI BIẾN, ƯỚC LƯỢNG VÀ KIỂM ĐỊNH Ở chương I phát biểu rằng bước đầu tiên trong phân tích kinh tế lượng là việc thiết lập mô hình mô tả được hành vi của các đại lượng kinh tế. Tiếp theo đó nhà phân tích kinh tế/ kinh doanh sẽ thu thập những dữ liệu thích hợp và ước lược mô hình nhằm hỗ trợ cho việc ra quyết định. Trong chương này sẽ giới thiệu mô hình đơn giản nhất và phát triển các phương pháp ước lượng, phương pháp kiểm định giả thuyết và phương pháp dự báo. Mô hình này đề cập đến biến độc lập (Y) và một biến phụ thuộc (X). Đó chính là mô hình hồi quy tuyến tính hai biến (thường gọi là mô hình hồi qui đơn). Mặc dù đây là một mô hình đơn giản, và đôi khi có thể là phi thực tế, nhưng việc hiểu biết những vấn đề cơ bản trong mô hình này là nền tảng cho việc tìm hiểu những mô hình phức tạp hơn. Thực tế, mô hình hồi quy đơn tuyến tính có thể giải thích cho nhiều phương pháp kinh tế lượng. Trong chương này chỉ đưa ra những kết luận căn bản về mô hình hồi quy tuyến tính đơn biến. Mục tiêu đầu tiên của một nhà kinh tế lượng là làm sao sử dụng dữ liệu thu thập được để ước lượng hàm hồi quy của tổng thể, đó là, ước lượng tham số của tổng thể β1 và β2. ˆ ˆ Ký hiệu β1 là ước lượng mẫu của β1 và β 2 là ước lượng mẫu của β2. Khi đó mối quan ˆ ˆ ˆ hệ trung bình ước lượng là Y = β1 + β 2 X. Đây được gọi là hàm hồi quy của mẫu. Thuật ngữ đơn trong mô hình hồi quy tuyến tính đơn được sử dụng để chỉ rằng chỉ có duy nhất một biến giải thích (X) được sử dụng trong mô hình. Trong chương tiếp theo khi nói về mô hồi quy đa biến sẽ bổ sung thêm nhiều biến giải thích khác. Thuật ngữ hồi quy xuất phát từ Fraccis Galton (1886), người đặt ra mối liên hệ giữa chiều cao của người con trai với chiều cao của người cha và quan sát thực nghiệm cho thấy có một xu hướng giữa chiều cao trung bình của người con trai với chiều cao của những người cha của họ để “hồi quy” cho chiều cao trung bình của toàn bộ tổng thể. β1 + β2Xi gọi là phần xác định của mô hình và là trung bình có điều kiện của Y theo X, đó là E(Yi) = β1 + β2Xi . Thuật ngữ tuyến tính dùng để chỉ rằng bản chất của các thông số của tổng thể β1 và β2 là tuyến tính (bậc nhất). 2.1. Khái niệm hàm hồi qui tổng thể Tổng thể là toàn bộ các quan sát về các đối tượng hay con người cho mục đích nghiên cứu. Mục tiêu đầu tiên của một nhà kinh tế lượng là làm sao sử dụng dữ liệu thu thập được để ước lượng hàm hồi quy của tổng thể, đó là, ước lượng tham số của tổng thể β1 và β2. Cho Y là biến được giải thích, chọn X2, X3, Xk là biến giải thích. Y là ngẫu nhiên và có 1 phân phối xác suất nào đó. => tồn tại E(Y|X2, X3, Xk) = giá trị xác định Do vậy F(X2, X3, Xk) = E(Y|X2, X3, Xk) là hàm hồi qui tổng thể của Y theo X2, X3, Xk (PRF-population regression function), hàm phụ thuộc ở mức độ trung bình của Y theo X. 17
  9. Với một cá thể i, tồn tại (X2i, X3i, Xki, Yi) Ta có Yi ≠ F(X2, X3, Xk) => ui = Yi - F Do vậy: Yi = E(Y|X2, X3, Xk) + ui Hồi qui tổng thể PRF: Y = E(Y|X) + U E(Y|X) = F(X) 2.2. Hàm hồi qui mẫu Do không biết tổng thể, nên chúng ta không biết giá trị trung bình tổng thể của biến phụ thuộc là đúng ở mức độ nào. Do vậy chúng ta phải dựa vào dữ liệu mẫu để ước lượng. Trên thực tế khi tổng thể lớn, tồn tại F nhưng không tìm được chính xác do: 9 Không quan sát được (do thời gian hay tài chính không cho phép ) 9 Tổng thể biến động 9 Đặc điểm thông tin: không cần quan sát Do vậy người ta phải tiến hành chọn mẫu, mẫu là một nhóm hay một bộ phận của tổng thể. Hồi qui mẫu: Cho PRF: Y =F(x2, x3, xk) + u Trên một bộ phận (mẫu) có n cá thể gọi Yˆ = Fˆ (X 2, X 3 , Xk) là hồi qui mẫu (SRF - Sample regression function) ˆ Với một cá thể mẫuYi ≠ F(X 2i, X 3i , Xki) ˆ ˆ Sinh ra ei = Yi − F(X 2i, X 3i , Xki) = Yi −Yi ; ei gọi là Phần dư SRF ˆ ˆ Ký hiệu β1 là ước lượng mẫu của β1 và β 2 là ước lượng mẫu của β2. Khi đó mối quan ˆ ˆ ˆ hệ trung bình ước lượng là Y = β1 + β 2 X. Đây được gọi là hàm hồi quy của mẫu. Ước lượng SRF: Chọn 1 phương pháp nào đó để ước lượng các tham số của F qua việc tìm các tham số Fˆ và lấy giá trị quan sát của các tham số này làm giá trị xấp xỉ cho tham số của F. 18
  10. 2.3. Phương pháp bình phương nhỏ nhất 2.3.1. Tư tưởng của phương pháp bình phương nhỏ nhất Trong kinh tế lượng, thủ tục ước lượng được dùng phổ biến nhất là phương pháp bình phương nhỏ nhất. Tiêu chuẩn tối ưu được sử dụng bởi phương pháp bình phương nhỏ nhất là cực tiểu hóa hàm mục tiêu. Phương pháp bình phương nhỏ nhất là một phương pháp được đưa ra bởi nhà toán học Đức Carl Friedrich Gauss, đây là một phương pháp mạnh và được rất nhiều người sử dụng, nó thường được ký hiệu là OLS (ordinary least squares). Tư tưởng của phương pháp này là cực tiểu tổng bình phương các phần dư. Do đó có thể nói để có được đường hồi qui “thích hợp” nhất, chúng ta chọn các ước lượng của tung độ gốc và độ dốc sao cho phần dư là nhỏ. Chúng ta đặt: yi ký hiệu giá trị thực của biến y tại quan sát i yˆi ký hiệu giá trị của hàm hồi qui mẫu ˆ ei ký hiệu phần dư, yi − yi ˆ 2 2 Do đó cực tiểu hoá ∑ ()yi − yi sẽ tương đương với cực tiểu ∑ei từ đó tìm ra β1 và β2. Chúng ta có thể mô tả tổng quát như sau: Xét hàm hồi qui tổng thể (PRF): Y = β1 + β2X2 + β3X3 + . . . βkXk + u 19
  11. β1 = E(Y x2, x3, xk = 0) ∂Y β j = ∂x j Với mẫu: ˆ ˆ ˆ ˆ yˆ = β1 + β2 X 2 + β3 X 3 + + βk X k ˆ Chúng ta sẽ sử dụng phương pháp bình phương nhỏ nhất để tìm các tham số β j của hàm hồi qui mẫu. 2.3.2. Các giả thiết của phương pháp bình phương nhỏ nhất Phương pháp bình phương nhỏ nhất (OLS) là phương pháp rất đáng tin cậy trong việc ước lượng các tham số của mô hình, tuy nhiên mô hình ước lượng phải thoả mãn 6 giả thiết. Khi thoả mãn các giả thiết, ước lượng bình phương nhỏ nhất (OLS) là ước lượng tuyến tính không chệch có hiệu quả nhất trong các ước lượng. Vì thế phương pháp OLS đưa ra Ước Lượng Không chệch Tuyến Tính Tốt Nhất (BLUE). Kết quả này được gọi là Định lý Gauss–Markov, theo lý thuyết này ước lượng OLS là BLUE; nghĩa là trong tất cả các tổ hợp tuyến tính không chệch của Y, ước lượng OLS có phương sai bé nhất. Các giả thiết như sau: + Mô hình hồi quy là tuyến tính theo các hệ số: Điều này có nghĩa là quá trình thực hành hồi quy trên thực tế được miêu tả bởi mối quan hệ dưới dạng: y = β1 + β2x2 + β3x3 + . . . βkxk + u hoặc mối quan hệ thực tế đó có thể được viết lại ví dụ như dưới dạng lấy loga cả hai vế. + E(ui) = 0, kỳ vọng của các yếu tố ngẫu nhiên ui bằng 0. Trung bình tổng thể sai số là bằng 0. Điều này có nghĩa là có một giá trị sai số mang dấu dương và một số sai số mang dấu âm. Do β1 + β2Xi là đường trung bình, nên có thể giả định rằng các sai số ngẫu nhiên trên sẽ bị loại trừ nhau, ở mức trung bình, trong tổng thể. + Cov (ui,uj)=0, Không có sự tương quan giữa các ui Không có sự tương quan giữa các quan sát của yếu tố sai số (không có tương quan chuỗi). Nếu chúng ta xem xét các chuỗi số liệu thời gian (dữ liệu được thu thập từ một nguồn trong nhiều khoảng thời gian khác nhau). Yếu tố sai số ui trong khoảng thời gian này không có bất kỳ một tương quan nào với yếu tố sai số trong khoảng thời gian trước đó. 20
  12. + Cov (ui,xi)=0, U và X không tương quan với nhau Điều này có nghĩa là khi bất kỳ biến giải thích nào mà lớn hơn hay nhỏ đi thì yếu tố sai số sẽ không thay đổi theo nó. 2 + Var (ui) = σ , Phương sai của sai số không đổi với mọi ui 2 Tất cả giá trị u được phân phối giống nhau với cùng phương sai σ , sao cho Var( ui) = 2 2 E(ui )=σ . Điều này được gọi là phương sai của sai số không đổi. + ui Phân phối chuẩn Điều này rất quan trọng khi phát sinh khoảng tin cậy và thực hiện kiểm định giả thuyết trong những phạm vi mẫu là nhỏ. Nhưng với phạm vi mẫu lớn hơn, điều này sẽ trở nên không mấy quan trọng. Ví dụ về “Phương sai sai số không đổi” và “Phương sai sai số thay đổi” 21
  13. 2.3.3. Ứng dụng phương pháp bình phương nhỏ nhất tìm tham số hồi qui: ˆ ˆ Cho hàm hồi qui mẫu yˆ i = β1 + β2xi 2 2 L = (y − y) ) = (y − βˆ − βˆ x ) Ta đặt ∑ i i ∑ i 1 2 i i i ˆ ˆ Ta thấy rằng β1, β2 sẽ là nghiệm của hệ thống phương trình sau: ∂L = −2 (y − βˆ − βˆ x ) = 0 ˆ ∑ i 1 2 i (2.1) ∂β1 i ∂L = −2 x (y − βˆ − βˆ x ) = 0 ˆ ∑ i i 1 2 i (2.2) ∂β2 i (y − βˆ − βˆ x ) = 0 ⇔ y − nβˆ − βˆ x = 0 Từ (2.1), ∑ i 1 2 i ∑ i 1 2∑ i i i i Nhưng ∑ yi = ny và ∑ xi = nx ˆ ˆ ˆ ˆ Do vậy ta có thể viết ny − nβ1 − nβ2x = 0 hay y − β1 − β2x = 0 (2.3) x (y − βˆ − βˆ x ) = 0 Từ (2.2), ∑ i i 1 2 i (2.4) i 22