Bài giảng Phân tích dữ liệu và dự báo - Bài 3

Nội dung:
Dự báo thô
Trung bình giản đơn
Trung bình di động đơn/kép
San mũ giản đơn
San mũ Holt/San mũ Winter
Phân tách chuỗi thời gian
Phần mềm ForecastX/Crystal Ball 
pdf 54 trang hoanghoa 08/11/2022 5480
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Phân tích dữ liệu và dự báo - Bài 3", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

File đính kèm:

  • pdfbai_giang_phan_tich_du_lieu_va_du_bao_bai_3.pdf

Nội dung text: Bài giảng Phân tích dữ liệu và dự báo - Bài 3

  1. Có khi người ta có thể sử dụng tỷ lệ thay đổi thay cho số thay đổi tuyệt đối: ^ Y Y t Yt 1 t Yt 1 Dự báo thô cho dữ liệu mùa (không xu thế): ^ Yt 1 Yt 3
  2. Nếu dữ liệu mùa và có xu thế thì cách dự báo như thế sẽ dự báo “thấp”, vậy: ^ (Yt Yt 1) (Yt 3 Yt 4 ) Yt 1 Y t 3 4 ^ (Yt Yt 4 ) Yt 1 Yt 3 4 Nếu dữ liệu theo tháng và có xu thế? Table4.1 H
  3. c1t3&f6
  4. Trung bình giản đơn (simple average forecast) Công thức: 1 t Y t 1 Y t i i 1 t Yt 1 Yt 1 Yt 2 t 1
  5. Phương pháp trung bình giản đơn phù hợp khi các nhân tố ảnh hưởng đến đối tượng dự báo có tính ổn định, và môi trường liên quan đến chuỗi dữ liệu là không thay đổi. Phương pháp trung bình giản đơn sử dụng giá trị trung bình của tất cả các quan sát quá khứ làm giá trị dự báo cho giai đoạn tiếp theo. Phù hợp với dữ liệu dừng.
  6. 320 310 300 290 280 270 260 250 240 5 10 15 20 25 30 Table4.3 H
  7. Trung bình di động (moving average forecast) Quan tâm đến một số cố định các quan sát gần nhất. Khi có thêm một quan sát mới, ta có một giá trị trung bình mới. Yt Yt-1 Yt-k 1 Yt 1 MA(k) k ^ Y t+1 : giá trị dự báo giai đoạn tiếp theo Yt : giá trị thực tại thời điểm t k : hệ số trượt
  8. Công thức trên Eviews: @MOVAV(Yt,k) 320 310 300 290 280 270 260 250 240 5 10 15 20 25 30 GALLONS @MOVAV(GALLONS,4) Table4.3 H
  9. Chọn hệ số trượt bao nhiêu tùy vào độ dài của chu kỳ hay bản chất của dữ liệu. Để so sánh và chọn mô hình tốt, nên dựa vào các tiêu chí thống kê (RMSE). Thường dùng đối với dữ liệu quý hoặc tháng để làm trơn các thành phần trong chuỗi thời gian. Thường dùng với chuỗi dừng.
  10. Trung bình di động kép (double moving average forecast) Khi dữ liệu có xu thế tuyến tính thì ta sử dụng phương pháp bình phương di động điều chỉnh, được gọi là “trung bình di động kép”: Yt Yt-1 Yt-k 1 M Yt 1 t k ' M t Mt-1 Mt-k 1 Mt k
  11. ' ' at Mt (Mt Mt ) 2Mt - Mt 2 b (M M' ) t k -1 t t Yt p at bt p
  12. Table4.4 H
  13. MSE = 133 MSE = 63.7
  14. San mũ giản đơn (simple exponential smoothing forecast) Giống trung bình di động, được sử dụng khi dữ liệu không có yếu tố xu thế và mùa vụ. Trong khi MA chỉ dựa vào các quan sát gần nhất để dự báo, thì san mũ dựa vào tất cả các quan sát trước đó để dự báo nhưng với trọng số giảm dần.
  15. Giá trị dự báo tại bất kỳ thời điểm nào là giá trị trung bình có trọng số của tất cả các giá trị sẵn có trước đó. Giá trị càng xa hiện tại thì trọng số càng giảm. Nghĩa là, các quan sát gần nhất được cho là chứa đựng thông tin thích hợp nhất, và có ảnh hưởng lớn hơn các quan sát quá khứ.
  16. Quan sát gần nhất có trọng số (0< <1), quan sát kế tiếp là (1- ), quan sát tiếp theo nữa là (1- )2, Trọng số được gọi là hệ số mũ. Mô hình san mũ giản đơn có thể được viết như sau: Yt 1 Yt (1- )Yt
  17. Phương trình này có thể được viết lại như sau: Yt 1 Yt (1- )Yt Yt Yt - Yt Yt (Yt - Yt ) Yt et
  18. Yt Yt-1 (1- )Yt-1 Yt 1 Yt (1- )Yt Yt (1- )[ Yt-1 (1- )Yt-1] 2 Yt (1- )Yt-1 (1- ) Yt-1 2 3 Yt (1- )Yt-1 (1- ) Yt-2 (1- ) Yt-3
  19. Tốc độ mà các quan sát quá khứ không còn tác động đến giá trị san mũ phụ thuộc vào .
  20. Chọn giá trị là vấn đề quan trọng nhất của phương pháp san mũ: . Nếu các dự đoán ổn định và biến đổi ngẫu nhiên ít, thì chọn nhỏ, ngược lại nên chọn lớn. . Một cách phổ biến để ước lượng là dựa vào một quy trình lặp đi lặp lại sao cho tối thiểu hóa MSE (hoặc RMSE).
  21. Có thể sử dụng phân tích độ nhạy để xác định hệ số san mũ tối ưu. Quy trình thực hiện trên Eviews: . Quick/Series Statistics/Exponential Smoothing . Series Name . Xuất hiện box sau:
  22. Chọn phương pháp (single) Chọn hệ số nếu không biết thì chọn E (Eviews sẽ ước tính)
  23. . Nhân tố thứ hai sau là việc chọn giá trị ^ san mũ đầu tiên Y 1 cho chuỗi giá trị san mũ (giá trị dự báo). . Lấy giá trị Y1: Gán cho Y1 trọng số quá lớn, nhưng ảnh hưởng này sẽ giảm khi t tăng. . Lấy giá trị trung bình của một số quan sát đầu tiên. . Cũng có thể chọn giá trị đầu tiên tối ưu bằng phân tích độ nhạy (cho cố định).
  24. San mũ Holt (san mũ kép) Khi chuỗi thời gian có yếu tố xu thế (và không có yếu tố mùa vụ). Là một mở rộng của phương pháp san mũ giản đơn bằng việc đưa thêm một thừa số xu thế vào phương trình san mũ để điều chỉnh yếu tố xu thế. 3 phương trình và 2 hằng số san mũ được sử dụng trong mô hình Holt như sau:
  25. Giá trị san mũ (giá trị trung bình) Yt Yt (1- )(Yt-1 Tt-1) Ước lượng xu thế: Tt (Yt Yt-1) (1- )Tt-1) Giá trị dự báo giai đoạn p trong tương lai: Ht p Yt pTt
  26. Y t : giá trị san mũ giai đoạn t Yt : giá trị thực giai đoạn t Tt : giá trị ước lượng xu thế : hệ số san mũ của ước lượng giá trị trung bình : hệ số san mũ của ước lượng giá trị xu thế p : số giai đoạn dự báo trong tương lai Ht+p : giá trị dự báo Holt ở giai đoạn p
  27. Hệ số và có thể được chọn theo chủ quan hoặc tối thiểu hóa sai số dự báo như MSE: Khi có thay đổi lớn trong giá trị các thành phần thì sử dụng trọng số lớn, và ngược lại. Có thể áp dụng phân tích độ nhạy hai chiều trên Excel.
  28. Chọn giá trị ban Y t đầu cho: . Cách 1: Lấy quan sát thứ nhất, và xu thế bằng 0. . Cách 2: Trung bình của 5 hoặc 6 quan sát đầu tiên và xu thế là hệ số gốc của đường xu thế của các quan sát này. . Cách 3: Hệ số cắt và hệ số gốc của đường xu thế tương ứng là giá trị ban đầu và giá trị xu thế ban đầu.
  29. Quy trình thực hiện trên Eviews: . Quick/Series Statistics/Expon ential Smoothing . Series Name . Xuất hiện box sau: Table4.1 H
  30. L1 = Y1 = 500
  31. Yt Giá trị san mũ : Yt (1- )(Yt-1 Tt-1) St-s Ước lượng xu thế: Tt (Yt Yt-1) (1- )Tt-1) Yt Ước lượng mùa vụ: St (1- )St-s ) Yt Dự báo p giai đoạn trong tương lai: Wt p (Yt pTt )St-s p
  32. Y t : giá trị san mũ Tt : ước lượng xu thế St : ước lượng mùa vụ : hệ số san mũ của giá trị trung bình : hệ số san mũ của ước lượng xu thế : hệ số san mũ của ước lượng mùa vụ p : số giai đoạn dự báo trong tương lai s : độ dài mùa vụ Wt+p: giá trị dự báo Winter ở giai đoạn p
  33. Các hệ số , , và có thể được chọn theo chủ quan hoặc tối thiểu hóa sai số dự báo như MSE. Chọn giá trị ban đầu cho Y 1, T1, và S1: . Cách 1: Lấy quan sát thứ nhất, xu thế bằng 0, và chỉ số mùa vụ bằng 1. . Cách 2: Hồi quy Y = f(t), hằng số sẽ là ước lượng ban đầu của giá trị san mũ, hệ số dốc là ước lượng ban đầu cho xu thế. Giá trị ban đầu của thành phần mùa vụ từ các hệ số hồi quy của biến giả.
  34. Table4.1 H
  35. Quy trình thực hiện trên Eviews: . Quick/Series Statistics/Expone ntial Smoothing . Series Name . Xuất hiện box sau: Table4.1 H
  36. Phân tách thành phần chuỗi thời gian (decomposition forecast) Mô hình cộng (additive) Yt = Trt + Clt + Snt + Irt Mô hình nhân (Multiplicative) Yt = Trt. Clt. Snt. Irt
  37. 9700 9200 8700 8200 7700 7200 6700 6200 1000 5700 900 5200 800 4700 700 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 600 500 Monthly Sales Monthly 400 300 200 100 0 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 Month
  38. Phần mềm? ForecastX Crystal Ball