Smoothing Daten entfernt zufällige Variation und zeigt Trends und zyklische Komponenten Inhärent in der Sammlung von Daten über die Zeit genommen wird, ist eine Form von zufälligen Variation. Es gibt Methoden zur Verringerung der Annullierung der Wirkung aufgrund zufälliger Variation. Eine häufig verwendete Technik in der Industrie ist Glättung. Diese Technik zeigt, wenn sie richtig angewendet wird, deutlicher den zugrunde liegenden Trend, saisonale und zyklische Komponenten. Es gibt zwei verschiedene Gruppen von Glättungsmethoden Mittelungsmethoden Exponentielle Glättungsmethoden Mittelwertbildung ist der einfachste Weg, um Daten zu glätten Wir werden zunächst einige Mittelungsmethoden untersuchen, z. B. den einfachen Mittelwert aller vergangenen Daten. Ein Manager eines Lagers möchte wissen, wie viel ein typischer Lieferant in 1000-Dollar-Einheiten liefert. Heshe nimmt eine Stichprobe von 12 Lieferanten zufällig an und erhält die folgenden Ergebnisse: Der berechnete Mittelwert oder Mittelwert der Daten 10. Der Manager entscheidet, dies als Kostenvoranschlag für die Ausgaben eines typischen Lieferanten zu verwenden. Ist dies eine gute oder schlechte Schätzung Mittel quadratischen Fehler ist ein Weg, um zu beurteilen, wie gut ein Modell ist Wir berechnen die mittlere quadratische Fehler. Der Fehler true Betrag verbraucht minus die geschätzte Menge. Der Fehler quadriert ist der Fehler oben, quadriert. Die SSE ist die Summe der quadratischen Fehler. Die MSE ist der Mittelwert der quadratischen Fehler. MSE Ergebnisse zum Beispiel Die Ergebnisse sind: Fehler und quadratische Fehler Die Schätzung 10 Die Frage stellt sich: Können wir das Mittel verwenden, um Einkommen zu prognostizieren, wenn wir einen Trend vermuten Ein Blick auf die Grafik unten zeigt deutlich, dass wir dies nicht tun sollten. Durchschnittliche Gewichtungen alle früheren Beobachtungen gleich In Zusammenfassung, wir sagen, dass die einfache Mittelwert oder Mittelwert aller früheren Beobachtungen ist nur eine nützliche Schätzung für die Prognose, wenn es keine Trends. Wenn es Trends, verwenden Sie verschiedene Schätzungen, die den Trend berücksichtigen. Der Durchschnitt wiegt alle früheren Beobachtungen gleichermaßen. Zum Beispiel ist der Durchschnitt der Werte 3, 4, 5 4. Wir wissen natürlich, dass ein Durchschnitt berechnet wird, indem alle Werte addiert werden und die Summe durch die Anzahl der Werte dividiert wird. Ein anderer Weg, den Durchschnitt zu berechnen, besteht darin, daß jeder Wert durch die Anzahl von Werten geteilt wird, oder 33 43 53 1 1.3333 1.6667 4. Der Multiplikator 13 wird das Gewicht genannt. Allgemein: bar frac sum links (frac rechts) x1 links (frac rechts) x2,. ,, Links (frac rechts) xn. ETS (Exponentielles Glättungszustandsraummodell) Wir werden diskutieren, wie diese Methoden funktionieren. (Fortsetzung auf Englisch) Und wie man sie benutzt. (EWMA) Entsprechend ARIMA (0,1,1) - Modell mit konstantem Term Für die geglätteten Daten zur Darstellung verwenden Prognosen einfach gleitender Durchschnitt: Vergangene Beobachtungen werden gleich exponentiell gewichtet Glättung: Zuordnung von exponentiell abnehmenden Gewichten über Zeit Formel xt - Rohdatenfolge st - Ausgabe des exponentiellen Glättungsalgorithmus (Schätzung des nächsten Wertes von x) - Glättungsfaktor. 0160lt160160lt1601.Choosing rechts keine formale Methode der Wahl der statistischen Technik kann verwendet werden, um den Wert von (zB OLS) zu optimieren, desto größer wird die enge es naiv Prognose bekommt (die gleichen Ports wie Original-Serie mit einer Periode lag) Double Exponential Smoothing bearbeiten Einfach Exponentielle Glättung nicht gut, wenn es einen Trend gibt (es wird immer Bias) Doppelte exponentielle Glättung ist eine Gruppe von Methoden, die sich mit dem Problem Holt-Winters doppelte exponentielle Glättung bearbeiten Und für t gt 1, wo ist der Daten-Glättungsfaktor. 0160lt160160lt1601, und ist der Trend Glättungsfaktor. 0160lt160160lt1601. Ausgabe F tm - eine Schätzung des Wertes von x zum Zeitpunkt tm, mgt0 basierend auf den Rohdaten bis zum Zeitpunkt t Triple exponentielle Glättungsbearbeitung berücksichtigt saisonale Änderungen sowie Trends, die zuerst von Holts Schüler Peter Winters, 1960 Input, vorgeschlagen wurden Xt - Rohdatenfolge der Beobachtungen t 1601600 L Länge eines Zyklus der jahreszeitlichen Veränderung Die Methode berechnet: eine Trendlinie für die saisonalen Datenindizes, die die Werte in der Trendlinie gewichten, basierend darauf, wo dieser Zeitpunkt im Zyklus der Länge L fällt. S t den geglätteten Wert des konstanten Teils für die Zeit t darstellt. Bt die Reihenfolge der besten Schätzungen des linearen Trends darstellt, die den saisonalen Änderungen ct überlagert sind, ist die Folge saisonaler Korrekturfaktoren ct der erwartete Anteil des prognostizierten Trends zu jedem Zeitpunkt t mod L im Zyklus, den die Beobachtungen annehmen Initialisieren die saisonalen Indizes c tL muss es mindestens einen kompletten Zyklus in den Daten geben Der Ausgang des Algorithmus wird wieder als F tm geschrieben. Eine Schätzung des Wertes von x zum Zeitpunkt tm, mgt0 auf der Basis der Rohdaten bis zum Zeitpunkt t. Die dreifache Exponentialglättung wird durch die Formeln angegeben, wo der Datenglättungsfaktor ist. 0160lt160160lt1601, ist der Trend Glättung Faktor. 0160lt160160lt1601, und ist die saisonale Änderung Glättungsfaktor. 0160l160160lt1601. Die allgemeine Formel für die anfängliche Trendschätzung b 0 ist: Einstellen der Anfangsschätzungen für die Saisonindizes c i für i 1,2. L ist ein bisschen mehr beteiligt. Wenn N die Anzahl der vollständigen Zyklen in Ihren Daten ist, dann: Beachten Sie, dass A j der Mittelwert von x im j-ten Zyklus Ihrer Daten ist. ETS bearbeiten Übergeordnete Parameter bearbeiten 8.4 Durchschnittliche Modelle verschieben Anstatt frühere Werte der Vorhersagevariablen in einer Regression zu verwenden, verwendet ein gleitendes Durchschnittsmodell vergangene Prognosefehler in einem Regressionsmodell. Y c et the theta e dots theta e, wobei et weißes Rauschen ist. Wir bezeichnen dies als MA (q) - Modell. Natürlich beobachten wir nicht die Werte von et, also ist es nicht wirklich Regression im üblichen Sinne. Man beachte, daß jeder Wert von yt als gewichteter gleitender Durchschnitt der letzten Prognosefehler betrachtet werden kann. Allerdings sollten gleitende Durchschnittsmodelle nicht mit der gleitenden glatten Glättung verwechselt werden, die wir in Kapitel 6 besprochen haben. Ein gleitendes Durchschnittsmodell wird für die Prognose zukünftiger Werte verwendet, während die gleitende gleitende Durchschnittskurve für die Schätzung des Trendzyklus der vergangenen Werte verwendet wird. Abbildung 8.6: Zwei Beispiele für Daten aus gleitenden Durchschnittsmodellen mit unterschiedlichen Parametern. Links: MA (1) mit yt 20e t 0,8e t-1. Rechts: MA (2) mit y t e t - e t-1 0,8e t-2. In beiden Fällen ist e t normal verteiltes Weißrauschen mit Mittelwert Null und Varianz Eins. Abbildung 8.6 zeigt einige Daten aus einem MA (1) - Modell und einem MA (2) - Modell. Das Ändern der Parameter theta1, dots, thetaq führt zu unterschiedlichen Zeitreihenmustern. Wie bei autoregressiven Modellen wird die Varianz des Fehlerterms et nur den Maßstab der Reihe ändern, nicht die Muster. Es ist möglich, jedes stationäre AR (p) - Modell als MA (infty) - Modell zu schreiben. Beispielsweise können wir dies bei einem AR (1) - Modell demonstrieren: begin yt amp phi1y et amp phi1 (phi1y e) et amp phi12y phi1 e et amp phi13y phi12e phi1 e et amptext end Vorausgesetzt -1 lt phi1 lt 1 wird der Wert von phi1k kleiner, wenn k größer wird. So erhalten wir schließlich yt und phi1 e phi12 e phi13 e cdots, ein MA (infty) Prozess. Das umgekehrte Ergebnis gilt, wenn wir den MA-Parametern einige Einschränkungen auferlegen. Dann wird das MA-Modell invertierbar. Das heißt, dass wir alle invertierbaren MA (q) Prozess als AR (infty) Prozess schreiben können. Invertible Modelle sind nicht einfach, damit wir von MA-Modellen auf AR-Modelle umwandeln können. Sie haben auch einige mathematische Eigenschaften, die sie in der Praxis einfacher zu verwenden. Die Invertibilitätsbedingungen sind den stationären Einschränkungen ähnlich. Für ein MA (1) Modell: -1lttheta1lt1. Für ein MA (2) - Modell: -1lttheta2lt1, theta2theta1 gt-1, theta1 - theta2 lt 1. Kompliziertere Bedingungen gelten für qge3. Wiederum wird R diese Einschränkungen bei der Schätzung der Modelle berücksichtigen.
No comments:
Post a Comment