Entwicklung von Methoden zur Abschätzung des Vorhersagefehlers von FIR

Kurzbeschreibung

Bei der Vorhersage eines quantitativen Werts der Ausgangsvariable eines qualitativen FIR Modells werden die fünf nächsten Nachbarn (5NN) in der Datenbank der Erfahrungswerte (training data set) zu Hilfe gezogen.

Dafür werden die diffusen Werte der Eingangsvariablen des vorherzusagenden Datenpunktes mit allen diffusen Werten der Eingangsvariablen der gespeicherten Datensätze verglichen. Die 5NNs werden gefunden, indem der neue Datensatz sowie die Datensätze in der Datenbank der Erfahrungswerte pseudo-quantifiziert und miteinander im Sinne eines Euklid'schen Abstandsmasses verglichen werden.

Der vorherzusagende Ausgangswert wird sodann als gewichteter Mittelwert der Ausgangswerte der 5NNs ermittelt, wobei Nachbarn, die im Eingangsraum dichter beim vorherzusagenden Datensatz liegen, mehr Gewicht zugemessen wird.

Bei der Vorhersage analytischer Funktionen können zwei Arten von Fehlern auftreten, welche die Unschärfen im Eingangsraum und im Ausgangsraum betreffen.

Die Unschärfe im Eingangsraum bezieht sich auf die Relevanz der Erfahrungswerte. Je weiter die 5NNs im Eingangsraum vom vorherzusagenden Datensatz entfernt sind, desto stärker muss interpoliert werden. Somit ist das Vertrauen in eine Vorhersage mit der Nähe der 5NNs im Eingangsraum gekoppelt.

Die Unschärfe im Ausgangsraum bezieht sich auf die interne Konsistenz der Erfahrungsdatensätze. So ist es möglich, dass bezüglich ihrem Eingangsraum sehr ähnliche Datensätze sehr unterschiedliche Ausgangswerte mit sich führen. Solche Datensätze sind nicht sinnvoll auswertbar. Somit bezieht sich die Unschärfe im Ausgangsraum auf die Streuungsbreite der Ausgangswerte der 5NNs.

Josefina (Fina) López untersuchte in ihrer Dissertation, wie die Vertrauenswerte zur Abschätzung des Vorhersagefehlers eingesetzt werden können. Zu diesem Zweck entwickelte sie zwei Metriken, eine probabilistische Abstandsmetrik und eine possibilistische Ähnlichkeitsmetrik, die das Vertrauen in die Vorhersage quantifizieren sollten [1].

Die Abschätzung des Vertrauens in die Vorhersage wurde sodann ausgenützt, um die Vorhersage selbst zu verbessern. Zu diesem Zweck wurden parallel mehrere Vorhersagen unter Verwendung verschiedener suboptimaler Masken (qualitativer Modelle) gemacht. In jedem Vorhersageschritt wurde sodann die Vorhersage weiter verwendet, die den höchsten Vertrauenswert mit sich führte [2].


Wichtigste Publikationen

  1. Cellier, F.E., J. López, A. Nebot, and G. Cembrano (1996), Means for Estimating the Forecasting Error in Fuzzy Inductive Reasoning, Proc. ESM'96, European Simulation MultiConference, Budapest, Hungary, pp.654-660.

  2. López, J., and F.E. Cellier (1999), Improving the Forecasting Capability of Fuzzy Inductive Reasoning by Means of Dynamic Mask Allocation, Proc. ESM'99, European Simulation MultiConference, Warsaw, Poland, pp.355-362.

  3. López, J. (1999), Time Series Prediction Using Inductive Reasoning Techniques, Organització i Control de Sistemes Industrials, Universitat Politècnica de Catalunya, Barcelona, Spain.

Sponsoren


English Version
Homepage


Modifiziert: 17. Juli 2005 -- © François Cellier