Hyperpriorsensitivity of Bayesian Wrapped Gaussian Processes with an Application to Wind Data
Wirtschaftswissenschaftliche Fakultät
Direktionale oder periodische Messungen spielen in vielen wissenschaftlichen Bereichen eine entscheidende Rolle. Methoden zur Analyse von Richtungsdaten unter Berücksichtigung ihrer spezifischen Merkmale sind zentrales Thema der direktionalen Statistik. Zusätzlich zu der Direktionalität unterliegen solche Messungen oft einer strukturierten Abhängigkeit über Raum und Zeit, die für die Datenanalyse und Modellierung berücksichtigt werden müssen, beispielsweise in der meteorologischen Analyse von Windrichtungen.
In dieser Arbeit werden Methoden zur Analyse von direktionalen Daten mit solchen räumlichen und zeitlichen Abhängigkeitsstrukturen in einem Bayes'schen Ansatz unter Verwendung von Gauß-Prozessen vorgestellt. Der Schwerpunkt liegt auf "gewickelten" räumlichen Gauß-Prozessmodellen (wrapped Gaussian process models), wie von Jona Lasinio, Gelfand und Jona Lasinio (2012) entwickelt und im R-Paket CircSpaceTime von G. Jona Lasinio, Mastrantonio und Santoro (2019) implementiert.
Die Hyperpriorsensitivität der "gewickelten" räumlichen Gauß-Prozessmodelle wird mit simulierten Daten untersucht. Dabei werden verschiedene Annahmen der Hyperparameter in den Hyperpriorverteilungen untersucht, wobei Resultate zusätzlich zwischen verschiedenen Größen der Trainings- und Teststichproben verglichen werden. Die räumliche Interpolationsgenauigkeit wird mit zirkulären Varianten des durchschnittliche Vorhersagefehler (APE) und des Rangwahrscheinlichkeitsscores (CRPS) bewertet.
Ergebnisse betonen die zentrale Rolle des Parameters ρ, der den Grad des räumlichen Decays parametrisiert, sowie der Annahmen für die Hyperparameter in seiner gleichverteilten A-priori Verteilung.
Eine Anwendung dieser "gewickelten" räumlichen Gauß-Prozessmodelle für die räumliche Vorhersage von Windrichtungen in Deutschland wird vorgestellt. Mit Daten des Deutschen Wetterdienstes (DWD) wird die Vorhersagegenauigkeit für verschiedene Tage, Zeitpunkte,
Testorte und verschiedene Hyperpriorannahmen am Beispiel der räumlichen Vorhersage von Windrichtungen in Deutschland weiter untersucht. Ergebnisse legen nahe, dass bestimmte Merkmale der gewählten Zeitpunkte, wie beispielsweise die zirkuläre Streuung der Windrichtungen an dem gegebenen Tag und Zeitpunkt, einen größeren Einfluss auf die räumliche Vorhersagegenauigkeit haben als die Auswahl unterschiedlicher Orte in den Testdaten oder verschiedene Annahmen für die Hyperparameter der A-priori Verteilungen. Directional or periodic measurements play a vital role in many scientific fields. Developing
ways to analyze directional data while accounting for their specific characteristics is an important topic of ongoing research in the discipline of directional statistics. In addition to
accounting for the directional nature of given measurements, applications like the meteorological analysis of wind directions face structured dependence of observations over space and time that needs to be accounted for.
This work presents methods to analyze directional data with such spatial and temporal dependence structures in a Bayesian framework using Gaussian processes. The focus is on wrapped spatial Gaussian process models as developed by Jona Lasinio, Gelfand, and Jona Lasinio (2012) and implemented in the R-package CircSpaceTime by G. Jona Lasinio, Mastrantonio, and Santoro (2019).
Hyperpriorsensitivity of such wrapped models is inspected with simulated data by comparing
predictive performance of wrapped Gaussian process models for different hyperparameters in the hyperprior settings of the models implemented in CircSpaceTime while controlling for
different training and test sample sizes. Spatial interpolation accuracy assessed by circular
average prediction error (APE) and circular ranked probability scores (CRPS) emphasizes the
central role of the spatial decay parameter ρ and the hyperparameter settings in its Uniform
prior distribution.
An application of wrapped spatial Gaussian process models is presented for wind direction
data from the German Weather Service (Deutscher Wetterdienst (DWD)) further exploring
prediction accuracy for different test locations and different hyperprior settings. Results
suggest that specific characteristics of a chosen date, like circular dispersion of the observed
wind directions, have more influence on prediction accuracy than differing test locations or
hyperparameter assumptions.
Files in this item