Modellierung & Prognose – so funktioniert das Verfahren
Das eigentliche Prognosemodell nutzt ein Verfahren namens XGBoost. Dabei handelt es sich um ein modernes Machine-Learning-Verfahren, das auf sogenannten Entscheidungsbäumen basiert. Es hat sich als besonders leistungsfähig erwiesen, wenn es darum geht, komplexe Zusammenhänge aus vielen unterschiedlichen Datenquellen zu erkennen.
Für jeden relevanten Luftschadstoff – NO₂, PM₁₀ und PM₂,₅ – wird ein eigenes Modell trainiert. Dadurch kann jedes Modell gezielt auf die spezifischen Einflussfaktoren und typischen Schwankungen eines Schadstoffs eingehen. Um auf dem aktuellen Stand zu bleiben, erfolgt das Training der Modelle monatlich. So kann das Modell Veränderungen im Verkehrsverhalten, im Wetter oder in anderen Umweltfaktoren berücksichtigen und bleibt anpassungsfähig.
Die Prognose selbst erfolgt zunächst auf einem feinmaschigen Raster mit einer Auflösung von 50 m × 50 m. Das heißt: Für jeden Punkt in diesem Raster wird ein eigener Luftschadstoffwert vorhergesagt. Diese feine Auflösung ist entscheidend, um auch kleinteilige Unterschiede in der Luftqualität innerhalb der Stadt sichtbar zu machen.
Das Modell verwendet eine Vielzahl an Einflussgrößen (Features), darunter:
- Zeitliche Informationen: Jahr, Wochentag, Tageszeit und auch spezielle Zeiten wie Schulferien oder Feiertage.
- Meteorologische Daten: Dazu gehören Temperatur, Windrichtung und -geschwindigkeit, Niederschlagsmengen und andere Wettergrößen.
- Räumliche Faktoren: Bebauungsdichte, Grünflächenanteil, Straßenstruktur – all das beeinflusst, wie sich Schadstoffe verteilen.
- Verkehrsdaten: Die prognostizierte Anzahl an Fahrzeugen in jeder Rasterzelle fließt ebenso ein wie deren Geschwindigkeit.
- Vergangene Messwerte: Durch sogenannte „Lags“ – also zeitlich verzögerte Werte – kann das Modell kurzfristige Trends erkennen und darauf reagieren.