
Einleitung
Das Parkleitsystem der Stadt Münster umfasst 19 Parkhäuser und -plätze im Stadtgebiet. Diese werden sowohl von Gästen als auch von Einheimischen viel genutzt. Teilweise kann daher die Parkplatzsuche zur Herausforderung werden.
Die Verfügbarkeit von Parkplätzen stellt in vielen Städten, darunter auch in Münster, eine alltägliche Herausforderung dar. Insbesondere in innerstädtischen Bereichen schwankt die Auslastung der Parkhäuser stark und hängt vermutlich von verschiedenen Faktoren wie Tageszeit, Wochentag oder besonderen Ereignissen ab. Für Verkehrsteilnehmende bedeutet dies häufig eine zusätzliche Verkehrsbelastung im Stadtzentrum.
In unserem Data-Science-Projekt untersuchen wir daher die Auslastung von Parkhäusern in Münster auf Basis eines Datensatzes aus den Jahren 2019 bis 2025. Nach der Aufbereitung und Ergänzung der Daten analysieren wir Nutzungsmuster und mögliche Einflussfaktoren wie Zeit, Wetter oder Feiertage und entwickeln Modelle zur Prognose der Parkplatzverfügbarkeit. Dabei wollen wir herausfinden, ob sich typische Muster in der Parkhausnutzung erkennen lassen und alltagsrelevante Fragen beantworten: Wann sind Parkhäuser besonders voll? Gibt es Unterschiede zwischen Wochentagen und Wochenenden? Und lässt sich die zukünftige Parkhausauslastung möglicherweise sogar vorhersagen?
Um diese Fragen zu beantworten, haben wir die historischen Belegungsdaten zunächst explorativ analysiert, um zeitliche Trends und wiederkehrende Nutzungsmuster sichtbar zu machen. Anschließend wurden statistische Methoden und Regressionsmodelle eingesetzt, um mögliche Einflussfaktoren, etwa Tageszeit, Wochentag oder Feiertage, zu untersuchen. Ziel war es, ein besseres Verständnis für die Dynamik der Parkhausauslastung zu entwickeln und erste Ansätze für datenbasierte Prognosen der Parkplatzverfügbarkeit zu erarbeiten.

Methodik
Die Analyse basiert auf einem öffentlich verfügbaren Datensatz zur Parkhausauslastung in Münster, der über GitHub bereitgestellt wird und die Belegungsdaten der Parkhäuser im Zeitraum von 2019 bis 2025 umfasst. Zu Beginn des Projekts wurde eine umfassende Datenbereinigung und -aufbereitung durchgeführt. Aufgrund des langen Erhebungszeitraums von nahezu sechs Jahren wies der Datensatz teilweise uneinheitliche Werte auf, die zunächst bereinigt und strukturiert werden mussten. Ergänzend wurden zusätzliche Informationen zu den Parkhäusern, darunter Öffnungszeiten und Kapazitäten, eigenständig recherchiert und mit dem Datensatz abgeglichen. Auf dieser Grundlage wurde beispielsweise auch die Variable geöffnet erstellt, die angibt, ob ein Parkhaus zu einem bestimmten Zeitpunkt tatsächlich zugänglich war (True/False). Diese Information ermöglicht einen validen Vergleich der Auslastung zwischen verschiedenen Parkhäusern und Zeitpunkten.
Anschließend wurde eine explorative Datenanalyse durchgeführt, um erste Nutzungsmuster zu identifizieren. Mithilfe von Python wurden insbesondere Unterschiede zwischen Parkhäusern sowie zeitliche Variationen nach Tageszeit und Wochentagen untersucht. Darauf aufbauend wurden statistische Modelle und Regressionsanalysen eingesetzt, um mögliche Einflussfaktoren auf die Parkhausauslastung zu analysieren. Hierzu wurden zusätzlich Wetterdaten sowie Informationen zu Feiertagen und Schulferien aus Nordrhein-Westfalen und umliegenden, potenziell relevanten Regionen in den Datensatz integriert.
Abschließend wurden mit Facebooks Prophet Verfahren für jedes Parkhaus ein Machine-Learning-Modell entwickelt, das basierend auf dem Zeitpunkt, der Wettervorhersage und den Feiertagen sowie Ferienzeiten die zukünftige Auslastung prognostiziert.

Ergebnis
Insgesamt zeigen sich deutliche Unterschiede zwischen den Parkhäusern in ihrer Auslastung. Beispielweise um die Mittagszeit werden im Durchschnitt die meisten Parkplätze belegt, allerdings zeigen sich auch hier Unterschiede zwischen den jeweiligen Standorten.
Um den möglichen Einfluss des Wetters auf die Parkhausauslastung zu untersuchen, wurden stündliche Wetterdaten (Temperatur und Niederschlag) über die Open-Meteo API abgerufen und mit den aggregierten Parkdaten zusammengeführt. Als Metrik wurde die stadtweite Summe der freien Parkplätze pro Stunde verwendet. Die Pearson-Korrelationsanalyse – beschränkt auf die Kernzeiten von 8 bis 20 Uhr – ergab für die Temperatur einen statistisch signifikanten, aber sehr schwachen positiven Zusammenhang (r = +0,058). Für den Niederschlag zeigte sich kein signifikanter Zusammenhang (r = −0,006, p = 0,31). Die Signifikanz der Temperatur ergibt sich vor allem aus der großen Datenmenge von über 27.000 Stunden; der tatsächliche Effekt ist so klein, dass er praktisch kaum ins Gewicht fällt. Die Vorhersage von Münsters Parkhausbelegungsdaten lässt sich mit Facebooks Prophet Verfahren gut erreichen.
Learnings
Das Projekt verdeutlicht, wie offene Parkhausdaten und diverse Methoden der Datenanalyse genutzt werden können, um urbane Nutzungsmuster sichtbar zu machen und datenbasierte Einblicke in die Dynamik städtischer Infrastruktur zu gewinnen. Ein zentrales Learning bestand darin, dass ein großer Teil der Data-Science-Arbeit zunächst in der Datenaufbereitung und -bereinigung liegt. Auch wenn Modelle und Visualisierungen häufig im Fokus stehen, zeigt die praktische Arbeit mit realen Datensätzen, dass viele Schritte erforderlich sind, um Daten überhaupt analysierbar zu machen. Uneinheitliche Werte, fehlende Informationen oder strukturelle Unterschiede im Datensatz erfordern häufig zusätzliche Recherche und Anpassungen. Darüber hinaus wurde uns deutlich, dass auch scheinbar einfache Analysen oder Codeschritte in der Praxis oft mehr Zeit in Anspruch nehmen als erwartet, etwa wenn Fehler auftreten oder einzelne Verarbeitungsschritte nicht wie geplant funktionieren. Das Projekt hat daher auch gezeigt, wie wichtig Geduld, iterative Arbeitsweisen und kontinuierliches Testen im Umgang mit Datenanalyseprojekten sind.
Überraschend war, dass es in Python für einige Aufgaben bereits passende Libraries gibt, etwa holidays zur Einbindung von Feiertagen. Gleichzeitig war jedoch auch eigene Recherche notwendig, beispielsweise zu Kapazitäten und Öffnungszeiten der Parkhäuser, um den Datensatz sinnvoll zu ergänzen. Abschließend haben wir gelernt, dass es sich lohnt, dranzubleiben und den Kopf nicht hängen zu lassen. Gerade in der Anfangsphase wirkte das Projekt stellenweise noch unübersichtlich und es war nicht immer klar, wohin die Analyse genau führen würde. Mit Geduld, kontinuierlichem Ausprobieren und kleinen Fortschritten hat sich jedoch Schritt für Schritt eine klare Struktur entwickelt. Auch wenn es zunächst nicht immer so aussieht, als würde alles funktionieren, zeigt sich oft erst im Verlauf der Arbeit, dass Durchhaltevermögen und Neugier zentrale Bestandteile erfolgreicher Data-Science-Projekte sind.
Github:
https://github.com/MauriceKrause/parking-occupancy-muenster
Quellen:
Parkhausbelegung Stadt Münster (dl-de/by-2-0), historisiert von Code For Münster, https://github.com/codeformuenster/parking-decks-muenster
Team
Finn Both
In alle Schritte des Projekts eingebunden
Maurice Krause
In alle Schritte des Projekts eingebunden, hat zusätzlich eigenständig das Machine Learning Model gebaut
Marc Manias
In alle Schritte des Projekts eingebunden
Hanna Vogel
In alle Schritte des Projekts eingebunden
Mentor:in

Mathis Hunke








