Datendialog

Datendialog mit CorrelAid in Berlin

Am 2. und 3. Juni trafen sich Daten-Interessierte von Bertelsmann Stiftung und CorrelAid bereits zum zweiten Mal zu einem Datendialog in Berlin. Für das Open-Data-Portal Wegweiser Kommune wurden dort gemeinsam Ideen diskutiert, wie Indikatoren zur kommunalen Infrastruktur jenseits der amtlichen Statistik weiterentwickelt werden könnten.

Ansprechpartner

Foto Nina Hauser
Nina Hauser
Project Manager
Foto Petra Klug
Petra Klug
Senior Project Manager

Das Format Datendialog gibt es bereits seit dem letzten Jahr – initiiert wurde es vom Data Science Lab der Bertelsmann Stiftung. Die Idee: Gemeinsam mit CorrelAid, einem gemeinnützigen Netzwerk von Daten-Enthusiast:innen sollen unsere Daten-Projekte weiterentwickelt werden, indem Menschen mit unterschiedlichen Perspektiven und Kompetenzen an einer bestimmten Fragestellung arbeiten. Während es beim ersten Datendialog für uns darum ging, Ideen für die Visualisierung unserer neuen Bevölkerungsvorausberechnung 2040 zu entwickeln, sollte es dieses Mal um neue Datenquellen jenseits der amtlichen Statistik gehen. Neben dem Projekt Daten für die Gesellschaft haben sich auch Kolleg:innen aus dem Zentrum für nachhaltige Kommunen und dem Projekt Frühkindliche Bildung am Datendialog beteiligt.

Daten zur kommunalen Infrastruktur

Bisher werden in unserem Datenportal Wegweiser Kommune vor allem Daten der amtlichen Statistik für alle Kommunen ab 5.000 Einwohner:innen flächendeckend aufbereitet und visualisiert. Beim Datendialog wollten wir austesten, ob und wie wir diese Daten mit spannenden Indikatoren aus anderen Datenquellen anreichern können. Interessant wären beispielsweise Indikatoren zur wohnungsnahen Grundversorgung, die eine wichtige Basis für die Planung kommunaler Räume liefern. Und wir wollten dabei methodisch neue Wege gehen: Lassen sich Daten von Kartendienstleistern als Grundlage für die Indikatoren-Berechnung nutzen und wie könnte ein entsprechender Prototyp zur Erhebung der Daten aussehen?

Erreichbarkeit von Apotheken

Mit Apotheken, einem Beispiel von vielen für eine wohnungsnahe Grundversorgung, wollten wir starten. Mit Google Maps und Open Street Maps stehen zwei unterschiedliche Kartendienstleister zur Verfügung, deren Daten über eine API abgerufen werden können. Zudem lagen uns Daten des Apothekenregisters vor – eine wichtige Ergänzung zur Beurteilung der Datenvalidität. Im nächsten Schritt ging es um die Zuordnung der Apotheken zur Geometrie des Portals Wegweiser Kommune über den Amtlichen Gemeindeschlüssel bzw. die Postleitzahlen, bevor über die Berechnung von Indikatoren wie beispielsweise „Anzahl der Apotheken pro Kommune“ oder „Entfernung der nächsten Apotheke zum Ortskern“ nachgedacht werden konnte.

Coding-Phase

Mit dem Startschuss der Arbeitsphase öffneten drei Teams ihre Laptops: Während in einem Team die Datenabfrage über die Over Pass API von Open Street Maps optimiert wurde, programmierte ein anderes parallel den Code zum geografischen Matching über zwei Wege – den Postleitzahlen und den Geometriedaten. Ein weiteres Team entwickelte Indikatoren aus den entstandenen Datensätzen und überprüfte anhand des Registerdatensatzes die Datenqualität. Zwischen den Sprintphasen tauschten sich die Teams beständig aus, sodass sie die Arbeit der anderen Teams als Grundlage für ihre Arbeit verwenden konnten. Die Arbeitsergebnisse reichten die Teilnehmer:innen direkt über das bereitgestellte GitHub-Repository ein, ein IT-Kollaborationstool, über das auch die Bertelsmann Stiftung standardmäßig technische Entwicklungen vorantreibt. Die Ergebnisse werden von unserem Team im Anschluss an den Datendialog konsolidiert.

In Zusammenarbeit mit den Daten-Enthusiast:innen und dem Data Science Lab soll aus den einzelnen Funktionen nun ein gesamtheitlicher Prototyp entstehen, mit dem automatisiert Datenabfragen an Mappingdienstleister gestellt, die Geometrie mit unserem Open-Data-Portal Wegweiser Kommune gematcht und die zugehörige Indikatorik berechnet werden kann. Perspektivisch sollen neben Apotheken auch andere Infrastrukturdaten abgefragt werden, wobei die Datenqualität stets gegen alternative Datenquellen geprüft werden sollte. Langfristig ermöglicht uns die Nutzung von solchen offenen Daten die kostenlose Hebung von Datenschätzen, die wir und andere in einem Data-Enrichment-Prozess für spannende Analysen nutzen können. Die Arbeit an dem Prototyp eröffnete uns auch neue Austauschmöglichkeiten, unter anderem mit dem Thünen-Institut, das aktuell an vergleichbaren Datenthemen arbeitet.

Sie interessieren sich für die Arbeit von CorrelAid e.V.? In Data4Good-Projekten mit der Zivilgesellschaft schaffen die über 2.000 ehrenamtlichen Daten-Enthusiast:innen technische Neuerungen für das Gemeinwohl. Daneben bildet das Netzwerk Datenanalyst:innen For Good und zivilgesellschaftliche Organisationen aus, stärkt so die Data Literacy und schafft eine Community von datenbegeisterten Vorbildern mit Zivilcourage.

Blogbeitrag von CorrelAid e. V.