Datenherausforderungen

Nachfolgend findet ihr eine umfassende Beschreibung der Projekte, die beim DatenDialog teilnehmen werden bzw. teilgenommen haben.

#DatenDialog #Data4Good

Inhalt

Macht euch bitte mit den aktuellen Projekten vertraut, lest die Unterlagen zur Vorbereitung und bringt gerne Anmerkungen, Fragen und eigene Impulse mit.

Für Rückfragen stehen die Referent:innen gerne zur Verfügung. Ihr erreicht sie am besten per E-Mail, die Adressen sind jeweils verlinkt.

März 2026

Bertelsmann Transformation Index BTI

Der BTI ist ein umfassendes und komplexes Dateninstrument der Bertelsmann Stiftung. Er vergleicht anhand von 52 Indikatoren quantitativ und qualitativ Transformationsprozesse in den Dimensionen Politik, Wirtschaft und Governance in 137 Ländern.

Der BTI wird alle zwei Jahre veröffentlicht, enthält 7.124 individuelle Punktbewertungen von 1-10 (1: sehr schlecht; 10: sehr gut) und ca. 5.500 Seiten an Länder- und Regionalberichten pro Ausgabe.

Der BTI ist das Ergebnis der Zusammenarbeit von knapp 300 Länder- und Regionalexperten von führenden Universitäten und Denkfabriken weltweit. Ziel ist es, erfolgreiche Strategien zur Steuerung des Wandels zu identifizieren.

Der BTI erhebt seit 2003 Primärdaten und wurde erstmals 2006 veröffentlicht.

Der BTI praktiziert eine Open Data Policy und bietet durch seine qualitativen Analysen der Länder nachvollziehbare Gutachten, die nicht nur vergleichend genutzt, sondern auch als einzelne Informationsquelle verwendet werden können.

Die inhaltliche Tiefe und analytische Qualität des BTI ist sehr hoch, zugleich ist die Komplexität der Datenbasis für zentrale Zielgruppen nur schwer schnell erfassbar.

Obwohl der BTI eine offene und reichhaltige quantitative und qualitative Datengrundlage bietet, fällt es externen Nutzer:innen schwer, daraus eigenständig relevante Fragestellungen, Vergleiche oder Handlungsperspektiven abzuleiten.

Gleichzeitig stellt die große qualitative Datenmenge intern eine Analyse- und Übersetzungsherausforderung dar. Die länder- und zeitübergreifende Analyse der Daten abseits von wissenschaftlicher QDA-Tools ist eingeschränkt.

Die zentrale Datenherausforderung besteht darin, die umfangreichen BTI-Daten so bereitzustellen und zu kommunizieren, dass zentrale Trends, Muster, Abweichungen und Korrelationen zwischen Ländern, Regionen und Zeiträumen sichtbar und analysierbar werden.

Ziel ist eine zielgruppenspezifische Datenkommunikation, die den unterschiedlichen Bedürfnissen von Wissenschaft, Zivilgesellschaft, Medien sowie Entscheidungsträger:innen in Politik und Wirtschaft gerecht wird und eine präzise, gezielte und reaktive Nutzung der BTI-Daten ermöglicht.

Was ist das gesellschaftliche Problem, was wir mit unserem Projekt bearbeiten und was ist die Wirkung, die wir erreichen wollen?

Der BTI analysiert und vergleicht weltweit Transformationsprozesse und identifiziert erfolgreiche Strategien für den friedlichen Wandel.
Der BTI wirft einen ganzheitlichen Blick auf gesellschaftliche Veränderungsprozesse und ermöglicht das Monitoring rechtsstaatlicher Demokratie, sozialer Marktwirtschaft und politischer Steuerungsfähigkeit mit Blick beispielsweise auf Demokratieerosion, Resilienz oder Regimeperformanz.
Der BTI ist ein Orientierungs-, Lern- und Dialoginstrument und zielt auf evidenzbasierte Wissensproduktion, Datennutzung und gesellschaftlich-politische Wirkung ab.

Was wir uns von euch beim Datendialog versprechen:

Neue Erkenntnisse, Ideen und Lösungsansätze für die Analyse, Nutzbarkeit und zielgerechte Kommunikation der BTI-Daten.

Der BTI nutzt seit 2008 eine umfassende interne Datenbank, in welcher anhand eines konstanten methodischen Unterbaus seit 2010 externe Referenzdaten zur Verfügung stehen.

Bisher 10 Erhebungswellen: 2006, 2008, 2010, 2012, 2014, 2016, 2018, 2020. 2022, 2024
Quantitative Daten: n Länder x 51 Datenpunkte (+ aggregierte Daten)
Qualitative Daten: n Länder x 49 response items (offene Fragen, s. Codebuch)

Externe Datengeber sind primär:

The World Bank, World Development Indicators
UNDP, Human Development Report
International Monetary Fund, World Economic Outlook
Asian Development Bank (für Taiwan)

sowie

International Labour Organization
Stockholm International Peace Research Institute (SIPRI)

und andere Indices wie:

World Bank, Worldwide Governance Indicators
Freedom House, Freedom in the World
Transparency International, Corruption Perceptions Index.

Diese Daten werden als Referenzindikatoren herangezogen, haben aber nur konsultativen und keinen direkten Einfluss auf unser eigenes Scoring.

Welche Datenkompetenzen sollten die Volunteers idealerweise mitbringen?

Datenanalyse und -übersetzung
Datenkommunikation und Data Storytelling
Datenvisualisierung

Wie können sich die Volunteers im Vorfeld auf den Workshop vorbereiten?

BTI-Webseite besuchen (Methodik und Download)
BTI 2026 Codebuch lesen
Regionalbericht(e) lesen (qualitativ)
Ländergutachten durchgehen (qualitativ)

Gerne könnt ihr mit ersten Verständnisfragen auf Sebastian Plate zukommen.

Bertelsmann Stiftung

Sebastian Plate

Bertelsmann Stiftung

Sebastian Plate

Intelligente Kombination von Park- & Verkehrszeichendaten

Die NVBW – Nahverkehrsgesellschaft Baden-Württemberg mbH – betreibt MobiData BW® im Auftrag des Ministeriums für Verkehr Baden-Württemberg. Der bestehende Datenkatalog reicht von Sharing- über Parkdaten und Fahrplandaten, sowie Daten zu Ladeinfrastruktur, Ereignissen, Baustellen, Rad- und Fußverkehr, Zählungen und Verkehrsmeldungen.

Bestandteil einer klimafreundlichen Mobilität ist nicht zuletzt auch der ruhende Verkehr mit allen Formen des Abstellens von Fahrzeugen, wie z. B. auf Parkplätzen, am Straßenrand oder in Parkhäusern. Vor diesem Hintergrund führt MobiData BW® landesweit gebündelte Datensätze zu Parkplätzen und Parkbauten wie auch zu Straßen-Parkplätzen – Daten, die dazu beitragen, den Umstieg auf nachhaltige Mobilitätsangebote zu erleichtern und Parksuchverkehr zu reduzieren.

Datensatz „Gebündelte Daten Straßen-Parkplätzen Baden-Württemberg“ bündelt MobiData BW® Daten, die in Kommunen im Rahmen der kommunalen Verkehrsplanung über verschiedenartige, oft manuelle oder nur teil-automatisierte Prozesse erhoben werden.

Daneben gibt es Ansätze zu KI-gestützten Verfahren der Erhebung und Bereitstellung von Daten zu Straßen-Parkplätzen, z. B.

KI-Analyse von Befahrungsbilddaten
Auswertung von Luftbildern und Ableitung von
einzelnen Stellplätzen mithilfe von KI-Algorithmen

Mit dem Ziel, über automatisierte und intelligente Vorgehensweisen landesweit für die Kommunen eine Datenbasis zu Straßen-Parkplätzen zu erstellen und zur Weiterbearbeitung verfügbar zu machen, beschäftigen uns u.a. folgende Fragestellungen:

Was könnten weitere „Datenquellen“ für die automatisierte bzw. KI-gestützte Erhebung und Bereitstellung von Daten zu Straßen-Parkplätzen sein und wie lassen sich diese zu einer konsistenten und
skalierbaren Datenbasis zusammenführen?
Wie könnte man eine Art „Confidence Level“ abbilden, um darzustellen mit welcher Wahrscheinlichkeit an einer über automatisierte, intelligente Verfahren definierten Stelle/Fläche tatsächlich ein Parkplatz ist?
Wie können automatisiert erhobene Daten zu Straßen-Parkplätzen und Verkehrszeichendaten sinnvoll miteinander kombiniert werden, so dass daraus ein maschinenlesbares und kommunal weiter
verarbeitbares Datenmodell für die standardisierte Datenbereitstellung entsteht?

Ziel unserer Forschung ist es Ansätze zu finden, wie wir über automatisierte und mit KI-Methoden gestützte Verfahren den Kommunen landesweit eine Datenbasis zu Straßen-Parkplätzen im öffentlichen Raum als „Arbeitsgrundlage“ zur Verfügung stellen zu können, welche sie z. B. in einem landesweiten digitalen Parkplatzkataster bearbeiten und pflegen könnten.

Perspektiven, Ideen und Impulse, welche Möglichkeiten bestehen die beschriebenen Fragestellungen und Zielsetzungen anzugehen. Wir würden uns freuen, wenn aus der Diskussion mit den Volunteers beim Datendialog möglichst konkrete neue Handlungsoptionen entstehen könnten.

Im Rahmen des DatenDialogs würden wir gerne die Daten der Stadt Heidelberg als Beispieldaten verwenden:

On-Street-Parkplätze
Verkehrszeichen

Zunächst freuen wir uns über Offenheit und Interesse, sich generell mit Mobilitätsfragen kreativ auseinander zu setzen. Der Fokus sollte dann möglichst konkret auf dem Thema einer intelligenten Kombination von Park- & Verkehrszeichendaten liegen – aber auch hier sind wir offen für verschiedenste, gerne auch kreative Ansätze (Crowd-Sourcing, Gamification, etc.).

IT-Erfahrung und Programmierkenntnisse wären von Vorteil, um die Beispieldaten bewerten und idealerweise möglichst konkrete Ideen und Handlungsoptionen für KI-gestützte bzw. automatisierte Vorgehensweisen erarbeiten zu können.

Die Volunteers können sich im Vorfeld mit der Plattform MobiData BW® vertraut machen. Zusätzliche wäre Auseinandersetzung speziell mit dem ParkAPI-Datenmodell, welches wir bei MobiData BW® zur Darstellung von Parkdaten nutzen, sowie mit den Beispieldaten vorteilhaft.

NVBW - Nahverkehrsgesellschaft Baden-Württemberg mbH

Antje Falkinger

NVBW - Nahverkehrsgesellschaft Baden-Württemberg mbH

Antje Falkinger

Kommunale Klimaräte

Engagement, Beteiligung und Koproduktion sind beim kommunalen Klimaschutz notwendiger denn je – sowohl in der kommunalen Politik als auch bei kommunalen Unternehmen. Klimaräte, Klimabeiräte und andere Gremien stehen für eine informelle, mal mehr oder weniger dauerhafte und verbindliche Zusammenarbeit mit der Stadtgesellschaft, in deren Rahmen Lösungen zu umstrittenen politischen Fragen und Vorhaben in der kommunalen Klimapolitik erarbeitet werden.

Wir sammeln und bereiten einen bundesweiten Überblick über die in Städten, Gemeinden und kommunalen Unternehmen eingesetzten Klimaräte und ähnliche Gremien auf. Auf dieser Basis stellen wir die verschiedenen Modelle und Arbeitsweisen dar, ermitteln Herausforderungen und geben Handlungsempfehlungen für Kommunen und öffentliche Unternehmen, um die Beteiligung der Bürgerinnen und Bürger zu stärken.

Die Formate, Ziele und Arbeitsweisen von Beteiligungsstrukturen im Klimabereich sind sehr unterschiedlich. Die Herausforderung besteht in einer sinnvollen Strukturierung und Aufbereitung der qualitativen Daten sowie deren Auswertung und Visualisierung.

Klimaräte sind entweder, wie zum Beispiel in Köln, Potsdam oder Darmstadt, als beratende Expertengremien mit Persönlichkeiten aus Wissenschaft, Wirtschaft, Zivilgesellschaft und Verwaltung dauerhaft angelegt und durch die Politik offiziell ernannt. Oder es sind temporäre geloste Gremien, wie u.a. die Klimabürgerräte in Freiburg oder in Konstanz. Auch kommunale Unternehmen wie Stadtwerke nutzen vermehrt Beteiligungsgremien, um sich in ihrer Arbeit beraten zu lassen.

Was ist die Wirkung, die ihr erreichen wollt?

Es gibt keine strukturierten Übersichten über Klima(bei)räte in Städten, Gemeinden oder kommunalen Unternehmen. Wir wollen diese Lücke schließen. Auf einer soliden Datenbasis können dann verschiedene Modelle und Arbeitsweisen dargestellt und ausgewertet werden. Wir wollen Herausforderungen ermitteln und Handlungsempfehlungen geben, damit noch mehr Kommunen den Weg von Beteiligung und Koproduktion bei der Umsetzung von kommunalen Klimaschutzmaßnahmen gehen. Eine Plattform kann Interessierte für mehr Beteiligung (z.B. aus Verwaltungen) mit Kommunen oder Unternehmen vernetzen, die bereits praktische Erfahrung mit der Einrichtung guter und empfehlenswerter Beteiligungsstrukturen gesammelt haben

Welche Datenkompetenzen sollten die Volunteers eurer Meinung nach idealerweise mitbringen?

Digitale Unterstützungstools für Recherchearbeiten
Datenvisualisierungen
Data Storytelling

Was wir uns von der Diskussion mit den Volunteers versprechen

Erkenntnisse über eine effiziente Recherche der Klimaräte bei uneinheitlicher Datenlage (gibt es (halb-)automatisierte Unterstützungstools?) und eine innovative,anschauliche digitale Datenaufbereitung (z.B. interaktive Visualisierungen) sowie mögliche Implementierung auf unserer Website (CMS: Wordpress)
Ziel ist es, am Ende des DatenDialogs einfache Vergleiche, Visualisierungen oder kleine Modelle zu haben, die wir im Nachgang Fördermittelgeber pitchen können, um das Projekt deutschlandweit zu skalieren

Themenheft „Zukunft beginnt vor Ort“ - So werden Kommunen lebenswert und klimaneutral
https://www.boell.de/de/2025/06/13/zukunft-beginnt-vor-ort (Seiten 12-13 lesen)

Vielfalt an gelosten Bürgerräten (und deren unterschiedliche Bezeichnungen) auf Landesebene:
https://www.buergerrat.de/buergerraete/buergerraete-in-den-laendern/

Beispiel einer Datenbank/Visualisierung zu gelosten Bürgerräten (ohne andere, nicht-geloste Formate)
https://www.datenbank-buergerraete.info/buergerraete/abfragen

Gesellschaft für Klima und Demokratie e.V.

Björn Obmann

Gesellschaft für Klima und Demokratie e.V.

Björn Obmann

Informations- und Aktivierungsangebot: Klimaantrag.de

Wir entwickeln eine Plattform, die über das Instrument „Einwohnerantrag“ informiert und Menschen aktiviert, so ihre Klimathemen auf die Agenda der Kommunalpolitik zu setzen.

Nutzer*innen hätten folgende Möglichkeiten: Sie geben ihre Postleitzahl an und die Plattform zeigt an…

…welches Amt in der Gemeinde zuständig ist.
…welche jeweiligen Voraussetzungen (Quorum, Fristen) gelten.
…welche Erfolgsbeispiele es für kommunale Klimathemen im Bundesland gibt.
…wer eine fachliche Beratung anbietet.

Über die Plattform kann ggf. ein Antrag gestellt bzw. eine Unterschriftenliste generiert werden. Alternativ könnte ein How-to bereitgestellt werden.

Wie gestaltet sich die Schnittstelle und was sind die möglichen Datenquellen für die Anzeige PLZ > zuständiges Amt?
Formular: Automatisches Generieren eines Einwohnerantrags
Könnte über die Plattform auch ein Antrag eingereicht werden? Wie könnte sich ein Rücklauf gestalten?

Die Gesellschaft für Klima und Demokratie e.V. ermutigt und befähigt Menschen und lokale Initiativen, ihre Mitbestimmungsmöglichkeiten für die Umsetzung einer klimafreundlichen Kommunalpolitik auszuschöpfen, und begleitet sie aktiv bei ihrem Weg dorthin.

Mit einem Einwohnerantrag können Menschen ihr Anliegen auf die Tagesordnung der Kommunalpolitik setzen. Unterstützt eine bestimmte Anzahl der Einwohner*innen (je nach Bundesland 1 bis 5%) die Forderung, muss die Politik darüber beraten und in manchen Bundesländern sogar darüber entscheiden. Leider ist diese Möglichkeit kaum bekannt. Es gibt bisher kein ansprechendes und aktivierendes Informationsangebot, das das Instrument des Einwohnerantrags erklärt und Menschen dazu aktiviert, es für ihre Anliegen zu nutzen. Die Plattform wäre eine bundesweite Anlaufstelle, die die Daten einheitlich und anschaulich aufbereitet. Das baut Zugangshürden ab und stärkt den Ansatz einer inklusiven, partizipativen Demokratie.

Welche Datenkompetenzen sollten die Volunteers eurer Meinung nach idealerweise mitbringen?

Allgemeine Softwareentwicklung und Data Engineering, um das Angebot in seinen unterschiedlichen Komponenten und Schnittstellen weiterentwickeln zu können

Was wir uns von der Diskussion mit den Volunteers versprechen:

Überprüfung des Ansatzes und Diskussion über die allgemeine Infrastruktur des Angebots
Ein besseres Verständnis von möglichen Schnittstellen und Datenquellen
Weiterentwicklung der Konzeption und Klarheit über die nächsten Schritte

Gesellschaft für Klima und Demokratie e.V.

Michaela Zimmermann

Gesellschaft für Klima und Demokratie e.V.

Michaela Zimmermann

We Want Them Back App
Auf der Suche nach den Vorfahren

wewantthemback.berlin ist eine zivilgesellschaftliche Web-Anwendung zur Aufarbeitung der Berliner Kolonialgeschichte. Sie macht Informationen über menschliche Gebeine (Ancestral Remains) aus kolonialen Kontexten sichtbar, die noch in deutschen Museen, Universitäten und Sammlungen liegen. Ziel ist es, Transparenz zu schaffen und Nachfahr:innen den Zugang zu Informationen über den Verbleib ihrer Vorfahr:innen zu erleichtern, um Rückführungsprozesse zu unterstützen.

Die Plattform bündelt Daten und bietet einen Überblick über Ancestral Remains in Deutschland. Sie ist kein offizielles Rückgabeportal, sondern ein digitales Werkzeug für Sichtbarkeit, Aufklärung und zivilgesellschaftliches Engagement. Der Prototyp wurde aus einer dekolonialen Perspektive entwickelt, ist nutzerfreundlich und visuell orientiert.

Die App soll Transparenz fördern, politische Meinungsbildung unterstützen und Handlungsoptionen für Betroffene eröffnen. Entwickelt wurde sie gemeinsam mit Vertreter:innen von Herkunfts-Communities, insbesondere Repat. A-Take und Berlin Postkolonial. Als Open-Source-Projekt basiert sie auf modernen Technologien wie next.js, rough.js, leaflet.js, d3.js und einer Grist-Datenbank mit API-Anbindung.

Unsere Anwendung nutzt ein umfassendes Datenmanagementsystem auf Basis von Grist, mit dem unterschiedliche Daten zu Ancestral Remains und beteiligten Institutionen strukturiert erfasst und verwaltet werden. Aktuell bestehen zwei zentrale Herausforderungen, die dringend bearbeitet werden müssen:

Umbau der Grist-Tabelle:
Die bestehende Datenstruktur benötigt zusätzliche Cross-Referenzen und kombinierbare Filter, da derzeit nicht mehrere Kategorien gleichzeitig berücksichtigt werden können. Ziel ist eine flexiblere, relationale Struktur, die komplexere Abfragen erlaubt.

Erleichterung der Dateneingabe:
Um Redakteur*innen und Museen die Mitarbeit zu erleichtern, soll die Dateneingabe grundlegend verbessert werden. Derzeit erfolgt sie über ein verschachteltes Grist-System mit hohem Fehlerrisiko. Geplant ist die Entwicklung einer benutzerfreundlichen Frontend-Eingabemaske mit Authentifizierung, über die Redakteur*innen Daten strukturiert einpflegen können. Dabei müssen Quellenangaben und Prüfmechanismen integriert sein, bevor Daten in der Datenbank gespeichert und veröffentlicht werden.

Was ist das Ziel unserer Forschung? Was ist das gesellschaftliche Problem, was ihr mit eurem Projekt bearbeitet?

„We want them Back“ ist ein wichtiger Schritt für eine transparente und respektvolle Auseinandersetzung mit Ancestral Remains aus kolonialen Kontexten in Deutschland. Die App bietet eine Plattform, die sowohl die Rückführung der Gebeine unterstützt als auch das Bewusstsein für ihre historische und kulturelle Bedeutung stärkt. Es ist die erste digitale Übersicht zu dem Thema und möchte zeigen, dass ein respektvoller Umgang und Informationsfluss zu dem Thema möglich ist.

Was ist die Wirkung, die ihr erreichen wollt?

Als Open-Source-Projekt wurde die App entwickelt, um gemeinsam mit Betroffenen und Institutionen mehr Transparenz und Sensibilität für das Thema Ancestral Remains zu schaffen. So sollen die Chancen auf Repatriierungen erhöht werden – etwa durch vermehrte Nachfragen aus betroffenen Communities oder durch intensive Provenienzforschung.

Besonders wichtig ist, dass die Überarbeitung der App die Kommunikation zwischen Nachfahr*innen und den deutschen Institutionen, die über Ancestral Remains verfügen, erleichtert. Dadurch kann der Prozess der Rückführung menschlicher Gebeine in ehemals kolonialisierte Gebiete beschleunigt werden und ein wertvoller Beitrag zur Aufarbeitung des Unrechts des deutschen Kolonialismus geleistet werden.

Was wir uns von der Diskussion mit den Volunteers versprechen

Kein Code, aber Klarheit:
Ein Verständnis der aktuellen Probleme und Ideen für Lösungsansätze in Bezug auf:

Grenzen der bestehenden Grist-Tabelle
Probleme bei Cross-Referenzen & - Mehrfachkategorien
Hürden bei der Dateneingabe für Externe

Wir wünschen uns eine Skizze für eine Zielarchitektur und eine klare Benennung von Arbeits- und Aufgabenpakete, mit denen wir dann nochmal Volunteers für die Umsetzung anfragen können (inkl. grobe Zeit- & Aufwandsabschätzung).

Welche Datenkompetenzen sollten die Volunteers eurer Meinung nach idealerweise mitbringen?

Profil 1: Daten- & Grist-Kompetenz (konzeptionell und technisch)
Volunteers mit diesem Profil bringen Erfahrung in der Datenmodellierung und im Datenbankdesign mit und sind in der Lage, eine flexibel erweiterbare Datenstruktur zu entwerfen, die mehrdimensionale Abfragen (z. B. kombinierte Kategorien und Filter) erlaubt. Idealerweise verfügen sie über Grist-spezifische Kenntnisse, insbesondere im Umgang mit Referenztabellen, Formeln und Filterlogiken, sowie über ein gutes Verständnis von Datenlogik und Abfragekonzepten, um komplexe Beziehungen sauber und nachhaltig abzubilden.

Profil 2: Frontend- & Dateneingabe-Kompetenz
Volunteers dieses Profils verfügen über einen Hintergrund in Webentwicklung oder Medieninformatik und Erfahrung mit modernen Frontend-Frameworks. Ihre zentrale Kompetenz liegt darin, eine benutzerfreundliche Eingabemaske zu entwickeln und das Frontend technisch so zu übersetzen, dass die eingegebenen Daten strukturiert, valide und konsistent in die zugrunde liegende Grist-Tabelle überführt werden. Dabei ist ein Verständnis für nutzerzentriertes Design ebenso wichtig wie die Fähigkeit, Frontend und Datenstruktur sinnvoll miteinander zu verzahnen.

Wie können sich die Volunteers im Vorfeld auf den Workshop vorbereiten?

Projekt & Technik sichten: Repository, bestehende Grist-Tabelle und die aktuelle Website von wewantthemback.berlin vorab ansehen, um Datenstruktur und Funktionsgrenzen zu verstehen.

Decolonize Berlin e.V.

Merel Fuchs

Decolonize Berlin e.V.

Müslüm Örtülü

Decolonize Berlin e.V.

Merel Fuchs

Decolonize Berlin e.V.

Müslüm Örtülü

Legal Data for Good – der "Verfassungsfreund”

Der Verfassungsfreund soll als KI-gestütztes Legal Tech Tool entwickelt werden, das Bürger*innen bzw. Bürgern eine erste Einschätzung geben soll, ob staatliches Handeln verfassungskonform war.

Viele Bürgerinnen und Bürger haben wenig Wissen darüber, wie staatliches Handeln im Lichte ihrer Grundrechte zu bewerten ist. Der "Verfassungsfreund" soll eine erste - unverbindliche Einschätzung - bieten, ob staatliches Handeln verfassungskonform ablief und problematisches Handeln aufzeigen. Er soll dabei auch als Informationsbot genutzt werden, sodass der Nutzer eine Kurzübersicht über den Bedeutungsgehalt etwaig betroffener Grundrechte erhält.

In dieser Datenherausforderung sollen die ersten Schritte für die Entwicklung des “Verfassungsfreundes” am Beispiel eines konkreten Grundrechts gelegt werden.

Dies kann von Data-Scraping bzw. Vorbereitung eines geeigneten Datensatzes zur Entwicklung eines Trainings- und Testdatensatzes reichen bis hin zur ersten Arbeit
mit Trainings- und Testdatensätzen.

Auch kann gerne mit generativen Tools experimentiert werden um zu analysieren, wie etwaige Ergebnisse dargestellt werden können.

Welche Datenkompetenzen sollten die Volunteers idealerweise mitbringen?

Kenntnisse im automatisierten Data-Scraping
Kenntnisse in Machine-Learning Verfahren
Kenntnisse in LargeLanguageModels und generativer KI
gerne auch vertiefte Informatikkenntnisse, um eigene Tools programmieren zu können

Was wir uns von der Diskussion mit den Volunteers versprechen:
Viele tolle neue Ideen zur Nutzung von rechtlichen Texten im Kontext von KI.

Wie können sich die Volunteers im Vorfeld auf den Workshop vorbereiten?

Wer mag, kann sich schon einmal die Seite des Bundesverfassungsgerichts anschauen und überlegen, wie man sinnvoll automatisiert an Legal Text Daten zu einem bestimmten Artikel (z.B. Art 4 Religionsfreiheit oder Art. 5 Meinungsfreiheit) des Grundgesetzes gelangt, die man für die weitere Analyse verwenden kann.

Universität Speyer

Judith Kärn

Universität Speyer

Judith Kärn

Dezember 2025

Vom Datensatz zur Datastory

Das Data Science Lab der Bertelsmann Stiftung ist ein internes Beratungsteam. Es hilft der Stiftung, Kompetenzen und Infrastruktur für Data Science und KI aufzubauen. Jedes Jahr veröffentlicht die Stiftung rund 200 Studien und Papiere in ihren acht Programmen und Zentren. Damit dieses Wissen leichter nutzbar ist, haben wir einen Q&A-Chatbot entwickelt – den „PublikationsBot“.

Der PublikationsBot nutzt Retrieval-Augmented Generation (RAG), um Fragen zu den Inhalten der Publikationen zu beantworten. Jede Nutzerfrage wird vektorisiert und mit vektorisierten Absätzen im Korpus abgeglichen. Die ähnlichsten Textstellen werden ausgewählt, und ein Sprachmodell formuliert daraus eine kurze Antwort mit Quellenangaben. Zu jeder Publikation speichern wir Metadaten wie Titel, Autor:innen, Jahr und – falls vorhanden – Projekt und Programm.

In der Datenherausforderung möchten wir untersuchen, wie der PublikationsBot genutzt werden kann, um spannende, evidenzbasierte Geschichten über die Themen der Stiftung zu erzählen – und wie sich diese im Zeitverlauf verändern.

Wir starten mit einem gemeinsamen Brainstorming: Welche Arten von Geschichten lassen sich mit „Text als Daten“ erzeugen? Welche Methoden eignen sich zum Extrahieren und Analysieren? Wie lassen sich Ergebnisse gut darstellen und visualisieren? Anschließend Prototypen kleine Gruppen ein oder zwei Methoden zu einem selbst gewählten Thema. Beispiele: Ein Thema über zwei Zeiträume vergleichen (z. B. vor vs. nach COVID-19) und zusammenfassen, was sich geändert hat. Oder verfolgen, wie sich Schlüsselbegriffe über die Jahre entwickeln – welche neu entstehen, welche abnehmen und welche stabil bleiben.

Nach der Session möchten wir einen prototypischen Workflow und praktische Tipps für Storytelling mit dieser Datenquelle haben. Idealerweise entsteht auch eine erste Geschichte, eine Visualisierung und/oder ein einfaches Jupyter-Notebook als Ausgangspunkt für ein Storytelling-Tool.

Stehen euch bereits Daten zur Verfügung?
Ja. Wir stellen Zugriff auf die Datenbank mit (vektorisierten) Absätzen und Publikations-Metadaten bereit.

Welche Datenkompetenzen sollten die Volunteers idealerweise mitbringen?

Kenntnisse zu Methoden, um „Text als Daten“ zu verarbeiten
Grundkenntnisse in Datenbanken (Starterfunktionen stellen wir bereit)
Python/Jupyter oder R – alternativ Low-Code-Tools für einfache Visualisierungen
Affinität für Storytelling und Datenvisualisierung
Grundverständnis von Information Retrieval (Embeddings, Top-k-Suche)
Neugier und die Fähigkeit, Forschungsfragen zu formulieren

Die Website der Bertelsmann Stiftung durchstöbern und ein paar Publikationen ansehen
Werft einen Blick auf mögliche Visualisierungen (z.B. Slope-Graph, Jahresbalken, Mini-Timeline)
1–2 Story-Ideen oder Leitfragen mitbringen (z.B.: „Welche Geschichte könnten wir über … erzählen – und für wen?“)

Data Science Lab

Dr. Helena Bakic

Data Science Lab

Dr. Helena Bakic

Ein halbes Jahr Datenatlas Zivilgesellschaft: Bilanz und Blick nach vorne

Der Datenatlas Zivilgesellschaft ist ein zentrales Metadatenportal, das offene Daten aus der Zivilgesellschaft sichtbar, auffindbar und nutzbar macht. Es ist ein Angebot der Bertelsmann Stiftung.

Ziel des Datenatlas Zivilgesellschaft ist es, den Zugang zu qualitativ hochwertigen Daten zu verbessern, die Arbeit zivilgesellschaftlicher Organisationen zu unterstützen und datenbasiertes Handeln zu fördern.

Der Datenkatalog bildet das Herzstück des Datenatlas. Hier können Sie gezielt nach offenen Datensätzen aus unterschiedlichsten zivilgesellschaftlichen Bereichen suchen – beispielsweise gefiltert nach Themen, Regionen oder Organisationen. Die verwendeten Metadaten folgen dem europäischen Standard DCAT-AP und ermöglichen so eine einfache Integration in bestehende Dateninfrastrukturen.

Neben dem Datenkatalog legt der Datenatlas besonderen Wert auf Kompetenzaufbau, Wissenstransfer und Vernetzung. Mit Open-Data-Workshops, Datensprechstunden, Open-Data-Netzwerktreffen und Open-Data-Barcamps wollen wir die Datenkompetenz zivilgesellschaftlicher Akteur:innen stärken.

Langfristig trägt der Datenatlas zum Aufbau eines gemeinwohlorientierten Datenökosystems bei, das Transparenz schafft, datenbasierte Entscheidungsprozesse unterstützt und gesellschaftliche Teilhabe fördert.

Der Datenatlas Zivilgesellschaft wird zum Zeitpunkt des Datendialogs am See seit gut einem halben Jahr live sein. Wir möchten mit euch eine erste Bilanz ziehen. Dazu schauen wir uns den aktuellen Stand des Datenatlas Zivilgesellschaft an: Wie viele Organisationen stellen ihre Daten bereit? Wie viele Datensätze gibt es im Datenatlas? Wie schätzt ihr die Usability ein, z.B. hinsichtlich des Data Provider Interface (DPI)?

Wir möchten auf der Basis einer aktuellen Bestandsaufnahme anschließend in die Zukunft blicken. In welche Richtung könnte sich der Datenatlas Zivilgesellschaft entwickeln? Sollte aus dem Metadatenportal ein Datenportal werden? Wie können wir die Nutzung des Datenatlas ausbauen?

In dieser Session brauchen wir unterschiedlichste Kompetenzen und wir freuen uns über alle Teilnehmenden, die sich für Daten aus dem zivilgesellschaftlichen Sektor interessieren.

Am besten schaut ihr euch zur Vorbereitung einmal den Datenatlas Zivilgesellschaft genau an und prüft ihn auf Herz und Nieren. Was fällt euch in der Nutzung auf? Was könnte verbessert werden? Wenn ihr euch den Datenatlas im Vorfeld schon angeschaut habt, können wir mit dem Workshop direkt tief im Thema einsteigen. Wir freuen uns auf eure Teilnahme und auf eure Beiträge!
datenatlas-zivilgesellschaft.de

Daten für die Gesellschaft

Mario Wiedemann

Daten für die Gesellschaft

Bürge Uprak

Daten für die Gesellschaft

Mario Wiedemann

Daten für die Gesellschaft

Bürge Uprak

Open Data Portal Wegweiser Kommune: Mit Fakten Potenziale heben

Im Projekt geht es darum, die vielfältigen Datenangebote des Wegweisers Kommune (Ist-Daten, Prognose, Typisierung usw.) so aufzubereiten, dass sie stärker genutzt und sichtbarer werden. Im Mittelpunkt steht die Frage, wie aus komplexen Rohdatenstrukturen verständliche, ansprechende und wirksame Kommunikationsformate entstehen können – von Kurzanalysen und Visualisierungen bis hin zu datengetriebenen Stories oder interaktiven Formaten. Ziel ist es, Ideen zu entwickeln, die sowohl analytisch fundiert als auch ressourcenschonend umsetzbar sind. Die Teilnehmenden arbeiten gemeinsam an prototypischen Ansätzen, wie Daten des Wegweisers allein oder in Kombination mit externen Quellen genutzt werden können, um gesellschaftlich relevante Themen sichtbar zu machen und gleichzeitig den Wegweiser präsenter zu positionieren. Damit trägt das Projekt zur neuen Kommunikationsstrategie des Wegweisers bei und stärkt dessen Position als Datentool.

Die konkrete Datenherausforderung besteht darin, Wege zu finden, wie die umfangreichen Datenlage des Wegweisers in konkrete Kommunikationsformate übersetzt werden kann. Die Daten selbst liegen größtenteils in guter Qualität vor, doch bisher fehlt es an Formaten, die den Mehrwert schnell sichtbar machen und eine breite externe Nutzung anregen. Gefragt sind Ansätze, die komplexe Informationen verdichten, visualisieren und mit narrativen Elementen verknüpfen, ohne dass dafür dauerhaft ein großes Analyseteam nötig wäre.

Mögliche Fragestellungen: Wie lassen sich aus den vorhandenen Indikatoren pointierte Data Storys entwickeln? Welche Visualisierungen oder Kurzanalysen könnten Aufmerksamkeit erzeugen? Inwiefern kann die Kombination mit externen Datenquellen zusätzliche Relevanz schaffen? Welche Kanäle würde man für welche Analyseform am besten nutzen? Es sollen erste prototypische Ideen erarbeitet werden, die in die Kommunikationsstrategie des Wegweisers Kommune einfließen können.

Wir wollen herausarbeiten, wie die Daten des Wegweisers Kommune so aufbereitet und kommuniziert werden können, dass sie über den Kreis von Fachanwender:innen hinaus genutzt werden. Im Fokus steht die Entwicklung von prototypischen Kommunikationsformaten, die komplexe Daten in verständliche, wirkungsvolle Geschichten und Visualisierungen übersetzen.

Obwohl Daten zur demografischen, sozialen und wirtschaftlichen Entwicklung in Kommunen verfügbar sind, werden sie in Politik, Verwaltung und Öffentlichkeit oft nicht genutzt, weil Zugänge und Aufbereitungen fehlen oder die Quellen (z. B. der Wegweiser) nicht bekannt sind. Damit bleiben Potenziale für faktenbasierte Diskussionen, politische Entscheidungen und gesellschaftliches Lernen ungenutzt.

Wir möchten erreichen, dass die Daten des Wegweisers Kommune sichtbarer, anschlussfähiger und wirkungsvoller eingesetzt werden – sowohl im gesellschaftlichen Diskurs als auch in der medialen Berichterstattung. Langfristig sollen datenbasierte Formate dazu beitragen, gesellschaftliche Debatten zu versachlichen, lokale Unterschiede verständlich zu machen und Kommunen Impulse für Handeln und Gestaltung zu geben.

Wir versprechen uns von der Diskussion mit den Volunteers kreative Impulse. Besonders wertvoll ist für uns der Blick von außen: Welche Formate würden sie selbst spannend finden? Welche Datenstorys lassen sich mit vertretbarem Aufwand entwickeln? Und wie können Visualisierungen oder Narrative gestaltet werden, damit sie in der Öffentlichkeit ihre geplante Wirkung entfalten? Die Diskussion soll uns helfen, Ideen zu priorisieren und konkrete Ansätze zu identifizieren.

Stehen euch bereits Daten zur Verfügung?

Ja, es existiert eine umfangreiche Datengrundlage: Ist-Daten-Zeitreihen von 2006 bis (bald) 2024 in über 300 Indikatoren verschiedener Themen (Nachhaltigkeit, Arbeitsmarkt, Bildung …) über alle Gemeinden, Kreise, Länder. Darüber hinaus Prognosedaten, Typisierungsdaten, Pflegeprognosedaten und Wanderungsdaten.

Welche Datenkompetenzen sollten die Volunteers eurer Meinung nach idealerweise mitbringen?

Kenntnisse in Datenanalyse und vor allem Statistik (Lage- und Streuungsmaße, Verteilungen, Inferenz, hypothesengeleitetes Arbeiten, Explorationsmethoden …)
Erfahrung mit Datenvisualisierungen jeglicher Art. Es muss nicht (und sollte auch nicht) die Ggplot-Grafik herauskommen, die zu fachlich ist und keiner versteht
Fähigkeit zu Data Storytelling und verständlicher Kommunikation: Komplexe Zusammenhänge anschaulich darstellen; Erfahrung mit unterschiedlichen Kommunikationskanälen
Konzeptstärke: Formate entwickeln, Zielgruppen denken
Offenheit für interdisziplinäre Zusammenarbeit

Ganz wichtig: Es sind nicht nur Profi-Data-Scientists gefragt. Dieses Projekt profitiert von jeder Idee und jedem Fachbereich!

Kurz mit dem Wegweiser Kommune vertraut machen (Datenangebot, Indikatoren, Themenübersicht der Indikatoren, Prognosen, Typisierung, ggfs. Methodenberichte)
Beispiele für Data Storys und Visualisierungen anschauen, die man im Projekt als Referenz nutzen könnte
Überlegen, welche Formate sie persönlich ansprechend finden (z. B. interaktive Grafiken, Kurzanalysen, Narrative)
Falls möglich: einen Blick in vergleichbare offene Datenportale werfen, um Inspirationen zu sammeln.

Wegweiser Kommune

Hendrik Jütte

Wegweiser Kommune

Hannah Amsbeck

Wegweiser Kommune

Hendrik Jütte

Wegweiser Kommune

Hannah Amsbeck

Frischer Blick auf „alte“ Daten

Umfragen der Bertelsmann Stiftung folgen meist einem bewährten Muster: Datenerhebung, Studie, Veröffentlichung - dann verschwindet der Datensatz in der Schublade. Dabei steckt in jedem Datensatz weitaus mehr Potenzial, als eine einzige Auswertung ausschöpfen kann. Mit Frischer Blick auf „alte“ Daten wollen wir das Ändern und einen Kulturwandel anstoßen.

Wir bringen zwei aktuelle Befragungen (2025) samt Veröffentlichung mit - zum Thema 1) Gaming, Medien & Politik und 2) Ausbildungsperspektiven junger Menschen - und entwickeln in Gruppen neue Ideen und Auswertungen. Ziel ist es, am Ende spannende Ergebnisse zu haben, die einen neuen Spin geben und im besten Fall in Form von Posts, kurzen Beiträgen oder kleinen Veröffentlichungen sichtbar werden.

Die Datensätze können im Slackchannel #dd-frischer-blick eingesehen werden.

Die Volunteers wählen nach Interesse, mit welchem Datensatz und Thema sie arbeiten möchten. Je nach Anzahl der Teilnehmenden können auch mehrere Gruppen mit jeweils einem Datensatz gebildet werden. Zunächst verschaffen sich die Gruppen einen Überblick, welche Fragen bereits untersucht wurden und welche Potenziale offen sind. Anschließend entwickeln sie eigene Hypothesen und testen diese mit den Daten. Möglich sind einfache Vergleiche, Visualisierungen oder kleine Modelle. Ziel ist es, am Ende des DatenDialogs kurze Storylines, Grafiken oder Mini-Beiträge zu haben, die wir im Nachgang den Projektverantwortlichen pitchen können. Im besten Fall entsteht daraus ein Social-Media-Post, eine Mini-Veröffentlichung oder konkreter Input für ein neues Projekt.

Eine weitere Idee: Wir könnten erproben, ob KI uns bei der Analyse von Codebooks und den Veröffentlichungen zusätzliche Anknüpfungspunkte liefert. So könnten wir testen, ob LLMs künftig regelmäßig helfen können, ungenutzte Datenpotenziale sichtbar zu machen.

Unser Ziel:
Zu zeigen, dass bestehende Umfragedaten für neue Fragestellungen nutzbar sind und schnell zu relevanten Ergebnissen führen können.

Welches gesellschaftliche Problem bearbeiten wir in unserem Projekt:
Wissen bleibt oft ungenutzt, weil Daten nach der ersten Veröffentlichung nicht weiterverwendet werden. So gehen Erkenntnisse verloren, die für Politik und Zivilgesellschaft hilfreich wären.

Welche Wirkung wir erreichen möchten:
Projektteams der Stiftung sollen erleben, dass Re-Use praktikabel ist und Mehrwert schafft. So entsteht Anreiz, Daten künftig öfter erneut einzusetzen und mit anderen zu teilen.

Wir erhoffen uns neue Perspektiven auf unsere Datensätze: frische Fragestellungen, kreative Analyseideen und kleine Auswertungen, die wir selbst so nicht gesehen hätten. Besonders wertvoll ist für uns der frische, mehrdimensionale Blick aus unterschiedlichen Forschungsbereichen. So gewinnen wir Anregungen für künftige Projekte und Ansätze, die wir in die Stiftung zurück spiegeln können.

Diese Datenkompetenzen können hilfreich sein:

Grundkenntnisse in Statistik und Datenanalyse
Sicherheit im Umgang mit gängigen Analysetools (z. B. R, Python oder SPSS)
Erfahrung in der Visualisierung
Kreativität bei der Hypothesengenerierung
Interesse an gesellschaftlichen Themen

Sobald feststeht, welche Datensätze genutzt werden, stellen wir Codebooks und die zugehörigen Studien bereit. Ihr könnt euch vorab einlesen und überlegen, welche Themen ihr spannend findet. Optional könnt ihr schon erste Ideen oder Fragen mitbringen und im Workshop pitchen – es geht aber auch problemlos ohne Vorbereitung.

Hier stellen wir die relevanten Materialien bereit, sobald die finalen Datensätze feststehen:

Codebooks (folgt)
Studienveröffentlichungen (folgt)
ggf. weitere Hintergrundinformationen (folgt)

Data Science Lab

Daniel Bensel

Data Science Lab

Daniel Bensel

März 2025

Abbau von Sprachbarrieren

Die Open Innovation City Bielefeld verfolgt das Ziel, Netzwerke zu schaffen und offene Innovationsprozesse in der Stadt zu fördern. Eine aktuelle Herausforderung betrifft das Kommunale Integrationszentrum der Stadt Bielefeld. Das Kommunale Integrationszentrum unterstützt, berät und begleitet Menschen mit Migrationshintergrund oder Ausländer*innen. Häufig stehen sie dabei vor der Herausforderung, mit fremdsprachigen Menschen in den spontanen Kontakt zu treten oder Beratungsgespräche zu führen. Dies führt oft zu erheblichen Sprachbarrieren, da nicht immer genügend Dolmetscher*innen verfügbar sind und die Verwaltung keine handelsüblichen Übersetzungstools aufgrund datenschutzrechtlicher Bedenken verwenden darf. Unsere Aufgabe ist es, eine datenschutzkonforme Lösung zu entwickeln, die in Gesprächen zur Echtzeitübersetzung verwendet werden kann und von der Stadt selbst betrieben wird.

Die Herausforderung besteht darin, ein Tool zu entwickeln, das in Gesprächen und Beratungen des Kommunalen Integrationszentrums Sprachbarrieren überwindet. Dieses Tool soll sicherstellen, dass Berater*innen und Klient*innen trotz sprachlicher Unterschiede effizient kommunizieren können. Dabei steht der Datenschutz im Vordergrund, da das Tool keine externen Übersetzungsdienste wie ChatGPT nutzen darf. Die Idee ist, eine Lösung zu finden, bei der Speech-to-Text bzw. Text-to-Speech in Echtzeit erfolgt, sodass ein*e Berater*in sprechen und die beratende Person den Text lesen kann (und umgekehrt). Auch eine Speech-to-Speech Lösung ist denkbar. Entscheidend ist, dass die Stadt dieses System und eigenständig betreiben kann, um alle Datenschutzbestimmungen zu erfüllen.

Unser Ziel ist, eine datenschutzkonforme Lösung für Beratungsgespräche des Kommunalen Integrationszentrums zu entwickeln, um die Kommunikation zwischen Berater*innen und Klient*innen trotz Sprachbarrieren zu erleichtern.

In der Migrationsgesellschaft Bielefelds treffen Berater*innen häufig auf Klient*innen ohne gemeinsame Sprache. Das erschwert den Zugang zu Beratungsdiensten und behindert die Integration und Unterstützung. Die Herausforderung besteht darin, diese Kommunikationsbarrieren zu überwinden und dabei die strengen Datenschutzanforderungen zu erfüllen.

Wir möchten eine nachhaltige und sichere Übersetzungslösung bereitstellen, die Kommunikation erleichtert und gleichzeitig Datenschutz gewährleistet. So können Berater*innen und Klient*innen effektiv zusammenarbeiten und eine bessere Beratung ermöglichen.

Wir hoffen, durch den Austausch mit den Volunteers innovative technische Ansätze und Lösungen zu identifizieren, um unsere Herausforderung zu meistern. Insbesondere erwarten wir wertvolle Impulse zur Entwicklung und Implementierung einer datenschutzkonformen Lösung.

Stehen euch bereits Daten zur Verfügung?

Leider nicht.

Welche Datenkompetenzen sollten die Volunteers eurer Meinung nach idealerweise mitbringen?

Erfahrung in Speech-to-Text, Text-to-Speech und Speech-to-Speech-Technologien
Kenntnisse in der Entwicklung und Implementierung datenschutzkonformer Anwendungen
Expertise in maschinellem Lernen und Natural Language Processing (NLP)
Vertrautheit mit Datenschutz und Data Privacy, insbesondere im öffentlichen Sektor

Auseinandersetzung mit bestehenden in Speech-to-Text, Text-to-Speech und Speech-to-Speech-Lösungen
Recherche zu den datenschutzrechtlichen Rahmenbedingungen in Deutschland
Einarbeitung in Open-Source-Alternativen zu kommerziellen Übersetzungstools
Verständnis der spezifischen Anforderungen bei der kommunalen Datenverarbeitung

Stadt Bielefeld

Bürge Uprak

Stadt Bielefeld

Sarah Bollmann

Stadt Bielefeld

Bürge Uprak

Stadt Bielefeld

Sarah Bollmann

FörderFunke

FörderFunke ist eine Web Applikation, die Bürger*innen über ihre Rechte und Ansprüche informiert und sie dabei unterstützt, Anträge ordnungsgemäß einzureichen. Die Funktionsweise ist einfach: Bürger*innen erstellen auf einem Endgerät ein Profil mit einer Auswahl an Datenpunkten. Die Software vergleicht die Daten mit den Anforderungsprofilen verfügbarer Leistungen. Bei einem Treffer werden Nutzer*innen benachrichtigt und durch notwendige Schritte geführt. Fehlen Angaben für bestimmte Überprüfungen, werden Nutzende eingeladen, diese zu vervollständigen.

Aktuell enthält unser Katalog zehn essentielle Sozialleistungen. Im Laufe der kommenden Monate möchten wir die Anzahl kontinuierlich vergrößern. Dabei ist es für uns enorm wichtig, dass die Anforderungen und Leistungsbeschreibungen immer aktuell bleiben. Zu diesem Zweck möchten wir eine neue Lösung entwickeln: den Leistungs-Feed.

Der Leistungs-Feed ist ein kompakter Service, der in regelmäßigen Abständen diverse öffentliche Datenquellen scannt und prüft, ob neue Meldungen existieren, die für unseren Katalog relevant sind. Eine besonders interessante Datenquelle ist beispielsweise das Bundesgesetzblatt. Hier werden täglich alle neu erlassenen Gesetze und Verordnungen veröffentlicht.

Wir benötigen eine Pipeline aus drei Komponenten: ein Scraper lädt in regelmäßigen Intervallen die neuen Meldungen herunter. Ein Textanalyseprogramm prüft, erkennt und kategorisiert die Dokumente. Ein Benachrichtigungsservice bereitet relevante Daten auf und informiert uns oder andere Abonnenten.

Der Staat hat den Auftrag, Bürger*innen in unterschiedlichen Lebenssituationen zu unterstützen. Tatsächlich bleiben viele Leistungsangebote wie Elterngeld oder Bildungsgutscheine ungenutzt. Die Ursache ist oft einfach: Betroffene wissen nicht, dass ihnen Leistungen zustehen oder wie sie sie beantragen können. Unsere Applikation schließt diese Lücke, indem sie es Nutzer*innen ermöglicht, ihre Daten sicher zu speichern und durch schematisierte Anforderungsprofile über verfügbare Leistungen informiert zu werden. Wir hoffen, dass durch unsere Plattform eine signifikant größere Anzahl an Menschen relevante Leistungen und Förderungen in Anspruch nehmen kann.

Eine große Herausforderung für uns besteht darin, den Katalog an Leistungen kontinuierlich zu erweitern oder etwaige Änderungen in der Gesetzeslage aufzunehmen. Wir möchten die diversen öffentlichen Quellen (z.B. Bundesgesetzblatt) systematisch nutzen, um rechtzeitig die notwendigen Informationen zu erhalten, die es uns erlauben, den Katalog entsprechend zu pflegen und zu entwickeln.

Wir erhoffen uns Inspiration in drei Bereichen: gibt es möglicherweise zusätzliche Datenquellen, die uns nicht bekannt sind. Wir wären beispielsweise auch interessiert an Informationen zu Leistungen, die einzelne Bundesländer betreffen. Wir erhoffen uns Rat und Unterstützung im Bereich der textlichen Auswertung – unser eigener Erfahrungsschatz ist hier begrenzt. Wir sind neugierig, kreative Vorschläge für die allgemeine Infrastruktur des Services zu diskutieren.

Stehen euch bereits Daten zur Verfügung?

Der Bundesanzeiger und das Bundesgesetzblatt bieten eine spannende Datenquelle, die wir gerne gemeinsam weiter explorieren möchten. Daten stehen hier mit einer kleinen Anzahl an Metadaten als weitestgehend semi-strukturierte PDFs zur Verfügung. Tatsächlich gibt es aber auch viele Leistungen, die einzelne Länder, Kommunen oder Städte separat anbieten. Hier suchen wir zur Zeit nach belastbaren und einheitlichen Datenquellen.

Welche Datenkompetenzen sollten die Volunteers eurer Meinung nach idealerweise mitbringen?

Entsprechend der Herausforderung wäre Kompetenz in den folgenden Bereichen spannend: Allgemeine Software Entwicklung und Data Engineering, um den Service in seinen unterschiedlichen Komponenten und Schnittstellen zu entwerfen. NLP und Textverarbeitung, um die unstrukturierten Daten aus den PDFs sinnvoll auszuwerten und zu klassifizieren.

Grundsätzlich sehen wir keinen Bedarf, dass sich die Volunteers im Vorfeld besonders vorbereiten sollten. Wir möchten die Diskussionen flexibel und ergebnisoffen gestalten. Wer möchte, ist eingeladen, sich das Bundesgesetzblatt, den Bundesanzeiger oder beispielsweise auch die Website Abgeordnetenwatch anzusehen.

FörderFunke

Benjamin Degenhart

FörderFunke

Ben Gläser

FörderFunke

Benjamin Degenhart

FörderFunke

Ben Gläser

Health Transformation Hub

Der Health Transformation Hub ist eine Plattform für die Akteure des Gesundheitssystems, die unsere Gesundheitsversorgung durch aktives Handeln verbessern wollen und können. Hier kommen sie zusammen, um gemeinsam mit uns Lösungen zu entwickeln und umzusetzen. Unser Ziel: Konzepte für ein patientengerechtes, leistungsstarkes und zukunftsfestes Gesundheitssystem. Wir wissen, dass Veränderungen im Gesundheitswesen viel Substanz und einen langen Atem brauchen. Der HTH wird von der Bertelsmann Stiftung organisiert sowie inhaltlich und kommunikativ unterstützt. Das Gesundheitsprogramm der Stiftung treibt als Think Tank insbesondere die forschungsbasierte Grundlagenarbeit voran. Die BSt Gesundheit gGmbH, eine hundertprozentige Tochter der Stiftung, begleitet inhaltlich vor allem die Umsetzungsprojekte.

Der Health Transformation Hub der Bertelsmann Stiftung startet das Health Transformation Panel – eine exklusive Umfrage unter Personen, die das Gesundheitswesen maßgeblich mitgestalten.
Gemeinsam gewinnen wir wertvolle Einblicke in den Reformbedarf, das Reformklima und die aktuellen Handlungsbedarfe im Gesundheitswesen. So identifizieren wir die entscheidenden Themen und ebnen den Weg für zukunftsweisende Verbesserungen. Die Befragung findet zwei Mal jährlich statt (Mai/November). Der Fragebogen des Panels enthält ein festes Set an Items. Im letzten Schritt fragen wir Freitextantworten zum Thema, welche Veränderungen im Allgemeinen und vom Gesetzgeber konkret angegangen werden sollen, bei den Panelisten ab. Diese Freitextantworten werden aktuell manuell von uns definierten Clustern zugeordnet. Perspektivisch möchten wir diesen Schritt der Datenanalyse bestmöglich automatisieren.

Ziel der Forschung sind zwei Dinge:

1. Wir ermitteln, wie groß der Reformbedarf im deutschen Gesundheitssystem ist und ob es überhaupt Unterstützung und Bewegung für Veränderungen gibt.
2. Mit den Gestaltern des Gesundheitswesens die entscheidenden Themen zu identifizieren – auch, um an den relevanten Stellschrauben mit unserer Projektarbeit anzusetzen.

Wir stehen vor einer Vielzahl gesellschaftlicher Herausforderungen. Bei den jüngsten Bevölkerungsumfragen im Vorfeld der Landtagswahl in Thüringen (09.2024) gaben beispielsweise 59% der Befragten eine wahrgenommene Verschlechterung der ärztlichen Versorgung an.

Die bestehenden Strukturen und Prozesse des Gesundheitssystems passen nicht mehr zu den aktuellen gesellschaftlichen Realitäten. Die demografische Entwicklung, der medizinische Fortschritt sowie veränderte Lebens- und Arbeitsstile stellen enorme Herausforderungen dar. So gibt es immer mehr Menschen, die medizinische Leistungen in Anspruch nehmen, aber immer weniger Menschen, die diese Leistungen erbringen können oder wollen. Wir erleben zunehmend einen Fachkräftemangel und Versorgungslücken. Das System muss an die neuen Realitäten angepasst werden. Unser Ziel ist es, dass das vorhandene Gesundheitspersonal effektiver und effizienter eingesetzt wird, veraltete Strukturen und Prozesse modernisiert sowie die Möglichkeiten der Digitalisierung klug genutzt werden.

Als gemeinnützige Plattform, die Theorie und Praxis verbindet wollen wir – gemeinsam mit den Veränderungen im Gesundheitswesen – Lösungen zur Verbesserung des Gesundheitssystems entwickeln und diese auch wirklich realisieren.

Wir haben bereits im Dezember 2023 am Datendialog in München teilgenommen und super gute Erfahrungen gemacht, konkret an den Realdaten mit den Teilnehmenden zu arbeiten. Das möchten wir in dieser Session auch gern wieder machen. Wenn es uns gelingt, Software und Scripte und alles, was es braucht so aufzusetzen, dass wir die Analyse und Zuordnung der Daten zu den Clustern oder ggf. auch freies Bilden der Cluster durchzuführen und zu automatisieren, haben wir für unser Vorhaben ein großes Ziel erreicht. Denn: Das Panel wächst, die Teilnehmenden werden mehr, die Antworten vielfältiger. Manuell können wir den Analyseprozess künftig nicht mehr stemmen.

Stehen euch bereits Daten zur Verfügung?

Ja, wir bringen mit:

die Originaldaten als Exporte aus unserer Panel-Software aus zwei Befragungswellen
ein Script (R), mit dem wir Fragen mit weichen Antwortzwang vorbearbeiten
eine Liste mit den von uns definierten Clustern (Sammelbegriffen)
das Datenformat (json) für den Import auf unserer Website

Welche Datenkompetenzen sollten die Volunteers eurer Meinung nach idealerweise mitbringen?

Nach unserem Empfinden macht es Sinn, wenn wir gemeinsam mit Datenanalysen arbeiten, die in folgenden Schwerpunkten unterwegs sind:

Datenanalyse & Automatisierung
Clusteranalyse
Ggf. Machine Learning

Und alle, die Lust darauf haben, an einem ganz konkreten Usecase mit uns zu arbeiten.

Ihr könnt euch gern unser „Endprodukt“ – die Kommunikation der Panelergebnisse auf unserer Website vorab anschauen, um einen ersten Eindruck zu bekommen, den Rest erarbeiten wir einfach on the fly.

BSt Gesundheit

Christian Thiele

BSt Gesundheit

Christian Thiele

MobiData BW®

MobiData BW® ist die verkehrsträgerübergreifende Open-Data-Plattform für Mobilitätsdaten des Landes Baden-Württemberg. Die zentrale Integrationsplattform trägt dazu bei, die Ziele der Mobilitätswende zu erreichen, indem sie die Mobilitätsdaten landesweit bündelt und diese kosten- sowie diskriminierungsfrei öffentlich bereitstellt. Ein standardisiertes, transparentes Lizenzmodell erlaubt die Nutzung der Daten für kommerzielle und nicht kommerzielle Zwecke. So können innovative verkehrsträgerübergreifende und nachhaltige Mobilitätsdienste entstehen.

Die NVBW – Nahverkehrsgesellschaft Baden-Württemberg mbH – betreibt MobiData BW® im Auftrag des Ministeriums für Verkehr Baden-Württemberg und hat MobiData BW® als landesweite Plattform für Mobilitätsdaten etabliert und damit einen zentralen Punkt zur Bündelung und Bereitstellung von Verkehrs- und Angebotsdaten aus Kommunen und Verkehrsverbünden sowie von privatwirtschaftlichen Mobilitätsanbietern geschaffen.

Der bestehende Datenkatalog reicht von Sharing- über Parkdaten und Fahrplandaten, sowie Daten zu Ladeinfrastruktur, Ereignissen, Baustellen, Rad- und Fußverkehr, Zählungen und Verkehrsmeldungen.

Mobilität ist Gemeinwohl – welche Daten machen dies möglich?

MobiData BW® sammelt und bündelt Daten mit Mobilitätsbezug (wie z.B. ÖPNV, Barrierefreiheit, Sharing Mobility, Parkraum, Meldungen, Zählungen, etc.) und stellt diese in standardisierten Formaten und mit offenen Lizenzen bereit.

Welche Anwendungen von Mobilitätsdaten seht ihr in gemeinwohlorientierten Organisationen und Projekten?

Mit welchen Informationen / Daten lassen sich Mobilitätsdaten für gemeinwohlorientierte Anwendungen sinnvoll ergänzen, um deren Nutzen zu steigern?

Wie sollten Plattformen wie MobiData BW® die Daten und Formate im Idealfall bereitstellen, um optimale Mehrwerte zu erzielen? Welche Datenarten sind am relevantesten, welche Lizenzen und Anwendungen wichtig? Welche Rolle können sensible, aber relevante Daten spielen, die nicht als Open Data verfügbar sind?

Vorstellbar ist für uns ein Leitfaden für Mobilitätsdaten im Gemeinwohl-Einsatz als auch ein prototypisches Anwendungsdesign für konkrete Anwendungen.

Aufgabe von MobiData BW® ist die verkehrsträgerübergreifende Datenbereitstellung, als Open Data und damit für alle nutzbar. Das Ziel ist, mit den Daten einen Beitrag zur Mobilitätswende zu leisten und damit die klimafreundliche Mobilität voranzubringen.

Unser Ziel ist es, die Perspektive der Zivilgesellschaft zu erfahren und kennen zu lernen, Feedback zu erhalten und auch herauszufinden, wo noch bisher ungenutzte Potentiale liegen. Wir wollen ermitteln, mit welchen Daten wir das bestehende Datenangebot sinnvoll ergänzen und damit besser machen können, um die Nutzung attraktiver zu gestalten. Oder: Mit welchen Datenquellen können wir unser Angebot besser vernetzen, welche Informations- und Vernetzungspfade helfen dabei, Mobilitätsdaten optimal in praktische Anwendungen zu bringen.

Stehen euch bereits Daten zur Verfügung?

Ja, MobiData BW® verfügt über einen gut gefüllten Datenkatalog. Zu verschiedenen Mobilitätsarten stehen jeweils Datenprofile zur Verfügung, über welche die Daten eingesehen und genutzt werden können.

Welche Datenkompetenzen sollten die Volunteers eurer Meinung nach idealerweise mitbringen?

Wir freuen uns generell über Offenheit und Interesse, sich mit dem Thema Mobilität auseinander zu setzen. IT-Erfahrung und Programmierkenntnisse können von Vorteil sein, um einen Blick in das bestehende Datenangebot werfen zu können und ggf. sogar erste Anwendungsszenarien skizzieren zu können.

Die Plattform MobiData BW® besuchen, die Datenprofile und vor allem die dazugehörigen Visualisierungen betrachten. Mit geschärftem Blick durch den Alltag gehen und die Vielfalt von Mobilitätsdaten und deren (potentielle) Anwendungsgebiete entdecken und erkunden. Beispiele von bestehenden Datenanwendungen ausprobieren. Ähnliche Plattformen besuchen wie z.B. die Mobilithek, die Open-Data-Plattform daten.bw sowie Geoportale oder Open Data Portale von Kommunen.

NVBW - Nahverkehrsgesellschaft Baden-Württemberg mbH

Reinhard Otter

NVBW - Nahverkehrsgesellschaft Baden-Württemberg mbH

Marlene Picha

NVBW - Nahverkehrsgesellschaft Baden-Württemberg mbH

Reinhard Otter

NVBW - Nahverkehrsgesellschaft Baden-Württemberg mbH

Marlene Picha

Open Data Forum

Das Kompetenzzentrum Open Data (CCOD) im Referat D I 4 des Bundesverwaltungsamtes hat in Kooperation mit dem Zentrum für Digitale Souveränität (ZenDiS) auf der Open CoDE Plattform ein eigenes Forum zum Thema Open Data eingerichtet.

Hiermit kommen wir dem Wunsch der Open Data Community nach einer zeit- und ortsunabhängigen Möglichkeit zum Austausch nach.

Das Open Data Forum (ODF) verfolgt das Ziel, durch transparente und systematisierte Formen der Kommunikation von Datenbereitstellenden und Datennutzenden mit- und untereinander langfristig die Veröffentlichung faktisch nachgefragter und qualitativ hochwertiger Datensätze zu erhöhen.

Im Open Data Forum können (sich)

Nutzende von offenen Daten mit den Datenbereitstellenden in Kontakt treten
Datenbereitstellende untereinander Erfahrungen und Wissen teilen
Anwendungsfälle von offenen Daten präsentiert werden
Interessierte zu Open Data Veranstaltungen (z.B. den Fachforen) austauschen

Verwaltungsmitarbeitende von der Open Data Expertise in der Zivilgesellschaft profitieren

Anstelle einer konkreten Datenherausforderung bildet den Kern dieses Projektes die Kommunikation über (offene) Daten, um der Herausforderung der wenig systematisierten Kommunikation der beteiligten Akteure zu begegnen.

Während Teile der Datenbereitstellenden zumindest innerhalb bestehender Netzwerke kommunizieren, ist insbesondere die Kommunikation mit Nutzenden in der Breite unterentwickelt. Für eine möglichst

bedarfsgerechte Nachnutzung – das eigentliche Ziel der Datenbereitstellung – ist jedoch die Kommunikation (vor allem mit) mit Datennutzenden unerlässlich. Nur so können datenbereitstellende Stellen die Qualität der Daten einschätzen, faktische Bedarfe ihrer Community kennen lernen und letztlich in ihrer Bereitstellung priorisieren.

Häufig erfolgt eine solche Kommunikation sporadisch und unstrukturiert, hier soll das Open Data Forum Abhilfe schaffen. Mit der neuen Kommunikationsplattform ergeben sich jedoch neue Hürden:

Wie erreichen wir möglichst viele Datennutzende?
Wie schaffen wir es, den Großteil der Bundes- Landes und Kommunalbehörden ins Forum zu holen und dazu zu animieren, sich aktiv einzubringen?
Wie fördern wir einen nachhaltigen Diskurs?“

Mit dem Open Data Forum beabsichtigt das CCOD einen zentralen, transparenten und systematisierten Raum für Austausch im Bereich der offenen Daten zu bieten.

Neben der Akquise neuer Nutzender beabsichtigen wir, neue Anforderungen für die stetige Weiterentwicklung des Forums einzuholen. Nachdem das Forum – dank der Kooperation mit Open CoDE – schnell realisiert und gelauncht werden konnte, konzentrieren wir uns nun darauf, die Plattform anhand der realen Nutzendenbedarfe weiterzuentwickeln.

Welche Datenkompetenzen sollten die Volunteers eurer Meinung nach idealerweise mitbringen?

Keine spezifischen Datenkompetenzen von Nöten. Wichtiger ist, dass die Teilnehmenden Nutzende oder Bereitstellende von Open [Government] Data sind.

Volunteers können sich gerne im Vorfeld zu dem Workshop mittels der unten genannten Links registrieren und das Open Data Forum besuchen.

Kompetenzzentrum Open Data

Inhalt

März 2026

Intelligente Kombination von Park- & Verkehrszeichendaten

Kommunale Klimaräte

Informations- und Aktivierungsangebot: Klimaantrag.de

Dezember 2025

Vom Datensatz zur Datastory

Open Data Portal Wegweiser Kommune: Mit Fakten Potenziale heben

Stehen euch bereits Daten zur Verfügung?

Welche Datenkompetenzen sollten die Volunteers eurer Meinung nach idealerweise mitbringen?

Frischer Blick auf „alte“ Daten

März 2025

Abbau von Sprachbarrieren

Stehen euch bereits Daten zur Verfügung?

Welche Datenkompetenzen sollten die Volunteers eurer Meinung nach idealerweise mitbringen?

FörderFunke

Stehen euch bereits Daten zur Verfügung?

Welche Datenkompetenzen sollten die Volunteers eurer Meinung nach idealerweise mitbringen?

Health Transformation Hub

Stehen euch bereits Daten zur Verfügung?

Welche Datenkompetenzen sollten die Volunteers eurer Meinung nach idealerweise mitbringen?

MobiData BW®

Stehen euch bereits Daten zur Verfügung?

Welche Datenkompetenzen sollten die Volunteers eurer Meinung nach idealerweise mitbringen?

Open Data Forum

Welche Datenkompetenzen sollten die Volunteers eurer Meinung nach idealerweise mitbringen?

Juni 2024

Coming soon…

März 2024

Coming soon…

Dezember 2023

Coming soon…

Juni 2023

Coming soon…

November 2022

Coming soon…

%NAME%

%DOWNLOADS_TITLE%

%SECTION_TITLE%