Datenherausforderungen
Nachfolgend findet ihr eine umfassende Beschreibung der sechs Projekte, die beim Datendialog im März 2025 teilnehmen werden. Macht euch bitte mit den Projekten vertraut, lest die Unterlagen zur Vorbereitung und bringt gerne Anmerkungen, Fragen und eigene Impulse mit. Für Rückfragen stehen die Referent:innen gerne zur Verfügung. Ihr erreicht sie am besten per E-Mail, die Adressen sind jeweils verlinkt.
Ansprechpartner:innen
Abbau von Sprachbarrieren
Die Open Innovation City Bielefeld verfolgt das Ziel, Netzwerke zu schaffen und offene Innovationsprozesse in der Stadt zu fördern. Eine aktuelle Herausforderung betrifft das Kommunale Integrationszentrum der Stadt Bielefeld. Das Kommunale Integrationszentrum unterstützt, berät und begleitet Menschen mit Migrationshintergrund oder Ausländer*innen. Häufig stehen sie dabei vor der Herausforderung, mit fremdsprachigen Menschen in den spontanen Kontakt zu treten oder Beratungsgespräche zu führen. Dies führt oft zu erheblichen Sprachbarrieren, da nicht immer genügend Dolmetscher*innen verfügbar sind und die Verwaltung keine handelsüblichen Übersetzungstools aufgrund datenschutzrechtlicher Bedenken verwenden darf. Unsere Aufgabe ist es, eine datenschutzkonforme Lösung zu entwickeln, die in Gesprächen zur Echtzeitübersetzung verwendet werden kann und von der Stadt selbst betrieben wird.
Die Herausforderung besteht darin, ein Tool zu entwickeln, das in Gesprächen und Beratungen des Kommunalen Integrationszentrums Sprachbarrieren überwindet. Dieses Tool soll sicherstellen, dass Berater*innen und Klient*innen trotz sprachlicher Unterschiede effizient kommunizieren können. Dabei steht der Datenschutz im Vordergrund, da das Tool keine externen Übersetzungsdienste wie ChatGPT nutzen darf. Die Idee ist, eine Lösung zu finden, bei der Speech-to-Text bzw. Text-to-Speech in Echtzeit erfolgt, sodass ein*e Berater*in sprechen und die beratende Person den Text lesen kann (und umgekehrt). Auch eine Speech-to-Speech Lösung ist denkbar. Entscheidend ist, dass die Stadt dieses System und eigenständig betreiben kann, um alle Datenschutzbestimmungen zu erfüllen.
Unser Ziel ist, eine datenschutzkonforme Lösung für Beratungsgespräche des Kommunalen Integrationszentrums zu entwickeln, um die Kommunikation zwischen Berater*innen und Klient*innen trotz Sprachbarrieren zu erleichtern.
In der Migrationsgesellschaft Bielefelds treffen Berater*innen häufig auf Klient*innen ohne gemeinsame Sprache. Das erschwert den Zugang zu Beratungsdiensten und behindert die Integration und Unterstützung. Die Herausforderung besteht darin, diese Kommunikationsbarrieren zu überwinden und dabei die strengen Datenschutzanforderungen zu erfüllen.
Wir möchten eine nachhaltige und sichere Übersetzungslösung bereitstellen, die Kommunikation erleichtert und gleichzeitig Datenschutz gewährleistet. So können Berater*innen und Klient*innen effektiv zusammenarbeiten und eine bessere Beratung ermöglichen.
Wir hoffen, durch den Austausch mit den Volunteers innovative technische Ansätze und Lösungen zu identifizieren, um unsere Herausforderung zu meistern. Insbesondere erwarten wir wertvolle Impulse zur Entwicklung und Implementierung einer datenschutzkonformen Lösung.
Stehen euch bereits Daten zur Verfügung?
Leider nicht.
Welche Datenkompetenzen sollten die Volunteers eurer Meinung nach idealerweise mitbringen?
- Erfahrung in Speech-to-Text, Text-to-Speech und Speech-to-Speech-Technologien
- Kenntnisse in der Entwicklung und Implementierung datenschutzkonformer Anwendungen
- Expertise in maschinellem Lernen und Natural Language Processing (NLP)
- Vertrautheit mit Datenschutz und Data Privacy, insbesondere im öffentlichen Sektor
- Auseinandersetzung mit bestehenden in Speech-to-Text, Text-to-Speech und Speech-to-Speech-Lösungen
- Recherche zu den datenschutzrechtlichen Rahmenbedingungen in Deutschland
- Einarbeitung in Open-Source-Alternativen zu kommerziellen Übersetzungstools
- Verständnis der spezifischen Anforderungen bei der kommunalen Datenverarbeitung
FörderFunke
FörderFunke ist eine Web Applikation, die Bürger*innen über ihre Rechte und Ansprüche informiert und sie dabei unterstützt, Anträge ordnungsgemäß einzureichen. Die Funktionsweise ist einfach: Bürger*innen erstellen auf einem Endgerät ein Profil mit einer Auswahl an Datenpunkten. Die Software vergleicht die Daten mit den Anforderungsprofilen verfügbarer Leistungen. Bei einem Treffer werden Nutzer*innen benachrichtigt und durch notwendige Schritte geführt. Fehlen Angaben für bestimmte Überprüfungen, werden Nutzende eingeladen, diese zu vervollständigen.
Aktuell enthält unser Katalog zehn essentielle Sozialleistungen. Im Laufe der kommenden Monate möchten wir die Anzahl kontinuierlich vergrößern. Dabei ist es für uns enorm wichtig, dass die Anforderungen und Leistungsbeschreibungen immer aktuell bleiben. Zu diesem Zweck möchten wir eine neue Lösung entwickeln: den Leistungs-Feed.
Der Leistungs-Feed ist ein kompakter Service, der in regelmäßigen Abständen diverse öffentliche Datenquellen scannt und prüft, ob neue Meldungen existieren, die für unseren Katalog relevant sind. Eine besonders interessante Datenquelle ist beispielsweise das Bundesgesetzblatt. Hier werden täglich alle neu erlassenen Gesetze und Verordnungen veröffentlicht.
Wir benötigen eine Pipeline aus drei Komponenten: ein Scraper lädt in regelmäßigen Intervallen die neuen Meldungen herunter. Ein Textanalyseprogramm prüft, erkennt und kategorisiert die Dokumente. Ein Benachrichtigungsservice bereitet relevante Daten auf und informiert uns oder andere Abonnenten.
Der Staat hat den Auftrag, Bürger*innen in unterschiedlichen Lebenssituationen zu unterstützen. Tatsächlich bleiben viele Leistungsangebote wie Elterngeld oder Bildungsgutscheine ungenutzt. Die Ursache ist oft einfach: Betroffene wissen nicht, dass ihnen Leistungen zustehen oder wie sie sie beantragen können. Unsere Applikation schließt diese Lücke, indem sie es Nutzer*innen ermöglicht, ihre Daten sicher zu speichern und durch schematisierte Anforderungsprofile über verfügbare Leistungen informiert zu werden. Wir hoffen, dass durch unsere Plattform eine signifikant größere Anzahl an Menschen relevante Leistungen und Förderungen in Anspruch nehmen kann.
Eine große Herausforderung für uns besteht darin, den Katalog an Leistungen kontinuierlich zu erweitern oder etwaige Änderungen in der Gesetzeslage aufzunehmen. Wir möchten die diversen öffentlichen Quellen (z.B. Bundesgesetzblatt) systematisch nutzen, um rechtzeitig die notwendigen Informationen zu erhalten, die es uns erlauben, den Katalog entsprechend zu pflegen und zu entwickeln.
Wir erhoffen uns Inspiration in drei Bereichen: gibt es möglicherweise zusätzliche Datenquellen, die uns nicht bekannt sind. Wir wären beispielsweise auch interessiert an Informationen zu Leistungen, die einzelne Bundesländer betreffen. Wir erhoffen uns Rat und Unterstützung im Bereich der textlichen Auswertung – unser eigener Erfahrungsschatz ist hier begrenzt. Wir sind neugierig, kreative Vorschläge für die allgemeine Infrastruktur des Services zu diskutieren.
Stehen euch bereits Daten zur Verfügung?
Der Bundesanzeiger und das Bundesgesetzblatt bieten eine spannende Datenquelle, die wir gerne gemeinsam weiter explorieren möchten. Daten stehen hier mit einer kleinen Anzahl an Metadaten als weitestgehend semi-strukturierte PDFs zur Verfügung. Tatsächlich gibt es aber auch viele Leistungen, die einzelne Länder, Kommunen oder Städte separat anbieten. Hier suchen wir zur Zeit nach belastbaren und einheitlichen Datenquellen.
Welche Datenkompetenzen sollten die Volunteers eurer Meinung nach idealerweise mitbringen?
Entsprechend der Herausforderung wäre Kompetenz in den folgenden Bereichen spannend: Allgemeine Software Entwicklung und Data Engineering, um den Service in seinen unterschiedlichen Komponenten und Schnittstellen zu entwerfen. NLP und Textverarbeitung, um die unstrukturierten Daten aus den PDFs sinnvoll auszuwerten und zu klassifizieren.
Grundsätzlich sehen wir keinen Bedarf, dass sich die Volunteers im Vorfeld besonders vorbereiten sollten. Wir möchten die Diskussionen flexibel und ergebnisoffen gestalten. Wer möchte, ist eingeladen, sich das Bundesgesetzblatt, den Bundesanzeiger oder beispielsweise auch die Website Abgeordnetenwatch anzusehen.
Health Transformation Hub
Der Health Transformation Hub ist eine Plattform für die Akteure des Gesundheitssystems, die unsere Gesundheitsversorgung durch aktives Handeln verbessern wollen und können. Hier kommen sie zusammen, um gemeinsam mit uns Lösungen zu entwickeln und umzusetzen. Unser Ziel: Konzepte für ein patientengerechtes, leistungsstarkes und zukunftsfestes Gesundheitssystem. Wir wissen, dass Veränderungen im Gesundheitswesen viel Substanz und einen langen Atem brauchen. Der HTH wird von der Bertelsmann Stiftung organisiert sowie inhaltlich und kommunikativ unterstützt. Das Gesundheitsprogramm der Stiftung treibt als Think Tank insbesondere die forschungsbasierte Grundlagenarbeit voran. Die BSt Gesundheit gGmbH, eine hundertprozentige Tochter der Stiftung, begleitet inhaltlich vor allem die Umsetzungsprojekte.
Der Health Transformation Hub der Bertelsmann Stiftung startet das Health Transformation Panel – eine exklusive Umfrage unter Personen, die das Gesundheitswesen maßgeblich mitgestalten.
Gemeinsam gewinnen wir wertvolle Einblicke in den Reformbedarf, das Reformklima und die aktuellen Handlungsbedarfe im Gesundheitswesen. So identifizieren wir die entscheidenden Themen und ebnen den Weg für zukunftsweisende Verbesserungen. Die Befragung findet zwei Mal jährlich statt (Mai/November). Der Fragebogen des Panels enthält ein festes Set an Items. Im letzten Schritt fragen wir Freitextantworten zum Thema, welche Veränderungen im Allgemeinen und vom Gesetzgeber konkret angegangen werden sollen, bei den Panelisten ab. Diese Freitextantworten werden aktuell manuell von uns definierten Clustern zugeordnet. Perspektivisch möchten wir diesen Schritt der Datenanalyse bestmöglich automatisieren.
Ziel der Forschung sind zwei Dinge:
1. Wir ermitteln, wie groß der Reformbedarf im deutschen Gesundheitssystem ist und ob es überhaupt Unterstützung und Bewegung für Veränderungen gibt.
2. Mit den Gestaltern des Gesundheitswesens die entscheidenden Themen zu identifizieren – auch, um an den relevanten Stellschrauben mit unserer Projektarbeit anzusetzen.
Wir stehen vor einer Vielzahl gesellschaftlicher Herausforderungen. Bei den jüngsten Bevölkerungsumfragen im Vorfeld der Landtagswahl in Thüringen (09.2024) gaben beispielsweise 59% der Befragten eine wahrgenommene Verschlechterung der ärztlichen Versorgung an.
Die bestehenden Strukturen und Prozesse des Gesundheitssystems passen nicht mehr zu den aktuellen gesellschaftlichen Realitäten. Die demografische Entwicklung, der medizinische Fortschritt sowie veränderte Lebens- und Arbeitsstile stellen enorme Herausforderungen dar. So gibt es immer mehr Menschen, die medizinische Leistungen in Anspruch nehmen, aber immer weniger Menschen, die diese Leistungen erbringen können oder wollen. Wir erleben zunehmend einen Fachkräftemangel und Versorgungslücken. Das System muss an die neuen Realitäten angepasst werden. Unser Ziel ist es, dass das vorhandene Gesundheitspersonal effektiver und effizienter eingesetzt wird, veraltete Strukturen und Prozesse modernisiert sowie die Möglichkeiten der Digitalisierung klug genutzt werden.
Als gemeinnützige Plattform, die Theorie und Praxis verbindet wollen wir – gemeinsam mit den Veränderungen im Gesundheitswesen – Lösungen zur Verbesserung des Gesundheitssystems entwickeln und diese auch wirklich realisieren.
Wir haben bereits im Dezember 2023 am Datendialog in München teilgenommen und super gute Erfahrungen gemacht, konkret an den Realdaten mit den Teilnehmenden zu arbeiten. Das möchten wir in dieser Session auch gern wieder machen. Wenn es uns gelingt, Software und Scripte und alles, was es braucht so aufzusetzen, dass wir die Analyse und Zuordnung der Daten zu den Clustern oder ggf. auch freies Bilden der Cluster durchzuführen und zu automatisieren, haben wir für unser Vorhaben ein großes Ziel erreicht. Denn: Das Panel wächst, die Teilnehmenden werden mehr, die Antworten vielfältiger. Manuell können wir den Analyseprozess künftig nicht mehr stemmen.
Stehen euch bereits Daten zur Verfügung?
Ja, wir bringen mit:
- die Originaldaten als Exporte aus unserer Panel-Software aus zwei Befragungswellen
- ein Script (R), mit dem wir Fragen mit weichen Antwortzwang vorbearbeiten
- eine Liste mit den von uns definierten Clustern (Sammelbegriffen)
- das Datenformat (json) für den Import auf unserer Website
Welche Datenkompetenzen sollten die Volunteers eurer Meinung nach idealerweise mitbringen?
Nach unserem Empfinden macht es Sinn, wenn wir gemeinsam mit Datenanalysen arbeiten, die in folgenden Schwerpunkten unterwegs sind:
- Datenanalyse & Automatisierung
- Clusteranalyse
- Ggf. Machine Learning
Und alle, die Lust darauf haben, an einem ganz konkreten Usecase mit uns zu arbeiten.
Ihr könnt euch gern unser „Endprodukt“ – die Kommunikation der Panelergebnisse auf unserer Website vorab anschauen, um einen ersten Eindruck zu bekommen, den Rest erarbeiten wir einfach on the fly.