Barcamp 2023

Wie passen Open Data und KI zusammen?

Das Projekt "Daten für die Gesellschaft" hat am 18. Januar das bereits 13. Open-Data-Netzwerktreffen veranstaltet. Rund 100 Teilnehmer:innen aus Kommunen beteiligten sich an dem Austausch über KI und Open Data per Zoom.

Ansprechpartner

Foto Mario Wiedemann
Mario Wiedemann
Senior Project Manager
Foto Petra Beckhoff
Petra Beckhoff
Project Assistant

 

Das Thema Künstliche Intelligenz hat längst die Rathäuser in den Kommunen erreicht. Ein spannender Ansatzpunkt: Künstliche Intelligenz mit offenen Datensätzen verknüpfen und den User:innen einen Mehrwert bieten. Beim 13. Open-Data-Netzwerktreffen am 18. Januar 2024 stellten die Referenten vor, wie das gelingen kann.

Fast 100 Teilnehmer:innen waren dabei, als der Schweizer Christian Stocker zum Auftakt eine Verknüpfung von Open Data und Künstlicher Intelligenz in der Stadt Zürich vorstellte. Stocker hat als Entwickler bei der Webagentur Liip mit Kolleg:innen den ZüriGPT geschaffen zuericitygpt.ch/. Dieser kann viele Fragen rund um die Stadt Zürich beantworten: Was macht Zürich beim Klima? Wie bekomme ich eine Baugenehmigung?

Website-Suche als mühsam empfunden

Ansatzpunkt für das Projekt, das die Webagentur eigenständig ohne die Stadtverwaltung durchführte, war eine nicht optimale Suchfunktion auf der Webseite, wie Christian Stocker erläuterte. „Bei 50.000 HTML-Seiten ist es unter Umständen sehr mühsam, etwas zu finden“, sagte er.

Zusätzlich hat Christian Stocker mit LinkedDataGPT ld.gpt.liip.ch ein Tool entwickelt, das die Abfrage von Linked Data der Stadt Zürich mittels Künstlicher Intelligenz vereinfacht. Auf Basis von OpenAI's GPT-API werden natürlich-sprachliche Fragen in SPARQL-Abfragen umgewandelt. Auf diese Weise können auch weniger technisch affine Menschen relevante Informationen aus den offenen Daten der Stadt Zürich erhalten.

Dazu werden dem Tool relevante Datensätze und Dateien zur Verfügung gestellt, aus denen es dann die Antworten ziehen kann. „Man schenkt dem Tool sein Wissen und am Schluss lege ich fest, welche Frage beantwortet wird und wie diese Antwort aus dem zugeschickten Wissen aussieht“, beschrieb Christian Stocker den Vorgang. An die Informationen gelangten sie, indem sie vorher die Webseite crawlten. In manchen Fällen mussten die Dateien umgewandelt werden. Informationen zur Müllabfuhr konnte ChatGPT nicht finden, weil die Informationen in einer pdf-Datei steckten. Stocker und Co. haben sie dann in ein kompatibles Format umgewandelt.

Einschränkungen bei Plausibilität

Christian Stocker und Kolleg:innen haben die Anwendung für verschiedene Städte nachgebaut, unter anderem für Lausanne und die Parlamentsseite des Kanton Wallis. Doch die Anwendung hat auch Grenzen. Eine Demoversion für den Zürcher Zoo offenbarte Schwächen, wie Christian Stocker offen zugab. Die Antwort auf die Frage, wann der Löwe aktiv sei, beinhaltet zwei, sich widersprechende Aussagen. Im besten Fall sollten die Antworten also regelmäßig geprüft werden.

Als zweiter Referent berichtete Justus Engelland, wie die Stadt Braunschweig Künstliche Intelligenz und Open Data miteinander verzahnt. Engelland ist der stellvertretende Leiter der Stabsstelle Digitalisierung der Stadt Braunschweig und für den Bereich Open Data verantwortlich opendata.braunschweig.de/.

Das Open Data Portal ist seit 2022 im Einsatz und beinhaltet aktuell 58 Datensätze. „KI gewinnt in der öffentlichen Verwaltung zunehmend an Bedeutung“, stellte Justus Engelland fest. Dies liege insbesondere daran, dass in der Verwaltung viele Texte und Daten zur Verfügung stünden. „Die KI-basierte Analyse von Daten rückt in den Fokus.“

 

Von Fluglärm bis Haushaltsdaten

Engelland berichtete über drei konkrete Anwendungsfälle: erstens Geodaten zum Fluglärm, zweitens Haushaltsdaten und drittens Sensordaten zur Personenfrequenz in der Braunschweiger Innenstadt. Zur Auswertung nutzte die Stadtverwaltung den Dataanalyzer. Im ersten Fall wurde mit den Daten eine Fluglärmkarte erstellt und im nächsten Schritt auf die Regionalkarte von Braunschweig mit der Flughafenumgebung übertragen. Dataanalyzer hat dazu die Daten zusammengeführt.

Das zweite Beispiel befasste sich mit den Haushaltsdaten der Stadt. Die Basisdaten wurden aus dem Open-Data-Portal als CSV-Datei gewonnen. Die Haushaltsdaten wurden dann von Dataanalyzer ausgelesen. Zur visuellen Darstellung wurden Tortendiagramme mit den einzelnen Ausgabenposten erstellt. Zudem sind Nachfragen möglich, zum Beispiel zu möglichen Einsparpotenzialen der Stadt.

Die Passantenfrequenzen in Braunschweig konnte Dataanalyzer nach Tagen auswerten und beispielsweise in einem Diagramm darstellen. „Durch KI und einer dialogbasierten Datenauswertung und -darstellung sind schnellere Analysen möglich“, sagte Justus Engelland.

Qualität der Eingabe bestimmt Qualität der Ausgabe

Ein enormes Potenzial liege auch darin, dass nicht zusammenhängende und in verschiedenen Formaten vorliegende Dateien zusammengefügt werden könnten. Um das volle Potenzial KI-basierter Datenanalyse auszuschöpfen, muss der Umgang mit Daten standardisiert werden, sagte er. Dabei bestimme die Qualität der eingegebenen Daten und Anfragen (sogenannte Prompts) die Qualität der Ausgaben. Auch Justus Engelland betonte, dass teilweise eine menschliche Prüfung der Datenausgabe noch erforderlich sei.

Zum Abschluss präsentierte Stefan Riedel vom Technologie Campus Grafenau einen Leitfaden, der Akteur:innen im Tourismus dabei unterstützt, offene Daten bereitzustellen tourismus.bayern/.

In einem zweiten kurzen Slot stellte Luis Moßburger von der Bayerische Agentur für Digitales Byte ink: open.bydata.de/ eine Handreichung zum Thema “Hochwertige Datensätze” für Kommunen vor.

Haben Sie Interesse? Melden Sie sich hier an!

Wenn Sie Interesse an einer Teilnahme an unserem Austauschformat zu Open Data in Kommunen haben, melden Sie sich bitte hier an! Sie können sich auch anmelden, wenn Sie am kommenden Termin nicht teilnehmen können. In diesem Falle nehmen wir Sie in den Verteiler für künftige Veranstaltungen auf.

Der Termin für das nächste Open-Data-Netzwerktreffen (per Zoom) wird in Kürze bekannt gegeben.

Das Thema unseres 14. Open-Data-Netzwerktreffens geben wir Anfang März bekannt.