Musterdatenkatalog
Musterdatenkatalog für Kommunen

Welche offenen Daten werden von Kommunen in Deutschland veröffentlicht?

Musterdatenkatalog
Worum geht es?

Welche Daten werden von Kommunen als Open Data veröffentlicht? Darüber herrscht bisher kaum Klarheit. Der Musterdatenkatalog verschafft eine gute Übersicht über Open Data in Kommunen. Er umfasst alle Kommunen in Deutschland, deren offene Daten über das Datenportal für Deutschland, GovData.de, auffindbar sind.

Das Projekt Smart Country der Bertelsmann Stiftung hat gemeinsam mit GovData, KDZ – Zentrum für Verwaltungsforschung und der Open Knowledge Foundation Deutschland den Musterdatenkatalog entwickelt.

Der Musterdatenkatalog gibt Kommunen einen Anhaltspunkt, welche Daten sie noch als Open Data veröffentlichen könnten. Außerdem gibt er jenen Kommunen, die mit der Veröffentlichung offener Daten beginnen wollen, Orientierung. Sie können mit dem Katalog schnell in Erfahrung bringen, welche Daten von anderen Kommunen als Open Data veröffentlicht werden. Auf diese Weise kann ein Musterdatenkatalog auch Initialzündung für die Öffnung von kommunalen Daten sein. Auch weitere Personen wie Datenjournalist:innen oder Entwickler:innen können sich mit Hilfe des Musterdatenkatalogs einen besseren Überblick über Open Data verschaffen.

In Kooperation mit zahlreichen Städten, einem IT-Dienstleister und zivilgesellschaftlichen Organisationen wurde in einem ersten Schritt ein Prototyp erarbeitet, der im Mai 2019 veröffentlicht wurde. Im April 2020 wurde in Zusammenarbeit mit der Geschäftsstelle Open.NRW im Ministerium für Wirtschaft, Innovation, Digitalisierung und Energie in Nordrhein-Westfalen eine Version für Open-Data-Kommunen aus Nordrhein-Westfalen veröffentlicht. Der bundesweite Musterdatenkatalog ist eine Weiterentwicklung des Prototoypen und der NRW-Version.

Was ist der Musterdatenkatalog?
Musterdatenkatalog Download
Download des Musterdatenkatalogs
Musterdatenkatalog: Suchen Sie nach Open Data in Kommunen
Starten Sie Ihre Suche nach…

0

Datensätze
Um Potenziale anzuzeigen wählen Sie zuerst eine Kommune.
+ Potenzial anzeigen
KommuneTitelThemaBezeichnung
Bitte wenden Sie das Display für eine bessere Ansicht.
Wird geladen...
Schließen X

Was bedeutet “Potenzial anzeigen”?
Das „Potenzial“ einer Kommune zeigt die Anzahl von Musterdatensätzen, die in mindestens einer der Vergleichskommunen veröffentlicht wurden, aber noch nicht in dieser Kommune selbst. Nehmen wir das Beispiel Köln. Sie können sich in der obigen Suche alle Datensätze aus Köln anzeigen lassen. Im Datentool erscheint oben rechts nun der Button “Potenzial anzeigen”. Wenn Sie hier draufklicken, sehen Sie zum einen, welche Musterdatensätze Köln bereits veröffentlicht hat. Zum anderen können Sie sehen, welches Potenzial zur Veröffentlichung an Datensätzen Köln noch hat. Bezugspunkt zur Berechnung des Potenzials einer Kommune ist die Gesamtheit der Musterdatensätze aller Kommunen.
Der Musterdatenkatalog ist eine Fundgrube für Datenschätze in der Verwaltung, die nur darauf warten, veröffentlicht zu werden.
Alice Wiegand, Stadt Düsseldorf
Open Data ist für die kommunale Mitgestaltung so etwas wie das Fundament beim Hausbau.
Ivan Aćimović, Stadt Freiburg
Durch den Musterdatenkatalog wird sichtbar, welche Datensätze von welchen Städten bereits veröffentlicht wurden.
Stephan Bernoth, Stadt Moers
Der Musterdatenkatalog ist ein hilfreiches Werkzeug für die Smart City-Weiterentwicklung einer Kommune. Er bietet Anreize für die Gestaltung einer innovativen Kommune mit Open Data.
Sven Hense, Stadt Bonn
Wo fangen wir mit Open Data an? Der Musterdatenkatalog bietet einen Überblick, der viele Kommunen inspirieren kann.
Heinrich Lorei, Metropolregion Rhein-Neckar
Ich benutze den Musterdatenkatalog sehr häufig. Wenn ich in einer anderen Abteilung nach Daten frage, ist es hilfreich, Beispiele aus anderen Städten zu haben. Dies verringert ihren Widerstand, wenn es um Sorgen bezüglich des Datenschutzes geht.
Alexandre Souza Gomes, Stadt Konstanz
Fragen & Antworten

Bei der Vergleichbarkeit von Datensätzen der Kommunen gibt es zwei Herausforderungen. Einerseits gibt es sehr unterschiedliche Bezeichnungen für Datensätze, die eigentlich ähnlich sind. Zur Veranschaulichung hier ein Beispiel öffentlicher Toiletten:

Bonn: „Stadt Bonn: Standorte öffentlicher Toiletten“
Köln: „Stadt Köln: Oeffentliche Toiletten Koeln“
Düsseldorf: „Standorte öffentlicher Toiletten Düsseldorf“
Moers: „Stadt Moers: Öffentliche Toiletten in Moers mit Hinweisen für Menschen mit Behinderung“

Die individuellen Bezeichnungen erzeugen nicht nur das Problem, dass gleiche Datensätze unterschiedlich bezeichnet werden, sondern es kann andererseits mitunter vorkommen, dass die Bedeutung der Datensätze über die Bezeichnung nicht immer leicht verständlich ist.

Der Musterdatenkatalog soll bisherige Ordnungskriterien nicht ersetzen oder einheitliche Datensatzbezeichnungen in der Verwaltung vorschreiben. Vielmehr soll ein „Musterdatensatz“ ein zusätzliches Ordnungskriterium einführen, das die Vergleichbarkeit zwischen den Kommunen verbessert. Zur Veranschaulichung dient erneut das Beispiel „öffentliche Toiletten“. Der Musterdatensatz lautet: „Infrastruktur – Öffentliche Toiletten“.

Der bundesweite Musterdatenkatalog wird automatisiert mit einem Algorithmus erstellt. Dieser ordnet die offenen Daten in die Musterdatensätze ein. Wir haben den Algorithmus umfangreich trainiert, aber eine hundertprozentige Zuordnung aller Datensätze kann so nicht gelingen. Dafür gibt es vor allem drei Gründe:

1. Bei sehr vielen Datensätzen sind die Metadaten nur unzureichend beschrieben. Es gibt teilweise unklare Titel oder fehlende Beschreibungen. Ein Beispiel eines Bebauungsplans aus Rheinland-Pfalz: Titel: „E1“; Beschreibung: „Mörlheim, An den Herrenäckern“.
2. In manchen Musterdatensätzen gibt es nur sehr wenige Datensätze – teilweise nur ein oder zwei. Auf dieser dünnen Datenbasis fällt es dem Algorithmus sehr schwer, zu lernen.
3. Der Vorgänger des bundesweiten Musterdatenkatalogs, der NRW-Katalog, wurde mit seinen rund 2.500 Datensätzen manuell zugeordnet. Und selbst bei einer manuellen Zuordnung gibt es gelegentlich Fehler. Auch ein Algorithmus funktioniert nicht perfekt.

Mit einer breiteren Datenbasis wird der Algorithmus sich kontinuierlich verbessern. Außerdem hoffen wir, dass der Musterdatenkatalog auch einen Impuls setzen kann, damit Kommunen ihre Metadaten besser und eindeutiger beschreiben.

Nein. Der Musterdatenkatalog kann nicht automatisch bei jeder neuen Veröffentlichung offener Datensätze aktualisiert werden. Das hat vor allem zwei Gründe:

1. Es gibt technisch bisher keine Lösung mit geringem Aufwand, um automatisiert abzugleichen, welche neuen Datensätze auf GovData.de für eine Aufnahme in den Musterdatenkatalog in Frage kommen.
2. Die Aufbereitung der heruntergeladenen Daten erzeugt Arbeitsaufwand, weil aus den beschriebenen Metadaten häufig gar nicht klar hervorgeht, welche Kommune einen Datensatz zur Verfügung gestellt hat.

Eine Aktualisierung wird von der Bertelsmann Stiftung in Auftrag gegeben. Aktuell planen wir eine Aktualisierung des Musterdatenkatalogs 1-2 Mal pro Jahr.

Im Musterdatenkatalog führen wir offene Daten zusammen, die im Portal GovData.de abrufbar sind. Dort sind keine kommunalen Daten aus den Bundesländern Bayern, Niedersachsen, Sachsen-Anhalt und Saarland abrufbar. Ein Abruf der Daten aus Open-Data-Landesportalen (die die meisten der genannten vier Bundesländer nicht haben) oder aus kommunalen Portalen wäre zu aufwändig. Sollten künftig die Daten aus Kommunen der vier genannten Bundesländer auf GovData verfügbar sein, werden diese auch in den Musterdatenkatalog mit aufgenommen.

Im Musterdatenkatalog 3.0.1 wurden offene Daten berücksichtigt, die bis zum Stichtag 17. Juni 2021 auffindbar waren. Daten, die nach diesem Stichtag veröffentlicht wurden, können erst nach einer weiteren Aktualisierung Eingang in den Musterdatenkatalog finden.

Nur teilweise. Der Musterdatenkatalog wurde auf Basis eines Pilotprojekts mit 1000 Datensätzen aus fünf Kommunen in Nordrhein-Westfalen entwickelt (Musterdatenkatalog 1.0). Es konnten also „nur“ Musterdatensätze auf Basis von 1000 Datensätzen gebildet werden. Es können jedoch bei Bedarf neue Musterdatensätze entwickelt werden. Dazu hat sich ein kleiner Arbeitskreis mit kommunalen Vertreter:innen gebildet. Auf GitHub https://github.com/bertelsmannstift/Musterdatenkatalog gibt es außerdem die Möglichkeit, neue Musterdatensätze vorzuschlagen. Da der Musterdatenkatalog also auf der Konsolidierung der bisher bereits veröffentlichten Daten basiert, enthält er gute Hinweise darauf, welche Art von Daten in einer Kommune typischerweise verfügbar sein müssten. Es kann aber natürlich darüber hinaus noch jede Menge weiterer Daten geben, die bisher keine der Kommunen in Deutschland veröffentlicht hat und die daher noch nicht im Musterdatenkatalog enthalten sein können.

Der Musterdatenkatalog wurde zunächst als Prototyp im Mai 2019 veröffentlicht. Der Erstellung des Prototypen gingen drei Workshops in Köln voraus, zu denen GovData und die Bertelsmann Stiftung mehr als 20 Expert*innen aus der Open-Data-Community eingeladen haben. Die Ergebnisse der Workshops wurden in enger Abstimmung mit Vertreter*innen der Städte Bonn, Düsseldorf, Köln und Moers sowie mit dem IT-Dienstleister kdvz Rhein-Erft-Rur vertieft und mündeten in dem im Mai 2019 veröffentlichten Prototypen. Dieser bildete die Grundlage für die anschließende Entwicklung eines NRW-Musterdatenkatalogs durch die Projektpartner:innen Bertelsmann Stiftung, GovData, KDZ – Zentrum für Verwaltungsforschung und Open Knowledge Foundation Deutschland gemeinsam mit Open.NRW (Geschäftsstelle im Ministerium für Wirtschaft, Innovation, Digitalisierung und Energie des Landes Nordrhein-Westfalen). Der bundesweite Musterdatenkatalog ist eine Weiterentwicklung des Prototoypen und der NRW-Version. Die technische Umsetzung des Musterdatenkatalogs erfolgte durch Mila Frerichs (Civic Vision).

Unsere neuen Veröffentlichungen zu Open Data in Kommunen

Publikation: Ein Leitfaden für offene Daten

Der Leitfaden für offene Daten beschreibt alle notwendigen Schritte hin zur Veröffentlichung von Open Data (Lizenzen, Formate, Metadaten usw.). ...

Publikation: Open Data in Kommunen

Eine wachsende Zahl von Kommunen in Deutschland stellt schon jetzt offene Daten bereit. Welche Chancen und Herausforderungen Kommunen damit verbinden, ...

Publikation: Open Data in Kommunen – Eine Broschüre

Die Broschüre beschreibt kurz, was unter Open Data in Kommunen, also offenen Verwaltungsdaten, zu verstehen ist. Sie skizziert einige Argumente ...

Der Musterdatenkatalog ist ein Gemeinschaftsprojekt von:
Bertelsmann Stiftung
KDZ Logo
Govdata Logo
Open Knowledge Foundation Logo
Open NRW Portal
  • PDF