Blick auf eine Fußgängerzone. Links und rechts Geschäfte. Ein paar Fußgänger unterwegs. Auf dem Bild ist noch eine Grafik mit weißen Strichen und Punkten.

Musterdatenkatalog für Kommunen

Welche offenen Daten werden von Kommunen in Deutschland veröffentlicht? Der Musterdatenkatalog verschafft einen Überblick.

 

Worum geht es?

Welche Daten werden von Kommunen als Open Data veröffentlicht? Der Musterdatenkatalog verschafft eine gute Übersicht über Open Data in Kommunen. Er umfasst alle Kommunen in Deutschland, deren offene Daten über das Datenportal für Deutschland, GovData.de, auffindbar sind.

Die Bertelsmann Stiftung hat gemeinsam mit GovData, KDZ – Zentrum für Verwaltungsforschung und der Open Knowledge Foundation Deutschland den Musterdatenkatalog entwickelt.

Der Musterdatenkatalog gibt Kommunen einen Anhaltspunkt, welche Daten sie noch als Open Data veröffentlichen könnten. Außerdem gibt er jenen Kommunen, die mit der Veröffentlichung offener Daten beginnen wollen, Orientierung. Sie können mit dem Katalog schnell in Erfahrung bringen, welche Daten von anderen Kommunen als Open Data veröffentlicht werden. Auf diese Weise kann ein Musterdatenkatalog auch Initialzündung für die Öffnung von kommunalen Daten sein. Auch weitere Personen wie Datenjournalist:innen oder Entwickler:innen können sich mit Hilfe des Musterdatenkatalogs einen besseren Überblick über Open Data verschaffen.

Die Nutzung des Musterdatenkatalogs für Kommunen wird im Konventionenhandbuch von DCAT-AP.de empfohlen. Der Verweis auf die Musterdatensätze erfolgt durch eine URI, die auf dieser Seite alle aufgelistet sind. Dort finden sich auch Beschreibungen und englische Übersetzungen der Musterdatensätze sowie eine RDF-Datei mit Verlinkungen zu anderen kontrollierten Vokabularen.

Der Musterdatenkatalog ist veröffentlicht unter CC0.

Musterdatenkatalog: Suchen Sie nach Open Data in Kommunen

Starten Sie Ihre Suche nach…

0

Datensätze
Um Potenziale anzuzeigen wählen Sie zuerst eine Kommune.
+ Potenzial anzeigen
KommuneTitelThemaBezeichnung
Bitte wenden Sie das Display für eine bessere Ansicht.
Wird geladen...
Schließen X

Was bedeutet “Potenzial anzeigen”?

Das „Potenzial“ einer Kommune zeigt die Anzahl von Musterdatensätzen, die in mindestens einer der Vergleichskommunen veröffentlicht wurden, aber noch nicht in dieser Kommune selbst. Nehmen wir das Beispiel Köln. Sie können sich in der obigen Suche alle Datensätze aus Köln anzeigen lassen. Im Datentool erscheint oben rechts nun der Button “Potenzial anzeigen”. Wenn Sie hier draufklicken, sehen Sie zum einen, welche Musterdatensätze Köln bereits veröffentlicht hat. Zum anderen können Sie sehen, welches Potenzial zur Veröffentlichung an Datensätzen Köln noch hat. Bezugspunkt zur Berechnung des Potenzials einer Kommune ist die Gesamtheit der Musterdatensätze aller Kommunen.

Was ist der Musterdatenkatalog?

Fragen & Antworten

Was ist ein Musterdatensatz?

Bei der Vergleichbarkeit von Datensätzen der Kommunen gibt es zwei Herausforderungen. Einerseits gibt es sehr unterschiedliche Bezeichnungen für Datensätze, die eigentlich ähnlich sind. Zur Veranschaulichung hier ein Beispiel öffentlicher Toiletten:

Bonn: „Stadt Bonn: Standorte öffentlicher Toiletten“
Köln: „Stadt Köln: Oeffentliche Toiletten Koeln“
Düsseldorf: „Standorte öffentlicher Toiletten Düsseldorf“
Moers: „Stadt Moers: Öffentliche Toiletten in Moers mit Hinweisen für Menschen mit Behinderung“

Die individuellen Bezeichnungen erzeugen nicht nur das Problem, dass gleiche Datensätze unterschiedlich bezeichnet werden, sondern es kann andererseits mitunter vorkommen, dass die Bedeutung der Datensätze über die Bezeichnung nicht immer leicht verständlich ist.

Der Musterdatenkatalog soll bisherige Ordnungskriterien nicht ersetzen oder einheitliche Datensatzbezeichnungen in der Verwaltung vorschreiben. Vielmehr soll ein „Musterdatensatz“ ein zusätzliches Ordnungskriterium einführen, das die Vergleichbarkeit zwischen den Kommunen verbessert. Zur Veranschaulichung dient erneut das Beispiel „öffentliche Toiletten“. Der Musterdatensatz lautet: „Gesundheit– Öffentliche Toilette“.

Warum werden mir in manchen Musterdatensätzen auch Datensätze angezeigt, die eigentlich nicht dort hineingehören?

Der bundesweite Musterdatenkatalog wird automatisiert mit einem Algorithmus erstellt. Dieser ordnet die offenen Daten in die Musterdatensätze ein. Wir haben den Algorithmus umfangreich trainiert, aber eine hundertprozentige Zuordnung aller Datensätze kann so nicht gelingen. 

Bei sehr vielen Datensätzen sind die Metadaten nur unzureichend beschrieben. Es gibt teilweise unklare Titel oder fehlende Beschreibungen. Ein Beispiel eines Bebauungsplans aus Rheinland-Pfalz: Titel: „E1“; Beschreibung: „Mörlheim, An den Herrenäckern“.

In manchen Musterdatensätzen gibt es nur wenige Datensätze. Auf dieser dünnen Datenbasis fällt es dem Algorithmus schwer, zu lernen.

Der Vorgänger des bundesweiten Musterdatenkatalogs, der NRW-Katalog, wurde mit seinen rund 2.500 Datensätzen manuell zugeordnet. Und selbst bei einer manuellen Zuordnung gibt es gelegentlich Fehler. Auch ein Algorithmus funktioniert nicht perfekt.

Mit einer breiteren Datenbasis wird der Algorithmus sich kontinuierlich verbessern. Außerdem hoffen wir, dass der Musterdatenkatalog auch einen Impuls setzen kann, damit Kommunen ihre Metadaten besser und eindeutiger beschreiben.

Wird der Musterdatenkatalog automatisch aktualisiert, sobald eine Kommune offene Daten veröffentlicht?

Nein. Der Musterdatenkatalog kann nicht automatisch bei jeder neuen Veröffentlichung offener Datensätze aktualisiert werden. Das hat vor allem zwei Gründe:

  1. Es gibt technisch bisher keine Lösung mit geringem Aufwand, um automatisiert abzugleichen, welche neuen Datensätze auf GovData.de für eine Aufnahme in den Musterdatenkatalog in Frage kommen.
  2. Die Aufbereitung der heruntergeladenen Daten erzeugt Arbeitsaufwand, weil aus den beschriebenen Metadaten häufig gar nicht klar hervorgeht, welche Kommune einen Datensatz zur Verfügung gestellt hat.

Eine Aktualisierung wird von der Bertelsmann Stiftung in Auftrag gegeben und zweimal pro Jahr durchgeführt.

Warum fehlen im Musterdatenkatalog manche Kommunen, die bereits offene Daten veröffentlichen?

Im Musterdatenkatalog führen wir offene Daten zusammen, die im Portal GovData.de abrufbar sind. Manche Bundesländer haben jedoch noch kein Open-Data-Portal, das Metadaten an GovData weiterreicht. In einigen Fällen ist GovData aber dazu übergegangen, Kommunen direkt an govdata.de anzuschließen. Diese Daten sind dann auch im Musterdatenkatalog enthalten. 

In meiner Kommune wurden bereits Datensätze veröffentlicht, die im Musterdatenkatalog nicht auftauchen. Warum?

Im Musterdatenkatalog Version 4 wurden offene Daten berücksichtigt, die bis zum Stichtag 20. August 2024 über govdata.de auffindbar waren. Daten, die nach diesem Stichtag veröffentlicht wurden, können erst nach einer weiteren Aktualisierung Eingang in den Musterdatenkatalog finden.

Zeigt der Musterdatenkatalog alle Daten an, die in einer Kommunen verfügbar sein sollten?

Nein. Der Musterdatenkatalog wurde 2019 zunächst auf Basis eines Pilotprojekts mit 1000 Datensätzen aus fünf Kommunen in Nordrhein-Westfalen entwickelt (Musterdatenkatalog 1.0). Es konnten also „nur“ Musterdatensätze auf Basis von 1000 Datensätzen gebildet werden. Es wurden im Laufe der Zeit bei Bedarf neue Musterdatensätze entwickelt. Dazu hat sich ein kleiner Arbeitskreis mit kommunalen Vertreter:innen gebildet. Auf GitHub https://github.com/bertelsmannstift/Musterdatenkatalog gibt es außerdem die Möglichkeit, neue Musterdatensätze vorzuschlagen.

Im Mai 2023 wurde die Version 4 des Musterdatenkatalogs mit einer völlig neuen Taxonomie veröffentlicht. Sie bietet eine bessere Übersicht und erleichtert dem Algorithmus eine genauere Klassifizierung der Datensätze.

Da der Musterdatenkatalog stets auf der Konsolidierung der bisher bereits veröffentlichten Daten basiert, enthält er gute Hinweise darauf, welche Art von Daten in einer Kommune typischerweise verfügbar sein müssten. Es kann aber natürlich darüber hinaus noch jede Menge weiterer Daten geben, die bisher keine der Kommunen in Deutschland veröffentlicht hat und die daher noch nicht im Musterdatenkatalog enthalten sein können.

Wer hat an der Erstellung des Musterdatenkatalogs mitgewirkt?

Der Musterdatenkatalog wurde zunächst als Prototyp im Mai 2019 veröffentlicht. Der Erstellung des Prototypen gingen drei Workshops in Köln voraus, zu denen GovData und die Bertelsmann Stiftung mehr als 20 Expert*innen aus der Open-Data-Community eingeladen haben. Die Ergebnisse der Workshops wurden in enger Abstimmung mit Vertreter*innen der Städte Bonn, Düsseldorf, Köln und Moers sowie mit dem IT-Dienstleister kdvz Rhein-Erft-Rur vertieft und mündeten in dem im Mai 2019 veröffentlichten Prototypen. Dieser bildete die Grundlage für die anschließende Entwicklung eines NRW-Musterdatenkatalogs durch die Projektpartner:innen Bertelsmann Stiftung, GovData, KDZ – Zentrum für Verwaltungsforschung und Open Knowledge Foundation Deutschland gemeinsam mit Open.NRW (Geschäftsstelle im Ministerium für Wirtschaft, Innovation, Digitalisierung und Energie des Landes Nordrhein-Westfalen). Der bundesweite Musterdatenkatalog ist eine Weiterentwicklung des Prototoypen und der NRW-Version. Die technische Umsetzung des Musterdatenkatalogs erfolgte zunächst durch Mila Frerichs (Civic Vision) und aktuell durch &effect data solutions GmbH.

Haben Sie Interesse am Open-Data-Netzwerktreffen? Melden Sie sich hier an!

Wenn Sie Interesse an einer Teilnahme an unserem Austauschformat zu Open Data in Kommunen haben, melden Sie sich bitte hier an! Sie können sich auch anmelden, wenn Sie am kommenden Termin nicht teilnehmen können. In diesem Falle nehmen wir Sie in den Verteiler für künftige Veranstaltungen auf.

Unsere Veröffentlichungen zu Open Data in Kommunen

Ansprechpartner