Blick auf eine Fußgängerzone. Links und rechts Geschäfte. Ein paar Fußgänger unterwegs. Auf dem Bild ist noch eine Grafik mit weißen Strichen und Punkten.

Musterdatenkatalog für Kommunen

Welche offenen Daten werden von Kommunen in Deutschland veröffentlicht? Der Musterdatenkatalog verschafft einen Überblick.

 

Worum geht es?

Welche Daten werden von Kommunen als Open Data veröffentlicht? Der Musterdatenkatalog verschafft eine gute Übersicht über Open Data in Kommunen. Er umfasst alle Kommunen in Deutschland, deren offene Daten über das Datenportal für Deutschland, GovData.de, auffindbar sind.

Die Bertelsmann Stiftung hat gemeinsam mit GovData, KDZ – Zentrum für Verwaltungsforschung und der Open Knowledge Foundation Deutschland den Musterdatenkatalog entwickelt.

Der Musterdatenkatalog gibt Kommunen einen Anhaltspunkt, welche Daten sie noch als Open Data veröffentlichen könnten. Außerdem gibt er jenen Kommunen, die mit der Veröffentlichung offener Daten beginnen wollen, Orientierung. Sie können mit dem Katalog schnell in Erfahrung bringen, welche Daten von anderen Kommunen als Open Data veröffentlicht werden. Auf diese Weise kann ein Musterdatenkatalog auch Initialzündung für die Öffnung von kommunalen Daten sein. Auch weitere Personen wie Datenjournalist:innen oder Entwickler:innen können sich mit Hilfe des Musterdatenkatalogs einen besseren Überblick über Open Data verschaffen.

Die Nutzung des Musterdatenkatalogs für Kommunen wird im Konventionenhandbuch von DCAT-AP.de empfohlen. Der Verweis auf die Musterdatensätze erfolgt durch eine URI, die auf dieser Seite alle aufgelistet sind.

Der Musterdatenkatalog ist veröffentlicht unter CC0.

Musterdatenkatalog: Suchen Sie nach Open Data in Kommunen

Starten Sie Ihre Suche nach…

0

Datensätze
Um Potenziale anzuzeigen wählen Sie zuerst eine Kommune.
+ Potenzial anzeigen
KommuneTitelThemaBezeichnung
Bitte wenden Sie das Display für eine bessere Ansicht.
Wird geladen...
Schließen X

Was bedeutet “Potenzial anzeigen”?

Das „Potenzial“ einer Kommune zeigt die Anzahl von Musterdatensätzen, die in mindestens einer der Vergleichskommunen veröffentlicht wurden, aber noch nicht in dieser Kommune selbst. Nehmen wir das Beispiel Köln. Sie können sich in der obigen Suche alle Datensätze aus Köln anzeigen lassen. Im Datentool erscheint oben rechts nun der Button “Potenzial anzeigen”. Wenn Sie hier draufklicken, sehen Sie zum einen, welche Musterdatensätze Köln bereits veröffentlicht hat. Zum anderen können Sie sehen, welches Potenzial zur Veröffentlichung an Datensätzen Köln noch hat. Bezugspunkt zur Berechnung des Potenzials einer Kommune ist die Gesamtheit der Musterdatensätze aller Kommunen.

Was ist der Musterdatenkatalog?

Fragen & Antworten

Was ist ein Musterdatensatz?

Bei der Vergleichbarkeit von Datensätzen der Kommunen gibt es zwei Herausforderungen. Einerseits gibt es sehr unterschiedliche Bezeichnungen für Datensätze, die eigentlich ähnlich sind. Zur Veranschaulichung hier ein Beispiel öffentlicher Toiletten:

Bonn: „Stadt Bonn: Standorte öffentlicher Toiletten“
Köln: „Stadt Köln: Oeffentliche Toiletten Koeln“
Düsseldorf: „Standorte öffentlicher Toiletten Düsseldorf“
Moers: „Stadt Moers: Öffentliche Toiletten in Moers mit Hinweisen für Menschen mit Behinderung“

Die individuellen Bezeichnungen erzeugen nicht nur das Problem, dass gleiche Datensätze unterschiedlich bezeichnet werden, sondern es kann andererseits mitunter vorkommen, dass die Bedeutung der Datensätze über die Bezeichnung nicht immer leicht verständlich ist.

Der Musterdatenkatalog soll bisherige Ordnungskriterien nicht ersetzen oder einheitliche Datensatzbezeichnungen in der Verwaltung vorschreiben. Vielmehr soll ein „Musterdatensatz“ ein zusätzliches Ordnungskriterium einführen, das die Vergleichbarkeit zwischen den Kommunen verbessert. Zur Veranschaulichung dient erneut das Beispiel „öffentliche Toiletten“. Der Musterdatensatz lautet: „Infrastruktur – Öffentliche Toiletten“.

Warum werden mir in manchen Musterdatensätzen auch Datensätze angezeigt, die eigentlich nicht dort hineingehören?

Der bundesweite Musterdatenkatalog wird automatisiert mit einem Algorithmus erstellt. Dieser ordnet die offenen Daten in die Musterdatensätze ein. Wir haben den Algorithmus umfangreich trainiert, aber eine hundertprozentige Zuordnung aller Datensätze kann so nicht gelingen. Dafür gibt es vor allem drei Gründe:

  1. Bei sehr vielen Datensätzen sind die Metadaten nur unzureichend beschrieben. Es gibt teilweise unklare Titel oder fehlende Beschreibungen. Ein Beispiel eines Bebauungsplans aus Rheinland-Pfalz: Titel: „E1“; Beschreibung: „Mörlheim, An den Herrenäckern“.
  2. In manchen Musterdatensätzen gibt es nur sehr wenige Datensätze – teilweise nur ein oder zwei. Auf dieser dünnen Datenbasis fällt es dem Algorithmus sehr schwer, zu lernen.
  3. Der Vorgänger des bundesweiten Musterdatenkatalogs, der NRW-Katalog, wurde mit seinen rund 2.500 Datensätzen manuell zugeordnet. Und selbst bei einer manuellen Zuordnung gibt es gelegentlich Fehler. Auch ein Algorithmus funktioniert nicht perfekt.

Mit einer breiteren Datenbasis wird der Algorithmus sich kontinuierlich verbessern. Außerdem hoffen wir, dass der Musterdatenkatalog auch einen Impuls setzen kann, damit Kommunen ihre Metadaten besser und eindeutiger beschreiben.

Wird der Musterdatenkatalog automatisch aktualisiert, sobald eine Kommune offene Daten veröffentlicht?

Nein. Der Musterdatenkatalog kann nicht automatisch bei jeder neuen Veröffentlichung offener Datensätze aktualisiert werden. Das hat vor allem zwei Gründe:

  1. Es gibt technisch bisher keine Lösung mit geringem Aufwand, um automatisiert abzugleichen, welche neuen Datensätze auf GovData.de für eine Aufnahme in den Musterdatenkatalog in Frage kommen.
  2. Die Aufbereitung der heruntergeladenen Daten erzeugt Arbeitsaufwand, weil aus den beschriebenen Metadaten häufig gar nicht klar hervorgeht, welche Kommune einen Datensatz zur Verfügung gestellt hat.

Eine Aktualisierung wird von der Bertelsmann Stiftung in Auftrag gegeben und zweimal pro Jahr durchgeführt.

Warum fehlen im Musterdatenkatalog manche Kommunen, die bereits offene Daten veröffentlichen?

Im Musterdatenkatalog führen wir offene Daten zusammen, die im Portal GovData.de abrufbar sind. Dort sind keine kommunalen Daten aus den Bundesländern Bayern, Niedersachsen, Sachsen-Anhalt und Saarland abrufbar. Ein Abruf der Daten aus Open-Data-Landesportalen (die die meisten der genannten vier Bundesländer nicht haben) oder aus kommunalen Portalen wäre zu aufwändig. Sollten künftig die Daten aus Kommunen der vier genannten Bundesländer auf GovData verfügbar sein, werden diese auch in den Musterdatenkatalog mit aufgenommen.

In meiner Kommune wurden bereits Datensätze veröffentlicht, die im Musterdatenkatalog nicht auftauchen. Warum?

Im Musterdatenkatalog 3.1 wurden offene Daten berücksichtigt, die bis zum Stichtag 3. März 2022 auffindbar waren. Daten, die nach diesem Stichtag veröffentlicht wurden, können erst nach einer weiteren Aktualisierung Eingang in den Musterdatenkatalog finden.

Zeigt der Musterdatenkatalog alle Daten an, die in einer Kommunen verfügbar sein sollten?

Nur teilweise. Der Musterdatenkatalog wurde auf Basis eines Pilotprojekts mit 1000 Datensätzen aus fünf Kommunen in Nordrhein-Westfalen entwickelt (Musterdatenkatalog 1.0). Es konnten also „nur“ Musterdatensätze auf Basis von 1000 Datensätzen gebildet werden. Es können jedoch bei Bedarf neue Musterdatensätze entwickelt werden. Dazu hat sich ein kleiner Arbeitskreis mit kommunalen Vertreter:innen gebildet. Auf GitHub https://github.com/bertelsmannstift/Musterdatenkatalog gibt es außerdem die Möglichkeit, neue Musterdatensätze vorzuschlagen. Da der Musterdatenkatalog also auf der Konsolidierung der bisher bereits veröffentlichten Daten basiert, enthält er gute Hinweise darauf, welche Art von Daten in einer Kommune typischerweise verfügbar sein müssten. Es kann aber natürlich darüber hinaus noch jede Menge weiterer Daten geben, die bisher keine der Kommunen in Deutschland veröffentlicht hat und die daher noch nicht im Musterdatenkatalog enthalten sein können.

Wer hat an der Erstellung des Musterdatenkatalogs mitgewirkt?

Der Musterdatenkatalog wurde zunächst als Prototyp im Mai 2019 veröffentlicht. Der Erstellung des Prototypen gingen drei Workshops in Köln voraus, zu denen GovData und die Bertelsmann Stiftung mehr als 20 Expert*innen aus der Open-Data-Community eingeladen haben. Die Ergebnisse der Workshops wurden in enger Abstimmung mit Vertreter*innen der Städte Bonn, Düsseldorf, Köln und Moers sowie mit dem IT-Dienstleister kdvz Rhein-Erft-Rur vertieft und mündeten in dem im Mai 2019 veröffentlichten Prototypen. Dieser bildete die Grundlage für die anschließende Entwicklung eines NRW-Musterdatenkatalogs durch die Projektpartner:innen Bertelsmann Stiftung, GovData, KDZ – Zentrum für Verwaltungsforschung und Open Knowledge Foundation Deutschland gemeinsam mit Open.NRW (Geschäftsstelle im Ministerium für Wirtschaft, Innovation, Digitalisierung und Energie des Landes Nordrhein-Westfalen). Der bundesweite Musterdatenkatalog ist eine Weiterentwicklung des Prototoypen und der NRW-Version. Die technische Umsetzung des Musterdatenkatalogs erfolgte durch Mila Frerichs (Civic Vision).

Haben Sie Interesse am Open-Data-Netzwerktreffen? Melden Sie sich hier an!

Wenn Sie Interesse an einer Teilnahme an unserem Austauschformat zu Open Data in Kommunen haben, melden Sie sich bitte hier an! Sie können sich auch anmelden, wenn Sie am kommenden Termin nicht teilnehmen können. In diesem Falle nehmen wir Sie in den Verteiler für künftige Veranstaltungen auf.

Unsere Veröffentlichungen zu Open Data in Kommunen

Ansprechpartner