Das Open Data-Portal ist seit 2011 online und macht die Datenbestände der Berliner Verwaltung für die Öffentlichkeit auffindbar. Unter dem Punkt Datensätze auf dem Open Data-Portal befinden sich alle derzeit verzeichneten 2972 Datensätze. Die Datensätze sind zum einen in 22 Kategorien angeordnet, zum anderen aber auch über Tags zu finden.
Das Open Data-Portal besteht aus zwei Teilen:
Es gibt das öffentlich sichtbare eigentliche Portal. Dieses Portal wird von Nutzerinnen und Nutzern für die Suche und das Browsen im Inhalt des Datenportals genutzt. Jeder Datensatz hat eine Detailseite, die im Browser angesehen werden kann und von der aus die Datenressourcen verlinkt sind. Die Zielgruppe des Open-Data-Portals ist offen gehalten und umfasst Zivilgesellschaft, Presse und Wirtschaft, aber auch die Verwaltung selbst.
Parallel existiert das nicht-öffentliche Datenregister. Bei diesem handelt es sich gewissermaßen um das Redaktionssystem des Datenportals, über das Verwaltungsmitarbeiterinnen und -mitarbeiter Datensätze einstellen oder ändern können. Voraussetzung für die Nutzung des Datenregisters ist ein Benutzerinnen- bzw. Benutzerkonto. Dieses können Verwaltungsmitarbeiterinnen und -mitarbeiter per E-Mail beantragen und aktivieren lassen.
Was ist ein Datensatz?
Jede Datenressource (Dateien, Datenbanken etc.) wird durch eine Reihe von Metadaten (Titel, Beschreibung, geografischer und zeitlicher Bezug etc.) beschrieben. Datenressource und Metadaten bilden jeweils gemeinsam einen Datensatz, der im Datenportal seine eigene Seite und URL erhält.
Welche Datenarten und Themenfelder gib es?
Beispiele Datenarten:
Statistiken, Geodaten (Karten & Sachdaten), Haushaltspläne u.ä., Amtsblätter, Satzungen & Richtlinien, Bestimmte Gutachten & Studien, Messergebnisse
Beispiele Themenfelder:
Bevölkerung & Gesellschaft, Arbeit (Tarife, Arbeitslosigkeit etc.),Bildung, Kultur, Sport, Energie, Entsorgung, Justiz, Wissenschaft & Technologie, Jugend & Familie, Gesundheit & Pflege, Gleichstellung, Integration, Infrastruktur, Kontrolle (Gewässer, Lebensmittel etc.), Kriminalität, Soziales, Stadtplanung, Umweltdaten, Veranstaltungen, Verkehr, Wirtschaft, Wohnen, Finanzen
Was zeichnet gute Open Data Formate aus?
1. Maschinenlesbarkeit ist das wichtigste Kriterium bei der Wahl eines Daten- bzw. Dateiformats. Formate gelten dann als maschinenlesbar (auch: strukturiert), wenn sie die softwaregestützte Erkennung und Verarbeitung von Daten erlauben. Tabellarische Daten zum Beispiel sind zwar im PDF gut für Menschen lesbar, jedoch für Maschinen schwierig zu interpretieren.
2. Standardisierung: Neben der Maschinenlesbarkeit ist die Standardisierung eines Formats ein wichtiges Kriterium: Das Format sollte nach Möglichkeit in Form eines offen und unentgeltlich nutzbaren Standards präzise definiert und dokumentiert sein. Das Vorhandensein eines offenen Standards garantiert, dass Daten in diesem Format jederzeit und von jedem korrekt verarbeitet werden können.
3. Offenheit: Schließlich hat die Offenheit eines Formats großes Gewicht. Statt eines proprietären Formats sollte nach Möglichkeit immer ein offenes gewählt werden, um die Verarbeitung der Daten nicht zu erschweren.
Welche Formate kann ich für meine Datensätze nutzen?
- Tabellen im CSV Format (mit Einschränkungen auch Exel bzw. OpenDocument-Formate)
- Baumstrukturen ( z.B. hierarchische Daten) im JSON und XML Format Netzwerkstrukturen (Graphstruktur) im RDF Format
- Generische Formate, wie die hier aufgelisteten, können grundsätzlich für jede Art von Daten genutzt werden: Alles lässt sich irgendwie als Tabelle, Baum oder Graph abbilden.
Welche Metadaten sind für Open Data relevant?
Nicht alle Metadatenfelder kommen bei allen Veröffentlichungswegen zum Einsatz; einige kommen etwa nur bei der direkten Nutzung des Datenregisters vor.
- Titel
- Art
- Kategorie
- Veröffentlichende Stelle
- Kontaktperson
- Kontakt E-Mail
- Webadresse
- Beschreibung
- Lizenz
- Tags
- Text für Namensnennung
- Veröffentlichungsdatum
- Aktualisierungsdatum
- Zeitliche Auflösung
- Zeitliche Abdeckung
- Geographische Auflösung
- Organisation
- Sichtbarkeit
- Geographische Abdeckung