GTFS, NeTEx, DELFI, VDV, MDM, Mobilitybox: Eine Reise durch den Verkehrsdaten-Dschungel

Rosario Raulin
Vesputi
Published in
4 min readOct 21, 2020
Vernetzte Mobilität in Deutschland: Daten werden immer wichtiger

Dem öffentlichen Vekehr gehört die Zukunft, sagen die Einen, schon allein wegen des Klimawandels. Aber selbst große Verfechter des Individualverkehrs müssen zugeben: Eine Welt ohne Bus und Bahn ist zumindest in Deutschland kaum noch denkbar. Gerade für immer größer werdende Metropolregionen ist schon heute der öffentliche Personennahverkehr (ÖPNV) ein nicht mehr wegzudenkender Teil der Mobilitätslandschaft. Auto-, Fahrrad- und Scooter-Sharing-Angebote finden zunehmend Verbreitung und werten das Angebot enorm auf.

Immer wichtiger werden in diesem Zusammenhang die Fahrplandaten von Bus und Bahn. Viele Anwendungen basieren auf einer strukturierten Zugriffsmöglichkeit ebendieser Daten. Der Klassiker schlechthin: Wann fährt mein Zug von welchem Gleis zu meinem Reiseziel und hat er eventuell heute Verspätung? Diese Information lässt sich so in unterschiedlichsten Formen finden, z. B. an Anzeigetafeln am Bahnhof oder in Apps auf unseren Smartphones.

Nun erwarten wir ein Mindestmaß an Auskunft vom Verkehrsbetrieb selbst, doch oft liegt die Kernkompetenz dieser Unternehmen nicht in digitalen Apps. Dabei ermöglichen gerade die verschiedenartigen neuen Mobilitätsangebote zahlreiche Verbesserungen — intermodale Mobilität ist hier das Stichwort. Gemeint ist die Kombination von verschiedenen Angeboten des ÖPNV — Bus, Bahn, aber eben auch Fahrrad-, Scooter- oder Car-Sharing. Auch politisch ist Innovation in diesem Feld gewünscht und so steigt der Druck auf Mobilitätsanbieter, ihre Fahrplandaten Dritten für ebensolche und viele weitere Angebote zu öffnen.

Wer in diesem Feld mitspielen will, sollte zumindest die Technik grob kennen und die Begriff zuordnen können. GTFS, NeTEx, DELFI, VDV, MDM, Mobilitybox — die Welt der offenen (Nah-)Verkehrsdaten steckt voller Abkürzungen und verwirrender Begriffe, die zwar alle im Zusammenhang stehen, aber nur allzu leicht verliert man hier den Überblick. Versuchen wir an dieser Stelle einmal, etwas Licht ins Dunkle zu bringen und das Ganze zu ordnen.

Datenformate

Beginnen wir zunächst einmal damit, zu klären, welche Art von Daten uns in diesem Zusammenhang überhaupt interessiert. Typische Informationen, die wir für eine weitere Verarbeitung brauchen, sind:

  • Haltestellen und Gleise inklusiver ihre Positionen
  • Abfahrts-/Ankunftszeiten
  • Routen und einzelne Fahrten auf diesen Routen
  • Verkehrsbetriebe/Verbünde (d. h. Wer betreibt eine Linie überhaupt?)
  • Echtzeitinformationen über einzelne Fahrzeuge (Standort, Verspätung)
  • Ticketpreise, Tarife, Tarifzonen

Um diese Daten einer breiteren Öffentlichkeit zugänglich zu machen, haben sich über die Zeit verschiedene Datenformate etabliert, die diese Informationen (teilweise) abbilden und so standardisiert vorliegen. Gucken wir uns an dieser Stelle kurz die zwei populärsten Formate an — GTFS und NeTEx.

GTFS

GTFS ist ein ursprünglich von Google entwickeltes Dateiformat, bei dem verschiedene CSV-Tabellen in ein großes ZIP-Archiv zusammengefasst werden. Enthalten sind unter anderem Abfahrts- und Ankunftszeiten, Haltestellennamen und -positionen, Informationen zum Verkehrsbetrieb bzw. -verbund und Tarifzonen. Es existiert eine Erweiterung, um auch Echtzeitinformationen abzubilden, GTFS-realtime. GTFS hat inzwischen auch in Deutschland große Verbreitung gefunden und zählt zu den De-Facto-Standardformaten im Bereich offener Verkehrsdaten.

NeTEx

Anders als GTFS ist NeTEx ein eher politisch vorangetriebener europäischer Standard, der sich stark an deutschen VDV-Formaten orientiert. VDV ist der Verband deutscher Verkehrsunternehmen und hat eine große Bandbreite von Spezifikationen rund um Verkehrsdaten entworfen, die mit in den europäischen Standard eingeflossen sind. NeTEx basiert anders als GTFS auf XML-Dokumenten und ermöglicht ebenfalls Echtzeitinformationen. Der Standard ist sehr viel umfangreicher als GTFS und ermöglicht auch komplexere Anwendungen, die über die reine Fahrgastinformation hinausgehen.

Organisationen

Der Mobilitätssektor in Deutschland wird von vielen verschiedenen Betreibern gestaltet. Neben der technischen Standardisierung ist deshalb auch die organisatorische Koordination von großer Bedeutung. Es haben sich einige namhafte Institutionen über die Zeit herauskristallisiert, die wir uns im Folgenden kurz ansehen möchten.

DELFI e.V.

Der DELFI e.V. ist ein Verein, der sich sowohl technisch als auch organisatorisch dafür stark macht, eine elektronische Fahrgastinformation für ganz Deutschland bereitzustellen. Der Verein betreibt die Plattform „Open Data ÖPNV“, auf der er unter anderem einen GTFS- bzw. NeTEx-Datensatz für Soll-Fahrplandaten bereitstellt, der weite Teile Deutschlands abbildet. Dieser wird gelegentlich auch DELFI-Datensatz genannt. Mitglieder des Vereins sind Verkehrsbetriebe bzw. -verbünde unter Beteiligung der Länder und des Bundes.

VDV e.V.

Ein weiterer in Deutschland aktiver Verein ist der Verband Deutscher Verkehrsunternehmen, kurz VDV. Er hat circa 600 Mitglieder und besteht vor allem aus Unternehmen des ÖPNV und Eisenbahngüterverkehrs. Der VDV ist ebenfalls bekannt für zahlreiche Standards, wie weiter oben bereits erwähnt. Neben Soll- und Ist-Fahrplandaten-Schnittstellen zählt dazu unter anderem auch die „VDV-Kernapplikation“, ein Standard für elektronische Tickets. Der VDV ist außerdem sehr aktiv im europäischen Standardisierungsprozess im ÖPNV-Daten-Bereich.

Die Standardisierung und Veröffentlichung von Mobilitätsdaten macht viele neue Anwendungen denkbar, die mit proprietären Dateiformaten noch unmöglich waren. Auch die Zusammenführung von verschiedenen Datenquellen ist nun greifbar. Das ist gerade für verkehrsbetrieb- bzw. verbundübergreifende Software eine notwendig Vorausetzung.

Immer häufiger findet sich hier der Begriff der „Datendrehscheibe“. Damit wird eine Integration verschiedener Datenquellen zu einer Plattform beschrieben. Neuere Initiativen wie die MDM-Plattform des Bundesverkehrsministerium versprechen Datenlieferanten (z. B. Verkehrsbetrieben) die effektive Verteilung von Rohdaten an verschiedenste Konsumenten durch eine zentralisierte Einlieferungsstelle. Auch auf lokalerer Ebene gibt es entsprechende Initiativen, z. B. Open Data Berlin oder MobiData BW.

Von Rohdaten zur Schnittstelle

Einen etwas anderen Ansatz verfolgt die Mobilitybox: Sie vereint verschiedene Datenquellen (z.B. den DELFI-Datensatz) in einer einzigen und einfachen Schnittstelle für Anwendungsentwickler*innen, ohne dass diese ein großes Verständnis von Verkehrsdaten bzw. den dazugehörigen Formaten mitbringen müssen. Die Mobilitybox kann damit als skalierbares Standard-Backend für Mobilitätsanwendungen verwendet werden. Die Verfügbarkeit der Rohdaten in Form von GTFS, NeTEx oder über VDV-Schnittstellen ist die eine Sache, das Aufsetzen und der Betrieb eines Backend-Systems für die eigene Anwendung eine oft kostspielige und komplizierte Angelegenheit, die mit der Mobilitybox obsolet wird.

Mobilitybox: Der Connector zwischen Daten und Anwendungen

--

--