De Lijn: rijden er nu meer mensen met bus en tram dan 15 jaar geleden?

De Lijn heeft net een open dataset vrijgegeven over het aantal ritten dat gemaakt wordt met de verschillende soorten vervoersbewijzen. En alle ruwe gegevens vind je hier: http://opendata.vlaanderen.be/dataset/drmow-ind012

Ik werk hier met de dataset zoals ik ‘m op 8 augustus 2017 heb gedownload. En ik neem je mee door elke stap van de analyse. De software die ik gebruik om de data in een werkbare vorm te masseren en om grafieken te maken zijn Python, Numpy, Pandas en Matplotlib.

Eerste werk eerst: de data inladen

De Lijn levert de gegevens aan in het XML-formaat. En als we dat inlezen in met Python en er een Pandas-dataframe van maken, dan krijgen we het volgende:

Het DataFrame zoals het rechtstreeks ingelezen uit het XML-bestand. Valt niet veel mee aan te vangen, tenzij je een olifantengeheugen hebt.

De data staan in een platte lijst. 661 lijnen van cijfers over alle vervoersbewijzen, alle jaren en alle provincies vrolijk in de hutsekluts. Probeer daar maar een wijs uit te geraken.

De data leren kennen: een eerste verkenning

De gegevens worden zinvoller als je er een draaitabel uit maakt. Met een kolom per vervoersbewijs en een rij voor elk jaar. En alle gegevens van de verschillende provincies tellen we bij elkaar op, zodat we het totaalbeeld van Vlaanderen krijgen.

Draaitabel uit de gegevens van De Lijn. Veel beter! Wie vlotjes getallen van 9 cijfers kan lezen, kan er al conclusies uit trekken. Maar ik ben niet zo iemand. Jammer.

Uit deze tabel leren we al heel veel:

  • Het abonnement is in 2007 stopgezet en vervangen door de Buzzy Pass en een combinatie-abonnement met de NMBS.
  • In 2008 is De Lijn gestart met de dagpas en met sms-tickets
  • In 2016 gebeurt er iets vreemd met mobiele en sms-tickets

Voor de rest is het redelijk moeilijk om zinnige conclusies te trekken. Daarom gaan we die zwik eens in een grafiekje gooien.

Je kan al ruwe conclusies trekken op basis van deze grafiek.

We zien een groot volumeverschil tussen het aantal ritten met een abonnementsformule van De Lijn en die met een ticket. Het grootste deel van de ritten van De Lijn gebeurt met een soort van abonnement. En dus houdt het steek om de grafiek uit te splitsen tussen abonnementsformules en tickets.

De abonnementsformules van dichter bij

We gaan de volgende vervoersbewijzen eens samen in een grafiekje gooien:

  • Abonnement
  • Buzzy Pass
  • Abonnement De Lijn — NMBS
  • Omnipas, MTB en Dagpas
Ja, mannen, als je ineens een soort abonnement afschaft en vervangt door twee anderen, hoe kunnen we dan zinnige conclusies trekken?

Het is duidelijk dat in 2006 De Lijn zijn abonnement heeft afgeschaft en vervangen door 2 andere producten: Een Buzzy Pass en een combinatie-abonnement met NMBS. En in 2007 kwam de Omnipas, dagpas en MTB erbij.

We gaan de grafiek uitbreiden met de optelling van verschillende gegevens om de trend te zien van die drie vervoersbewijzen gecombineerd.

Aha, die bruine stippellijn, dat ziet er een goeie trendlijn uit!
Je ziet aan de paarse puntjeslijn dat de abonnementen in 2007 een serieuze knauw kregen door de invoer van een dagkaart. Maar als we de bruine stippellijn (optelling van alle abonnementsformules) bekijken, zien we in het totaal ongeveer een verviervoudiging van reizigers met een abonnementsformule tussen 2000 en 2010. En sinds 2010 zijn de ritten door abonnees gestagneerd.

En wat met de tickets?

Laten we nu eens de evolutie bekijken van de reizigersvolumes met een ticket-achtig vervoersbewijs. Voor het gemak reken ik daar ook de Lijn-kaarten bij.

Raar hoor, De Lijn. Het sms-ticket in 2016 ineens hernoemen naar mobiel ticket.
Je ziet aan de roze stippellijn dat het totale aantal tickets (zonder rekening te houden met derdebetalers) een licht dalende trend vertoont.

Als je daarbij rekent dat er vanaf 2015 een ernstige vermindering is van het derdebetalerssysteem, dan zie je aan de grijze puntjeslijn dat de totale tendens van ticketrijders dalend is.

En het totale verdict?

De Lijn op deze grafiek gaat eerst naar boven en dan naar beneden. ‘De Lijn’, hebdem?
De totale tendens is stijgend tot in 2010, daarna gaat het licht bergaf.

Nogal wiedes dat de curve deze vorm heeft, want de abonnementsritten stegen onafgebroken tot 2010 en bleven dan stabiel. En de ticketritten begonnen sterker te dalen vanaf 2010. Deze grafiek is daar gewoon de som van.

Verschillen per provincie

Laat ons nu nog eens de extra dimensie bekijken van de provincies.

We maken een nieuw pivot table met de reizigersaantallen per provincie (alle vervoersbewijzen bij elkaar opgeteld). En we trekken er meteen een grafiekje uit.

In Antwerpen wordt het meest met bus en tram gereden.
  • De meeste ritten gebeuren dus in de provincie Antwerpen.
  • Provincies Oost-Vlaanderen en Vlaams-Brabant zijn goed voor de helft van de ritten van Antwerpen.
  • West-Vlaanderen en Limburg zijn de provincies met de minste lijnritten.

Je zou hier ook nog kunnen nagaan waar er de meeste ritten gebeuren per inwoner van elke provincie. Antwerpen is ook de grootste provincie, dus is het logisch dat daar meer ritten gebeuren. Maar daarvoor zouden we een andere dataset bij moeten betrekken met de bevolkingsgegevens. Dat is voor later.

Welke provincie betaalt het liefst met zijn gsm?

Laten we eens de sms-tickets bekijken per provincie.

Antwerpen boven!

Okee, deze grafiek zegt dus twee keer niks. Er worden meer sms-tickets verkocht in de provincie waar het meest met de bus gereden wordt. Hallo, Kapitein Voordehand!

En dus moeten we de verhouding bekijken van sms-tickets tegenover alle ritten in de provincie.

Ah neen, Oost-Vlaanderen boven!

Kijk eens aan! Alle provincies zijn ongeveer even hip. Alleen de Oost-vlamingen steken erbovenuit. Zo mobiel en al.

Conclusies

  • Er rijden meer mensen met de bus dan 15 jaar geleden.
  • Maar er rijden minder mensen met de bus dan in 2010
  • De Lijn vervoert vooral abonnees
  • In het totaal stellen sms-tickets niet veel voor, maar de Oost-vlamingen zijn er het enthousiasts voor

Verder onderzoek

Met deze data weten we hoeveel ritten de Lijn heeft uitgevoerd voor reizigers met welk type vervoersbewijs. Dat is boeiend, maar we weten nog niet waarom. Daarvoor moeten we andere gegevens gaan betrekken, zoals:

  • de dienstregeling, want De Lijn heeft tot 2010 zijn aanbod uitgebreid en daarna weer licht teruggeschroefd. En dat komt merkwaardig overeen met de trendlijn die wij zien in aantal ritten.
  • de bevolking. Meer mensen, meer reizigers.
  • En de prijs van de abonnementen. (SPOILER ALERT. Dat heeft amper een invloed.)
En het antwoord op de vraag in de titel: ja er rijden meer mensen met bus en tram dan 15 jaar geleden.
Waarom deze post?
Ik ben een oude liefde van aan de unief weer aan het vastpakken: statistiek. Buisvak voor velen, een zeldzame onderscheiding voor mij. En dus leer ik nu opnieuw data science en statistiek. En de tools verkennen, dat leer je door te doen. Vandaar.
Ah ja, en constructieve kritiek is altijd welkom.