COVID-19: het interpreteren van getallen in context

Loek Gerrits
VantageAI
Published in
6 min readMar 26, 2020

Een korte blog over hoe cijfers in perspectief gezien moeten worden wanneer deze de revue passeren in de media.

De afgelopen weken krijg je de ene pop-up melding na de andere met nieuwe cijfers over het COVID-19 virus. Er worden veel berichten op social media gedeeld met tabellen en adviezen van virologen zijn ook niet altijd eenduidend.

Het opvallende is dat iedereen die cijfers ziet of hoort, deze gaat interpreteren op zijn eigen manier. Maar waar moet men op letten als je zo’n bericht of tabel voor je neus krijgt? In dit blog zal ik jullie, aan de hand van een aantal voorbeelden, de nodige handvaten geven om in de komende periode kritische vragen te stellen over de cijfers die verschijnen en op die manier dezelfde cijfers beter in context te plaatsen.

Analyseer de tabel

De onderstaande tabel werd de laatste weken vaak gedeeld via social media. De hamvraag is natuurlijk: kunnen we de situatie met betrekking tot het COVID-19 virus in Nederland vergelijken met die van Italië op basis van deze tabel? Om deze vraag te beantwoorden moeten we nagaan wat we precies zien.

Tabel 1: veel gedeelde tabel op social media om Italië en Nederland te vergelijken.
  • Bron

Gelukkig staat bij deze tabel een bron. Belangrijk is om deze te verifiëren als je data interpreteert. Als de gegevens niet betrouwbaar zijn, kunnen de conclusies die je trekt onjuist zijn. In Nederland is een betrouwbare bron het Rijksinstituut voor Volksgezondheid en Milieu (RIVM) en wereldwijd de World Health Organization (WHO). Uit nader onderzoek blijkt dat Worldometers, de bron van deze tabel, gebruikt maakt van de WHO data en regelmatig wordt geraadpleegd voor wetenschappelijke artikelen.

  • Besmettingen

De tabel heeft voor elk land drie kolommen: de besmettingen, doden en datum. Onze eerste focus gaat uit naar de kolom besmettingen. Zijn dit nieuwe patiënten per dag of zijn ze geaccumuleerd (de som tot die dag)? Daarnaast is het ook bekend dat mensen genezen. Wordt dit feit in de tabel meegenomen of niet?

Na het zelf gecontroleerd te hebben gaat het hier om het geaccumuleerde aantal besmettingen waarbij de genezen patiënten niet worden meegenomen. Dit betekent dat het aantal actieve besmettingen op elke datum in beide landen lager ligt.

Een andere vraag luidt: hoe betrouwbaar is het getal besmettingen in het algemeen? Er zijn testen die een besmetting met COVID-19 aantonen, maar lang niet iedereen in Nederland wordt getest dus zal het werkelijke aantal hoger liggen (maar hoe hoog?). Hoe zit dit in Italië? Het is bekend dat er in Duitsland en Zuid-Korea veel meer wordt getest, waardoor het aantal besmettingen daar vele malen hoger ligt. De aanname dat er in Nederland en Italië evenveel getest wordt is van cruciaal belang om het aantal besmettingen tussen die landen te kunnen vergelijken.

Tenslotte bestaat er bij medische testen altijd de kans dat een resultaat False-Positive of False-Negative is. Dit betekent dat er gevallen zijn waarbij patiënten onterecht gediagnosticeerd worden met het virus en aan de andere kant patiënten die het bij zich dragen naar huis worden gestuurd met de boodschap dat ze het virus niet hebben.

  • Sterfte

Het aantal doden staat ook niet op zichzelf. In het begin zal het aantal doden door COVID-19 accuraat zijn. Echter, in Italië is de gezondheidszorg inmiddels overbelast en waarschijnlijk gaat dit ook in Nederland gebeuren. Dit veroorzaakt ook een groot aantal indirecte doden als gevolg van het virus. Stel je krijgt een auto-ongeluk en de ambulance is niet snel genoeg ter plaatse of je hebt een hartaanval gehad maar er is geen plek meer op de IC. Zijn dit ook doden die je mee moet nemen in het getal?

Bovendien hangt het sterftecijfer per land ook af van hoe deze de boeken in gaat. Als een patiënt op de IC ligt als gevolg van COVID-19 en als complicatie krijgt deze persoon een hartaanval, wordt deze dan meegenomen in het COVID-19 dodenaantal of niet?

  • Datum

De datum lijkt in eerste instantie erg onschuldig in zo’n tabel, maar niks is minder waar. Waarom wordt er bij 16 maart gestart in Nederland? Waarom beginnen we niet bij de datum waar de eerste overledene werd geregistreerd? En welke resulterende tabel krijgen we wanneer niet de eerste sterfte als startdatum wordt genomen maar de 100ste besmetting? In Figuur 1 zie je drie tabellen die deze verschillende startdatums in ogenschouw nemen en op basis hiervan zou je bij elke afzonderlijke tabel een andere conclusie kunnen trekken.

Figuur 1: drie verschillende tabellen met een andere startdatum en de verschillende conclusies die hieruit getrokken kunnen worden. Bron: https://www.ad.nl/binnenland/staatje-met-cijfers-van-nederland-en-italie-wat-zeggen-kenners-erover~a2665ea2/
  • Absolute getallen

De media is gek op absolute cijfers en het liefst brengen ze dit terug tot een zo overzichtelijk mogelijk aantal. Echter, in veel gevallen is het beter om iets in een relatieve context te plaatsen. Vraag jezelf af of het aantal doden per inwoner niet een meer waardevolle betekenis heeft. Vallen deze cijfers dan niet beter uit voor Italië omdat de populatie circa 3 keer zo groot is?

En wat als we deze getallen in de tabel opsplitsen naar leeftijd, wat positief samenhangt met sterfte? Italië heeft een gemiddeld hogere leeftijd dan Nederland (zie Figuur 2), maar wat is het relatieve verschil in sterftecijfer in een bepaalde leeftijdscategorie tussen deze twee landen?

Figuur 2: de mediaan van de leeftijd over de laatste jaren van Italië en Nederland. Note: 2015 is het meest recente jaar beschikbaar. Bron: https://ourworldindata.org/age-structure
  • Overige factoren

Tenslotte zijn er nog tal van andere elementen die een rol spelen bij het interpreteren van deze getallen. Ten eerste verschillen de maatregelen van land tot land en zit er een vertraging van het effect in deze maatregelen. Zo besloot Italië op 4 maart de scholen te sluiten¹, waar Nederland dit deed op 15 maart². Wanneer de aanname wordt gemaakt dat zo’n maatregel bijdraagt aan het indammen van de verspreiding, resulteert dit in een andere trend in de toekomst dan Italië.

Daarnaast zal de populatiedichtheid ook een effect hebben op de verspreiding van het virus. Hoe dichter mensen bij elkaar wonen, hoe makkelijker het virus verspreid. Nederland had in 2018 een bevolkingsdichtheid van 511 mensen per km² en in Italië was dit slechts 205³.

Tenslotte verschillen Nederland en Italië enorm in cultuur en zorgsysteem. Zo blijkt dat in Italië het gebruikelijk is om bij een kind te gaan wonen als (alleenstaande) bejaarde. In Nederland blijven deze mensen ofwel op zichzelf wonen dan wel naar een verpleeghuis gebracht⁴. Hierdoor kan geredeneerd worden dat het in Nederland makkelijker is om de ouderen te isoleren, wat ervoor zorgt dat het sterftecijfer in Nederland makkelijker te controleren is dan in Italië doordat het sterftecijfer samenhangt met leeftijd.

Conclusie

Wees kritisch en hou vast aan de onderstaande punten:

  • Check en valideer de bron.
  • Stel kritische vragen over de definitie van de eenheid (besmetting, sterfte, datum).
  • Probeer het absolute getal in relatieve context te plaatsen.
  • Denk aan overige factoren die van invloed zijn, zeker bij het vergelijken tussen landen.

Vanuit hier kan men zijn eigen conclusies trekken en meningen vormen over de, toch wel op het oog, oppervlakkige cijfers die verschijnen met betrekking tot COVID-19. En stel jezelf nu opnieuw de vraag: kunnen we de situatie met betrekking tot het COVID-19 virus in Nederland vergelijken met die van Italië op basis van deze tabel? Naar mijn mening kan op basis van een simpele tabel de vergelijking tussen landen niet gemaakt worden omdat vele factoren in acht genomen moeten worden.

  1. https://www.bbc.com/news/world-europe-51743697
  2. https://www.rijksoverheid.nl/actueel/nieuws/2020/03/15/aanvullende-maatregelen-onderwijs-horeca-sport
  3. https://data.worldbank.org/indicator/EN.POP.DNST
  4. De Jong Gierveld, J., & Van Tilburg, T. (1999). Living arrangements of older adults in the Netherlands and Italy: Coresidence values and behaviour and their consequences for loneliness. Journal of cross-cultural gerontology, 14(1), 1–24.

Dank gaat uit naar Lieke Kools, Rik Kraan and Guido Tournois voor het reviewen van dit blog.

--

--