Mitä mallit voivat ja eivät voi kertoa meille COVID-19:stä?

PNAS-tiedelehdessä ilmestynyt mielipidekirjoitus

Thomas Brand
Brandin kirjasto
8 min readJun 30, 2020

--

Lue myös aiempi suomennettu versio artikkelista.

Alexander F. Siegenfeld (vas.), Nassim N. Taleb (oik. ylh.) ja Yaneer Bar-Yam (oik. alh.)

Uuden koronaviruksen, äkillinen vakava hengitystieoireyhtymä koronavirus 2:n (SARS-CoV-2) aiheuttama koronavirustauti 2019 (COVID-19) -pandemia on vaatinut jo yli 470 000 kuolemantapausta maailmanlaajuisesti tätä kirjoitettaessa [1] ja tulee todennäköisesti tappamaan monia muita ihmisiä. Mallit voivat auttaa meitä määrittämään, miten viruksen leviäminen voidaan pysäyttää.

Mutta on tärkeää erottaa toisistaan se, mitä mallit voivat ja eivät voi ennustaa. Kaikkien mallien oletukset eivät kuvaa useimpien reaalimaailman järjestelmien yksityiskohtia. Näillä järjestelmillä voi kuitenkin olla laajamittaisia käyttäytymistapoja, jotka eivät riipu kaikista näistä yksityiskohdista [2]. Yksinkertainen malli, joka kuvaa oikein nämä laajamittaiset käyttäytymistavat, mutta jossa tietyt yksityiskohdat ovat väärin, on hyödyllinen; monimutkainen malli, joka onnistuu kuvamaan tietyt yksityiskohdat oikein, mutta laajamittainen käyttäytyminen on kuvattu virheellisesti, on parhaimmillaan harhaanjohtava. Mallin yksityiskohtien tarkkuudella ja hienostuneisuudella on merkitystä vain siinä tapauksessa, jos mallin yleiset oletukset kuvaavat oikein kiinnostukseen kohteena olevia reaalimaailman käyttäytymistapoja.

Kaoottiset järjestelmät, kuten pandemiat, ovat pohjimmiltaan arvaamattomia. Tieteen rakentavana roolina on tunnistaa interventiot — mukaan lukien turvavälit, maskien käyttö, eristämistoimet ja matkustusrajoitukset — jotka tukevat aktiivisten tartuntamäärien eksponentiaalista vähentämistä. Kuvalähde: Shutterstock/Travelerpix

Mallien vahvuuksien ja puutteiden huolellinen rajaaminen ei vain selvennä sitä, miten mallit voivat olla avuksi, vaan lisäksi se saattaa saada politiikantekijät ja kansalaiset ajattelemaan maltillisemmin, kun he haluavat ymmärtää viruksen täydet vaikutukset tulevina viikkoina ja kuukausina. Vielä ennustettakin tärkeämpää on mallien kyky ohjata toimintaa, jotka voivat muuttaa tätä vaikutusta, mukaan lukien toimet, jotka voivat mahdollisesti johtaa viruksen tukahtumiseen.

Mallin kyvykkyys

Joskus on tärkeämpää ymmärtää, mitä mallit eivät voi ennustaa kuin ymmärtää se, mitä ne voivat ennustaa. Esimerkiksi kaoottisessa järjestelmässä, kuten säätilassa, vain hyvin lyhyen aikavälin ennusteet voivat olla tarkkoja; pienet muutokset nykyhetkessä voivat johtaa hyvin suuriin muutoksiin tulevaisuudessa. Sama pätee pandemian kehityskaareen: koska tartuntatapauksien määrä riippuu eksponentiaalisesti epidemian kasvunopeudesta, pienet epätarkkuudet kasvuvauhdin ennustamisessa johtavat suuriin muutoksiin kuolemantapauksien lukumäärässä riittävän ajan kuluttua. Lisäksi epidemian kasvu- tai tukahtumisnopeus riippuu interventioiden täsmällisistä torjuntatoimien täytäntöönpanon yksityiskohdista, hyvin pieni muutos interventioiden voimakkuudessa saattaa olla merkityksellinen kahden hyvin erilaisen lopputuloksen saavuttamisen kannalta: eksponentiaalinen kasvu verrattuna eksponentiaaliseen tukahtumiseen. Epidemian kehityskaaren ymmärtäminen on tärkeää. Mutta ottaen huomioon taudista ja sosiaalisesta dynamiikasta johtuvat huomattava epävarmuus — puhumattakaan interventioiden toteuttamiseen liittyvästä epävarmuudesta — yksityiskohtaiset mallien tarkennukset luovat usein harhaanjohtavan varmuuden ja tarkkuuden tunteen.

Yleisemmin mallien yksityiskohtiin takertuminen on turhaa, jos saavutettu tarkkuus hukkuu mittaustulosten epävarmuuteen tai mallin ydinoletuksien epätarkkuuteen. Mitä järkeä on tarkentaa mallia 10 prosentilla, jos 50 prosenttia mallin epävarmuudesta johtuu mallin muista näkökohdista tai oletuksista. Mitä hyötyä on mallin hienostuneesta säätämisestä, jos mallinnetussa järjestelmässä on merkityksellistä laajamittaista käyttäytymistä, jota malli ei kykene lainkaan käsittelemään?

Mallit, jotka yrittävät vangita järjestelmän pienimuotoisen yksityiskohtaisen käyttäytymisen (esim. viite [3]), sisältävät väistämättä joitakin yksityiskohtia ja toiset jätetään huomioimatta. Riippuen siitä, millaiset yksityiskohdat on sisällytetty malliin, tällaiset mallit saattavat johtaa virheelliseen kuvaan järjestelmän laajamittaisesta käyttäytymisestä. Tällaisten mallien toimivuus johtuu usein siitä, että niiden erityiset oletukset ovat tietyn yksinkertaisemman, yleisemmän mallin erityistapaus. Näin ollen joskus on niin, että järjestelmän laajamittaisen käyttäytymisen ymmärtämiseksi tehokkaimpia eivät ole monimutkaiset, vaan petollisen yksinkertaiset mallit.

Vaihemuunnos

Koronavirustaudin eli COVID-19:n tapauksessa yksi laajamittainen käyttäytymisen muoto on tartuntatapauksien eksponentiaalinen kasvu interventioiden puuttuessa (ellei tartunnan saaneiden ihmisten lukumäärä lähesty kylläisyyspistettä). Tarkka kasvunopeus riippuu sijainnista ja taudin leviämisen tarkoista yksityiskohdista. Interventiot voivat muuttaa tätä kasvuvauhtia. Ja ankarat interventiot, kuten sulku- ja lukitustoimet, voivat johtaa eksponentiaalisen kasvun sijaan eksponentiaaliseen tukahtumiseen.

Toinen laajamittaisen käyttäytymisen muoto on se, että tartunnat tapahtuvat pääasiassa paikallisesti. Matkustaminen luo kuitenkin mahdollisuuden pitkän kantaman leviämiselle. Tartuntojen määrä ei muutu tasaisesti kaikkialla maailmassa, vaan pikemminkin enemmän tai vähemmän itsenäisesti kullakin alueella. Todennäköisyys, että tauti leviää alueelta toiselle, riippuu infektioiden lukumäärästä ensimmäisellä alueella ja tartuntataudin siirtymisnopeudesta ensimmäiseltä alueelta toiselle tartunnan saaneiden yksilöiden mukana. Taudin leviämisprosessissa on lukuisia pieniä yksityiskohtia, mutta suuren mittakaavan dynamiikkaa näyttää kuvaavan alueen sisäinen lisääntymis- tai tukahtumisluku ja alueiden väliset leviämisnopeudet (molemmat saattavat muuttua ajan kuluessa interventioiden, kylläisyysvaikutusten tai muiden ulkoisten olosuhteiden vaihtelujen vuoksi).

Kuvio 1. Maantieteellisten alueiden joukko voi olla yhdessä kahdesta vaiheesta suhteessa koronavirustautiin. Vakaassa vaiheessa tauti sammuu ajan myötä, kun taas epävakaassa vaiheessa tartunnat kasvavat eksponentiaalisesti vain populaation koon rajoittamana. Se, missä tilanteessa alueiden joukko on, riippuu (1) paikallisten epidemioiden suuruudesta, mikä puolestaan riippuu (muiden tekijöiden ohella) siitä, kuinka nopeasti alueet ryhtyvät toimiin, jos uusi epidemia havaitaan ja (2) matkustukseen liittyvän leviämisen nopeudesta alueiden välillä (4–6)

Näiden parametrien dynamiikasta riippuen alueiden joukko voi olla yhdessä kahdesta vaiheesta: vakaassa vaiheessa, jossa taudin dynamiikalla on taipumus ajautua kohti vakaata kiinteää eliminointipistettä (toisin sanoen alueiden joukossa ei ole tartunnan saaneita alueita) tai epävakaassa vaiheessa, jossa tartunnan saaneiden alueiden lukumäärä kasvaa, kunnes kylläisyyspiste saavutetaan (katso Kuvio 1).* Jotta alueiden joukko olisi vakaassa vaiheessa, alueiden ei tarvitse olla jatkuvassa sulku- ja lukitustilassa viruksen tukahduttua, vaan kunkin alueen on ainoastaan oltava valmis panemaan toimet ankarat rajoitustoimet siinä tapauksessa, että ilmenee toinen hallitsematon taudin leviäminen [6]. Jos virus tulee jostain muualta tai se ilmenee uudelleen epävakaassa tilassa olevien alueiden keskuudessa, tartunnan saaneiden alueiden lukumäärä kasvaa eksponentiaalisesti. Mutta jos virus tulee jostain muualta tai se ilmenee uudelleen vakaassa tilassa olevien alueiden keskuudessa, alueet kykenevät palaamaan koronavirusvapaaseen tilaan.

Virheellinen mallintaminen

Jos järjestelmän laajamittaiset käyttäytymistavat on kuvattu oikein, erilaiset yksityiskohdat voidaan ymmärtää niiden näihin laajamittaisiin käyttäytymistapoihin kohdistuvien vaikutusten perusteella. Mutta jos mallin oletukset eivät synnytä mallinnettavalle järjestelmälle tyypillisiä laajamittaisia käyttäytymismalleja, ylimääräisten yksityiskohtien lisääminen malliin synnyttää vain valheellista luottamuksen tunnetta.

Esimerkiksi mallit, joissa käytetään jatkuvia muuttujia kuvaamaan tartunnan saaneiden henkilöiden murto-osia tai todennäköisyyksiä, voivat ennustaa, että vaikka lukitus- ja sulkutoimet voivat johtaa tartuntatapauksien eksponentiaalisen vähenemisen, uusien tartuntatapauksien lukumäärä jatkaa kasvuaan, kun sulkutoimet poistetaan. Oletus suunnilleen jatkuvasta käyttäytymisestä kuitenkin hajoaa pienten tartuntatapauksien kohdalla.

Tiedämme, että nolla tartuntatapausta ei voi alkaa kasvamaan uudelleen — ja edes harvat tartuntatapaukset eivät välttämättä lähde lisääntymään. Jos mallin lopputuloksessa esiintyy murto-osatapauksia, virhe voidaan korjata ihmisen arvostelukyvyllä (esim. tulkitsemalla murto-osatapaukset mallissa ikään kuin virus olisi todellisuudessa eliminoitu). Mutta jos nämä pienet luvut syntyvät mallin väliarvioina, malli ennustaa virheellisesti eksponentiaalisen kasvun lukitus- ja sulkutoimien poistamisen seurauksena, vaikka malli ei enää päde tämän järjestelmän tapauksessa, koska tapauksia voi tosiasiassa olla nolla.†

Tartuntatapauksien uudelleen ilmeneminen lukitus- ja sulkutoimien poistamisen jälkeen on järjestelmän mahdollinen laajamittainen käyttäytymispiirre, mutta se ei ole väistämätöntä (kuten jatkuvissa malleissa ennustetaan). Se riippuu pikemminkin toimistamme: jos riittävän vahvat interventiot viruksen eksponentiaaliseksi tuhoamiseksi pidetään voimassa riittävän kauan, virus kyetään eliminoimaan.‡

Jotkut saattavat väittää, että vaikka tartunnan saaneesta väestönosasta tulee hyvin pieni, niin jos tarkastelun kohteena oleva populaatio on kuitenkin riittävän suuri, tartuntatapauksien lukumäärä on silti riittävän suuri epidemian tarkastelemiseksi suunnilleen jatkuvana. Vaikka malleissa tarkastellaan usein koko maan väestöä, taudin leviäminen on todellisuudessa huomattavasti paikallisempaa (ja siitä voidaan tehdä entistä paikallisempaa sulku- ja lukitustoimin ja matkustusta vähentämällä). Näin ollen populaatioiden koko, joihin malleja sovelletaan, ovat paljon pienemmät kuin koko maa. Dynamiikan paikallisuus (jonka astetta voidaan lisätä matkustusrajoituksin) tekee todennäköisemmäksi, että pieni osa mallissa tartunnan saaneesta väestöstä vastaa viruksen eliminointia todellisuudessa, ja se mahdollistaa myös ankarien rajoitustoimien poistamisen alueittain sen sijaan, että niitä pidettäisiin yllä kaikilla alueilla, kunnes koko maa on vapautettu viruksesta. Tiettyjen mallien erityiset yksityiskohtaiset oletukset voivat poiketa tästä esimerkistä. Viime kädessä tärkeää on se, että kuvaavatko mallit asianmukaisesti tartuntataudin laajamittaista käyttäytymistä.

Mallintaminen politiikkatoimia varten

Lopuksi, “mitä tapahtuu?” on eri kysymys kuin “mitä meidän pitäisi tehdä?”. Koronavirustaudin tapauksessa jälkimmäiseen kysymykseen on paljon helpompi vastata kuin ensimmäiseen. Koska järjestelmän yksityiskohtia ei täysin tunneta, jälkimmäiseen kysymykseen vastaaminen edellyttää sen ymmärtämistä, miten mahdolliset toimemme vaikuttavat järjestelmän merkityksellisiin laajamittaisiin parametreihin, jotka COVID-19:n tapauksessa ovat kasvu- tai tukahtumisnopeus kullakin alueella ja todennäköisyydet taudin leviämiselle alueiden välillä.

Vaikka emme pystykään tarkasti ennustamaan yhdenkään toimenpiteen vaikutuksia, tiedämme monia interventioita, jotka vähentävät alueiden sisäistä, että niiden välillä tapahtuvaa taudin leviämistä. COVID-19:n leviämistä koskevan empiirisen ymmärryksemme ja sen tosiasian, että monet maat ovat eliminoineet tai lähes eliminoineet viruksen, vuoksi tiedämme, että tarpeeksi interventioita yhdistämällä, leviämisnopeutta voidaan riittävästi vähentää taudin eksponentiaalisen katoamisen saavuttamiseksi ja epidemian tukahduttamiseksi [7]. Tämä itsessään on yksinkertainen, mutta vahva muodollinen malli, joka kuvaa kiinnostavia laajamittaisia käyttäytymistapoja.

Kysymys taudin kehityskaaren ennustamisesta ei ole yhtä tärkeä kuin kysymykset, jotka liittyvät siihen, mikä on tarpeen (1) uusien tartuntatapauksien eksponentiaalisen vähenemisen saavuttamiseksi eksponentiaalisen kasvun sijaan ja (2) saamaan aikaan tämän uusien tartuntatapauksien vähenemisen mahdollisimman nopeasti. Yksittäisten interventioiden ennustamisessa, kuten turvavälien, maskien käytön, kotien ulkopuolelle eristämisen, testauksen/kontaktien jäljittämisen/karanteenien ja matkustusrajoituksien, ei ole järkeä. Lähtökohta on se, että jos ne otetaan käyttöön yhdessä, ne voivat johtaa viruksen eliminointiin.

Tämä ero on erityisen tärkeä, koska tutkijat tekevät usein ennusteita olettaen, että yhteiskunnat ovat haluttomia tai kykenemättömiä eliminoimaan viruksen. Se on oletus, jonka todelliset toimet ja saavutetut tulokset ovat mitätöineet sellaisissa maissa, kuten Australiassa, Belizessä, Kiinassa, Virossa, Kreikassa, Uudessa-Seelannissa, Norjassa, Slovakiassa, Sveitsissä, Thaimaassa, Vietnamissa ja monissa Yhdysvaltain osavaltiossa kuten Montanassa ja Vermontissa. Nämä alueet ottivat epidemian hallintaan, ja niissä on hyvin vähän yhteisöperäisiä tartuntoja kirjoitushetkellä [1]. Lisäksi olettamuksesta, että virusta ei kyetä voittamaan ennen rokotteen valmistumista, voi tulla itsensä toteuttava ennustus; poliittiset päättäjät eivät välttämättä ryhdy välttämättömiin toimiin, koska väitetyt tieteelliset ennusteet lannistavat heidät.

Yleisemmin mallien käyttö pandemiaan reagoidessa osoittaa merkittävän eron akateemisesti merkityksellisessä tutkimuksessa ja politiikkatoimien kannalta merkityksellisen analyysin välillä. Ensin mainitut voivat hyödyntää oletuksia ja malleja, jotka ovat luonteeltaan tutkivia. Tämä lisää tietämystämme monista olosuhteista, jotka saattavat sattua kohdalle joskus tulevaisuudessa tai jossain paikassa — tai jopa vaihtoehtoisessa todellisuudessa — mikä lisää ymmärryksemme laajuutta. Jälkimmäisenä mainitussa tapauksessa on keskityttävä vahvistettuihin oletuksiin ja reaalimaailman riskeihin, kuten datamme ja ymmärryksemme epävarmuuteen. Politiikkatoimia on ohjattava vain järkevien oletusten perustella, koska virheelliset oletukset voivat johtaa miljoonien ihmishenkien menetykseen. Sen sijaan, että olettaisimme olevan tyystin erilaisia kuin kaikki viruksen eliminoineet tai eliminaatiota lähestyvät maat (oletus, josta tulee entistä epäuskottavampi tällaisten maiden lukumäärän kasvaessa), meidän olisi sen sijaan keskityttävä siihen, kuinka voimme toistaa niiden saavuttaman yhteisen menestyksen.

Kirjoittajien huomautukset

* Yksittäisen maantieteellisen alueen sulkua voidaan analysoida kuviossa 1 esitetyllä tavalla, jos jokaista yksittäistä kotitaloutta pidetään “alueena”. Tässä tapauksessa epidemian keskimääräinen koko olisi kotitaloudessa olevien niiden yksilöiden lukumäärä, joiden odotetaan saavan koronavirustartunta, kun yksi henkilö kotitaloudessa on sairastunut. Taudin leviäminen “alueiden” välillä vastaa todennäköisyyttä, että tartunnan saanut yksi kotitalouden jäsen tartuttaa jonkun toisessa kotitaloudessa asuvan yksilön. Sulkutoimien ensisijaisena tavoitteena on hallita tätä todennäköisyyttä.

† Virus saattaa edelleen saapua takaisin jostain muualta, mutta jos eliminaatio on alueiden joukon kesken kiinteä piste (Kuvio 1), tartunnoista vapaiden alueiden lukumäärä laskee nollaan ajan myötä.

‡ Viruksen eliminointia voidaan nopeuttaa testaamalla, jäljittämällä ja karanteenilla, mistä saattaa tulla toteuttamiskelpoisempaa ja/tai tehokkaampaa, kun tartuntojen määrää on riittävästi vähennetty.

Viitteet

[1] Johns Hopkins Center for Systems Science and Engineering, COVID-19 dashboard. Luettu 17.6.2020.

[2] Y. Bar-Yam, From big data to important information. Complexity 21 (S2), 73–98 (2016).

[3] N. M. Ferguson ym., Impact of non-pharmaceutical interventions (NPIs) to reduce COVID-19 mortality and healthcare demand. Imperial College COVID-19 Response Team (2020).

[4] F. Ball, D. Mollison, G. Scalia-Tomba, Epidemics with two levels of mixing. Ann. Appl. Probab. 7, 46–89 (1997).

[5] V. Colizza, A. Vespignani, Invasion threshold in heterogeneous metapopulation networks. Phys. Rev. Lett. 99, 148701 (2007).

[6] A. F. Siegenfeld, Y. Bar-Yam, Eliminating COVID-19: The impact of travel and timing. arXiv:2003.10086 (2020). [Suomennettu versio]

[7] H. V. Fineberg, Ten weeks to crush the curve. N. Engl. J. Med. 382, e37 (2020). [Suomennettu versio]

Suomennos Alexander F. Siegenfeldin (Twitter), Nassim Nicholas Talebin (Twitter) ja Yaneer Bar-Yamin (Twitter) mielipidekirjoituksesta “What models can and cannot tell us about COVID-19,”. Mielipidekirjoitus ilmestyi PNAS-tiedelehdessä 24.6.2020.

Alexander F. Siegenfeld on väitöskirjaopiskelija MIT Media Labissa. Hän tutkii poliittista polarisaatiota matemaattisin menetelmin. Hän on erikoistunut fysiikan, matematiikan, valtiotieteen ja taloustieteen tarjoamiin menetelmiin muun muassa vaalien, äänestämisen ja talouskasvun tutkimuksessa. Siegenfeld toimii lisäksi New England Complex Systems Instituten tutkijana.

Nassim Nicholas Taleb on tunnettu amerikkalainen matemaatikko ja tilastotieteilijä, joka on tunnettu lukuisista kirjoistaan ja artikkeleistaan.

Yaneer Bar-Yam on fyysikko, järjestelmätieteilijä ja New England Complex Systems Instituten perustaja. Hän on erikoistunut monimutkaisten järjestelmien tutkimukseen ja tehnyt tutkimusta lukuisilla eri tieteenaloilla aina materiaalitieteistä neuraaliverkkoihin.

Kirjoituksen on suomentanut Thomas Brand (Twitter).

--

--

Thomas Brand
Brandin kirjasto

Curious observer. Interested in economics, fintech, Bitcoin, philosophy, strategy, innovation & existential risks.