Mitä mallit voivat ja eivät voi kertoa koronavirustaudista?

Alexander F. Siegenfeldin ja Yaneer Bar-Yamin essee

Thomas Brand
Brandin kirjasto
7 min readApr 10, 2020

--

Alexander F. Siegenfeld (vas.) ja Yaneer Bar-Yam (oik.)

Uuden koronavirus SARS-CoV-2:n aiheuttama COVID-19-pandemia on jo vaatinut 75 000 ihmisen hengen maailmanlaajuisesti [1], ja jos sitä ei saada hallintaan, se tulee vaatimaan monia, paljon enemmän kuolonuhreja. Mallit voivat auttaa meitä määrittämään, miten viruksen leviäminen voidaan pysäyttää, mutta on tärkeää erottaa toisistaan se, mitä mallit voivat ja eivät voi ennustaa. Kaikkien mallien oletukset eivät kuvaa useimpien reaalimaailman järjestelmien yksityiskohtia, mutta näillä järjestelmillä on suurimittakaavaisia käyttäytymismalleja, jotka eivät riipu kaikista näistä yksityiskohdista [2]. Yksinkertainen malli, joka kuvaa oikein suurimittakaavaisen käyttäytymisen, on hyödyllinen; monimutkainen malli, jossa tietyt yksityiskohdat ovat oikein, mutta joka kuvaa väärin suurimittakaavaisen käyttäytymisen, on parhaimmillaan harhaanjohtava. COVID-19-pandemian suurimittakaavaiseen käyttäytymiseen kuuluu aktiivisten tartuntatapausten määrän eksponentiaalinen kasvu/väheneminen kullakin alueella sekä alueiden välinen tartuntanopeus. Näiden parametrien arvot, joita molempia voidaan hallita interventioilla, määritelevät, onko COVID-19:n suurimitakaavainen käyttäytyminen eksponentiaalista kasvua saturaatiopisteeseen vai eksponentiaalista vähenemistä sen eliminointiin saakka. Emme ehkä pysty täsmällisesti ennustamaan epidemian kehityskulkua minkään tietyn interventiosarjan aikana, mutta tiedämme, että riittävän voimakkaiden toimenpiteiden avulla voimme varmistaa, että olemme matkalla jälkimmäistä — eksponentiaalisen vähenemisen — järjestelmää.

Sen ymmärtäminen, mitä mallit eivät voi ennustaa, on joskus tärkeämpää kuin ymmärtää, mitä niillä voidaan ennustaa. Esimerkiksi sään kaltaisessa kaoottisessa järjestelmässä vain hyvin lyhyen aikavälin ennusteet ovat tarkkoja, koska pienet muutokset tässä hetkessä voivat johtaa erittäin suuriin muutoksiin tulevaisuudessa. COVID-19-pandemian etenemissuunta on toinen esimerkki: infektioiden määrä on suhteessa epidemian eksponentiaaliseen kasvuvauhtiin, joten pienet epätarkkuudet epidemian kasvunopeuden ennusteissa johtavat suuriin muutoksiin kuolemantapausten määrässä riittävän ajan kuluessa. Lisäksi epidemian kasvu- tai hidastumisnopeus riippuu interventioiden täsmällisen toteutuksen yksityiskohdista, ja hyvin pieni muutos interventioiden voimakkuudessa saattaa olla riittävä ero kahden erittäin erilaisen lopputuleman välillä: eksponentiaalinen kasvu saturaatio- eli kyllästyspisteen tai eksponentiaalisen hidastuminen päättymiseen asti. Epidemian etenemissuunnan likimääräinen arvio on tärkeää, mutta kun taustalla olevista perussairauksista ja sosiaalisesta dynamiikasta on niin paljon epävarmuutta eri interventioiden toteutuksen epävarmuuksien tavoin, joten mallien yksityiskohtainen tarkentaminen ei ole kovin hyödyllistä.

Yleisemmin käy ilmi, että mallien yksityiskohtien selvittämiseen pyrkiminen on useimmiten turhaa, jos mittausten epävarmuus tai ydinmallin oletusten epätarkkuudet heikentävät saavutettavaa tarkkuutta. Mitä varten mallia pitäisi parantaa 10 prosenttia, jos epävarmuudesta johtuu 50 prosenttia mallin muista näkökohdista tai oletuksista, tai jos mallinnetussa järjestelmässä on jotain sellaista käyttäytymistä, jota malli ei pysty lainkaan kuvailemaan? Mallit, jotka pyrkivät keskittymään järjestelmän pienimittakaavaiseen yksityiskohtaiseen käyttäytymiseen (ks. esim. [3]), sisältävät väistämättä joitakin yksityiskohtia ja jättävät toisen huomioimatta. Riippuen siitä, mitkä yksityiskohdat malliin on sisällytetty, tällaiset mallit voivat kuvata järjestelmän suurimittakaavaista toimintaa virheellisesti, ja kun ne toimivat, se johtuu usein siitä, että mallin erityiset oletukset ovat erikoistapaus yksinkertaisemmasta, yleisemmästä mallista. Joten joskus järjestelmän suurimittakaavaisen käyttäytymisen ymmärtämiseksi tehokkaimpia eivät ole monimutkaiset mallit, vaan petollisen yksinkertaiset mallit.

COVID-19:n tapauksessa eräs suurimittakaavainen käyttäytymispiirre on infektioiden eksponentiaalinen kasvu ilman interventioita (ellei tartunnan saaneiden määrä ole lähestymässä saturaatiopistettä), ja tarkka kasvunopeus riippuu sijainnista ja tartuntojen täsmällisistä yksityiskohdista. Interventioilla voidaan vaikuttaa tähän kasvunopeuteen, ja riittävän vahvat sulun (lockdown) kaltaiset toimenpiteet voivat johtaa eksponentiaaliseen hidastumiseen ja vähenemiseen eksponentiaalisen kasvun sijaan. Toinen suurimittakaavainen käyttäytymispiirre on, että tartunnat tapahtuvat pääasiassa paikallisesti. Tämän vuoksi matkustelu voi aiheuttaa tartunnanaiheuttajan leviämisen kaukaisilla etäisyyksillä. Tartuntojen määrä ei muutu tasaisesti kaikkialla maailmassa samaan aikaan, vaan se riippuu kunkin alueen ominaispiirteistä siten, että ensimmäisen tartunta-alueen tartuntojen lukumäärän kulkeutumisesta ja tartunnan saaneiden yksilöiden matkustamisesta ensimmäiseltä alueelta toiselle. Taudin leviämisprosessissa on monia pienimuotoisia yksityiskohtia, mutta suuren mittakaavan dynamiikka näyttää riippuvan tartuntojen kasvu- tai vähenemisnopeudesta annetulla alueella ja eri alueiden välisestä leviämisnopeudesta (molemmat voivat muuttua ajan myötä interventioista, kyllääntymisvaikutuksista tai muista ulkoisten olosuhteiden muutoksista johtuen). Näiden parametrien dynamiikasta riippuen alueiden kokoelma voi olla yhdessä kahdesta mahdollisesta vaiheesta: vakaassa vaiheessa, jossa taudin dynamiikka näyttää siirtyvän kohti vakaata kiinteä eliminaatiopistettä (eli infektoituneita alueita) tai epävakaassa vaiheessa, jossa tartunnan saaneiden alueiden määrä kasvaa, kunnes kyllääntymispiste saavutetaan (katso kuvio 1). [1*] Jotta alueiden kokoelma olisi vakaassa vaiheessa, alueiden ei tarvitse olla jatkuvassa lukituksessa sen jälkeen, kun virus on onnistuttu niistä puhdistamaan, vaan jokaisen alueen on oltava valmiudessa toteuttamaan uusi sulku mahdollisimman pian sen jälkeen, kun se saa uusintatartunnan. [5] Jos virus tuodaan tai tuodaan uudelleen epävakaassa vaiheessa oleville alueilla, tartunnan saaneiden alueiden määrä kasvaa eksponentiaalisesti, mutta jos virus tuodaan tai tuodaan uudelleen vakaan järjestelmän omaavien alueiden kokoelmaan, järjestelmä palaa ajan kuluessa (interventiotoimien myötä) eliminaatiovaiheeseen ja virus on (taas) onnistuttu poistamaan.

Kuvio 1. Kokoelma maantieteellisiä alueita voi olla kahdessa eri vaiheessa suhteessa koronavirustautiin. Jos otetaan käyttöön riittävän voimakkaita sulku- ja lukitustoimenpiteitä (joihin saattava kuulua testaus, tartuntalähteen jäljitys ja karanteeni), virus voidaan poistaa nykyisin tartunnan saaneilta alueilta. Kysymys on sitten siitä, onko tämä eliminointi luonteeltaan vakaa vai palautuuko tapausten lukumäärä jollekin tasolle sulun poistamisen jälkeen. Se, onko eliminointi vakaa vai ei, riippuu (1) sairauden leviämisestä alueelle aiheutuvien tartuntatapausten keskimääräisestä kokonaismäärästä, mikä puolestaan riippuu (muiden tekijöiden ohella) siitä, kuinka nopeasti alueet sulkeutuvat paikallisesti niiden saadessa tartunnan tai uustartunnan, ja (2) sen todennäköisyydestä, että tartunnan saanut yksilö yhdellä alueella tartuttaa yksilön toisella alueella, mikä puolestaan riippuu alueiden välisestä matkustus- ja liikkumissuhteesta [4,5].

Jos järjestelmän suurimittakaavainen käyttäytyminen on kuvattu oikein, tarkat yksityiskohdat voidaan ymmärtää niiden vaikutuksesta suuren mittakaavan käyttäytymiseen. Mutta jos mallin oletukset eivät tuota samaa yleistä suuren mittakaavan käyttäytymistä mallinnettavassa järjestelmässä, yksityiskohtien lisääminen malliin voi johtaa vain väärään itseluottamukseen mallin ennusteiden suhteen. Esimerkiksi mallit, joissa käytetään jatkuvia muuttujia tartunnan saaneiden yksilöiden osien tai todennäköisyyksien esittämiseksi, voivat antaa ymmärtää, että vaikka sulku voi johtaa tapausten eksponentiaaliseen vähenemiseen, tapausten lukumäärä palautuu väistämättä sulun poistamisen myötä. Oletus lähes jatkuvasta toiminnasta ei kuitenkaan toimi pienten tartuntatapauksien määrän kohdalla (joka väistämättä seuraa eksponentiaalisen vähenemisen tuloksena riittävän ajan kuluessa). Jos vain pieniä lukuja ilmenee mallin lopputuloksissa, ihmisen arviointi voi korjata virheen (esimerkiksi tulkitsemalla mallin tuottaman murto-osamuotoisen tartuntatapauksen, koska virus on eliminoitu todellisuudessa). Mutta jos nämä pienet luvut syntyvät mallin väliarvoina, malli ennustaa eksponentiaalisen kasvun sulun poistamisen jälkeen, huolimatta siitä, että malli ei ole enää pätevä tässä järjestelmässä ja tartuntatapauksia voi olla tosiaisassa nolla. [2*] Infektioiden uusi kasvu sulkutoimenpiteiden poistamisen jälkeen voi olla seurausta järjestelmän mahdollisesta suuren mittakaavan käyttäytymisestä, mutta se ei ole väistämätöntä (kuten jatkuvat mallit ennustavat), vaan riippuu pikemminkin toiminnastamme: jos interventiot ovat riittävän voimakkaita saamaan aikaan eksponentiaalisen vähenemisen aktiivisissa tapauksissa, niin niiden pitäminen voimassa riittävän kauan johtaa viruksen eliminointiin. [3*]

Voidaan tietysti väittää, että vaikka tartunnan saaneesta väestönosasta tulee hyvin pieni, jos tarkasteltavana olevaa populaatio arvioidaan riittävän suureksi, tartuntatapauksien lukumäärä on silti riittävän suuri, jotta tartuntatapauksien voidaan approksimoida olevan jatkuvia. Malleissa tarkastellaan kuitenkin usein koko maan väestöä yhdessä. Todellisuudessa tartuntatautien leviäminen on paikallisempaa (ja siitä voidaan tehdä vielä paikallisempaa sulku-, rajoitus- ja estotoimien avulla; mm. matkustusrajoituksin ja karanteenitoimin), joten ne populaatiot, joihin näitä malleja sovelletaan, ovat kooltaan paljon pienempiä kuin koko maa. Tästä syystä dynamiikan paikallisuus (jonka astetta voidaan kasvattaa matkustus- ja liikkumisrajoituksin) johtaa siihen, että pieni osa mallissa tartunnan saaneesta populaatiosta todennäköisesti vastaa sitä, että virus on saatu todellisuudessa eliminoitua, ja se sallii myös sulkutoimien poistamisen alueittain sen sijaan, että ne pidettäisiin voimassa kaikilla alueilla aina siihen asti, kunnes koko maa tai alue on saatu puhdistettua virustaudista. Viime kädessä tiettyjen mallien yksityiskohtaiset oletukset vaihtelevat; yksityiskohtaiset oletukset eivät ole tärkeitä, vaan tärkeää on se, että onnistuuko malli asianmukaisesti luonnehtimaan ja kuvaamaan edellä kuvattuja suurimittakaavaisia käyttäytymismalleja.

“Mitä tapahtuu?” on eri kysymys kuin “Mitä meidän pitäisi tehdä?”. COVID-19-pandemiassa jälkimmäiseen kysymykseen on paljon helpompaa vastata kuin ensimmäiseen. Koska järjestelmän yksityiskohtia ei täysin ymmärretä, viimeksi mainittuun kysymykseen vastaaminen edellyttää sitä, että ymmärrämme, miten mahdolliset toimemme vaikuttavat järjestelmän kannalta merkityksellisiin suurimittakaavaisiin parametreihin. Nämä ovat COVID-19:n tapauksessa eksponentiaalisen kasvun tai vähenemisen nopeus kullakin alueella ja todennäköisyydet alueiden välisille tartunnoille. Vaikka emme pysty täsmällisesti ennustamaan minkään tietyn toimenpiteen vaikutusta, tiedämme lukuisia eri toimenpiteitä, jotka vähentävät alueiden sisäistä ja niiden välistä tartuntanopeutta, ja perustuen empiiriseen ymmärrykseemme COVID-19-tartunnoista ja siihen, että osassa maista on nähty laskua uusissa tartuntamäärissä, tiedämme sen, että riittävän monenlaisten interventioiden yhdistämisen avulla tartuntanopeutta voidaan vähentää niin, että se hidastaa eksponentiaalista kasvua, kääntää sen eksponentiaaliseksi laskuksi ja lopulta epidemia päättyy ainakin viruksen alueelliseen tuhoutumiseen [6]. Tämä itsessään on yksinkertainen, mutta selitysvoimainen muodollinen malli, joka kuvaa epidemian kiinnostavat laajamittaiset käyttäytymismallit. Kysymys tartuntataudin etenemissuunnasta on vähemmän tärkeä kuin kysymys siitä, mitä voidaan tehdä (1) saadaksemme aikaan eksponentiaalisen vähenemisen uusien tartuntatapausten kasvun sijaan ja (2) uusien tartuntatapauksien lukumäärän mahdollisimman nopeaksi vähentämiseksi. Kysymys ei ole kunkin intervention erityinen ennustaminen, vaan se, että interventiot yhdessä voivat tuhota viruksen.

(Ala)viitteet

[1*] Yksittäisen maantieteellisen alueen sulkua voidaan analysoida Kuvio 1:ssä esitetyllä tavulla, jos kutakin kotitaloutta pidetään omana “alueenaan”. Tässä tapauksessa epidemian keskimääräinen koko olisi niiden kotitalouden asukkaiden keskimääräinen lukumäärä, joiden odotetaan saavan COVID-19-tartunnan, jos yksi henkilö kotitaloudessa on saanut tartunnan, ja taudin leviäminen “alueiden” välillä vastaa todennäköisyyttä sille, että eräässä kotitaloudessa tartunnan saanut henkilö tartuttaa jossain toisessa kotitaloudessa asuvan henkilön. Sulkutoimien ensisijainen tarkoitus on hallita tätä todennäköisyyttä.

[2*] Virus voidaan kuitenkin tuoda uudelleen, mutta jos eliminaatio on vakaa kiinteä piste alueiden kokoelmassa (Kuvio 1), alueiden lukumäärä, joilla ei ole tartuntoja, laskee ajan myötä nollaan.

[3*] Viruksen eliminointia voidaan vauhdittaa testaamalla, kontaktien jäljityksellä ja karanteenilla, mikä voi olla toteuttamiskelpoisempaa ja/tai tehokkaampaa, kun tartuntatapauksien määrää on vähennetty riittävästi.

[1] Worldometer. COVID-19 coronavirus outbreak. Luettu 7.4.2020.

[2] Yaneer Bar-Yam. From big data to important information. Complexity, 21(S2): 73–98, 2016.

[3] Neil M Ferguson, Daniel Laydon, Gemma Nedjati-Gilani, Natsuko Imai, Kylie Ainslie, Marc Baguelin, Sangeeta Bhatia, Adhiratha Boonyasiri, Zulma Cucunubá, Gina Cuomo-Dannenburg, ym. Impact of non-pharmaceutical interventions (NPIs) to reduce COVID-19 mortality and healthcare demand. Imperial College COVID-19 Response Team, 2020.

[4] Frank Ball, Denis Mollison, and Gianpaolo Scalia-Tomba. Epidemics with two levels of mixing. The Annals of Applied Probability, 7(1): 46–89, 1997.

[5] Alexander F Siegenfeld and Yaneer Bar-Yam. COVID-19 eliminointi: Yhteisöperusteinen analyysi. arXiv: 2003.10086.

[6] Harvey V. Fineberg. Ten weeks to crush the curve. New England Journal of Medicine, 2020. [Kymmenen viikkoa käyrän murskaamiseksi]

Suomennos Alexander F. Siegenfeldin (Twitter) ja Yaneer Bar-Yamin (Twitter) artikkelista “What models can and cannot tell us about COVID-19”. Essee ilmestyi New England Complex Systems Instituten verkkosivuilla 8.4.2020.

Alexander F. Siegenfeld on väitöskirjaopiskelija MIT Media Labissa. Hän tutkii poliittista polarisaatiota matemaattisin menetelmin. Hän on erikoistunut fysiikan, matematiikan, valtiotieteen ja taloustieteen tarjoamiin menetelmiin muun muassa vaalien, äänestämisen ja talouskasvun tutkimuksessa. Siegenfeld toimii lisäksi New England Complex Systems Instituten tutkijana.

Yaneer Bar-Yam on fyysikko, järjestelmätieteilijä ja New England Complex Systems Instituten perustaja. Hän on erikoistunut monimutkaisten järjestelmien tutkimukseen ja tehnyt tutkimusta lukuisilla eri tieteenaloilla aina materiaalitieteistä neuraaliverkkoihin.

Kirjoituksen on suomentanut Thomas Brand (Twitter).

--

--

Thomas Brand
Brandin kirjasto

Curious observer. Interested in economics, fintech, Bitcoin, philosophy, strategy, innovation & existential risks.