Jo riittää mallintaminen

Ensin suoja, sitten malli

Thomas Brand

Published in

Brandin kirjasto

4 min readApr 17, 2020

Olen lukenut monien väittävän, että virus yllätti meidät, koska ihmismielellä on vaikeuksia ymmärtää eksponentteja.

Isoäitini sanoisi, ettei sinun tarvitse ymmärtää eksponentteja ymmärtääksesi viruksen olevan vaarallinen. Nöyryys riittää.

Vetää nöyrästi, kun tarkastelet sitä, miten Kiinassa rakennettiin hätävarasairaaloita vuodepaikkoineen ja Espanjassa muunnettiin jäähalli ruumishuoneeksi, koska Madridin krematoriot ovat täynnä. Sen ymmärtäminen, että tämä voisi olla sinun tulevaisuutesi, yksinään riittää.

Vetää nöyräksi, kun ymmärtää, että Lombardia ei ole kolmas maailma, ja se, mitä siellä tapahtuu, tulee tapahtumaan myös muissa maissa, elleivät ne reagoi nopeammin ja tehokkaammin.

On helppo tietää, miten reagoida parhaiten — riittää katsoa, mikä toimi (Taiwanissa, Singaporessa, Etelä-Koreassa ja Kiinassa) ja mikä puolestaan ei (Italiassa), ja tehdä enemmän ensimmäistä ja vähemmän jälkimmäistä.

Valitettavasti jotkut ihmiset haluavat kuulostaa fiksummilta kuin tehdä sitä mikä toimii, joten meillä on malleja. Luultavasti, ei välttämättä, siksi, että malleja on arvostettu.

Poliittiset vaalit ja vertaisryhmistä muodostetut tieteelliset valiokunnat asettavat darwinistisen paineen kuulostaa fiksulta sen sijaan, että tehtäisiin niitä asioita, jotka toimivat — jälkimmäinen on yrittäjien ja muiden reaalimaailmassa elävien ammattilaisten osaamisalaa.

Tulos on, että meillä on modernien matemaattisia malleja käyttävien astrologien parvi.

Mallien ongelma

Jotkut mallit eivät toimi. Malleissa on kuitenkin kolme mahdollista ongelmaa, eikä mitään mallia, joka kärsii niistä yhdestäkään, pidä missään olosuhteissa käyttää (tämän ajatuksen taustat ovat monissa Nassim Nicholas Talebin teoksissa).

Ensinnäkin on tulosten virhe. Joissakin malleissa syötteiden pienet virheet tuottavat pieniä virheitä tuloksissa. Toisissa syötteiden pienet virheet tuottavat valtavia virheitä tuloksissa. Epidemiologiset mallit ovat usein jälkimmäisen kaltaisia.

Otetaanpa hyvin yksinkertainen malli: tartuntatapaukset kasvavat 30 prosentilla joka päivä. Tämä malli ennustaisi, että sadasta tartuntatapauksesta syntyisi 3937 tartuntatapausta kahdessa viikossa. Jos syöte on kuitenkin väärä ja tartuntatapaukset kasvaisivat tosiasiassa 40 prosentilla, malli ennustaisi 11 112 tartuntatapausta kahdessa viikossa. Kymmenen prosentin absoluuttinen ero syötteissä luo valtavan (melkein kolminkertaisen) eron tuloksissa (melkein kolminkertaisen).

Toiseksi on virhe parametreissa. Mistä tiedämme, kasvavatko tartuntatapaukset 20 prosenttia, 30 prosenttia vai 40 prosenttia? Arvioimme sen. Jos meillä on kuitenkin pieniä otoksia, kertoimesta vallitsee suuri epävarmuus, mikä johtaa vielä suurempaan epävarmuuteen tuloksessa.

Huomaa, että tässä tapauksessa merkitys ei ole (vain) otoskoossa, vaan sillä, miten klusteroituneita otokset ovat. 10 000 tartuntatapauksen otos viidestä eri maasta on luotettavampi kuin 100 000 tartuntatapauksen otos Kiinasta — viimeksi mainittu saattaa tarjota tietoja viruksesta TAI se voi antaa tietoa Kiinasta.

Gerd Gigerenzerin erinomainen kirja Gut Feelings osoittaa, että syy ihmisten ja eläinten yksinkertaiselle heuristiikan käytölle ei ole se, että ne ovat monimutkaisia malleja nopeampia. Heuristiikkojen käyttäminen johtuu siitä, että heuristiikat toimivat paremmin otosten ollessa pieniä tai parametrien ollessa epävakaita. Tässä tapauksessa yksinkertainen heuristiikka on muotoa: virukset leviävät nopeasti ja tappavat paljon ihmisiä, parempi reagoida nopeasti, ja epäselvissä tapauksissa, tee se, mikä on toiminut vuosisatoja: eristä sairaat.

Kolmanneksi on väärä turvallisuuden tunne. En välitä siitä, että mallisi voi ennustaa 95-prosenttisella tarkkuudella, miten epidemia kehittyy. Välitän siitä, mitä tapahtuu viidessä prosentissa jäljelle jääneistä tapauksista. Mitä tapahtuu luottamusvälin ulkopuolella? Kuoleeko kaksinkertainen määrä ihmisiä? Vai kuoleeko miljardeja ihmisiä?

Lisäksi — ja tätä ei häpeällisesti koskaan mainita — mikä on 95 prosentin epävarmuus? Toisin sanoen, kuinka tiedämme, että 95 prosentin luottamusväli ei tosiasiassa ole 50 prosenttia?

Vastaus on se, että emme tietä. Tai tarkemmin sanottuna tiedämme sen, kun tutkimme vuosikymmeniä havainnoituja ilmiöitä ja joilla ei ole mitään mahdollisuuksia kehittyä. Tämä ei selvästikään ole uuden koronaviruksen ja sen aiheuttaman koronavirussairauden tilanne.

Mallit pandemian aikana

On vastuutonta käyttää malleja tämän pandemian aikana. Ne, jotka ovat näin tehneet, ovat syyllistyneet kolmeen edellä mainittuun ongelmaan: pienet virheet syötteissä voivat aiheuttaa suuria virheitä tuloksissa, meillä ei ole tarpeeksi tietoa parametreista ja meillä ei edes ole tarpeeksi tietoa siitä, mitä emme tiedä.

On paljon parempi luopua ylimielisyydestä ja vastuullisesti nöyränä myöntää, että mikään malli ei pysty ennustamaan riittävän virheettömästi, mitä tapahtuu, jotta sen varaan voitaisiin rakentaa politiikkatoimia. Ei ole mitään syytä toimia ikään kuin meillä ei olisi luotettavaa tietoa: meidän pitää tehdä, mikä on osoittautunut toimivaksi ja olettaa, että jos näin ei tehdä, päädymme samaan tilanteeseen niiden maiden kanssa, jotka eivät myöskään tehneet toimiviksi osoittautuneita asioita.

Käytännön esimerkkejä

Taiwan ei yrittänyt mallintaa epidemian leviämistä eikä se odottanut tietojen keräämistä päätöksien tekemiseksi. Se aloitti Wuhanista saapuvien matkustajien seulonnat jo 5. tammikuuta eli samana päivänä, jona Maailman terveysjärjestön verkkosivuilla julkaistiin raportti Kiinan epätavanomaisista keuhkokuumetapauksista.

Ensin suojataan, toiseksi ajatellaan ja kolmanneksi mitataan. (Miksi on tarpeen ajatella ennen mittaamista? Koska muuten ekstrapoloidaan pettävien yhteensattumien varassa.))

Singaporessa toimitaan ensin. Jos jollakulla epäillään olevan virustartunta (koska hänellä on oireita tai koska hän on tavannut jonkun, joka on testattu positiiviseksi), niin ensin hänet eristetään, sitten testataan ja lopulta odotetaan tuloksia ennen kuin eristystoimista voidaan mahdollisesti luopua.

Mallien käyttö

Mailla on tehtävänsä: niillä voidaan ymmärtää, mitä tapahtui, miksi jotain tapahtui ja ehdottaa asteittaisia muutoksia tuleviin prototyyppeihin (jotka vahvistetaan todellisen maailman happokokeella).

Mallien olisi kuitenkin aina oltava todellisuuden loppupäässä, ei alkupäässä, ja niiden tulisi aina olla alisteisia riskienhallinnalle. Ensin suojaus, sitten malli, myöhemmin vahvistus ja lopulta optimointi. Vain alhaalta ylöspäin -lähestymistapa toimii.

Meillä ei ole varaa perustaa toimintaamme malleihin; ei varsinkaan silloin, kun virhe voisi osoittautua kohtalokkaaksi.

Tiedämme jo, mikä toimii. Meidän pitää vain olla nöyriä muuttaaksemme tietämämme toiminnaksi, vaikka se ei ollutkaan meidän ajatuksemme, vaikka emme olisikaan vakuuttuneita siitä, että juuri se on paras toimintatapa.

Turhaudumme aina siitä, että olemme niin mieltyneitä tuloksiin, mutta emme pidä tulosten saavuttamiseksi tarvittavista toimista.

Suomennos Luca Dellannan (Twitter) kirjoittamasta uutiskirjeestä “Enough with modeling: Protect first, model later”. Kirjoitus ilmestyi Dellannan Covid Stuff -uutiskirjeessä 25.3.2020.

Dellanna on koulutukseltaan koneinsinööri, mutta hän päätti jättää päivätyönsä ja ryhtyi itsenäiseksi käyttäytymistieteen tutkijaksi, johdon konsultiksi ja tietokirjailijaksi. Hän on vuosien varrella kirjoittanut useita kirjoja ja työskentelee Genovan yliopistossa osa-aikaisena luennoitsijana.

Kirjoituksen on suomentanut Thomas Brand (Twitter).