Mis on avaandmed ja millist kasu nad meile loovad?

Juturobotitega oleme kokku puutunud pea igaüks — olgu see Siri sinu iPhone’is, mõne ettevõtte iseteeninduses või kriis.ee lehel. Kõiksugu juturobotite ja krattide toimimise aluseks on aga andmed. Digiriigi andmete juht Ott Velsberg räägib intervjuus, mis need avaandmed on ja millist kasu nad meile loovad.

Majandus- ja Kommunikatsiooniministeerium
Digiriik
4 min readDec 14, 2020

--

Riigi andmete juht Ott Velsberg

Selgita lühidalt, mis üldse on avaandmed?

Avaandmete näol on tegemist avaliku sektori, ettevõtete, ülikoolide ja teiste andmevaldajate käes olevate andmetega, mis on taaskasutamiseks kättesaadavaks tehtud. Andmete taaskasutus võib seejuures olla ilma piiranguteta, või teatud juhtudel võib olla seatud ka piiranguid, näiteks kohustus viidata algallikale.

Miks avaandmeid avalikustada tuleb?

Avaandmete avalikustamine võimaldab erasektoril, akadeemial, tudengitel, vabaühendustel, kodanikel ja teistel huvilistel kasutada olemasolevaid andmeid ilma, et nad peaksid neid andmeid ise koguma. See omakorda loob uusi võimalusi andmete rakendamiseks ja seejuures ka olemasolevate teenuste täiendamiseks. Kui avaandmete taaskasutus suureneb, kasvab ka nendest loodav väärtus.

Kui avaandmete taaskasutus suureneb, kasvab ka nendest loodav väärtus.

Näiteks on eesti keeletehnoloogia aluseks justnimelt avaandmed, ilma milleta ei oleks võimalik luua masintõlget või kõnetuvastust. Paljud meist kasutavad Waze, Google Mapsi, Google Translate’i ja paljusid teisi erasektori poolt pakutavaid teenuseid, mis kõik kasutavad justnimelt avaandmeid. Samamoodi kasutatakse avaandmeid teadlike otsuste tegemisel, näiteks juhtimislaudades ja seda nii era- kui ka avalikus sektoris. Lisaks on avaandmed sisend krattide loomiseks — avaandmeid on kasutatud näiteks liiklusõnnetuste toimumise prognoosimiseks, metsa lageraiete ja puuliikide tuvastamiseks, aga ka veetaseme seires.

Ehk keegi pole Googlesse sisestanud tuhandeid sõnaraamatuid, vaid ta on õppinud talle avalikuks tehtud andmete pealt?

Täpselt nii, Google’i ja teised masintõlke lahendused ei oleks ilma avaandmeteta võimalik. Näiteks on avaandmete põhjal tehtud suur paralleelkorpus, kus on üle 15 miljoni tõlkesegmendi eesti ja inglise keele vahel. Sellises mahus andmeid ei ole ühelgi asutusel täna võimalik ise koguda, seega julgen öelda, et avaandmed on keeletehnoloogia alustala.

Milliseid andmeid avalikustatakse? Kas avalikustatakse ka minuga seotud andmeid või isikuandmeid?

Täna avalikustatakse andmeid kõikidel elualadel ja valdkondades, näiteks on kättesaadavad erinevaid ruumiandmeid, statistika, toimunud liiklusõnnetuste andmed, ühistranspordi sõidugraafikud ning sõidukite asukohad, andmed teeolude kohta, apteekide vastavus apteegireformi nõuetele, kõikvõimalikud keelekorpused, muuseumi kogud, arhiivides leiduvad pildid ja palju muud. Seega andmeid on kõigile huvilistele.

Mis puudutab isikuandmeid, siis isikuandmed üldiselt avaandmete hulka ei kuulu ja seega neid ka ei avalikustata. Samas - kui tegemist on infoga, millele on ühiskondlik ootus ning mis võib omada sotsiaalselt ja majanduslikult suurt väärtust, siis teatud juhtudel avalikustatakse ka isikuandmeid. Näiteks Euroopa Liit on avaandmete direktiivis kõrgväärtuslike andmetena määratlenud ettevõtlusega seotud andmeid. Eestis puudutab see suuresti äriregistri andmeid. Seega on lähima paari aasta jooksul oodata, et osa andmeid, mida me täna avaandmetena pole käsitlenud, muutuvad edaspidi avaandmeteks.

Kui palju üldse Eestis andmeid avalikustatakse?

Eestis on viimase kahe aasta jooksul avaandmete avalikustamine märgatavalt hoogustunud. Kui veel 2018. aastal oli avalikustatud 86 andmestikku 29 teabevaldaja poolt, siis tänaseks on teabeväravas avalikustatud 787 andmestikku 108 teabevaldaja poolt. Ainuüksi sel aastal on andmestike hulk kasvanud pea neljakordseks, sarnaselt on hoogustunud ka andmete kasutamine, seega näeme täna, et valdkond muutub järjest olulisemaks ja ka andmeid avalikustatakse ning kasutatakse rohkem.

Üle maailma avaldatakse koroonastatistikat avaandmetena. Foto: Clay Banks (Unsplash)

Meil on 787 komplekti andmeid. Mida kõigi nende andmetega peale hakatakse?

Ühelt poolt kasutatakse avaandmeid kõikvõimalike rakenduste loomisel, need on üldjuhul informatiivse olumusega, näiteks eElurikkuse asukohapõhine rakendus kuvab informatsiooni Eesti bioloogilise mitmekesisuse kohta ja koroonakaart kuvab haigust puudutavat statistikat.

Teisalt kasutatakse avaandmeid paremate otsuste tegemiseks. Ennist mainisin ka keeletehnoloogiat, kus ilma avaandmeta ei toimiks täna ei Google Translate, Microsoft Translate ja Tartu Ülikooli Neurotõlke teenus, mida paljud meist igapäevaselt kasutavad. Samamoodi on Waze ja Google Mapsi sisendiks just avaandmed, aga andmeid kasutavad ka teised teenusepakkujad, näiteks Microsoft, Tilde ja Garmin.

Samamoodi kasutab PRIA SATIKAS Euroopa Kosmoseagentuuri kogutavaid sateliidiandmeid, et tuvastada põldudel toimuv. Eestis on meil sateliidiandmete paremaks taaskasutamiseks loodud ESThub, mis on riiklik sateliidiandmete keskus.

Kas iga soovija ja nt ettevõtja saab neid satelliidiandmeid vabalt kasutada ja enda heaks tööle panna?

Sateliidiandmete keskus ESTHub võimaldab kasutajatel otsida ja kasutada Coprernicuse programmi andmeid. Tuge pakutakse seejuures nii asutustele kui ka ettevõtetele.

Millist kasu saan mina avaandmetest?

Ma usun, et me kõik võidame läbi paremate teenuste ja otsuste, mida saab andmete põhjal teha. Lisaks toetab avaandmete avalikustamine läbipaistvat riigi toimimist. Tehnoloogia arengu najal on avaandmed saamas tänapäeva ühiskonna toimimise aluseks. Näiteks kui soovime ka tulevikus kasutada oma sõidu- või tõlkerakendusi ja riigiga asju ajada eesti keeles, siis peame Eesti keeletehnoloogiasse ning avaandmetesse kõik ühiselt panustama.

Eesti on avaandmete vallas teinud viimastel aastatel suure hüppe.
Ott Velsbergi sõnul on Eesti avaandmete vallas teinud viimastel aastatel suure arenguhüppe.

Milline on avaandmete seis Eestis võrreldes ülejäänud Euroopa/maailmaga?

Kui veel 2018. aastal olime avaandmete valdkonnas Euroopas eelviimased ehk 27ndad, siis eelmise aastaga tegime suure tõusu ning oleme täna tublil 14ndal kohal ehk Euroopa keskmised. Samas usun, et juba järgmisel aastal paraneb meie tulemus oluliselt. Riigiasutused on viimase aasta jooksul avaandmetesse oluliselt panustanud. Sarnane seis on ka OECD OURdata indeksiga.

European Data Portal’i andmetel on Eesti Euroopas 14. kohal. Aasta varem olime 27. kohal. Tutvu pingereaga siin.

Sa mainisid teabeväravat. Mis on avaandmete teabevärav?

Avaandmete teabevärav võimaldab saada ülevaate kõikidest avalikustatud andmetest, mis omakorda võimaldab kõigil huvilistel lihtsamini üles leida enda jaoks huvitav info ning näha ka rakendusi, mis on avaandmete peale ehitatud. Seega julgustan kõiki, kes pole veel avaandmeid teabeväravasse viidanud, seda teha!

Lisaks tulime möödunud nädala lõpus välja uue teabeväravaga, mis hakkab asuma lehel avaandmed.eesti.ee. Uus teabevärav on hetkel veel beeta versioonis, seega kõik tagasiside ja ettepanekud on väga oodatud. Uues teabeväravas loome ka võimalused andmeid analüüsida ning neist lihtsamini väärtust saada.

Lisamaterjale andmehuvilistele:

▹ Tutvu ka Eesti avaandmete tegevuskavaga: https://digiriik.ee/index.php/avaandmete-tegevuskava/

▹Jooksev infovahetus OpenESTdata Facebooki grupis: https://www.facebook.com/groups/openestdata

--

--