Esimesed riiklikud andmeteaduse taibutalgud
Andmeteaduse taibutalgute näol on tegemist uue viisiga avalikus sektoris probleemide lahendamiseks.
Eessõna
Avaliku sektori ees seisab suur arv väljakutseid ning kõikidel asutustel on nad erinevad. Kui üks asutus otsib paremat platvormi kliendiga suhtlemiseks, teine püüab protsesse automatiseerida ning kolmas soovib tuleviku prognoosida, siis kunagi ei saa nende probleemidel olla üht ja sama lahendust, kuid võib olla üks ja sama viis, kuidas lahenduseni jõuda ning selleks on andmeteadus.
Usun, et paljudele ei tule uudiseks, et andmeteadus on täna väga populaarseks osutunud ning sellel on oma põhjus. Olukorra analüüsimiseks, tõelise probleemi väljaselgitamiseks ning targa otsuse langetamiseks on mõistlik kasutada andmeid. Raske vaielda, et faktidele põhinev lähenemine tõstab otsuste efektiivsuse määra, kuna tugineb reaal olukorrale.
Andmeteaduse taibutalgute näol püüdsime lahendada avalike asutuste poolt formuleeritud probleeme, luues mudeleid avaandmete põhjal ehk kasutades andmeteadust.
Kuidas andmeteaduse taibutalgud toimusid?
Andmeteaduse taibutalgud jagunesid kolmeks osaks:
- sissejuhatav töötuba riigitöötajatele;
- lahendavate probleemide ettevalmistus;
- probleemide avalikustamine andmeteadlaste rahvusvahelises võistluskeskkonnas nimega Kaggle ning neile lahenduste leidmine.
Peamiseks taibutalgute eesmärgiks oli reaalelulistele probleemidele lahenduse leidmine, kasutades selleks avaandmeid.
Kevadel toimunud töötuba tõi kokku kaheksa avaliku sektori tiimi üle Eesti, kes said teada andmeteaduse alustest ning formuleerisid probleeme, lähtudes omandatud teadmistest. Lahendada sooviti nii sotsiaalseid probleeme nagu huviringide toetuste määramise valiku efektiivsemaks tegemist kui ka puhtalt tehnilisi probleeme nagu veekvaliteedi prognoosimist.
Probleemide lahenduse peamiseks eelduseks oli mudelite loomiseks vajalike andmete olemasolu ning võimalus probleemi lahendada kasutades andmete põhjal loodud mudeleid. Neile kriteeriumitele vastas 5 formuleeritud ideed, mis said Kaggle keskonnas avalikustatud:
- Joogivee kvaliteedi prognoosimine — vee kvaliteeti ennustamine Eesti veejaamades, kasutades selleks varasemate mõõtetulemuste andmeid, mudeliga saaks viia veeinspektorite tööd uuele tasandile;
- Kliendipöördumiste mitmiktahtluse tuvastamine — Eesti esimese virtuaalse assistendi arengusse panustamine, luues masinõppe mudelit, mis tuvastab kõik kasutajate pöördumistes sisalduvad tahtlused;
- Muuseumide andmekvaliteedi parandamine — Eesti Muuseumide infosüsteemile MuIS muuseumiobjekti „olemuse“ (foto, dokument, pilt, jne) tuvastamiseks mudeli loomine nagu võimalus panustada Eesti kultuuripärandi säilimisse;
- Tartu pildipanga objektituvastus — Tartu pildipanga piltide märgendamine, et muuta need kergesti leitavaks ja taaskasutavaks;
- Oskuste tuvastamine tekstidest — metsanduse ja puidutööstuse ning metalli- ja masinatööstuse tekstidest oskuste tuvastamine, et muuta karjääriplaneerimist lihtsamaks.
Taibutalgute tulemused
Ühe kuu kestnud võistlus tõi kokku Kaggle keskonnas ligi 40 andmeteadlast kogu maailmast, kes üksi või koos teiste osalejatega esitasid 300+ mudelit reaaleluliste probleemide lahendamiseks. Osa pakutud mudeleid said püstitatud ülesannetega hakkama üle 90% täpsusega, mida saab pidada väga heaks tulemuseks. Rääkides andmeteadlastega saime teada, et nad pidasid enda poolt lahendatud probleeme aktuaalseteks, ning arvasid, et võistluste raskusaste, treeningandmed ja lahenduste formaat oli Kaggle’i jaoks sobivad.
Peale võistluse toimumist esitati kõige täpsemad mudelid probleeme formuleerunud asutustele, et nad saaksid neid rakendada.
Andmeteaduse taibutalgutel leidsime lahendusi reaalelulistele probleemidele, arendades AI Gov-stacki ning seeläbi luues väärtust kogu ühiskonnale!
Sofia Paes
Andmete nõunik
Majandus- ja Kommunikatsiooniministeerium