Õigusrobootika / kratid.ee ideed tehisintellekti rakendamiseks riiklikus ja erasektoris.

Published in

Deep Law

7 min readFeb 10, 2019

Roland Pihlakas, 10. veebruar 2019

Käesolev postitus on seotud kratid.ee ideekorjega tehisintellekti rakendamiseks Eesti majandusruumi erinevates valdkondades.

Enamus ideid on seotud õigusrobootikaga. Osadele ideedele olen ehitanud ka prototüüpe, millele tekstis viitan. Võimalik, et tulevikus lisandub siia veel ideid. Mõtteid on palju ning kui soovid nende teostamises koostööd teha, siis oled igati teretulnud — peame nõu! Loodan, et nende teostumisest on ühiskonnale abi.

Vihje, tasub uurida ka selle ettevõtmise tulemusi:
http://www.just.ee/et/uudised/justiitsministeerium-ootab-ideid-oiguskeskkonna-arendamiseks

Õigustekstide otsingu rakendused ja muu õigustekstide haldus.

Semantilised otsingurobotid

Alljärgnevad ideed number 2–7 võivad huvi pakkuda ka Eesti Õigusbüroole (https://www.juristaitab.ee/).

1. Raportitele viidete otsing.

Ametnikud peavad paljude raportite ja otsuste juures viitama vastavatele paragrahvidele. Paraku on nõnda, et seaduste üldist sisu on lihtsam meeles pidada kui konkreetseid paragrahvide viidete numbreid.

Rakendada saab seda tehnoloogiat nii otsuseid tegevate ametnike puhul, kui ka nende puhul kes kusagil midagi järgi kontrollimas käivad (Politsei, Veeteede amet, Tarbijakaitse, Patendiamet, muud).

Deep Law loodud prototüüp tehtud Veeteede Ameti tegevuse näitel:
https://www.deeplaw.ai/findreferences/

2. Dokumendi sisu järgi toimuv otsing.

Kasutaja laadib üles dokumendi, semantiline otsingumootor leiab dokumendi sisule vastavad seaduselõigud.

Deep Law loodud prototüüp: https://www.deeplaw.ai/search/ (otsingu juures on selle funktsionaalsuse jaoks vormi väli nimega “Positive topic documents”).

3. Õigustekstide semantiline otsingumootor.

Et kasutaja saaks lihtsamini otsida, sealhulgas ka tavakasutaja, suudab otsingumootor tuvastada sõnade tähendused ning tänu sellele suudab otsida ka sünonüümseid sõnu. Samuti on otsingut võimalik täpsustada “negatiivsete” sõnadega, ehk teemadega, mida ei soovita leida.

Deep Law loodud prototüüp: https://www.deeplaw.ai/search/
NB! Prototüüp kasutab Eesti ning EU seaduste eesti-inglise paralleelkorpust aastast 2004. Paralleelkorpus on tekstide kogumik, millel on kahes või enamas keeles tõlked iga lõigu jaoks. Paralleelkorpus aitab arvutil automaatselt selgeks õppida sõnade tähendusi ning sünonüüme ka sama keele piires.
Kui on soov sellele lingile suurem hulk inimesi peale saata, siis palun eelnevalt teavitada, saan suurendada selleks ajaks arvutusvõimsust — hetkel suudab teha ühe kasutaja otsingut korraga, iga otsing võtab u 10–30 sek aega.

Viide konkursile, mille ülal viidatud mootor võitis:
http://www.oi.ut.ee/en/studies/finding-right-needle-right-haystack

Võimalikud materjalid, mida semantilise otsinguga võiks tulevikus saada otsida:
— https://oigusaktid.tallinn.ee/
— http://www.pohiseadus.ee/
— Elektroonilise Riigi Teataja sisu: http://avaandmed.rik.ee/andmed/ERT/
— Kohtuotsused.
— TÜ Õigusteaduskonna lõputööd.
— Tarbijakaitse Komisjoni otsused.
— EU seadused.
— Seaduste seletuskirjad.
— Juridica.
— Seaduste kommenteeritud väljaanded (esialgu need materjalid suuremalt jaolt ei ole digitaalselt saadaval).
— Õiguskirjandus.

Tasuliste allikate puhul saaks asi toimida analoogselt Google raamatuotsingule, otsing leiaks viite sobivale allikale, ning kuvada näidisena lühikest lõiku allikast. Kui kasutaja soovib tutvuda kogu allikaga, siis on tal tasulise allika puhul võimalik osta ligipääs.

4. Mõistete selgitused seaduse tekstide külge.

Mõisted oleksid allajoonitud lingid. Kui kasutaja läheb hiirega üle, siis kuvatakse mullike lühiselgitusega. Lingile vajutades kuvatakse kontekst, kust selgitus pärineb.

Võimalikud teostused:

Wikipedia abil: https://www.ut.ee/et/uudised/eesti-advokatuur-tartu-ulikool-teevad-eesti-riigile-uhise-kingituse
Definitsioonid sama seaduse ja muude samu mõisteid kasutavate seaduste tekstides.
Näiteks, “tahtlikkuse” mõiste ja selle alatüübid on mõnevõrra erinevalt kirjas Kriminaalkoodeksis ja Karistusseadustikus, kuid kasutatakse / viidatakse neid mõisteid ka mujal seadustes.
Samuti saaks kasutada mitmesuguseid seni suletumas vormis olnud seletuskirju ning kommenteeritud väljaandeid.
Viited muudele õiguskirjanduse artiklitele.

5. Paragrahvide külge reklaami lisamine.

Teenusepakkujate info, kes aitavad vastavas paragrahvis kirja pandud norme täita.

6. Õigustekstide otsingu juures automaatsete täpsustavate küsimuste küsimine.

Täpsustavaid küsimusi küsib otsingumootor automaatselt puhul, kui senine otsing saab viia erinevate teemadeni või temaatiliste alajaotusteni.

Näiteks sõna “piir” võib tähendada tolli või ka liikluse piirjoont.

7. Dialoogi põhine õigustekstide otsing juturoboti abil.

Otsing toimub dialoogi vormis: juturobot küsib otsingu algusest peale suunavaid küsimusi lähtuvalt sisse ehitatud õigusteemade puust, ning lähtuvalt kasutaja vastustest eelnevatele küsimustele.

8. Asutusesiseste dokumentide otsing.

Otsingumootor kasutab andmebaasi, mis on ligipääsetav ainult asutuse töötajatele. Abiks nii riikliku kui erasektori suuremates asutustes.

Keeletehnoloogial põhinevad õigustekstide haldused.

9. Raportite ja dokumentide klassifitseerimine / statistika.

Klassifitseerimine toimub automaatselt lähtuvalt teatud märksõnadest / semantilistest dimensioonidest, mis dokumendis leiduvad. Tehisintellekt saab keeletehnoloogia abil tuvastada muid sõnatüvesid ning ka sünonüümseid sõnu, mis on seotud statistika klassifikatsiooni märgitud peamiste sõnadega.

10. Kantseliidi “speller”.

Tuvastab tavakodanikule raskesti loetavamad sõnavormid ja keelekasutused ning joonib vastavad sõnad või lauseosad alla.

Näiteks Tallinna linna Teenuste veebis http://www.tallinn.ee/teenused olevaid tekste saaks teha lugejasõbralikumaks.

Praegu saadaolevate moodulite abil on võimalik tuvastada näiteks järgnevat:

Teatud tegusõnavormid on väga korduvad.
Teatud võtmesõnu võiks loetavuse huvides muuta sedasi, et oleks suure algustähega.
Kasutada EKI ametnikele mõeldud andmebaasist pärinevat teavet lausevormide automaatseks kohendamiseks. EstNLTK keeletehnoloogia moodulite abi kasutav algoritm saab EKI lehel toodud näidistest üldistada ka muude sarnase ehitusega lausete peale, mis sisaldavad sama võtmesõna kõrval juba muid mitte-võtmesõnu, kui EKI näidetes, ning soovitada vastavalt parandusi lause ehitusele.
Näidis:
Detailplaneering leidis heakskiitu ⇒ Detailplaneering kiideti heaks.
http://www.eki.ee/dict/ametnik/index.cgi?Q=leidma
Pikad laused muuta bullet listideks ning lisada bullet listide ette checkboxid. Näiteks kui tekstis on kirjas tingimused ja lisaks ka protseduurid, mida tuleb läbi teha, siis inimesel on võimalik koostada omale “TODO” nimekiri ja hiljem teostatud protseduure sammhaaval läbi joonida, ilma et peaks tihedas tekstis aina näpuga järge ajama.

11. Õigustekstide tõlkimine kontrollitud keelde.

Kontrollitud keel on keel, mida saab lugeda igaüks, kuid mille kirjutamiseks on tarvis väikest lisaharidust. Kontrollitud keele sõnavara ning grammatika on teatud moel piiratud / lihtsustatud. Tänu sellele suudab sellest keelest ühesel moel aru saada ka arvuti. Näiteks kirjutatakse sel moel lennukimanuaale, sest neis ei tohi leiduda vastuolusid.

Kontrollitud keel on lihtsamini loetav ka tavainimesele.

Tänu kontrollitud keele kasutamisele oleks tulevikus võimalik kasutada tunduvalt tõhusamaid õigustekstide otsingumootoreid, samuti saaks juba seaduse kirjutamise ajal automaatselt tuvastada võimalikud vastuolud muude olemasolevate seadustega või soovimatud mitmetitõlgendatavused (sihipärased mitmetitõlgendatavused võib alles jätta).

Eesti keelest autorile teadaolevalt ei ole kontrollitud keele vormi loodud, küll aga on mitmeid kontrollitud keele vorme inglise keelel. Inspiratsiooniks mõned näited:

Basic English.
Special English — kasutatakse uudistes.
Simplified Technical English — kasutatakse lennunduses ning kaitsetööstuses.
Attempto Controlled English — üks autoritest on eestlane Kaarel Kaljurand.
Palju muid piiratud sõnade arvuga sõnastikke, mida saab rakendada näiteks niiöelda “spelleris” sõnakasutuse keerukuse kontrolliks. Üks paljude sõnavara suuruse valikutega online speller on kasutatav siin:
https://www.online-utility.org/english/simple_basic_helper.jsp

Õigustekstidega seonduvad ideed, mis ei vaja tehisintellekti.

12. Tagasiside seaduste tõlgendatavuse ja sätete rakendamise kohta.

Kui õigesti mäletan, mainis Advokatuuri esimees Hannes Vallikivi seda, samuti hiljem üks investeerimisega tegelev isik.

Üsna lihtne teostada, ei vaja AI-d: brauseri laiendus (ennekõike Chromele ja Firefoxile) — iga paragrahvi, lõike ja alalõike juurde saavad kasutajad (ennekõike ametnikud) märkida enda tagasiside:

Märkida riikliku statistika huvides, milliseid paragrahve, lõikeid ning alalõikeid nad kasutavad. Võimaldab tuvastada seaduse osad, mis on niiöelda “surnud”, ehk mida ei kasutata. See võib tähendada, et need osad on kas arusaamatud / vajavad koolitamist-selgitamist, või on nood tülikad rakendada, aegunud, vms.
Tagasiside andmise võimalus — millises kohas ja millisel moel tekkis seaduse teksti tõlgendamisel raskusi. Vabateksti väli, kirjutada saavad kõik, samas kui tagasisidet vaadata saavad ainult seaduse “autorid” ja muud riigi poolt autoriseeritud isikud. Enda kommentaare näeb muidugi ka vastavate kommentaaride autor —samas teiste inimeste kommentaare igaüks ei näe.

Muud ideed tehisintellekti rakendamiseks avalikus sektoris.

13. Koormuse ennustamine lähtuvalt asukohast, kuupäevast, kellaajast.

Ennustamisel saab lähtuda ka liikuvatest pühadest ning tähtpäevadest, toimuvatest sündmustest piirkonnas, soovi korral ka ilmast:
— Liikluskoormus tänavatel;
— Liiklusõnnetused;
— Kiirabi väljakutsed;
— Tuletõrje väljakutsed;
— Politsei väljakutsed.
— Avaliku sektori teenindusasutused.

Analoogse algoritmi olen varasematel aastatel ehitanud StaffLogic projekti raames, kes müüs tööjõu planeerimise toodet ennekõike teenindusasutustele (seal toimub ennustamine konkreetse asukoha jaoks, mitte geograafiliselt).

Loomuliku keele masintöötluse (NLP) teemalisi linke.

Sketch Engine — eestikeelsete sõnade semantilised vektorid.
fastText — eestikeelse Wikipedia põhjal arvutatud sõnade semantilised vektorid.
EstNLTK keeletehnoloogia moodulid.
EstNLTK on kogumik Python 2.7/Python 3.4 teeke, mis pakuvad eestikeelsete vabatekstide töötlemiseks vajalikke baasoperatsioone.
Eesti ning EU seaduste eesti-inglise paralleelkorpus aastast 2004.
Paralleelkorpus on tekstide kogumik, millel on kahes või enamas keeles tõlked iga lõigu jaoks. Paralleelkorpus aitab arvutil automaatselt selgeks õppida sõnade tähendusi ning sünonüüme ka sama keele piires.

Muu õigusrobootika ning keeletöötluse teemaline kirjandus autorilt.

“Project: Legal accountability in AI-based robot-agents’ user interfaces.”
The central subject of this project is legal accountability in artificial intelligence. We are going to show who can justifiably and fairly be made responsible for the actions of artificial agents, and how can whitelisting help both artificial intelligence developers and legislators in making sure that we will have as few surprises as possible. In other words, the project will research the possible ways to control and limit the agents’ actions and learning from a legal point of view, by utilising specialised, humanly comprehensible user interfaces, resulting in clearer distinctions of accountability between the manufacturers, owners, and operators.
What happens when autonomous robots are not regulated or on the contrary, qualify as subjects of law?
Proposals have been made, that in order to have a worthwhile dialogue on the subject of regulating autonomous agents, we should first determine what are the problems that need to be solved via these regulations.
Making the tax burden of robot usage equal to the tax burden of human labour.
There have been proposals to introduce robot taxes. I would propose something slightly different as a potentially better alternative.
The main point of my proposal is that the tax burden of technology is currently lower than the tax burden of human resources and this will have to change sooner or later. By “technology” I mean all of the following: software, robots, even cyborgs, all other technological solutions, be it a trained bird on a branch — it makes no difference from the perspective of this proposed solution and no registration or classification will be necessary. Therefore this solution can not be bypassed by “legally correct” tricks for avoiding the taxes.
Project: Wise Woman in the Pocket — Google AI Impact Challenge application
I propose building a guide called the Wise Pocket Sage, which would contain the synthesis of life-wisdoms from books and similar sources, on one hand, and the presentness, observation capability, and initiative of a good friend, on the other. The proposed pocket sage would be something that gives advice when a person needs to hear it, in an unobtrusive manner.

Aitäh lugemast! Kui Sulle see kirjutis meeldis, plaksuta nii mitu korda, kui mitu endale meeldivat mõtet siit leidsid. Sel moel levib see kirjutis paremini. Samuti võid mu postitusi siin Mediumis jälgima hakata. Palun kommenteeri ja ütle, kuidas saaksin teksti paremaks teha!

Võta minuga julgelt ühendust —

Skype | Facebook | LinkedIn | E-mail