Umělá inteligence a učení

Andrea Waltlová
EDTECH KISK
Published in
11 min readMay 29, 2019

Co to umělá inteligence je? Kde se sní můžeme setkat? Jak umělá inteligence souvisí s učením? A jakou má roli ve vzdělávání lidí?

Zdroj: Flickr

Uměla inteligence (Artificial intelligence — AI) je všude kolem nás — řídí naše auta, ovlivňuje naše rozhodování, určuje, co vidíme za vybrané příspěvky na sociálních sítích, vybírá hudbu na Spotify — a to je jen zlomek z možných příkladů. Spousta lidí se s rozvojem AI obává, že jejich pracovní místa budou nahrazeni stroji — tedy umělou inteligencí. Může se to ale stát i učitelům? Může umělá inteligence nahradit i takto důležitou profesi na které záleží vzdělání budoucích generací? V tomto článku bude krátce představeno několik způsobů, jak umělá inteligence zasahuje do oblasti vzdělávání.

“We can achieve both great artificial intelligence and great privacy standards. It’s not only a possibility, it is a responsibility. In the pursuit of artificial intelligence, we should not sacrifice the humanity, creativity, and ingenuity that define our human intelligence.”(Tim Cook, zdroj)

Co se vlastně pod pojmem umělá inteligence skrývá?

Než se přesuneme k různým formám umělé inteligence, bylo by záhodno říci, co vlastně umělá inteligence je a co si pod ní můžeme představit.

Jednoduše řečeno, umělá inteligence je označení pro stroje nebo systémy, které napodobují lidskou inteligenci. Dá se také říci, že umělá inteligence napodobuje lidské kognitivní schopnosti jako je řešení problémů, učení, rozpoznávání jazyka, nebo také vizuálních vjemů (například fotografií).

Kdy lze stroj považovat za inteligentní?

Tuto otázku si lidstvo pokládá již dlouhá léta. Odpověď na ni nabízí Turingův test, který v roce 1950 předložil Alan Turing. Podle něho je stroj inteligentní tehdy, pokud nejsme schopni rozeznat, že nám na otázku odpovídá stroj nebo člověk.

Tento test však vůbec nepočítá s tím, že stroj také porozumí obsahu a smyslu otázky, testuje pouze odpověď. Tento argument se nazývá argument čínského pokoje, předložil ho filozof John Searl (1980). Díky tomu se můžeme setkat s rozlišením „slabé“ a „silné“ umělé inteligence. Turingův test by při tomto rozdělení testoval pouze slabou AI.

Problém napodobení lidské inteligence můžeme dále rozdělit na dílčí problémy:

  • Uvažování, řešení problémů
  • Reprezentace znalostí (ontologie, web ontology language)
  • Plánování
  • Učení (Machine learning)
  • Zpracování přirozeného jazyka (Natural language procesing)
  • Vnímání (Machine perception)
  • Pohyb a manipulace (zejména v Robotice)
  • Sociální inteligence
  • Obecná inteligence

S umělou inteligencí souvisí i poměrně nový pojem deepfake, kterým se označují falešná videa. Tyto videa jsou upravena a zkonstruována za pomoci pokročilého zpracování dat a umělé inteligence. Tady už se však dostáváme spíše do oblasti dezinformací, která není předmětem tohoto článku.

Soft computing

Tento pojen je spojen se skutečností, že poznávání našeho reálného světa je plné nepřesností a neurčitostí.

„Do této kategorie spadají metody, jejichž cílem je vypořádat se s nepřesným popisem reálného světa a umožnit počítači odvozovat v případech, kdy jsou k dispozici pouze nedokonalá data“ (Flasiński, 2016, s. 26).

„Fuzzy“ počítání

Pojem fuzzy ve spojení fuzzy množina nebo fuzzy logika spadá pod obor matematické logiky. Podstatou tohoto oboru je překonat vágnost pojmů přirozeného jazyka, jako je například pojem vysoká teplota. Jakou teplotu lze označit za vysokou?Pro každého člověka znamená tento pojem jinou hodnotu. Mezi znalostmi získanými přirozeným poznáním a znalostmi získanými poznáním metodou exaktních věd, je kvalitativní propast. Ve fuzzy počítání se tak jedná o to, jak inherentně vágní výroky přirozeného jazyka, převést do formálního jazyka, jímž v tomto případě je fuzzy logika a překonat tak zmíněnou propast.

Video vysvětlující Fuzzy logiku

Bayesovské sítě

Jedná se o pravděpodobnostní grafický model, který je schopen modelovat problémy, ve kterých je třeba pracovat s nejistými, neurčitými (vágními) informacemi.

Bayesovské sítě lze využívat pro různé účely. Mohou odpovídat například na otázky:

  • Jaká je velikost podmíněné pravděpodobnosti za daných pozorovaných hodnot?
  • Jaká informace by nejvíce pomohla se rozhodnout?
  • Na kterých proměnných je výsledek nejvíce závislý?
  • Jaká je nejpravděpodobnější příčina pozorovaného stavu?

Do bližšího vysvětlování se pouštět nebudu, jelikož se jedná o pro mě složitou problematiku. Více je možné přečíst si například v prezentaci z Fakulty informatiky Masarykovy univerzity zde.

Umělé neuronové sítě

Umělá neuronová síť je jedním z výpočetních modelů (patří sem například také již zmíněný Turingův stroj) používaných v umělé inteligenci.

Jak už název napovídá, umělá neuronová síť je odvozená z bilogické struktury neuronů a podle toho také funguje. Tyto sítě tak můžeme naučit rozpoznávat různé objekty, třeba i obrázky. V dnešní době dokáže umělá inteligence dokonce generovat tváře lidí, kteří neexistují. Pokud tedy potřebujete fotku náhodné neexistující osoby stačí jen aktualizovat stránku https://thispersondoesnotexist.com/.

„ For example, in image recognition, they might learn to identify images that contain cats by analyzing example images that have been manually labeled as “cat” or “no cat” and using the results to identify cats in other images. They do this without any prior knowledge about cats, for example, that they have fur, tails, whiskers and cat-like faces. Instead, they automatically generate identifying characteristics from the learning material that they process.“ (zdroj: Wikipedie)

Způsoby učení neuronové sítě -> tzv. učící paradigmata

Supervised learning (Učení s učitelem) — učení na základě testovacího vzorku (daný vstup a očekávaný výstup)

Unsupervised learning (Učení bez učitele)— při učení bez učitele se nevyhodnocuje výstup dat, síť dostane sadu vzorků, které si sama roztřídí

Generování lidských portrétů

Strojové učení

Jedná se o podoblast AI, která se zabývá algoritmy a technikami, díky kterým se počítačový systém (stroj) dokáže „učit“. Učením je myšlena taková změna stavu, která zefektivní schopnost přizpůsobení se změnám okolního prostředí. Strojové učení je propojeno s oblastí statistiky a „data mining“ (dolování dat). Jeho techniky se využívají např. v biomedicínské informatice (tzv. systémy pro podporu rozhodování), rozlišení nelegálního užití kreditních karet nebo rozpoznávání řeči a psaného textu.

Existuje několik základních algoritmů strojového učení:

  • Klasifikace(Clasification) rozděluje vstupní data do dvou nebo několika tříd — patří do supervised learning
  • Regrese(Regression) odhaduje číselnou hodnotu výstupu podle vstupu — také patří do supervised learning
  • Shlukování (Clustering) zařazuje objekty do skupin s podobnými vlastnostmi — patří do unsupervised learning

Přijde mi poněkud zbytečné opakovat v tomto článku pouze informace již několikrát řečené v podobných článcích mých drahých spolužáků. Přidávám proto odkaz na TED talk Anthony Goldblooma (spoluzakladatel CEO společnosti Kaggle), který strojové učení považuje do budoucna za nejdůležitější odvětví umělé inteligence.

Zmiňuje například, že algoritmy již dokázali ohodnotit eseje studentů stejně dobře jako učitelé, nebo rozpoznat nemoc oka stejně dobře jak oftalmologové. Pokud chcete vědět v čem mají lidé navrch oproti strojovému učení, určitě se na video podívejte.

Dolování dat

Jinými slovy vytěžování dat (analogie těžení potřebných prvků) kombinuje poznatky ze statistiky a databázových systémů. Cílem dolování dat je z velkých vzorků a souborů dat vyčíst skryté na první pohled neviditelné vztahy a informace. Jedná se o pojem z oblasti Bussines Intelligence, kde tyto informace je možné použít k předpovědi chování zákazníka nebo z nich získat konkurenční výhodu.

Pokud „dolujeme“ data je to buď za účelem deskripce nebo predikce, případně můžeme hledat zajímavé odchylky.

  • Predikce (Prediction) — umožňuje předvídat budoucí hodnoty atributů na základě nalezených vzorů v datech, ale nemůžeme například na základě dat za jeden měsíc predikovat vývoj na rok dopředu (záleží na datech)
  • Deskripce (Description) — popisuje nalezené vzory a vztahy v datech, které mohou ovlivnit rozhodování, tento účel je dle mého názoru častější
  • Hledání nugetů — zjištění zajímavých odchylek od normálních hodnot

Existuje několik metod, které se používají (na základě zvoleného typu cíle/účelu)

Statistické metody — Kontingenční tabulky, Regresní analýza, Shluková analýza, Diskriminační analýza

Strojové učení (o kterém jsme si už něco řekli výše) — rozhodovací stromy, neuronové sítě, Bayesovské sítě, rozhodovací pravidla

AI ve vzdělávání

Dolování dat ve vzdělávání

Pro dolování dat ve vzdělávání existuje samostatný obor (ano vážně!), který se nazývá Educational data mining (EDM). Zabývá se tím, jak je dolování dat aplikované na data získaná ze vzdělávacích systémů.

Pro představu se může jednat například o data:

  • kdy student přistupoval k učebnímu objektu
  • kolikrát k němu přistoupil
  • kolik minut byl učební objekt zobrazen na obrazovce počítače uživatele

V poslední době je EDM aplikováno pro řadu účelů. Jedním z významných cílů využití EDM je hledání empirických podkladů pro zpřesňování a rozšiřování pedagogických strategií. V praxi může EDM pomoci vyučujícím a adminstrátorům kurzů analyzovat aktivity studentů a využívání učebních materiálů za účelem vylepšení kurzů. Pomáhá také s analyzováním podpory výuky a zjištěním, které didaktické strategie a metody jsou nejúčinnější a za jakých podmínek (Rathouz, 2017)

Zdroj

Ryan S. Baker and Kalina Yacef identifikovali následující cíle EDM:

  1. Predikování studentova budoucího chování — S využitím studentského modelování může být tohoto cíle dosaženo vytvořením studentských modelů, které zahrnují charakteristiky žáka, včetně podrobných informací, jako jsou jejich znalosti, chování a motivace učit se. Měří se také uživatelská zkušenost žáka a jejich celková spokojenost s učením.
  2. Objevování nebo zlepšování doménových modelů — Příklady zahrnují ilustraci vzdělávacího obsahu pro zapojení žáků a stanovení optimálních instruktážních sekvencí na podporu studijního stylu studenta.
  3. Studium efektů podpory vzdělávání, které lze dosáhnout prostřednictvím vzdělávacích systémů.
  4. Posílení vědeckých poznatků o učení a studentech budováním a začleněním studentských modelů, oblastí výzkumu EDM a používaných technologií a softwaru.

Na Masarykově univerzitě (dále jen MU) by se tak mohlo jednat například o Odpovědníky v Informačním systému, případně o přístupy k osnově předmětu (momentálně můžeme vidět pouze procentuální progress). Datovým výstupem je také zcela jistě předmětová anketa, díky které se zlepšuje a zkvalitňuje výuka jednotlivých předmětů. Samostatným zdojem dat může být také e-learningový portál elf na Filozofické fakultě MU. Bohužel jsem nebyla schopna zjistit, zda MU nějakým způsobem data zpracovává a vyhodnocuje. Předmětovou anketu určitě čtou učitelé, kteří se mohou, ale také nemusí řídit jejím výsledkem. Na základě zpětné vazby od studentů pak mohou upravovat například obsah předmětu.

Zpracování přirozeného jazyka ve vzdělávání

Zpracování přirozeného jazyka (anglicky natural language processing, NLP) je interdisciplinární obor, kam spadá hlavně lingvistika, počítačová věda a kognitivní psychologie. Obor se zabývá teoreticky založenými výpočetními technikami pro analýzu a reprezentaci textových dat.

“Texty jsou zpracovávány v rámci jedné nebo více úrovní lingvistických analýz (lexikální, sémantická, morfologická apod.) za účelem napodobit lidské zpracování jazyka pro různorodé aplikace. Vzhledem k faktu, že NLP usiluje o napodobení člověka, je patřičné na ni nahlížet jako na disciplínu AI.” (Rathouz, 2017)

Možné využití ve vzdělávání

  • Adaptace textu — přepsání textu do více čitelné formy
  • Sumarizace textu — vytáhnutí klíčových a důležitých částí textu
  • Simplifikace textu —například nahrazení odborných nebo těžce pochopitelných výrazu synonymy
  • Klasifikace textu, indexace, klíčová slova
  • Hodnocení studentem konstruovaných odpovědí
  • Učení dialogem — dialogový systém může mít formu pedagogického agenta (agenti s konverzačními schopnostmi se nazývají chatboti)

Na světě již existuje několik příkladů, kdy umělá inteligence hodnotí eseje právě díky zpracování přirozeného jazyka. Například v Číně se mluví o 92% úspěšnosti AI (porovnání s lidským hodnocením), navíc dokáže AI dávat také omezenou zpětnou vazbu. Mezi největší výhody NLP ve vzdělávání je vidina objektivního hodnocení studentů, snížení zátěže učitelů, kteří by se místo známkování mohli soustředit i na jiné aspekty práce. Zde je ale třeba zmínit, že NLP záleží hodně na zpracování konkrétního jazyka, český jazyk má oproti angličtině vlastní specifika.

Emoce ve vzdělávání

Existuji vzdělávací systémy, které berou v úvahu emoční stav studenta, nazývají se afektivní vzdělávací systémy (anglicky affective tutoring systems, ATS). ATS budou dost možná nástupcem dnešních vzdělávacích systémů, které berou v potaz pouze kognitivní vlastnosti studenta.

Imagine (zdroj)

Představte si, že se systém přizpůsobí podle toho, jestli se zrovna nudíte, máte náladu na vtipy, na dlouhé texty nebo na videa. Systém, který se snaží předcházet nepříznivým emočním stavům, případně se studentům snaží pomoci se s nimi vypořádat.

Mezi emoce, které různé ATS mohou rozpoznat se řadí například:

  • PAT2Math — Satisfied, disappointed, happy, sad, grateful, angry, ashamed
  • EER-tutor — Happy, smiling, angry, frustrated, neutral emotions
  • Mathspring — Confident, worried, excited, inactive, satisfied, frustrated, interested, bored

Samozřejmě záleží, jaké technologie daný ATS využívá, například systémy s kamerou rozeznají navíc výrazy obličeje, ze kterých se snáze poznají některé emoce. Některé ATS dokonce využívají i fyziologické senzory, jako snímaní srdeční aktivity.

Umělá inteligence ve školství v ČR

Například na Západočeské univerzitě v Plzni vyvinuli zajímavý software Pethevo, který je schopen vyhodnotit, které z kurzů různých univerzit se nejvíce podobají obsahem a úrovní kurzu.

For example, we are able to recognise similar Spanish language courses of similar difficulty at different schools. The algorithm creates its own interpretation of what a Spanish language course description looks like and understands the contents of the description.

U jazykových kurzů je možné zjistit, zda se vyučuje stejný jazyk, zda jde o shodný typ výuky, jak se shoduje obtížnost. Algoritmus rozumí obsahu textu nikoliv díky klíčovým slovům, ale porozuměním obsahu přirozenému textu bez předem stanovené struktury.

Dále existuje dokument o výzkumu potenciálu rozvoje umělé inteligence v ČR, který v prosinci 2018 zveřejnili autoři z Technologického centra, Ústavu státu a práva AV ČR a FEL ČVUT. V tomto dokumentu je mimo jiné uvedena i SWOT analýza stavu AI v ČR.

Mezi slabé stránky patří:

  • Neexistuje národní strategie rozvoje AI v ČR.
  • Aplikační VaV (výzkum a vývoj) neřeší přelomové inovace.
  • Nízké zapojení do mezinárodního VaV (výzkumu a vývoje).

Ve SWOT analýze socioekonomického dopadu z hlediska AI v ČR je zmíněna ve slabých stránkách : “nedostatečná připravenost učitelů na změny ve výuce”. V příležitostech poté využití: “AI jako asistenta učitele ve vzdělávání”.

Závěr

Tento článek představil několik pojmů — umělá inteligence, neuronové sítíě, strojové učení- Také zmínil některé možnosti využití různých odvětví AI ve vzdělávání, jako například data mining, zpracování přirozeného jazyka a emoce ve vzdělávání. Na závěr velmi krátce zmínil AI ve školství v ČR.

Zdroje:

--

--

Andrea Waltlová
EDTECH KISK

Interested in data analysis, programming in Python and unicorns.