Human Learning vs. Machine Learning

Published in

EDTECH KISK

11 min readMay 17, 2019

Jakým způsobem se učí lidé a jakým počítače? Mají počítače nad lidmi opravdu náskok? Nebo je naopak nikdy nedoženou? Kdo je lepší v kreativní práci? Jsou počítače schopné napsat třeba knihu?

Možná jste už někde zaslechli, že neuronové sítě umožňují učení a existují jak v lidském mozku, tak v rámci umělé inteligence. Možná vás také napadne, jestli je ten stejný název náhodný nebo spolu obě sítě souvisí. Ve druhém případě byste měli pravdu. Umělá neuronová síť opravdu vychází z té biologické, ale přesto nejsou stejné. V čem má navrch umělá neuronová síť a v čem ta biologická?

Lidský mozek je v mnoha ohledech výkonnější a „chytřejší“ než počítač. Dokáže rozeznat humor, sarkasmus a malé citové nuance textu a chování lidí. Také pro nás není obtížné opsat třeba captcha kódy a na první pohled rozeznat, na kterém z více obrázků se nachází auto. Pro počítač jsou takové obrázky jen hromada pixelů a musí se nejprve natrénovat, aby auta na obrázcích spolehlivě rozeznal.

Naproti tomu počítače mají ale před lidským mozkem obrovskou výhodu a tou je jejich rychlost a přesnost.

Otázkou tedy je, kdo je ve výsledku výkonnější a „lepší“?

Pojďme si napřed trochu popsat, jak vlastně vypadají umělé a biologické neuronové sítě a jak se díky nim počítače i lidé učí.

Lidský mozek obsahuje asi 100 miliard neuronů. Všechny neurony jsou mezi sebou spojeny synapsemi a tvoří komplexní síť, po které se mohou přenášet informace a vnější podněty, na které mozek reaguje. Lidský mozek je mimo jiné skvělý v přizpůsobování se prostředí a ve schopnosti učit se z vnějších podnětů. Představte si třeba příklad, když po nějaké době potkáte starého kamaráda, který mezitím změnil účes. Tuto novou skutečnost nejspíš hned zaznamenáte a kamaráda i přesto poznáte.

Umělá neuronová síť naproti tomu neobsahuje ani zdaleka tolik „neuronů“ — uzlů ani spojení mezi nimi jako lidský mozek. Také se k poznání nějaké skutečnosti a vyvození výsledků musí natrénovat, ale o tom podrobněji až za chvíli.

Jak se učí lidé?

Učení je proces, kterým si osvojujeme nové znalosti, návyky, měníme naše názory a chování. Impulzem k učení bývá zájem o danou tematickou oblast nebo schopnost. My se zaměříme na pojmové učení, což je právě proces nabývání znalostí, jaký si většina z nás pod pojmem „učení“ představí.

Mezi další typy učení patří třeba učení senzomotorické, které se nejvíce rozvíjí u dětí nebo třeba habituace, tedy upravování svých návyků podle prostředí, v kterém se vyskytujete. V porovnání s machine learning tyto typy ale asi nejsou až tak relevantní, proto o tom jindy.

Co se týká pojmového učení, lidé se učí už jen prostřednictvím konverzace s dalšími a vyjadřováním svého názoru a znalostí o tématu, čímž se jim rozšiřuje pohled na věc a „databáze“ znalostí a upravuje názor. Také stačí, když budete nad konkrétním tématem nebo problémem přemýšlet a zkoušet věc pochopit z více úhlů. Taková konverzace nebo kontemplace potom může vést k dalšímu vyhledávání informací a rozšiřování povědomí o učené látce. A samozřejmě, ne nadarmo se říká, že člověk se nejvíc naučí, když si nějakou činnost vyzkouší. Učíme se, když zkoušíme úplně novou věc, ale také když opakujeme to, co již umíme a přidáváme si k naučenému postupu malé kroky navíc. Tento postupný vývoj a ověřování našich domněnek se nazývá experiential learning, tedy učení ze zkušenosti a přišel s ním David A. Kolb.

Experiential learning tedy je, jak bylo již naznačeno, kontinuální cyklus, v němž se opakují 4 fáze učení. Prožitou situaci nebo zkušenost reflektujeme, vyvozujeme závěry k jejímu zlepšení, které po sléze aplikujeme a celý proces se opakuje.

Slyšeli jste také někdy, že se všichni lidé neučí stejným způsobem? Že někdo se nejvíce naučí, když si zapisuje poznámky, někdo, když si je přeříkává nahlas a někdo třeba když ho zkouší jiná osoba. Tento názor je ve společnosti tak zakořeněný a využívaný, že ani nepřemýšlíme nad tím, že by mohl být nepravdivý. Z Kolbova cyklu totiž můžeme vyvodit, že ve skutečnosti si člověk v procesu učení projde všemi styly učení. Musí o problému a již zjištěných poznatcích přemýšlet, pochopit je, rozvíjet otázky týkající se hlubšího pochopení problému, a nakonec je zkusit aplikovat, z čehož opět získá nové vědomosti. David A. Kolb sice jako součást své teorie učení uváděl i různé styly učení, tento přístup byl ale později vyvrácen a místo toho byla zdůrazněna nutnost látku pochopit. Již v roce 1973 byla provedena studie, která porovnávala schopnost expertních hráčů šachu a nováčků zapamatovat si rozmístění figurek v herním poli. Výsledkem bylo zjištění, že experti si dokázali zapamatovat mnohem více pozic figurek než nováčci. Důvodem nebyly odlišné styly učení, ale fakt, že experti dokázali velmi rychle identifikovat a pochopit herní strategii a podle toho si figurky snáz zapamatovat. Ale v momentě, kdy byly šachové figurky v herním poli rozmístěny zcela náhodně, ztratili i experti schopnost zapamatovat si rozmístění jednotlivých figurek, jelikož již nebylo možné odhalit herní strategii.

Jak se učí počítač

Jak již název vypovídá, machine learning se zabývá schopností počítače učit se. Obecně se jedná o snahu zautomatizovat proces učení a přisvojit počítači schopnost poučit se z předchozí zkušenosti bez toho, aniž by se musel programově upravit. Ale jak se stroj dokáže sám učit? Využívá k tomu neuronovou síť! Jistě mnohé z vás napadne, že neuronovou síť máme přece taky! A opravdu, umělá neuronová síť je založena na principu té biologické, ale přesto nejsou totožné. V umělé neuronové sítě jsou uzly rozmístěné rovnoměrně ve vrstvách a pracují s tzv. váhami, které vyhodnocují důležitost vstupů k učení pro daný uzel. Kromě uzlů pracuje neuronová síť i s prahy, které ovlivňují míru aktivace uzlu.

Tento systém je dost složitý, ale samotný princip neuronové sítě není tak těžký na pochopení. Doporučuji podívat se na tento model neuronové sítě a vyzkoušet si vliv množství dat na vstupu, počet uzlů a vliv změny vah a prahů. Kromě toho si vše můžeme představit na praktických příkladech.

V tomto rychlém pokusu je nastíněno, že stroje se dokáží učit stejně dobře, jako lidé. Představte si situaci, kdy znáte jen několik vět z nějakého cizího jazyka (to jsou pro vás informace na vstupu) bez jakýchkoliv dalších souvislostí. Pokud se vás zeptám, co bude následovat po některém konkrétním slově z vět, nejspíše vaši odpověď získáte tím, že projdete příklady vět (stejně jako při proces trénování neuronové sítě), které již znáte a zjistíte, jaká slova se po tom zadaném vyskytují. Na základě tohoto natrénování mi odpovíte a já vám odpověď zvaliduji. A u počítače je proces hodně podobný.

Jiným příkladem je třeba proces učení studentů. Na zkoušku se (alespoň většina) snaží dostat do hlavy co nejvíce „dat“, ať už z vlastních zápisků, doporučené literatury nebo volně dostupných informací. Pokud zkoušku náhodou neudělají, bude je nejspíš zajímat, na které otázky odpověděli špatně a své odpovědi porovnají s těmi správnými (validace). Tím si poupraví set naučených znalostí, aby příště u zkoušky uspěli. Stejně jako tento výcvik lidského mozku probíhá i machine learning.

Na základě předchozích příkladů už můžeme rozlišit pattern a jednotlivé fáze strojového učení.

Fáze přípravy setu dat a trénování:

K tomu, aby se neuronová síť něco naučila potřebuje vzorek dat, na kterých se může natrénovat. Představte si, že máte třeba velkou databázi tulipánů a chcete neuronovou síť naučit rozeznávat jejich jednotlivé druhy. Proto jako vstupní data poskytnete neuronové síti vzorek z této databáze. Není rozumné dát ji celou databázi najednou, aby nedošlo k tzv. přetrénování neuronové sítě. To jednoduše znamená, že neuronka by se sice naučila naprosto přesně to, co jste jí poskytli, ale další tulipány (například s jemnými rozdíly lístků) by už nebyla schopna zařadit nebo by je zařadila špatně.

Tím se dostáváme k další fázi učení.

Fáze testování a validace:

Namísto toho, abychom neuronové síti dali na vstup celou naši databázi tulipánů, je vhodné předložit neuronové síti postupně jen vzorek dat, na kterém se naučí jednotlivé druhy tulipánů, a poté jí předložit další malý vzorek, na základě čehož si neuronová síť upraví váhy a prahy a rozšíří si „znalosti“ o tulipánech. Tento proces se může opakovat do té doby, dokud neuronka není schopna bezchybně rozlišovat druhy tulipánů.

Když celý příklad s tulipány shrnu, počítače mají tedy za úkol natrénovat si „mozek“ na setu dat a své „znalosti“ upravit podle výsledků. Tímto se dostáváme k druhům strojového učení rozdělených podle přístupů k procesu machine learningu.

Supervised learning neboli učení s učitelem spočívá v poskytnutí dat neuronové síti a jejím natrénování na tomto vzorku, přičemž očekáváme správný, předem známý výstup. Tím, že správný výsledek je předem daný, můžeme porovnat výstup s tímto výsledkem a nasměrovat neuronovou síť (například upravit váhy uzlů) ke správným výsledkům. Díky tomuto dohledu a kontrole nazýváme tento typ učení supervised learning — učení s dohledem nebo učení s učitelem. Supervised learning je zároveň nejrozšířenější metodou strojového učení.

Supervised learning můžeme také rozdělit podle použití metod. Mezi metody patří classification, tedy klasifikace, rozřazení vstupních dat do předem známých kategorií (to je např. případ naší databáze s tulipány), regression, neboli regrese, spočívající v nalezení parametrů a vytvoření modelu aproximujícího data, a predikce, kdy jsou počítači poskytnuta historická data a požadovaná předpověď dalšího vývoje (např. jak se budou vyvíjet zisky firmy, ceny komodit atp.). S predikcí je ale potřeba zacházet opatrně. I když je počítač schopný historická data zpracovat a vyvodit z nich další pravděpodobný vývoj, musíme myslet na to, že ani on nemá křišťálovou kouli, z které by vyvěštil budoucnost. Predikci je vhodné použít jen na malý časový úsek dalšího vývoje a je třeba poskytnou neuronové síti dostatečné množství dat. Je třeba mít na paměti, že výsledek vznikne čistě na základě poskytnutých dat, a tak není možné předpovídat například roční pohyb akcií s poskytnutím dat za jeden měsíc jejich pohybu na burze. Predikci je moudré využívat především na malé časové úseky periodicky se opakujících jevů (například sezónnost zboží atp.).

Při Unsupervised learning tedy při učení bez učitele, je počítači poskytnut jen vstup v podobě vzorku dat, bez předem známých výsledků. V podstatě necháme algoritmus, aby se s daty sám popral a ukázal nám zajímavé výsledky. Unsupervised learning je právě využíván k odhalení dalších poznatků, možných souvislostí a struktur dat. Učení se nazývá bez učitele právě proto, že žádný výsledek není špatně, nemusíme výstupy opravovat, a tak není potřeba ani učitel.

Unsupervised learning užívá mimo jiné dvě hlavní metody. Clustering, tedy shlukování, je metoda, při které jsou objekty rozčleněny na shluky podobných vlastností. Tato metoda může být využita například při doporučování písniček na Spotify. Pokud nejčastěji posloucháte třeba pomalé písničky s mužskými zpěváky, Spotify každou další písničku porovná a zařadí ji do odpovídajícího clusteru. U rychlých písní s ženským hlasem pak bude pravděpodobné vyloučení. Pokud si poslechnete středně rychlou písničku s mužským hlasem a vyhodnotíte ji jako dobrou, rozšíří se cluster toho, co se vám líbí. Tato metoda úpravy clusterů se nazývá K-means.

Druhou metodou unsupervised learningu je association, tedy asociace, spočívající v identifikování vztahů mezi různými objekty. Výstupem může být zjištění, že například zákazníci, kteří nakupují zboží A nejspíše koupí i zboží B. Toho je možné využít opět v doporučování produktů.

Semi-supervised learning je dalším typem učení a kombinací učení s učitelem a bez učitele. Tento typ učení se využívá především u velkých vstupních setů dat, kdy část z nich je označená (tzn. je znám správný výstup) a druhá (větší) část, jsou data s neznámým výstupem. Příkladem může být například galerie obrázků, kdy některé jsou označeny a podle toho, co na nich je. Tyto obrázky počítač klasifikuje a zbytek neoznačených obrázků rozřadí buďto do těchto vytvořených nebo ještě dalších kategorií. Při semi — supervised learningu se užívá kombinace metod supervised a unsupervised learningu.

Reinforcement learning neboli zpětnovazebné učení je posledním typem strojového učení. Jedná se v podstatě o metodu podobnou supervised learning, kdy jsou poskytnuta vstupní data i známé správné výstupy. Počítač si ale algoritmus neupravuje přímo podle správných výstupů ale podle průběžné zpětné vazby.

Zpětnovazebné učení existuje i v behaviorální psychologii a má stejný princip. Za správné chování dostáváme odměny, za špatné tresty. Po určitém množství takových zkušeností se naučíme, co se od nás očekává.

Teď, když známe proces lidského učení a proces strojového učení a jeho typy je čas na vyhodnocení!

Počítač vs člověk:

Rychlost je asi jasná! I když počet synapsí v lidském mozku je daleko vyšší než v umělé neuronové síti, počítače jsou daleko rychlejší, a to hlavně díky velmi úzké specializaci neuronové sítě (má prostě jen jeden úkol).

1:0 pro počítač

„A jak je to s přesností?“

Opět — tím že je neuronová síť velmi úzce specializovaná, je i přesnější. Tento rozdíl jde vidět na příkladu s omezenou znalostí slov uvedeném výše, kdy počítač velmi přesně vypočítal pravděpodobnost použití určitého slova.

2:0 pro počítač

„No dobře, dobře. Počítač je sice rychlý a přesný, ale lidský mozek má přece mnohem víc úkolů!“

Ano, především nás udržet při životě, ale už i to je hodně! Při pokusu napodobení 1 sekundy aktivity lidského mozku to počítači trvalo 40 minut! Náš mozek prostě skvěle zvládá multitasking.

2:1

„A co pocity? Pocity přece počítač nemá!“

To je pravda! I když jde umělá inteligence dopředu raketovou rychlostí, lidé stále zvládají práci s fantazií, pocity a emocemi lépe.

2:2

„Ale člověk je přece kreativnější!“

Jedním z argumentů v neprospěch umělé inteligence je to, že nemá kreativní cítění. V tomto hezkém příkladu je ale dokázáno, že i neuronové sítě mohou být zdatnými básníky!

K tomu, abychom napsali nějaký text, natož báseň, potřebujeme uložiště se slovní zásobou — paměť. Většina neuronových sítí paměť nemá a data jimi prochází jen jedním směrem — od vstupu po výstup. Existují už ale i tzv. rekurentní neuronové sítě, které umožňují pohyb dat oběma směry a tím pádem si data i ukládat a zpětně využívat. Takové neuronové sítě je obtížnější natrénovat, nicméně to není nemožné a už dohání lidskou činnost i v takových oblastech, jako je psaní básní.

Takže člověk vs. počítač?

Nad výsledným skóre popřemýšlejte sami. Pro mě je to nerozhodně. 😊

Zdroje:

The Learning Process. UBC Learning Commons [online]. University of British Columbia, Vancouver [cit. 2019–05–13]. Dostupné z: https://learningcommons.ubc.ca/tutoring-studying/selfassessment/the-learning-process/

CHASE, WILLIAM G. a HERBERT A. SIMON. Perception in Chess [online]. 1973 [cit. 2019–05–13]. Dostupné z: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.601.2724&rep=rep1&type=pdf

Learning styles & the importance of critical self-reflection: TedXTalks. Youtube [online]. 2015 [cit. 2019–05–13]. Dostupné z: https://www.youtube.com/watch?v=855Now8h5Rs

The 3 minute Kolb. Youtube [online]. 2013 [cit. 2019–05–13]. Dostupné z: https://www.youtube.com/watch?v=ObQ2DheGOKA

Biological Neural Network and Artificial Neural Network | Machine Learning Tutorial | Great Learning. Youtube [online]. 2017 [cit. 2019–05–13]. Dostupné z: https://www.youtube.com/watch?v=km0-yahmwno

Machine Learning Tutorial: Supervised Learning. Youtube [online]. 2017 [cit. 2019–05–13]. Dostupné z: https://www.youtube.com/watch?v=Ig1nfPjrETc

Středověk umělé inteligence skončil, seznamte se s neuronovými sítěmi, které umí psát básně. Machine Learning Guru [online]. 2015 [cit. 2019–05–13]. Dostupné z: http://www.mlguru.com/cs/basnik/

Supervised Machine Learning: Classification. Towards Data Science [online]. 2018 [cit. 2019–05–13]. Dostupné z: https://towardsdatascience.com/supervised-machine-learning-classification-5e685fe18a6d

Supervised and Unsupervised Machine Learning Algorithms. Machine Learning Mastery [online]. 2016 [cit. 2019–05–13]. Dostupné z: https://machinelearningmastery.com/supervised-and-unsupervised-machine-learning-algorithms/

An introduction to Machine Learning. GeeksforGeeks [online]. [cit. 2019–05–13]. Dostupné z: https://www.geeksforgeeks.org/introduction-machine-learning/

ML | What is Machine Learning ?. GeeksforGeeks [online]. [cit. 2019–05–13]. Dostupné z: https://www.geeksforgeeks.org/ml-machine-learning/

Člověk vs počítač: Překoná stroj lidský mozek?. Green Fox Academy [online]. 2018 [cit. 2019–05–13]. Dostupné z: https://www.greenfoxacademy.cz/post/clovek-vs-pocitac-prekona-stroj-lidsky-mozek

Tensorflow [online]. [cit. 2019–05–13]. Dostupné z: https://playground.tensorflow.org

Human Learning vs. Machine Learning

Written by Alena Frydrychova