Adastra na VŠE: Kdo si hraje a neskóruje, nejspíš hledá patterny

Adastřani vyrazili mezi lidi. Přesněji mezi studenty Katedry informačních technologií na VŠE, kde se celý akademický rok koná DS&BI Academy, série lekcí zaměřených na Data Science a Business Intelligence.

Akademie navazuje na úspěch podobně zaměřených workshopů z minulého roku. Výjimečná je tím, že se zde role lektorů ujímají odborníci z praxe.

Jakub Augustín, Big Data Competency Lead

Příležitost získat praktické zkušenosti

Jak jsem se dozvěděl od Martina Potančoka, hlavního organizátora akademie, s většinou zapojených firem VŠE spolupracuje dlouhodobě. „Výběr jsme navíc rozšířili o další společnosti, které svým zaměřením zapadají do konceptu. Studenti tak mají možnost získat praktické zkušenosti a pracovat na reálných případových studiích.“

Adastra do programu přispěla čtyřmi odpoledními bloky. Abych zjistil, jak taková lekce pod taktovkou Adastřanů vypadá, jedné jsem se zúčastnil.

Kdo vyhraje v League of Legends? Napoví data

Bloky pořádané Adastrou se točí kolem datového souboru ze hry League of Legends. Studenti se učí s pomocí big data platformy Cloudera navrhnout a vytvořit predikční model, aby po skončení akademie dokázali například odhadnout vítěze hry pouze na základě složení týmu.

Skoro nikdo z přítomných hru nehrál, bylo tedy co vysvětlovat.

Na setkání, které jsem navštívil, se studenti učili data nahrávat, interpretovat, kontrolovat a pochopit.

Snažil jsem se s ostatními držet krok, ale stejně jsem na konci měl spoustu otázek.
Proč zrovna data z League of Legends? 
Souvisí to nějak s praxí?
A vedli si studenti podle očekávání?

Na odpovědi jsem se zeptal Jakuba Augustína a Dagmar Bínové, Adastřanů, kteří lekci vedli.

Dovedli byste co nejlidštěji shrnout, o čem byla dnešní přednáška?

Dagmar (D): Ona to hlavně nemá být přednáška. Nejvíc práce máme právě s tím, abychom ukázali především tu praktickou podobu. Teorie jsme řekli minimum… strašně maloučko (smích). A spíš jsme chtěli, aby to studenti pochopili z příkladů. To, co my bychom přednášeli na přednášce, si asi leckdy musí dostudovat doma.

„Dosť to kopíruje, ako s dátami pracujeme v praxi. Snažili sme sa, aby všetko bolo naozaj reálne, aby to neboli veci vymyslené len pre výučbu. Vzali sme si, ako normálne pracujeme, a na základe toho pripravili naše bloky.“

Jakub (J): Čo sa týka samotného obsahu prednášky, my sme ich chceli dostať do situácie, ktorá je pre nás veľmi bežná: zákazník nám dá dátové súbory, ktorým do určitej miery rozumieme, ale stále je tam toho pre nás strašne veľa neznámeho. Cieľom dnešnej lekcie bolo študentom ukázať, ako pochopiť neznámy, komplikovaný dáta set, ako si z neho odvodiť zákonitosti, ako sa presvedčiť, že je v poriadku, a ako prípadné chyby nájsť a napraviť.

Lekce začala vyhodnocením domácího úkolu z minulého setkání.

D: V podstatě jsme chtěli odstranit takový ten prvoplánový dojem z modelování: že mám nějaká data, která vezmu a udělám z nich model. K modelování patří i to, že si s těmi daty musíme pohrát, musíme jim rozumět, musíme je zkontrolovat… a o tom byla dnešní hodina.

J: Zároveň sme im tie dáta nečistili, takže v nich zostali chyby, pretože to k tomu patrí. My si niečo stiahneme, niečo dostaneme a ono to nie je dokonalé. Veľa učebnicových príkladov sa robí tak, že je tam nejaká tabuľka, v ktorej nie sú chyby. Lenže pracovať s takou tabuľkou a tabuľkou, v ktorej je každý druhý riadok chybný, je niečo úplne iné. Tým, že sme tam chyby nechali, sme vlastne pracovali s dosť reálnym dáta setom.

Celá akademie je hodně prakticky zaměřená. Jak jste připravovali svůj díl?

J: Dosť to kopíruje, ako s dátami pracujeme v praxi. Snažili sme sa, aby všetko bolo naozaj reálne, aby to neboli veci vymyslené len pre výučbu. Vzali sme si, ako normálne pracujeme, a na základe toho pripravili naše bloky.

D: Existuje i obecná metodika, podle které postupujeme a která vzešla z praxe. Takže ty kroky, kterými procházíme, jsou metodické, ale zároveň jsou prověřené praxí, protože těch projektů za sebou máme celou řadu.

Dagmar Bínová, Big Data Science Leader

A baví vás to, přednášet pro studenty?

D: Já jsem při doktorandském studiu tři roky lektorovala kurzy na vysoké škole, takže mě to docela baví (smích). A vlastně lektoruji i v Adastře. Celou dobu, co tam jsem, celých deset let.

J: Momentálne ma to baví asi viac než moja oficiálna pracovná náplň, pretože tu vlastne nemám žiadne obmedzenia.

U zákazníkov človek stále naráža na to, že je v nejakom prostredí a toto sa musí tak, toto zase tak… tu sa nič nemusí (smích), všetko si urobím, ako chcem. Hneď sa ide na tie zaujímavé veci. Zaujíma ma, ako by sa dal spočítať nejaký model? Tak si ho spočítám.

A co zdejší studenti? Předpokládám, že jste od nich měli nějaká očekávání. Splnila se?

D: Měla jsem představu, že projdou nějakým sítem a že budou dobří. Ta představa se naplnila, jen mě trošku překvapilo, že jsou to studenti informatiky, ale nepůsobí na mě jako tolik technicky zaměření. Spíš než na IT jsou hodně zaměření byznysově, ale to není na škodu.

„Když ses podíval, jak pracují s daty, tak preferovali ty vizualizační programy, se kterými se uživatelsky pracuje snadněji, oproti takové té klasice, kdy se kóduje.“

J: Nie je to na škodu, ale museli sme jemne upraviť štruktúru kurzu, pretože my sme to brali tak, že bude pol na pol IT a biznis, ale ukazuje sa, že to je skôr deväťdesiat ku desiatim v prospech biznisu (smích). Takže tie ajťácké veci sme vypustili úplne… čo asi nie je na škodu, len to trochu stratilo ten reálny rozmer, pretože v skutočnosti to je 50/50, možno tam je aj viac tých ajťáckých vecí.

Takže teraz budú mať možno trochu deformovanú predstavu, ako to funguje. Keby k nám nastúpili a čakali, že budú robiť to, čo na akademii, nebude to tak, pretože my sme vynechali tú nezáživnú časť a nechali tam len tú peknú.

D: To je možná i nevýhodou toho, když nám přijdou nováčci. Oni čekají, že budou dělat tu zajímavou práci a… ona je za odměnu (smích).

Jakub ukazuje, jak funguje datová platforma Ataccama.

Zkraje lekce vymysleli studenti pro jedno zadání lepší řešení, než které měl připravené Jakub. O co šlo a v čem bylo jejich řešení lepší?

J: (smích) To bol veľmi ajťácký problém, ktorý sa asi zrozumiteľne popísať nedá… tam boli dve entity, dve tabuľky, ktoré medzi sebou súvisia, a oni našli lepší väzbu, než akú som dokázal nájsť ja.

Vzácný okamžik, kdy studenti potřebovali poradit.

D: Šlo vlastně o dva různé objekty toho herního světa, které mají něco společného. Na první pohled, když se podíváme do té tabulky, není ta společná vlastnost zřejmá. Kuba našel jeden způsob, jak ji odvodit, ale oni našli ještě jeden, lepší.

J: Takže lepšie pochopili tie dáta… minimálne sa dá povedať, že je určite pochopili. Mal som z nich dobrý pocit, tu sme sa našli, toto im sedí. Keď sme minule chodili okolo toho hardcore IT, tak to bolo také… chvíľku bolo v tej miestnosti také ticho (smích). Ale dnes som mal pocit, že to je presne to, čo ich baví, čomu rozumejú, čo asi chcú robiť.

A překvapilo vás dneska něco?

J: Bol som prekvapený, ako rýchlo vyklikali tie záverečnej reporty. Keď dostali zadanie, myslel som, že všetok čas využijú len na to, že sa budú trápiť s tým vizualizačným nástrojom. Už som sa na to pripravoval a preventívne som zrušil pauzu. Ale tri tímy zo štyroch mali výsledok za desať minút. A ten jeden tam vlastne riešil len nejakú drobnosť. Takže som bol príjemne prekvapený.

Na závěr každý tým prezentoval, k jakým výsledkům se dopočítal.

D: Je pravda, že když ses podíval, jak pracují s daty, tak preferovali ty vizualizační programy, se kterými se uživatelsky pracuje snadněji, oproti takové té klasice, kdy se kóduje. My často víme, že kódování je pro nás rychlejší, máme už uložené kódy, ale oni vlastně nejsou postižení tou praxí, takže to mají takto.

A jak byli s lekcí spokojení samotní studenti?

Udržet pozornost není jednoduché — každá lekce trvá pět hodin.

„Velice. Líbí se mi, že to je propojení byznysu s praxí. Přednášky jsou většinou spíš teoretické, maximálně s ukázkou toho, jak by to vypadalo, ale tady máme možnost pracovat přímo s reálnými daty a s reálnými nástroji. Pro mě jako pro mladého člověka, který se v tomto oboru chce rozvíjet, to má velký přínos,“ pochvaloval si na konci dne Vojtěch, jeden z 16 účastníků akademie.

„Přednášky jsou většinou spíš teoretické, maximálně s ukázkou toho, jak by to vypadalo, ale tady máme možnost pracovat přímo s reálnými daty a s reálnými nástroji.“