Data mining ve vzdělávání

Magdaléna Kodytková
EDTECH KISK
Published in
5 min readApr 25, 2022

Dolování dat nebo také data mining slouží k získávání užitečných znalostí ze surových dat. Techniky data miningu se v posledních letech významně rozšířily do mnoha oblastí, mezi které nepochybně patří i vzdělávání. Jde především o velkou výzvu a šanci změnit způsob vzdělávání.[3] Romero a Ventura (2020, s. 1)uvádí, že nárůst e-learningových zdrojů, softwarových vzdělávacích nástrojů, využívání internetu ve vzdělávání a zřizování státních informačních databází o studentech vytvořil velká úložiště vzdělávacích dat. Tato data je nicméně nemožné analyzovat manuálně, a proto jsou potřeba nástroje pro jejich automatickou analýzu.

Dolování dat pro vzdělávání se nazývá educational data mining (EDM). Nárůst využívání technologií ve vzdělávacích systémech vedl k ukládání velkého množství dat, a proto je důležité používat EDM ke zlepšení procesů výuky a učení (překlad vlastní).[1] Zároveň rozlišujeme learning analysis (LA), což podle Romera a Ventury (2020, s. 2) představuje měření, shromažďování, analýzu a vykazování dat o studentech za účelem optimalizace jejich vzdělávacího prostředí.

Mikoláš (2011) uvádí, že školy založené na datech znalostí žáků existují v USA pod názvem hybridní školy pro síťovou generaci. Tyto školy umožňují žákům studovat s větší mírou autonomie, ale zároveň pod průběžnými kontrolami učitelů, kteří se mohou věnovat více žákům s nedostatky. Na druhou stranu ale většina výuky probíhá u počítače.

Sběr dat je užitečný pro rozpoznání problémových studentů a vzdělávacích potřeb pro různé skupiny studentů, efektivní hodnocení výkonnosti instituce, využití zdrojů instituce nebo optimalizace školních osnov. Podle Mikoláše (2011) umožňují data zahrnující výukové výsledky žáků zjistit, jak je daná škola kvalitní. Vzhledem k rozvoji nejrůznějších školských politik existuje netriviální tlak na hodnocení škol nebo celých systémů a právě daty řízené školství k tomu poskytuje na první pohled jednoduchý, rychlý a objektivní nástroj.[3]

Virtuální výuka umožňuje získávat velké množství dat o všech žácích. K tomu slouží nejrůznější informační systémy, ke kterým řadíme například Moodle či Google Classroom. Zavedení informačních systémů umožňuje evidenci a uchovávání velkých objemů dat ve vzdělávacích institucích (překlad vlastní).[5] Do takového systému je možné vkládat výukové materiály, diskutovat, procvičovat probíranou látku, odevzdávat úkoly či vyplňovat testy. Moodle navíc umí generovat tzv. „sestavy o činnosti“, tedy záznamy o tom, co žák v systému v poslední době dělal, jaké jsou výsledky jeho testů, kterými cvičeními prošel a které pracovní soubory odevzdal.[4]

Všechna tato data systém ukládá, výsledky zjištění lze použít za účelem akademického výzkumu nebo přímo pro aktuální vzdělávací praxi. Brdlička (2022) získávaná data žáků klasifikuje do tří skupin — výsledky testů, docházka a socio-emocionální učení. Analýza výsledků získaných z testů umožňuje učitelům přizpůsobovat výuku podle potřeb žáků. Sledování docházky zase pomáhá zabránit tomu, aby se záškoláctví stalo rozsáhlejším problémem, který by narušil stabilitu celé třídy. Použití technik data miningu (DM) k analýze informací o studentech může pomoci identifikovat možné důvody selhání studentů (překlad vlastní).[1]

Pod sběr dat zaměřených na socio-emocionální učení řadíme tzv. měkké dovednosti. Spadá sem například čas strávený s počítačem nebo způsob práce s výukovými materiály. Provést analýzu žákovských digitálních dat za účelem zjištění jejich socio-emocionálního nastavení (wellbeingu) není snadné. Toto hodnocení bude vždy primárně založeno na osobním kontaktu.[2]

Podle Romera a Ventury (2020, s. 8) se data ve vzdělávání sbírají například v rámci interakce mezi instruktory a studenty, kam patří kvízy, interaktivní cvičení, chování při navigaci, zprávy ve fóru atp. Dále se sbírají administrativní údaje, jako jsou informace o škole a učitelích, demografické údaje, jako je pohlaví či věk a afektivita studenta, tedy motivace, emoční stavy a tak podobně.

Získaná data mohou využívat jak studenti, tak i učitelé, výzkumníci či administrátoři. Papadogiannis, Poulopoulos a Wallace (2020, s. 361) uvádí, že data poskytují studentům zpětnou vazbu a možnost úpravy svého studia. Učitelé a lektoři zase mohou rozvíjet své učební metody pomocí kategorizace studentů. Cílem výzkumníků je zhodnotit metody a algoritmy při řešení konkrétních vzdělávacích problémů (překlad vlastní).[5] Administrátoři mohou lépe využívat zdroje instituce, vyhodnocovat učební osnovy a zavádět nové formy výuky. Data mining tedy pomáhá všem zmíněným skupinám v jejich rozhodovacím procesu.

Algarni (2016, s. 460) zase kategorizuje hlavní zdroje dat používaných ve vzdělávacím data miningu. V tradičním, off-line vzdělávání dochází ke kontaktu face-to-face mezi studentem a učitelem. Také data se zde sbírají tradičními metodami, jako je pozorování nebo dotazníky. E-learning a systémy pro řízení výuky (LMS) poskytují studentům materiály, výuku, komunikaci a nástroje pro podávání zpráv, které jim umožňují učit se sami (překlad vlastní).[1] Data mining zde tedy probíhá v rámci dat uložených v těchto systémech, jak už bylo zmíněno výše.

Přes všechny výše jmenované výhody jsou ale se sběrem dat v oblasti vzdělávání spojena i negativa. Je zjevné, že čím více informací o studentovi budeme mít k dispozici, tím lépe jsme schopni hodnotit jeho vzdělávací progres a nabídnout mu kvalitní systém vzdělávání se. Na druhé straně zde platíme soukromím, což je v západním civilizačním okruhu důležitá hodnota.[3] Vedle ochrany soukromí jmenuje Černý (2014, s. 28) ještě další rizika, jako je možné zkreslení výsledků, ztráta kontaktu mezi žáky a učiteli, poškození dat či jejich špatná interpretace.

Sběrem dat zároveň celý proces nekončí. Předzpracování dat je náročný a komplikovaný úkol a někdy samotné předzpracování dat zabere více než polovinu celkového času stráveného řešením problému dolování dat (překlad vlastní).[6] Pro řešení konkrétních problémů je potřeba surová data převést do vhodné formy. Je tedy potřeba vybrat shromažďovaná data a otázky, na které mají odpovídat. Nakonec je důležité zachovat a chránit důvěrnost studenta anonymizací dat a vymazáním všech osobních údajů (neužitečných pro účely těžby) (překlad vlastní).[6] Černý (2014, s. 27) také uvádí, že sběr a zpracování dat není snadné, jelikož dokážeme získat jen malou část informací o skutečném chování a myšlení žáka. Nejsou v nich obsažena data od školních psychologů nebo z volnočasových aktivit, které navštěvuje, výpůjčky z knihoven, digitální stopy, jeho zájmy nebo práci v hodině.[3]

Data mining umožňuje ve školství predikci na základě získaných dat. Příkladem toho je už zmíněné rozpoznání problémových studentů. Umožňuje ale i klasifikaci dat na základě určitých společných vlastností nebo nacházení vztahů mezi velkým množstvím dat. Všechny takto získané znalosti pak mohou pomáhat ve zlepšování vzdělávacích systémů a procesů, nebo dokonce k tvorbě nových učebních metod. Data mining vzdělávacích dat (EDM) pomáhá vytvářet vývojové metody pro extrakci zajímavých, interpretovatelných, užitečných a neotřelých informací, které mohou vést k lepšímu porozumění studentům a prostředí, ve kterém se učí (překlad vlastní).[1]

Použité zdroje:

1. ALGARNI, Abdulmohsen, 2016. Data Mining in Education. (IJACSA) International Journal of Advanced Computer Science and Applications [online]. 7(6), 456–461 [cit. 2022–04–24]. Dostupné z: https://pdfs.semanticscholar.org/05e1/53f8f543165697d58665a9aab11c45a90a2e.pdf

2. BRDLIČKA, Bořivoj, 2022. Jak využívat žákovská data pro zdokonalení výuky?. Metodický portál: Články [online]. [cit. 2022–04–24]. Dostupné z: https://clanky.rvp.cz/clanek/23204/JAK-VYUZIVAT-ZAKOVSKA-DATA-PRO-ZDOKONALENI-VYUKY%3F.html

3. ČERNÝ, Michal, 2014. Daty řízený proces vzdělávání. ITlib. Informačné technológie a knižnice [online]. 18(3), 27–30 [cit. 2022–04–25]. Dostupné z: https://itlib.cvtisr.sk/wp-content/uploads/docs/27_daty%20rizeni%20proces.pdf

4. MIKOLÁŠ, David, 2011. Data mining — „těžba dat“ ve školství. Metodický portál: Články [online]. [cit. 2022–04–24]. Dostupné z: https://clanky.rvp.cz/clanek/14397/DATA-MINING---"TEZBA-DAT"-VE-SKOLSTVI.html

5. PAPADOGIANNIS, Ilias, Vassilis POULOPOULOS a Manolis WALLACE, 2020. A Critical Review of Data Mining for Education: What has been done, what has been learnt and what remains to be seen. International Journal of Educational Research Review [online]. 5(4), 353–372 [cit. 2022–04–24]. Dostupné z: https://dergipark.org.tr/en/download/article-file/1158707

6. ROMERO, Cristobal a Sebastian VENTURA, 2020. Educational data mining and learning analytics: An updated survey. WIREs Data Mining and Knowledge Discovery [online]. 10(3) [cit. 2022–04–24]. ISSN 1942–4787. Dostupné z: doi:10.1002/widm.1355

--

--