Pohledy na datovou gramotnost

Gramotnostní krajina již dávno není jen o schopnosti číst a psát — jednotlivých gramotností nacházíme desítky a bývají vymezeny a odlišeny doménově, věkově i geograficky (a to i na úrovni prosté “obecné gramotnosti”, viz UNESCO, 2006). Koncepty informační gramotnosti, mediální gramotnosti, gramotnosti zdravotní (healh literacy), vizuální, emoční nebo třeba eko-gramotnosti se neustále vyčleňují a rodí v návaznosti na neschopnost gramotností předchozích pokrýt nové skutečnosti a požadavky našeho světa. Jednou z moderních gramotností je i gramotnost datová.

Společnost založená na datech je módním úhlem pohledu a termín big data běžně slouží k označení síly, která ještě donedávna hýbala světem byznysu. Data skutečně jsou všude kolem nás a nic nenasvědčuje tomu, že by se jejich objem měl přestat navyšovat. I proto sílí přesvědčení, že by každý občan světa definovaného daty, měl být schopen s těmito daty efektivně pracovat. Sepisujeme proklamace potřebnosti datové gramotnosti, víme však, co je všechno její součástí a jak ji rozvíjet? Cílem seminární práce je shrnout pozici datové gramotnosti mezi ostatními gramotnostmi a přiblížit některé jí podřazené specializované podoblasti. Dále se zaměříme na snahy definovat obsah a výstupy datové gramotnosti (tj. co a koho učit a co rozvíjet, když přijde na data) a přiblížíme si její aktuální stav ve školství, a to především se zaměřením na stupně K-12.

Krajina datové gramotnosti

Nejobecnějším zastřešujícím pojmem pro datovou gramotnost (DG), se kterým se při zkoumání gramotnostní krajiny setkáváme, je informační gramotnost. Obecnou definici nabízí TDKIV: “Schopnost jedince identifikovat informační potřebu, vyhledat informace, zhodnotit je, zpracovat a efektivně využít.” V souvislosti s DG pak narážíme na užší termíny, jako je např. kvantitativní gramotnost, statistická gramotnost, vizuální gramotnost, grafická gramotnost (graphicacy) nebo datové gramotnosti specificky orientované na vědeckého a výzkumného profesionála, jako RDL, SDL nebo progresivnější DIL. V okrajích pak navazuje na informatické myšlení.

S datovou gramotností na základní rovině velmi úzce souvisí již zmíněná kvantitativní gramotnost či numeracy (termíny většinou považovány za shodné, viz Vacher, 2014), na vyšší úrovni pak i gramotnost statistická, tedy schopnost číst a interpretovat základní popisnou statistiku v médiích, a to ve formě grafů, tabulek, výroků, výzkumů a studií (Bidgood et al., 2010). Vahey et al. (2006) vycházejí z matematiky a numerické gramotnosti, když říkají, že datová gramotnost kromě jiného zahrnuje schopnost “formulate and answer questions using data as part of evidence-based thinking, […] develop and evaluate data-based inferences and explanations; and use data to solve real problems and communicate their solutions.” Tímto popisem ukazují rozdíl mezi prostou numerickou gramotností a gramotností datovou:

“To experience true data literacy, students must be deeply anchored in context. This context is required to inform the types of arguments and analyses that are relevant to solving important problems. Whereas in most mathematics the context is part of the irrelevant detail, in data analysis, context provides meaning.” (Vahey et al., 2006)

Základní ideou statistické gramotnosti oproti numerické je pochopení statistiky jako sociálně konstruovaného fenoménu:

“A key element of statistical literacy is assembly: how the statistics are defined, selected and presented. As Joel Best put it, statistics are more like diamonds than like rocks. Diamonds are carefully cut and displayed by people to produce a desired effect. Statistics, like diamonds, are not 100% natural like sand or rocks. They are socially constructed. Helping students see this is a major challenge.” (Schield, 2004)

Jakým způsobem tyto jednotlivé gramotnosti řadíme hierarchicky je otázkou pohledu jednotlivých oborů i informačních profesionálů. Někteří autoři, např. Linden (2002, via Schield, 2004), považují datovou gramotnost za zásadní součást informační a statistické gramotnosti. Většinou se setkáváme s modelem nadřazené informační gramotnosti, podřízené gramotnosti statistické, a v ní zahrnuté gramotnosti datové. Tento model prezentuje i Schield (2004), když tvrdí, že informačně gramotní studenti musí být schopni “kriticky přemýšlet o konceptech, prohlášeních a argumentech”, statisticky gramotní studenti musí umět “kriticky uvažovat nad základní popisnou statistikou, analyzovat a interpretovat statistiku jako podklad k argumentaci”, a datově gramotní pak musí být schopni “vyhledávat, vyhodnocovat, manipulovat, sumarizovat a prezentovat data”. Datová gramotnost je tedy v tomto pohledu prerekvizitou gramotnosti statistické a ta zase nutnou součástí širší gramotnosti informační. Některé pohledy ale naopak preferují statistickou gramotnost jako součást gramotnosti datové a jiné modely zase chápou datovou gramotnost jako prostý průnik informační a statistické gramotnosti s potřebnými dalšími technickými dovednostmi.

Kromě datové a statistické gramotnosti se v odborné debatě můžeme setkat také se specializovanými podgramotnostmi, jmenovitě především research data literacy (RDL), science data literacy (mnohdy jen jako SDL) nebo data information literacy (DIL). Všechny tyto pojmy označují dovednosti a schopnosti “pochopit, využívat a spravovat vědecká data” (Qin a D’Ignazio, 2010), jsou tedy zaměřeny přednostně do vědy a výzkumu, liší se však šířkou pohledu na vědce v datové současnosti.

Termín SDL se využívá především v oblasti konceptu tzv. e-vědy a e-výzkumu, kdy cílem SDL je produkovat studenty gramotné pro provoz e-Science a zároveň vytvářet pro tuto oblast profesionální datové manažery. Obsahem SDL se většinou chápe sběr, zpracování, řízení, evaluace a využívání dat pro vědecké bádání (Qin a D’Ignazio, 2010). Povšimněme si, že tato definice obsahu pracuje výrazněji s datovou gramotností pasivně, v roli příjemce, a nijak dále nezpracovává komunikaci a sdílení dat na konci životního cyklu dat. Stejně tak s ní pracuje koncept Research Data Literacy (Schneider, 2003), který je prezentován jako disciplína spadající pod praxi managementu výzkumných dat. SDL i RDL považuje za zásadní složku univerzitní knihovníky, kteří vědce vzdělávají a starají se o některé autorské části cyklu, jako je tvorba metadat nebo zvyšování povědomí o datech v rámci dané instituce.

Koncept DIL přistupuje k datové gramotnosti ve vědě šířeji a přidává k ní na straně vědců též roli autorskou, producentskou — a proto do názvu přibírá i odkaz na vyšší, informační gramotnost. Přicházejí s ním Carlson et al. (2011) a dle svých slov tím spojují “concepts of researcher-as-producer and researcher-as-consumer of data products.” DIL spojuje datovou, statistickou a informační gramotnost pod jeden termín v rámci jasně vymezená oblasti vědy a výzkumu. S termínem DIL, jak jej popisuje např. Shorish (2015), se taktéž setkáváme především v souvislosti s konceptem e-vědy. Nakolik je tento koncept zastaralý a nakolik moderní technologie, sítě, data a jejich sdílení ovlivnily všechny oblasti vědy a výzkumu, není předmětem tohoto přehledu.

Do rozsahu DIL spadá zpracování a analýza dat, vyhledávání dat, práce s databázemi, vizualizace dat, dohlížení na kvalitu dat (data quality), konverze dat a datová interoperabilita, datový management, uchovávání dat, datové kurátorství a znovuvyužití dat, zpracování metadat i etika práce s daty.(Carlson et al., 2013). Vidíme, že na rozdíl od RDL, kde je autorská stránka potlačena a termín “komunikace dat” je tam myšlen maximálně ve významu zvyšování povědomí o datech mezi vědeckou komunitou z pozice informačních profesionálů, v rámci RDL je datově gramotný vědec schopen svá data i prezentovat a vizualizovat a tyto výstupy dále šířit a propagovat.

“[DIL] …equips practitioners with the skills to make data reusable to others in a meaningful way. Data information literacy, with its characteristics of data documentation, preservation, and sharing, requires engagement with a wide array of information skills.” (Shorish, 2015)

Součástí datové gramotnosti (ale stejně tak svébytným oborem debat a výzkumů) je také gramotnost nazývaná jako graphicacy (česky většinou jako grafická gramotnost především v kontextu kartografie, v anglicky psaných zdrojích také mnohdy jako vizuální gramotnost, visual literacy). Graphicacy označuje schopnost přijímat/pochopit a komunikovat informace ve formě nákresů, diagramů, fotografií, plánů, map, grafů, sítí a dalších “netextuálních dvoudimenzionálních objektů” (Aldrich a Sheppard, 2000). Na rozdíl od obecné gramotnosti je graphicacy jen velmi málo explicitně vyučována (shodují se i Aldrich a Sheppard, 2000). Edukaci se snad věnuje větší úsilí jen v jedné z jejich oblastí, a to v kartografii a práci s mapou. Pro ty však už se zase vžívá pojem mapová gramotnost, a v některých jazykových prostředích už je tato dovednost běžně zaužívaná, viz německý termín kartenkompetenz. “Jedná se o schopnost číst, hodnotit a interpretovat obsah map, tvořit jednoduché mapy a porovnávat, rozlišovat a používat mapy v určitých situacích” (Knecht et al, 2010). A když už mluvíme o grafech a jiných datových grafických artefaktech, nemůžeme nezmínit také souvislost s gramotností mediální.

Hranice krajiny datové gramotnosti nejsou přesně vymezeny a bylo by zajímavé mapovat jednotlivé přístupy, rámce a modely a hledat jejich průniky a vztahy. V rámci této seminární práce se však nebudeme okolními gramotnostmi blíže zabývat a podíváme se na některé ze snah datovou gramotnost jako samostatný koncept ustálit a načrtnout její výstupy.

K obsahu datové gramotnosti

Datová gramotnost, ostatně jako všechny ostatní moderní gramotnosti, není ustáleným konceptem. Nejobecnější definice datové gramotnosti nám s pochopením podstaty a obsahu příliš nepomohou, neboť se omezují na tvrzení, že být datově gramotným znamená dokázat převádět data do hodnotných a využitelných informací. V literatuře však již dnes nacházíme desítky rozpracovanějších definic a výstupů lišících se podle odbornosti, jejíž optikou je nazírána, jejími kontexty i cíli. Jak jsme již shrnuli, značná část debat o podstatě datové gramotnosti je generována v oblasti vědy a výzkumu. Je však třeba si připustit, že dovednosti v práci s daty jsou relevantní nejen pro vědecké snažení, ale i pro ostatní oblasti lidské činnosti a stále více i pro běžný život člověka a občana v moderní společnosti.

Podíváme se tedy blíže na některé výraznější snahy ustálit obsah datové gramotnosti, a to jak snahy v oblasti vědy a výzkumu, tak snahy o obecnou, globální datovou gramotnost. Jak uvidíme, pohledy autorů jednotlivých pokusů se liší nejen jejich odborným zázemím, ale i nadhledem a šířkou záběru, který na celý koncept DG uplatňují. Někteří např. propagují vysokou míru techničnosti a své modely navazují na konkrétní SW nástroje, někteří se zaměřují jen na samotnou práci s daty, jiní zase pojmenovávají i širší kontext včetně uvědomění si hodnoty dat a problematických aspektů jejich užití z hlediska etiky a práva.

Zaměřme se ponejprv blíže na definice cílené primárně na univerzitní vzdělávání a vědu. Jak lze očekávat, nalézáme tu především technicky a nástrojově akcentované definice. Někteří autoři uvádějí přímo konkrétní nástroje pro manipulaci a konverzi dat, které studenti univerzit musí ovládnout. Shield (2004) zmiňuje např. structured query language (SQL), relační databáze (MS Access), software pro manipulaci s daty, statistické nástroje (SPSS, STATA, Minitab, MS Excel) i nástroje prezentační (MS Excel, MS PowerPoint). Teal et al. (2015) v rámci konceptu RDL (tedy už z podstaty také cíleno na vědce a výzkumníky) stanovuje za obsah gramotnosti organizaci dat v tabulkových procesorech, jmenovitě MS Excel, efektivní využívání těchto tabulek a znalost limitů tabulkových editorů; konverze tabulek do pokročilejších nástrojů typu R nebo Python; užívání databází včetně dotazování v SQL; ustalování postupů práce s daty a jejich automatizace, a to včetně práce s příkazovou řádkou a skripty. Srovnávat můžeme např. s obsahem kurzu popsaného v případové studii výuky RDL od Carlsona a Brackeové (2015).

Jiní autoři také neopomínají roli technologií, ale uznávají, že se budou lišit dle zvyklostí dané disciplíny, a pokouší se proto o popis dovedností na obecnější úrovni. Studie Carlsona et al. (2011) na základě interview s univerzitními pracovníky, analýzou kurzů DG a jejich sylabů a v konzultaci se standardy ACLR pro informační gramotnost shrnují cíle datové gramotnosti z širšího pohledu, ovšem v poněkud chaotickém pořadí:

  • základy databází a datových formátů; tj. porozumění relačním databázím, dotazování na ně, datové formáty;
  • hledání a získávání dat; tj. repozitáře, jejich využívání, importy a případné konverze dat;
  • řízení a organizace dat; tj. porozumění životnímu cyklu dat, datový management, jejich dokumentace;
  • konverze dat a interoperabilita; tj. konverze dat do jiných formátů, problematika migrace a poškození dat, porozumění potřebě využívání běžných formátů;
  • evaluace kvality datového výstupu; tj. rozpoznávání a oprava nekompletností nebo chyb v datech, identifikace obtíží dat skrze metadata;
  • metadata; tj. pochopení smyslu metadat, schopnost jejich vytváření, správného popisu dat, ontologie;
  • datové kurátorství; tj. pochopení smyslu znovuvyužití dat;
  • kultura praxe; tj. pochopení dat v kontextu svého oboru a vnímání doménových nuancí v nakládání a práci s daty;
  • uchovávání dat; tj. pochopení přínosů a nákladů uchovávání dat, znalost technologií, procesů a komponent takové praxe;
  • datová analýza; tj. obeznámenost se základními analytickými nástroji v dané disciplíně, využívání automatizačních postupů při práci s daty;
  • vizualizace dat; tj. dostatečná znalost nástrojů pro vizualizaci dat, povědomí o manipulačních technikách, pochopení různých vizuálních metafor a rozhodování o vhodných situacích k jejich využití;
  • a etika; tj. pochopení autorství v oblasti dat, bezpečnosti dat, zvyklostí ve sdílení dat v rámci dané disciplíny.

Prado and Marzal (2013) přistupují k datové gramotnosti z pohledu informační vědy a svojí optikou tak akcentují především oblast hledání a získávání dat a jejich řízení. Výrazně méně pozornosti už věnují samotné práci s daty: 1) pochopení dat; k čemu to je, jakou roli hrají v naší společnosti, jakou roli hrají ve vědecké komunikaci; 2) hledání a získávání dat; zdroje, kdo je vytváří a proč, kde data získat a co dělat, pokud neexistují; 3) čtení, interpretace a hodnocení dat; 4) řízení dat; metadata, dlouhodobé uchovávání, přístup, sdílení; 5) samotná práce s daty.

DG v kontextu vyššího vzdělávání musí sledovat kontextové rámce odlišných disciplín, jak připomínají i Maybee a Zillinski, 2015. Z toho je jasné, že ustanovit obecnou definici obsahu datové gramotnosti, jednotlivých dovedností a kompetencí není jednoduché. Když se však pohybujeme v oblasti základního a obecného středního školství nebo celoživotního vzdělávání, kde věříme, že je nutné DG taktéž rozvíjet, takovýto obecný rámec budeme potřebovat.

Mílové kroky k definici obecné datové gramotnosti udělal panel ODI (2016), kde se odborníci shodli na tom, že datově gramotný člověk:

“understands, explains, and documents the utility and limitations of data by becoming a critical consumer of data, controlling his/her personal data trail, finding meaning in data, and taking action based on data. The data-literate individual can identify, collect, evaluate, analyze, interpret, present, and protect data.”

Výstupy, které panel vyhodnotil jako nejdůležitější, jsou shrnuty níže. Je vidět, že v sobě zahrnují jak relevantní části grafické gramotnosti, tak gramotnost statistickou:

  • Drží se etických a právních pravidel při práci s daty, řeší otázky bezpečnosti dat, je znalý datové bezpečnosti.
  • Manipuluje s daty, vytváří a zadává data do datové struktury.
  • Řeší problémy, formuluje produktivní otázky.
  • Navrhuje odpovídající vizualizace dat.
  • Je seznámený se softwarovými nástroji, pracuje s tabulkami.
  • Je obeznámen s výzkumnými metodami zpracovávaných dat; je obeznámen se statistickým myšlením a metodami; myslí analyticky, informaticky a kriticky; myslí synteticky, produkuje kontextuální datové implikace, vyvozuje z dat.
  • Chápe designové myšlení/životní cyklus dat.

Strukturovanější a hlubším výzkumem podpořený rámec obecné datové gramotnosti poskytuje Deahlová (2016): “datová gramotnost je schopnost pochopit, najít, sesbírat, interpretovat, vizualizovat a podpořit svůj argument skrze kvantitativní a kvalitativní data”, a mezi dovednosti a jednoltivé výstupy pak řadí:

  1. Pochopit data: co jsou to data, jaké typy existují, jak jsou generována. Pochopení jejich role a dopadu na společnost v různých kontextech a etické implikace využívání dat.
  2. Najít data: pokládat si správné otázky, najít relevantní datové zdroje, porovnat a hodnotit zdroje a kontrolovat data pro nepřesnosti a nedostatky.
  3. Sesbírat data: kolektovat data, aplikovat různé výzkumné metody, provádět měření, dotazníkové šetření.
  4. Interpretovat data: připravit data pro analýzu, kriticky je analyzovat v různých formátech, vyvodit dedukce.
  5. Vizualizovat data: schopnost komunikovat data skrze širokou škálu vizuálních metod, včetně tabulek, grafů a map.
  6. Podpořit argument srze data: používat data jako důkaz, vyprávět nad nimi příběhy, brát v potaz širší kulturní, sociální a politický rámec datových vhledů. Používat data k řešení problémů a komunikaci těchto řešení.
Autorkou ilustrace je Erica Deahl, která téma DG soustavně zpracovává a orientuje si na učitele. Její video k tématu a tři doporučení pro tvůrce kurzů DG publikovala na blogu.

Rámec Ericy Deahlové považuji za aktuálně nejpovedenější model obecné datové gramotnosti pro moderního člověka (bez ohledu na oblast jeho realizace). Vnímáme, že Deahlová přichází se sociálně-vědním metodologickým pohledem (viz bod 3. Sesbírat), a na rozdíl od předchozích zmíněných autorů tak považuje za součást i vlastní sběr dat. Tvrdí tedy, že datově gramotný člověk nejen identifikuje situaci, kdy je vhodné pracovat s daty (a tento bod by bylo dle mého názoru třeba explicitněji zdůraznit), ale je schopen tato data i sám vytvářet a získávat v případě, že ještě neexistují.

Ať už z definice Deahlové bude široce přijímaný standard nebo nikoliv, je třeba mít na paměti, že každý jeden bod obsahu všech modelů DG, které jsme tu uvedli, je neustále podrobován dalším diskuzím. Jednotlivé dovednosti a výstupy se mění s tím, jak se dramaticky mění i oblast dat obecně, nástroje k jejich zpracování a naše metody práce s nimi. “Likewise, the techniques for teaching data literacy are just being developed.” (EDC, 2016)

Datová gramotnost ve vzdělávání

Datová gramotnost v systému vzdělávání cílí primárně na dvě skupiny: žáci a učitelé. O datové gramotnosti učitelů se aktuálně mluví více (viz např. konceptuální model datové gramotnosti učitele od Gummer a Mandinach, 2015), a to především v kontextu evidence-based practice (Wiliams a Coles, 2007). DG se řeší především s ohledem na etiku zacházení s daty, udržování bezpečnosti při nakládání se studentskými daty (viz Mandinach et al., 2015), schopnost pracovat s demografickými ukazateli o žácích, dovednost zpracovávat a analyzovat vývoje známek na vyšší než základní přehledové úrovni nebo schopnost vytvářet reporty (viz např. Schildkamp et al., 2012).

“They [teachers] need ‘assessment literacy’ — the collective capacity of teachers and leaders in schools to examine data, make critical sense of it, develop action plans based on the data, take action and monitor progress along the way.” (Earl a Fullan, 2003)

Když se zaměříme na studenty, narážíme na slepá místa. Univerzitní vzdělání je pokryto relativně dobře, základní a střední vzdělání je však datovou gramotností zasaženo zatím jen vzácně. Žádné velké vzdělávací instituce dosud neposkytly definici a výstupy pro oblast K-12 vzdělávání (Blake, 2017) a můžeme tak vycházet jen z obecných definic popsaných výše, jako je například model Deahlové. Studenti dovednosti spojené s daty získávají většinou ad hoc až na místě svých zaměstnání, a to jen v případě, že je potřebují (Jahnke and Asher, 2012). S nárůstem dat však mnoho vzdělávacích odborníků, politiků a žurnalistů vzdělávání věří, že by se s datovou gramotností mělo začínat již na základní škole.

Autoři věnující se problematice datové gramotnosti v oblasti K-12 vzdělávání cítí potíže s nedostatkem praktických materiálů, na trhu proto už nyní můžeme najít anglicky psané příručky pro učitele základního a středního vzdělávání psané přístupně a srozumitelně.

Roli zde budou hrát nejen samotní učitelé, ale také pedagogické školy (viz Mandinach et al., 2015), které je na praxi připravují. Opomínána není ani role akademických knihoven a knihovníků (viz např. Prado a Marzal, 2013, Hogenboom et al, 2011 nebo případová studie Hunt, 2004). Je třeba nastartovat debatu o roli neakademických a školních knihoven a o způsobech, jakými mohou datovou gramotnost implementovat do stávajících kurzů širší gramotnosti informační. První vlaštovky již můžeme pozorovat, například projekt LIS oboru University of Michigan snažící se připravit datově gramotné středoškolské knihovníky.

Pionýrskou roli v praktickém rozvoji datové gramotnosti na úrovni K-12 vzdělávání však hrají mimoškolní aktivity, osamocené projekty a komerční pokusy prosadit speciálně navržené nástroje. Young Rewired State a jejich Festival of Code je sice v jádru zaměřen na programování a informatické myšlení, datovou gramotnost ovšem také rozvíjí a to formou mimoškolní, prázdninové aktivity a hackatonu. Projekt City Digits byl tříletým pokusem ve veřejných školách na území New Yorku rozvíjet datovou gramotnost žáků společně a nad jedním tématem: alternativními finančními institucemi. Výstupem je interaktivní mapa. Podrobně se k projektu vyjadřují autoři v případové studii Williams et al. (2014). Podobný pokus globálního charakteru představuje Global Happiness Project, který zapojil školy z celého světa (dobrovolně se zapojilo na 240 učitelů a tisíce studentů z jedenácti zemí) do metodologického a datového řešení definice štěstí.

“…students have been thinking hard about how to measure happiness, exploring existing metrics such as Bhutan’s Gross National Happiness Index. They have designed and administered surveys to gather their own data about key indicators of happiness and are communicating their findings in a variety of formats.”

Volání po datové gramotnosti na nižších stupních vzdělávání vyslyšel i komerční sektor a produkuje první nástroje, které pomáhají učitelům výstupy DG naplňovat. Nejexponovanějším projektem je Tuva Labs. Společnost poskytuje nejen předpřipravené datasety s komentáři pro učitele, ale také vlastní SW nástroje, které žákům usnadňují tvorbu grafů a vedou je spíše k pochopení konceptů, než k zahlcení technickou a nástrojovou stránkou věci (více viz Ravindranath, 2014). Doba datové gramotnosti a jejího rozvíjení na základním a středním stupni vzdělávání započala. Prozatím můžeme podepsat proklamaci a začít z pozice učitelů i knihovníků rozvažovat, k jaké definici a výstupům se přikloníme a jakým způsobem je do svých lekcí dokážeme zapojit.

Použité zdroje a citace.
Celkem znaků vč. mezer: 22637