Source: https://tdwi.org/articles/2017/05/30/future-of-big-data-is-cloudy-and-bumpy.aspx

Úvod

Patrik Procházka
Letní škola 2018
Published in
4 min readJun 17, 2018

--

Data, big data, open data — toto jsou pojmy, které se poslední léta hodně řeší. Moderní technologie nám umožňují shromažďovat více a více dat, někdy proti naší vůli, ale to je jiné téma. Množství dat v dnešní době roste exponenciálně, data jsou taková nová ropa. Kdo se dřív naučí chápat spojitosti mezi daty, vidět vztahy mezi naprosto jinými tématy, bude mít informace, které nemá nikdo jiný. Informace jsou novou zbraní hromadného ničení, dokáží ovládat davy, byť jsou naprosto stupidní (ty informace, ne davy). Pracovní pozice, které jsou spojeny s daty, ať už se jedná o hluboké bádání, tzv. datové krtky, anebo o člověka, co interpretuje výstupy převzaté od krtků ostatním pozemšťanům, jsou velmi populární a je po nich velká poptávka. Nabídka kvalitních, dobře naučených a nadaných lidi pro tuto profesi už ovšem tak velká není a lidé, kteří tuto profesi ovládají, jsou placeni zlatem. Spojení knihovny a kvalitní práce s daty trochu pokulhává, čest výjimkám. Přitom knihovny byly dříve velmi klíčové pro přínos nových technologií a postupů v rámci našeho oboru. Dnes je to právě naopak, je spíše vidět, jak se knihovny novým technologiím částečně brání. Data nekoušou, data jsou upřímná a jsou velmi kvalitním zdrojem pro další plánování a rozhodování.

Data v knihovnách

Data jsou dnes klíčovým faktorem každého úspěšného komerčního podniku. Proč by nemohly být přínosné knihovnám? Každá knihovna data shromažďuje, ale nakládání s nimi už není tak efektivní a pokud to opět vztáhneme na komerční sféru, tak by firma zkrachovala. Může však knihovna zkrachovat? Kvůli neefektivní práci s daty určitě ne. Lidé do knihovny chodí, ať už se s daty pracuje jakkoliv. Knihovník jim knihu doporučí, případně ji pomůže najít. Čtenář odchází domů s úsměvem a vypůjčenou knihou. Knihovník má pracovní činnost a má práci. Jenže toto je velmi povrchní pohled na knihovnu. Knihovna má další vrstvy, další procesy, kde se efektivní práce s daty může projevit až několikanásobně oproti první vrstvě. Práce s fondem v regálech, akvizice, likvidace, katalogizace, přispívání do souborného katalogu a jiné vrstvy knihovny. U každé jsou data jinak důležitá. A co teprve management knihovny, směřování knihovny v dalších letech. Teď si vezměme v potaz, kdyby všechny knihovny v ČR dávaly data dohromady, co bychom se mohli dozvědět o čtenářích v ČR, jak moc je efektivní knihovnický proces v ČR. Krásné na datech je, že jsme z nich schopni vyčíst věci, které si spousta lidí neumí ani představit. Krásný příklad je od Martina Krčála, který přínos dat interpretuje na akademické knihovně, zda pomáhá studentům k lepším známkám. Potřebujete data z dvou systémů a jste schopni vyčíst, zda studenti, co navštěvují univerzitní knihovny, mají lepší průměr během studia. To už může být velmi solidní podklad pro další rozpočtové období knihovny. Více peněz pro pohodlí studentů, když jim je knihovna tak prospěšná. Problém může nastat v opačném scénáři, kdy se ukáže, že akademická knihovna nemá žádný vliv na studijní prospěch studentů. Hůře se to obhajuje, ale je to opravdu takový problém? Co když taková informace má spíše knihovně otevřít oči a navést ji k tomu, aby se vedení knihovny zamyslelo, co změnit, aby knihovna začala být přínosnější pro studenty a pomáhala jim k lepším studijním výsledkům. Jeden rok se ukáže, že prospěšná nebyla, změní se přístup ke studentům a v dalších rocích se může ukázat vzrůstající trend ve prospěch studentů. To přinese knihovně jen více peněz nebo alespoň argument k žádosti o více peněz do dalšího rozpočtového období.

Source: http://barnraisersllc.com/2014/08/critical-components-great-data-visualization/

PowerBI v knihovnách

Vizualizačních nástrojů je velká spousta, vyjmenovávat všechny by bylo na dlouho. Každý je jinak efektivní, každý má jinak postavenou licenci. Při pohledu více do hloubky vidíme několik způsobů, několik úrovní, jak pracovat s daty. Od jednoduchých tabulek a grafů v Excelu, přes využívání PowerQuery až po využívání programovacích jazyků pro hrabání se v datech. PowerBI se nachází v rovině práci s PowerQuery s možností vstupu dat z několika možných zdrojů, ale hlavní kouzlo je pokročilá vizualizace dat. Jak již bylo zmíněno, je potřeba se umět v datech hrabat (datoví krtci), ale stejně důležité je umět data interpretovat. Díky tomuto softwaru je společnost schopna velmi efektivně data interpretovat do srozumitelného formátu pro lidi ve vedení. Krásné grafy, vztahy mezi tématy a další nespočet věcí, které lze vygenerovat. Důležité je zmínit, že PowerBI nabízí například interpretaci live. Po nastavení elementů, skrz které se data interpretují, je možné tuto interpretaci obnovovat s každým novým záznamem v databázi, která je v PowerBI nastavena jako vstup dat. Zde ovšem nastává problém. Která data jsou pro naši knihovnu relevantní? Co vlastně chceme v dané knihovně sledovat? Zde je opravdu velký vykřičník, pro někoho spíše otazník, ale je dobré to zmínit. Pokud nevíte, co sledujete, nikdy to nebude efektivní práce s daty.

K zamyšlení a k diskuzi

V České republice se využívá hned několik knihovních systémů. Každý systém pracuje s daty jinak, má jinak formované výstupy ze systémů (reporting). Pokud chceme pracovat s daty na úrovni jednotlivé knihovny, případně sítě univerzitních knihoven, které používají stejný systém, tak to není překážka. Knihovna si definuje relevantní data pro plánované výstupy. Co když ale chceme sledovat něco v širších měřítku, celého kraje, celé republiky? Zde je potřeba mezikroku přes samotnou prací s daty. Je potřeba data sjednotit formou, ne však obsahem/hodnotami. Naskýtá se tu hned několik otázek do diskuze. Co když některý systém neumí sledovat data, která jsou pro nás v rámci celého kraje a cíle, který jsme si stanovily, relevantní? Jsme schopni je získat jinde? Diskuze nad daty je důležitá, můžete si díky ní definovat, co od nich v dané knihovně čekáte a co vám mají přinést. Data jsou opravdu skvělá věc, chcete je?

--

--