Cloudové služby v knihovnách

Adam Cironis
UISK — Library services today
12 min readDec 28, 2017

Moderní technologie začínají řídit naše životy, ať už si to přiznáváme či nikoliv. Postupně přetváří celá odvětví komunikace, průmyslu i obchodu. S nastupující výpočetní kapacitou a konektivitou dostupnou napříč světem se lidstvu otevírají dosud nevídané možnosti. Od roku 2016 do současnosti vzrostl počet lidí připojených k internetu zhruba o 7.5% na 3.7 miliardy. Pro srovnání v roce 2012 bylo připojeno přibližně 2.2 miliardy. Zatímco jste četli tento odstavec (17 sekund při průměrné rychlosti čtení 225 slov za minutu):

· skrze optické kabely proběhlo 881 297GB dat

· bylo odesláno 45 088 029 emailů (v roce 2017 odhadem až 60% spam)

· internetová stránka Youtube přehrála 1 224 935 videí

· uživatelé se 1 094 273krát zeptali Google vyhledavače

· přibylo 133 858 nových Tweetů

· Amazon prodal zboží za 73 324 dolarů

· Skype zaznamenal 49 572 nových hovorů

· na Instagram bylo nahráno 13 940 nových fotek

· pro zákazníky služby Uber vyjelo 12 972 řidičů

Na první pohled naprosto nepředstavitelná čísla, avšak díky enormnímu zájmu a technologickému posunu se objevily možnosti, jak přizpůsobit internetové služby na tento nápor. Jednou ze zmíněných technologií je tzv. „Cloud“, občas také nazývaný „Cloud computing“. Tento článek vás provede stručně jeho historií, popisu fungování a také se dočtete o digitalizaci knih. Rovněž se pokusím navrhnout směr, kam by se mohlo v budoucnosti ubírat využití cloudu v knihovnách.

1. Definice cloudu

Význam cloudu začíná být stále častěji vyzdvihován v internetových článcích, avšak už i v knižních publikacích. Skrze masivní medializaci se tak již dostává i do podvědomí mainstreamového obecenstva. Jak si ho ale vůbec představit? Cloud je tu vlastně již od dob vzniku World Wide Webu a následně internetu. Neexistovala pro něj ovšem přesnější specifikace, a tak je to s jeho definicí poměrně složité, a to z několika důvodů. Tím hlavním je pravděpodobně jeho neustálý vývoj. V současnosti zažívá tato technologie obrovský rozkvět, neboť už i velcí technologičtí hráči na trhu si uvědomují jeho potenciál, a tak na jeho rozšíření pracují tisíce vývojářů, softwarových architektů a síťařů po celém světě. Nejlépe pochopitelná mi přišla definice cloudu na Wikipedii, která zní: „Cloud computing je na internetu založený model vývoje a používání počítačových technologií. Lze ho také charakterizovat jako poskytování služeb či programů servery dostupnými z internetu s tím, že uživatelé k nim mohou přistupovat vzdáleně“ (1) Jedná se tedy o programy, služby, výpočetní kapacitu či uložiště, ke kterému je možné přistupovat vzdáleně. Poslední slovo této definice shledávám jako nejdůležitější. Poměrně nešťastně zvoleným termínem „cloud“, česky přeloženo jako „mrak“ či „oblak“ často dochází k mýlkám, že se jedná o převratnou technologii levitující někde nad našimi hlavami. Ve skutečnosti se vše odehrává na speciálně přizpůsobených serverovnách, které jsou rozmístěny na různých místech po světě a uživatel k nim pouze přistupuje vzdáleně. Dnes je systém jejich rozmístění dokonce tak sofistikovaný, že každá taková budova je strategicky zvolena na určitém místě na kontinentu, aby načítání požadované služby trvalo co nejkratší dobu. Takovýmto stanicím se poté říká „Content Delivery Network“ (CDN). Zároveň nejen zde dochází k zálohování jednotlivých souborů či služeb, aby v případě ztráty či výpadku na jednom místě bylo možné načíst kopii z jiného serveru. Kde se však toto know-how vzalo a jak jsme se do tohoto stádia dostali?

Ukázka cloudového uložiště Pionen ve Stockholmu. Původně sloužil jako protiatomový kryt. Video s prohlídkou. Zdroj: https://i.kinja-img.com/gawker-media/image/upload/s--hYmLn9Fc--/c_scale,fl_progressive,q_80,w_800/18moj54m1f9fejpg.jpg

2. Historie cloudu

Jednou z prvních ukázek využití cloudu byl v roce 1969 armádní projekt ministerstva obrany USA pojmenovaný ARPANET (Advanced Research Projects Agency Network), jež sloužil jako počítačová síť pro komunikaci pomocí paketů — neboli zprávou rozloženou na velmi malé segmenty, jež se na koncovém místě poskládají dohromady podle jejich identifikačního čísla. Jeho fungování mělo být kompletně decentralizované, aby v případě ztráty některýchuzlů byla stále zachována jeho funkčnost. Pomocí zhruba čtyřiceti kabelů bylo v roce 1973 propojeno téměř celé území Spojených států. V témže roce se začal systém objevovat i v Evropě, kde bylo jako první připojeni Norsko a Spojené království. V roce 1986 se zprovoznila nově vzniklá síť NSFNET (National Science Foundation Network). Za tímto projektem stála instituce NSF (National Science Foundation Network) a jejím cílem mělo být navrátit využívání sítě pro vědu a výzkum. Jako první měla propojit pět výzkumných ústavů, které disponovaly superpočítači na tehdejší dobu, později rozšířenými o univerzity. Konektivita NSFNET se zpočátku vázala na ARPANET a dosahovala rychlosti až 56 kilobytů za sekundu. Její zrychlení přišlo s protokolem TCP/IP, jež byl schopný přenášet až 1,5 megabytu za sekundu. Česká republika se o první připojení do lokální sítě EARN (European Academic Research Network) pokusila v roce 1987, ovšem neúspěšně z politických důvodů (zabránila Železná opona). Po převratu v roce 1989 byla žádost odeslána znovu a tentokrát již vyhodnocena úspěšně. Jako první v republice se do sítě připojil sálový počítač na ČVUT v Praze pomocí kabelu vedeného z rakouského města Linz. Na konci milénia se ve světě začaly objevovat první komerčně úspěšné služby nabízející cloudová řešení. V roce 1999 byla založena firma Salesforce.com, jež se proslavila primárně svým podnikovým systémem CRM2, jež byl dostupný jako služba na internetu. O tři roky později začala firma Amazon nabízet technologii Amazon Web Services, neboť jejich servery, optimalizované i na špičky návštěvnosti, zbytek času nebyly skoro vůbec využívány. Tak vznikl nápad nabízet jejich výpočetní kapacitu vývojářům pro jejich aplikace.

Cloud, jak ho známe dnes, popularizoval v roce 2010 Google pomocí služby Google Docs, později přejmenována na Google Drive, která uživatelům umožňovala sdílet materiály a zároveň poskytovala 1GB prostoru zdarma pro vlastní užití. O další posun se zasadila firma Apple se svojí verzí cloudového uložiště pod názvem iCloud, spuštěnou v červnu roku 2011. V té době se jednalo o samostatnou službu, která měla sloužit pouze pro příležitostnou zálohu souborů či sdílení materiálů s kolegy. Dnes je však již neodmyslitelnou součástí infrastruktury celého ekosystému. Zálohování běží automaticky na pozadí na všech zařízeních bez nutnosti interakce s uživatelem. Technologicky je to velmi důmyslně vyřešené, neboť současným trendem je pořizování stále kvalitnějších fotografií a videí v co největším možném rozlišení. Přináší to však automaticky nutnost většího uložiště v zařízení, jež se ale nezvětšuje úměrně rychle k rostoucím velikostem multimediálních souborů. Logicky tedy dochází k nahrávání starších fotografií či videí právě na cloud. V současnosti však není prostor neomezený a je třeba jej dokupovat ve formě měsíčních poplatků. Cloud se tedy stává stále důležitějším pilířem příjmů nejen technologických korporací.

3. Výhody a nevýhody cloudu

Každá nová technologie s sebou přináší řadu výhod i nevýhod, příležitostí i hrozeb a ani s cloudem tomu není jinak. Pro zkoumání této problematiky by bylo dobré oddělit od sebe uživatele a podniky. Nicméně pro účel této práce se pokusím stručně shrnout výhody a nevýhody pro celou technologii obecně. Mezi největší výhody patří nepochybně škálovatelnost. Dosud nebylo možné přizpůsobit výpočetní kapacitu během několika okamžiků zákazníkovi na míru. Tuto možnost využijí především subjekty, jež dokážou predikovat zvýšenou aktivitu svých stránek či služeb. Pro představu to může být spuštění nové webové stránky produktu, či zápis předmětů v novém semestru. V takové situaci může být traffic mnohdy až v desetinásobkách běžných čísel, a tak služba přestane odpovídat. V případě hostování na cloudu je možné servery na takový nápor dopředu připravit a zákazník pak nerozpozná téměř žádné známky mnohonásobné zatíženosti. Tento přístup vedl ke vzniku nového platebního modelu, tzv. „pay as you go“, kdy se platí podle reálné spotřeby výpočetní kapacity či úložného prostoru. Další nadstavbou je neustálá dostupnost zákaznické podpory či technických profesionálů v případě komplikací. Uživatelé rovněž ocení automatické zálohování nebo přístupnost z jakéhokoliv zařízení, ať už se jedná o mobil, tablet či počítač.

Využívání těchto služeb s sebou ovšem přináší závislost na aplikacích třetích stran. V roce 2012 postihlo datové centrum Amazonu výpadek kvůli bouřce, na jehož následky přestaly fungovat aplikace jako Instagram, Pinterest, Netflix či Heroku. Mnohým větším korporacím rovněž vadí ukládání svých dat na serverech konkurence i kvůli možným únikům, či jejich využití proti nim samotným.

4. Typy cloudových služeb

V současnosti se cloudové služby dělí na tři kategorie, i když pro fungování jakékoliv webové služby jsou nezbytné všechny. Při pronájmu některé z nich si tedy často pořizujete všechny naráz, aniž byste to věděli.

IaaS

Základním stavebním kamenem cloudové služby je infrastruktura, na které bude fungovat zvolená platforma. Tomuto modelu se říká „Infrastructure as a service“ (IaaS) a v rámci něj je nabízena základní výpočetní kapacita pro zpracování dat, datová uložiště, sítě či další zdroje. Je pak již na zákazníkovi, zda ji využije pro instalaci softwaru, aplikace nebo operačního systému. Příkladem budiž služby jako Microsoft Azure, Google Compute Engine nebo Amazon EC2.

PaaS

Na infrastruktuře je možné provozovat platformy pro spouštění nebo vývoj vlastních služeb, které jsou dostupné přes internet. Zmíněnému přístupu se říká „Platform as a service“ (PaaS) a zákazník se pouze stará o programovací jazyky a knihovny, které musejí být kompatibilní se zvoleným nastavením cloudu. O jeho infrastrukturu se však nemusí starat, o tu se stará dodavatel. Ukázkou jsou služby Bluemix od IBM, App Engine od Googlu.

SaaS

Nejvyšší vrstvou ze zmíněných je tzv. „Software as a Service“ (SaaS), která je nejčastěji využívána běžnými uživateli. Jedná se o cloudové aplikace, které jsou dostupné vzdáleně na nejrůznějších zařízeních, ať už mobilech, tabletech nebo počítačích, pomocí rozhraní internetového prohlížeče či vlastní aplikace. Příkladem jsou služby jako Google Docs, iCloud nebo Microsoft Office 365.

5. Cloudové služby v knihovnách a budoucnost

Cloudové služby mohou být pro knihovny velkým přínosem. V současnosti je pro ně zástupcem služba Worldcat, ale v budoucnosti se může jednat o využití tzv. velkých dat, rozšířené či virtuální reality, nebo zpracování přirozeného jazyka.

Wordcat

Služba Worldcat vznikla v roce 1998 pod záštitou firmy Online Computer Library Center (OCLC) jako společný katalog knihoven po celém světě. V současnosti sdružuje přes 72 000 knihoven ve více než 170 zemích a najdete v něm přes 330 miliónů záznamů, které představují okolo dvou miliard fyzických a digitálních výtisků ve 485 jazycích (data z roku 2014). Aplikace nemá za cíl fungovat v reálném čase, ale je aktualizována po dávkách. Rovněž nefunguje jako přehled vypůjčených, ztracených, opravovaných nebo archivovaných výtisků, avšak umožňuje knihovnám přidat odkaz do Worldcatu na jimi vlastněný výtisk v jejich katalogu.

Big data

S nástupem informační doby lidstvo produkuje obrovské množství dat. Dnes se již označují termínem „Big Data“, neboli velká data. Pro představu se může jednat o tisíce až milióny gigabytů dat. Dříve neexistovaly efektivní nástroje, jak s těmito informacemi pracovat. Doba pokročila a současné počítače jsou již schopny hledat v těchto balících kauzality a vyvozovat z nich různé analýzy a závěry. Knihovny obecně zaznamenávají obrovské množství dat, ovšem jejich velkou výhodou jsou tzv. „metadata“, neboli data o datech, např. ve formátu MARC21. Díky nim je daleko jednoduší s nimi pracovat. V budoucnosti by mohlo být možné využít tyto informace např. pro zúžení množiny při hledání dokumentu, neboť tušíme, co nejčastěji na základě vložených informací uživatelé vyhledávají. Knihovníci by rovněž mohli provádět verifikaci různých predikcí či tvrzení.

Internet of Things

Dalším zajímavým segmentem pro knihovny může být tzv. „Internet of things“ (IoT), neboli internet věcí. V dnešní době je již každé chytré zařízení připojené k internetu a jejich počet na jednoho obyvatele bude stále vzrůstat. Zařízení vysílají data a zároveň spolu mohou komunikovat. Knihovny by mohly podle analýz pohybu zákazníků po knihovně upravovat rozmístění regálů. Zároveň bude možné měřit počet aktuálně přítomných čtenářů a dle toho nastavovat topení nebo klimatizaci. Uživateli může být rovněž nabídnuta káva v kavárně, pokud jeho zařízení zaznamenají únavu.

Apps

Každá větší firma v minulosti toužila po vlastní aplikaci, kterou si jejich zákazníci stáhnou, a tak s ním mohou budovat vztah. Dnes se však díky statistikám ukazuje, že uživatelé již nechtějí další aplikace v mobilu a trend jejich instalací je spíše na ústupu. V průzkumu z roku 2017 o využívání aplikací odpovědělo 51% respondentů ve smyslu, že nestáhnou již ani jednu novou aplikaci měsíčně.

VR/AR

Momentálně vzrůstající trend zaznamenává segment virtuální a rozšířené reality. Pro knihovny by to mohlo přinést personalizovanou navigaci uvnitř knihovny pro konkrétní výpůjčku, nebo zobrazení hodnocení a recenzí knihy při pohledu na její hřbet v regálu.

Semantic web

Sémantický web má přinést revoluci ve využívání internetu, jakou lidstvo zažilo při transformaci webu na Web 2.0., kde se uživatelé podílejí na tvorbě obsahu a už ho pouze nekonzumují. Knihovny mohou sloužit jako místo, kde bude docházet k evangelizaci celé myšlenky a jeho předávání mainstreamovému zákazníkovi. Jedná se o prostor, kde i samotná zařízení budou chápat kontext mezi jednotlivými informacemi. Představit si to můžeme tak, že pokud si zadáme do kalendáře poznámku „Vrátit knihu“, systém automaticky rozpozná, o jakou knihu se jedná na základě expirace její výpůjční lhůty, nastaví nám i místo podle adresy dané knihovny a může nabídnout i termín na základě nižší průměrné návštěvnosti, abychom nemuseli čekat frontu.

Natural Language proccessing

Zpracování přirozeného jazyka velmi úzce souvisí se sémantickým webem. Jedná se o systémové chápání kontextu na základě mluvené řeči. V budoucnu bychom tak mohli přijít do knihovny a na terminálu poprosit o „Fantasy knihu podobnou Pánu Prstenů, ale pro mladšího čtenáře“ a terminál nám nabídne Letopisy Narnie.

Zajímavé projekty

Recaptcha

Službu reCaptcha vymyslel guatemalský profesor Luis von Ahn, jako pokračování programu Captcha (Completely Automated Public Turing test to tell Computers and Humans Apart), který sloužil jako ochrana proti spamu. Uživateli ukázal jedno slovo v obrázku a pokud jej uživatel správně opsal, formulář byl odeslán. Program se rychle stal velmi populárním a brzy se začal objevovat na většině internetových stránek. To však začalo von Ahna trápit, neboť vyplnění a odeslání jedné Captchi zabralo zhruba deset vteřin. Denně jich bylo vyplněno v průměru okolo 200 miliónů, což znamená, že každý den bylo takto promrháno 500 000 hodin lidského času. Začal tedy přemýšlet, jestli tento čas nelze nějak smysluplněji využít a v roce 2007 přišel se službou reCaptcha. Ta si vzala za cíl digitalizaci knih, které byly pomocí technologie OCR skenovány a rovněž převáděny na text. Často však měly problém rozeznat z důvodů poškození, vybledlosti nebo okrasnému písmu, o jaké slovo se skutečně jedná. Tato problematická slova tedy byla přidány do databáze reCaptchy a uživateli byly nově zobrazeny dvě slova místo jednoho. Jedno, které ověřilo, že není robot a jehož hodnotu systém znal, a druhé, které bylo vybráno právě z databáze problematických slov. Uživatel však nikdy nevěděl, které slovo je které, a proto se musel snažit vyplnit obě správně. Pokud se větší množství uživatelů shodlo na problematickém slově, OCR systém si jej zapamatoval a rovněž jej doplnil do přepsaného textu, kde chybělo. Takto bylo digitalizováno až 100 miliónů slov denně, což se rovná zhruba 2,5 miliónů knih za rok. Mohu vřele doporučit TED talk od Luise von Ahna o vývoji programu reCaptcha a jeho novém projektu Duolingo.

LBRY.io

Poměrně zajímavým projektem je LBRY.io, což je kompletně decentralizovaná služba pro sdílení publikací založená na technologii blockchainu. Její vývojáři vymysleli kompletně nový protokol adres ve formátu „lbry://“, který slouží jako ekvivalent internetového protokolu HTTP. Každé dílo má svou unikátní adresu, tudíž by nemělo docházet k duplicitám, pouze k navázání jednotlivých výtisků na příslušný odkaz. Přidanou hodnotou je integrovaný platební systém, jež propojuje odesílání a přijímaní peněz s poskytnutím díla kupci. Všechen obsah je rozmístěn mezi uživateli, aby nedošlo k jeho ztracení, ovšem zároveň je šifrován, a tak nemůže dojít k jeho zcizení.

6. Závěr

Moderní technologie jsou bez pochyby na vzestupu a cloudové služby jsou toho příkladem. Díky technologickému pokroku se ty nejdivočejší představy stávají postupně skutečností. Celý tento proces velmi trefně shrnuje fakt, že v současnosti největší dopravní taxi služba Uber nevlastní žádné automobily v provozu. Facebook, nejpopulárnější mediální nástroj, netvoří žádný obsah. AirBnB, největší poskytovatel ubytování na světe, nevlastní žádné pronajímatelné nemovitosti. To jenom dokresluje internacionalizaci cloudových služeb. Zároveň však bude nutné zachovat soukromí uživatele a překonat kulturní, jazykové i legislativní rozdíly.

Knihovny mohou tyto technologie využít pro svůj růst, rovněž se mohou stát evangelistou moderního přístupu k informacím. Zároveň se nabízí možnost jejich proměny ve vzdělávací a komunitní prostory díky postupné digitalizaci vědění.

Citace

(1) Cloud computing [online], poslední aktualizace 23. listopadu 2017 13:28 [cit. 25. 11. 2017], Wikipedia. Dostupné z WWW: https://en.wikipedia.org/wiki/Cloud_computing

Zdroje

REJNEK, Tomáš. Přínosy a problémy využití cloud computingu ve státní správě, informačních institucích a knihovnách [online] str.22–23 [citováno 27. 11. 2017]. Dostupné z: https://is.cuni.cz/webapps/zzp/detail/124303/

ČERNÝ, Michal. Deset trendů ICT, které změní knihovny i informační vzdělávání. In INFORUM 2013: 19. ročník konference o profesionálních informačních zdrojích. Praha: Albertina icome Praha, 2013. 8 s. ISSN 1801–2213

RYLICH, Jan. Cloudové služby: data i počítače v oblacích. Ikaros [online]. 2012, ročník 16, číslo 9 [cit. 2017–11–25]. urn:nbn:cz:ik-13965. ISSN 1212–5075. Dostupné z: http://ikaros.cz/node/13965

Přispěvatelé Wikisofia, Cloudové služby [online], , c2017, Datum poslední revize 22. 04. 2017, 11:05 UTC, [citováno 25. 11. 2017] https://wikisofia.cz/index.php?title=Cloudov%C3%A9_slu%C5%BEby&oldid=47458

KOROLOV, Maria. Největší bezpečnostní problém cloud computingu: dodržování zákonů. BusinessWorld. [online]. [2015] [citováno 25. 11. 2017]. Dostupné z: http://businessworld.cz/cloud/nejvetsi-bezpecnostni-problem-cloud-computingu-dodrzovani-zakonu-12250

PEREZ, Sarah. Majority of U.S. consumers still download zero apps per month, says comScore. TechCrunch. [online]. [2017] [citováno 25. 11. 2017]. Dostupné z: https://techcrunch.com/2017/08/25/majority-of-u-s-consumers-still-download-zero-apps-per-month-says-comscore/

GONZALEZ, Nick. reCAPTCHA: Using Captchas To Digitize Books. TechCrunch. [online]. [2011] [citováno 25. 11. 2017]. Dostupné z: https://techcrunch.com/2007/09/16/recaptcha-using-captchas-to-digitize-books/

KOETSIER, John. Data Deluge: What People Do on the Internet, Every Minute of Every Day. Inc. [online]. [2017] [citováno 27. 11. 2017]. Dostupné z: https://www.inc.com/john-koetsier/every-minute-on-the-internet-2017-new-numbers-to-b.html

DOČEKAL, Daniel. Bouřka vyřadila cloud Amazonu a s ním i řadu dalších služeb. Instagram stále mimo provoz. Lupa. [online]. [2012] [citováno 27. 11. 2017]. Dostupné z: https://www.lupa.cz/clanky/bourka-vyradila-cloud-amazonu-a-s-nim-i-radu-dalsich-sluzeb-instagram-stale-mimo-provoz/

ARPANET [online], poslední aktualizace 15.listopadu 2017 03:07 [cit. 27. 11. 2017], Wikipedia. Dostupné z WWW: https://en.wikipedia.org/wiki/ARPANET

National Science Foundation Network[online], poslední aktualizace 7.listopadu 2017 08:29 [cit. 27. 11. 2017], Wikipedia. Dostupné z WWW: https://en.wikipedia.org/wiki/National_Science_Foundation_Network

CESNET [online], poslední aktualizace 25.srpna 2017 13:12 [cit. 27. 11. 2017], Wikipedia. Dostupné z WWW: https://en.wikipedia.org/wiki/CESNET

--

--

Adam Cironis
UISK — Library services today

Aspiring software engineer, M.S. New Media Studies, National Museum in Czechia