Digital Humanities: O grafech a lidech

Ukaž mi svá metadata a já ti řeknu, kdo jsi.

Když se podíváte na seznam svých kontaktů na Facebooku, každý z nich nejspíš zařadíte do různých komunit. Vidíte známé ze školy, z práce a stejně tak i lidi zcela neznámé, které nikdy nepotkáte. Vazby mezi vámi a vašimi kontakty tvoří sociální graf – co z něj můžeme vyčíst?

Třeba bychom mohli určit ony škatulky. Algoritmicky, pouze na základě vazeb. Přesně to bylo náplní jedné hodiny Digital Humanities na SNM, kde jsme se zaměřili na zpracování dat z Facebooku v programu Gephi – „Photoshopu pro grafy“. Graf přátel – a jejich vazeb – jsme získali pomocí nástroje Netvizz. A pak přišla na řadu ta zábavná část.

Komunity (či clustery, chcete-li) v sociální síti vykazují silnější vazby mezi jednotlivými členy. Jeden ze způsobů, jak komunity v síti objevit, je výpočtem modularity – v Gephi záležitost jednoho kliknutí. Po obarvení jednotlivých komunit a úpravě rozvržení se nám zřetelně oddělí jednotlivé komunity.

Barva uzlu odpovídá třídě modularity, velikost uzlu míře mezilehlosti (betweenness centrality)

V mém případě se jasně oddělilo pět komunit: spolužáci ze SNM, z ČVUT a dva různé ročníky kamaradů ze střední školy (!). Poslední komunita vyšla méně jasně, zahrnuje „fantazáky“ a známé z Maelströmu, ale i kamarády ze zcela odlišných skupin. Možná je zde příliš málo vazeb nebo zde narážím na horší rozlišovací schopnosti modularity pro malé komunity. Nicméně na „hloupý algoritmus“ a pár minut práce to není špatný výsledek. Nebo jak by řekl Josef Šlerka:

Dost dobrý!

Tato data může získat každá aplikace na Facebooku, které povolíte základní přístup ke svému účtu. Jistě, jsou to „jenom metadata“ – podobně jako informace, s kým si píšete a komu voláte

Mezi námi stránkami

Dále jsem zkoumal vazbu mezi stránkami – page like network, tj. stránky, které „lajkují“ stránky… rekurzivně až do hloubky dvou. Pro analýzu jsem si vybral oblast fandomu: cony a akce zaměřené na anime, sci-fi a fantasy. Konkrétně: Festival fantazie, Advik, brněnský Animefest a Koprcon. K mému překvapení nebyla výsledná množina dat příliš velká, zřejmě nejsou správci v tomto směru příliš aktivní.

Nicméně i tak se ve výsledném grafu zformovaly jednotlivé fandomy.

Page like network pro Animefest, Advik, Festival fantazie a Koprcon

Animefest a Advik, přestože mezi sebou nemají přímou vazbu, tvoří jeden velký cluster otaku, který má zároveň nejblíže k mezinárodním komunitám (zde reprezentovaným stránkou EuroCosplay). Koprcon se ocitnul v clusteru se „seriálovými“ komunitami – Prima COOL, FAN BASE – ale zároveň má nejblíže ke komunitě Star Wars, což je zjevně vesmír sám pro sebe. Největším zklamáním byl Festival fantazie, který jaksi stojí na okraji veškerého dění, pouze s vazbou na herní weby a stránky magazínu Topzine.cz (které zde tvoří samostatný cluster).

Kam dál

Odvážným datologům vřele doporučuji kurz Social Network Analysis na Courseře. Nevyhnete se sice ani lehčímu programování, ani hromadě teorie, zato je látka podávána mnohem stravitelněji a zábavněji, než s čím jsem se setkal na technice.


Publikováno také na bitoff.cz.