Keď pri analýze dát nejde len o dáta
Ak sa povie „záverečná práca“, predstavím si automaticky strohý formát seminárky, bakalárky alebo diplomky a prác podobných. Kopa odborných výrazov, formálna štylistika, písmo Times New Roman 12, riadkovanie 1,5, zarovnanie do bloku, odseky, nadpisy, kapitoly, podkapitoly, automatické zoznamy,… skrátka všetko čo k tomu patrí. Presne tak som si predstavovala aj moju záverečnú prácu v Digitálnej akadémií od Czechitas. Vy ste mi však dali voľnosť a ja som sa rozhodla, že ju využijem. (Na)píšem svoj prvý blog!
Rada by som začala tam, kde to celé začalo. Približne v polovici akadémie sme si mali zvoliť tému záverečnej práce, alebo aspoň mentora k nej. Pár dní pred tým som si, sama pre seba, konečne sformulovala, kam sa chcem profesionálne ďalej uberať a aké sú moje ciele. Úprimne som si priznala, že najväčšiu radosť mi robí pomáhať a keď to postavím do sveta ekonómie a biznisu, tak pomáhať (menším) firmám, ktoré majú dobrý nápad, dobrú myšlienku, srdce a dušu, aby boli úspešné. Hneď za tým som sa opýtala seba samej: „Ako?“ Ako sa to dá dosiahnuť v súčasnom svete. Nuž u každej tej firmy to bude asi z časti individuálna cesta, ale väčšiu či menšiu úlohu v nej, pravdepodobne, okrem rozhodnutí robených na základe dát budú hrať aj sociálne siete. A o tých som ja, sociálny anti-človek, sakra, nič nevedela! Začala som sa nahlas smiať.
Keď som sa následne na akcií „Meet your mentor and find your internship“ posadila ku stolu Andejky Bubníkovej a ona sa ma opýtala, čo ma k nej privádza, vyšla som s pravdou von. Bez okolkov som na ňu vysypala, že o socmede neviem úplne že NIČ, ale chcem to zmeniť, lebo si myslím, že v dnešnom svete to je dôležitá vec a či si myslí, že záverečnú prácu u nej by zvládol aj človek ako ja. Andrejkina reakcia bola nezabudnuteľná. Vraj to znie ako výzva a tie má rada, že by do toho snáď aj išla. No a keď mi povedala, že témou práce by bola analýza dát z Facebook Insights reálneho klienta, v podstate jej „každodenný chleba“, bolo rozhodnuté. Dá mi zadanie, dá mi dáta, prevedie ma ich spracovaním, presne vie čo s nimi treba robiť, takže sa nikde nezamotáme a ja pričuchnem k socmedu. Pri voľbe mentora bola Andrejka moje číslo jedna. Viete si asi predstaviť, akú radosť som mala, keď som zistila, že to vyšlo :-)
Počas prvého Skypu som dostal od Andrejky odporúčanie prejsť si Digitálnu garáž od Googlu, a tiež sa ponoriť do Facebook Blueprint, zatiaľ čo bude mať pre mňa dáta. Garáž som už mala v tom čase rozrobenú, takže som do nej pustila s ešte väčším nasadením. O niekoľko dní neskôr, pri ďalšom Skype, som sa mohla pochváliť už certifikátom a najmä základnými znalosťami o online marketingu. Juch!
Prišli dáta. Patrili veľkému českému e-shopu a boli (a sú) prísne tajné, takže ich v ďalšom texte veľmi opisovať nebudem. Andy mi vysvetlila ako sa v nich mám orientovať, v ktorej tabuľke čo nájdem. Úloha na najbližšie dni znela: „Pozri si tie dáta a premysli si, čo by si chcela analyzovať.“ Haha. Dobrý vtip. Ja? Veď ani neviem čo sa dá v tých dátach nájsť, aké sú možnosti, aké sú trendy… No nič. Priateľ na telefóne by mohol pomôcť. Zavolala som kamarátke, markeťáčke (nešpecializuje sa však na social), že čo by ju potešilo vedieť o facebookových dátach firmy, pre ktorú by pracovala. Nechápala ma. A ja som jej to poriadne nevedela vysvetliť, lebo som sama netušila, čo všetko sa v tých dátach dá nájsť. Ešte som jej dva krát zopakovala otázku, ale takmer bez výsledku. Povedala mi len, že by ju zaujímalo, kto sú tí ľudia, čo chodia na jej Facebook, teda pohlavie, vek, geografická poloha, ich záujmy… No a keďže v portfóliu mojich kamarátov už žiadny iný markeťák nebol, začala sa ma zmocňovať panika.
Nakoniec som to vzala úplne z iného konca. Po svojom. Nesedela som nad dátami, ale nad blogmi o socmede, najmä o Facebooku a Facebook Insights. Googlila som, čítala som, pozerala som videá markeťákov na Skillshare a Youtube. To všetko s jediným cieľom — pochopiť svet sociálnych médií. Ďalší Skype s mentorkou sa blížil a moja úloha, premyslieť si, čo by som chcel analyzovať, bola stále nesplnená. Predstavila som si, že som riaditeľ firmy ja, alebo aspoň marketingový šéf. Čo by ma zaujímalo o firemnom Facebooku? A čuduj sa svete, otázky sa začali vynárať. A bolo ich hodne! Kto sú moji Facebook fanúšikovia? V akom čase najviac reagujú? Ktoré moje príspevky v analyzovanom období mali najväčší úspech? Aká časť z nich bola sponzorovaná a aká organická? Aký bol počet znakov najúspešnejších príspevkov? Existuje nejaká súvislosť medzi obsahom príspevku a jeho úspešnosťou? Má na úspech príspevkov vplyv počasie?! Páni, to bol zmena. Zrazu som na tom celom začala mať osobný záujem. Mňa samú zaujímali odpovede na všetky tie otázky, ktoré som si položila. Už som nepotrebovala mentorku, aby ma previedla celou prácou, stanovila mi zadanie a krok po kroku ma doviedla až k záveru. Začala som potrebovať spojenca a zároveň kritika, ktorý by konštruktívne usmernil moje nadšenie a zároveň ma nechal pracovať a skúmať to, čo mňa samú zaujímalo.
Andrejka zvládla novú situáciu na výbornú. Trpezlivo si vypočula všetky moje námety na možné analýzy, citlivo zhodnotila ich vhodnosť a nevhodnosť z pozície svojich skúseností a s veľkým nadšením ma podporila takmer vo všetkom, čo som vymyslela.
Konečné zadanie teda znelo: „Analýza úspešnosti facebookových príspevkov spoločnosti XXX v období 1. 1. 2017–1. 5. 2017.“ Vzala som si Facebook Insights Data Post Level, na hárku Lifetime Talking About This som si vytvorila nový stĺpec s názvom Záujem o príspevok a v ňom som cez funkciu SUM() sčítala pre každý jeden príspevok zdieľania, lajky a komenty. Následne som použitím filtra zoradila všetky príspevky podľa záujmu o ne od tých s najväčším záujmom až po tie s najmenším. Keďže som sa chcela zamerať na najúspešnejšie príspevky zo sledovaného obdobia, použila som Paretovo optimum a odčlenila horných 20%. K ďalším analýzam som používala už len tento zmenšený súbor dát.
Ako prvé ma zaujímalo percentuálne zastúpenia zdieľaní, lajkov a kometov. Teda či niektorá z týchto akcií výrazne prevyšuje inú. Vychádzala som z mnou upravenej tabuľky Lifetime Talking About This. Po natiahnutí tejto tabuľky vo formáte .xlsx do Power BI, sa mi v podstate štyrmi klikmi podarilo vykresliť koláčový graf, ktorý názorne zobrazil tento pomer (ako value som nastavila stĺpce share, like, comment). Najväčšie zastúpenie mali lajky, z väčším odstupom za nimi nasledovali komenty a najmenej bolo zdieľaní.
Následne ma zaujímal výskyt príspevkov s najväčším záujmom v čase. Opäť som ako východziu použila upravenú tabuľku Lifetime Talking About This. V Power BI som na osu x položila dátumy príspevkov a ako value som dala moju vypočítanú metriku Záujem o príspevok. Na základe grafu bolo možné konštatovať, že len v jednom kalendárnom mesiaci z piatich skúmaných sa nevyskytoval príspevok prevyšujúci hodnotu záujmu 2000.
Ďalej som porovnávala počet znakov príspevku a záujem oň. Počet znakov príspevku som určila použitím funkcie LEN() v Exceli. Následne opäť v Power BI som ako value označila metriky Počet znakov príspevku a Záujem o príspevok — obe mnou vypočítané v predchádzajúcich krokoch. Graf nebol veľmi čitateľný kvôli niekoľkým extrémnym hodnotám Záujmu o príspevok. Po ich odstránený z dátového súboru bolo možné vidieť, že závislosť medzi počtom znakov a záujmom o príspevok nie je veľmi zreteľná.
V ďalšom kroku som zisťovala, aký typ príspevku bol najviac rozšírený a aké zastúpenie mali jednotlivé typy príspevkov. Keďže som si s týmto nevedela poradiť priamo v Power BI, vytvorila som si pomocnú tabuľku v Exceli, kde som za pomoci funkcie COUNTIF() spočítala jednotlivé typy príspevkov. Najviac rozšíreným typom príspevku bola v skúmanom súbore dát fotka.
Rovnako vďaka pomocným výpočtom a tabuľkám v Exceli som zisťovala percentuálne zastúpenie platených a organických príspevkov a tiež pomer záujmu o ne. V tomto kroku som použila tiež dáta z hárku Key Metrics (tabuľka Facebook Insight Data Post Level).
Následne som si vyfiltrovala päť príspevkov s najväčším celkovým záujmom, pomocou odkazu som si ich zobrazila v prehliadači a pozrela som sa o aký typ príspevku išlo. Tiež som z neho urobila print screen, ktorý bude použitý pri prezentácií výsledkov firme XXX. Obdobným spôsobom som si vyhľadala a zobrazila tri najviac lajkované, tri najviac zdieľané a tri najviac komentované príspevky. Rovnako som postupovala aj pri piatich najúspešnejších organických príspevkoch. Pri nich ma ešte navyše zaujímalo celkové umiestnenie v analyzovanom súbore. Cieľom bolo sedliackym rozumom zistiť, čo majú (ak niečo) tieto príspevky spoločné.
K už vyššie spomínaným príspevkom s najväčším celkovým záujmom (organické aj platené, teda spolu desať) som ešte dohľadala záznamy o počasí pre celú Českú republiku v deň ich uverejnenia. Tieto údaje, aj keď na tak minimalistickej vzorke dát, vykázali určitý trend.
V rámci tohto projektu je to všetko. Mňa osobne, by ešte zaujímalo, ako by vyššie uvedené analýzy vyzerali v prevedení na celoročných dátach, a tiež by som sa rada pozrela podobným spôsobom aj na 20% príspevkov s najmenším záujmom a pokúsila sa v nich odhaliť trendy, ktorým by sa dalo následne vyvarovať. Pri troške vizionárskej predstavivosti si viem predstaviť prepojiť analýzu s údajmi o počasí a v prípade rozoznania trendu následne vytvoriť predikčný model/ aplikáciu pomocou ktorej by sa dalo naplánovať a realizovať efektívne uverejňovanie príspevkov z hľadiska závislosti na počasí.
V momente keď som prácu dokončila a pozrela som si ju celú, zmocnil sa ma pocit, že je príliš jednoduchá, že nie je hodná záverečnej práce v Digitálnej akadémií. Keď som sa nad tým zamyslela, zistila som, že to tak je a nie je zároveň. Táto práca skutočne z ďaleka neodzrkadľuje to, čo všetko som sa počas akadémie naučila. Nečistila som v nej dáta v SQL či Phytone, nepoužívala zložité selekty, neprepájala spolu niekoľko ohromných tabuliek, nepracovala som s dátami o objeme desiatok či stoviek tisíc údajov. Úplne som si vystačila s Excelom a Power BI a chvíľami som mala pocit, že by mi stačil aj Excel a Powerpoint… Moje novonadobudnuté hard skills zostali nevyužité… ALE! Vďaka tejto práci, som získala prehľad o online marketingu, dostala som sa bližšie k socmedu a naučila sa čítať v dátach z Facebook Insights (aspoň z časti). A čo je možno ešte dôležitejšie, začala som nad tými dátami premýšľať nie len z pozície dátovej analytičky, ale aj markeťáčky. Budúcnosť ukáže, či je to ozaj tak, no dnes si myslím, že toto je niečo, čo ma posunulo bližšie k môjmu cieľu, vedieť pomôcť (malým) firmám s dobrým nápadom robiť ich biznis úspešný. Ďakujem ❤