Analýza docházky

Úvod

MichuA
7 min readMar 11, 2018

Když jsme se dozvěděla, že Czechitas otevírají DA i v Ostravě, málem jsem skákala radostí do stropu. O tom, že bych se nepřihlásila, jsem ani na chvíli neuvažovala. Práce s čísly mě bavila vždycky, a tak proč nespojit příjemné s užitečným, aneb zvýšit si kvalifikaci a šance uplatnění se na trhu s možností naučit se něco zábavného, poznat nové lidi, kamarádky a stát se součástí ostravské datové komunity.

Nápad na téma jsem absolutně neměla. Ale usmála se na mne štěstěna a padli jsme si do noty s mentorem Petrem z firmy CEOS Data. Petr měl své téma, které mne zaujalo a hlavně i částečný přístup k datům. Vše vypadalo slibně, až do doby… Co čert nechtěl, Petr mi onemocněl zrovna ve chvíli, kdy jsme začínaly nabírat nějaké dovednosti. Nebylo moc možností, jak zrealizovat sosání dat, proto už začínala panika-stress.

Se spásnou myšlenkou přišel můj šéf, 2 týdny před odevzdáním, který mi nabídl účast na projektu ve firmě. Velice by jej zajímalo, kam mizí potenciální peníze, rozuměj: proč firma nedostane plnou platbu za člověka a jak to můžeme napravit.

Protože se jedná o zpracování citlivých firemních dat, jsou všechny mé výsledky zamaskovány tak, aby ani největší šťoural z nich nic nevyšťoural.

Techniky, nástroje a získání dat

Během DA nám bylo několikrát řečeno, že data jsou všude. Ano, jsou. Ale dostat je odněkud nebo od někoho, se mi jevilo jako nadlidský úkol. Abych dostala přístup k reportům, musela jsem obíhat několikrát kolečko po HR, IT i finančním oddělení. Pozitivum vidím v tom, že kluci z IT zjistili, kdo má na starost jaké přístupy do konkrétních databází a přiměla jsem je urychlit proces ze “zrovna dělám úpravu reportu” na “ten report budeš mít zítra”. Zítra sice nebyl, ale do týdne jsem měla všechna data u sebe a mohla jsem je začít zkoumat a upravovat.

Jako negativum vidím fakt, že lidská komunikace je na mizerné úrovni. Poté, co jsem si upravila data a byla skoro u konce svého snažení, vlastně mi chyběl jen graf, bylo mi řečeno, že report se ještě doladil a já pracuji se špatnými daty. Takže všechno špatně a mohla jsem začít od 0. Jak se pak ukázalo, nebyl to poslední “začátek”.

Dále mne překvapilo, že nikdo přesně neví, co se pod kterým sloupečkem skrývá. Asi to bude problém všech firem s větší fluktuací lidí. Ti, co databázi vytvářeli, již ve firmě nepracují a každý je schopen pojmenovat jen její část. Doposud se mi nepodařilo zjistit, CO se skrývá pod sloupečkem Other Else, když máme sloupec Other, ve kterém jsou napr. pohřby, svatby, stěhování a jiné. Je záhada, co Ještě Dalšího může být za Dalším. Pro účely analýzy jsem jej vypustila.

Projekt jsem zpracovávala ve dvou verzích. Jedna pro finanční oddělení a management firmy (Excel), druhá pro účely DA (Power BI).

Data

Ve firmě se používá stará dobrá škola Excelu. Proto firemní verze byla vypracována v něm. Musím říct, že se nepovažuji za totální excel-lamu, ale s tímto zpracováním jsem měla docela problém. Dost času mi zabrala úprava formátu sloupců, vymýšlení unikátního klíče a následné zbavování se duplicit. Po x hodinách přišel spásný nápad na vytvoření unikátního ID a mohla jsem přes Vlookup pospojovat jednotlivá data. Ke zbavení duplicit mi pomohla kontingenční tabulka, jejíž schopnosti jsem doposud podceňovala.

Pak jsem se dala do zpracovávání dat v Power BI, abych si osvojila alespoň něco málo ze znalostí získaných v DA. Ze začátku mi přišlo vše strašně jednoduché, tisíckrát více než Excel. Bohužel, to by můj notebook nesměl vyhlásit stávku, seknout se a narušit mi data z fakturace. Od nuly jsem musela začínat skoro pokaždé, když jsem spustila Power BI. Ponaučení: hned při druhém “začátku”, kdy jsem vytvářela tabulku, jsem si vše okopírovala do wordu. Mám obavy, že když bych tak neučinila, asi bych tvořila tabulku i ve snech.

Tvorba docházkové tabulky

Po vytvoření tabulky docházky přišla na řadu druhá tabulka, tentokrát fakturace. Naštěstí její vytvoření vyžadovalo jen jeden řádek. U obou tabulek jsem udělala úpravu formátu, případné rozdělení sloupců. Do obou tabulek jsem přidala nový sloupec s unikátním klíčem.

Vytvoření unikátního klíče

Když byl klíč na světě, mohla jsem se dát do tvorby vazby mezi jednotlivými tabulkami. Aby mne nemátly ty zdrojové, raději jsem je schovala a propojila tabulky INV a ATTD pomocí vazby 1:1.

Náhled vazeb mezi tabulkami INV a ATTD

Vizualizace

Když jsem měla tabulky krásně propojeny, mohla jsem se vrhnout na grafické znázornění výsledků. Protože jsme měla širokou škálu procent, vytvořila jsem si další sloupeček v tabulce INV, který jsem nazvala % Slicer.

Přidání procentuální škály do tabulky INV

Díky přidanému sloupečku jsem mohla začít vizualizovat jednotlivé kategorie po konkrétních měsících. Protože mne zajímali jen lidi, u kterých nebyla proplacena faktura na 100 %, vyfiltrovala jsem si jen je.

Vytvořené filtry % slicer a Month

Z daných tabulek zajímala vedení hlavně spodní část neproplacených peněz. Proto jsme si vyfiltrovala všechny zaměstnance, za které firma obdržela 0–60 % z celkové možné částky za celý rok

Neodpracované hodiny pro 0–60 % proplacené částky

Z grafu vidíme, že největší podíl na neproplacení peněz v této skupině má nemocnost. A to zejména v lednu, květnu a podzimních měsících, kdy se zvyšuje i návštěvnost lékaře.

Přehled skupiny 0–15 % za předešlý rok

U nejnižší skupiny jsme si vytvořila graf pro zobrazení podílu. Vidíme, že nemocnost nám zabírá 3/4, následuje dovolená, doktor a zbytek je skoro zanedbatelný.

Podíváme-li se na všechny kategorie za celý rok, vidíme to, co se dalo předpokládat již na začátku. Největší nepřítomnost v práci je v prosinci, kdy si lidé vybírají dovolenou a nastává období nachlazení a chřipek. Tento trend se většinou přesouvá i do ledna. V průběhu roku vidíme nárůst položky Holiday, kdy si zaměstnanci vybírají dovolenou. Její nejvyšší bod byl dosažen v srpnu.

Přehled neodpracovaných hodin za rok 2017

V lednu docházelo ve firmě k větším změnám. Proto jsem si nechala zvýraznit leden oproti ostatním měsícům. Do porovnání dávám i přesčasy, kterými se chce vedení zabývat v příštím kroku. Je zajímavé si porovnat, kolik hodin chybí a kolik se nadpracovalo. Neodpracované hodiny se zdaleka nepokryly. Do grafu jsem si vybrala všechny měsíce, aby byl patrný celkový vývoj, ale zvýraznila jsem si jen potřebný sloupec.

Leden pro skupinu 30–75 % s přesčasy.

Jak je vidět již z předešlého grafu, je dobré porovnat neodpracované hodiny s přesčasy. Můj poslední graf je srovnání všech skupin za celý loňský rok.

Porovnání neodpracovaných hodin s přesčasy za rok 2017

Firma eviduje největší podíl přesčasů v zimních měsících. Ale jak je zřejmé, zdaleka nepokryjí neodpracované hodiny. I duben, který má nejmenší podíl v neodpracovaných hodinách, je sotva pokryt z 1/4.

Závěr

Z předešlých grafů je zřejmé, že velký vliv na docházku zaměstnanců má nemocnost. Není se čemu divit, když firma sídlí v Moravskoslezském kraji, který se dlouhodobě potýká se znečištěným ovzduším a inverzí. Firma kvůli vysoké nemocnosti přichází o nemalé peníze. Rozhodně se vyplatí zainvestovat do svých zaměstnanců, například formou benefitů jim obstarat vitamíny nebo poukázky do lékáren. Také by bylo vhodné lepší pokrytí neodpracovaných hodin. Ty ani zdaleka nedoženou to, co se v daném měsíci zamešká. Závěrem bych firmě doporučila zjistit, co se skrývá pod označením Other Else, který jsem pro účel DA vynechala, ale v reálných datech dost ovlivňuje výsledné hodnoty.

Výhled do budoucna

DA mi dala spoustu možností, jak nahlížet na data. Ráda bych se této oblasti věnovala i nadále a prohlubovala své dosavadní znalosti. Třeba i s tímto projektem, kde porovnání docházky je jen první z částí celého procesu monitorování chodu ve firmě.

Úmyslně jsme nechala grafy tak, jak jsem je vytvářela. Postupně jsme přicházela na to, jak se dají přidávat popisky os, jak se dá měnit mřížka grafu apod. Byla to zábava, třebaže mě zrazovala technika.

Absolvování kurzu bylo náročné, jak časově, tak psychicky. Po x hodinách nalejvárny do hlavy mi odcházel mozek, ale svého rozhodnutí se přihlásit nelituji. Ba naopak, všude DA vychvaluji a doporučuji. Díky moc za tuhle příležitost. Doufám, že mi pomůže k získání práce, která by mne bavila.

Poděkování

V prvé řadě děkuji svému mentorovi Petru Sanderovi za velkou trpělivost a pomoc při zpracovávání projektu “na poslední chvíli”. Bohužel nám nemoci nepřály, abychom se viděli dříve a častěji, ale Petr je pohodář, tak jsme vše zvládli levou zadní.

A velké poděkování jde všem holkám z DA, lektorům/lektorkám a koučům/koučkám, díky kterým to byly super strávené 3 měsíce. A doufám, že naše komunita bude žít dále !!!

--

--