Analýza prodejů maloobchodní sítě prodejen

Úvod

Pod hlavičkou ABRA Software a.s. (společnost poskytující informační systémy třídy ERP a k nim vztahující se služby), jsme zpracovaly datovou business analýzu pro společnost Jihočeská textilní, s.r.o. (společnost zabývající se prodejem dámského i pánského oblečení či doplňků).

K volbě tématu došlo až na základě matchingu během Hackathonu. Ač jsme původně měly vymyšlené téma vlastní, nakonec se jako lepší cesta ukázala ta, kterou nastínili Tomáš Urban a Viktor Ponomarev z ABRA Software a.s. . Výhodou projektu byla dostupnost dat, srozumitelnost tematiky a možnost praktického výstupu.

Cílem navrženého tématu bylo obsáhnout a vizualizovat data, která mohou zajímat vedení sítě prodejen s oblečením, a to pro zákazníka Jihočeská textilní, s.r.o. a pomoci tak odhalit možnosti růstu sítě prodejen, tj. vyhledat nejvhodnějších lokace pro nové provozovny za pomoci demografických dat a dat týkajících se stávajících prodejů. Závěrem jsme si stanovily, že vyhodnotíme prodeje v rámci časových úseků, různých prodejních akcí a jejich dopadu na tržby, prověříme strukturu tržeb z pohledu typu oblečení a vyhodnotíme datovou relevantnost podkladových trendových dat o nakupované struktuře velikostí, stylů a případně i barev oblečení pro další budoucí návrhy kolekcí.


Plán projektu

Na začátku jsme si udělaly jednoduchý plán projektu. Cílem bylo ukrajovat vše po částech a v každém okamžiku vědět, co nás ještě čeká. V rámci každého bodu bylo několik úkolů a ty jsme postupně v Asaně plnily. Na začátku nám to šlo jako po másle, na konci se to trochu zvrhlo především pro živelnost zjištěných možností vizualizace a zkoušení, co všechno ještě jde udělat.


Data

Velkou výhodou bylo, že Jihočeská textilní, s.r.o. má data v systému ERP ABRA Gen, kde jsme díky kvalitní dokumentaci vyčetly potřebné vazby. Jelikož ale zákazník nikdy prodejní data nevizualizoval, nebyla pro potřeby reportingu data upravena a vytěžení potřebných veličin nebylo tak jednoduché, jak se na první pohled zdálo.

Na nás bylo tato data uspořádat a vytěžit z nich informace použitelné pro následující vizualizace a interpretaci. Získaly jsme přístup do očištěné databáze o citlivá data a mohly se pustit do přípravy schématu a SQL dotazů.

Krom dat z ERP ABRA Gen jsme ale potřebovaly i data tzv. “otevřená”. V našem případě se jednalo o data statistická ze státní správy, tj. demografická a finanční. Demografická data jsme čerpaly od Českého statistického úřadu — konkrétně datovou sadu obsahující časovou sadu se statistickými údaji o věkovém složení mužů a žen v krajích a okresech ČR. Ze stránek Ministerstva práce a sociálních věcí údaje k nezaměstnanosti taktéž vztažená k jednotlivým okresům v rámci ČR.


Nástroje

Nejvíce jsme pracovaly s SQL (Snowflake, Dbeaver + Firebird) a Tableau, koordinace projektu probíhala v Asaně a SLACKu. Dále jsme pracovaly s nástrojem Keboola a s Excelem.


Schéma

Pro lepší představu o uspořádání dat a následném SQL kódu jsme vytvořily normalizované db schéma. Schéma je zobrazeno v počáteční fázi jeho tvorby. Důvodem tvorby schématu byl rozsah originální dokumentace a potřeba vytěžení jen malé části z oblasti prodeje a struktury položek.

Pomocí schématu jsme si ujasnily, které klíčové ukazatele nás zajímají a jsou důležité pro další práci s vizualizací a prověřily namátkově jejich kvalitu pro určení dalších rizik. Toto prověření se nám vyplatilo při určování cílového oblečení (muži, ženy, unisex). Po prostudování dat jsme se zaměřily na parametry, která se týkají typologie oděvů (rozdělení dle pohlaví, rozdělení dle velikostí a typ oděvů) a demografie (okresy).

Výsledná datová prodejní sada, kterou jsme se rozhodly realizovat pomocí SQL obsahovala údaje časové — roky, měsíce a týdny i dny v měsíci a v rámci týdne; produktové — typy oděvů a velikosti, rozlišení dle pohlaví, sezón a barev ; demografické — kraje, okresy; finanční — maloobchodní tržby s počty prodaných kusů a uplatněné slevy.

Samostatně byla připravena a očištěna demografická statistická data.


Tvorba SQL

V SQL jsme byly limitovány funkčností databáze Firebird 3.0 a odlišné práce s datumem v databázi ERP ABRA Gen. Dokumentaci ke specifickým vlastnostem jsme hledaly na firebird.org a od našich mentorů.

Mezi hlavní použité funkce patřily následující příkazy: CAST — tato funkce provádí konverzi argumentu na zadaný typ, v našem případě se jednalo o konverzi STRING na DATE; EXTRACT — funkce vrací zadanou složku data, v našem případě se jednalo o týden v roce, den v roce a den v týdnu; COALESCE — podmínka, která nám vrátí chybějící místo nebo PSČ pro eshopové neadresné objednávky; REPLACE — funkcí replace jsme nahradily textový řetězec pro PSČ; CASE — podmínkou byly ošetřeny hodnoty pro rok, sezónu a určení pohlaví; WHEN, ELSE, END AS a WHERE — byla použita i tato podmínka; JOIN- bylo spojeno celkem 19 tabulek; UNION ALL — sloučeny dvě tabulky faktury a příjmy.

Výsledkem naší snahy bylo SQL o 150 řádcích založené na 2 základních tabulkách obratů s napojením všech potřebných informací. Konečná získaná množina prodejních dat (datová kostka) měla 1.2 milionu řádků a 30 sloupců. Vytěžení dat lze realizovat opakovaně pro offline přenos. Časová náročnost získání potřebných dat se pohybovala při jednotlivých pokusech na produkčním serveru kolem 5-ti minut.


Reporty

Struktura reportů

Stanovení struktury reportů je mezikrokem od sql kódu k vizualizaci a má podobu ryze teoretickou. Cílem je shrnutí dosavadních zjištění a návrh možných vizualizací. Pro lepší přehlednost a konzistentnost celého postupu jsme návrhy grafů rozčlenily do skupin, které jsme pojmenovaly totožně jako komponenty, které budeme při jejich vytváření používat.

Jedná se o následující 4 komponenty:

  • Zákazníci: pohlaví, věk
  • Zboží: barvy, velikosti, množství, sezóna, rok
  • Obchod: název firmy, cena, datum
  • Geo: město, PSČ, okres

Návrhů reportů bylo celkem 16 a byly vyselektovány ty, které byly považovány za nejvíce zákaznicky prospěšné. Jejich výčet a vizualizace je obsažena v následující části analýzy.


Vizualizace

Volba vizualizačního nástroje Tableau byla jasná volba. Jednak nám tento nástroj vyhovoval po intuitivní stránce a jednak jsme již věděly, že pro zobrazovaná data budeme potřebovat nástroj, který umí relativně detailně zobrazovat geografické údaje a přesně tuhle podmínku Tableau splňoval i díky získaným podkladovým datům k rozdělení okresů od Martina Balaše z Banana.bi.

V Tableau jsme pracovaly s celkem 4 datovými sadami (prodejní data, nezaměstnanost, věková struktura a mapový podklad okresů). Vše jsme sjednotily na úrovni okresů, což byla místy mravenčí práce.

Výpis připravených grafů:

  1. Podíl tržby versus počet obyvatel (30–65 let) v jednotlivých okresech v roce 2017
  2. Tržby celkem v jednotlivých okresech v roce 2017
  3. Nezaměstnanost vs. počet obyvatel (30–65 let) v jednotlivých okresech v roce 2016
  4. Nejprodávanější zboží ve sledovaném období 2016–2018
  5. Nejprodávanější velikosti v roce 2018 v pánské a dámské konfekci
  6. Nejprodávanější modely v roce 2018
  7. Množství a tržby z prodeje v čase
  8. Tržby vs. množství dle typu oděvů v roce 2018
  9. Tržby v týdnech pro roky 2016–2018

1-Podíl tržby versus počet obyvatel (30–65 let) v jednotlivých okresech v roce 2017

Tento graf uvádí v kontext nejvyšší tržby v souvislosti s nejvyšší počtem zákazníků v předem určené věkové kategorii. Cílová skupina zákazníků byla určena již před analýzou a to na základě dlouhodobých prodejních zkušeností Jihočeské textilní, s.r.o.. V našem případě má největší obchodní potenciál Praha. Následují České Budějovice, Plzeň-město, Praha-východ, Liberec, Kladno, Hradec Králové a a Brno město.

1 — Podíl tržby versus počet obyvatel (30–65 let) v jednotlivých okresech v roce 2017

Velikost obdélníků určuje hodnota tržby, barvu pak počet obyvatel vybraného věku. První uvedené číslo v obdélníku je tržba a druhé počet obyvatel.

2 -Tržby celkem v jednotlivých okresech v roce 2017

Následující graf zobrazuje výši celkových tržeb a vedení společnosti může vyhodnotit prodejně nejslabší oblasti = nejsvětlejší (ač zaujmou naopak tmavé odstíny vysokých tržeb). Graf poukazuje na oblasti, kde není dostatečně využit obchodní potenciál a kde je teoreticky možné posílit prodej otevřením prodejny anebo změnou obchodní strategie.

Při ověřování okresů s podstatně vyššími tržbami bylo zjištěno, že v okresech je více provozoven, nebo provozovny vysloveně tradiční, kam se sjíždí z celého okolí.

2 -Tržby celkem v jednotlivých okresech v roce 2017

Z mapy je patrné, že prostor pro realizaci obchodů anebo uvažováním o podpoře obchodů stávajících je především v celé oblasti Moravy a Slezska. V rámci Čech se pak jedná spíše o jednotlivé kraje — například západní a severní Čechy, kde je ale nutno brát v potaz potenciál s ohledem na zaměstnanost a počet obyvatel v okresních městech.

3 -Nezaměstnanost vs. počet obyvatel (30–65 let) v jednotlivých okresech v roce 2016

Následující graf zobrazuje nejvyšší nezaměstnanost v přepočtu na počet obyvatel. Ačkoliv se nemusí na první pohled zdát jako důležitý, jeho význam se prokáže při porovnání s vizualizací prodejní úspěšnosti.

Pro příklad si uveďme oblast Ostravy a severních Čech — právě tyto oblasti patří v prodejnosti mezi ty méně úspěšné a zároveň patří mezi oblasti s vysokou nezaměstnaností. Tento graf tak ukazuje jednu z možných cest, kterou se, při úvahách nad posílením prodejů, vydat či spíše neubírat a energii směřovat do ekonomicky silnějších oblastí, kde zatím společnost nepůsobí.

3 -Nezaměstnanost vs. počet obyvatel (30–65 let) v jednotlivých okresech v roce 2016

Barva určuje procento nezaměstnanosti a číslo uvedené u okresu počet obyvatel ve sledovaném věkovém rozsahu.

4 -Nejprodávanější zboží ve sledovaném období 2016–2018

V čem tkví síla produktového portfolia Jihočeské textilní, s.r.o.? To ukazují dva následující grafy pro pánské a dámské modely samostatně. Mezi nejprodávanější módní kousky patří jednoznačně tričko s krátkým rukávem ve velikostech XL, L, M a XXL. Následuje tričko s dlouhým rukávem ve velikostech L, XL a M. Je jen otázkou preference vedení společnosti, zda chce i nadále posilovat a rozšiřovat to, v čem tkví síla obchodu a případně omezit méně prodávané typy a velikosti.

4 -Nejprodávanější zboží ve sledovaném období 2016–2018

5 -Nejprodávanější velikosti v roce 2018 v pánské a dámské konfekci

Následující graf může mít velký význam při plánování výroby a určování přepravní matice oblečení. Mezi nejprodávanější velikosti patří L, XL, M a XXL. Dá se předpokládat, že v těchto prodejních tendencích k výraznějším změnám docházet nebude a proto, při plánování výroby a rozmístění zboží v rámci skladových prostor je třeba navyšovat objemy (jak vyrobených kusů, tak míst v rámci logistického skladu) právě pro tyto velikosti. Dodávka z výroby probíhá v tzv. maticích, tj. mixu velikostí jednoho modelu v jedné krabici. Tato struktura by měla pomoci odpovědět, jaká matice je optimální.

5 -Nejprodávanější velikosti v roce 2018 v pánské a dámské konfekci

6-Nejprodávanější modely v roce 2018

Jako hitparáda produktové oblíbenosti modelů by se daly nazvat oba následující grafy. Jsou tvořeny samostatně pro pánskou a dámskou konfekci názvy modelů a počtem prodaných kusů. Dá se tak s úspěchem předpokládat, že prodejem podobných či stejných modelů (byť v jiné barevné škále či s nepatrně odlišnými prvky — např. zdobením) se bude prodejní úspěch opakovat. Takovýto graf napovídá, jakým směrem se, s nejvyšší pravděpodobností, bude ubírat módní preference zákazníků i v roce následujícím.

Barva kruhů určuje velikost oblečení dle legendy vpravo.

6 -Nejprodávanější dámský model v roce 2018
6 -Nejprodávanější pánský model v roce 2018

7 -Množství a tržby z prodeje v čase

Graf zobrazující nejsilnější prodejní měsíce je spíše potvrzením letitých zkušeností vedení společnosti. Prosinec a červen jsou obchodně nejsilnější měsíce. Výrazné výkyvy množství jsou dány akcí 1+1 v lednu a červenci.

7 -Množství a tržby z prodeje v čase

8 -Tržby vs. množství dle typu oděvů v roce 2018

Následující graf nás utvrzuje v tom, které produkty jsou “tahounem” prodeje a zároveň přináší jedno zajímavé zjištění. Prvenství v prodaném množství z produktového portfolia se dá, jak se dalo s úspěchem předpokládat, přisuzovat tričkům — trička s krátkým rukávem jsou následována tričky s rukávem dlouhým. Zajímavostí je třetí příčka a tu tvoří šaty. Důležitým prvkem v tomto grafu je zobrazení měsíců, ve kterém byl obchod realizován. Vezmeme-li jako příklad trička s krátkým rukávem a šaty, můžeme konstatovat, že prodejní úspěšnost v měsíci červnu je rozložena právě mezi tyto typy oděvů.

8-Tržby vs. množství dle typu oděvů v roce 2018

9 -Tržby v týdnech pro roky 2016–2018

Pro detailnější plánování dovolených, inventur a různých inovací na provozovnách je zobrazeno porovnání tržby jednotlivých let po kalendářních týdnech. Dosud jsme se věnovaly měsícům a týdny jsou v tomto směru zajímavější. Je viditelné na první pohled, že v únoru je ideální čas na rozsáhlejší údržbu.

Data roku 2018 byla pouze do 45. týdne, tedy porovnání není pro konce roku věrohodné.

9 -Tržby v týdnech pro roky 2016–2018

Závěry

Sumarizace z vizualizace

Získaná data (ať už zákaznická nebo demografická) obsáhla potřebné množství informací, na jejichž základě lze vyvodit závěry použitelné pro uvažování nad dalšími kroky zvyšování tržeb společnosti Jihočeská textilní s.r.o.. Jednoznačně tím je rozšíření pobočkové sítě.

Pro optimalizaci skladových zásob lze využít porovnání velikostí a vizualizaci s úspěšností modelů a skladového menu.

Doporučení:

  • Vést evidenci systematicky, chybné údaje postupně opravovat/promazávat a rozdělovat do sortimentních skupin pro správné oddělení dámské a pánské konfekce.
  • Analyzovat data na pravidelné bázi.
  • Vytvářet vizualizace zejména pro kontrolu stavu, tyto vizualizace archivovat a stav obchodu průběžně porovnávat.
  • Při uvažování nových kroků reflektovat personální obsazenost skladových a prodejních jednotek a sociodemografické situace v dané oblasti.

Ohlédnutí po boji

Nejvíce času a energie jsme investovaly, jak se dalo předpokládat, do čištění dat a tvorby SQL kódu. Nemalé množství času jsme strávily obstaráváním demografických dat z veřejných zdrojů a taktéž jejich čištěním. Velkým oříškem pro nás byly přístupy do Tableau, jelikož jsme měly jen časově omezené trial verze. Tuto situaci jsme vyřešily používáním free public verze, která je sice v některých ohledech okleštěná, ale pro naše potřeby byla dostačující. „Bojovaly“ jsme taktéž s velikostmi souborů a formáty, ale i tyto problémy jsme nakonec vždy úspěšně vyřešily.

V rámci vizualizace můžeme říci, že jsme zkoušely, kolik možností máme a nejvíce práce dalo vybrat reporty, které jsou nejzajímavější.

Další postup

Končíme s novými zjištěnými informacemi pro Jihočeskou textilní, s.r.o., na které lokace se zaměřit, které modely, velikosti a typy oděvů jsou nejúspěšnější. Naším mentorem Tomášem Urbanem byly původní vizualizace osobně prezentovány zákazníkovi a následně byly některé z poznatků zahrnuty do podoby, kterou vidíte zde na blogu. Zpětná vazba byla fajn, získaly jsme dobrý pocit, že náš čas a energie do vizualizace vložená bude použita v praxi.

Přínosy

Přínosem pro nás bylo získání praktických dovedností v datové analýze na reálném zákaznickém projektu a možnost reálně si vyzkoušet práci především s SQL a Tableau — základem úspěchu jsou správně protříděná data, správně zvolené nástroje a správně kladené otázky. Jedno bez druhého nefunguje a tím pádem nevede k vytouženým cílům.

Sami jsme si posílily svoji vizi, že se chceme věnovat oboru datové analýzy. Tímto velmi děkujeme za důvěru, která do nás byla vložena při výběru do tohoto běhu Digitální akademie Czechitas a my tuto šanci využily.


Přehled online zdrojů dle abecedního pořadí

Abra Software a.s., LINK: https://www.abra.eu/

Asana, LINK: https://asana.com/product

Banana.bi, LINK: https://banana.bi/

Český statistický úřad, LINK: https://www.czso.cz/

DBeaver, LINK: https://dbeaver.io/

Draw Entity-Relationship Diagram, LINK: https://dbdiagram.io/

Jihočeská textilní, s.r.o., LINK: https://eshop.jtx.cz/

Keboola, LINK: https://www.keboola.com/

Ministerstvo práce a sociálních věcí, LINK: https://www.mpsv.cz/cs/

Tableau Public, LINK: https://public.tableau.com/en-us/s/

Snowflake, LINK: https://www.snowflake.com/