Analýza zákaznické podpory eshopu

Od začátku jsme chtěly dělat projekt, který bude mít business přesah a který bude mít praktické využití, proto nás hodně zaujala možnost pracovat na analýze pro zákaznickou podporu eshopu s módou.

Cílem projektu bylo na základě zjištění z dat vytvořit doporučení, které by pomohlo zefektivnit práci na podpoře, jejím zaměstnancům ušetřit čas a majiteli eshopu zdroje.

Vstupní data

Pro náš projekt jsme měly k dispozici data z databáze eshopu. Konkrétně se jednalo o databázi všech příchozích a odchozích emailů ze zákaznické podpory za poslední čtyři roky. Také jsme měli přístup do databáze s metadaty o telefonických hovorech.

Protože hlavní podstatu našich dat tvořily emaily, velkou roli v naší práci hrála NLP platforma Geneea. Dále jsme v průběhu projektu používaly Keboola, SQL, Python, Tableau i Power BI.

V první fázi jsme si nahrály data do Keboola přes AWS S3 extraktor. Získaly jsme tak z databáze eshopu dva datasety — jeden dataset obsahující informace o telefonních hovorech a jeden pro emaily.

Příprava dat

Z datasetu emailů pro nás byl nejdůležitější především samotný text, timestamp, předmět emailu a údaj o směru emailu (příchozí/odchozí). Velkou výzvou bylo emaily odfiltrovat, tak abychom měly emaily s textem od skutečných zákazníků podpory, nikoliv reklamní nebo automaticky generované zprávy.

Tento krok byl tak trochu mravenčí práce, protože bylo potřeba se v datech pořádně pohrabat. Nejdříve jsme si seskupily emaily podle nejčastějších předmětů a postupně jsme zjišťovaly, zda jsou emaily s těmito předměty automatické. Pro další analýzu bylo nutné rovněž upravit časový formát. (Kód)

Jaké emaily najdeme ve schránce podpory?

Protože jsme si všimly, že mnoho emailů není čistě příchozí text od zákazníka, ale nejrůznější automatické emaily a spamy, začaly jsme si klást otázku, kolik takových emailů na podporu chodí a jak velký objem z celkového množství tvoří. Ne málo.

Více jak polovina všech příchozích emailů jsou automaticky generované zprávy, emaily od samotných zákazníků pak tvoří pouze 38% ze všech příchozích emailů (ty jsme použily pro textovou analýzu).

Devadesát pět procent automaticky generovaných emailů jsou emaily tvořené samotným eshopem. Pouze 5% z nich jsou pak zprávy generované dopravci nebo poštou.

Podpora tedy věnuje čas emailům, které vůbec neposlal zákazník a proti kterým by pomohla lepší filtrace a lepší nastavení pravidel pro příchozí zprávy.

Čistění textu od html tagů pro textovou analýzu

Protože všechny emaily obsahovaly html tagy, bylo potřeba je odstranit, abychom získaly čistý text. Využily jsme python (kód) a transformaci v Keboola.

Text s html tags před vyčištěním
Text po odstranění html tags

Po získaní čistého textu jsme už jen text přiřadily zpět k ostatním údajům a vznikla tak výsledná tabulka pre textovou analýzu. (Kód)

Textová analýza

Jak zjistit o čem nám zákazníci píšou?

Pro analýzu textů jsme využívaly NLP platformu Interpretor od Geneea (demo) a také vizualizační nástroj Geneea Frida. Frida umí ukázat frekvenci jednotlivých slov v textu, nebo například keywords či sentiment. Dokáže také například automatickou detekci jazyka.

Frida screenshot

Kromě samotných dat bylo potřeba připravit pro textovou analýzu training file. V training file jsme si mohly definovat své vlastní entity a tématické okruhy. Například proto abychom si název značky zboží oddělily od ostatních vlastních jmen organizací.

Bylo také potřeba si některá slova sloučit pod jeden společný výraz. Skvrna, flek a šmouha jsou tři různá slova, ale pro účely analýzy se jedná o tu samou příčinu reklamace. Stejně tak teniska a kecka může být sloučena jako ten samý typ zboží.

Frida ukázka

Po proběhnutí první textové analýzy bylo nutné další čištění dat. Právě analýza ukázala, že v datech stále zůstalo mnoho spamů a automatických emailů. (Kód)

Dobrým příkladem jsou města Poprad a Trenčín, která měla podezřele vysoké zastoupení v lokacích. Eshop ale v těchto místech nemá prodejnu ani výdejní místo. Ukázalo se, že kdykoliv email obsahuje zároveň slova Poprad i Trenčín, jedná se o nevyžádané reklamní sdělení nikoliv o text od zákazníka.

Vizualizace

V této chvíli jsme již byly připravené zpracovat data z textové analýzy v podobě vizualizací. Zajímalo nás, na co se zákazníci nejvíce ptají a jaká slova a fráze se vážou k tématu reklamace. K těmto vizualizacím byly využita tabulka ‘entities’ (obsahující naše custom entity z training file) a tabulka týkající se druhu zboží a reklamací. K dalším vizualizacím jsme využily tabulky ‘relations’, která obsahuje informace o jednotlivých podmětech, předmětech a přívlastcích, které se s nimi pojí. Blíž jsme se také podívaly na konkrétní typy zboží, které se v textové analýze vyskytovaly nejčastěji.

Kdy je na podpoře největší provoz?

Jednou z otázek, kterou jsme chtěly zodpovědět, byla, kdy je zákaznická podpora nejvytíženější.

Z dat vyplývá, že špička v příchozích emailech nastává v 10h dopoledne, v tuto hodinu zákazníci i nejčastěji volají.

Nejvíce emailů chodí na podporu v červnu, říjnu a květnu. Nejvyšší počet telefonátů pak nastává vždy v květnu, březnu a dubnu.

Dobrá zpráva pro eshop je, že největší vytížení nastává v rámci jeho pracovní doby (08:00–17:00). Měnit pracovní dobu podpory či přidávat večerní směnu by tedy bylo zbytečné.

Dashboard emaily:

Emails
Emails

Dashboard hovory:

U telefonních hovorů jsme musely vyřadit metadata z roku 2015, protože všechny hovory označené rokem 2015 byly nahrané do databáze eshopu souhrně za několik předchozích let dohromady a byly nahrány se stejným rokem, datem i hodinou a tudíž pro nás neměly výpovědní hodnotu a vizualizace by zkreslovaly.

Calls
Calls

K dispozici jsme také měli metadata o tom, jak dlouho trvaly jednotlivé hovory. V Tableau jsme si proto připravily histogram s intervalem 15 vteřin a ukázalo se, že většina hovorů se vejde do 1 minuty.

Prodejnost značek ve srovnání s výskytem značek v emailech

Chtěly jsme také zjistit, zda podpora v emailech zbytečně často neřeší značku, která ale nepřináší zisk. Eshop nám proto poskytnul seznam 10 nejprodávanějších značek za posledních pět let.

Top 10 nejprodávanějších značek a top 10 značek nejvíce zmiňovaných v příchozích emailech se až na jednu výjimku shodují.

Pokud se podíváme na značku, která byla výjimkou, zákazníci se na podporu nejčastěji obraceli ohledně velikosti a nejčastěji zmiňovaným typem zboží byly kozačky. Je tedy možné, že vylepšení popisu tohoto zboží na webových stránkách eshopu, by pomohlo snížit počet emailů.

Doporučení pro eshop

Lepší nastavení emailové schránky:

  • Více jak polovina příchozích emailů jsou automaticky generované zprávy. Podpora tedy věnuje čas emailům, které neposlal zákazník. Proto bychom doporučily nastavit filtraci příchozích emailů a jejich automatické zařazování do složek.
  • Pro lepší filtraci spamu můžeme eshopu poskytnout seznam klíčových slov a identifikátorů spamu.

Trénink podpory:

  • Témata, která podpora nejčastěji řeší v emailech od zákazníků, jsou vracení zboží a otázky zákazníků na zboží. Nejvíce dotazů se týká velikosti zboží, jeho dostupnosti a možnosti vyzkoušení. Těmto tématům by se tudíž měla dát priorita při zaučování nových zaměstnanců podpory.
  • Především dobrý servis ze strany podpory při výběru velikosti by pomohl redukovat případy výměny a vrácení zboží.

Kdy posílit lidské zdroje:

  • Květen vyhrává v počtu nepřijatých hovorů. Je to nejvytíženější měsíc v počtu příchozích telefonátů a zároveň i jeden z nejvytíženějších měsíců v příchozích mailech.
  • Nejvíce emailů i telefonátů přichází v pracovní době podpory, zde je tedy vše pořádku — měnit pracovní dobu či přidávat večerní směnu by bylo zbytečné.

Popisky zboží a FAQ:

  • Přestože jsou velikosti zboží na stránkách eshopu dobře popsané, nejvíce dotazů chodí právě na ně. Bylo by dobré podívat se na tuto problematiku více do detailu a rozšířit popisky zboží například o šířku stélky.
  • Zákazníky nejvíce zmiňovaný konkrétní typ zboží jsou kozačky a otázky na jejich velikost, především obvod lýtka. Na webu eshopu tato informace totiž často chybí. Vylepšením popisů zboží by tedy došlo ke snížení počtu emailů.
  • Zákazníci podporu často kontaktují, protože mají zájem zboží nejdříve vyzkoušet na prodejně. Je na zvážení eshopu, zda je pro ně žádoucí možnost této služby přidat a popsat do FAQ stránky.

Poděkování

Velký dík patří našim mentorům Markete Spinkove a Petru Hamernikovi z Geneea!

Zdroj ilustrací: LINK