Shopee 蝦皮實習,扎實的數據分析與商業訓練

最近因為將要做學術研究的關係離開蝦皮。有鑒於剛好下一年度2020的暑期實習計畫開始,在這個時間點寫心得文應該可以幫助到更多人了解這家公司,所以決定記錄下自己這接近一年(2019.7~2020.4)充實的實習心得(Commercial + BI)。最後會寫上個人之前申請時準備履歷、面試的感受。

Shopee 是一家怎麼樣的公司?

SEA Group

母公司為SEA (NYSE SEA), 2009年在新加坡成立,旗下有三大事業體,包含Garena (台灣營運英雄聯盟、極速領域、傳說對決等遊戲…) 、AirPay (行動支付)、Shopee 蝦皮購物,Shopee於2015年首次在新加坡推出,目前已擴展到馬來西亞、泰國、印度尼西亞、越南、菲律賓和臺灣,以東南亞市場為主,為全世界華人地區用戶的線上購物和銷售商品提供服務。東南亞市場現在其實是網路業的兵家必爭之地,登陸台灣時,曾經因為免運的價格戰大力衝擊台灣電商市場。

先說結論

Growth your career

如標題所述,我覺得蝦皮實習這趟旅程下來:

  1. 提升自己的溝通能力
  2. 商業簡報製作技巧
  3. 大東南亞市場的商業思維
  4. 更懂得掌握數據分析
  5. 了解實務建模上的問題

如果對電商(特別是電商,蝦皮的實習訓練絕對會讓你對電子商務(甚至說互聯網)常看指標有非常深刻的認識)、互聯網產業有興趣,我非常推薦你/妳來這邊學習與工作,如果你還不確定想去什麼產業,蝦皮絕對也是一個很好的訓練場所,因為他是平台電商,上面有分成四大品類,品類下面又有許多子品類,換句話說,如果想要接觸到不同產業、消費品的資料分析,或者是學習一些domain,蝦皮絕對都有辦法滿足你,只是看你/妳願不願主動去學。

福利

蝦皮的實習福利也是一等一的,有咖啡機讓你提神,想喝飲料或者牛奶冰箱都有,每週固定水果日,下午餓了可以去零食區逛一圈回來,有時候冰箱還有奶酪等等的…. 還有按摩時段可以搶(填)!,工作疲乏了其實可以到沙發區去或者是多功能室(一大排座位,非用餐時間空空的)換個位置來思考,外面看出去就是松菸跟京華城、台北市的都會區,天氣好的時候他們都會發光(很刺眼XD)不過景色真的很好,有一種自由享受的感覺。

然後實習生也會配到一台筆電、有自己的公司信箱、雲端硬碟、很大的座位,上面有一個牌子寫自己的名字,那個位置就是你的!我就看到蠻多人(正職或者實習生都有)會精心佈置自己的座位,比如放一些小玩偶、盆栽、模型、角落生物之類的…還有看到一些奇奇怪怪的抱枕(比如ㄓㄌ抱枕)XDD 有時候也會看到蝦小編,辦公室整體就是橘色橘色配上許多個人化座位,蠻溫馨的。

工作氣氛

快樂型,也可能是我待過的兩個team都這樣,Commercial 稍微比較活潑一點,BI雖然比較沈穩不過還是很多超好笑的事情。5分鐘左右一次笑聲吧。然後同事不定時會餵食、Team building包括密室逃脫、城市尋寶、卡拉等等…或者跟主管一起跑去搶樓上樓下的水果就會覺得很好玩XD

然後平常跟同事的訊息互動到後面都是下面這種感覺,真人真事。

讚!

: Dennis ,我們有任務了!

:?

: 走啊拿水果!

????????????

好進入正題:

我在蝦皮有幸待過兩個很棒的部門,Business Intelligence(數據分析部門) 與 Commercial(商務營運部門) ,以下將分別就兩個團隊說明自己的感覺。

Commercial

主要負責整個產品的商業營運,依照品類來分

在Commercial 我是屬於HE team,比較偏向Data Analyst(Data Analyst 使用工具以Python , Excel 為主,搭配一些內部會使用的BI工具,我自己是有用Power BI來做DashBoard、Python寫模型,不過像我主管主要是使用R,看個人專精程度),主要收穫有三點:

  1. E-commerce Business 電子商務的知識
  2. Data Driven Campaign Analysis 數據驅動的分析
  3. Actionable and problem solving 解決問題的能力

E-commerce Business

截圖自蝦皮購物網站

在Commercial可以讓自己對電子商務有非常多的了解,也就是Data Sciecne 或者我們說Data Analysis中的domain know-how 有個認識,這也是我樂見的,畢竟如果連你分析的數據都不知道是什麼、有什麼含義,那很容易把數據變成數字或者編碼,沒有實質意義,也難以得到特別的insight。

Commercial 比較多的營運規劃是Campagin Analysis,包括說每一檔活動的成效、要操作什麼商品等等… 畢竟現在電商常常造節、規劃活動與促銷,不同Campaign其實都有不同的目的,而蝦皮使用不同Campaign的場景都不太一樣,會區分等級。在內部可以學到「不同目的」的行銷與操作商品的思考方法,因為蝦皮的商業模式簡單來說可以分成

  • B2C
  • B2B2C
  • C2C

我覺得最大的好處就是:你會考慮到很多不同的「Stakeholders」以及「Target Audience」,以前學財務管理的時候對stakeholders這個詞都沒什麼感覺(投資人、富爸爸),真的在Commercial就會理解到為什麼要做這麼多的規劃與盤算。除了Campaign,因為App有許多的資源可以使用,所以每一個渠道,包括說不同的推播方式都是你在規劃活動、分析數據時會考慮、並且作為一個操作工具的手段。舉個簡單的例子,如果我們今天發現信用卡的案型成效不錯,除了了解原因,以後在推行這個產品的時候其實就可以作為一個說服店家、合作廠商的案例。再比如關鍵字廣告的競價可以讓商品更往前、提升流量,通常是預算的主要支出…. 實在有太多domain know how可以學到,也讓我寫了一本Evernote的記事。

Data Driven Campaign Analysis

示意圖,非真實資料

回到我本身,我覺得在Commercial 很好玩一點是可以做許多嘗試,也就是「具行動力的假說思考」,比如你結合天氣資料發現下週的氣溫如何,那搞不好適合推毛衣、暖爐等等….又到分析議題上,同樣一批數據怎麼樣發生價值,好比你發現「鬼滅之刃」站內搜索關鍵詞突然竄高,就可以想有什麼負責的產品是可以聯合搭配、規劃的,疫情之下又反映了什麼產品的需求激增,這點可以從許多電商的站內數據旁敲側擊得到。

Actionable and problem solving

我的主管很樂於讓我嘗試想做的專案,這也是我覺得蝦皮實習一個很棒的點,不管在BI還是在Commercial ,主管都會在第一天跟你說「如果你有什麼想法,都歡迎說出來!」,不只第一天,這在之後每一次開會、每一次討論、每一次頭腦風暴主管們都會再說一次:「Dennis , 你對這件事情會怎麼想?」

比如我就根據資料發現有許多有趣的事情可以挖掘,包括Bundling (Basket Analysis) , Sales Forecasting (KPI) , CLV estimation(Beta-Gamma model) 、Customer Clustering 都是可以根據手邊的銷售資料就可以建立,那其實也不一定每一件事情都可以做,因為要考慮他是不是可以實際產生行動,比如發折價券就比較屬於我們可以控制的,那麼可行性比較高。Bundling 可以直接在活動案型上線時協助選品,這也可以做。

我覺得這其中也提供了很多流程優化的機會,比如寫程式可以自動化一些比較重複性的工作,那麼就可以幫團隊做出來。尤其蝦皮又很多資料相關的事務,有自動化整理資料的工具會方便很多。

同事也會教很多domain knowhow,舉個例子,有些店家會在商品標題打上入內議價,這是為了廠商之間控制價格的協定,這對資料分析來說是一個noise,但是你很難去改變,因為這是一個商業上的事情,要想改變不一定靠資料就可以,還需要跟其他人溝通、了解資料品質的狀況。

再比如說,會根據我們的商業情景產生不一樣的問題,好比NLP(自然語言處理 — 一種AI technuque)中我們說NER(命名實體識別) 可以做 Brand Detection,一種用模型辨識商品品牌的方法。

但是實務上我在做Brand detection時,資料的名稱常常混了很多型號(通常都是數字與英文字母編碼),比如手機、筆電會有不同型號,更遑論有些商品的名稱並不會寫上Brand name(因為賣家的命名標準不同),你要先想辦法區分出他們,這就是一個蠻實務上的問題,在學校是不會碰到的、在B2C電商也不太會遇到,但是到了C2C場景就會遇到,而這就是考驗一個資料分析師解決問題能力的地方,要根據商業場景去識別問題,並且考慮有哪些解決方法/演算法,然後執行與實作。

Business Intelligence

其中在BI 的時候是Data Science team,BI還有其他team,分別會處理不同的數據問題,而Data Science 工作比較偏建模(modeling),使用Machine Learning , Deep Learning的相關技術。主要使用語言為Python,資料量一大會是SQL。

我覺得在BI ,尤其是Data Science 主要收穫有三點:

  1. Consulting 內部諮詢、數據解決方案提供
  2. Data Quality 資料品質
  3. Modeling 模型可解釋性

Consulting

BI 就我的認知比較像是輔助性後台,協助整個business run得更順利,而這個問題除了我們會主動開發、了解,其他部門比如Marketing , HR 等等也可能會提出,並且共同商討一個數據驅動的解決方案。

這裡的解決方案並不一定是很fancy的模型,它有可能是一個產品,比如儀表板,也有可能是一個data request ,需要什麼樣的外部資料、內部資料來協助決策、業務推動,都會由BI 這邊去提供,所以我記得才剛到BI,我就有跟不同team,可能是BD 、可能是CM開會、發想或者確定執行一個解決方案。這點也很有趣,因為即使作為實習生,你可以了解到跨部門的合作方式、學習換位思考,怎麼可以幫助這家公司往前? 比如我寫過爬蟲、做過簡報、寫過模型、資料清洗的腳本等等…. 這些都是某種解決方案。

重點不在「寫了一個多準確的模型」,而是「你怎麼樣解決這個問題」。

Data Quality

包括資料清洗與分析,這邊的資料清洗其實不單純指缺失填補、資料型態規整等等…

更多我覺得是「對領域知識的掌握程度」

好比雙11 , 雙12的資料不太可能「直接」拿去做銷售預測,或者你在EDA時發現 00:00 下的單特別多,原因是App上有一些小遊戲可以玩、或者辦了什麼活動,這些都是noise,因為小活動可能才花你1元、9元,並不是你平常的消費行為或者習慣,但是作為資料就會被算作「你消費過一次」,在CLV estimation , churn prediction 的model上都會影響到模型,就要設計一些機制來讓資料乾淨一些。

學思想,而不是單純的方法

而這些機制設計可能又跟計量經濟的「方法本質」有關,比如你要找一個變數去衡量移除掉會怎麼樣、能不能保留資料完整性的同時又移除noise的影響? 這也是我覺得學這種我們說「hard technique」的知識時,最重要一點是「怎麼用」,我在修習Wharton 商學院的分析課程時,教授第一句話就是:

「這個時代無關乎你擁有多少知識,而在於你該怎麼使用它。」

這句話絕對是學習技術非常重要的一句話,尤其是商管應用上。

如果只把計量經濟、數量方法當作一種習題,那麼它就走不出教室,但是真實世界上,解到資料科學的問題時經常需要使用對資料結構拆解的技術,除了工具要夠熟練(比如我寫Python就覺得很多資料操作起來蠻容易的)、還要懂得使用、挑選方法。

Modeling 模型可解釋性

示意圖,非真實資料

這個就跟建模的準確度有關,這邊我就先general 一點以免太複雜,有興趣可以之後聊聊。簡單來說這個變數重要嗎,如果重要「然後呢?」。

比如你發現「是否雙11消費是今年首次消費」這個變數對預測消費能力的重要性很高,那你要「讓大家雙11前至少買一次」嗎? 「讓大家不要都等到雙11嗎?」該怎麼做? 這個就蠻模糊的,如果追求預測性,那麼解釋性可能就是一個tradeoff沒錯。再舉個例子,PCA是一個很常用的降維技巧,但是會取代掉原本的變數意涵,這時候就要靠domain know how標註這個因子是什麼意涵,這其實也不容易做,特別是資料量很大的時候。

跨國視野與合作

跨國合作時,除了模型變數意涵,資料隱私與傳輸也是一個課題,比如說新加坡總部那邊可能會有一個很大的模型,到臺灣辦公室這邊,BI要去整合,就需要先整理哪些變數可以用(某些新加坡有的資料在臺灣不一定有,相對地,臺灣也可以透過自己的資料去fine tune model,各國辦公室目前都有相對「接地氣」的營運策略),或者印尼蝦皮那邊有一個best practice我們可以嘗試,也不會直接拿來用 ,不同國家間對資料隱私權的規範、敏感度都不相同,比如印尼人可能就很討厭tracking,在台灣上網可能只是會被retargeting,他們是真的線上線下的「資訊轟炸」,你滑一滑腳踏車,走一走會來一通電話問你要不要買腳踏車,這也是在跨國合作的時候需要考慮、分析的。我的公司信箱也會每幾天就有不同國家的市場新聞、動態進來,像是越南的市場動態就會常常看到Lazada(越南的電商巨頭)、台灣可能就是PChome之類的… 每週我都會自己針對這一週的市場資料做消化、整理,蝦皮同樣提供實習生這種跨國視野。

履歷、面試

從蝦皮多功能室看出去的景色(部分)

我不是專業的人資,以下說得都是我的理解與參考,也不代表照著做就可以「offer get」,不過希望能對今年的申請者有所幫助,可以參考:

蝦皮辦公室外面就是大大的標語「順勢應變、分秒必爭」,我覺得雖然不同部門側重的點不同,但這句話絕對是工作起來可以感受到的,一個專案的問題發現、分析、解決、執行通常很快,我們做了很多盤算,真的到了上線時也會不停優化。尤其是雙11的時候,看著儀表板會很刺激XD 在蝦皮的時間,我剛好參與到了下半年的所有大促(從D9到D12),蝦皮真的是一個移動速度非常快的電商,也因為這樣,你必須要很快反應、很快給出你的「假說」,根據那個假說去找答案。

我想說的是:

通常如果一個職缺名額不太多、又是熱門的職位、公司,那麼更應該挖掘自己的「特質」你/妳有沒有跟別人不一樣的地方? 比如我在政大實習版幫團隊貼出徵才文章,1個名額,收到了50封左右的履歷,全部台政清交(Data Analyst Intern position),背景也都是很優秀的人,要怎麼取1對企業來說就很困難,求職者必須想辦法「打造自己的個人品牌」自己的市場定位,我覺得這個蠻重要是必須體認到:在學校我們修同樣的科目,學測指考都考一樣的東西,但是現在不一樣,沒必要去跟一群人「站在同一個地方競爭」,「程式」寫不過別人,但是很懂「電商」,那可能就會成為主管錄取你/妳的理由,學歷也是,沒有規定只有哪些學校可以投遞,學歷只是「在學科測驗那個標準之下」測出來的很參考的評量,如果你/妳覺得你有可以貢獻、幫助團隊的能力,招募團隊會看到的。側重點不同,很難給出一個通用方案,不過我覺得準備重點其實就是以下三點:

找到自己的「專長」,而且身旁的人、甚至全世界都知道那方面你是「專家」

溝通能力,有辦法讓「專長」被面試官「看到」

相信自己,有「自信」

大概就是這樣,可以去思考「我的」什麼「專長」可以很符合「順勢應變、分秒必爭」的特質,再來可以參考蝦皮MA的三大特質:

  • Critical thinking
  • Leadership
  • Ownership

然後去思考「什麼背景可以佐證我這一點?」

自信的關鍵其實就在於知道自己很符合這家公司,得失心也不用太重,蝦皮不過是某家公司,今天它選擇你/妳,你/妳同時也在選擇它,在準備過程理解公司,並且確認你們彼此都接受,準備過程就能收穫許多。

最後,我當初蝦皮面試體驗是非常好的那種,前面有問題時人資都會很快回覆、面試時主管也像是在跟你討論蝦皮、資料(看你面什麼職位)、你本身,出去的時候Eric(面試官)還送我到電梯門口才回辦公室(這點讓我受寵若驚),非常尊重面試者,其實不必太緊張,把面試當作跟以後的同事先聊天就好,當然也不要太Chill ,除非Marketing (歐

經驗、感受、我

蝦~

我想這些經驗跟我個人挑選工作有關,我是一個很在意「感受」的人,比如說工作的人、工作的內容、工作的氣氛,而會這麼喜歡這份實習經驗,除了三者都在蝦皮獲得良好的回饋之外,更重要的是它有讓我「更接近目標」的感覺:

每份工作其實都在接近那個最想要成為的自己。

可以非常老實說,進了Commercial讓我對商業思維、國際市場更感興趣,並且是「數據驅動的商業分析」,而進了Business Intelligence讓我更明確要走Customer 、Quantitative Marketing 相關的modeling,好比說估計客戶生命價值、流失模型、決策問題等等「商業問題」,而不是現在Data Science領域很夯的CV 、Bot之類的…內部的訓練紮實,蝦皮很多高層都是麥肯錫出身的,內部培訓用的簡報、文件撰寫等教學以我在政大管顧社(也是請Mastercard、BCG等顧問來上課)來說能感受得到這些都是「管理顧問式」的教學,也讓我對故事線簡報邏輯等掌握得更加清楚。

SEA & Shopee

全部打完,看到這邊還是覺得很感謝蝦皮的人、事、物。工作內容因為許多蠻私密的所以無法分享,但都是解決既有成就感又有趣的商業問題,想到自己做的東西會影響到台灣的Shopee App、Web 這麼多使用者,依然覺得這種感覺真的很特別。回首這份實習,它讓我在學習、強化資料科學這段路上得到非常多實務經驗,對商業的理解也是。學無止盡,這份實習的成長曲線是非常高的,希望大家也能有一個很棒的實習經驗。

感謝區

最後謝謝蝦皮的大家,Sandy,Aaron兩位大主管給予我的機會。

謝謝Joanne學姊讓我有機會嘗試不同的領域、PoloBao 教我各種暗黑(?爬蟲技巧、Py2SQL XXD

米雪總是在我開會時的100個「為什麼」跟「這什麼」詳細解答(剛進蝦皮時開會真的一堆專有名詞跟縮寫聽到霧煞煞)、Jia 教的分析方式、Jimmy 的C2C 、Tiffany的Campaign Analysis、Chris的Vlook up 、Scarlett的比價、Yuni的特徵工程、另外一個Jimmy的DataBase、查理的後端、Sonny的網頁知識,凱迪、安迪等各個intern… 都讓我獲益良多。

最後是Eric , 謝謝你教了我上面那些(我記得太多了,應該上面的都有包含到XD)跟讓我做許多想做的專案、想寫的東西,能遇到這麼棒的主管真的非常開心!

— — — — — — — — — — — — — — — — — — — — — — — — — — — —

敬請期待下一篇!或是您也可以逛逛我的其他資料科學文章:人工智慧商務系列:

Python資料科學系列:

看我用金融的概念解釋AI:

如果想跟著我實作資料科學,開始寫程式必知必會基礎系列:

--

--

戴士翔 | Dennis Dai
Finformation當資料科學遇上財務金融

外商分析顧問,Ex- Apple Data Scientist,曾在FMCG巨頭/日商管顧/MBB管顧/高成長電商從事商業分析與數位轉型,專注分享管顧、商業、數據分析的思考。分析/演講/合作歡迎來信:dennis.dai.1011@gmail.com