您的外送已抵達!專訪foodpanda 資料分析師 Tina Hsieh

Yu-Ping Tseng
Taiwanese in Data Science
9 min readMay 24, 2024

曾經有過這樣的體驗嗎?在一個寒冷的天氣裡,當你不想外出時,只需輕輕一點手指,暖心的 foodpanda 外送熱奶茶就會在眼前出現。外送服務已成為現代生活中不可或缺的一部分,為了確保美食能夠準時送達顧客手中,背後需要依賴龐大的歷史數據和精密的資料分析。那麼,究竟是怎樣的資料科學技術讓這項艱鉅任務變得如此順暢呢?

這次,我們有幸邀請到目前在 foodpanda Data Team 擔任資料分析師的 Tina Hsieh 來分享她的工作專案與職涯經驗。

Tina 已在 foodpanda 工作近兩年時間,工作範圍涵蓋了模型建立、商業分析、資料庫管理等多個領域。接下來,就讓我們用以下兩個專案來一窺Tina工作上的主要挑戰。

foodpanda

專案一:穩定訂單量與外送工時的供需平衡

foodpanda,作為一個領先的美食外送服務平台,不僅扮演著媒合餓肚子的顧客、外送夥伴及店家的角色,更需同時考慮三方的供需平衡,以確保營運的穩定與流暢。

首先,Tina先帶我們聚焦於三大關鍵利益相關者 (stakeholders) 及其業務指標:
1. 商家 (Vender):製作食物是否準時完成、訂單量、顧客評分
2. 顧客 (Customer):回購率、滿意度、淨推薦值 (NPS)
3. 外送夥伴 (Rider):完成訂單數、運送時間、平均工時(AWR)

在這個專案中,供需平衡的關鍵在於理解顧客訂單量與外送夥伴工作時數之間的關係。foodpanda 使用了 UTR(訂單量除以平均工時,即每小時可以送達多少訂單)作為核心指標,當 UTR 偏高或偏低時,即代表供需失衡,foodpanda 必須及時採取措施來解決問題,例如在訂單量過高時提供獎金加碼以鼓勵外送夥伴協助外送。

為了協助營運團隊即早掌握營運狀況與風險,Tina 使用兩個預測模型,一是預測訂單量,二是預測外送夥伴工作時數,透過時間序列模型與 tree-based 模型預測,計算出 UTR。

至於用於訓練模型的主要特徵是什麼呢?
Tina以幽默的口吻說道,foodpanda 這個外送產業是「看天吃飯」,天氣是模型中最重要的特徵之一,直接影響顧客的訂單量和外送夥伴的出勤意願。在下雨天,顧客不太願意外出,而外送夥伴也不願意承接訂單,尤其是梅雨季時整個團隊上下會進入全力備戰的狀態。

另一個重要的特徵為歷史數據,透過過去一周或四周的平均工作時數,模型就能準確預測未來工作時數。

此外,模型也考慮了外送夥伴過往的出勤行為。例如,有些外送夥伴習慣在途中休息或在下雨天請假,這些行為模式也會影響模型的預測結果。

在選擇模型的過程中,主要依賴領域知識以及與 stakeholders 進行的討論和反饋。例如,如果 stakeholders 對某些變量感到擔憂,就可以將其納入模型中。

Powered by DALL.E 3

專案二:減少延遲訂單數

接下來,Tina 進一步深入分享了另一關鍵議題:減少延遲訂單數。延遲訂單的主要原因之一是外送夥伴轉單,這在 foodpanda 中也是一個極為重要的挑戰。外送夥伴可能因各種原因而放棄訂單,導致訂單無人處理,例如,外送夥伴可能接到一個必須扛著大桶飲用水上五樓的訂單,或是沒有加購袋子的麥當勞訂單,這些情況可能導致訂單延遲,有時甚至延遲數小時之久。

說到這裡,Tina 也不忘提醒大家,在下雨天訂餐的時候,遇到像麥當勞這種使用紙袋的店家,請一定要記得加購袋子,尤其如果又是一次團購麥當勞二十杯飲料的時候!

如何處理轉單情況,成為了 Data Team 的重要工作之一。他們通過模型來預測不同階段的送達時間,進而比較實際值和預測值,評估延遲的嚴重程度。

為了更清晰地了解延遲情況,團隊主要通過兩個指標來評估:延遲超過 10 分鐘的比例以及延遲的實際時間。這兩個指標使得團隊能夠對不同階段的延遲情況進行更精確的評估。

根據延遲情況,團隊制定了相應的應對方案。這可能涉及到系統預測是否準確,或者外送夥伴是否疊單 (即先送附近的訂單再來送你的訂單)。Tina會再與團隊深入分析這些情況,並與海外團隊共同討論可能的解決方案,以確保訂單能夠準時送達。

Powered by DALL.E 3

跨國團隊合作

foodpanda 在德國總部有專門的資料團隊,負責不同的模型和專案,總部主要負責訂單時間預測與最佳配送組合等重要模型,而在臺灣團隊則負責根據當地的需求進一步優化模型或提出改善建議。

在臺灣團隊目前團隊人數大約 10 人,主要與亞太區的新加坡同事合作。有時團隊可能會根據當地需要,如優先處理新客戶訂單等,提出調整模型參數的需求,需進行 A/B 測試,在這樣情況下就會視專案範圍而決定由總部進行或是臺灣團隊進行。

多元組成背景

在臺灣的團隊中,除了 Tina 本身是資管系畢業以外,大部份的同事本來都不是資料領域出身,比如有本來做 PM、人資的同事、也有進入團隊才學會 SQL 與 Python 的。

Tina 表示,在團隊剛成立時,確實會有包容度,讓團隊成員有這種在公司學習的機會,這種時機點是大家可以把握的。

獨特的專案管理模式

Tina還向我們介紹了 foodpanda Data Team 獨特的專案管理模式。內部專案通常由一個人負責,並由一名主管擔任 PO。當專案完成到某一階段時,資料分析師會與主管討論是否達到了預期目標,如果 stakeholders 對目前的成果滿意,該專案將轉交給其他團隊成員進行後續的優化或應用工作。

舉例來說,預測訂單量和外送夥伴工時的模型曾有三、四位資料分析師參與過,每個人負責不同的範疇,有些同事負責平日的預測,而 Tina 則負責假日的預測。

這種模式能夠讓每位資料分析師參與各種不同類型的專案,避免他們長期被束縛在同一個專案上。同時,這也確保了專案在轉交時,能由新的團隊成員順利接手後續工作。

Photo by Mimi Thian on Unsplash

踏上資料分析師之路

接下來,讓我們來一探 Tina 的職涯背景,為什麼一開始會選擇 Data Analyst 作為職涯出發點?

Tina 為資管背景,就學期間正值大數據熱潮席捲之際,學校從國外聘了一些老師來講授大數據課程,她因此機緣成為助教,並逐漸對寫程式產生了興趣。這段經歷也讓她開始思考未來的職業方向,是否朝向與資料相關的工作或銀行業的 MA 儲備幹部。

畢業後,她曾任職於 91APP (電商) 與鈦坦科技 (遊戲產業),隨後轉至目前的 foodpanda,剛進入 foodpanda 時,正逢 Data Team 剛成立之際,這讓她得以接觸到更廣泛的工作內容。她鼓勵大家,即使臺灣的資料產業還不夠成熟,但這樣的環境能提供一個成長的絕佳機會

Tina 不斷跳脫舒適圈,通過轉換行業或加入不同的數據團隊來擴大視野,並在這過程中回頭檢視當初有什麼盲點,Tina 綜合了她過往的職涯經驗,與我們分享以下幾點:

1. 執行專案參考指標
在決定優先執行哪個方案時,Tina 通常會參考兩個指標:方案的影響力以及難易度。這兩個指標幫助她將方案分成四個象限,在討論方案時,Tina 會考慮到自身部門、stakeholders 與其他部門可能需要協調的人力資源,去梳理各個行動的難易度與影響力,若行動方案可輕易由內部團隊自行完成,且具有高度影響力,那便會被排在較高的優先順序。

2. Hypothesis Thinking
在進行資料分析之前,制定假設至關重要。Tina 分享了她在使用模型預測時的經驗,她會先思考可能的假設,然後再進行驗證。舉例來說,在做模型預測時,要不要加入天氣這個屬性?Tina 會先做出假設,天氣不好時,人們不太願意出門購物,而會更傾向於外送,所以訂單量上升。因此,再將天氣這個因素納入模型中,以驗證這個假設。這種做法有助於使分析更具解釋性。

3. 提出有效問題
在面對問題時,不僅要提出問題,還要提供解決方案的選項。比如說看到訂單正在下降,不能直接把問題丟給老闆,要做的事情應該是帶着 A, B, C 三個方案,去跟老闆說明訂單在下降,然後自己先分析可能這三個方案各自可以怎麼做?它們的好處與壞處是什麼?Tina 認為,先講出自己的理解然後請對方來糾正是最有效的溝通方式,可以最快找到自己的盲點,因為假如直接由對方解答,當下可能覺得自己懂了,事後卻有可能發現腦中卡關的那個點,對方還是沒有回答到。

Photo by Louise Viallesoubranne on Unsplash

資料分析師的面試準備

最後,Tina 提供了一些建議,以幫助準備資料分析師的面試。

在準備資料分析師的面試時,Tina 提供了一些重要建議。她強調,掌握 SQL 是非常重要的,隨後的技能可能包括 Python 或 Excel。然而,如何確定自己的 SQL 技能已經達到足夠的水準呢?她建議通過 Leetcode 刷題,直到能夠解決 medium 或更難的問題,因為這些問題往往會對應到實際工作中的挑戰。

另外,培養商業思維也是至關重要的。在面試中,可能會被問及過去的專案,或需要完成一個回家作業並在限定時間內提交簡報。Tina 建議可以通過案例研究的方式來鍛煉這方面的能力。在這方面,foodpanda 團隊時常舉辦內部活動,利用 BCG 或 McKinsey 的方法來分析問題,從原因分析到解決方案,再到風險評估和下一步行動,最終得出結論。

此外,是否需要進行 side projects 呢?Tina 認為建立作品集是必要的,但不一定要限於 side projects。透過參與線上課程如 Coursera、edX 和 DataCamp,除了獲得證書外,還可以獲取一些公開資料。Tina 建議可利用這些數據來進行完整的分析,從數據清理到發現洞察,打造一個完整的作品集。

在 Tina 的精彩分享中,我們得以窺探資料分析師的世界,以及面對挑戰時的應對之道。從 SQL 的掌握到商業思維的培養,再到建立作品集的重要性,做足這些準備不僅僅是為了在面試中脫穎而出,更能提升自身的專業能力。讓我們一起跟隨 Tina 的足跡,勇敢探索資料分析領域的無限可能吧!

Host: 峻廷

Writer: Yu-Ping Tseng

--

--

Yu-Ping Tseng
Taiwanese in Data Science

工學背景出身、不小心一腳跨入統計所,目前在銀行業擔任資料科學家。