【 矽谷大數據 01】資料科學家和產品經理的困境與解法

郭芳佐
twdsmeetup
Published in
18 min readSep 18, 2020

矽谷多年僅有 5% 台灣訪問團拜訪,但近 5 年與台灣交流頻繁,所以創立社群,希望分享台灣人在矽谷如何做資料科學及機器學習,提供做事方法及數據思維培養,期許解決台灣人才缺口及企業挑戰問題,過往與許多學校合作推廣資料科學的概念。

講者簡介

👨管其毅 Chi-Yi Kuan(之後👨代表其毅)到美國工作超過20年,擁有史丹佛統計學系、工程經濟系統與作業研究雙碩士,並為資料科學社群 Data Science Meetup 共同創辦人。曾擔任 LinkedIn 大數據分析與數據挖掘總監。工作經歷從顧問、DemandTec、eBay、LinkedIn 到 OYO,橫跨 B2B、B2C、SaaS 到 Marketplace model,Dimension 角度分類則市場、行銷、客服到風控為個人專業強項。👩矽谷阿雅 Anya(之後👩代表阿雅)
到美國工作約13年,擁有西北大學行銷碩士與芝加哥大學MBA的學經歷,早年在 Sears 擔任行銷分析師、大數據專案經理,之後經歷 Target 平板電商產品長、麥當勞全球數位資深總監、eBay 手機拍賣新興市場產品長及 Facebook 電商產品經理,針對產品經理、數據分析師的轉職、職涯規劃做分享。且是《追不到夢想就創一個》作者。

摘要

📍 Chi-Yi Kuan 跟 Anya 矽谷阿雅此次希望分享過往在矽谷工作的經歷,從如何找到數據相關工作、業務上的經歷分享讓大家知道資料科學家和產品經理到底有哪些職位、需要什麼技能,在現在 COVID-19 的疫情影響下,兩位還是透過自身經歷來鼓勵以及教導大家如何找工作。並且從自己過往與不同團隊以及人才合作的經驗,歸納出數據工作者以及產品經理需要具備的核心能力,當中也分享 Superpower 的概念,知道如何跟不同的角色合作,甚至是若要跨轉不同角色的話,面試應該怎麼應對,相信對於現在許多求職甚至希望精進自己的各位,是個非常棒的分享。

1. 如何從非相關領域跳轉到數據工作者

👩 在來美國之前是擔任記者,之後來到美國讀行銷,當時沒有硬技能可以當賣點,只好參加老師推薦的 Webinar,當場次講者很幸運的為雜誌社老闆,因此主動接觸老闆,因為跟自己背景有相關所以跟老闆聊完後覺得很適合自己,但因為金融風暴造成後續聯繫人資的時候,他已經被遣散。所以只好轉戰紐約、洛杉磯大城市找工作,透過約 100 次跟產業專家的面試以及聊天,整理了許多產業資訊,但都沒有新招聘人員,因此回到芝加哥並回到 Webinar 的雜誌社提案自己撰寫出來的策略計畫書,因為當時雜誌社要數位轉型,雜誌社營收來源就是告廣告主買版位,因此要跟廣告主談版位合作需要強調 Click Through Rate、 Email Open Rate 成效可以多好,就去 Sears 當買方看廣告成效、Return on Ad Spend,哪家公司的銷售是真的有效

✔️️不要忘記詢問教授,或許會是個好開頭 
✔️透過與產業工作者聊天撰寫成策略計畫書

👨個人經歷了兩次風暴,在美國經歷低谷之後的 Recovery 的反應是非常快,很多老闆或是企業就是希望知道你了解怎麼讓他們的公司做得更好,

有時候年輕人都會問怎麼找工作,我都會說如果你是招聘經理,你會選你為團隊的新成員嗎? 很多人都說不會!其實要自己去思考你能貢獻什麼、資料科學/數據分析要做什麼,所以美國找工作看的是 Combination Skill Sets,尤其近期 LinkedIn 在招募的時候,會強調不要太看重學位,不要在像傳統方式招募,這樣更能增加公司 Diversity。

要思考怎樣準備簡報告訴招募經理

「我可以為公司貢獻什麼」

2. 長年於數據領域工作的經驗分享

👨過往做過顧問以及深耕 SaaS area 領域,這段經驗非常重要,讓自己從傳統分析或 A/B testing 方法變成從 SaaS 的思維去看 Total Solution,當時負責產品研發部門專門做成自動化 (Production),原本是統計背景但必須得學習Java來寫軟體,之後不管是在 eBay 或是 LinkedIn 做 Data Scientist(DS) 都是用2000~2006年所建立的 SaaS 經驗來執行,透過自動化流程來協助產品定價策略。

例如,在 eBay 7年半之間負責 Global Marketplace 的風控管理,學習到最多的就是了解客戶,資料科學家很在意知道客戶痛點,痛點在哪裡,新的機會就在哪裡。處理事情都是用戶導向為主,透過這樣子的概念去做出電商平台上最好的成交方式、針對績效以及名聲制訂 Seller Standard/Tiers、Buyer Abusive Program,建立良好的 Eco-system,後來這套賣家/買家管理系統被阿里巴巴和Amazon 所採用。

而 LinkedIn 說的永遠 member first,是非常好的價值主張,這也是最有價值的地方,要去了解消費者對於產品 Engagement 的知識架構,並且不像一般 SaaS公司。LinkedIn 有良好的數據量以及環境可以做出很好的產品,像是 Feed、 Recommendation、Premium Subscription…,當時做過8~10種的 Tool,從中不斷的自我成長以及挑戰新領域,這也是矽谷很好的文化。之後就是轉變到 DS 領導人,到底怎麼從2人到80人成長並創造出世界級的 DS 團隊,之後也可以聊聊招募人的方式以及所需要基本具備的人才技能。

👩當時在 eBay Classifieds Group (類似台灣蝦皮 C2C 拍賣),那時候其實沒什麼數據,所以分析的工作也不是一定要有很多數據才能做。這階段公司所需要的人才技能也不太一樣,像是當時就要在數據量小的情況找到 insight,就要透過各地方數據,當時公司主要有線下交易資料,可能就再加入位置、質化調查、產業報告資料做結合,所以就像偵探一樣,不是現在 Google Analytics(GA) 上可以直接找到的數據跟洞察。又例如在 Facebook 的時候做過 Connectivity Team 要在全世界沒有網路的地方賣網路,當時就不會有數據,連上網連 Facebook 都沒辦法了,這樣子數據分析的要求就會不一樣。

3. 數據工作者角度看待目前職場動態

不同的產業或是公司經歷的階段不同,其實職能的分別也會不太一樣。必須了解就算是說做 Marketing Analyst 也會非常不同,因為包含了 Social media、Branding、 Targeting;說到業務是做 Product 則可能有以下面向,AARRR、Value Preposition 等等,可以知道業務內容都有極大的差別。

請探討你喜歡做什麼、你的熱情所在(前後端、marketing analytics)

Dimension 2 Domain know-how

可能包含產品、市場、行銷、風控、客服、Infrastructure 等。

Dimension 3 產業別

要考慮該公司的商業模式如何、數據規模大小、應用數據的方式,整個環境不一樣會影響到數據工作者的業務內容。

👉三個象限加起來才會找到適合的 Specific job

矽谷大數據分五場的意義

(第二場 Marketing Analytics Domain Knowledge 小編寫完紀錄就附上連結)

這就是為什麼要分五場,從 Marketing Analytics、Product Analytics、Data Engineering、Data Scientist for Modeling & Algorithm 都具備不同功能性可以深入探討。

👩大家都很想要近科技業,當時候零售業倒一堆,因此不會是就業的首選,但其實零售業的數據量非常的大,像是 Online/ Offline Data、 Mailing List、 Household Information,其實是一個非常好的 Training Ground,所以大家要思考一下你是真的喜歡這份工作嗎?還是只是追逐潮流投較夯的職位,清楚了解自己需要學習的是什麼技能,並且去找到什麼樣的產業、公司可以讓你最快學到。

👨對於零售業有切身之痛,因為2000~2006就是在做零售,那時候台灣很喜歡 POS 系統的數據,要為公司找到 software 的訂價。在零售業的最大挑戰就是 Margin 非常低,所以做分析的時候要有意識知道如何優化 Margin 提升1~2%是非常重要且非常有挑戰的,跟網路產業不同隨便就是30%~200% Margin 的提升,有這樣的 Mindset 才能進入這行業。

👩現在零售業因為疫情變成最夯的,那時候在做 Customer Data for Modeling、 Scoring 就是在希望每個人進去店裡可以再多買一樣商品,Sears廣告這麼多樣,要去想清楚哪一個用戶要推給他哪一樣商品,就要靠模型來做精準用戶的觸及,每個人都有不同商品偏好的分數。那時候想要用電視廣告觸及用戶,當時就跟電視台合作,透過第三方做資料的匹配和輪廓分析,我們就可以只針對曾經來過 Sears 購物過的用戶,這樣我們不僅可以減少很多支出,並且還能知道要推廣這一批用戶什麼類型的商品。

數據不大可以做數據分析嗎

👨其實很多人會問我數據不大可以做分析嗎?在 LinkedIn、Google 等很多大公司的數據其實都不是乾淨的,都要清理數據並建立整理好資料架構才可以使用,不會有 Free Lunch / Low Hanging Food 讓你應用,所以公司都要花時間沉澱數據。資料最大的效果是1+1>3,自己的資料是不夠的,要再加入外部數據,讓 data feature 更加豐富,若要知道 IP (避免 Black IP),其實Google、 Facebook 就會做資料的分享給 LinkedIn,就可以把一些 Black IP 給清理掉。

👩當時坐 eBay Classifieds,雖然數據少,但是懂得用關鍵搜尋、產業資料等各種外部資料做出推薦,要懂得收集外部資訊。

4. 數據工作者技能組合的分類

除了剛剛說到的3個 Dimension 做工作的類別分析,從技能面來談,以自己在 LinkedIn 面試觀察的經驗包含五個面向,五項技能偏向找尋合適的全能端 (Full stack) 的資料科學家,以 Google、Facebook 的資料科學家可能三個 Dimension 都要有9分。但還是要看你面試的公司,他所使用的軟體、分析工具等等,來判別你的技能要達到幾分。

數據處理能力

首先經過市場的淬鍊,目前好的公司都一定會累積數據,所以必須要有數據處理的能力,不管是用 Python、SOL、R、 Azure、AWS 都可以,最基本的就是從 SQL 出發,要有會撈取資料 (Query) 的能力。

數學統計能力

其次就是統計,分析的場景越來越多,統計的效用就變大,利用方法論來測試並找到洞察。

建模能力

包含統計模型,其實在一般的金融產業統計模型就夠用,但隨著資料量遽增、運算的需求變大,Data Mining、Machine Learning、AI 等進階方法變多,未來就要專注在解決問題如何應用不同的方法。大約只要有 2%的人才需要在建模專研得非常精深,一般來說面試都不會問。

Domain Knowledge

該產業的知識或是你的 idea 一定要在面試的過程展現出來,像是阿雅就有把他的點子提給面試官。

溝通能力

最後,很常被疏忽的就是溝通能力,尤其做 Data Scientist 中分析追蹤的人最主要就是看溝通能力好不好,再來才是 ML 的能力、演算法的技能。面試官如何評估溝通能力,看得就是你要怎麼很精簡明確的在短時間把你做的某一個案子完整表達,解決什麼問題、有什麼樣子的洞見,而且當被挑戰的時候你怎麼用數據去跟 user 辯論,還有要怎麼跟非數據工作者承諾自己可以帶來多少業績成長。

👩大家不要聽到會覺得灰心,其實自己當時在工作也是很多技能不懂,必須要跟 CMO 開會,去瞭解他們未來策略、品牌問題、痛點以及他們想要推廣的廣告,再帶回來分析部門,思考主要的計畫,挑選出如果只能做一件事情,當我們在看不同指標時候,一個 upward 一個 downward,到底哪個數據重要,最後把重要、要做的事情報告給主管,告知他我們要怎樣分析、要產出什麼結果。雖然自己是做 Marketing Analytics 的時候不做太多 coding 而是做溝通的角色。

資料科學家 DS 技能培養:
1st communication
2nd machine learning
3rd algorithm
大家一定要會很多工具,才能解決特定場景問題。

5. 避免 NG 面試回答

👩 Facebook 的 Data Scientist 其實等於 Product Analytics(PA) 或 Product Manager,如果你覺得你沒有這麼技術硬底子,你可以選擇 Decision Scientist 等於 Marketing Analytics,主要是協助 Marketing Manager,就比較不會這麼需要技術面的能力,而是有接觸 Consumer的經驗。

*可再參考 Decision Scientist → Support PM 但沒有那麼 technical

DS PM 面試常錯題目

表情符號上架是要用什麼 KPI 評估?

(❌) 多少人按讚?多少人轉分享?

(✔️) 解決什麼困境

表情符號對於1. 按讚的人來說,要多種情緒表達的按鈕;2. 收讚的人感受就會很好
- 收到表情符號的人貼文更多
- 按讚、按愛心…用戶會不會用更多其他功能
- 會不會原本打字哈哈,現在會用表情符號

產品分析其實要跟產品經理有一樣經營產品的能力

➡ 產品經理人什麼時候 say no

➡ own the problem!!!

要知道真正的問題點,看看有沒有評估到需要解決的問題。

6. 資料科學家轉產品經理、產品經理轉資料科學家怎麼轉

產品分析師的技能

  • 拆解題目,找到使用者想要解決的問題
  • 並且要 own the problem,進步的來源就是你會自己出題目給自己做
  • 從 Junior 跳到資深或是主管,其實就是你看事情的格局可不可以更全面,可以把自己站在 CEO 的角度看事情,賦予自己比職責更多的責任,會帶來更多正向的熱情,會很享受自己解決的問題,並開啟很多的其他職缺發展的可能性

PM 的技能

  • 通常 CEO 要看 A 指標的數據,99%不是因為要 A 指標,所要非常去瞭解詢問這個數據背後的目的性,所以要回問 CEO 要解決什麼問題

DS 轉職 PM

  • 瞭解要解決的問題,知道那些數據要求不是適合的
  • PM 要解決太多的商業問題不可能每件事情都透過數據支持得到答案,因此當 Data scientist 的,要知道對 PM 來說決定問題的時機點錯過了,數據就是無用的,好的 DS/PA 要會問什麼時候要這個分析,為什麼需要這個分析,什麼時候要做決定、有哪一些選項
  • 當產品上市表現不理想,好的 DS/PA 會做跟產品無關的分析幫你找到答案,不讓 PM 只是用瞎掰的方式來面對主管,DS/PA 就可能會找到某項指標的 drop rate 很快,可能是 UI 的問題,請 PM 去看看流程改善後狀況會不會更好
  • PM 的角色很多,最重要的就是瞭解用戶的痛點在哪裡,之後才可以決定解決問題的架構是什麼,之後可以做 Business Test、Funnel Analysis 或Prediction,後續還要設計怎麼樣的解法可以解決問題,這些解法是根據一些規則 (Criteria) 以及分數 (Score) 的排序,選擇出最適合的選項。中間也會跟 DS 合作做 Tracking、A/B Test、Post-Analysis、Optimization
  • 不過要記住有些問題不是數據可以解決的,像是臉書曾有個功能 The Day Before 1 Yrs Ago,若有人一年前有親戚過世,他會想要回憶起這天嗎?所以要做出排除掉這類型用戶會收到的功能嗎?以 Data-Driven 的角度是不需要的,因為只有 0.000000001% 的可能性會遇到這類用戶,對 OKR/KPI 沒幫助,回到 Human 用戶導向就是 PM 很重要的核心,有時候是會跟 Data 牴觸的,但這是很重要的心態

👨與 PM 合作的經驗,喜歡跟哪種 PM 合作

過往的公司是希望讓每個人 Own the data 的意念,不講最討厭的產品經理,說說自己期望的超強團隊,包含產品經理、資料科學家、設計師、工程師是四個團隊必備的核心成員,可以比擬為一支球隊, 「I want to be win」是大家應該有的共同目標,因此很喜歡跟有企圖心的產品經理合作,有 Customer-Centric、Member first,雖然這種產品經理會因為要求很多而一直被罵,但以結果導向來說,最嚴厲的產品經理帶給團隊的貢獻越多。

其實沒人喜歡產品經理的,但是如同Adam說的團隊中的每個角色都有自己的 Superpower,產品經理的 Superpower 是可以聚集大家來討論產品內容以及未來策略,設計師的 Superpower 是把大家想像的內容具體輸出,工程師的 Superpower 則是把大家想像中的想法真實建立出系統或是軟體,而身為資料科學家的我們 Superpower 是從資料裡面找到洞察、客戶喜歡的東西、影響每個人做產品策略。這些 Superpower 一定要合在一起才會發生影響力,所以要尊重每一個職位,而不是像一般矽谷很愛做的事情 — Role & Responsibility (R&R) 來分工合作。

Q. 請問PM和Data Scientist (Product Analyst)在產品決策上如果有衝突該如何溝通?

👨 跟每個人都有衝突,每個團隊都有自己的 Superpower,大家都想要讓產品更好,但目的性不同,或是急迫性不一樣,Respect Superpower,What are we suffering? What’s the root cause?
👩 現在最在意的是什麼? NPS、心佔率、margin、retention ….把自己的歧異忘記,先想想組織的目的是什麼,bottleneck 是什麼

Q.請問矽谷越來越多不同領域的人投入Data相關領域,未來是否會有供過於求的現象?

👨 競爭越來越激烈,過去三個月都在看 Data Scientist Program,全世界越來越考慮數據了,重點是你的 skill set 怎麼去符合市場需求。後疫情時代下,有很多產業需要數據解決問題,而且沒辦法走回頭路了。
👩 Analytics is the first priority to fill in all jobs,現在後疫情時代要重新做策略,因此會需要數據來輔佐。

Q. 有個說法是 Data Scientist 是公司的奢侈品,碰到疫情這種事件,公司較容易裁掉 DS 而非軟體工程師 SDE,想請問兩位的看法?

👨 看事情的高度,如果你是經營者,要把現金流保存極大化,但要經營還是要有基本,DS 是要讓公司 grow,那就可能被捨棄,但是 DE 不能拔掉,但如果 DS 是在風控就不會。

👩 就業report呈現的趨勢 Lee Hecht Harrison (LHH)
- Operation 成長(實體變線上)
- Research 公司做策略會需要
- Financial professional 要有錢做或是要賺錢
- 策略分析師管顧,做策略
- 法務/HR 砍人或是改變型態,新的產品新的人
- 物流、電商、科技、醫療還是有機會

Q.管理顧問,做數據分析的諮詢案件。常常遇到台灣上市櫃企業的客戶,在數據分析領域中,多數仍以 domain knowledge override 資料分析導向,分析結果往往只是管理階層想要看的 supporting information,而不是由分析結果去帶領決策。請問要怎麼幫助企業調整看待數據分析的心態?

👨 思考 data-driven 是每個東西都需要嗎?Slack、Airbnb 比較是 data-inform、designer-driven,就不太需要數據,更重要的是視覺化。

👩 Transformation,大家很喜歡你設計很小的 pilot 給個很酷的名字,不失去飯碗的 program 比較容易接受。

Q. 其毅離開 LinkedIn 去 OYO,而阿雅則在籌備自己的新創.為什麼二位最後都離開大公司而選擇新創?

👨 LinkedIn 統計一般會換7~9份的工作(3~5年換一次),矽谷Innovation/Startup 是在自己的人格裡面,突破自己人生的 Milestone,要透過不同角色以及企業的轉變
Goal: Head of data report to CEO
*美國沒有 Retire job,not secure

👩 對自己誠實,什麼地方自己不足但是別人不會發現,終究幾年後別人會發現你自己的缺點,那時就太晚了。因此很感謝大公司的培養,但有一件事情我會跟十年前的自己講,我很少跟自己講我想要什麼、我的 Passion 是什麼,以前很常想 How to prove myself,在大公司其實影響有限。現在籌備人工智慧的新創,對於社會是有意義的,就覺得影響力多很多,而且對矽谷來說,創業失敗反而還是金招牌,所以現在就算這波創業失敗還是可以回來矽谷找工作。

只看文章不過癮? 直播錄影,直接聽 ->
https://www.facebook.com/AnyaChengSanFrancisco/posts/1207883752889816

筆記:@funjoy2011
校稿:HungWei Lin
👉 歡迎加入台灣資料科學社群,有豐富的新知分享以及最新活動資訊喔!
https://www.facebook.com/groups/datasciencemeetup

--

--

郭芳佐
twdsmeetup

用一股傻勁面對挑戰・用一種熱情擁抱未知・用我的態度過生活・我是不斷用數據做改變的小小分析師