數據職位求職指南:用產品分析提升求職效率

lavinalu
twdsmeetup
Published in
31 min readJul 13, 2024

講者簡介

講者 Josh 畢業於中興大學電機系後到美國念 NYU 工業工程碩士,雖然在學校有修一些課,但因為講者的工作經驗不夠,所以一開始找工作時陷入滿大的困難。

於是講者先加入了一個 DS Bootcamp,很幸運地從 Intern 變成 Full-Time 工作,但這對講者來說不算是真正的產業工作經驗,比較像是在學術單位教學,在 Bootcamp 主要擔任 TA 、打雜的工作。

在 Bootcamp 裡待了兩年後,講者在 2019 年時進了 Samsung Ads,擔任 Data Analytics Engineer,工作內容偏向 Data Engineer,Samsung Ads 是 Samsung 收購的新創,所以跟 Samsung 本身的文化有點不同。

在 Samsung Ads 待了兩年之後,講者在 2021 年跳槽去 Meta,職稱是 Data Scientist,是偏向產品分析的 Data Scientist,主要是在 Facebook 的 Story 組下。

Photo by Szabo Viktor on Unsplash

接著在 2023 年講者去了 Pinterest,也是做 Data Scientist,Pinterest 裡的 Data Scientist 涵蓋範圍很廣,講者是待在產品組底下,做產品分析相關的 Data Scientist,目前是做 Merchant 跟一些 Monetization 領域相關的題目,共有五年以上的數據分析經驗。

今天分享的主題是:數據職位求職指南,內容來自於講者在美國求職的經驗&與其他求職者的交流,用產品分析的方式提升求職效率,包括找工作的策略,以 Case Study 的方式分享給大家,如何從中分析出自己的優勢與弱勢,接著採取行動,找到自己最想要的數據工作。

本次分享時間有限,講者會持續收集大家在求職路上的疑問,在 IG 上回答,歡迎大家追蹤以下 IG 帳號

版聚回顧及重點摘要

找到適合自己的數據職缺

Data 職位各式各樣,常見的有 Data Analyst, Data Scientist, Product Data Scientist, Analytics Engineer, Business Intelligence Engineer, Machine Learning Engineer, Software Engineer。

很多人會問或是很多 Youtube 影片常見的題目是:DA, BA, DS 的差異?講者認為很難單純看職稱就判斷差異,因為產業、公司大小、薪水急遽都會影響職稱,重點還是要回到 JD(Job Discription),即使職稱都是 DS(Data Scientist),但每間公司的定義也可能不同,這是一個永遠不會結束的討論

講者建議與其探討要找什麼職稱的工作,不如從培養什麼技能開始研究。

因此講者將 Data 領域分成三大類,分享個領域需要培養哪些技能:Data Engineer, Data Analytics & Inference, Development & Research。

[第一類:Data Engineer]

常見的 Programming Skill 是 SQL, Python, 還有 Data Warehouse, Data Lake 一些後端處理的技能,還有 Data Modeling, ETL 是比較常在 JD 裡看到的,另外還有 Big Data 處理需要用到的 Spark, Kafka,最後是 Data Pipeline 相關的 Airflow 很常見。

跟 Data Reporting 有關的就是 Dashboard 或是 Automation Report,這些技能常出現在職稱為 Data Engineer, Data Engineer Infra, Analytics Engineer, Data Analyst, Software Engineer。

講者常被問到的問題是:「Data Analyst」到底屬於哪個領域?講者自己的經驗與其他朋友的經驗,Data Analyst 有很大的比例是做 Reporting 或 Ad hoc request,需要的數據常常是其他人定義好的問題,DA 的工作就是拉出數據,假如需要被追蹤的指標會再變成 Dashboard,而這種 DA 更屬於Data Engineer 的領域,因為更多是 Build 數據產品或報表,比較少提出 Actionable Insight。

Photo by Luke Chesser on Unsplash

[第二類:Data Analytics & Inference]

此領域與講者自身工作相關,Programming Skill 方面 SQL 是基本,有時候會用到 Python,因為有些統計學的東西,SQL沒有辦法完成,需要用 Python 來做。

這個職位對實驗或是分析的要求是很高的,會更像是 Research Analysis,舉例:Experimentation, Causal inference, Metrics Design。

講者之前在 Meta 或是 Pinterest研究產品問題,會希望以「做研究」的方式進行,當然不會像 PHD 那麽嚴謹,會以大方向進行研究,不一定需要很 Fancy 的方法,但會從產品角度出發,提出「What’s the problem?」、列出假設、經研究後條列出 Actionable Insight。

分析師不只是拉數據算出數字,而是真的經由分析,提出讓其他人能做出行動的建議

Machine Learning 跟 Statistic 在這個職位中也是相對常見,Machine Learning 之所以重要,是因為跑實驗過程中,並不是所有情況都可以跑實驗,有時候會需要做一些 Machine Learning Method 來瞭解:「到底發生什麼事?」

所以 Propensity Score Matching, Difference and Difference 都是要用一些模型,而這個領域用到的 ML 跟 Development & Research 最大的差別,是這個職位的 ML 通常是在 Local 端執行,不會進到 Production,因此 Coding Quality 不會要求太高。

Photo by Mimi Thian on Unsplash

這職位另一個重要技能是:Data Communication,因為做完分析找到 Insight 後需要找到合作夥伴像是 PM, EM, Leadership 去採用結論、採取行動,所以需要搭配 Data Visualization 跟 Story Telling 能力去溝通、說服其他人。

這個領域中可以看到的職稱包含:Data Scientist, Product Data Scientist, Data Analyst,尤其是在產品組底下的 Data Analyst 通常都會被歸在這個領域中。

[第三類:Development & Research]

此領域較偏向工程跟研究,講者認為在這個領域的專家都是大神等級,有非常強的實作與研究能力。常見的 Programming Language 像是 Python, Java, C,只要能讓 Code 進到 Production 環境的程式語言都有機會碰到,就是看各個公司要求哪種。

Machine Learning Tech. 絕對很重要,因為要把 ML 變成一個產品,舉例:Facebook Feeds Ranking 就是一個 ML 產品,會需要寫production code的能力,這個就是 Development 的部分,軟體工程師也很常有做 ML的,講者之前在 Meta,Machine Engineer 在內部的職稱也是 Software Engineer(ML)。

Photo by Árpád Czapp on Unsplash

這個職位也要會寫一些 Production Code,更研究導向一點的職位像是 Applied Scientist, Research Scientist,會需要有 Research 能力,因為有些內部會要求發 Research Paper,所以研究能力也是滿重要的技能。

常見的職稱:Machine Learning Engineer, Software Engineer, Applied Scientist, Research Scientist, General Data Scientist, Data Scientist-Algorithm。

面試準備:技能需求清單

[Behavior Question]

講者統整美國市場的面試經驗後,認為「Behavior Question」這是面試時最重要的題型,比大家想像中的重要很多,不管是找 Entry-Level 職位或是 Mid-Level、Senior-Level,你的 Behavior 留給人印象、你講的故事、你對話的邏輯性,最終會影響你會不會錄取。

[SQL]

也是講者認為很基本的技能,對於分析師來說就是個跟喝水一樣的技能,真的就是每天都會寫,一些 Ad hoc 的問題或是要做分析,都是要用到 SQL。

面試最基本最要優先準備的就是 Behavior Question&SQL,而SQL 跟 Behavior Question 的差別在於, SQL 就是一個是否會被刷掉的門檻, Test Fail 就是 Fail,不會再細看分數高低即使表現特別好,也不會影響最高面試分數。

[Python]

在面試 Data 職位有時會考 Data Structure 或是 Pandas, Data Structure 會考你怎麼處理 List?怎麼處理 Dictionary?就是考你會不會處理不同的 Data Type。

這些比較基本的 Python 技能通常在面試 Data Engineer, Data Scientist 會有這類的考題,其他 Data Analyst, BI Analyst, Product Data Scientist 有時候也會考 Python。

[Statistics & Inference]

相關考題會出現於面試 Prodcut Data Scientis 職缺,而 Prodcut Data Scientis,這個職位比較常開在 B2C 且擁有一定用戶數量的軟體公司,才會有足夠客戶量可以跑實驗,因此這個職缺需求會落在某些特定公司,像是 Meta,職缺需求量並不高,但卻是蠻多人會想要進科技公司的一個管道,是滿有特色的職位。

Photo by Dave Adamson on Unsplash

[Product Sense]

比較常出現特別重視產品/Metric 的公司,會考產品相關的問題,像是怎麼去思考產品如何優化?如何跑實驗驗證?這些題目比較會出現在產品相關的 DS 職位。

[Data Modeling]

會考比較多 Schema, ETL 的東西,會考 Table 要怎麼設計?Pipeline 要怎麼跑?要怎麼樣增進 Table 效率? 用 Batch Processing 還是 Streaming Processing? 當中的 Trade-off 是什麼?

如何從資料量最大的 Events-Level Table 到下個階段 Aggregate by Daily, Dashboard Generation,每層的 Table 都會長不一樣,通常在面試 DE 或 BI 職位會要求這些職能。

[Algorithm]

就是 Leetcode 上的演算法題,像是 Binary Search 通常不會在 Analytics/Inference相關職位出現,因為他跟數據上是有點不相關的,更多的是探討 Code 的優化程度,基本上是 Code 要進 Production 的職缺才會考這類的問題。

所以像 Machine Learning Engineer, Applied Research Scientist, Software Engineer, 還有偏 Infra 的 Data Engineer 會考 ML Case, System Design 相關的演算法。

[Take Home Challenge]

這個講者認為是 Optional,因爲前幾年滿常見但近幾年有變少,連講者自己公司也比較少採用了,但某些小公司還是滿喜歡採用take home來篩選候選人。

這個方式其實是滿沒效率的面試方式,但對面試者來說,如果想拿到面試機會,一般人還是會花時間寫,其實就跟工作上寫一個分析很像,要如何短時間寫一個讓人容易閱讀、快速理解的大綱,這就是 Take Home Challenge 的用意。

Photo by National Cancer Institute on Unsplash

求職路線圖:設立並實現求職目標

講者認為求職跟做產品兩件事情滿相近,因此使用路線圖的方式來分享,同時讓大家也能了解 DS 在 Build 產品時,產品組 DS 扮演什麼樣的角色。

從求職跟 Build 產品來看,路線圖有五大領域:

  1. Opportunity Sizing: 了解要做的 Project 有多大的 Impact ,找工作的話,要先了解有多少職缺?機會有多大?
  2. Goal Setting:訂出一定時間區間內要達到什麼樣的目標?公司眾人才能往這個指標協力完成同一件事情。講者認為訂目標是件很重要的事情,而找工作過程中訂目標也很重要,像是幾個月內要完成什麼東西。
  3. Develop Product:工作上就是開始建立產品,找工作的話就是怎麼樣去打造你的 Resume,因為 Resume 就是要找工作的 Product,那要怎麼寫好 Resume 就是很重要的事情
  4. Performace Tracking:這部分是做產品時 DS 扮演很關鍵的角色,在做產品的時候會跑實驗、做追蹤指標,在找工作的時候,就是用過去求職數據、分析目前找工作的情況,找到最大的 Gap 去優化。
  5. Actionable Recommendation:對 DS 來說這是非常重要的能力,怎麼從前面的分析找到 Insight後、Action Recommendation 就是很重要的技能。找工作的時候,當分析完哪邊有 Gap,要怎麼樣採取行動去改善,是非常重要的。
Photo by Jason Goodman on Unsplash

Step1:Opportunity Sizing

講者直接示範:上週從 Linkedin 搜尋美國 DA+DS 相關職缺,總共有一萬五千個,總數應該少於一萬五千個,因為這兩個職位必定有 Ooverlap,但這邊先假設有一萬五千個職缺。

同時講者搜尋軟體工程師的職位作為 Benchmark,工程師大概有十三萬份職缺,就可以得知軟體工程師的職位是 DA+DS的八倍,但講者認為數字應該比這個比例更高,因為軟體工程師職位有時後一個職位要招的人不只一個,但 DS 職缺很大機會是一個蘿蔔一個坑。

從 Opportunity Sizing 的角度,DS 跟 DA 找工作的難度永遠大於軟體工程師,但這兩年應該有聽到很多軟體工程師找工作也遇到很大困難,跟 2021 下半年、2022 Q1 完全不一樣的情況,連軟體工程師都這麼難,可想而知 Data 相關職位會更難,這是個現實的情況,現在找工作真的不容易。

Step2:Goal Setting

目標設定的重點在於「怎麼在有限時間內量化你的目標? 」依照每個人畢業時間不同、財力不同,需要多快找到工作,每個人的狀況都不同,找工作的目標設定會不同。

Photo by Afif Ramdhasuma on Unsplash

講者以未來一年內畢業的情況舉例 3 個月內要拿到 20 個電話面試、6 個月內要拿到 5 個最終面試、6–12 個月內希望拿到一個 offer。

講者之所以設定一年,是因為目前美國找工作,找一年起跳是非常常見,事實上很多人確實都找超過一年或是超過一年都還沒有找到,因為現在市場上真的很競爭,並且對於沒有工作過的人不是非常友善。

但是從找工作的角度,一但訂出目標,就可以督促你往這個目標去發展,去優化整個求職流程,而 Goal Setting 也是平常在做產品時需要做的重要任務。

Step3:Develop Product

求職時你的產品就是你的履歷,如果履歷不好,是無法推進到下一個階段,最終取得 Offer。

Recruiter 基本上只會花 5–10 秒看你的 Resume,所以怎麼把排版排好,讓 Recruiter 可以一眼看出你的特殊之處,是很重要的事情

在準備 Resume 跟 Profile 時,將心比心去思考:「Recruiter 時間有限,如何讓 Recruiter 在一兩千的申請人中很快看到你」就是你能脫穎而出的重點。

Resume 要注意的幾個面向

  1. 排版:工作經驗 5–10 年內一頁就夠了,沒有必要 2–3 頁,要濃縮到一頁就是需要淺顯易懂的乾淨排版,把你的優勢重點標注出來。
  2. 強調工作經驗:Data 行業中工作經驗非常重要,比你學校所有的 Project 都還要重要很多,假如有實習經驗、工作經驗,是否能將這些經驗包裝進履歷中。講者過去幾個月跟滿多學生聊,發現學生們會花很多篇幅說明學校的 Project,但其實很多人有實習的經驗,所以把實習經驗包裝得更完整列更多重點,對於 Recruiter 來說,會讓你的 Profile 更有競爭力
  3. 量化影響力:講者協助看 Resume 的時候也發現,很多人喜歡強調自己用了什麼工具、技術、程式語言,但因為現在市場上太多 Data 的人,會使用這些工具的人也很多,所以用這樣的描述方式無法凸顯你個人。描寫你完成特定專案、量化自己的影響力、凸顯自己的 Achievement 才能在求職市場上脫穎而出
  4. 整理你的 Github如果你有放 Github,那有沒有整理乾淨?有沒有淺顯易懂?如果用人主管對你有興趣的話,基本上會點進去。如果你今天做了一個分析,這個分析是否有被清楚描寫分析Context、Insight、Recommendation?這個也很重要。
  5. 展現獨特個人項目:講者發現很多人會放一些經典的分析題目在 Resume 上,像是 Kaggle 上會看到的題目像是 House Pricing, Titanic 或是 Citi Bike。這些題目六七年前就有了,從主管角度,會覺得:「這些東西我看過了,你有沒沒有什麼跟別人不一樣?」。如果沒有跟別人不一樣,放這個 Project 到 Resume 上就是浪費一個版面,所以可以思考一下:「是否能做出一些獨特的項目,可以放在 Resume 上?」
Photo by Resume Genius on Unsplash

講者也分享幾個 Linkedin Profile 的小 Tips

  1. 完整你的個人頁面:將個人頁面填寫完整,讓 Recruiter 感覺你這個人是 Active 的。
  2. 增加 Connection:這點跟演算法有關,當你跟越多人有連結,越容易跟 Recruiter 或用人主管變成 Second-Connection,講者沒有實際數據去證實,但有個假設是:有更多 Connection 時,也更容易看到其他人的 Repost 或是 React 招聘人相關的貼文。
  3. 關鍵字優化:如何讓 Profile 裡的關鍵字被搜尋到,也是滿關鍵要加強的。

Step4:Performace Tracking

講者分享一個 Funnel Analysis 的框架,從投遞履歷到獲得 Offer 中間可粗略分成四個階段

  1. 拿到面試:方式有海投、系統內推、找獵頭或主管內推、獵頭直接接觸
  2. Phone Screen(電話面試):常見可能是技術面試 etc. Python 或 Case Study。另一種是主管面試,就會問 Behavior Question、Technical 問題,或是 Take Home Challenge。
  3. Onsite:跟 Phone Screen 的問題類似但問得更深入,而且會有更多輪,基本上 3–5 輪都有可能,且要跟很多對手競爭,是競爭激烈的階段。
  4. Take Offer:取得 Offer。

從分析 Funnel 角度出發,可以很容易看出不同階段的 Dropoff 比例,就可以知道自己目前 Gap 在哪裡?

假如拿不到面試,就可以思考第一階段有哪些需要優化,若是在技術面試 Dropoff 比較多,就可以去精進技術面試或是回答 Behavior/Case 的技巧,On-site 沒有過,去了解哪一部分的回答比較薄弱,需要加強。

Performance Tracking 可以協助整個找工作流程的優化,才能達成目標,就跟分析產品一樣。

找出哪裡有 Gap,提出弭平 Gap 的建議行動,嘗試建議行動、再驗證,一步步接近我們的目標,是相同的概念與邏輯。

Photo by Jake Hills on Unsplash

Step5:Actionable Recommendation

當分析完自己在哪些階段 Dropoff 比較多,就是可以優化的部分

[海投]

重點在於關鍵字、工作經驗、排版,海投很現實地受有無「工作經驗」影響,如何運用排版強調你的工作經驗,有沒有寫到關鍵字,讓你的履歷可以通過 AI 的 Screen。

另外一個小 Tips 是投遞的時間點,因為一個 Data 職缺被打開,會有 500–1000 人去投遞,從公司角度,面試一個 Candidate 的成本滿高,面試一個人要花 30–60 分鐘,結束後還要寫 Feedback,基本上要花 1.5–2 小時,面試官這些時間也可以拿去做工作上的事情,所以面試對公司的成本來說很高。

甚至開 Coding Tool 也是依照人頭計價,所以對公司來說面試人的成本很高,所以公司會評估若面試 20 個人會發出 2 個 Offert,當中會有 1 個人答應到職,那這個職缺開出來只要有 20 個人進面試流程了,就不會再接受新的人了(但可能職缺還是開著),因此投遞時間很關鍵。

講者分享從朋友那邊聽到的數據,在 2023 年裁員潮的時候,一個 DS 職缺開出來,一天多就收到 5000 份履歷,所以這個大概兩天就關掉這個職缺。

最後一個是講者自身經驗「地點」也很重要,因為疫情的關係,大家喜歡 Remote 的工作,而 Relocation 並不是每間公司都會提供。假如你在紐約投加州的工作,有一定機率會被 Recruiter 過濾掉,所以一個小 Tips 是:各地都準備一個地址,投遞履歷時先拿到面試再說,因為拿到面試是第一關,很多人是連面試都拿不到的。

Photo by Z on Unsplash

[內推]

有分成系統內推、獵頭、主管。通常一般公司會有規定,系統內推就是一定要進去看一下,但現在市場人太多了, 所以常常光系統內推人數就爆表了,講者滿懷疑系統內推跟海投的差別有多大,但可能對某些公司像是 Meta 或是傳統公司,系統內推還是有價值。

不過當你花時間找人內推時,職位可能因為太多人投遞而被關掉,這個就是要思考系統內推跟上述說的投遞時間點,兩者之間的平衡。

最好的情況是獵頭主管內推,至少履歷一定會被看到,如果對你有興趣,就一定會找你去面試,如果覺得適合,就會直接把你的履歷給用人主管,看要不要找你去面試,這個方法跟海投與系統內推差距最大的。

但這種方法比較不容易,因為你會需要跟他人有一定的 Connection,那就是平常需要多 Networking。

最後一個是獵頭接觸,跟海投會滿像的,「地點」很重要,因為獵頭找滿多 Contractor 職位,你在職位相同的地點會更容易被篩選出來,所以 Location 在 Linkedin 上也是滿關鍵的。

[Coding]

可以多去刷 Leetcode 或是 Mock Interview,講者以自身作為面試官的角度分享,在考 Coding 時會在意面試者有沒有跟面試官溝通,有沒有一起解決問題的感覺,比起面試者直接寫 Code,溝通與共同解決問題的特質,面試會更加分。

講者舉例:當拿到 SQL 問題,講者會先問這個 Table 長什麼樣子?有沒有數據重複?了解完後講者會分享自己的邏輯,然後確認面試官認為這個邏輯對不對?

Photo by Kaleidico on Unsplash

確定面試官知道且認可你的邏輯,才不會往錯的地方發展,溝通完以後,講者才會真的開始寫 Code,寫完以後講者會再跟面試官總結並說明 Code 的細節,確認有沒有一些小的問題可以直接修,這是一個比較好的技術面試作法。

在技術面試上,沒有跟面試官溝通,拿到就直接寫,面試官也不知道你的方向,如果往一個完全錯誤的方向發展,這個是最糟糕的。

[Case Study]

可以多看一些科技 Blog、Medium、Podcast、Mock Interview,這些內容對於準備 Case Study 或是有提問想了解 AB Testing,這些來源都有滿多有用的內容。

另外可以找人多練習溝通能力,拿到題目不要立刻講你的做法,而是先分享一下你要用的框架,需要什麼樣的資料,等一下預計講的段落,先從 A 開始到 B 然後接 C。

這個方式能使面試官更容易了解你分析的邏輯性,讓面試官能一步一步跟著你的分析框架,比較不容易跟丟,當面試官跟丟的時候,對你來說就是扣分。

Case Study 跟技術有關,但有架構的溝通能力在 Case Study 上絕對是很加分的。

[行為面試]

講者認為被低估,但實際上很重要的事情,行為面試的聖經可以去看 Amazon 的 16個原則,講者面試完 Amazon 之後就知道行為面試要怎麼講,大概準備 15–20 幾個故事,這些故事都可以套在未來行為面試的模板裡。

另外 ChatGPT 也是準備行為面試的好工具,可以利用 ChatGPT 去架構你的故事,檢視邏輯性、檢視是否 Easy to Understand,講者重複多次強調行為面試的重要性,是非常值得花時間去準備的項目。

最後是目前市場很常見的情況,就是從來沒拿到面試過,這種情況代表你的履歷在市場上競爭力不夠,這時候就需要從 Networking 方向著手

Photo by Beth Macdonald on Unsplash

這部分不限於真的 Professional Networking,像有時候去朋友家參加活動,講者的經驗是,當朋友聽到你在找工作,一般來說都滿願意內推的,所以一些簡單的 Social Events 上都有機會找到內推的協助。

另外因為全職不好找,從實習出發去 Linkedin Profile Page 上找一些 unpaid 的實習,然主動聯繫你對公司很有興趣,是否能到該公司做 unpaid實習,並詢問是否可以把這個經驗寫在 Resume 上,講者認為是有機會的。

像是有些新創,不是很熱門的公司,但主要你需要的是在一間公司下有工作經驗,比起你都是學校裡的專案經驗,是差很多的。

另外一個求職策略是:如果你自己的背景在 Data 領域裡不夠有競爭力,但你的背景,舉例是金融有關、醫療有關,那往那些產業找其他非 Data 常見的職位,可能成功機率比較高。因為現在不管哪個職位都需要有數據分析能力,把數據分析能力當作加分技能,而非目標職缺。

單純找 Data 職位很競爭,可以試著把背景同時加進去,往特定方向發展,會更容易一些

最後是給在美國的人,因為美國太競爭了,可能完全拿不到面試,講者會建議投遞其他國家的職位,至少可以有面試的機會。講者幾年前聽過有些人在泰國、新加坡,但目前不太確定,主要是要讓自己維持面試的手感,確定自己的問題在哪裡,持續優化,達到最終得到 Offer 的目標。

QA

Q1:工作基本上不會接觸到太多 Experiment Design, AB Testing,前陣子剛好有面試 DS Product Analyst 職位,請問因為沒有相關經驗,Case 很難給出 Constructive Suggestion,若未來想往 Product Analyst 方向走,可以提供建議?跟現階段一些相關的經驗?以及如何增加相關經驗?

A1:我自己覺得很多人會說在做 Product Analyst 就是在做 Experiment,我覺得Yes and No,它就是工作的一部分。

所以重點是你對產品要有敏銳度,很清楚知道要訂什麼指標來衡量產品成功於否

這個工作久了,或是在不同產品領域待久了,就會比較熟悉,舉例廣告領域待久了,你就會知道廣告相關的產品指標要怎麼訂,我在用戶端待久了,也會對用戶端比較熟,Domain Knowlege 培養滿重要的蠻重要的,但實驗或產品的題目對沒有相關背景的人來說確實滿 Tricky 的,因為沒有手動經驗的話確實比較難答出很細節的回答。

我自己的建議是看一些大公司分享他們怎麼跑實驗,像是 Airbnb, Lift, 或是我們公司(Pinterest)都有發一些 Tech Blog 可以參考,或是建議可以看 Youtube 上其他人分享 Mock Interview 要怎麼回答這種實驗設計的問題。

Photo by Brooke Cagle on Unsplash

最後假如真的拿到面試,我滿建議去找待過這種公司的人,比較可以給你直接的建議,因為我自己的經驗是,進 Meta 前後,我對實驗的理解是完全不一樣的,花時間去讀 Blog 會比較虛,即便你練習照一個模板做出一個實驗,但還是會有些真實情況沒有考慮到,會有些 Edge Cases 真的要工作過才比較容易遇到。

如果已經拿到面試,代表你的 Resume 是讓人覺得 OK 的,找目前已經在這些公司待過的人 Mock Interview 給你反饋,是滿有價值的。

Q2:目前工作跟 DS 重疊到的地方不太多,想要用做作品集的方式突出自己,想知道該如何做一個作品集?還有如何邏輯思考?

A2:我自己的想法是:工作上跟 Data 重疊不多,但是還會有「你想做某個決定,然後想參考數據」的情境,所以可以從既有工作經驗去包裝一下,會比單純自己工作之外做的專案更強一些,這是第一個建議強調的。

作品集部分會需要看你要找什麼樣的職位,我觀察下來大家作品集都喜歡做 ML 相關,舉例:做一個「Classification Model」,然後就把所有的分類模型都跑一遍,比較各模型表現,但這樣的專案沒有任何商業價值,因為工作上不可能跑四個模型,一定只會選擇跑一個最適合的,因為需要考量到上線部署成本…等,所以這種作品集比較像是學習。

我的建議是要做跟別人不一樣的東西,當我在發想一個分析專案時,會結合我個人的特色,像我個人很喜歡玩一個籃球遊戲,於是我就好奇:「傷兵是否可以作為選球員的一個決策因素?」

Photo by Daniel McCullough on Unsplash

以這個題目下去分析,如果你得出結論是傷兵完全無法被預測,因此在選球員時,完全可以排除傷兵的因素,那就是一個很強的分析,因為你可以依據這個結論去採取行動。

做任何專案都是要讓人可以採取行動,那才有價值

之前我曾經做過國家公園什麼時候最適合去露營,那就是去找參觀人數的資料、溫度、密集度…等,做出來的結果就可以讓人知道「什麼時間點可以採取什麼行動」,如果一個專案 Insight 無法讓人採取行動,那專案的價值就不高,這個可作為你在準備作品集時的思考邏輯。

Q3: Data 領域的管理職跟 DS 領域的管理職有什麼不同職級(Junior, Mid-level, Senior, Staff, Manager)嗎?每個職級的技能跟 Mindset 有什麼差別?可以分享你的經驗嗎?

A3:因為我也沒有很資深,我不覺得可以非常完美回答這個問題,但我自己的觀察 Analytics&Inference 相關職位來說,這個職位的技術要求是一定的,但是這個職位並不是完全往技術技能點,往技術技能點的是 Development 跟 Research。

Analytics & Inference 必較需要去強化 Business Sense, Ownership, Leadership 的技能,還有如何做 Stakeholder Management、預期設定,讓利害關係人對這個分析完成到什麼程度有所預期。

那 IC 部分就是你的分析是否有 Actionable Impacct,但這個有時候有很隨機,會依據你拿到的 Project 好不好會有關係。

不同職級的差別,通常越資深的人負責的 Scope 會越大,也會同時管理很多產品,所以管理能力是很強大的,然後也很會做 Sizing,知道哪些 Project 是最有影響力,該如何去排序工作,越資深的人越有這個能力。

Photo by Jo Szczepanska on Unsplash

資深的人的會有Ownership,很獨立,並不需要很多主管或是資深同事的幫助就可以獨立完成專案,這是Junior 跟 Senior 的差別。

我不是 Manager,所以這部分我就不探討太多。

Q4:近期 ML 跟 AI 的發展下,Data 領域的就業市場有什麼變化?在 ChatGpt 可以進行分析的情況下,是不是職位需求有減少?或者是工作內容都轉向 AI 產品發展,反而在部署產品的職缺需求是變高的,有這個現象嗎?

A4:應該說絕對有影響,但我覺得長期的影響較難預測

短期內可以看到最大的影響是 Junior 的職位少很多。

我自己在科技公司的經驗,通常1個產品組會有一個 PM、一個 DS、一個 Engineer Manager,然後 Designer, Researcher,DS 相較之下比較會開給 Mid-level 或是 Entry-level,因為 DS 的職位比較新。

但是目前觀察的趨勢是:DS 也漸漸以Senior-Level為主,還是會有一些 Mid-Level,但不多,很大的比例都只剩下 Senior。

因為這個職位已經有一陣子,跟 PM 職缺很像,就是會偏向招比較 Senior 的人進來, Entry level 確實有被擠壓到,跟前幾年比,我覺得並沒有這麼容易入這一行。

我自己覺得受影響的部分還有,工作上大家會更有效率,因為這些 Tool 可以移除一些 Daily Work 跟一些 Rutine 的工作項目。

Photo by Jonathan Kemper on Unsplash

分析的部分,如果要讓 ChatGpt 去分析,需要先提供很多 Background ,但目前多數公司的文件都寫的蠻不好的,很多東西並沒有被文件化,還是需要 DS 的各種 Domain Knowledge 才可以做一些更好的分析,假如在一個有完整文件化的環境下,那 ChatGpt 應該可以做出一個還不錯的分析。

Data Engineer 部分是否受到影響?要看是哪一種 Data Engineer,假如你是比較流程化,很 General 的 Reporting的話,那這方面的職位也確實比以前少很多,我目前看到的是 Contractor 比較多。

但如果你是 ML Pipleline 的 Data Engineer 或是 AI Tool 的 Engineer 這種需求應該還是有的,因為你要怎麼處理這些大型數據,然後讓ML/AI Model 可以跑出來,目前是需要的技能,但 Data Engineer 的 Entry-level,做純 Reporting 相關的也確實越來越被壓縮。

Q5:請問對於轉領域者在履歷上要如何凸顯自己技術方面的技能,除了多參加 Data 相關的比賽跟累積個人專案或是技術證照,多數職位希望看到跟職缺需求技能相關的工作經驗,但過往工作經驗無法改變,請問如何可以調整自己的 CV 並說服面試公司自己的適切度?

A5:這個問題相較 New Grad 找工作,我覺得會更容易一點,目前美國就業市場也很多從其他領域轉成 Data Analyst,可能是做過很多年 Consulting 的人選,或是做過銀行相關的職位的。

我自己覺得 Soft Skill 或在工作上累積的 Domain Knowledge 是不能被取代的,相較之下 Hard Skill 是更容易學的。

因為網路上有非常多的 Open- Source,所以這些技術技能養成速度是蠻快的,我會做一些 Side-Project,然後把 Github 都整理乾淨,讓人資或面試官知道你有一些真正的專案去證明你有能力去完成這些分析。

證照部分我自己的觀察是還好,影響沒那麼大,挑選一個真的有解決問題的專案,是更有價值的,無論是練習你的 Coding 能力或是證明你有 Hard Skill 去證明你有完成工作的能力,這是一個可以發展的方向。

Photo by Vitaly Gariev on Unsplash

歡迎大家追蹤講者 IG 帳號,講者會不定期分享求職相關 QA

筆記手:盧姵吟 Lavina Lu
校稿:Josh Lee、Ting Yu
👉 歡迎加入台灣資料科學社群,有豐富的新知分享以及最新活動資訊喔!
https://www.facebook.com/groups/datasciencemeetup

--

--

lavinalu
twdsmeetup

軟體 PM |商業智能分析 BA|增長專案 Growth Project|策展與媒體行銷 Curation Marketing|數位媒體編輯 ft. 瑜珈老師。email: dance3022@gmail.com