Mlops

2.6K

Stories

1.5K

Writers

創建一個好的機器學習回饋與再訓練的服務架構

當資料科學家花費力氣將機器學習模型創建出來後,接下來會希望能夠部署機器學習模型服務,但大部分在部署模型服務完成後,即算完成專案並結案,導致不少公司會出現許多的「一次性模型」,但模型在上線服務一段時間後,可能會有預測越來越不準的狀況,因此在模型的維運上就顯得更為重要,這篇文章會試著介紹更多模型上線後的下一步應該要如何進行,來幫助公司可以持續的延續專案。 下方的架構圖是我針對上線後的模型服務要進行回饋與再訓練的循環所規劃出來的架構: 其中,我們需要注意以下幾件事情: 使用者回饋機制建立:當模型部署和應用服務都完成後,要去增加一個使用者回饋的機制,來幫助新資料能夠不用再找人標注的情況下,就能夠獲得可以直接進行訓練的資料,而這個使用者回饋機制,可以透過一些設計的方法來做處理,例如說:如果今天的資料是一個時間序列的資料,那其實不需要有使用者回饋,因為未來的資料就可以當作預測的結果,來進行後續模型重新訓練的資料來源,而如果今天是一個類別型的分群、分類模型,就可以透過使用者評1–5分,並且拿1分和5分的資料來當作額外的新資料做後續模型優化作業,當然,使用者回饋也是要預防使用者回饋狀況不佳的問題,建議可以針對回饋優良的使用者來進行即可,也可增加這些使用者的黏著性。

創建一個好的機器學習回饋與再訓練的服務架構
創建一個好的機器學習回饋與再訓練的服務架構