[R]碩論-機器學習參數優化(田口法)

Allen
NoteOcean
Published in
Feb 24, 2021

隨著科技的發達,宣告Big-Data的時代已開始,因資料量遽增,硬體設備的進步成為一項重要的發展技術。軟體上,機器學習模型中使用核心作為平行/分散運算的方法也越來越多。但在有限的資源下,也不及資料量與運算量增加的速度。

論文連結

主要使用的套件是caret,是一套極為便利的套件,輔助了使用者在選擇變數後自動進行各項參數可能的組合結果,並比較製成模型給使用者。然而這樣便利的情況也帶來頻繁的重複建模、測試。

現有的方法多以硬體的優劣,來評斷應該給予多少訓練時間,電腦好訓練的次數多,可以比較的組合多,反之則減少了可能的組合,來降低訓練時間。

應用實驗設計的田口直交法來減少模型訓練的次數。

使用方法跟一般的caret並無兩樣,僅是在給予調整參數時,利用直交法產生的實驗表,當作caret的參數調整。

--

--