諸々落ち着きそうであるので、Kaggleに再度参加しようと思う。Mercariのやつにしようかな。
tkmさんのKaggle動画をみていたところ、 sklearn.model_selection.StratifiedKFold が出て来た。
sklearn.model_selection.StratifiedKFold
Jupyter NotebookでPandasのDataFrameを表示する時、カラム数が多すぎると省略されてしまうことがある。
そんな時は、
pd.set_option('display.max_columns', 100)
とやると良い。100の部分は表示したいカラム数。
引っ越しコンペが終わったので、どのコンペに挑もうか考える。
初めてちゃんと挑んだ分析コンペの引っ越しコンペが終了した。
tkm2261さんがkaggleの入門動画を上げてくださった。KaggleのあるコンペにSubmitするところまでを全部で2時間程度の動画にしてくださっている。
機械学習コンペではアンサンブル学習を利用されることが多いらしい。アンサンブル学習は別々に学習した分類機を組み合わせて、新たな分類結果を作るというもの。
下記の記事が、なぜアンサンブル学習をすると精度があがるかを例示してくれていた。
現在、ある分析コンペに参加している。参加途中の中での雑感をメモしておく。