Kaggle Tokyo Meetup #3が良すぎた
Published in
2 min readOct 28, 2017
今日はこちらのイベントに参加してきた。Kaggle上位入賞者の方たちによる、手法の共有。
資料はまだ全てはアップされてないようなのでまたの機会に。
僕はコンペをがっつり始めたのは最近なので、勉強になる点が多かったが、
- 特徴量作成などの泥臭い作業
- コンペ期間中の各時期にどんなことしてるのか
- 分析環境
- 受賞者の方がどんな方達か(発表者4人中2人が現役学生の方)
の一例を知ることができたのはよかった。
また、受賞された方達の手法を聞いていて、今自分が取り組んでいるコンペに活用できそうなものにも気づけた。(自分がまだまだ不勉強だからというのはある)
例えば、
- 時系列データの学習データは全て使わず直近○年のみとする
- ラベル付けの済んだテストデータを元に再度モデルを学習し直し、残りのテストデータにラベルを貼り付ける。
- xgboostはrandom_seedを変えて10個ほどモデルを作り、その平均を取るだけで、アンサンブル学習ができる
など。
明日は1日完結型のデータ分析コンペCpaw AI competitionがあるので頑張ろう。