データ分析コンペの進め方がわからない
Published in
2 min readOct 8, 2017
現在、ある分析コンペに参加している。参加途中の中での雑感をメモしておく。
難しいなと感じるのは、タスクの優先順位のつけ方。
データ分析を進める上で、すべきタスクがいくつか思いつくのだが、そのどれを進めるべきかがわからない。
例えば、データをある程度成形し、モデルに突っ込んで、予測を得た時に
- 特徴量の作成
- 別のモデルで試してみる
- モデルのパラメータ調整
などがすべきこととして考えられると思うが、どれに注力すべきかがわからない。経験が少ないから、どこにどれだけ時間を費やせば、どれくらい改善しそうだ、という感覚が持ててない。
現段階では、自分の経験のために、思いついたことは全部やってみよう、という気持ちで進めている。
scikit-learnのパラメータ調整について書かれた数少ない(?)本として下記が紹介されていたので購入してみた。