В первой части этой статьи мы занимались извлечением и очисткой данных, потому теперь, когда все необходимые данные находятся в одном месте, мы можем приступить к обучению нашей модели. Попутно мы также осуществим анализ наших данных, пытаясь выяснить, что больше всего влияет на исход судебного дела. — Подготовка к обучению Разбиение датасета Прежде, чем приступить к обучению модели, напишем небольшую подручную функцию train_model для того, чтобы мы могли быстро обучить модель, когда меняем датасет, добавляем признаки и т.д. Функция будет делать вполне типичную для ML рутину — делить обучающий датасет на обучащий, или training set, и тестовый, он же — test set…