Анализ рынка вакансий Data Science в Казахстане

В последние пару лет в Казахстане начал развиваться так называемый Data Science, а если более приземленно — клиентская аналитика. Мне, как молодому специалисту в этой сфере, стало интересно, что сейчас происходит на рынке вакансий, и, собственно, есть ли куда расти.

Источник информации — API HeadHunter.kz.

Инструменты — R, MyStem от Яндекс для текстовой аналитики.

Первый вопрос, который возникает, по какому названию искать? Вы скажете «Data Science»? К сожалению, по такому запросу вы найдете только одну вакансию (на 3 декабря 2017) от Kaspi Bank. Поэтому мы ищем «аналитика»: после рассмотрения первых 25 страниц с вакансиями, были отфильтрованы те, у кого в заголовке нет слова «аналитик», а также сочетания «финансовый/химик/инвестиционный аналитик», потому что это не совсем то, что нам нужно. В итоге у нас осталось 127 актуальных вакансий в 10 городах Казахстана.

Если посмотреть на географию предложений, то большинство из них из Алматы и Астаны. Ничего удивительного в этом нет, так как большинство головных офисов расположено именно в этих городах.

Зарплата указана в 31 вакансиях из 127 (24%), и это большая проблема наших объявлений (“цены в дайрект”). Человек, который рассматривает вакансию должен понимать, что конкретно ему предлагают и стоит ли тратить на это время. Средняя указанная зарплата — 250 тыс. тенге, 11 вакансий из 31 предлагают зарплату менее 200 тыс. тенге.

Средний требуемый опыт работы — 2 года. Самые популярные позиции — «аналитик-маркетолог», «аналитик» и «аналитик отдела продаж».

Наиболее часто встречающиеся слова в обязанностях (слева) и требованиях (справа) к вакансиям

В обязанностях наиболее часто повторяющиеся слова (кроме «анализ» и производных) это «отчет», «контроль», «проведение», «исследование», в общем, то, что можно назвать пост-анализ и бумажной работой. Очень редко встречаются слова «математический», «предиктивный» и «модель».

Судя по требованиям, основные факторы, которые делают из вас аналитика это высшее образование, опыт работы от одного года до двух, ну и владение MS Excel. Что касается навыков «python», «sql», «r», «sas» и «spss», то они в среднем указаны в 3-х вакансиях.

А вывод из всего этого такой: если вы хотите начать карьеру Data Scientist в нашей стране, то сразу переезжайте (если еще не там) в Астану или Алматы и будьте готовы к тому, что в большинстве случаев вам будут предлагать составлять отчеты и делать пост-анализы. Но, если вам повезет, вы можете себя показать и предлагать свои идеи, у меня получилось :)

Для тех, кому интересно как делать такой анализ на R (а особенно как, черт возьми, вытащить опыт работы из описания вакансии):

Код на GitHub

Простой WebScraping на R через API hh.ru / Хабрахабр

Стемминг текстов на естественном языке