Big Data & Predictive Analytics (trsl Rus)

Big Data и Прогностическая Аналитика — больше, чем тренд

Примечание к переводу: Статья полезная, для начального уровня DS, больше нацелена на маркетологов компаний, как обычно в подобных статьях происходит смешивание структурированных и неструктурированных данных, поэтому и сами авторы путаются и “в показаниях”, и в приземлении к реальности прогностической аналитики, сваливаясь на количественную, “физическую” сторону данных. Отсюда и результат: “далекое будущее” (по мнению авторов) — уже случилось — в предвыборной кампании Трампа.

В инструментарий любой современной компании необходимо добавить одну очень полезную вещь — хрустальный шар. Если вы можете предсказывать будущее, то и результат всех ваших начинаний будет известен заранее, позволяя избегать ненужные риски. Вам более не придётся угадывать мысли уже существующей или потенциальной аудитории, а дела организации сразу начнут идти на подъём.

Нет, я не собираюсь учить вас предсказывать будущее. В этой статье я попробую объяснить то, как прогностическая (предсказательная) аналитика усиливает Big Data, что, по сути, мало чем отличается от предсказания будущего.

Без лишних слов
 
Попробую в простых понятиях рассказать, что же эти два термина значат:

Big Data можно назвать бесконечной галактикой записываемых чисел, генерируемых без остановки в любой момент времени всеми электронными устройствами как онлайн (наиболее часто) так и оффлайн (до загрузки данных в интернет).

Бизнесы, дата-центры и спецслужбы промышляют сбором данных уже много лет. Каждая открытая страница, загрузка приложения, продажа продукта, сообщение, даже каждое прикосновение к портативному устройству — абсолютно все пригодные к цифровой записи действия становятся частью этой галактики, которая и называется Big Data.

Вы можете называть все посещения вашего сайта данными, но только совокупность всех возможных параметров с каждого сайта, посвящённого вашей отрасли могут называться “большими данными”.

Потоки данных за 1 год

Таким же образом все данные, создаваемые в ходе повседневной деятельности сотрудников крупной корпорации можно назвать Big Data: все оплаты и денежные переводы, их условия и места проведения, запросы в службу поддержки, колебания стоимости акций, вовлечённость в соцмедиа и многое, многое другое.
 
Прогностическая аналитика — один из инструментов, что позволяет обрабатывать настолько большие наборы данных и находить закономерности, полезные в достижении конкретных целей и задач. Эти закономерности также можно использовать для прогнозирования результатов, а значит опознавать не только тренды относительно всего объёма информации, но и относительно отдельных её частей. Например, выявить группу людей, предпринимающих определённое действие и сравнение их привычек с какой либо другой группой.

Сама по себе Big Data сравнительно бесполезна. Данных попросту слишком много для извлечения из неё сколько либо существенной пользы и они неструктурированны по своей природе. Но если вы начнёте использовать аналитику для работы с Big Data, то результат не заставит долго себя ждать…
 
Вы сможете соединить все причинно-следственные точки, выявляя закономерности в процессах, статистике продаж и потребительском поведении.
 
На основе данных по прошлым тенденциям, эту гармоничную комбинацию Big Data и прогностической аналитики можно использовать для предсказания будущего развития ситуации, что также означает повышенный доход и лучшую систематизацию деятельности компании.

Возможности для бизнеса
 
Сможет ли такая комбинация заменить собой хрустальный шар? Нет, но её возможности установления причинно-следственных связей в больших и сложных наборах данных — практически то же самое.
 
Пол Трухильо выделяет три основных полезных применения Big Data для бизнеса:
 
1) Помощь в достижении лучшего понимания клиентов. Вы сможете упрочнить ваши связи с покупателями и понять, чего же они в самом деле хотят.
 
2) Помощь в выявлении проблем в бизнес-процессах. Путём решения этих проблем можно повысить общую эффективность работы организации.
 
3) Функциональная эволюция сети поставщиков информации. Вы наконец сможете достичь взаимовыгодного обмена информацией в реальном времени.

Потоки данных

Гейл Гарднер объясняет, как можно применить на практике идеи Пола: 
 
1) Информация о покупателях может быть использована для создания специальных, таргетированных на конкретного человека предложений именно тогда, когда они будут ему интересны.
 
2) Вы сможете предсказывать технические неисправности оборудования, что позволит их предотвратить, либо же заранее установить дополнительные устройства.
 
3) Улучшенные протоколы безопасности позволят применять данные о прошлых закономерностей для предотвращения взломов, краж и прочего мошенничества, а заодно и понимать где и как эти нарушения безопасности могут происходить.
 
Пол Трухильо привёл примеры и двух уже повсеместно использующихся методов: анализ информации о конкретном месте приобретения товара в супермаркете для увеличения продаж и отслеживание штрих-кодов / использование инвентарной системы для улучшения управления запасами. Возможности — безграничны и каждый из нас может начать внедрять подобные идеи в деятельность своей фирмы при помощи прогностических инструментов.

Святой Грааль для маркетологов?
 
Что было бы, если бы вам были доступны все возможные данные обо всех покупателях со всех платформ? Если бы вам была доступна информация об их денежных операциях, истории браузера, активности в социальных медиа, интересах, склонностях, демографии — и ею можно было воспользоваться для управления тенденциями даже на уровне конкретного пользователя? 
 
Сможете ли вы предсказать потребительские привычки ваших покупателей, чтобы создать лучшие уникальные предложения для каждого из них?

Это можно было бы назвать абсолютной вершиной маркетинга, здесь и сейчас. Ответ на этот вопрос мы обсудим позже…
 
Такие уровни персонализации всегда вызывают беспокойство пользователей о сохранности их персональных данных. Но это палка о двух концах — некоторые деятели отрасли утверждают, что это и есть именно то, чего хочет каждый потребитель и именно этого он и будет в конце концов требовать (без исключения).

Проблема IT-сферы — незнание, где конкретно стоит провести черту “приватности”

В наши дни пользователь ожидает, что поставщики товаров и услуг должны моментально и точно отвечать личным требованиям каждого конкретного потребителя. Те же ожидания распространяются и на их службы поддержки.
 
Маркетинг постоянно становится всё сложнее и именно поэтому современный маркетолог должен уметь принимать решения на основе собираемых данных, а не предубеждениях и прошлом опыте.
 
Но такой хрустальный шар совсем не ограничивается ролью маркетингового инструмента. Он также может быть и инструментом послепокупочной поддержки клиента, помощником менеджера по продажам и дополнительным способом повышения лояльности. Только представьте: реальновременный анализ того, что продали, кому продали, когда продали и с какого устройства была эта покупка совершена. Это был бы способ удостовериться, что покупки для потребителя будут быстрые, удобные и безопасные, заодно предоставляя информацию, которую можно использовать для совершенствования процесса как для стороны покупателя, так и для стороны продающего…и даже это вас не вдохновляет? А должно!

Ограничения
 
Получается, что прогностические алгоритмы Big Data и вправду могут рассказать нам о покупателе абсолютно всё, вплоть до черт его характера? Получается, что такой хрустальный шар может полностью предугадывать грядущие события?..
 
 Ответ: пока что нет
 
Простой пример: ‘персонализированная’ реклама, также известная как “ремаркетинг”, преследующая вас в прогулках по интернету. Если кто-то незадолго до рождества дал себе обещание больше заниматься в новом году спортом и искал на сайте спортивных товаров кроссовки для бега, то это не значит, что ему эти кроссовки останутся интересны и в следующем ноябре…

Кроме того, агрессивный ремаркетинг (хоть порой и эффективен), может вызывать у потребителя чувства сильно негативные, особенно, если переусердствовать. Потребители, непонимающие рекламных технологий, будут чувствовать, что их права на приватность активно ущемляют, что отнюдь не приносит выгоды.

Только тогда, когда Big Data и предсказательная аналитика совмещаются грамотно, мы можем получать точные результаты. Но, как говорит Мэтт Масуи, человеческое поведение невозможно предсказывать со стопроцентной точностью. Данные не всегда являют собой панацею — покуда вы не решитесь погрузиться в продвинутый анализ и теорию хаоса.
 
Еще один нюанс: по данным отчёта по оценке качества данных от Experian (за 2015 год), организации считают, что в среднем, 26% оперируемых ими данных — неточны.

С одной стороны это невероятно, с другой стороны — невероятно разочаровывающее. Big Data, как правило, неполны, неточны и слишком массивны, чтобы с их помощью добиваться желаемых результатов и методы работы с такими многосторонними данными необходимо совершенствовать.
 
Человеческий подход
 
Big Data и прогностическая аналитика — ближайший аналог хрустального шара, что у нас есть сегодня. Но сам по себе хрустальный шар бесполезен, к нему в комплект нужен предсказатель, который способен считывать с подобного инструмента информацию и облачать её в полезные идеи и выводы, что кроме человека никто не сделает.

В любом тесте и наблюдении всегда будет присутствовать элемент человеческой непредсказуемости. Можно ли создать алгоритм, что будет предугадывать такие случайности? Я считаю, что крайне маловероятно. По крайней мере, не в следующие пару десятилетий!

Нельзя надеяться, что для того, чтобы узнать все желания и нужды поребителей вам понадобится всего лишь запустить системный аналог хрустального шара. Вам всё равно стоит прислушиваться и взаимодействовать с ними на самом базовом уровне, чтобы наладить столь необходимую обратную связь. Но, тем не менее, хрустальный шар окажет неоценимую помощь желающему взглянуть в будущее.
 
Именно поэтому самые сбалансированные и точные прогнозы получаются в результате совмещения Big Data, прогностической аналитики и человеческого участия.
 
Николас Исмаил рассматривал ‘3 столпа’ полезного применения Big Data и предсказательной аналитики на пользу бизнесу. Эти столпы — понятие желательности, целесообразности и состоятельности обнаружения проблем, а чьи проблемы разрешаются возможностью количественной оценки их последствий. Всё это, по сути, решает человек и именно поэтому многие компании не могут целиком разобраться в головоломке под названием “Big Data” даже сегодня. Господству роботов придётся подождать…
 
А что в будущем…?
 
Аджай Оржи утверждает, что создание более дешёвых способов хранения данных вкупе с интуитивно понятным программным обеспечением сделали Big Data и прогностическу аналитику куда более доступными, чем они были раньше, что и повлекло за собой множество желающих воспользоваться нововведением, толком не понимая, как же оно на самом деле работет.
 
Если что то потенциально предоставляет большие возможности, то этим однозначно нужно пользоваться, но, для начала, следует должным образом разобраться в принципах его работы.
 
Big Data и прогностическая аналитика уже играют одну из ключевых ролей в развитии бизнесов, помогая им
направлять клиентов и упрощая операционный аспект. С повышением востребованности автоматизации будет повышаться и спрос на предсказательные системы и от этого никуда не деться — если в ногу со временем не идёте вы, то вас обгонят те, кто этим не брезгует.
 
И напоследок — ещё одна красивая инфографика:

Источник