Пользовательские данные ≠ понимание пользователей

Rodion Sorokin
Humanized Design / Ru
7 min readJul 27, 2018

«Без данных — вы лишь очередной человек со своим мнением»
— Вильям Эдвардс Деминг

«Вы не можете улучшить то, что не можете измерить»
— Питер Друкер

Компании собирают данные, чтобы иметь представление о том, что происходит с их бизнесом. Анализируя данные, они создают модели, которые объясняют прошлое, помогают предсказывать будущие события, или оптимизировать существующие процессы.

У моделей, графиков и таблиц одна функция: они избавляют нас от сложностей мира и защищают от его хаотичности. Сложно принимать решения, опираясь на неструктурированную информацию. Поэтому модели приводят в порядок беспорядочное и дают возможность бизнесу принимать осознанные решения на пути к достижению своих целей.

Культ сбора данных

Сегодня крупные компании одержимы Big Data — большими массивами информации о бизнесе, пользователях и их взаимодействии. Аналитики собирают максимум данных о пользователях в надежде, что количество перерастет в качество. Но зачастую компании не понимают, какая информация им нужна и что они планируют с ней делать.

Благодаря простому доступу к статистике, детальным отчетам и инструментам визуализации, компаниям сейчас удобнее получать информацию о типах клиентов и моделях их поведения. Используя статистику, маркетологи планируют рекламные кампании, коммерсанты прогнозируют спрос, а руководители определяют цели на следующий квартал.

Проблема количественных данных в том, что информация о пользователях полезна только после их проверки в реальном мире с реальными людьми. Тем не менее, многие бизнесы остановились на добыче данных и не обращаются к клиентам за дополнительной информацией.

Статистика показывает, что авторизованные на сайте пользователи покупают чаще и больше, чем неавторизованные. Аналитик делает вывод, что увеличение доли авторизованных пользователей увеличит доход. Для этого в разных разделах сайта делаются назойливые напоминания с просьбой авторизоваться.

Такое решение не даст значительного результата, потому что аналитик, опираясь на количественные данные, ошибся в причинно-следственных связях. Пользователи покупают не потому, что они авторизованы. Авторизованные пользователи — это лояльные и повторные покупатели. Если нелояльный или нецелевой пользователь авторизуется на сайте, это не повлияет на его мотивацию сделать покупку. Иногда, чтобы увеличить конверсию на сайте, необходимо не искать способы увеличения конверсии, а уменьшить привлечение нецелевой аудитории.

Бессмысленно смотреть в цифры, графики и пытаться догадаться, почему клиенты покупают один товар, а не другой — нужно пойти и спросить. Но это кажется слишком простым в эпоху Big Data и машинного обучения. Стоит признаться, что ни Big Data, ни машинное обучение всё ещё не могут объяснить поведение людей. Статистика не заменяет живое общение с клиентами. Компаниям нужно воспринимать клиентов как людей, а не только как наборы данных.

Big Data vs Small Data

Последние десять лет крупные компании пытаются свести человеческое поведение к набору моделей. Вместо того, чтобы разобраться в природе человека, они инвестируют в способы её упрощения. Анализ больших данных нацелен на понимание паттернов потребительского поведения и перевод их в успешные модели продаж. Но компании часто терпят неудачи из-за неправильного понимания сигналов. Иррациональность поведения потребителей препятствует созданию идеальной модели, даже при использовании большого количества данных.

Medallion — один из трех хедж-фондов компании Renaissance Technologies. Его средняя годовая доходность с момента основания превышает 40% и по данным Bloomberg за последние 28 лет он принес около $55 млрд прибыли. Работа фонда основана на количественных методах анализа фондового рынка. Сотрудники используют математические модели, чтобы найти корреляции между рыночными ценами и происходящими событиями. С этой целью 300 человек, среди которых 90 обладают учёной степенью, целыми днями наблюдают за паттернами.

Изучая сведения об облачности, они выявили связь между солнечными днями и подъёмом рынков от Нью Йорка до Токио. «Оказывается, когда в Париже облачно, вероятность того, что рынок пойдет вверх, понижается. Однако это не то, на чём можно заработать много денег, поскольку эта тенденция прослеживается в пятидесяти с небольшим случаев из ста.» — рассказывает Питер Браун, сооснователь компании. «Мы не начинаем с моделей, мы начинаем с данных. Мы ищем сигналы, которые могут повторяться тысячи раз.» — добавляет Джеймс Саймонз, руководитель фонда.

«Мы просматриваем исторические данные в поисках аномальных паттернов, которые не кажутся случайными. Мы анализируем данные и рынки, чтобы проверить статистическую значимость события и его постоянство. Когда мы находим обоснованность паттерна, мы спрашиваем себя: соответствует ли это событие поведению, которое кажется разумным?»

История фонда Medallion — это успешная история использования больших данных. Мало кому удается с такой стабильностью улавливать сигналы, превращать их в модели и принимать правильные решения на их основе. Если их алгоритмы работают так хорошо, то почему бы не масштабировать их на больший капитал и в других бизнесах? На это Саймонз отвечает: «Мы сейчас управляем капиталом в размере $4 млрд. Можем ли мы управлять $8 млрд? Да. Можем ли мы управлять $70 млрд? Конечно нет. Я понятия не имею, как это можно сделать. Мне сложно представить, как можно управлять таким капиталом делая то, что мы делаем сейчас.» Как видите, у всех моделей есть ограничения.

Чтобы отделить ценный сигнал от шума, нужны большие вычислительные мощности и сложные математические модели. Большинство компаний не владеет этим, поэтому сегодня использование больших данных — это зачастую попытки объяснить какие-то события задним числом за большие деньги.

Существует 3 проблемы использования Big Data для принятия решений касательно пользовательских сервисов:

  1. Количественные данные показывают паттерны поведения пользователей и их предпочтения, но не отвечают на вопрос «почему».
  2. Из-за иррационального поведения людей сложно отделить сигнал от шума.
  3. Big Data воспринимает пользователей как наборы информации, но не как людей, поэтому некоторые параметры возводятся в абсолют без учета психологических и социологических особенностей человека.

Big Data подходит для поиска корреляций, но не для выявления причинно-следственных связей. Для выявления причин нужны так называемые «малые данные» — данные, которые достаточно малы для их понимания человеком. Источником Small Data являются качественные исследования: наблюдения, интервью, симуляции, эксперименты.

Small Data можно назвать человекоцентричной альтернативой Big Data. Оба подхода собирают информацию, чтобы получить представление о поведении, интересах людей и т. д. Но подход малых данных строится на сочетании наблюдательности и прикладной интуиции.

В пользовательских исследованиях Small Data представляют собой с виду незначительные поведенческие наблюдения, которые содержат ценные детали, указывающие на неудовлетворенную потребность клиентов. Такие данные являются основой для прорывных идей и трансформации брендов.

С середины 1990-х годов LEGO начала отходить от своего основного продукта — конструкторов — и ориентировалась на тематические парки, одежду, видеоигры и розничные магазины. Они были убеждены, что из-за компьютеров и видеоигр дети нового поколения требовали мгновенного удовлетворения, и им не хватало терпения или внимания, чтобы собирать сложные конструкторы. Большие данные показали, что будущие поколения потеряют интерес к LEGO.

Но с помощью Small Data LEGO посмотрели на свой бизнес с другой стороны. Компания узнала от своего 14-летнего поклонника, что его подвиги на скейтборде измерялись износом обуви. Он скользил под углом 12,5˚ и это оставляло характерный след на его кроссовках. Такой износ был знаком крутости в его окружении.

Именно тогда LEGO осознала, что дети получают социальное одобрение у своих сверстников, основываясь на мастерстве, которое они проявили в своем избранном хобби. В результате компания переориентировалась на свой основной продукт и создала более сложные и трудоемкие конструкторы. Оказалось, что клиенты оценили этот усложненный опыт.

По наблюдениям Мартина Линдстрема, о которых он пишет в книге «Small Data», из 100 величайших инноваций нашего времени, 60–65% основаны на small data. В отличие от Big Data, Small Data способны объяснять эмоции и давать представление о мотивах поведения людей. Вы можете анализировать настроения и свести эмоции к числам, но вы не можете понять их, глядя только на числа.

Для принятия решений нужны как малые, так и большие данные

Подумайте о сети ресторанов, которая пытается улучшить доставку. Они слышат, что клиенты разочарованы текущей ситуацией, но независимо от того, сколько данных они анализируют, они не могут найти решение. Все потому, что больших данных недостаточно. Компании необходимо исследовать, как клиенты взаимодействуют с доставкой — в каких ситуациях они заказывают её, как ожидают и получают заказ, что происходит после доставки. Затем компании необходимо применить эмпатию, чтобы интерпретировать опыт клиентов и отследить их эмоции. Большие данные не могут этого сделать.

Netflix — это тонко настроенный набор алгоритмов, основанных на огромном количестве информации, которую собирает компания. Эти алгоритмы позволяют Netflix предвидеть всё: от фильма, который вы захотите смотреть в определенное время суток, до списка актеров и режиссеров, которых нужно пригласить для нового сериала. Это большие данные в действии.

При этом есть вещи, которые алгоритмы Netflix не могут предсказать. Хотя он хорош в рекомендациях контента, который мы хотели бы смотреть, он имеет меньше информации о наших реальных впечатлениях от просмотра. Netflix знает, что вы просмотрели три эпизода «Черного зеркала» в воскресенье, но он не знает, что вы в это время делали уборку и общались с мамой по телефону.

Стриминговые сервисы начали изменять способы потребления медиа. Статистика четко уловила эти изменения, но не может объяснить, почему. Поэтому Netflix, имея собственную команду исследователей, также работает с известным антропологом Грантом МакКракеном. Он провел много дней в домах обычных семей в США и Канаде, чтобы узнать, что меняется в жизни людей из того, что может повлиять на потребление медиа. Так в одном из исследований он обнаружил, что зрители более терпимы к спойлерам, чем склонны это признавать. Это означает, что новый способ потребления сериалов — «binge watching», когда зрители устраивают марафон и просматривают сериалы эпизод за эпизодом — не угрожает модели их распространения. Качественные исследования отвечают на десятки вопросов, которые касаются развития бизнеса Netflix, на которые не могут дать ответа большие данные.

Нассим Талеб в своей книге «Черный лебедь» заметил, что люди склонны строить модель, а потом начинают раскладывать реальность по её ячейкам, вместо того чтобы, отталкиваясь от реальности, искать то, что ей соответсвует. В конечном итоге компаниям необходимо использовать как малые, так и большие данные. Важно использовать результаты качественных исследований для построения гипотез и затем искать подтверждение им в моделях, выявленных в больших данных. При тесном контакте с клиентами компаниям легче понять контекст принятия решений и тестировать с ними новые идеи.

📢 Humanized Design — журнал о создании клиентоориентированных продуктов и услуг. Следите за новыми статьями в Телеграме и Фейсбуке.

--

--