Супер-сила AI: где мы сейчас

Human + AI

Denis Nushtaev (AMAI)
AMAI
Published in
5 min readJun 2, 2022

--

Несколько лет назад в рамках AMAI мы начали развивать свой Voice AI движок, потому что увидели, как мало решений есть на рынке и какое количество проблем могут решить голосовые технологии — с тех пор потребность только выросла, а у людей стало появляться понимание практической пользы от AI-продуктов: например, в сентябре 2019 года Сильвен Дюрантон из Boston Consulting Group в рамках своего выступления на TEDx отметил, что позитивные кейсы от использования AI случаются у тех компаний, которые 80% решений внедряют для помощи человеку, а не для полной замены его работы. Напротив, те компании, которые пытались полностью автоматизировать процессы, упирались в «алгократию»…

Алгократия?

Согласно словам Сильвена, если AI должен принимать 100% решений, то очень быстро он начинает чудить, капризничать, требовать внимания и новых правил для обработки простейших ситуации, с которыми он незнаком. Представим, что вы хотите нанять людей в свою компанию и начинаете общаться с AI: ✌

— У меня есть 5 классных Python-разработчиков, я хочу нанять ещё троих таких же. Найди мне.

— Вот этот парень кажется подходит.

— Нет, нет. Python — это язык программирования.

— А, понял, ну тогда вот.

— Уже лучше. Но важнее, чтобы он хорошо писал на Python. Возраст не так важен.

— Тогда вот это точно подойдёт.

— Не, ну не настолько же. Он же ещё школьник. Так, и почему ты написал этому парню, что он не подходит?

— Из этого города мало, кто имеет хороший опыт разработки IT-продуктов.

— Да, потому что здесь живёт всего 30 тысяч человек — он может вообще один разработчик на весь город.

Как и в случае любой плохой автоматизации процессов, затраты на её обслуживание превышают прирост к эффективности. Тем не менее рынок AI-технологий не только растёт, но и активно внедряется в критически важные сферы: медицина, промышленность, финансы, самоуправляемые автомобили, самоуправляемые коровы🐄 (спасибо

Carl Lippert

). Посмотрим на цифры:

Цифры

  • Объём рынка AI-технологий (hardware, software, services) сегодня оценивается в $39+ млрд.
  • Ежегодный рост рынка примерно 42% (CAGR). Для сравнения рост рынка SaaS-решений составляет 11.7%, облачных решений 14.9% в год.
  • Размер добавленной ценности (GVA) превысит $1 трлн. в ближайшие 15 лет (основной профит от AI получат медицина, автомобильная промышленность, ритейл и финансы). На долю Voice AI придётся $200+ млрд. по нашим оценкам.
  • Общий объём инвестиций в AI только в 2019 году превысил $70 млрд.
  • Около 86 тыс. научных AI-публикаций было сделано в прошлом году.
  • AI — самое популярное направление среди IT-специалистов, которые получают PhD (его выбирают более 20%).

Human + AI

AI начинает работать, когда внедряется в критически важную часть процесса, а не старается покрыть весь процесс. В случае кейса с поиском людей в команду одна HR-компания эффективно автоматизировала процесс рекрутинга не за счёт отсеивания кандидатов, а за счёт системы рейтингования, забрав на себя самую трудозатратную задача в рамках процесс рекрутинга: «Кому бы написать первому?». И оставив ответственность за принятие решений рекрутёру. Здесь диалог с AI выглядит уже таким образом:

— Я бы рекомендовал сначала посмотреть на этого парня, но если он не подходит, то у меня их тут ещё много.

— Да, спасибо. У нас тут ещё пришли обновления по вакансии, можешь внести корректировки в поиск?

— Без проблем.

Примеров позитивного использования формулы AI+Human масса — особенно в тех сферах, где высока ответственность за результат:

  • Компьютерное зрение. На объектах с повышенной защитой оператор отслеживает активность более, чем на 10 экранах. Однако, если полностью поручить AI ответственность за наблюдение, то как показывает опыт, мы будем постоянно упираться в ложные срабатывания. В реальности компьютерное зрение только сообщает оператору об активности на определённом участке и предполагаемую проблему.
  • Голосовой ассистент в интернет-магазине. Как показала практика, люди очень раздражаются при долгом общении с роботом и всегда просят позвать человека. Но успешным примером является опыт компаний, которые используют голосового помощника для соединения человека с нужным оператором и определения по голосу имени клиента, чтобы оператор сразу получил историю его покупок.
  • Микрохирургия. Биоинженеры в Бостонской детской больнице использовали микророботов, которые помогали проводить сложные операции: для этого их научили определять своё место в сердце и искать утечки, после чего он передавал информацию хирургу, которому не пришлось тратить долгие утомительные часы на этот поиск.

Voice AI

Отдельно хочется поговорить про технологии Voice AI по 2 причинам: в контексте AI — это одно из самых топовых направлений; мы сами разрабываем Voice AI продукты и видим растущую потребность.

К Voice AI относится как распознование речи, так и text-to-speech технологии, которые позволяют AI воспроизводить максимально естественную человеческую речь за счёт широкого спектра вшитых настроений — понять, как это работает можно на нашем демо.

Попробуйте отличить робота от человека

Такие технологии постепенно становятся неотъемлимой частью клиентского сервиса в банках и интернет-магазинах: 82% всего рынка Voice AI приходится именно на эти сферы; 15% — на автомобильную промышленность. Среди тех направлений, которые мы развиваем сейчас, стоит отметить следующие:

  • Call-центры. Многие знают, как могут раздражать голосовые помощники при звонке в банк или интернет-магазин, однако, практика показывает, что при позитивном опыте общения с голосовым ассистентом, клиенты начинают постоянно использовать его для получения необходимой информации, потому что гораздо больше раздражает бесконечное ожидание для получение нужной информации. Плюс, голосовые помощники исключают возможность человеческой ошибки при консультации клиента (а они случаются часто). Позитивный опыт могут создать менее «деревянные» голосовые технологии, поэтому для наших клеинтов мы делаем голосовых помощников максимально «человечными» в общении с клиентом за счёт тонкой настройки голосовых параметров.
  • Аудиокниги. Но использование голосовых технологий не ограничивается этими направлениями и есть много сфер, где Voice AI технологии могут перевернуть всё. Например, сейчас мы делаем классный продукт по озвучиванию аудиокниг на английском и русском языках. В данном случае технология помогает человеку озвучивать уже готовый текст. В свою очередь человек может внести корректировки в ударениях, изменить настроение повествования, использовать разные голоса. Как и в примерах выше, здесь AI решает самую трудозатратную задачу. Учитывая, что рынок аудиокниг неумерённо растёт (20%+ CAGR), а у блогеров стало модно озвучивать свои статьи (вот Medium пару лет назад уже внедрил эту функцию для некоторых популярных статей), данная технология станет супер-востребованной в ближайшее десятилетие.
  • Роботы и IoT👾. Активное внимание последнее время привлекает робототехника и интернет вещей, в которых голосовые помощники часто являются ключевым функционалом. До недавнего времени, одной из проблем при их разработке, была невозможность работать без Интернета — мы решили эту проблему, разработав self-hosted версию движка и таким образом голосовых помощниках можно использовать на производстве и других местах, где могут быть перебои с Интернетом. Именно за счёт таких инноваций IoT-устройства за последние несколько месяцев наводнили всю промышленность в мире (особенно — горнодобывающую).

Наш опыт показывает, что правильное использование Voice AI открывает новые возможности для самых разных рынков — в частности, нашим текущим челенджом является освоение большего количество языков (в прошлом году показательным примером стала продажа индийского стартапа, который может распознавать речь на 10 местных языках). Поэтому мы считаем, что несмотря на хайп вокруг AI в прошлом десятилетии, его реальная ценность начинает раскрываться только в этом.

Photo by Markus Winkler on Unsplash

--

--