ЛЁГКИЙ диалог: проектируем навык для голосового помощника

Ivan Golubev
3 min readMay 14, 2018

--

IT-гиганты готовы общаться с нами голосами Алисы, Google Assistant и других подобных помощников, лишь бы продать собственные сервисы. Но кто научит технологичных ассистентов разговаривать на языке пользователя? Каким должен быть удобный диалог, и как его оценить? Обобщая опыт, полученный при создании навыков одного из ассистентов, делюсь мнемонической аббревиатурой, которая поможет разработчикам проверить качество проектируемого голосового интерфейса.

Актуальность

Используя голос, можно просто и быстро передать большое количество информации. Хотя голосовой интерфейс имеет свои недостатки, эволюция доказала его эффективность для общения людей, а современные речевые технологии сделали его доступным и для машин. Теперь дело за разработчиками диалогов (они же навыки, скилы и экшены), которые учат сервисы общаться и, таким образом, делают голосовых помощников полезными. При этом потребность в инструкциях для создания чат-ботов с голосовым интерфейсом удовлетворяется лишь частично, в основном документами от Amazon, Apple, Google, Microsoft и Яндекс, а также специальной литературой ([1], [2], [3]). В связи с этим представляется актуальным создание инструментов, позволяющих быстро и просто проверить разрабатываемое решение на соответствие базовым принципам проектирования диалога.

Чек-лист диалога голосового помощника

Итак, обещанная мнемоническая аббревиатура: хороший диалог = ЛЁГКИЙ диалог.

Личностный

Голосовой помощник, как правило, имеет отличительные особенности — определённый образ, характер. Например, помощник компании “Яндекс” — это умная, начитанная, спокойная Алиса, которая держит дистанцию и не допускает панибратства. Пользователи ожидают от неё соответствующего поведения, и соблюдение целостности характера способствует повышению доверия к ассистенту. Этот принцип ограничивает возможности автоматизации генерации ответов, а также использование данных внешних источников без дополнительных проверок, но он важен для пользовательского восприятия.

Естественный

Язык помощника должен быть естественным: избегайте повторов и канцелярских формулировок, по возможности используйте неявные подтверждения, используйте техники активного слушания. Не забудьте корректно обрабатывать приветствие, прощание, благодарность, запрос помощи и т.п.

Гибкий

Используйте средства NLU, чтобы понимать всевозможные формулировки запросов, а также вероятные ошибки распознавания речи. Предусматривайте для пользователя возможность изменить ход диалога в любой момент (например, отказаться от заказа или предоставить нужную информацию в удобном для него порядке). Также имейте в виду, что пользователь может вкладывать в один запрос больше информации, чем вы просите. Например, в диалоге подтверждения “Хотите пиццу ‘Маргарита’ за 200 рублей?” Будьте готовы к ответу “Да, 2 штуки, пожалуйста.”

Контекстный

Априорный контекст может включать информацию о времени, локации, устройстве пользователя, апостериорный — предыдущие запросы/ответы, имя, авторизационные данные, настроение пользователя и самого ассистента и т.п. Приветствуйте пользователя с учётом времени суток, называйте по имени, не запрашивайте то, что уже знаете, не инструктируйте опытного пользователя как новичка, будьте готовы к эллипсису.

Инициативный

Избегайте ситуации, когда пользователь не знает, что делать дальше. Отслеживайте “затыки” в диалоге и предлагайте выход из них. Направляйте диалог с помощью вопросов или подсказок, формируя ожидания собеседника. В Алисе для этого хорошо использовать кнопки (они же саджесты).

И краткий

Краткие формулировки снизят когнитивную нагрузку, сэкономят время и будут звучать более естественно. Сокращайте тексты за счёт предоставления только важной и актуальной информации, а также за счёт опускания уже известных пользователю фактов и инструкций. Если у ассистента есть экран, часть информации для краткости можно не озвучивать.

Заключение

На практике проектирование диалога ограничено как уровнем развития речевых технологий, так и особенностями реализации конкретного голосового помощника, а также интерфейсами используемых сервисов. Но следование указанным принципам может помочь разработчикам сделать разговор с их чат-ботом более лёгким.

--

--