Юзабилити голосовых меню

Марина Рогачева, 2003

Vlad Golovach
Usethics ⭕ doc
11 min readNov 29, 2014

--

Особенности пользовательских интерфейсов голосовых телефонных меню и необходимость применения эргономического, ориентированного на пользователей, подхода в процессе их разработки.

Голосовые меню (выражаясь научно — интерактивные телефонные системы), в которых пользователь вступает в диалог с автоматизированным звуковым интерфейсом, широко распространены за рубежом ещё с восьмидесятых годов, а теперь массово появляются и в России.

Установка интерактивной телефонной системы, как правило, приводит к повышению прибыльности бизнеса, поскольку такая система способствует привлечению дополнительных клиентов. Более того, речь обычно идёт именно о тех клиентах, в которых большинство компаний особенно заинтересовано — в частности, о социально активном населении с относительно высоким уровнем дохода. Помимо привлечения дополнительных клиентов, голосовые меню позволяют сократить штат, понизив расходы организации (отпадает необходимость в большом числе операторов).

Разумеется, телефонное меню по всем параметрам проигрывает обслуживанию через интернет, но зато оно обладает двумя принципиальными достоинствами: во-первых, практически у любого человека есть доступ к телефону (доступ в интернет в нашей стране до сих пор является относительной роскошью, доступной лишь малой части населения; кроме того, даже если доступ в интернет и есть, он редко бывает круглосуточным), во-вторых, телефонное меню дешевле, поскольку в любой сколько-нибудь мощной коммерческой АТС есть встроенные средства создания меню. В любом случае, задачу переброски входящих звонков на конкретных сотрудников через интернет не решить.

Следует заметить, что, несмотря на столь очевидные достоинства интерактивных телефонных систем, их внедрение совершенно не обязательно приводит к желаемому результату. Неудачно спроектированное и неэффективное голосовое меню может привести даже к увеличению времени звонка из-за неспособности пользователя свободно ориентироваться в системе. Более того, в дальнейшем клиент, скорее всего, будет избегать пользоваться меню.

Опрос, проведённый в США в 1997 году, показал, что, несмотря на повсеместность и очевидные преимущества голосовых меню, лишь 60 процентов опрошенных достигают желаемого результата при их использовании. Количество опрошенных, которые остаются довольны процессом взаимодействия с телефонными системами, ещё ниже — оно составляет всего 40 процентов (Katz, Aspden & Reich, 1997).

Объяснить это просто — меню необходимо специально проектировать, а делать это должен не сетевой администратор, а специалист. Без этого меню не будет обладать качественным интерфейсом. В данной статье речь пойдёт об особенностях пользовательских интерфейсов этих меню и необходимости применения эргономического, ориентированного на пользователей, подхода в процессе их разработки.

Специфика звуковых интерфейсов

О чём необходимо помнить, приступая к разработке голосового меню? В первую очередь, о психологических характеристиках и ограничениях пользователей, связанных со спецификой звукового восприятия информации. Ниже приведёны основные такие характеристики.

Линейность и память

Звуковые интерфейсы отличаются от графических интерфейсов, прежде всего, способом передачи информации пользователю. В отличие от визуальных интерфейсов, где информация представлена параллельно, звуковую информацию, в особенности речь, невозможно донести до человека иначе, как последовательно, слово за словом. Это накладывает ограничения на скорость передачи информации (скорость чтения меню оператором), но что еще более важно — на количество элементов на каждом иерархическом уровне меню.

Так как пользователь не имеет постоянного доступа ко всем элементам меню одновременно, ему приходится постоянно удерживать в памяти всю текущую ветвь меню и полный путь к этой ветви. Проблема в том, что объем этой оперативной памяти в среднем равен всего семи элементам, таким образом, удерживание сложного меню, неминуемо приводит к перегрузке памяти, в особенности, если меню или названия перечисленных элементов недостаточно кратки и понятны.

Когнитивные ресурсы и бдительность

Прослушивая меню первые несколько раз, его содержимое трудно или невозможно запомнить, но зато легко забыть. Пользователям обычно приходится повторять уже прослушанные элементы про себя, чтобы удержать их в оперативной памяти (и, по возможности, перенести из кратковременной памяти в долговременную). В результате, количество когнитивных (познавательных) ресурсов, задействованных непосредственно в усваивании смысла меню, резко снижается, а значит, снижается и способность понимания и восприятия сложных и недостаточно интуитивных формулировок.

Кроме того, пользователи заинтересованы в том, чтобы проскочить меню максимально быстро, что порой приводит к ошибкам. Важно понимать, что пользователь выбирает не правильный элемент, а первый элемент, который похож на правильный. Это значит, что если два похожих элемента находятся в одном уровне меню, большинство пользователей поначалу обязательно выберет первый элемент (в графическом интерфейсе оба элемента будут предъявлены пользователю почти одновременно, так что первый элемент будет лишь чуть-чуть более «популярен»).

Есть и другая причина фактического снижения бдительности пользователей. Чем дольше пользователь прослушивает меню, тем сильнее снижается объем и устойчивость внимания, которое он уделяет процессу. Если же пользователь недостаточно сосредоточен, он может пропустить ряд элементов, включая те, которые представляют для него наибольший интерес, и в результате будет вынужден либо вернуться в начало меню для повторного прослушивания, либо, что гораздо хуже, вообще бросить трубку или обратиться к оператору.

Основные правила проектировки голосовых меню

Опишем некоторые правила, позволяющие улучшить интерфейс голосовых меню. Некоторые правила являются взаимоисключающими — увы, но универсальных алгоритмических правил не существует.

  • Звуковое меню должно быть коротким, не превышая 4 элементов на одном иерархическом уровне (условно говоря — 4 элемента текущей ветви плюс путь к ней; по этой же причине корневых ветвей может быть больше). Пользователь вынужден выслушивать названия элементов последовательно, не всегда имея возможность вернуться в начало меню или же не всегда помня о такой возможности. Чем больше элементов на одном уровне, тем выше вероятность того, что пользователь в лучшем случае их перепутает, а в худшем — забудет.
  • Крайне важно придерживаться кратких и ясных формулировок. Не стоит опасаться того, что пользователь посчитает тот или иной элемент меню недостаточно вежливым. В случае диалога с автоматизированной телефонной системой излишние «пожалуйста», «спасибо» и «будьте добры» неуместны. Все заинтересованы сократить диалог с компьютером до минимума, поэтому изобилие вежливости послужит для клиента лишним раздражителем.
  • Составные формулировки, например «Операции и отчеты» приводят к человеческим ошибкам. Услышав про операции, пользователи будут игнорировать вторую половину элемента (отчеты).
  • Пользователю приходится помнить свой путь к текущей ветви меню, но это сокращает доступный объем оперативной памяти для собственно содержимого ветви. Соответственно, полезно делать меню широким, нежели глубоким (со многим уровнями вложенности).
  • Названия элементов меню должны быть содержательными, адекватно отражая задачи пользователя. Например, лучше сказать: «Для пополнения баланса, нажмите один», а не «Чтобы попасть в отдел абонентской службы…». Возможно, что пользователь не знает, чем именно занимается тот или иной отдел. Кроме того, при когнитивной перегрузке у пользователя не остаётся возможности «вдуматься» в смысл формулировки и он руководствуется прямым значением услышанного («абонентская служба — это абоненты, абонент — это я»). В ситуации, когда отдел абонентской службы занимается лишь частью возможных вопросов абонентов, вероятность неэффективной навигации особенно велика.
  • Элементы меню должны быть выстроены в соответствии с частотой обращения пользователей по тому или иному вопросу. К примеру, если абоненты сотовой сети обращаются в центр обслуживания чаще всего для того, чтобы пополнить баланс, необходимо поставить данный элемент меню первым. В результате большинство пользователей получат возможность продвигаться по автоматизированной иерархии относительно быстро, прослушивая минимальное количество информации и сокращая общее время диалога с системой.
  • Чрезвычайно важно пронумеровать элементы последовательно, начиная с единицы. Подобное построение позволит пользователю предугадать номер следующего элемента и нажать его, не прослушав название пункта полностью. Таким образом, клиент достигнет цели быстрее и сэкономит время.
  • Название пункта меню обязательно должно предшествовать цифре, которую необходимо нажать в случае выбора данного элемента. Такое построение облегчит нагрузку на когнетику пользователя (не нужно будет запоминать номер элемента, параллельно пытаясь осмыслить название, зачитываемое оператором) и позволит пользователю быстрее передвигаться по меню, в случае если он может заранее предугадать цифру элемента, зачитываемого в настоящий момент.
  • Любая операция пользователя должна иметь немедленную обратную связь. Например, если пользователь нажал номер элемента до того, как были перечислены все элементы ветви, автооператор должен прервать чтение и перейти к списку элементов следующего иерархического уровня.
  • Если разные пользователи контактируют с системой по разным вопросам, стоит попросить пользователя назвать себя в начале диалога с системой и далее сократить меню, предоставив клиенту лишь актуальные для него элементы. Например, если в начальной стадии процесса проектировки телефонной системы банка выяснилось, что основные задачи частного клиента отличаются от задач бизнес-представителя какой-либо фирмы, идентификация клиента в начале диалога и дальнейшее сокращение меню будут способствовать быстрой и эффективной навигации.
  • Следует соблюдать последовательность внутри системы между меню разными иерархическими уровнями. Например, если утвердительный ответ пользователя обозначен цифрой один на одном уровне, следует придерживаться этого обозначения на всей иерархии.
  • Важно предоставить пользователю возможность в любой момент вернуться в основное меню или обратиться за помощью к реальному оператору. Фактическим стандартом является обозначение возврата цифрой ноль и после перечисления основных элементов на каждом уровне меню (несмотря на стандартность, цифру возврата все равно нужно сообщать пользователю).
  • Предоставляемая пользователю информация должна быть максимально релевантна его потребностям. Перед тем, как включить какую-либо фразу в элемент, следует достоверно убедиться в том, что эта информация является необходимой для решения пользователем своей задачи. И обратно — нужно убедиться, что предоставляемой информации достаточно для принятия решения.

Пример анализа звукового интерфейса

Типичные ошибки, возникающие при проектировании голосовых интерфейсов, легко отследить, проанализировав реально работающую интерактивную телефонную систему.

Структура меню из примера

Данная система внедрена в одном из российских банков. Она позволяет клиентам банка получить отчёт о состоянии их счёта, а также предоставляет общую информацию о характере дистанционного обслуживания, осуществляемого по телефону (например, о том, какие именно операции клиент может осуществить по телефону, какова их стоимость и т.д.).

«Глубина» и «ширина» голосового меню

Голосовое меню системы построено следующим образом — на каждом из четырёх иерархических уровней меню присутствуют от одного до шести элементов, пронумерованных последовательно. Обратим внимание на «глубину» и «ширину».

Соглашения

Характерной особенностью данного меню является длинный гудок, звучащий на каждом уровне в конце зачитанного оператором списка. По аналогии с системой, традиционно принятой в автоответчиках, где длинный гудок является сигналом к действию, пользователь данного голосового меню, скорее всего, истолкует гудок как необходимое условие для начала ввода информации. Но если в автоответчике пользователь действительно не может взаимодействовать с системой до гудка, то в диалоге с интерактивной телефонной системой существует возможность нажать клавишу выбранного элемента до того, как оператор закончит чтение. В рассматриваемой нами системе такая возможность присутствует, однако гудок в конце меню вероятнее всего будет истолкован пользователем, как необходимое условие для начала ввода информации, то есть возникнет иллюзия, согласно которой дальнейшее продвижение по меню невозможно до гудка. Таким образом, скорость передвижения пользователем по иерархии существенно снизится.

Ещё одно очевидное отсутствие соглашений относится к внутреннему построению данного меню. На некоторых иерархических уровнях элемент «факсимильное сообщение» обозначен цифрой «1», тогда как на других уровнях он закодирован цифрой «2», т.к. ему предшествует элемент «голосовое сообщение». Разумнее было бы присвоить идентичному элементу одно и то же цифровое обозначение — для этого просто нужно поменять элементы «голосовое сообщение» и «факсимильное сообщение» местами на тех уровнях, где они оба присутствуют.

Построение меню

В рассматриваемом меню цифровое значение элемента предшествует его смысловому названию (например, «нажмите клавишу один — сеанс телефонной связи»). Подобное построение усложняет задачу клиента, приводит к частым ошибкам и возвратам, так как способствует увеличению когнитивной перегрузки и не позволяет быстро передвигаться по меню.

Формулировки

Не все названия элементов данного меню понятны и наполнены содержанием для пользователя. Например, название «голосовое сообщение» очевидно в первую очередь будет ассоциироваться с голосовым почтовым ящиком. Более удачный вариант: «Для прослушивания информации, нажмите один» и «Для пересылки информации на ваш факсимильный аппарат, нажмите два».

Непонятно также название «Памятки». Если имеются в виду правила выполнения различных операций, неясно почему, например, элемент «Правила расчётно-кассового и дистанционного обслуживания» относится к категории «Документы по факсу», а не к категории «Памятки», ведь правила — это не документ. По всей видимости, подразумевается список обязательств, которые клиент должен подписать в случае покупки услуг системы, — в таком случае, название «Договор о расчётно-кассовом и дистанционном обслуживании» было бы более уместным.

Недостающая информация

Ввод любой информации в обсуждаемом меню необходимо заканчивать нажатием клавиши «решётка». В связи с этим, следует отметить две вещи: во-первых, это правило не соответствует дизайну большинства звуковых интерфейсов, в которых выбор осуществляется лишь одним нажатием цифровой клавиши. Вероятнее всего, клиент не привык заканчивать ввод нажатием «решётки», и это осложнит эффективность диалога. Кроме того, подобное построение не соответствует информации, сохранённой в памяти пользователя, так как при чтении меню оператор не упоминает клавишу «решётка» после цифрового обозначения элементов. Соответственно пользователь помнит фразу «нажмите клавишу один», а не «нажмите клавишу один и затем решётку». И, наконец, пользователи обычно забывают нажать дополнительную клавишу после цифровой (Aucella & Ehrlich, 1986; Halstead-Nussloch, 1989), по-видимому, в связи с тем, что функциональность этого действия для пользователя трудно уяснима («я уже выбрал один, зачем же нажимать ещё решётку?»).

Помимо всех вышеперечисленных минусов, связанных с необходимостью подтвердить свой выбор нажатием «решётки», в рассматриваемом меню существует ещё один, значительно более существенный — факт того, что выбор необходимо закончить «решёткой» вообще не упоминается! Единственный способ прояснить ситуацию — это совершить ошибку (то есть не нажать ничего после нажатия цифры). После этого система довольно долго многозначительно молчит, пока пользователь безуспешно нажимает злополучную цифру снова и снова, затаивая подозрения по поводу исправности клавиш на своём телефонном аппарате, а затем произносит «Вы не произвели никаких действий в течение десяти секунд. Повторите ввод последнего параметра после звукового сигнала. В противном случае произойдёт принудительное завершение сеанса работы. Напоминаем, что ввод любой информации надо заканчивать клавишей «решётка». Собственно говоря, это напоминание вовсе не является напоминанием, так как звучит впервые. Стоит ли говорить о том, что подобный интерфейс вряд ли будет оценен пользователем положительно…

Ещё хуже обстоит дело с возможностью вернуться в главное меню или на предыдущий уровень иерархии. Таковых просто не существует. Правда, в ряде случаев система сама «выбрасывает» клиента в главное меню, например, если он ввёл неправильный пароль или попросил отправить ему факсимильное сообщение, в то время как его номер не определён системой. Подобная тактика со стороны системы, конечно, лучше, чем отключение (популярный метод среди непрофессиональных разработчиков голосовых меню), но все равно недопустима. Ведь весьма вероятно, что в подобной ситуации пользователь вовсе не хочет возвращаться в главное меню! Что касается возможности подняться на предыдущий уровень иерархии — она, как выяснилось, закодирована всё той же решёткой, что тоже не вполне понятно (получается, что решётка является не только вспомогательной клавишей, служащей для подтверждения ввода информации, а имеет ещё и свою независимую функцию). На протяжении всего голосового меню о функции возврата вообще не упоминается, так что вероятность того, что пользователь её обнаружит, стремится к нулю.

Решение вышеназванных проблем очевидно — в конце списка на каждом уровне меню необходимо добавить элемент возврата на предыдущий уровень и в главное меню. Кроме того, в случае если клиент совершил ошибку, нужно предоставить ему возможность обратиться к реальному оператору, который поможет ему разобраться в происшедшем.

Этот анализ не претендует на исчерпывающую полноту (равно как и приведенные выше правила проектирования звуковых интерфейсов). Однако фиксация даже этих проблем позволит значительно повысить эффективность меню из примера; для разработки же действительно эффективного меню необходимо полноценное юзабилити-тестирование (возможно, меню даже стоит спроектировать заново).

Заключение

Звуковые интерфейсы — это один из тех случаев, когда несложная технологически система способствует увеличению прибыли компании за счёт ряда самых разнообразных факторов. В то же время, важно помнить, что следование принципам юзабилити во время проектировки системы должно играть первостепенную роль. Разрабатывать интерфейс необходимо по всем правилам, включая сбор и анализ бизнес-требований, анализ задач потенциальных пользователей, разработку сценариев взаимодействия пользователя с системой, выявление пользовательских профилей, построение навигационной системы и, что самое главное, юзабилити-тестирования. Подобный процесс, хотя и займёт больше времени, обеспечит комфорт пользователей в процессе взаимодействия с интерактивной телефонной системой, тогда как последнее, в свою очередь, будет способствовать удачному росту бизнеса в дальнейшем.

Библиография

Aucella, A.F., and Erlich, S.F. (1986). Voice messaging: Enhancing the user interface based on field performance. In M. Mantei and P.Oberton (Eds.), Proceedings of CHI’86 (pp.156–161) . New York: Association for Computing Machinery.

Bond, C. and Camack, M. (1999). Your call is important to us…Please hold. Ergonomics in Design, 9–15.

Dulide, L. (2002). Automated telephone answering systems and aging. Behavior & Information Technology, 21(3), 171–184.

Halstead-Nussloch, R. (1989). The design of phone-based interfaces for consumers. In Proceedings of CHI’89 (pp.347 — 352). New York: Association for Computing Machinery.

Katz, J., Aspden, P. and Reich, W.A. (1997). Public attitudes toward voice-based electronic messaging technologies in the United States: a national survey of opinions about voice response units and telephone answering machines. Behaviour & Information Technology, 16, 125 — 144.

Marics, M.A. and Engelbeck, G. (1997). Designing voice menu applications for telephones. In Helander, M., Landauer, P. and Prabhu. P. (Eds.), Handbook of Human Computer Interaction, 2d edition, (pp. 1085 — 1102). Elsevier Science B.V.

Paap, K.R. and Cooke, N.J. (1997). Design of menus. In Helander, M., Landauer, P. and Prabhu. P. (Eds.), Handbook of Human Computer Interaction, 2d edition, (pp. 533 — 571). Elsevier Science B.V.

Schumacher, R.M., Hardzinski, M.L. and Schwartz, A.L. (1995). Increasing the usability of interactive voice response systems: Research and guidelines for phone-based interfaces. Human Factors, 37(2), 251–264.

Schwartz, A.L. and Hardzinski, M.L. (1993). Ameritech phone –based user interface standards and design guidelines. Ameritech Services.

Interactive services design guidelines. ITU — T Recommendation F.902.

Изначально опубликовано в блоге Usethics.

--

--