5 conseils pour réussir votre application vocale sur GoogleHome et Alexa.

shirkaLAB
shirkalab
Published in
6 min readDec 29, 2017
copyright www.pcmag.com

Vous souhaitez créer une « Voice app » pour créer de nouvelles expériences conversationnelles engageantes avec vos utilisateurs? C’est une excellente idée, mais encore faut-il partir sur de bonnes bases !

Voici quelques conseils pour réussir votre application.

1/ Définir vos objectifs

Avant de vous lancer dans la rédaction de scénarios et de définir votre schéma conversationnel, vous devez commencer par poser les bases !
Comme pour tout projet, posez-vous tout d’abord plusieurs questions pour définir votre concept :

• Quelle sera sa valeur ajoutée ?
• Quelles sont mes cibles et leurs besoins ?
• Quelles fonctions développer en priorité ?

Mais la principale question à vous poser est « Pourquoi développer une application vocale ? »

Une application vocale est un nouveau mode de communication. Contrairement à une application mobile et web, une « Voice app » n’a pas recours à la vue et au toucher pour interagir avec vos utilisateurs, mais uniquement la voix. Elle est donc utilisée dans un contexte différent, dans des situations où les mains et la vision de l’utilisateur sont déjà occupées, principalement au domicile ou en voiture (source 2016 Internet Trends Report).

Une Voice app est un service complémentaire à vos services existants et non juste un « copy cat » d’une application mobile ou web.

La perte de repère visuel dans l’interaction avec l’application nécessite un effort cognitif plus important pour l’utilisateur. Ce dernier doit mémoriser en permanence le contexte de la discussion et les informations fournies. Pour faciliter son adoption, une « Voice App » doit être simple, efficace, amusante, et répondre à un besoin précis .

2/ Organiser la discussion

« Une discussion est un processus itératif fait d’échanges interactifs d’informations entre plusieurs personnes » (Wikipédia).

La première étape dans la conception d’une « Voice APP » est de définir ces différentes interactions : « le schéma conversationnel ». Il est primordial d’organiser la discussion et les interactions pour que l’utilisateur puisse obtenir rapidement l’information qu’il recherche.

2.1 Mais où est le menu ?

Quand on visite un lieu pour la première fois, il vaut mieux avoir une bonne carte pour se retrouver et se déplacer sans s’égarer. Le menu de navigation est le guide de vos utilisateurs, problème de taille dans une « Voice app », pas de visuel, donc pas de menu !

Il est donc important de présenter les différentes fonctionnalités de votre application dès la première interaction en énumérant les principaux modes d’interactions de votre application.

Par exemple: une application proposant un service de billet d’avion , la conversation pourra être commencée de la façon suivante: « Bonjour bienvenu sur flyticket pour trouver un vol au meilleur prix . Donnez-moi une ville de départ, une destination et la date de votre voyage et on s’occupe du reste ».

2.2 Limiter les choix possibles

Sans interface visuelle, il faut constamment orienter l’utilisateur. Le plus simple est de poser des questions fermées avec un minimum de choix pour la réponse. Il convient aussi d’être explicite en énumérant les choix possibles à chaque question. Amazon recommande de ne pas proposer plus de 3 choix par question. Il est aussi important d’être extrêmement concis et d’utiliser des mots simples pour que l’utilisateur n’ait pas à faire un effort de mémorisation. Dans le cas où l’on souhaite proposer plus de 3 choix, il est préférable de proposer un choix « plus d’informations » à la fin de votre énumération.

À la question “Trouve-moi un vol paris Nice pour demain matin” la réponse pourra être “j’ai trouvé plusieurs vols pour paris Nice demain matin à 7h30, 8h et 8h35. Le tarif le plus bas est à 8h. Voulez-vous plus d’informations sur d’autres vols ? “

2.3 Des phases courtes

Un des gros problèmes des applications vocales est que le contenu diffusé est le plus souvent destiné à être présenté sur écran plutôt que d’être écouté. Un assistant vocal parle beaucoup plus lentement qu’un humain. Une réponse courte sur papier sera beaucoup plus longue lorsqu’elle est retranscrite vocalement. Un utilisateur sera vite perdu et impatient avec de longues réponses. Vous avez intérêt à faire des phrases courtes (15–20 mots) ne comprenant qu’une seule idée pour maintenir l’attention de vos utilisateurs.

2.4 Relancer la discussion.

Dans une discussion, il est important de prolonger l’échange et de guider l’utilisateur pour qu’il puisse trouver ou découvrir l’information qu’il est venu chercher. Ainsi chaque réponse de votre Voice app doit laisser la possibilité de découvrir d’autres fonctionnalités, par une suggestion ou une question. En revanche, éviter de répondre à une question par une question. Même dans les conversations entre humains, il peut être frustrant de répondre à votre question par une question. Essayez toujours de donner une information utile avant de poser une question à votre utilisateur.

Par exemple àla question « Donne-moi un vol pour paris Nice » l’application pourra demander la date du voyage « le premier vol paris Nice décolle demain matin à 7h30. Quelle est la date de votre voyage ? »

2.5 Guider l’utilisateur

« Ne présumez pas que l’utilisateur sait quoi faire ou ce qui va se passer. »

Chaque réponse, chaque interaction est une occasion pour aider et guider l’utilisateur dans sa recherche d’information. Mais il est toujours compliqué de connaître l’ensemble des fonctionnalités d’une application . Proposer une aide est très utile, voire obligatoire dans une VoiceApp. Si Alexa impose à toute application d’avoir une « intention Aide », il est utile de rappeler comment invoquer cette aide , aux premiers lancements de l’application ou lorsque votre application ne peut apporter de réponse.

3/ Ne pas sous-estimer la complexité du langage.

Pratiqué au quotidien par tous, le langage nous est intuitif et normal. Mais la compréhension d’un élément de langage est extrêmement complexe.

Dans toutes les langues, il existe une multitude de façons de poser une même question. Une application vocale doit appréhender toutes ces différentes formulations en tenant compte, du vocabulaire, de la synonymie, de la construction des phrases, du contexte et même des variations régionales .

Pour fonctionner correctement, vous allez devoir pour chaque « intention » de l’utilisateur définir toutes les questions possibles et toutes les variations autour de ces questions. Ces variations sont appelées des « utterances ». Plus cette liste sera exhaustive, plus le moteur arrivera à extraire le sens de la question. L’intelligence de Google home et Alexa est en fait assez limitée, les moteurs ont besoin d’être nourris par énormément d’informations pour être pertinents.

Même s’il existe des solutions pour générer automatiquement des combinaisons de phrases à partir de plusieurs mots , la définition de plusieurs centaines d’utterance pour une intention est souvent la clé d’une bonne compréhension du moteur.

Pour demander une information sur un vol on imagine facilement les dizaines questions possibles:

•Donne-moi les horaires d’un Paris Nice demain
•Je voudrais faire un voyage au départ de paris Orly à destination de Nice le 30 janvier
•Je cherche un aller simple Paris-Nice début mars
•Trouve-moi le meilleur tarif entre paris et Nice après demain

4/ Conserver le contexte

« Euh rappelle-moi, c’est ton père qu’on cherche ou l’mien ? »(Le monde de Némo, Dory.)

Pour éviter de répéter plusieurs fois la même question, il est crucial de mémoriser les éléments de contexte. On distingue les éléments de contexte non persistant relatifs à la conversation et les éléments de contexte persistant relatifs à l’utilisateur.

En conservant le contexte de conversation, on évite de proposer plusieurs fois les mêmes choix à notre interlocuteur.

Dans notre exemple de vol pour Paris Nice à la question « donne-moi d’autres horaires » l’application ne va pas redemander le trajet et la date de départ.

Le contexte persistant permet de sauvegarder les événements récurrents relatifs à un utilisateur pour engager plus facilement la conversation.

Dans notre exemple si un utilisateur utilise plusieurs fois le service avec le même point de départ le message de bienvenue pourra être plus direct « Bonjour bienvenue sur flyticket, quelle est votre destination ? »

5/ Donner une identité àvotre application

Tous les assistants utilisent une voix de synthèse pour communiquer. Cette solution a ses limites pour retranscrire des dialogues complexes de plus d’une minute.

Pour créer une réelle identité et un attachement émotionnel à votre application, il est préférable d’interagir avec votre « propre voix » avec votre utilisateur.

Il est souvent impossible de se passer de la voix de synthèse de l’assistant si l’application utilise du contenu dynamique. En revanche il est toujours possible d’ajouter un « logo sonore » un ou plusieurs messages de bienvenue , ou de petites pastilles sonores à des moments choisis dans la discussion (aide, relance après un silence ….)

On retrouve ces principes dans les meilleures applications notées sur Amazon.

Pierre-yves CIO @ shirklab

Une idée ? Un projet? Un conseil pour définir une VoiceAPP ? contactez-nous sur www.shirkalab.io.

--

--

shirkaLAB
shirkalab

Notre agence vous conseille, développe et vous accompagne sur les étapes de création de vos applications vocales sur Google Home & Alexa.