Applications conversationnelles : les dessous de la discussion

Marion Wyss
shirkalab
Published in
5 min readApr 21, 2019
© ShirkaLab

Des intentions plus ou moins avouées, voilà ce qui fait une conversation. Des mots plus ou moins précis, leur choix, leur ordre, c’est ce qui leur donne corps.

Mais est-ce que cela suffit à se comprendre ?

Extraire le sens des phrases, comprendre l’intention et le contexte, c’est ce que nous faisons à ShirkaLab lorsque nous concevons des applications vocales Google & Alexa.

Cette question du langage, de l’importance des mots et de comment ils sont énoncés, est fascinante.

Petite revue des règles de bases pour mener une conversation lorsqu’on est une Voice app

Keep it simple, keep it short

Sans support visuel, la navigation dans une skill Alexa ou une action Google Assistant doit être simple, facile, pour pouvoir se déplacer sans s’égarer.

  • Des phrases courtes

Pas plus de 15–20 mots, avec une seule idée par phrase. Les enceintes vocales parlent plus lentement que les humains, ne noyez pas votre interlocuteur avec des mots interminables…

  • Annoncez les règles du jeu

A la première rencontre, présentez les fonctionnalités de votre appli, et ses modes d’interaction.

Bonjour et bienvenue sur Flyticket. Pour trouver un vol au meilleur prix, donnez-moi une ville de départ, une destination et la date de votre voyage. On s’occupe de réserver votre billet.

  • N’ouvrez pas trop de portes

Ne laissez pas plus de 3 choix à votre interlocuteur, et aidez-le à décider.

A la requête “Trouve-moi un vol pour Nice demain matin”, la réponse pourrait être :

“J’ai trouvé plusieurs vols pour Nice demain matin à 7h30, 8h et 8h35. Le tarif le plus bas est à 8h. Voulez-vous plus d’informations sur d’autres vols ?”

  • Relancez la discussion

Tant que l’action n’a pas été accomplie, relancez la discussion en donnant une information utile avant de reposer une question.

A la demande incomplète (sans date) “Trouve-moi un vol pour Nice”, l’application pourrait répondre :

Le premier vol pour Nice décolle demain matin à 7h30. Quelle est la date de votre voyage ?

Marquez la compréhension

De la même manière que nous hochons la tête et murmurons des “hum, hum” au cours d’une conversation, l’app vocale doit être dotée de :

  • Marqueurs temporels

Les marqueurs temporels servent à se repérer dans la conversation. Utilisez par exemple :

“Première question,…”

“Finalement,…”

“Encore une dernière question,…”

  • Marqueurs de confirmation

Les marqueurs de confirmation servent à rassurer l’utilisateur sur la bonne compréhension de son intention.

Explicite : “Vous confirmez votre réservation pour le vol de Nice demain à 7h30 ?”

Implicite : “Ok, je vous ai réservé un billet pour le vol de Nice demain à 7h30.”

L’importance du contexte

Comprendre une information, c’est surtout la comprendre dans un certain contexte. Et c’est qui permettra aux réponses de Google Assistant ou de la skill Alexa d’être les meilleures possibles.

  • Le contexte non-persistant

Le contexte non-persistant est relatif à la conversation.

Il évite de proposer plusieurs fois les mêmes choix à l’utilisateur pour accomplir son action, et est oublié à la fin de l’échange.

Exemple : “Pour ce voyage, j’ai besoin de 3 billets d’avion.”

  • Le contexte persistant

Le contexte persistant est relatif est l’utilisateur.

Il permet de sauvegarder les habitudes pour engager plus facilement la conversation.

Exemple : “Je préfère les vols de nuit.”

La prise en compte du contexte persistant différencie le parcours entre un utilisateur novice et un utilisateur expert. Il permet évidemment d’augmenter l’engagement sur l’application.

Personnaliser la discussion

Nous n’écrivons pas de la même manière à un collègue qu’à un ami parti vivre au bout du monde. Aujourd’hui, on est capable de personnaliser la discussion via 2 biais :

  • La géolocalisation

L’intérêt du partage des données de localisation est immense. Dans le cadre d’un achat de billet d’avion évidemment, mais aussi pour la définition du contexte persistant de l’utilisateur : sur les habitudes locales, la législation, etc.

  • L’account linking

La connexion au compte Google ou Amazon de l’utilisateur, selon les informations partagées (partageables) pourra être une source de données précieuses pour fluidifier la conversation et proposer des solutions plus pertinentes.

Quand on ne se comprend pas

La compréhension n’est déjà pas forcément évidente entre deux être humains qui se connaissent, se voient et se touchent… alors imaginez avec une appli qui n’a ni vue, ni toucher ! Petit florilège des erreurs les plus courantes :

  • Pas de son

Basique, mais aucun son détecté (micro coupé ou défectueux), ou un bruit de fond trop fort (rue, train, pompiers…) empêchent franchement la discussion.

N’oubliez pas de prévoir une réponse dans ces cas-là.

  • La réponse n’est pas dans votre univers sémantique

Soit votre appli ne comprend rien : “Nié”.

Soit votre appli comprend quelque chose, mais cette réponse n’est pas dans la liste des réponses possibles : “Je veux un billet d’avion pour le Japon. Très bien, pour quand ? Je ne sais pas trop.”

Dans ces cas-là, analysez les réponses récoltées, et enrichissez votre schéma conversationnel. En ajoutant des synonymies, ou en élargissant la liste des réponses.

“Le Japon est sublime au moment de la floraison des cerisiers. Voulez-vous y aller au printemps prochain ?”

  • La réponse est correcte sémantiquement mais n’est pas un choix possible pour continuer la discussion

“Finalement, je crois que je préfère aller en Inde”

Positivez l’erreur, et reprenez le lead sur la conversation pour tenter de finir l’action.

“Ah, très bien ! J’annule donc les billets pour le Japon ?”

  • La complexité du langage

Ne sous-estimez pas la complexité du langage. La réponse attendue n’est pas toujours une évidence…

Mille façons d’énoncer une date

Toutes les routes mènent à…

Combien de chemin pour obtenir la même information ? Combien d’entrées dans une conversation possibles ?

Je me souviens, lorsque nous travaillions sur l’appli vocale UGC (tentez “Ok Google, j’aimerais parler avec UGC”), comme nous avons eu le tournis en pensant à tout ce qui pouvait mener un utilisateur à vouloir réserver une place de cinéma.

Bien sûr, il y a le “happy path” : “Ok Google, j’aimerais réserver une place de cinéma, pour voir Shazam en VF demain 17h30 à l’UGC Normandie.”

Trop fastoche. Imaginez plutôt :

“ Ok Google, j’ai envie de voir Shazam.”

“Ok Google, est-ce que Shazam est sorti ?”

“Ok Google, quels films passent au ciné à côté de chez moi cet aprèm ?”

“Ok Google, il me reste 2 places à dépenser à côté de la maison avant dimanche, que suggères-tu ?”

“Ok Google, ça fait trop longtemps que je n’ai pas vu de film…”

Bref, un vrai long fleuve tranquille fascinant…

Vous souhaitez que l’on discute de votre prochaine app vocale ? Réunissez quelques mots ensemble et faites-en un mail : marion@shirkalab.io / https://www.shirkalab.io/

--

--

Marion Wyss
shirkalab

Co-founder of Underlines. We help publishers increase their revenue per reader. Be the referent of reader revenue thanks to our newsletter : tiny.cc/underlines