WozTester vos applications vocales !

shirkaLAB
shirkalab
4 min readMar 25, 2019

--

Les promesses des interfaces vocales sont immenses. Pour autant, tout n’est pas encore parfait. En toute honnêteté, la fluidité des dialogues n’atteint pas encore un niveau de qualité suffisante. Les actions Google et les skills Alexa sont souvent conçues autour d’un scénario préconçu par son créateur et sont très loin d’un véritable dialogue entre un humain et une machine.

Créer une interaction vocale s’avère beaucoup plus compliqué qu’il n’y paraît à première vue. On ne sait jamais à quoi s’attendre, il n’y a pas de règle, aucun repère et une application vocale ne peut se limiter un ou deux scénarii.

« Nous ne sommes pas nos utilisateurs », c’est le principe de base que devrait appliquer tout designer d’application. Nous n’avons pas tous le talent de Steve Jobs non plus. Il est impensable de designer un produit en se basant juste sur sa propre intuition.

Il est indispensable d’éprouver son application auprès de vrais utilisateurs en conditions réelles afin de comprendre exactement la manière dont ils se servent de l’application. Idéalement il faut intégrer ces tests au plus tôt dès la phase de conception pour éliminer les cas d’erreurs et identifier les scénarii non prévus nécessitant des développements importants.

Lorsque nous avons développé une application de réservation de place de cinéma pour une célèbre enseigne (UGC pour ne pas la citer), nous avions bien sûr effectué quelques tests mais nous étions loin d’imaginer la créativité des utilisateurs. Difficile d’anticiper que l’on veut voir un film « après l’apéro », « sur les champs » « à côté de chez moi » « la semaine prochaine à la même heure ». La mise en place d’une vraie session de tests dès la phase de conception nous aurait épargné des allers et retours avec les équipes de développements pour modifier le schéma conversationnel de l’application.

Mais comment tester l’efficacité d’une application qui n’a pas encore été développée ?

Il existe une solution « Le prototypage Wizard of Oz ». Ce concept de prototypage est attribué au Dr Jeff Kelley, expert en ergonomie, qui s’inspire de la scène du film Le Magicien d’Oz dans laquelle Toto le chien tire un rideau pour révéler que le sorcier est en réalité un homme actionnant les boutons d’un automate. Cette « supercherie » de bas niveau encourage les comportements naturels et facilite les interactions.

Pour être efficace, le prototype doit avoir les caractéristiques suivantes :

• Il doit être fonctionnellement proche du produit fini pour couvrir tous les cas d’usages.

  • Il doit être suffisamment flexible, interactif et réaliste pour interagir avec des utilisateurs : l’effet « Wizard of Oz ».
  • Il doit pouvoir enregistrer les sessions de tests. Non seulement le transcript de la conversation mais aussi l’enregistrement sonore de la discussion. Les hésitations, les blancs sont des indices et des indicateurs qui peuvent en dire long sur la compréhension.

La solution la plus simple consiste à préparer l’ensemble des prompts dans un fichier texte, de simuler un dialogue en jouant le rôle de l’assistant et d’enregistrer la discussion. Si cette solution a pour elle sa simplicité de mise en œuvre, elle est peu réaliste. L’utilisateur va adapter son discours à son interlocuteur et l’ensemble des échanges ne refléteront pas un dialogue entre une personne et un assistant.

Pour éviter cet écueil, il est possible de faire « lire » les prompts en utilisant un moteur de synthèse vocale. On se rapproche plus de la réalité et on est obligé de suivre le scénario écrit à l’avance. En pratique, il est quasiment impossible d’être suffisamment réactif pour simuler une discussion. Surtout si des éléments de dialogue reprennent une partie de la réponse de l’utilisateur. Il faut alors compléter en live le dialogue et refaire lire ce nouvel élément de discussion au moteur de synthèse vocale.

Le WozTest by ShikaLab

Fort de ce constat, nous (shirkalab) avons développé notre propre interface, suffisamment flexible, interactive et réaliste pour que l’utilisateur ai vraiment l’impression d’interagir avec un assistant.

Cette interface très simple permet de construire les différentes étapes du dialogue « les prompts des intentions ». Ces prompts sont modifiables avec un simple clic en fonction des éléments de réponses prédéfinis de l’utilisateur.

Interface de Woztesting

La lecture des différents prompts est instantanée, le dialogue est fluide sans intervention humaine « visible » l’effet Wizard of Oz.

Retranscription de l’échange

Pour analyser les résultats, l’application permet non seulement d’enregistrer le fichier son de la discussion, mais aussi de générer automatiquement la retranscription de l’échange.

LaShirkaBox

Pour accentuer l’effet de magie, l’interaction est réalisée avec la « shirkaBox » une petite boite contenant une enceinte connectée et des micros bluetooth.

Le magicien (l’opérateur réalisant le test) et l’ordinateur pilotant la shikaBox n’ont pas besoin d’être dans la même pièce, laissant l’utilisateur seul devant cette enceinte mystérieuse. L’illusion est alors parfaite !

--

--

shirkaLAB
shirkalab

Notre agence vous conseille, développe et vous accompagne sur les étapes de création de vos applications vocales sur Google Home & Alexa.