Transcription audio en texte & moi

Sophie Imbach
Jan 16, 2018 · 4 min read

Depuis un an, j’essaye de sortir de mon silence (silence relatif vu mes acouphènes…). Et j‘essaye différents outils de transcription de la parole : celui par défaut sur les smartphone, tadeo, ava, rogervoice.

Voici un premier bilan après plusieurs mois d’utilisations d’outils de transcription instantanée de la parole. N’hésitez pas si vous en avez d’autres à me proposer je suis toujours partante pour des tests :)

Il va bien falloir qu’un jour je me mette à la langue des signes, mais toutes ces solutions testées me permettent de sortir de mon isolement, alors un pas après l’autre.

Les outils de transcription par reconnaissance vocale.

L’outil que j’utilise le plus est tout simplement celui de mon smartphones (iPhone). Lorsque la lecture labiale est trop compliquée, je place mon téléphone près de la bouche de mon interlocuteur, et je lance “Notes” pour lire au fur et à mesure.

C’est surprenant, de voir mes contacts lancer de fausses discussions sur slack / messenger ou d’autres outils pour activer la reconnaissance vocale alors que Notes fait ça très bien et qu’on peut lire plus facilement.

Je n’ai pas mesuré de grande différence entre la reconnaissance vocale d’iOS et d’Android.

je sais que Dragon est le plus fabile du marché, mais pour du perso, le logiciel par défaut des smartphone suffit amplement.

J’utilise également en mode “perso” Ava ou Rogervoice qui vont compléter mes besoins :

  • Rogervoice pour passer des coups de fils
  • Ava pour discuter à plusieurs

En mode “pro” j’utilise à 90% Tadeo qui est une solution de retranscription manuelle. Lire mon article à ce sujet

Quelle différence entre la transcription automatique et manuelle ?

Le cœur du sujet ! pourquoi ne pas tout faire en retransmission automatique vu les progrès de ces dernières années ?

Beaucoup de choses sont différentes, et c’est souvent l’échange avec les e-transcripteurs qui donne une qualité de communication supérieure

  1. en retranscription automatique, la personne a tendance à se relire beaucoup plus (pour vérifier la traduction), ce qui n’est pas une bête idée au départ) mais cela coupe beaucoup la communication. Ça peut donner une franche rigolade quand l’outil glisse des mots inappropriés, mais en fait ça ne me fait pas tellement rire, ce que je cherche c’est surtout à poursuivre la discussion :)
  2. la retranscription manuelle me donne des informations supplémentaires (par exemple l’ e-transcripteurs va me dire que le ton de la voix de la personne change, ou bien que la personne ne termine pas ses phrases etc.). Un autre exemple, l’ e-transcripteur m’informe des bruits parasites comme un avion qui passe.
  3. le champs lexical de la retranscription manuelle est immense, oui je sais que l’automatique a fait un bond en avant, mais je vous assure, dans mon secteur on a une cargaison d’angliscime et autres acronymes, ils sont au top !
  4. Un seul défaut, c’est qu’ils connaissent toute ma vie pro :) il faut oublier l’intimité dans un échange et voir ces personnes qui écoutent pour nous comme une aide réelle sans jugement. Souvent en rigolant mon interlocuteur au téléphone me dit : ah on est sur écoute !
  5. J’apprécie également quand la personne qui a échangé avec moi remercie le staff de tadeo pour la qualité de la retranscription.

Et donc Ava VS Rogervoice ?

On pourrait penser que ce sont deux concurrents car ce sont 2 applications de reconnaissances vocales.

J’utilise souvent Rogervoice pour appeler ma famille (rarement des professionnels comme un médecin). On peut discuter assez longtemps et je comprends 95% des échanges (si la personne n’a pas d’accent particulier). Son gros point faible pour moi c’est le prix :) et oui si on passe par la ligne téléphonique, c’est payant. Mais je vois mes contacts tellement heureux de pouvoir discuter avec moi (et me raconter en détail leur menu de midi…) que je suis prête à financer de temps en temps des crédits. J’apprécie également la “vibration” du téléphone lorsque la personne parle, ainsi ça me donne une information supplémentaire et je sais quand je peux parler.

A noter : Rogervoice peut être gratuit si la personne installe le logiciel.

Ava j’ai eu beaucoup plus de soucis techniques, mais j’ai pu discuter avec le CEO pour lui faire part de mes retours, et ils sont très à l’écoute.

En terme d’interface, je trouve Rogervoice plus simple à utiliser également.

Je vois des personnes perdre l’audition (pas autant que moi, mais rencontrant des difficultés au téléphone) et je me dis que tous ces outils automatiques vont pouvoir les aider dans les prochaines années.

Maintenant je vais tout vous avouer, que ce soit transcription automatique ou manuelle, ce qui est le plus agréable pour moi c’est lorsque la personne ne lit pas la retranscription. Car même si il y a des erreurs, avec la phonétique ou autre j’arrive toujours à comprendre, et du coup cela coupe moins notre discussion. Alors un conseil quand on utilise ensemble la retranscription, faites semblant de ne pas la lire ;)

Le jour où je pourrais avoir une reconnaissance vocale sans internet ça sera un grand pas ! mais je n’y crois pas du tout, car tous ces systèmes sont dans le cloud.

Toutes les semaines je réponds à quelqu’un qui me dit “tu m’entends ?” : “non je te lis”❤

    Sophie Imbach

    Written by

    Communication @Kaliop. Co-organisatrice des @myaperomtp de @SocialMixCity. Supportrice de @lafrenchtech @FrenchSouthD \o/ #deafgirl