Um robô deve se passar por humano?

VUI.BR
VUI.BR
Published in
6 min readNov 25, 2021

A comunicação interpessoal é algo muito complexo, que envolve inúmeras possibilidades e formas de acontecer. A cada comunicação nos desgastamos a fim de fazer com que o outro interprete da forma como desejamos e, caso não aconteça, desdobramos o diálogo a fim de atingir tal objetivo.

E quando a comunicação se dá entre homem e máquina?

Administrar a ilusão de um intercâmbio de ideias, no intuito de obter sucesso é um desafio, mas faço parte do time que batalha diariamente para conquistar a satisfação do usuário, através de experimentações e melhorias no fluxo conversacional entre robôs e humanos, buscando a melhor usabilidade nas interações através do reconhecimento da fala.

No entanto, e graças à infeliz herança do estigma que os primórdios das URAs e seus limites tecnológicos deixaram para a sociedade, onde dificilmente encontraremos uma pessoa comum satisfeita ao saber que do outro lado da linha se encontra um “computador”, esperamos que, para uma parcela significativa da população brasileira, reverter a indignação sobre as chamadas “gravações chatas de robôs”, também será um desafio a ser superado.

Mas, e quando essa interação se dá de forma tão humanizada que poderia se passar facilmente por um humano? Devemos permitir que o robô omita sua verdadeira essência, e testar o limite da percepção do usuário?

Claro que não! Além de antiético, ninguém gosta de ser enganado.

Sem contar que a voz amiga e “humanizada” do outro lado da linha poderá retornar frases para o usuário que não diz respeito nem ao fluxo nem aos questionamentos do usuário, uma vez que esse robô vocalizará uma gama de tratativas de erros, colocando a situação na ordem do solilóquio, gerando estranhamento por parte do usuário que se perguntará, inconsciente ou não, “como essa voz simpática não escuta ou não leva em consideração o que estou dizendo?”

Apostar que é válido esperar o usuário chegar ao ponto em que precisa perguntar no telefone se está falando com um robô não parece ser um caminho inteligente. Esperar que o usuário tenha expectativas que não serão sanadas, esperar que ele teste seu interlocutor a fim de uma confirmação sobre sua exata compreensão pode ser tarde demais. Qualquer interação criada para resolver alguma questão já terá falhado nesse momento.

Permitir que o robô finalize com um “tchau” ou transferindo para um humano, por culpa do reconhecimento da fala, que não deveria fugir do caso de uso em questão, é assumir o insucesso e o custo que o atendimento humano cobrará por ter de arcar com a frustração desse usuário, além de alimentar o estigma de que robôs são gravações não muito inteligentes e um tanto chatas.

Além das questões levantadas acima, existem outros pontos de extrema importância quando o tema é interação por voz a partir do reconhecimento da fala.

No mundo dos agentes/atendentes virtuais, fazer ou receber uma ligação com o usuário precisa ter pequenas, porém importantes, preocupações estudadas. Por exemplo, é importante ter consciência a respeito do impacto e das diferenças entre um agente virtual ativo e um receptivo, onde o primeiro liga para o usuário, enquanto o segundo espera o usuário ligar.

Designers, vamos permitir mesmo que o usuário tenha que dizer frases como: “Me perdoe, mas por você ter me chamado, não seria educado você me falar o seu nome?”

Em termos gerais, quando pensamos em chamadas por telefone, acreditamos na convenção que prega que a pessoa que fez a ligação é aquela que tem por educação a obrigação de se apresentar. Portanto, se é um robô fazendo essa chamada, ou seja, um agente virtual ativo, é fácil defender que ele deve se apresentar como tal, e seguir a interação com a competência que lhe foi atribuída. Uma vez que seu interlocutor não terá escolhas e terá que aceitar a interação com esse robô, se quiser permanecer na linha durante toda a interação.

Se a pessoa souber só depois que falou com uma máquina, poderá se sentir desconfortável. Não devemos permitir que a pessoa do outro lado da linha passe por esse desconforto

E se for o contrário: O usuário ligando para uma central de atendimento? O robô tem carta branca para omitir sua inexistência de carne e osso? Obviamente não! Vou justificar esse ponto de vista com dois motivos que deveriam ser suficientes para qualquer profissional de VUI não precisar temer a transparência da automatização dos atendimentos.

- Primeiro, o interlocutor jamais deve ser deixado na incerteza sobre quem está do outro lado da linha, e isso inclui não só o seu nome, mas também sua posição e, se possível, suas limitações na conversa. Mas só o fato de ser extremamente rude assumir a postura desagradável que é receber o usuário anonimamente, já garante qualquer decisão que um designer possa tomar.

- Além disso, como a tecnologia de reconhecimento de fala espera que as falas do usuário ao robô sejam classificadas em alguma intenção já pré-definida pela equipe que desenvolve esse robô (seja essa predefinição Gramática ou NLP), permitir (através do descuido com a forma de interagir com esse usuário) uma falsa verdade sobre a realidade da pessoa por trás da voz humanizada é o principal fator de uma interação sem sucesso, devido aos impactos negativos no reconhecimento de fala que certamente surgirão.

Nesse aspecto, uma série de armadilhas ou falhas na interação podem ser previstas e evitadas com antecedência antes de chegar ao usuário final. Se passar por humano e, por consequência dessa negligência, deixar o usuário falar o que quiser, com prelúdios, floreios e contextualizações antes de abordar o foco do motivo da ligação ou da objetividade do caso de uso, impacta negativamente no reconhecimento da fala, afeta o reconhecimento por NLP ou gramática, faz com que, ou o usuário se frustre e se irrite ao ponto de perguntar se fala com um robô, ou o robô chega no seu limite e intima o usuário com a desculpa de que não foi dessa vez que puderam ter uma conversa, pois, dirá o robô: “Eu não entendi mais uma vez o que você quis me dizer”.

Acredito que seja tão importante apresentar-se no início de qualquer interação por voz em uma ligação, quanto desenhar uma interação onde o sistema se mostra amigável, receptivo, acolhedor e objetivo.

Só assim, quando o usuário tiver o direito de saber com quem fala abertamente logo no início, evitaremos que esse mesmo usuário não perca tempo fazendo comparações do sistema automatizado com um interlocutor humano, nem classificando toda interação desse tipo como inferior.

E as grandes empresas, o que pensam sobre isso?

A primeira demonstração do Duplex, onde os atendentes de um salão e um restaurante acreditaram estar falando com um humano e não com um computador, levantou muitas críticas e questões éticas sobre os usuários terem ter o direito de saber se é um robô ou um humano do outro lado da linha.

Um representante do Google falou ao The Verge sobre essa questão, onde afirmou que o Duplex irá informar para a pessoa do outro lado da linha que ela está falando com uma máquina: “Estamos projetando o recurso com divulgação embutida e nos certificaremos de que o assistente seja identificado adequadamente. O que mostramos no I/O foi uma demonstração inicial da tecnologia”.

Portanto, quando se tem em mente que o objetivo de um agente/atendente virtual é falar com os humanos da maneira mais natural possível, a confiança em se apresentar como uma máquina tornará a interação, além de honesta, mais assertiva. Além disso, não há necessidade de contemplar as mesmas capacidades que os humanos. Apesar de entusiasta, preciso confessar que isso soa utópico e precipitado.

Se nós, de uma vez por todas, entendermos que o caráter de um sistema é abordar o técnico de forma humanizada, sem a finalidade de resolver os problemas particulares e necessidades de escuta dos usuários, deixaremos de, não só ter problemas com as máquinas na hora do reconhecimento, mas também educaremos a população a acreditar que, de fato, os robôs podem sim ser pragmáticos, úteis e funcionais.

Publicado originalmente em 30 de outubro de 2018, por Sueliton Ribeiro

--

--