As boas práticas da língua falada em interfaces conversacionais

Adriano Pequeno
Dialograma
Published in
13 min readOct 13, 2020
Fonte: Giphy

Quer ouvir o nosso texto em vez de ler? É só clicar no player abaixo!

Este texto é fruto de um trabalho de longa data, realizado em parceria com Luigi Parrini, dentro do Núcleo de Humanização da Mutant.

Para todos nós, designers conversacionais que trabalhamos com interfaces de voz, há um desafio inerente ao exercício da profissão: a humanização dessas interfaces.

Essa humanização pode possuir diversas facetas, objetivos, modos de fazer e possibilidades de abordagem, mas o ponto central que vai ser discutido aqui é que, além de deixar a interface mais simpática e amigável, ou trazer características da marca representadas na voz, a humanização também pretende (ou deveria pretender) atuar em favor da própria usabilidade da interface, assumindo, assim, um aspecto funcional.

Mas como a humanização pode ser funcional? Qual que é essa funcionalidade?

Bom, antes de tudo, é bastante comum entender o ato de humanizar ou “trazer características de diálogos falados para as interfaces” como uma prática quase desnecessária, acessória, ou até mesmo, para colocar nas palavras de um cliente cujo nome não é válido citar:

“Essa coisa de humanização é pra URA falar português errado”.

Mas parando para pensar um pouco, se o produto final de trabalho do designer, os textos orais em áudio, é de natureza falada, enquanto o seu instrumento de trabalho é constituído pelas fraseologias, os textos escritos, uma parte da tarefa da construção de interfaces de voz passa necessariamente por um processo de “tradução” entre dois universos distintos, o escrito e o falado, integrando assim características comuns aos diálogos ou conversas cotidianas para despertar no usuário a sensação de naturalidade de um papo qualquer.

Adequar os textos escritos à modalidade falada, ainda mais com características dialógico-conversacionais, possui uma função fundamental para os produtos finais, relacionada à intuitividade e à usabilidade das interfaces, preocupações que estão no centro de todo trabalho de UX Design.

Ao utilizarmos diálogos conversacionais nas interfaces, entregamos para o usuário o mesmo efeito que uma conversa comum do dia a dia proporcionaria. Com isso, a necessidade desse usuário se esforçar para entender o que está acontecendo ou de ter de aprender a interagir com a interface tende a diminuir sensivelmente, já que ali constam elementos que, mesmo sendo imperceptíveis ao senso comum, imprimem nesta relação uma espécie de sensação de “conversa”.

Mas pera aí um pouquinho, rapidão… qual que é a diferença entre oralidade, texto escrito, texto falado, dialógico, conversacional e todo esse blá-blá-blá aí?

Em termos gerais, a oralidade é a transmissão oral dos conhecimentos. É uma característica essencial da língua falada, o que não quer dizer que todos os textos orais sejam seus sinônimos. Para entender tal afirmação, basta a gente considerar notícias transmitidas por rádio e televisão, que se caracterizam pela oralidade mas não são faladas, são textos escritos realizados oralmente.

Assim, a gente pode considerar os diálogos conversacionais, a língua falada, como uma interação verbal centrada entre dois ou mais interlocutores — uma conversa, entrevista, debate — em que os participantes compõem o texto de forma colaborativa à medida que a ação é realizada, concepção fundamentada por Mikhail Bakhtin, filósofo e pensador russo.

Uma vez que existem tipos distintos de língua falada, não é difícil imaginar que esta não se diferencia da escrita apenas em relação à substância — fônica, percebida pela audição, ou gráfica, visual — mas também por diferenças de outra natureza.

Para a professora Ângela Rodrigues, entre estas diferenças está o contexto específico de realização: enquanto o ato de escrever constitui algo solitário, e as tarefas de planejar e elaborar o texto são de inteira responsabilidade do autor, a língua falada resulta da tarefa cooperativa de duas ou mais pessoas, num mesmo momento e num mesmo espaço; em outros termos, “é a dialogicidade instaurada pela situação face a face que caracteriza a língua falada”.

Ainda segundo Rodrigues, a fala e a escrita também se separam pelas diferenças nas condições de produção: o planejamento e distanciamento da língua escrita (com consulta a outros textos e possibilidade de revisão) versus a tendência para o não planejamento da língua falada, que mostra todo o seu processo de criação imediatamente.

Essas condições de produção determinam as marcas que vão caracterizar o texto como somente destinado à leitura, uma conversa falada (formal ou informal), um diálogo escrito, um texto oral planejado, e daí por diante, trazendo a identificação, inclusive, do contexto de utilização desse texto.

Para a gente citar exemplos práticos, a repetição de termos é algo considerado condenável na língua escrita (afinal, podemos simplesmente retomar o parágrafo, lendo-o novamente), mas na língua falada informal, além de ser muito comum, a reiteração é um artifício fundamental à compreensão do que está sendo dito.

A utilização dos termos pra (em vez de para), num (no lugar de não) e (redução por aférese de você), as reformulações (“como eu ia dizendo…”) e o ataque à face (“hmm…”; “então…”) são todas características de diálogos conversacionais falados que não são encontradas na língua falada formal, como na defesa de um advogado no tribunal, e muito menos na língua escrita.

Por outro lado, a utilização de clíticos no discurso, como em fazê-lo, é um fenômeno que ocorre na língua escrita, mas que é absolutamente incomum na língua falada brasileira, com exceção de situações muito específicas de formalidade.

Deste modo, na língua existem diversos “tipos de texto”, que variam de acordo com as marcas linguísticas, enunciativas, textuais e discursivas que os identificam e os caracterizam. Se a gente quer que as interfaces de voz emulem textos reais de conversas faladas entre dois participantes, não há nada mais objetivo do que compor estes textos por meio de observação direta, usando como insumo as conversas reais em todas as suas características particulares, principalmente aquelas que as diferenciam dos textos escritos.

OK, acho que eu entendi até aqui, mas como assim as pessoas não diferenciam a língua falada da língua escrita? Não tem nenhum linguista que estuda isso?

Já aviso que esse terreno é bastante pantanoso porque as nuances que diferenciam os textos falados dos escritos não são tão evidentes em análises superficiais. Há uma definição popular para a tarefa dos linguistas, sem autor conhecido, que é muito apropriada para esse caso: “O linguista é aquele que estuda o que as pessoas sabem, mas não sabem que sabem”. Ou seja, os linguistas analisam exatamente as particularidades da fala e dos textos que as pessoas não se dão conta que estão utilizando.

No senso comum, as pessoas não percebem que falam de uma maneira absolutamente distinta de como escrevem e tendem a rejeitar textos que mimetizem a fala. Além disso, há um agravante sociopolítico estrutural que desemboca no que podemos chamar de preconceito linguístico. O preconceito parte da ausência de uma abordagem voltada para a língua falada nos currículos escolares e, desse modo, ou a fala fica apagada ou cria-se uma noção que a oralidade deve (ou deveria) seguir os preceitos da língua escrita.

Isso tudo faz com que as pessoas sequer “abram os ouvidos” para escutar essas particularidades da língua falada. É muito comum na esfera do design de voz, por exemplo, que os clientes, ao receberem textos oralizados, tendam a rechaçá-los, numa ideia simplória de corrigi-los, esbravejando e tratando o designer como analfabeto. (Quem nunca passou por isso, não é mesmo?)

Uma pessoa que transcrever um texto a partir de um diálogo conversacional real qualquer, mesmo que de maneira muito simplificada, vai perceber que aquele produto final textual possui características que não correspondem às normas do padrão escrito.

Toda essa confusão, para sermos justos, é tão comum ao pensamento das pessoas que acompanha a própria história dos campos de estudo da linguagem. As noções de língua, linguagem, fala e texto se confundiam bastante, e a própria linguística só veio a se constituir enquanto ciência moderna quando Ferdinand de Saussure rompe com a tradição da gramática histórica, que realizava estudos comparativos a partir de textos escritos, e lança mão dos estudos baseados na noção de língua enquanto sistema interiorizado, e da fala enquanto realização prática da língua.

Se Saussure plantou essa semente, nas últimas décadas o estudo da língua falada e da oralidade vem recebendo cada vez mais atenção em todo o mundo. Há um interesse crescente por seus métodos e modalidades nos mais diferentes campos de pesquisa linguística, e uma intenção crescente em desvendar seus fenômenos próprios. Eles estão alocados dentro da Análise do Discurso Oral, da Pragmática, da Sociolinguística, e até mesmo ocupam posição central em campos que excluíam a oralidade de seu escopo de trabalho, como a Linguística Textual.

De acordo com a linguista Ingedore Koch, a partir da década de 1980, a Linguística Textual ampliou o seu universo, que até então tinha foco na construção de gramáticas do texto, e passou a girar em torno de uma complexa rede de fatores de ordem linguística, cognitiva, sociocultural e interacional, que levaram a um especial interesse em relação à língua falada.

Com isso, os gêneros discursivos, a perspectiva textual-interativa e questões como o tópico discursivo, turno conversacional, o uso de marcadores e procedimentos de reformulação passaram a assumir uma particular importância, ganhando, na década de 1990, uma projeção cada vez maior tanto na Europa como na América.

No Brasil, este movimento resultou em inúmeros projetos voltados para a descrição da modalidade oral da língua, como é o caso da coleção Gramática do Português Falado e do Projeto NURC — Norma Urbana Linguística Culta — cujos trabalhos constituem uma das principais bases teóricas dos estudos da oralidade.

Tá bom, mas cê tem mais umas dicas práticas de como diferenciar a língua falada da língua escrita?

Eu tenho algumas orientações bem objetivas para diferenciar a língua falada e a oralidade da língua escrita, mas antes, é bem importante frisar que não são (nem de longe) um guia definitivo que estressa todas as possibilidades, pois são fruto de um levantamento feito ao longo de um recorte de tempo e voltado especificamente para interfaces conversacionais.

Além disso, jamais vai servir para utilização em todo o território nacional, pois enquanto linguista tenho o dever de informar que as variações dialetais (geográficas, etárias, sociais, culturais, etc.) são absolutamente determinantes e sensíveis aos produtos da fala. Então, fica aqui o combinado que as orientações a seguir são oriundas de observações feitas em diálogos ocorridos em São Paulo, entre homens e mulheres de diversas idades, classes sociais e hábitos culturais, colhidos entre os anos de 2017 e 2020.

Bora lá!

  • Treinar a escuta e ler os textos em voz alta
Leia o seu texto em voz alta!

Antes de tudo, independente do arcabouço trazido pelos estudos linguísticos, a melhor ferramenta (e talvez única) que exista para realizar essa tradução do escrito para o falado é a escuta. Até porque estes mesmos estudos linguísticos descritivos chegaram ao nível atual somente por conta do método de observação direta, que é basicamente escutar, anotar de forma padronizada e tirar conclusões posteriores.

Só que escutar não se trata simplesmente de ouvir passivamente, mas de ouvir com atenção e trazer um julgamento crítico voltado para avaliar o grau de naturalidade do enunciado que foi escutado.

Ao ler em voz alta, principalmente os próprios enunciados escritos para a interface de voz, é possível escutá-los para fazer uma primeira avaliação do quanto aquilo se assemelha a um enunciado real cotidiano. Gravá-los para conseguir ouvir várias vezes é melhor ainda para conseguir fazer um decupagem trecho a trecho.

Trago abaixo um exemplo prático, extraído de uma URA de telefonia, de um percurso de adaptação dos textos escritos à língua falada. Na sequência, cada caso será comentado.

T1: Resolverei a situação, mas para tal, é fundamental que a pendência financeira seja quitada o quanto antes.

T2: Eu vou resolver sua situação, mas pra isso, é fundamental que a pendência financeira seja quitada o quanto antes.

T3: Pra eu resolver o seu problema, é muito importante pagar a conta atrasada o quanto antes.

T4: Então… Pra eu resolver o seu problema, é muito importante que você pague logo a conta atrasada.

  • Marcação pronominal na maioria dos enunciados

Nos exemplos acima, há dois casos de marcação pronominal que merecem ser observados. O primeiro deles está no T2 em relação ao T1 (Resolverei x Eu vou resolver) e o segundo se encontra no T4 em relação ao T3 (É muito importante pagar x É muito importante que você pague).

Diferente da escrita, em que a utilização dos pronomes é vista pelos gramáticos prescritivos como redundância, na fala os pronomes pessoais estão por toda parte no português brasileiro.

Nesse caso, como os preceitos da norma da língua escrita vêm do português europeu, que tanto na fala quanto na escrita possui uma tradição de flexionar os verbos de acordo com a pessoa em todos os casos (Cá estou; Foste à padaria?), os pronomes, sobretudo os pessoais, tornam-se de certa maneira dispensáveis ao discurso.

O sistema do português brasileiro falado opera de modo diferente, já que há uma padronização maior na flexão verbal (tu vai, você vai, ele vai). Assim, é muito comum a utilização reiterada, como no exemplo abaixo, extraído de um call center:

“Ó, senhora, eu vou te ensinar o que você tem que fazer pra você acessar o nosso portal que tem as informações, tá? (…), não vai ter nenhuma dificuldade. É só você abrir o seu navegador (…), daí vai ver a barra de endereço lá em cima, e você bota lá www...com.br, aí você dá o enter. Daí você… já vai aparecer pra você a nossa página na tela e é só você ir no botãozinho informações gerais, à sua direita em cima, pra você navegar lá e você ter acesso às informações completas que eu tava te passando (…)”.

No trecho acima, há ainda a se observar a utilização dos pronomes possessivos (o nosso portal; seu navegador; à sua direita), que também são utilizados com uma frequência altíssima na fala (sobretudo, acompanhando os artigos), como também é demonstrado nos exemplos sua e o seu em T2 e T3.

  • Futuro perifrástico versus futuro sintético

Como aparece em T2 em relação a T1 (Eu vou resolver x Resolverei), a utilização do futuro perifrástico (locução do verbo auxiliar ir flexionado no futuro + o verbo principal no infinitivo) é um dos casos mais sensíveis à oralidade. Basicamente, na fala cotidiana só utilizamos o futuro sintético em contextos muito específicos, como em julgamentos, discursos oficiais ou situações que exigem uma absoluta solenidade.

Assim, para perceber esse fenômeno, basta ler em voz alta alguns pares de casos para que você perceba por si só:

Hoje, eu farei o almoço mais tarde x Hoje, eu vou fazer o almoço mais tarde

Aguardará pelos resultados x Ele vai aguardar pelos resultados

Você fará o procedimento sozinho x Você vai fazer o procedimento sozinho

  • A priorização das variantes lexicais utilizadas na língua falada

para > pra
fundamental > importante
para tal > pra isso
pendência financeira > conta atrasada
seja quitada > pague
o quanto antes > logo

Um dos pontos mais importantes ao se desejar imprimir o efeito de “língua falada” em um texto é a seleção lexical. Quando utilizamos a fala, em contextos informais, tendemos a priorizar formas coloquiais que costumamos evitar a todo custo em contextos escritos, como ocorre com a locução pronominal a gente em detrimento de nós.

Como se pode observar na evolução de T4 em relação a T1, os termos para, fundamental, para tal e o quanto antes foram substituídos progressivamente por pra, muito importante, pra isso e logo, que trazem mais naturalidade ao texto final, uma vez que são aqueles mais usuais na língua falada.

Dois exemplos específicos que valem ser ressaltados são pendência financeira (T2) e seja quitada (T3). É bastante comum que as empresas tenham apego a expressões técnicas como essas, já que usam cotidianamente em suas rotinas de trabalho. No entanto, esses termos só trazem sensação de naturalidade para quem os utiliza cotidianamente, ou seja, o próprio cliente (mas não o cliente dele, o usuário final).

Os termos específicos precisam ser substituídos por outros mais adequados à compreensão de toda uma gama de usuários finais, como demonstrado em T3 (conta atrasada) e T4 (pague). Essas substituições melhoram, inclusive, a própria acessibilidade da URA, e os melhores termos podem ser selecionados de diversas maneiras, como por testes A/B, que avaliam a aderência dos públicos finais a esses termos.

  • Utilização de marcadores conversacionais e discursivos

Como ocorre no exemplo de T4 em relação a T3 (inserção de Então…), os marcadores discursivos e conversacionais não desempenham papel semântico na frase, ou seja, eles não possuem significado, mas isso não quer dizer que eles não alterem a significação comunicacional dos enunciados.

Hudinilson Urbano, em “Estudos de Língua Falada”, define marcadores conversacionais e discursivos como “elementos de variada natureza, estrutura, dimensão, complexidade semântico-sintática, aparentemente supérfluos ou até complicadores, mas de indiscutível significação e importância para qualquer análise de texto oral e para sua boa e cabal compreensão”. Esses elementos incluem redundâncias, repetições, reformulações, titubeios, gaguejos, pausas, entre outros.

De acordo com o linguista Luiz Antônio Marcuschi, os marcadores posicionam-se, de modo geral, antes ou depois de unidades conversacionais e normalmente encerram, continuam ou introduzem uma unidade, trazendo esse efeito de fluidez, colaboração entre participantes e continuidade aos diálogos. Para ele, os marcadores desempenham funções mais genéricas (articuladora e estruturadora) e funções mais específicas (monitoramento, busca de aprovação, sinalização de hesitação, de atenuação ou reformulação, bem como da intenção de asserir ou perguntar). São exemplos muito encontrados, segundo o autor:

  1. de hesitação: ah, ah ah, ah ahn, eh eh; alongamento de vogais; pausas longas
  2. de teste de participação ou de busca por apoio: sabe? né?, não é?, tá?, certo?
  3. de atenuação da atitude do falante: então, tá bom, eu acho que…, eu tenho a impressão de que…
  4. de apoio ou de monitoramento do ouvinte: ahn ahn, uhn uhn, sei!
  5. de reformulação: como eu ia dizendo, ah! só pra lembrar…

Os marcadores valem como estratégias muito válidas para a composição de diálogos conversacionais, pois além de trazer uma sensação de naturalidade, eles principalmente servem para organizar o texto de acordo com duas funções: função interpessoal e função ideacional. Os marcadores interpessoais servem para administrar os turnos conversacionais, delegando a continuação do turno para cada um dos falantes, enquanto os marcadores ideacionais são acionados por esses falantes para a negociação do tema e seu desenvolvimento, conforme elucida o linguista Ataliba Castilho.

Legal, então é isso? Se eu fizer essas quatro coisas, os meus textos vão ficar mais “falados”?

Bom, como eu já disse, esses são apenas lampejos de boas práticas voltadas à tradução de textos escritos para textos falados. Mas só essas quatro atitudes ainda estão muito distantes de abarcar em extensão todas as características da língua falada.

A gente espera que tenha ficado claro o potencial funcional das atividades voltadas para humanização, para que ela deixe de ser enxergada apenas como um “floreio”.

Além disso, esperamos muito que essas boas práticas auxiliem os designers de interfaces de voz a refletir e, sobretudo, a entregar a melhor experiência possível ao usuário, mesmo que ele não se dê conta de forma consciente em que essas propostas auxiliam na inteligibilidade, na usabilidade e na intuitividade das plataformas.

Um beijão!

Outro pra você!

Curtiu o texto? Quer trocar uma ideia sobre design conversacional? É só mandar um e-mail pra redacao.xd@mutant.com.br. Se ficou a fim de trabalhar com a gente, aí é só entrar aqui. E segue também o nosso Medium pra saber quando tem texto novo!

--

--

Adriano Pequeno
Dialograma

Linguista, ator e designer conversacional. Um verdadeiro vira-lata.