Quer que eu desenhe? Um diagrama das Interfaces Conversacionais

Pedro Hutsch Balboni
Dialograma
Published in
6 min readFeb 10, 2021
Fonte: Kvalifik/Unsplash

Eu comecei a escrever este texto pensando em falar sobre a importância da classificação das coisas pra organizar a informação da maneira mais adequada, até comecei a pesquisar um pouco sobre isso, mas aí mudei de ideia, e resolvi simplificar.

Quantas vezes você já esteve em uma sala cheia de pessoas te olhando enquanto você tenta explicar algo, mas todos partem de lugares tão distintos em suas próprias cabeças que o consenso chega a parecer, por alguns instantes, uma mera utopia?

Bom, eu estive algumas vezes nessa situação, e em várias delas veio aquela voz me lembrando do “quer que eu desenhe”? E às vezes, quando tem algum cantinho pra rabiscar, isso pode ajudar bastante mesmo!

Vou aproveitar pra fazer uma breve digressão antes de seguir com o tema principal, sobre essa coisa de desenhar pros outros entenderem. Isso tem a ver com trazer elementos abstratos, constructos intelectuais, para o plano concreto e compartilhado. Quando você bota algo no papel, na lousa, em algum lugar pra fora de você, passa a existir um novo ponto de referência com o qual todos podem se relacionar. É claro que isso não garante o entendimento, mas é mais uma ferramenta. E qual o motivo desta digressão? Quando me sinto impelido a desenhar algo que estou com dificuldade para explicar apenas usando minha voz, vários dilemas sobre o design de interface de voz surgem na minha cabeça. Calma: pra não misturar as coisas, não estou dizendo que vozes surgem na minha cabeça, mas sim que a dificuldade de explicar algo pra alguém apenas falando é um aspecto constante para um designer que trabalha em uma interface de voz. Chega de digredir, vamos voltar ao tópico.

Numa conversa, é importante saber do que a gente tá falando, tornar evidente, discriminar. Existem alguns tipos de interface conversacional, como um chatbot, uma URA, um Assistente de Voz, etc. O que estou chamando de “Interface Conversacional” aqui? Aquela que acontece em forma de conversa entre máquina e humano. É sério, isso tá até escrito no material do treinamento que a gente aplica para os novos designers.

Pra organizar a variedade de interfaces conversacionais, tanto as de tipos que eu já conheço, quanto as que eu ainda não conheço (uma mágica que a organização lógica dos elementos nos dá a capacidade de fazer), uso dois eixos: se a interface usa elementos gráficos ou não, e se a navegação é estruturada ou não. Vamos por partes.

Se ela possui elementos gráficos é mais fácil de explicar. Um chatbot, por exemplo, é uma conversa, mas em forma de texto. Algumas interfaces de voz podem abrir um elemento gráfico num aplicativo do seu celular, por exemplo, para complementar a experiência. Nossa, mais simples: se for um device como uma caixinha de som que fala com você, e ela tiver luzes oscilando durante a fala, indicando algo, também temos elementos gráficos envolvidos, de forma menos direta. Ou pode ser uma interação usando unicamente a voz, sem nenhum apoio gráfico diretamente relacionado.

Agora, sobre a navegação estruturada, preciso forçar um pouquinho mais a barra com você e pedir a gentileza de que caia na minha. Isso porque, até onde sei, toda interface é de navegação estruturada. Não existe nenhum caminho não mapeado nas interfaces construídas, ainda não aprendemos a realmente construir algo que não seja de alguma maneira estruturado. Então, quando faço dessa diferenciação, pense que “estruturada” se refere a estruturas mais óbvias, com as interações guiadas, como URAs que pedem pra você digitar números específicos para exprimir intenções, ou chatbots que te oferecem opções de botões para que você clique em cima. Quando a interface é, por exemplo, de fala aberta, e você pode ir mudando de assunto a qualquer momento, entra no contexto que estou chamando de interface não estruturada.

Lembra daquela minha digressão ali em cima, no início do texto, quarto parágrafo? Então, é um exemplo de como a interação humana costuma ser uma conversa não estruturada. Se pra gente é difícil acompanhar algumas linhas de raciocínio, imagina pra máquina, que ainda tem aquele cerebrinho mirrado? Inclusive, se quiser conhecer um pouco mais sobre o “cérebro” dessas máquinas, a Letícia Souza escreveu uma série de artigos muito bacanas sobre NLP, vale ler. Fim da digressão sobre a digressão.

E pronto! Temos aqui a diferenciação que forma quatro quadrantes, dentro dos quais a gente pode encaixar tipos de interfaces conversacionais para fazer a classificação. Tá aqui a imagem embaixo:

Bem mais fácil só olhar esse diagrama do que acompanhar todas essas palavras, né? É em situações assim que o “quer que eu desenhe” entra em cena pra ajudar em algumas conversas. E claro, preciso te lembrar que nem sempre a gente pode contar com recursos visuais, como o próprio diagrama mostra. Pois é, o desafio do designer conversacional segue o mesmo que sempre foi desde o primeiro dia de sua carreira: fazer as conversas fluírem da melhor maneira possível, usando as ferramentas que ele tem, para atender as necessidades do usuário dentro de seu contexto de interação com a marca.

(Parênteses: já vi um material da Yasmim com uma categorização um pouco parecida com essa, também vale olhar para conhecer outras nuances possíveis).

Ah, tem um detalhe interessante aqui, uma outra camada, quase outra dimensão, que geralmente não incluo nesse desenho, mas escrevo como tópicos ao lado dele, que é a modalidade de acionamento da interface. Ou seja, qual é a origem da interação?

Basicamente, pode ser uma interface receptiva (como uma URA de um SAC, que atende a ligação feita por um usuário precisando de ajuda), ativa (como um VDA de cobrança, que liga pra gente quando sente saudades) ou contínua (como um Assistente de Voz, que, morando dentro ou fora de nosso celular, está sempre esperando ansiosamente pelo nosso chamado).

Com essa gama de elementos, de traços distintivos, já dá pra melhorar bastante o entendimento sobre que tipo de interface se está conversando. É uma interface receptiva, não gráfica e de navegação estruturada! É uma interface contínua, com suporte gráfico e sem navegação estruturada! Viu? Muito mais fácil do que usar “URA” ou “Assistente de Voz”… só que não.

Mas, apesar de soar mais complexo, as fronteiras são muito mais claras, percebe? Se eu ouvir apenas “Assistente de Voz”, não tenho como saber o que meu interlocutor entende por esse termo, ainda mais hoje em dia, em que ele é tão usado. Não sei, por exemplo, se esse “Assistente de Voz” usa elementos gráficos, ou se utiliza processamento de linguagem natural na interação. Eu posso até inferir, mas não tenho certeza disso. E a falta de certeza aumenta a margem pra dúvida, desentendimento, retrabalho, e várias palavras chatas que a gente não gosta que aconteçam no dia a dia.

Assim, quando a gente tem essas faixas de classificação, acabamos criando atalhos de conexão lógica entre os elementos, conseguimos tomar decisões mais rápidas e assertivas, o que pode trazer impactos positivos sobre uma série de coisas que temos intenção em fazer, principalmente no âmbito da realidade compartilhada com outras pessoas.

Puxa, se você prestou atenção, vai perceber que acabei de fazer um pouco do que disse que não faria ali no início do texto, né não? Imagina só se eu tivesse tirado um tempo pra desenhar esta conversa, e ela tivesse saído deste jeito esquisito que você está vendo, que maluquice que seria…

Até a próxima! o/

Curtiu o texto? Quer trocar uma ideia sobre design conversacional? É só mandar um e-mail pra redacao.xd@mutant.com.br. Se ficou a fim de trabalhar com a gente, aí é só entrar aqui. E segue também o nosso Medium pra saber quando tem texto novo!

--

--