#2 Legal, fui contratada como VUI Designer. (pausa dramática) E AGORA? - Como comecei?

Janaína Pereira
11 min readDec 22, 2020

--

Agora? Usa o prompt (áudio) específico de repetição nas explicações/passo-a-passo, teste tudo o que puder e acumule repertório até aprender a técnica, como toda profissão. Crie sua caixa de ferramentas e estude outras existentes, um dia de cada vez 😉

Imagem animada tipo gif de uma cena do filme O Diabo Veste Prada. A atriz Anne Hathaway aparece no centro vestindo uma regata verde, um colar de pingente circular, cabelos batendo no busto e de franja. Ela está em um comodo de paredes brancas que está desfocado ao fundo, diz "OK" para alguém que não aparece na imagem e mantém o sorriso no rosto.

Essa é uma série de artigos que montei para falar sobre VUI Design e a minha trajetória profissional. 😬 Se você chegou aqui sem ler o primeiro, onde explico como tudo isso começou e qual formato adotei para as publicações, recomendo que volte ao menu ant…. NÃO, NUNCA VOLTE AO MENU ANTERIOR ❌

Lição aprendida número 5: o que você pode chamar de menu, por exemplo, pode ter outra etiqueta do ponto de vista do usuário. Além disso, as metáforas que se referem a movimentos (“voltar”, “retornar”, “vou te levar de volta” etc) não fazem sentido algum em uma conversa, afinal, como ela é uma interação tipo "task success", independente de ser uma compra, consulta, transação ou informativa, já é esperado que ela vá pra frente, pois cada mensagem transforma o entendimento do emissor e do receptor. Pode partir de um ponto do passado se for baseada em dados comportamentais, claro, mas nunca voltar pra algum ponto que o usuário não saiba com exatidão qual é. Avançar é o caminho, mesmo que mude o contexto.

Comece pelo início da série que você chega nesse artigo de novo, não se preocupe 😉

💬 🔑 palavras-chaves: #primeirosaprendizadosdejr #voltarparaomenuanterior #designdeinteracao #GUIvsVUI #PrincípioDeParetoOitentaVinte #UX #ArquiteturaDaInformacao #documentacaoSPEC #LerEmVozAlta #CompartilharDialogoComAlguem #PreconceitoLinguistico

Quando há uma conversa, eu não volto, tu não voltas, você não volta, nós não voltamos… REPASSEM! 🙏

Imagem animada tipo gif. Uma criança branca vestida com um lençol branco e toalha vermelha no cabelo está olhando para a câmera e balançando um chocolate da marca Garoto chamado Batom para dar a ideia de hipnose.

Entendo que a vontade de colocar a função "voltar" nas VUIs venha de experiências com interfaces visuais. Eu dei essa sugestão em um dos meus primeiros designs de 2012 e aprendi MUITO com esse erro. Já ouviu falar nos Dark Patterns de design? É a usabilidade do mal! 🤢 Eu não conhecia a expressão na época, mas é tipo isso.

Por mais que tudo depende quando se fala em design, há um limite!

Eu não fazia testes com o usuário (infelizmente!), comecei pedindo para outros VUIs fazerem esse papel — e nem tinha pensado no viés de serem usuários heavy users e/ou pessoas que já conhecem os bastidores do projeto. Mesmo assim, foi bom para mim, para os projetos e para os colegas de profissão também porque trocamos figurinhas sobre o processo de design. Ana Suzigan, Cláudio Bastos, Fausto Sposito e Yasmim Costa contribuíram com meus dilemas de JR. Obrigada, pessoal, e não fiquem com raiva de mim pela foto tirada na câmera VGA que eu tinha😬

Foto com quatro pessoas sentadas em uma mesa de boteco e posando para uma foto que eu tirei. Todas estão sorridentes. Da esquerda para a direita, Ana Suzigan é uma mulher branca, cabelo curto liso, no alto do pescoço, e está de blusa de frio azul. Ao seu lado, Yasmim Costa é uma mulher negra de cabelos longos ondulados que está de blusa de frio preta. Na frente dela, Fausto Sposito é um homem branco, cabelo curto liso, está de camiseta branca, possui barba e bigode e está segurando o celular. Ao seu lado, Claudio Bastos é um homem negro, cabelo curtíssimo, barba volumosa e está de blusa de frio azul. Na mesa possuem alguns pratos, copos, salgadinhos e guardanapos.

Existe um artigo na InformIT publicado em 2002 (!) que já dava pistas sobre a falácia da pura e simples reprodução de experiências em mídias e interfaces diferentes. Ele é simples e explicativo, então, não vou me estender muito na questão.

Além dessa fonte (e outra que você vai encontrar no final da página), sempre tínhamos um documento de “defesa de design” que falava sobre isso para os gerentes de projeto usarem em reuniões com o cliente, foi um dos primeiros do departamento da empresa que eu li. Disseminar o conhecimento pelo time é um papel do designer também.

Mas já participei de um projeto que não teve jeito: o cliente exigiu a (pseudo)opção “Voltar ao Menu Principal”. Por mais que eu tenha argumentado com base em tudo isso e levado um diálogo gravado exemplificando o que esse design causa, saímos da reunião com uma data de homologação do projeto. O que fiz pra chegar num meio termo e não ficar tão ruim foi montar um texto explicativo, mais longo para a opção, e que assumisse que a Persona já tinha dito isso. Algo nessa linha: “Agora, se você precisar falar de algum outro assunto que não seja [opcao atual], posso repetir o que falei no início da conversa, aqueles outros assuntos que já conheço, e você escolhe pra qual deles precisa de atendimento. É só digitar X que eu retomo todos.” 😰

Olha A volta que eu tive que dar…O projeto entrou em produção e não teve o retorno esperado…

Lição aprendida número 6: Se precisamos "voltar" nas interfaces de voz, o design precisa ser revisto porque não apresentou a interação e as possibilidades adequadas.

Tô sendo incisiva aqui porque, realmente, não vi funcionar nesses anos todos, mas fiquem à vontade para compartilharem experiências positivas e/ou discordarem!

Por falar nisso, é importante ressaltar as diferenças entre GUIs (interfaces gráficas) e VUIs (interfaces de voz) 🤔

Imagem animada tipo gif. O personagem mexicano Chapolin Colorado está sentado na frente de uma máquina antiga de gravações telefônicas escutando uma conversa. Ele fica animado com o que escuta. Dois outros personagens observam Chapolin bem atrás da máquina, estão de pé.

Pois é! Essa questão era recorrente no meu primeiro ano como VUI Designer. E a cada mudança ou intersecção nos dois tipos de interface, volto a me questionar.

Gosto M-U-I-T-O dessa matriz que conhecemos no primeírissimo meetup de VUI em Abril de 2019 através da apresentação da parceirona YahDuc antes mesmo do multimodal em interfaces por voz ser sonho de consumo das marcas no Brasil:

Matriz que relaciona interfaces cconversacionais e não-conversacionais com interações por áudio e por imagem e situa exemplos de interfaces nos cruzamentos dessas características. Criada pela diva eterna YahDuc.

Além de pensar nessas relações sugeridas por ela, podemos elencar algumas diferenças interessantes.

Em conversas por texto:

  • A falta de instantaneidade na interação por parte do usuário, o que gera um certo "silêncio", pode ser parte da experiência, pois a pessoa está revendo o que a interface conversacional apresenta na mensagem antes de prosseguir;
  • O histórico da conversa permanece na tela;
  • Pode-se listar um número extenso de opções;
  • Admite-se algum grau de formalidade, sempre de acordo com o tom de voz da marca;
  • Se necessário, pode contar com os dois sistemas funcionais do cérebro, tanto o de longo prazo (mais utilizado em aprendizagens, como, entender a diferença entre boleto e fatura) quanto o de curto prazo (já saber onde fica o botão Power do controle remoto ou andar de bicicleta, por exemplo).

Vou parar aqui porque já consigo criar um raciocínio, mas há muitos outros aspectos. Vale o exercício, se quiser continuar (compartilha com a gente nos comentários!) 😉

Por voz, isso muda:

  • O “silêncio” por si só já é uma resposta que deve ser considerada no desenho. O ideal é que o usuário já saiba o que fazer para prosseguir no seu turno assim que ouvir a interface;
  • O histórico da conversa é totalmente diluído na memória de curto prazo. Caso o usuário se perca, ele vai expressar esse comportamento ficando em silêncio, abandonando a interação ou pedindo ajuda para a interface de voz;
  • Quanto mais opções disponíveis, mais o usuário tem que pensar. #LeiDeHick manda vários beijos nesse quesito;
  • A formalidade inibe a empatia que se precisa para iniciar uma conversa por voz, exceto se você for fazer algo totalmente exclusivo para um ramo que precise intrinsicamente de termos técnicos e de uma persona com vocabulário mais controlado, por exemplo —e ainda assim precisa ser conversacional e parecer humana;
  • A memória de curto prazo é a única com a qual podemos contar nesse tipo de interação para obtermos sucesso, porque o fardo cognitivo, ou seja, trabalho mental para acompanhar com qualidade o que está sendo proposto na interação, tem que ser combatido o máximo possível.

Lição aprendida número 7: é importante testar se as ideias e conhecimentos que adquirimos trabalhando com interfaces A e B funcionam na C. E vice-versa. No final, estamos entregando conteúdo interativo POR MEIO da interface, e não ela em si.

Precisamos falar mais sobre design de interação pra depois chegar nas escolhas de interfaces, na boa! 😅

Imagem animada tipo gif com dois personagens da tirinha Peanuts/Charlie Brown e Snoopy. Patty, uma garotinha de cabelo ruivo até a altura do ombro, está vestindo uma camisa listrada verde, uma calça preta com uma lista branca ao lado e chinelos verdes. Ela está pendurada na maçaneta de uma porta para tentar abri-la usando o máximo de força que puder puxando-a pra fora. Charlie Brown passa por ela e a empurra para dentro fazendo com que a porta se abra facilmente. Patty respira fundo demonstrando decepção consigo mesma.

Quem já estudou ou leu sobre a evolução de interfaces digitais viu que os softwares passaram pelas interfaces de linha de comando (CLI ou ILC), foram para a gráfica (GUIs) com tridimensionalismo, esqueumorfismo, material design etc, chegaram nas conversacionais e apresentam experimentações e cases com zero UI, como a loja Amazon Go. E se você parar pra analisar só um pouquinho, vai ver o quanto A INTERAÇÃO também mudou por causa dos novos componentes das interfaces.

E é a natureza da interação, considerando suas limitações, especifidades e vantagens, que deve ser o guia do designer, não a interface em si. 🤩

Lição aprendida número 8: há dois caminhos possíveis para tangibilizar as soluções de design conversacional: desenhar aquela que for ideal e podá-la do ponto de vista de tecnologia e negócios ou começar levantando os limites que a solução terá e partir para o desenho. O importante é pensar em qual interação vai funcionar antes de dizer se vai ser só áudio (voice only), áudio funcionando como interface principal contando com apoio de imagens (voice first) ou áudio como funcionalidade adicional (voice added).

Desabafo rápido, mas tô bem cansada do "vamos começar o brainstorming de solução" sem considerar em qual tipo de interação o usuário pode ter uma taxa de maior de sucesso. Claro que o tripé de UX (usuário, negócio e tecnologia) precisa entrar num acordo ao definir o que é possível naquele momento, mas para chegar na humanização, a verdadeira humanização, a atenção e o cuidado com o processo de interação e da experiência proporcionada são os indícios mais importantes. Falarei mais sobre isso lá no meio dessa série 🙆🏾‍♀️

📘 Dicas rápidas: existe um livro chamado “Design de interação: além da interação humano-computador” que é o baú de provas sobre isso que tô falando! É o primeiro que li no trabalho. Foi escrito por Yvonne Rogers, Helen Sharp e Jenny Preece! E um outro mais recente sobre essa parte estratégica para voz que se chama "Voice Strategy: Creating Useful & Usable Voice Experiences" escrito por Susan Westwater e Scot Westwater. Pra mim é a combinação perfeita de literaturas entre design de interação e VUI 😬

A elaboração da documentação das interfaces me deu a visão que eu precisava sobre arquitetura da informação e a parceria com outros times que não sejam de design

Imagem animada tipo GIF representando um jogo antigo do gênero plataforma chamado Super Mario Bros no qual o personagem de roupa e chapéu vermelhos, calça azul e sapatos pretos pode usar um dinossauro verde para andar pelo cenário. Nessa imagem, Mario dá um pulo par alcançar o indicador de final de fase saindo de cima do dinossauro e chegando até lá sozinho.

Lembro também do meu primeiro projeto longo e complexo, ainda como JR: a especificação técnica de um redesign do fluxo de visita técnica (agendamento e reagendamento, especificamente). Aí você me pergunta: mas se é fazer documentação, onde entra o projeto? Pois foi na hora de montar o documento para o DEV — mas que seria absorvida por QA e BI também, pessoas que eu desconhecia totalmente—é que notei que tínhamos que voltar ao desenho da conversa. Acredite: isso é retrabalho. Foi legal do ponto de vista de aprendizado, mas tive que me desdobrar pra refazer o que poderia melhorar. 😐

Enquanto encontrava o equilíbrio entre o detalhamento para o DEV e a experiência com os áudios de erro/ajuda que, geralmente, se faz nessa fase do projeto, comecei a perceber como os detalhes são importantes não só na experiência, mas na documentação também: fiz áudios específicos por tipo de comportamento necessário para a interação e tipo de contexto também (dias da semana rejeitados não seriam ofertados novamente, horários inexistentes também tinham prompts de erro específicos e mais); identifiquei cada tentativa de recomeço para marcação da visita com um áudio diferente, criei a desambiguação entre começar o fluxo por horário ou data para que o usuário pegasse o caminho que fosse mais natural para ele e defini áudios de introdução que contextualizavam quem ouviu automaticamente a visita que tinha e se deu conta de que não podia recebe-la e quem já tinha como objetivo inicial remarcar a visita.

Já pensou se isso tudo não fica claro para o time de DEV (e outras áreas)? 🤔 NEM PENSE! 😐

Estava determinada em entregar uma documentação que pudesse conversar com quem fosse consumi-la (no caso, o desenvolvedor), para poupar o tempo de todos e não gerar ruídos. Eu fazia reuniões diárias com o DEV pra ele apontar o que não entendeu e o que conseguiu para prosseguir, pois ele estava totalmente remoto e atuava no ramo há 10 anos, no mínimo. Havia MUITO para a Jana de 2012 e 2013 aprender. Depois de participar do board da empresa, esse profissional se voltou mais para CX e hoje comanda um braço da empresa que acelera novas ideias do mercado. Gallo, aprendi DEMAIS COM VOCÊ, obrigada pela paciência, broncas e elogios!🙏

Hoje podemos contar com uma comunidade que se dedica a essa parte do processo e faz muito mais: a Tech Writing BR. De nada 😉

Lição aprendida número 9: especificação técnica pode afundar ou salvar a execução de um projeto. E não há modelos ideais, cada time e/ou empresa precisa encontrar a que mais funciona pra si.

Bom, se eu continuasse falando dos aprendizados de JR, esse artigo ficaria mais longo do que já está. Continuei me aprofundando no preconceito linguístico pra treinar minha escrita pensada para fala; conheci o princípio de Pareto, a famosa regra do 80/20, que segue a ideia de que uma pequena quantidade de causas é responsável pela maior parte das consequências — o que acabou me levando ao ACOA (ajuda com outros assuntos) que seria nosso termômetro pra saber o quanto as opções estavam sendo relevantes ou não; mergulhei super fundo em Arquitetura da Informação (virei fã do tema!); conheci os materiais das outras 3 pessoas que trabalhavam comigo, enchi o estúdio de perguntas porque elenquei uma listinha razoável enquanto escutava os áudios das interfaces… Enfim, fui explorar meu País das Maravilhas. ❤️ E escolhi para esse artigo algo que ainda não tenha visto nesse Mediunzão da vida.

📘 Dicas rápidas: mais dois livros escritos pelo Marcos Bagno que recomendo são “Preconceito Linguístico” e “A língua de Eulália” — este último é uma dica de um VUI designer e colega fera demais chamado Felipe Caldas 😬

Imagem animada tipo gif do personagem cowboy de Toy Story chamado Woody. Ele usa chapeu marrom com abas, roupa amarela listrada e colete de pele de vaca, calca jeans e botas marrom. Está sentado em uma estante de brinquedos levantando o braço direito com a ajuda do braço esquerdo. Demonstra preocupacao em ver que o braço não funciona sozinho.

Hoje procuro dar o máximo de atenção e espaço para quem for JR em troca da minha experiência. É tudo o que eles precisam e me ajuda a amenizar o vício da falsa zona de conforto que a vivência trás. Conhecimento sem estudo constante é estrutura fraca e fadada a morrer.

Terminada a minha jornada de JR na prática, chegou o momento que eu mais esperava: propor uma interface do zero e lidar diretamente com o cliente em algumas situações onde eu sentia mais controle e segurança. Esse dia FOI LOKO, contarei tudo no próximo artigo 😉

Super obrigada pelo seu tempo, de verdade! Esse foi o segundo da série, espero te ver no terceiro! 😃

Por enquanto, acompanhe as comunidades VUI Design BR e Women In Voice Brasil para mais conteúdos meus e de outros profissionais da área de VUI e correlatas também. 🤩

Indicações finais

Deixe um comentário e não se acanhe de continuar esse papo via mensagem no meu Linkedin. 😉 Até mais!

--

--

Janaína Pereira

Design Manager | Conversational AI+6exp | LLMs e IAGen +1exp | CX e VUI +12exp | Aqui escrevo sobre como design, liderança e IA se entrelaçam com minha carreira