Quantos participantes chamar para um teste de usabilidade?

Elisa Volpato
TESTR
Published in
6 min readJun 25, 2017

Esta é uma das perguntas mais comuns de quem está começando na área. Quem tá acostumado com pesquisa do Ibope e pesquisa do Censo pode achar que qualquer pesquisa só funciona bem se for com centenas — ou milhares — de pessoas, certo? Não.

Teste de usabilidade é uma técnica aplicada principalmente de forma qualitativa. Isso quer dizer que o objetivo principal é levantar o maior número possível de problemas de usabilidade e de comportamentos que afetam o uso do produto. Usamos algumas métricas e números, sim, mas elas servem mais para indicar quais são os problemas mais críticos e o que precisa ser melhorado primeiro.

E com quantas pessoas fazer um teste de usabilidade? Quanto maior o número de participantes, melhor o estudo. Mas também fica mais caro e mais demorado. O segredo é encontrar um ponto ideal de bom custo benefício.

ps. Estamos nos referindo a testes de usabilidade qualitativos, presenciais ou não. Eles são realizados de forma individual. Só para não confundir “grupo de participantes” com um grupo de pessoas fazendo teste ao mesmo tempo.

‘Com 5 participantes você já descobre 80% dos problemas de usabilidade’

Entre os profissionais de UX existe a ideia do número ideal: 5 participantes por teste. Ele vem de uma recomendação do Jakob Nielsen, que mostrou que com 5 participantes você já consegue encontrar 80% dos problemas de uma interface. Depois disso os problemas começam a se repetir e o aprendizado diminui — logo, uma amostra com 5 participantes tem um bom custo benefício.

Gráfico que mostra a curva de número de problemas x número de participantes - Jakob Nielsen
Jakob Nielsen usou estudos anteriores para mostrar que com 5 participantes você já pode obter 80% dos problemas de usabilidade. E depois a curva começa a se estabilizar.

Então todos os testes de usabilidade são feitos só com 5 participantes? Não exatamente. O número 5 é um guia, mas em muitos casos vale a pena fazer com mais pessoas:

  • Quando a tarefa testada é um pouco mais complexa, com várias subtarefas. Como lembrou o Fabricio Teixeira, um fluxo de compra de e-commerce, tem várias etapas: encontrar o produto, colocar no carrinho, verificar o frete, preencher um cadastro… Um estudo com 5 participantes pode não ser suficiente para explorar o fluxo todo.
  • Quando há mais de um perfil de usuário dentro do público-alvo e essa diferença afeta o uso do produto a ser testado.

Mais importante do que a quantidade é a representatividade

Representatividade, neste caso, quer dizer duas coisas:

  • Testar com as pessoas certas.
  • Ter todos os perfis de participantes representados

Se o seu produto é um site para comparar preços de passagens aéreas, teste com pessoas que estão querendo viajar ou viajaram recentemente. Ou pelo menos procure pessoas que voaram de avião e compraram as passagens pelo menos uma vez na vida. Se você testa com alguém que está muito fora do perfil esperado para o seu produto, sem motivação e sem contexto, você pode acabar tendo resultados diferentes do que teria com os usuários de verdade. Ah, e evite testar com os seus colegas de trabalho. Pesquisa é um bom momento para sair da sua bolha. ;)

E se o produto tem perfis diferentes, é importante considerar isso na hora de definir a amostra e recrutar os participantes. Alguém que está acostumado a viajar bastante e entende bem como comparar os preços de passagens pode ter um comportamento bem diferente de quem prefere ter a ajuda de uma agência de viagens.

Para montar a amostra, escolha os critérios que são relevantes para o seu estudo e monte uma tabela cruzando as informações. Em geral colocamos de 3 a 5 participantes em cada célula.

Um exemplo bem comum: dividimos os participantes por experiência prévia e por dispositivos usado (computador ou celular) e deu um total de 12 participantes.
Neste segundo exemplo, um estudo um pouco maior, em que separamos os participantes também por comportamento. Neste caso tudo bem colocar 2 participantes em cada célula — há muitas divisões e não precisamos comparar as células da tabela entre si. O importante é ter um bom número de clientes e não clientes, desktop e mobile, online e offline.

Dica: só separe os participantes por perfis desta forma quando identificar critérios que são relevantes e podem afetar o comportamento de uso do seu produto. E não escolha mais do que 3 critérios — senão até a tabela fica bem difícil de montar.

Às vezes tudo de que você precisa é de uma amostra diversa dentro do seu público-alvo. Montando a matriz ou não, procure pessoas diferentes entre si: varie a idade, a profissão e o local onde moram (você pode fazer testes remotos!). Se você fizer um estudo com 20 estudantes de biologia de 18 a 24 anos que moram em São Paulo, pode aprender menos do que fazendo um estudo com 10 pessoas com diferentes idades, profissões e contextos de vida.

Em tempo: se a intenção é fazer um teste comparativo de dois sites ou dois layouts diferentes do mesmo site, é bom ter uma amostra maior, pensar em baterias separadas e tomar um cuidado maior no recrutamento para poder comparar amostras diferentes. Aliás, isso de testes comparativos merece um post especial no futuro. ;)

Teste com quantas pessoas for necessário para ter segurança de que está no caminho certo

Quanto mais participantes, mais confiança nos resultados você terá (desde que a amostra esteja bem equilibrada). Se você está testando o seu produto, você pode se organizar com uma meta (“vou testar com 5 a 8 participantes”) e decidir quando parar. Depois de 5, 6 ou 7 participantes os problemas começam a se repetir e isso indica que você encontrou um padrão. Esta pode ser a deixa para parar.

Por exemplo: eu trabalhei em um projeto de e-commerce em que havíamos planejado fazer testes com 10 pessoas. Mas depois do sétimo participante percebemos que os problemas já estavam muito claros: o carrinho estava confuso, confirmando as baixas taxas de conversão. E paramos a pesquisa para focar nas melhorias.

Faça ciclos de testes e melhorias

Então eu faço alguns testes e depois que descubro os problemas, paro os testes para sempre? Não! Volte, melhore o seu produto (ou protótipo) e teste de novo. No mesmo artigo em que fala dos 5 participantes, Nielsen defende os testes iterativos:

Se você tem orçamento para testar com 15 pessoas, faça 3 rodadas com 5 pessoas — e vai aprender mais.

Teste de usabilidade não precisa ser um acontecimento especial, uma ou duas vezes ao ano, com um estudo super aprofundado. Nada contra os estudos aprofundados — são muito úteis — mas incluir testes de usabilidade como uma atividade do dia-a-dia pode ser melhor para você e para o seu produto também.

Faça ciclos de testes e melhorias: teste o produto que está no ar, volte e melhore um pouco, teste de novo, faça um protótipo, teste de novo, coloque no ar, teste de novo. Se puder, divida os usuários em perfis. Se não der, fazer com 5 participantes dentro do público-alvo já pode ser suficiente.

A cada ciclo você aprende e evolui — e o seu produto evolui junto. Afinal, um design nunca está pronto. Como disse o Robson Santos em sua palestra na UXConf: UX é como louça. E enquanto você estiver vivo, haverá louça. ;)

Originally published at TESTR Blog.

--

--

Elisa Volpato
TESTR
Editor for

Pesquisadora de experiência do usuário, trabalhando com UX desde 2005.