O que é uma variável latente e como medi-la? — Parte 1

Gabriel Rodrigues
Datapsico
Published in
9 min readSep 14, 2020

(A Parte 2 está aqui!)

João está pegando um sorvete para sua namorada no supermercado. Ele escolhe o de sorvete de flocos e vai caminhando para a fila do caixa. Ele entra na fila e se admira com a quantidade de panelas que o supermercado está vendendo. Ao se distrair olhando para o lado, uma pessoa passa na sua frente. João, ao perceber isso, pede licença para a pessoa:

- Oi, tudo bem? Eu estava aqui na fila antes e vi que você entrou na minha frente. Não sei se você tinha reparado…

A pessoa, surpresa, responde:

- Ah, desculpe! Não tinha visto!

- Sem problemas! Às vezes a gente se distrai mesmo — João fala, com um sorriso no rosto.

O que podemos tirar de toda essa cena? Baseando-se nessa cena, se eu te perguntasse quais as características que João tem, o que você me responderia?

Fazendo uma lista, as possíveis respostas para a pergunta acima são:

  • João é uma pessoa educada: parece respeitar o espaço dos outros e o que as pessoas tem a dizer.
  • João é uma pessoa flexível: ele não partiu do pressuposto que a pessoa que tomou seu lugar na fila estava o fazendo por mal. Ele achava que poderia ser um engano e resolveu descobrir se era isso mesmo.
  • João é uma pessoa assertiva: ele deixou nítido o seu lugar e o que pensava da situação, sem agredir a pessoa que o passou na fila.
  • João é uma pessoa acolhedora: entendeu a posição da outra pessoa e a acolheu no seu engano.

Mas afinal: o que isso tem a ver com ciência de dados, psicometria e psicologia?

Tá latente no dente da gente

A cena serviu para introduzir a noção de que tiramos conclusões sobre como as pessoas são a partir daquilo que elas demonstram.

Melhor ainda: o que as pessoas expressam e fazem são demonstrações externas daquilo que elas têm dentro. Ao mesmo tempo, essa coisa que tá lá dentro não pode ser acessada a não ser que seja expressa do lado de fora.

Esse é, basicamente, o conceito de uma variável latente.

Variáveis latentes são variáveis que não podem ser acessadas diretamente e que possuem manifestações no mundo externo. Elas são inferidas através da mensuração de variáveis observáveis.

A variável latente mais falada e mais conhecida é a personalidade. Existem várias teorias de personalidade, sendo que muitas dessas tratam, por exemplo, da extroversão e da introversão como construtos importantes.

Construtos são conceitos que possuem uma mensuração bem definida. Extroversão pode ser um construto porque existem instrumentos que apresentam boas evidências de validade para medir o quão extrovertida uma pessoa é.

Outros exemplos de variáveis latentes podem ser:

A lindeza das variáveis latentes

O que é super legal nas variáveis latentes é que essas variáveis:

  • Não podem ser mensuradas diretamente.
    Não existe uma régua que mede extroversão ou autoestima. Do mesmo modo, é impossível determinar o nível de depressão de uma pessoa com um teste sanguíneo. Apenas manifestações externas (isto é, comportamentos, respostas a perguntas, etc.) podem nos oferecer boas estimativas dessas variáveis.
  • Precisam de instrumentos validados para que sejam acessadas.
    É difícil mensurar variáveis latentes. Elas geralmente estão muito associadas (isto é, correlacionadas) com outras variáveis latentes e, por isso, necessitam de procedimentos rígidos para que uma boa mensuração delas seja feita.

Vale ressaltar que as variáveis latentes não são objetos de estudo apenas da psicologia.

Essas variáveis estão presentes em estudos sobre política, administração, nutrição, comunicação, medicina, odontologia, enfermagem etc.

Dito isso, há uma dificuldade considerável no estudo dessas variáveis. Talvez por estarem muito presentes e difundidas em vários campos, podem haver enganos no que concerne ao desenvolvimento de medidas válidas desses construtos.

Afinal, se é tão difícil assim as medir, como esse processo é feito?

Vamos oferecer um exemplo e explicar um pouco sobre como isso geralmente é feito.

Mensurando variáveis latentes

A mensuração de variáveis latentes geralmente se dá através da construção de escalas. Essas escalas utilizam vários itens que se propõem a medir as variáveis observáveis que, em conjunto, nós supomos que expressam o comportamento da variável latente.

Lembra que não conseguimos acessar diretamente a variável latente? Pois então: a resposta de uma pessoa a um item seria a manifestação externa que estaria medindo o construto latente.

Agora, como se acham os itens específicos para se medir essas variáveis?

Como saber se estou medindo o que eu quero medir ou se estou mensurando outra coisa?

O processo de construção de escalas (e testes) demora tempo e é melhor explicado por Reppold, Gurgel, & Hutz (2014), Borsa, Damásio, e Bandeira (2012), e para quem lê em inglês, por Boateng e colegas (2018).

Por ora, vamos ao nosso exemplo.

Escala de Saúde Mental Positiva

Como já dito, escalas psicométricas são muito úteis para mensuração de variáveis latentes. Nessas escalas, as pessoas geralmente são apresentadas com uma série de itens que geralmente são frases em 1ª pessoa, como por exemplo, “Eu gosto de trabalhar”. Após a leitura de cada frase, a pessoa é instruída a marcar, geralmente:

  • o quanto cada item as descreve mal, as descreve mais ou menos, ou as descreve bem;
  • o quanto discordam daquele item, nem concordam nem discordam dele, ou concordam com ele;
  • a frequência que aquele item aparece em suas vidas.

Essas medidas de intensidade em cada item são o que garantem a variação das respostas e indicam a quantidade de pontos (isto é, a granularidade) das escalas. Cada medida de intensidade recebe um número, como já veremos, o que transformaria essa medida em ordinal.

Entende-se que, quanto maior o escore de uma pessoa, maior a presença daquele atributo nela. Pontos de corte geralmente são estabelecidos, sendo uma boa prática divulgar os percentis de como uma pessoa se compararia frente à amostra coletada no estudo inicial de construção da escala.

O sistema de pontuação pode alterar, sendo costumeiro o escore se dar ou pela soma de todos os itens ou pela média deles.

Abaixo você encontra um bom exemplo de escala psicométrica, a Escala de Saúde Mental Positiva (Machado & Bandeira, 2015).

Escala de Saúde Mental Positiva (Machado & Bandeira, 2015).

Essa é uma escala psicométrica que busca medir três diferentes dimensões:

  • Bem-estar emocional.
  • Bem-estar social.
  • Bem-estar psicológico.

Cada tipo de bem-estar contribuiria para consequências diferentes quando se trata da saúde mental. Após extensa revisão da literatura e análises estatísticas por Modelagem por Equações Estruturais e Teoria de Resposta ao Item, Machado e Bandeira chegaram à conclusão de que essa escala é bifatorial.

Apresentar bons índices para uma estrutura bifatorial significa que ela possui as três variáveis latentes já apresentadas e, além disso, uma variável latente maior que essas. Já sabe qual é? Essa variável que estaria explicando a maioria da variação das outras variáveis latentes se chama “saúde mental positiva”.

Analisando a escala mais ainda, podemos tirar alguns insights interessantes.

Instrução

Ainda na instrução, é dada a referência temporal a partir da qual a pessoa deve basear suas respostas (“como você tem se sentido durante o último mês”). Isso é importante a fim de evitar que algumas pessoas respondam de acordo como geralmente se sentiram na vida, outras respondam de acordo com a última semana, outras de acordo com o último ano, e algumas de acordo com o que estão sentindo naquele momento. Isso teoricamente diminuiria o erro de medida.

Nesse exemplo, após uma instrução, é requisitado que a pessoa que está respondendo coloque a intensidade de sua concordância em uma escala.

As escalas psicométricas, ainda, podem tomar vários formatos de intensidade.

Geralmente, essas escalas são:

  • Likert.
    Uma escala com itens neutros com opções de resposta em 5 pontos de intensidade: “discordo totalmente”, “discordo”, “nem concordo nem discordo”, “concordo” e “concordo totalmente”.
  • Tipo-Likert.
    Uma escala com dois extremos de intensidade que podem ou não ser de 5 pontos, contanto que esses 5 pontos não sejam os mesmos da Likert. Por exemplo, uma escala tipo-Likert de 7 pontos: “discordo totalmente”, “discordo”, “discordo um pouco”, “nem concordo nem discordo”, “concordo um pouco”, “concordo”, “concordo totalmente”. Ou uma escala tipo-Likert de 7 pontos que avalie frequência (e não concordância): “nunca”, “quase nunca”, “às vezes”, “com frequência”, “sempre”.

Aqui está o principal entendimento que se deve ter: a intensidade de um atributo em uma pessoa vai determinar o quanto ela concorda ou discorda com as afirmações que são apresentadas a ela. Quanto mais ela possuir de um atributo, mais ela tende a concordar com a afirmação que lê.

É a intensidade dessa resposta que nos faz acessar o atributo que aquela pessoa possui. É essa resposta, essa variável manifesta, que nos permite estipular e modelar o que consideramos ser as tais variáveis latentes.

Nesse sentido, as variáveis latentes partem de um modelo reflexivo: quanto mais uma pessoa tem de um atributo, mais ela concorda ou discorda com afirmações que tem a ver com aquele atributo. A mudança na variável latente vai gerar a mudança nas respostas. Por exemplo, quanto mais uma pessoa for engajada, mais ela vai concordar com os itens.

Justamente por causa disso, variáveis latentes não podem ser modeladas a partir de Análises de Componentes Principais — pois o modelo da ACP é um modelo formativo. A ACP cria componentes a partir das respostas — ou seja, um aumento nas respostas gera um aumento no componente. A mudança nas respostas geraria uma mudança no componente.

Para entender melhor sobre isso, sugiro a leitura de Damásio (2012) — ou o vídeo que o autor fez sobre o assunto.

Interpretação

A partir da resposta aos itens da Escala de Saúde Mental Positiva, os escores podem ser interpretados pelo Apêndice B do artigo.

Machado e Bandeira disponibilizaram a tabela de percentis e escores modelados Rasch para que possamos comparar um escore individual com o escore da amostra do estudo.

O escore mínimo da escala é de 14 e o escore máximo é 84. Isso significa que um escore na metade da escala, a mediana, estaria no ponto 49. Entretanto, se você teve um escore de 49 e for olhar para a tabela acima, percebe um fenômeno diferente.

O escore bruto, esse que a gente obtém ao somar a escala, está na coluna“Raw score”. Olhando para a linha na qual o escore é 49 (a metade dos escores), vemos que essa pontuação, na coluna de percentis, equivale a um escore acima de 23% dos outros escores obtidos no estudo de construção da escala. Ou seja, teoricamente existiriam 77% de pessoas que obtiveram um escore acima desse.

Exercício: você consegue dizer, olhando na tabela, qual escore uma pessoa precisa ter para se posicionar 50% acima de outros escores e 50% abaixo de outros escores? Dica: olhe para os percentis!

Observando novamente a tabela, um escore acima de 50% da amostra e abaixo de 50% da amostra (na metade) vai ser um escore de 60.

Na avaliação psicológica, os percentis e desvios-padrões são bastante utilizados para comparação de um escore individual com um grupo. Entretanto, isso é sempre considerado em um contexto, já que existem erros ao se comparar um escore individual a um escore obtido em um estudo de construção de uma escala psicométrica.

Como construir escalas psicométricas?

Os procedimentos de construção de uma escala consistiriam, de acordo com Pasquali (1998) em:

  • Definição constitutiva
  • Definição operacional
  • Construção dos itens
  • Revisão dos itens (por experts e população-alvo)
  • Análises iniciais
  • Revisão
  • Publicação

UFA! Quanta coisa!

Existem vários possíveis erros nesse processo. Os principais enganos ocorrem na construção dos itens — ou seja, na fonte geradora dos nossos dados!

Como existem erros comuns quando o assunto é a criação de itens, no post 2 dessa série trataremos apenas disso. Então abre o olho e se inscreve na nossa Newsletter para não perder os conteúdos do PsicoData.

Contato

Espero que tenha gostado! Qualquer dúvida, observação ou comentário são muito bem-vindos! Fique à vontade para se manifestar e vamos aprender juntos 😄

Para falar comigo, é só entrar em qualquer um desses links.

--

--

Gabriel Rodrigues
Datapsico

Sou um psicólogo que trabalha com Análise e Ciência de Dados desde a graduação — busco criar e compartilhar conteúdo sobre esses assuntos. linktr.ee/gabrielrr