Desinformação a partir dos dados

A importância do storytelling e das fontes dos dados para a veracidade da informação

Karina Moura
Mulheres de Produto
4 min readMar 19, 2019

--

Quantas postagens/artigos de pessoas citando dados e chegando a conclusões em cima deles você já leu por ai? Muitas né! E é muito fácil olhar para aqueles vários números e ter a sensação de: “Nossa! Como não pensei nisso antes? Alguém estudou esse assunto e chegou nesses números, então, só pode ser verdade”. Pois é, mas a coisa toda não é tão simples assim.

De fato, ao contarmos uma história e utilizarmos os dados para subsidiar sua veracidade, precisamos ter muito cuidado com o significado que estamos querendo passar e principalmente com as técnicas utilizadas pelos pesquisadores para chegar às inferências (conclusões).

Mas o que exatamente isso significa? Tem alguns fatores que são importantes na hora de construir uma narrativa e interpretar as informações que nos estão sendo reveladas. Vou expor alguns desses fatores a seguir:

#1 Técnicas de coleta e seleção de dados: a forma como os dados foram coletados, a veracidade dos registros, o recorte que foi feito para a pesquisa (local, quantidade, público etc) e as técnicas de análise utilizadas influenciam os resultados das informações geradas. Como assim? Em muitos casos os dados que analisamos não provém de máquinas, mas sim de pessoas, por exemplo: um funcionário que alimenta um sistema de controle de estoque, usuários que postam em redes sociais etc. Estas informações podem estar sendo registradas com erros e vieses, pois, como humanos, somos passíveis ao erro.

Isso significa que precisamos confiar na fonte (empresa) que fornece os dados e nas pessoas que colocam eles nos sistemas.

Também precisamos entender um pouquinho sobre as técnicas de análises utilizadas. Que tipos de erros elas podem conter? O quão confiável aquele algoritmo aplicado é de acordo com o que foi coletado? Pense assim: se você vê um muro já com o acabamento dificilmente você vai conseguir saber a qualidade do material que foi utilizado para que ele fosse colocado em pé. O resultado final pode parecer seguro e confiável, porém, dependendo da força que aplicarmos nele, as consequências podem ser inesperadas. Com os dados não é diferente, um resultado de uma análise pode ser tão frágil quanto um muro feito de argila.

#2 Cultura analítica: tem um post da Cassie Kozyrkov que gosto sempre de citar, neste post ela faz a provocação sobre o quanto não estamos acostumados a tomar decisões nos baseando em dados e que isso está intrinsecamente relacionado a um processo cultural. A frase que sempre compartilho do post é esta:

Many people only use data to feel better about decisions they’ve already made. (Data-Driven? Think again)

O que a Cassie nos trás aqui é justamente nossa vontade em manipular as informações que temos em mãos. Nós construímos uma história em cima dos dados que, muitas vezes, não exemplifica o que os dados estão de fato indicando, mas sim o que queremos “ouvir” deles. Isso inclui, por exemplo, escolher apenas dados que corroborem com nosso pensamento, ao invés de trazer dados que divergem e causem reflexões sobre o assunto.

Pense em como esse fato diz muito sobre nosso comportamento como seres humanos. O quão acostumados estamos em discutir assuntos complexos com vieses diferentes sem nos exaltarmos? Acho que nossas redes sociais demonstram essa incapacidade de conexão e troca de conhecimento com uma certa maestria.

#3 A história contada com dados: além de demonstração dos dados muitos canais contam histórias com eles. Estas histórias são expressadas através de narrativas e visualizações das informações que podem vir em vários formatos. Um bom exemplo disso é a proporção dos gráficos, dependendo da impressão que queremos passar, um gráfico com a mesma diferença em quantidade (números) pode ser representado com proporções diferentes, alterando por completo nossa interpretação visual da informação.

Tem uma palestra muito boa da Letícia Pozza sobre esse assunto no evento Big Data Revolution 2018 da Cappra Data Science. Durante a palestra a Letícia traz uma série de exemplos e demonstrações de como os dados podem ser mal interpretados e como é fácil circularmos informações incompletas sob um viés que atenda às nossas crenças, assiste aí:

Esses são apenas três fatores que podem influenciar no significado dos dados. No final, é como se fosse uma grande brincadeira de telefone sem fio, cada pessoa vai adicionando sua própria interpretação em cima da narrativa inicial e quando chegamos ao final da contação, a história já perdeu há muito o seu significado original. Por isso, atente-se aos detalhes e sempre se pergunte:

  • quem ou qual instituição coletou e criou a análise desses dados?
  • qual veículo publicou conclusões em cima dessa análise, é uma empresa confiável?
  • quem foi a pessoa quem criou essa narrativa e quais os possíveis interesses dela ao passar essa mensagem?

Os dados, no geral, sempre serão confiáveis. Mas é preciso se ater sim aos detalhes “chatos” como as fontes e as instituições que estão contanto essa história para nós.

--

--