Sua empresa “data driven” vai funcionar devagar

Carlos Alberto Rocha Cardoso
DATA ENGINEER BR
8 min readJul 20, 2019

--

As coisas mudam no devagar depressa dos tempos. Guimarães Rosa. Grande Sertão — Veredas

Esse não é um daqueles títulos fake usados apenas para chamar sua atenção. Para mim, ele contém a essência do que significa o termo data driven. Antes de chegar lá porém, queria passar por outro termo, o famoso data is the new oil.

Sobre dados como potencial fonte de valor

Perdi a conta de quantas vezes vi essa frase nos power points da vida: dado é o novo petróleo. Embora uma tanto desgastada, não é minha intenção desconstruí-la por completo. Elas guardam certa semelhança se pensarmos que, para extrair valor dessas duas entidades, precisamos conduzi-las por um um processo de transformação. Por outro lado, é bom saber que de perto ninguém é igual (nem normal).

Transformar dados em algo de valor não é um processo tão definido como transformar petróleo em gasolina. Para chegar lá com os dados, sempre vamos depender de um contexto, uma hipótese, um processo com certa doze de incerteza. Se é certo que ao processar o petróleo teremos gasolina como produto e valor final, não podemos dizer o mesmo dos dados. Ao trabalhar com eles, em parte conduzimos, em parte somos conduzidos. Ainda que alguns usem a tortura para extrair dos dados o que querem, não é esse o caminho, há de se guardar certo respeito ao lidar com essa matéria prima. Seu valor não está só no produto gerado a partir de sua transformação, surge ao longo do trabalho ou mesmo do inesperado.

Quer um exemplo?

Pesquisadores do laboratório CERN na Suíça chegaram a conclusão de que o nosso universo não deveria existir. Buscavam encontrar uma assimetria na quantidade das partículas de matéria e antimatéria formadas durante o Big Bang, mas não foi isso que encontraram. Conforme os estudos, essas partículas teriam sido formadas em igual quantidade e por isso se anulariam. Nada de universo, nada de nada. Simplesmente não sabem explicar por que tudo está de pé. Qual o valor dessa conclusão? Não sei ao certo, mas não se pode desconsiderar o lucro que é viver em um universo que nem deveria existir.

Brincadeiras a parte, acredito que tão importante ou determinante quanto os dados, é encontrar as perguntas certas, respondê-las, e então tirar o maior valor possível das respostas, seja quais forem. Descobrir que você estava errado pode ter tanto valor quanto estar certo.

Voltando à metáfora do petróleo e dos dados, creio que o objetivo não é fazer um paralelo profundo entre essas duas entidades, talvez o objetivo maior seja dizer às pessoas com outras palavras: olhem para os dados como potencial fonte de valor.

Sobre ser direcionado por dados

Considere a descrição abaixo:

Ricardo é muito tímido e retraído, invariavelmente prestativo, mas com pouco interesse nas pessoas ou no mundo real. De índole dócil e organizada, tem necessidade de ordem e estrutura, e uma paixão pelo detalhe.

Agora responda no menor tempo possível:

Há maior probabilidade de Ricardo ser um bibliotecário ou um fazendeiro ?

Provavelmente bibliotecário é a primeira coisa que veio à sua mente, a mais rápida. Mas e se você tivesse mais tempo e investisse maior esforço na análise dessa questão? Se tivesse à disposição dados estatísticos sobre a quantidade de fazendeiros e bibliotecários no mundo, se soubesse o país ou estado em que Ricardo vive, ou mesmo as profissões dos seus parentes mais próximos? Imagine que nos EUA por exemplo, há uma proporção de 20 fazendeiros para cada bibliotecário. Não seria razoável imaginar que lá provavelmente encontraríamos mais pessoas de índole dócil e organizada dirigindo tratores do que organizando uma estante de livros?

Esse é um exemplo razoável do que é ser direcionado por dados.

Peguei essa reflexão emprestada do livro Rápido e Devagar: Duas formas de Pensar. Nele Daniel Kahneman apresenta dois sistemas que utilizamos para pensar, resolver problemas e tomar decisões: o sistema 1, também chamado de rápido, e o sistema 2, ou devagar.

Embora no meio da leitura do livro, com muita expectativa do que vem pelas próximas páginas, o contato inicial com a descrição desses dois sistemas misturou algumas ideias na minha cabeça e me trouxe a esse texto. Se você já ouviu que dado é o novo petróleo, com certeza não passou imune à chamada de que devemos tomar decisões em nossas empresas baseadas em dados, ou como estamos mais acostumados a encontrar nos power points, devemos ser uma empresa data driven. Não tenho dúvida de que esse é um caminho necessário para ser bem sucedido na grande maioria dos mercados, se não em todos. É por isso que entender o que essa frase significa na essência se tornou fundamental para mim. Data driven na minha cabeça sempre esteve ligado à ideia de velocidade, rapidez. Não poderia estar mais enganado sobre a essência do que eu pensava conhecer.

Sobre os sistemas 1 e 2

Se me permite, quero voltar ao exemplo do nosso amigo Ricardo e descrever um pouco mais os sistemas apresentados no livro do Kahneman. O sistema 1, rápido, é o que soprou no seu ouvido que Ricardo devia ser um bibliotecário. Ele é intuitivo, impulsivo, muitas vezes involuntário. Utiliza semelhanças, esteriótipos e tudo mais disponível em sua memória como uma heurística para te dar a resposta mais rápida. Contudo, obter a resposta mais rápida nem sempre significa obter a melhor, ou a correta.

Para o seu sistema 1, qual das linhas abaixo tem o maior comprimento ?

Com certeza ele te disse que é a primeira linha. A verdade é que ainda que você já tenha visto essa imagem antes, e saiba que se trata da ilusão Müller-Lyer, o sistema 1 continua gritando para você que a primeira linha é a menor. Você precisa de certo esforço para sobrepor essa intuição. Precisa dos fatos e dados processados pelo sistema 2. A conclusão racional que ele entrega é a de que as duas linhas tem o mesmo comprimento.

Como o exemplo acima mostra, o sistema 1 pode nos levar a respostas equivocadas. Analisar seu funcionamento pode nos ajudar a identificar erros sistemáticos em nossas decisões. Analisar por sinal é característica do sistema 2, devagar, raciocinador, responsável por alocar atenção a atividades trabalhosas, cálculos complexos, moderação e auto controle.

Para mim, conhecer esses dois modos de pensar foi a chave para a essência do que chamamos: ser direcionado por dados. O que te parece? Ser data driven tem mais a ver com o modo de pensar do sistema 1, rápido, ou do sistema 2, devagar?

Passei a entender que levar uma empresa a orientar suas ações cada vez mais em fatos e dados, e cada vez menos em intuição, achismo e impulso, é leva-la a usar cada vez mais o sistema devagar, e cada vez menos o sistema rápido. A verdade é que sua empresa orientada por dados vai funcionar devagar, a essência do que é ser data driven está nesse modo de pensar.

Os problemas do sistema 2

O primeiro problema é que pensar devagar não é sexy, ninguém quer pensar devagar. Ninguém quer dizer que sua empresa data driven pensa devagar, mas é assim que é quando olhamos para nós mesmos, na perspectiva humana da coisa. Utilizar o sistema 2 no processo de decisão de sua empresa, em tese, consumirá muito mais tempo do que o sistema 1, baseado na “experiência” e “intuição”.

Nosso sistema 2, o devagar, tem ainda algumas limitações. Suas atividades exigem atenção e podem ser interrompidas quando o foco é desviado. Essa atenção, assim como todo trabalho que ele executa, gera um desgaste, consome energia. Não atoa, nosso instinto resiste sempre que possível em utilizá-lo, principalmente quando há algo com aparência de útil disponível no sistema 1, rápido. Chamamos daquela velha preguiça de pensar. Quando em uso, é possível perceber outros aspectos. Há um limite de eventos, variáveis ou passos que conseguimos manter em memória durante uma atividade. Tente realizar um cálculo complexo apenas de “cabeça”. Em atividades como essas, precisamos muitas vezes lançar mão das ferramentas, caneta e papel sempre ajudam.

Apesar dessas limitações, esse sistema não deixa de ser fantástico, base de todo pensamento científico. Nos ajuda a transpor o obstáculo do viés, ainda que devagar, calçado no pensamento analítico e orientado por dados.

O devagar depressa

Convivemos diariamente com as limitações. Grande parte do trabalho executado pela humanidade, nossa evolução, gira em torno de contornar ou eliminar limitações. Nesse contexto, ainda que a essência do data driven passe pelo pensar devagar, há uma forma de agilizar esse processo. Existe um caminho para executarmos esse modo de pensar com mais velocidade, escalarmos sua execução. Precisamos utilizar habilidades e tecnologias especializadas para isso.

Com esse auxílio, é como se pudéssemos subir de bonde a montanha do pensamento analítico, algo que antes era feito a pé.

Creio que tudo que estamos vivendo hoje na área dos dados gira em torno de agilizar nosso sistema 2. Isso não é de hoje, desde o primeiro computador, quem sabe desde o ábaco. A questão é que tijolo a tijolo, a cada camada de abstração, escalamos e potencializamos as habilidades, tecnologias e o próprio modo de pensar devagar. Seja você um cientista, engenheiro ou qualquer outra coisa de dados, saiba que seus algoritmos de predição, modelos, APIs de machine learning, pipelines e datalakes são todos parte de um trabalho cuja essência é otimizar os sistema 2, o sistema devagar. Fazer com que ele seja executado com cada vez mais velocidade, qualidade, precisão, acurácia. Assim entregamos valor.

Ah! E antes que eu me esqueça!

De preferência que seja aplicado ao contexto adequado, dentro de um conjunto de princípios éticos, de forma a não gerar valor para alguns indivíduos em prejuízo de outros.

Concluindo

Comecei esse texto falando sobre o potencial dos dados para geração de valor, lembrando porém que compará-los ao petróleo não é tão simples, há sempre algo que pode surgir do inesperado quando trabalhamos com os dados. Baseado no livro do Daniel Kahneman, falei um pouco sobre os sistemas 1 e 2, modos de pensar rápido e devagar, relacionando o modo devagar com o trabalho analítico apoiado em dados ou data driven. A partir desse ponto tentei mostrar que o trabalho dos profissionais da área de dados, em sua essência, gira em torno de agilizar esse sistema.

Espero com esse texto apresentar uma visão que, embora menos (ou nada) técnica, nos ajude a compreender a essência do nosso trabalho.

Dados importam. Pensar devagar, de forma analítica e apoiado em dados, reduz o risco de você cair no viés do pensamento rápido. Você pode agilizar o modo devagar de pensar com as habilidades e tecnologias corretas. Grande parte do nosso trabalho gira em torno disso:

Fomentar o devagar depressa dos tempos!

--

--

Carlos Alberto Rocha Cardoso
DATA ENGINEER BR

Data professional, enjoying the journey of the life, the universe and everything.