Como a cultura come Data Science com farinha

Originalmente publicado com o título "Culture eats data science for breakfast", por Johan Himberg, no blog da Reaktor. Faço comentários inline no padrão Medium.

Não é suficiente introduzir tecnologia de Big Data, algoritmos complexos e alguns cientistas de dados faz-tudo (unicórnio) isolados do resto da empresa. Não se pode esperar que eles mudem a organização e a cultura de trabalho sozinhos. Para tirar o maior proveito dos cientistas de dados o modus operandi precisa mudar e é necessário que se crie uma cultura orientada a dados.

Um post no LinkedIn chamado The Inconvenient Truth About Data Science, de Kamil Bartocha (em inglês), recentemente apareceu no meu feed. Essa lista é, para um profissional de Data Science… digamos, só li verdades, o que torna tudo mais engraçado.

Em poucas linhas, essa lista diz algumas coisas interessantes: a excelência técnico-acadêmica é só uma fração do trabalho diário e há muitas buzzwords flutuando por aí. Poderíamos adicionar alguns itens a essa lista, começando com “marketing pedirá mais segmentações, não importa qual seja o problema”. Você encontrará alguns itens complementares nos comentários do post.

Entretanto, esse post me lembrou uma reunião inspiradora de um tempo atrás: meia dúzia de cientistas de dados experientes falando sobre treinamento em data science. Como fazer data science no mercado? O que dizer às pessoas?

Vindo de um grupo de cientistas de dados com doutorado, você esperaria grandes lições e metodologias avançadas, enfoque tecnológico, insights de negócio, visualização de dados — ou pelo menos você esperaria algo sobre a importância da limpeza dos dados (sim, isso toma 80% do tempo de projeto).

Porém, nossa conversa entrava em loop sempre voltando para cultura organizacional e comunicação. Resumi nossas conclusões da seguinte forma.


Princípios para uma organização orientada a dados

  • Seja bayesiano. Entenda as incertezas.
  • Seja curioso. Procure evidências e aprenda sempre coisas novas.
  • Seja proativo e ágil. Teste; não apenas junte dados observacionais. Descubra falhas rápido (fail fast) — mas não tão rápido. Colete evidência suficiente para ser taxativo.
  • Seja corajoso. Aja com base em evidências e análises.
  • Seja sincero. Não diga nada que os dados não dizem: não dobre as evidências de acordo com seus desejos ou para ser compatível com a “política interna”.
  • Seja transparente e solícito. Sempre coopere e trabalhe além das fronteiras das áreas da organização. Tente agregar todo o fluxo de informação (information path): ação–decisão–análise–dados. Seja um defensor da transparência democrática dos dados, sempre respeitando limites legais, éticos e de negócio.
  • Seja esperto. Há horas que se deve ser analítico, horas que se deve ser intuitivo e horas para ser visionário.

A primeira virtude, ser bayesiano, é, claro, a essência de um cientista de dados. O resto dos princípios pode soar “bobagem” (soft principles). Mas, ser proativo não se trata apenas de personalidade. Em data science, proatividade significa testes controlados e empirismo em vez de agregação de dados passiva e uma caça cega por correlações. A coragem é necessária para começar a confiar mais no método empírico e menos nos lugares-comum “sempre fizemos assim” ou “minha intuição”.

É óbvio que precisamos entender o que uma organização está almejando e como funciona o mercado em que atua. Excelência técnica e profissional são importantes. Mas concluímos que muitas vezes não é suficiente. Ser orientado a dados (data-driven) é fazer as coisas com base em informação objetiva, ou seja, fortes evidências. Será que talvez não deveríamos organizar a empresa com essa premissa?

Não é suficiente introduzir tecnologia de Big Data, algoritmos complexos e alguns cientistas de dados faz-tudo (unicórnio) isolados do resto da empresa. Não se pode esperar que eles mudem a organização e a cultura de trabalho sozinhos. Para tirar o maior proveito dos cientistas de dados o modus operandi precisa mudar e é necessário que se crie uma cultura orientada a dados.

Se a cultura corroi a estratégia, definitivamente fará o mesmo para data science.


Agradecimentos

Renato Brandão pela tradução genial do título.