O lado difícil de desenvolver uma cultura data-driven

Manuele Ferreira
Dec 18, 2021 · 8 min read

Aquele lado que não te contaram no curso que você fez

Photo on Nappy

Cultura data-driven é um termo que está, definitivamente, na moda. Não só no mundo de Tecnologia, mas em todos os outros fóruns e espaços. É até clichê falar que é importante considerar dados como um dos parâmetros na tomada de decisão.

No entanto, esse movimento tem impactado cada vez mais a forma com que as empresas lidam com dados e, principalmente, nas expectativas lançadas sobre os times de dados. Eu já li diversos livros, artigos e participei de eventos/meetups sobre times de dados e cultura data-driven e a impressão que tenho é que fica cada vez mais difícil encontrar respostas rápidas para os problemas enfrentados. Esses problemas, em geral, envolvem tanto questões técnicas como comportamentais.

Em um survey realizado pela IDC e financiado pela Tableau em Maio de 2021 [1] com 1100 líderes em 10 países chegaram ao resultado que:

83% das pessoas em posição de CEO querem empresas data-driven, mas apenas 33% dessas pessoas sentem que tem isso.

Dessa forma podemos avaliar que, apesar de ser algo bastante discutido e conhecido, ainda não é algo que é dominado pelo mercado. Esse cenário me lembra um trecho do livro O lado difícil das situações difíceis do Ben Horowitz [2]:

As situações são difíceis, pois não há receita nem resposta fácil sobre como sair delas. São difíceis porque, nelas, nossas emoções conflitam com nossa lógica. São difíceis porque não conhecemos a resposta.

Apesar de não termos uma receita ou resposta pronta para isso, no survey da IDC são elencados cinco pilares que são comuns a empresas mais maduras a lidar com dados. Vamos discutir um pouco sobre eles:

1- Talento: Esse pilar elenca a importância no investimento na contratação e desenvolvimento de habilidades de análise, interpretação e comunicação com dados das pessoas colaboradoras. Nesse cenário não falamos apenas das pessoas com papéis de dados, mas de todo e qualquer pessoa da empresa. É aqui também que vemos a importância do self-service BI e de dar autonomia para as áreas consumirem e gerar as suas próprias análises com dados.

Em seu livro, Ben Horowitz elenca quatro motivos importantes para que sejam feitos treinamentos bem feitos na empresa: Impacto positivo em produtividade, gestão de desempenho com declaração de expectativas para os papéis, garantia da qualidade do produto e aumento da retenção dos colaboradores.

Photo on Nappy

Na teoria esse movimento é bem legal, mas o que não te contam é que na prática surgem diversos desafios como, por exemplo: 1) Como dar clareza para as outras áreas que pessoas de dados são facilitadoras no processo de análise e não as únicas responsáveis? 2) Como engajar as áreas a realizarem os treinamentos e fazer as suas próprias análises?

Definição de valores associados a orientação à dados, disponibilização de treinamentos assíncronos e um movimento top-down com constante incentivo vindo das lideranças da empresa são algumas das estratégias que podem ser usadas para contornar esses problemas.

É importante citar também nesse pilar o desafio atual das empresas em trazer e reter talentos em dados em razão da alta demanda por profissionais no mercado. É ainda mais desafiador em empresas menos maduras, pois muitas vezes essas pessoas chegam com expectativas de aplicar tecnologias mais modernas e avançadas, quando muitas vezes o foco naquele momento é a estruturação de processos básicos para consumo de dados.

Em um meetup recente organizado pela Tera sobre construção da área de dados [3] esse assunto foi discutido e algumas das sugestões levantadas foram as de que: 1) Não existe um único modelo oficial/certo de times de dados. Leve em consideração aspectos culturais e particularidades do seu cenário na hora de construir um; 2) É importante selecionar as pessoas/papéis certos para a sua organização em relação à maturidade de dados que você tem. Além disso, dar muita clareza as pessoas sobre expectativas em relação a sua atuação. Esses são excelentes conselhos para aquelas corporações que querem escalar, mas não sabem como.

2- Confiança: Para dar autonomia para as áreas realizarem as suas análises é essencial o processo de democratização de dados. Esse pilar é sobre a importância de dar acesso a todo dado necessário para a tomada de decisão para os colaboradores de forma controlada, confiável e com responsabilidade. Ou seja, devemos considerar disponibilizar os dados consistentes, mas seguindo critérios de segurança e LGPD, por exemplo.

O que não te contam desse processo é que quanto maior o número de pessoas focadas em uma métrica e tendo acesso aos dados, maior é o número de regras diferentes que elas definem. E as pessoas são muito criativas quanto a essas variações!

Não é a toa que para o próximo ano, como falado nesse episódio [4] do podcast do Data Hackers, uma das vagas mais quentes é de pessoa Engenheira de dados e suas variações. Um processo básico de governança é essencial para trazer alguma sanidade mental sobre os números. Existem diversas empresas que criaram iniciativas da fonte da verdade (ou single source of truth) como o Airbnb [5] e se você fizer um rápido exercício de abstração vai chegar a conclusão que essa é a mesma base teórica do velho Data Warehouse. No fim, muita coisa em tecnologia é cíclico.

3- Mindset: Nesse pilar o foco é no incentivo à mentalidade de experimentação, inovação e exploração dos dados. Esse item está muito ligado ao ponto 1 e é uma consequência natural da mudança de mentalidade na empresa.

E como vimos anteriormente, quanto maior o número de pessoas com conhecimento em dados, maiores são as expectativas e desafios. Vou citar 2 deles nesse pilar:

3.1- Foco no uso dos dados: No livro o Ben Horowitz traz um exemplo bem interessante nesse sentido:

Photo on Nappy

Quando dirigi a Opsware enfrentamos o problema do trimestre não linear. Fechamos 90% dos novos contratos no último dia de um trimestre. Esse tipo de padrão de vendas dificulta o planejamento e é especialmente aflitivo para as empresas de capital aberto.

Naturalmente, determinei-me a endireitar o gráfico. Para incentivar o fechamento de contratos nos primeiros dois meses do trimestre, ofereci bonificações para os contratos fechados nesse período. Graças a isso, o trimestre seguinte mostrou-se ligeiramente mais linear e a renda foi um pouco menor do que a prevista.

Pensando bem, eu não deveria ter pedido à equipe que endireitasse os gráficos dos trimestres. Se era isso que eu queria, deveria estar disposto, ao menos temporariamente, a aceitar receitas trimestrais menores. Tínhamos um número fixo de vendedores que estavam maximizando a renda de cada trimestre. Infelizmente, eu apreciava mais a antiga prioridade de maximizar a receita.

Vemos no exemplo um problema muito comum, principalmente, em startups: a falta de foco em relação às métricas. Muitas vezes não conseguimos impactar todas as métricas de uma só vez, temos que priorizar. Dave Mcclure, empreendedor e investidor famoso no ambiente de startups, viu isso muitos anos atrás e foi o que o motivou a criar o Framework AARRR [6]. Esse framework tem como objetivo orientar a empresa a selecionar e focar em conjunto específico de métricas mais importantes ao negócio.

3.2- A "mágica da inteligência artificial": Um ponto desafiador, principalmente para pessoas que atuam com produtos de dados com Machine Learning, é trazer para a realidade o sonho que o mercado vende sobre inteligência artificial. A criação, desenvolvimento e maturidade de um produto de dados com ML exige muito esforço e tempo.

No entanto, muitas vezes no dia-a-dia é difícil trazer clareza para todas as pessoas envolvidas de que um modelo precisa ser treinado, o que é uma amostra e o porquê não necessariamente funcionar em um caso vai fazer com que funcione em todos. Além disso, mantê-lo consistente funcionando em produção à longo prazo exige outros cuidados e pode causar frustrações como o recente caso do impacto da pandemia no algoritmo de previsão de preços da Zillow [7].

No fim, mais importante do que levantar dados para tomar decisões é ter clareza sobre o motivo daquilo estar sendo feito, qual o propósito e expectativas claras.

4- Colaboração: Esse é um dos pilares que eu mais gosto e fala sobre o incentivo à visão de colaboração e comunidade no uso de dados. Principalmente no reconhecimento ao uso dos dados na tomada de decisão.

Eu, particularmente, começo a perceber que a empresa está mais madura sobre cultura data-driven quando pessoas que não tem papéis de dados começam a falar sobre: a importância no tracking de dados, criticar o uso de cálculos de métricas em planilhas dos colegas e incentivar o uso das fontes oficiais da empresa ou até falando sobre a importância na definição de métricas consistentes para monitoramento dos serviços/produtos. É ai que o jogo vira!

São esses aqueles momentos críticos para usarmos isso como case e incentivar mais pessoas da empresa a fazerem isso, dando o máximo de publicidade interna possível. É ai também que mais pessoas começam a se interessar por usar dados, fazer análises e o backlog do time dados começa a crescer vertiginosamente. Uma boa estratégia de priorização e foco no que é mais estratégico podem ser caminhos para contornar a sobrecarga do time.

5- Comprometimento: Por último, e talvez o mais importante pilar, é sobre a influência da liderança na cultura data-driven. Para ela funcionar de forma consistente a liderança precisa ser data-driven e valorizar isso. Ou seja, não adianta pedir para as pessoas colaboradoras tomarem decisões baseadas em dados quando as principais estratégias da empresa foram baseadas somente no feeling.

O processo para desenvolvimento da cultura data-driven em cada empresa vai funcionar de forma diferente e muitas vezes vai necessitar de estratégias diferentes também. No entanto, no fim, como dito pelo Ben Horowitz:

É claro que, mesmo com todos os conselhos e toda a experiência do mundo, as situações difíceis continuam sendo difíceis. Por isso, para terminar, desejo apenas paz a todos aqueles que estão engajados na luta para realizar seus sonhos.

Obrigada Talita Correa Barcelos, Thiago Patente e Gabriela Escobar Belo pelas revisões. 💛

Bibliografia:

[1] Survey IDC-Tableau May, 2015 https://www.tableau.com/about/blog/2021/7/what-do-data-driven-companies-have-common

[2] Horowitz, Bem. “O Lado Difícil das Situações Difíceis.” (2015)

[3] Data Beer: Construindo a área de dados. Como começar? https://www.youtube.com/watch?v=uHCXfyigmuY

[4] O passado, presente e o futuro da Engenharia de Dados — Data Hackers Podcast 49 https://medium.com/data-hackers/o-passado-presente-e-o-futuro-da-engenharia-de-dados-data-hackers-podcast-49-34be714b20f6

[5] How Airbnb Achieved Metric Consistency at Scale https://medium.com/airbnb-engineering/how-airbnb-achieved-metric-consistency-at-scale-f23cc53dea70

[6] O que é “AARRR (Métricas Piratas)” https://www.cursospm3.com.br/glossario/aarrr-metricas-piratas/

[7] Why Zillow Couldn’t Make Algorithmic House Pricing Work https://www.wired.com/story/zillow-ibuyer-real-estate/

Data Hackers

Blog oficial da comunidade Data Hackers

Data Hackers

Blog oficial da comunidade Data Hackers

Manuele Ferreira

Written by

Data Hackers

Blog oficial da comunidade Data Hackers