A estratégia de dados do Grupo Boticário

Entenda como uma das maiores empresas de beleza do mundo está usando dados

Philipp Nguyen
Data Hackers
8 min readJul 5, 2021

--

Photo by Scott Graham on Unsplash

Indiferente da empresa em que você trabalha, do seu tamanho ou segmento, já parou para refletir sobre os dados que estão sendo gerados a cada dia e como são usados?

Aqui no Grupo Boticário geramos todos os dias uma imensidade de dados e informações, pois o nosso negócio engloba a cadeia de valor inteira do segmento de beleza: Desde a pesquisa e desenvolvimento de novos produtos nos laboratórios, passando pela produção nas nossas fábricas e logística que distribui nossos produtos pelo mundo inteiro, e indo até a venda ao consumidor final no varejo físico e online nos nossos próprios canais e nos canais de parceiros. E vale a pena mencionar que também temos uma fintech, chamada Mooz, que processa transações no valor de bilhões de reais por ano.

Para tangibilizar o tamanho disso, aqui estão alguns números:

  • Das nossas indústrias saem mais de 350 milhões de produtos a cada ano
  • Somos a maior rede de franquias de beleza do mundo com mais de 4 mil lojas físicas em 1.750 cidades
  • Temos a maior plataforma de e-commerce do segmento de beleza da América Latina
  • Centenas de milhares de revendedores levam os nossos produtos pro Brasil inteiro, gerando renda para as suas famílias
  • Levamos nossos produtos para mais de 15 países
Linha de tempo Grupo Boticário
Linha do tempo do Grupo Boticário

Temos um mar de dados em todas as etapas da nossa operação, e usamos esses dados para retroalimentar outros processos da cadeia, por exemplo: podemos usar as avaliações dos produtos no e-commerce e nas pesquisas de satisfação para gerar inputs para os times nos laboratórios que desenvolvem novos produtos. No varejo, o nosso time de data science criou modelos de previsão de vendas para definir a produção nas fábricas e o abastecimento da rede de lojas. Esses foram apenas dois exemplos para ilustrar o grande diferencial do Grupo Boticário comparado a outras empresas: plugando um algoritmo de machine learning no início da cadeia, podemos ver e medir o impacto direto no fim da cadeia e vice-versa, pois todos os dados ficam dentro de casa.

As possibilidades são quase infinitas e um grande volume de dados ainda não estava sendo utilizado para criar melhores produtos, serviços e experiências para os nossos consumidores, parceiros e colaboradores.

Por isso, o Grupo Boticário começou a investir fortemente em dados, criando uma nova área dedicada ao tema para turbinar a jornada. O nosso time começou em janeiro 2021 com 30 pessoas e em breve já ultrapassará o número de 150 (ainda temos vagas abertas #ficaadica), além dos mais de 200 profissionais de dados da consultoria GAVB, que faz parte do Grupo Boticário desde março 2021. Os desafios e as ambições são grandes, pois estamos construindo o maior ecossistema de beleza do mundo, com dados como um dos principais pilares.

Para colocar essa visão em prática e direcionar os esforços, precisamos de uma estratégia de dados sobre a qual falaremos a seguir.

Do grego, strateegia…

Muitas das vezes, escutamos o termo “estratégia de dados” de forma isolada, no contexto de gestão de dados e tecnologia, com o objetivo de tratar dados como um ativo da empresa. Essa visão é limitada e resulta, na prática, principalmente em empresas que não nasceram no mundo digital, em estratégias de dados definidas por abordagens do tipo “vamos migrar tudo para cloud, modernizar a nossa tech stack e implementar processos de gestão de dados”.

Sem dúvida alguma, essas atividades geram valor, mas elas representam apenas uma fatia da estratégia de dados. Acreditamos que a visão deve ser mais holística, e gosto bastante da seguinte definição do MIT Center for Information Systems Research (CISR):

”Estratégia de dados é um conceito central e integrado, que articula a forma como dados vão habilitar e inspirar a estratégia de negócio.”

Assim, a estratégia de dados habilita a estratégia de negócio: não são duas coisas que andam da forma separada, muito pelo contrário, são integradas e uma complementa a outra. Trazendo este conceito para a prática, identificamos quatro pilares que vão guiar a estratégia de dados do Grupo Boticário.

1. Alinhamento à visão: alinhando a estratégia de dados à estratégia de negócio

Uma abordagem comum é olhar quais dados existem e assim explorar o que é possível ser feito com esses dados. Apesar de ser uma abordagem pragmática, com potencial de gerar quick-wins, o limitador será sempre a quantidade de dados disponível. Lembrando a definição de estratégia de dados acima, essa abordagem também não garante que cheguemos mais próximo da nossa visão de negócio.

Por isso, usamos o caminho inverso e começamos sempre com o resultado esperado: em vez de “quais dados existem e o que podemos fazer com esses dados?” a pergunta correta é “onde queremos chegar? Como dados podem ajudar e quais dados precisamos?”. A visão do negócio se desdobra em planos estratégicos e táticos em cada área, e no nosso caso, o time de dados conversou com centenas de pessoas em 40 diretorias da empresa para entender seus objetivos, dores e oportunidades. Por meio desse trabalho, conseguimos juntar as peças do quebra-cabeça e identificar sinergias e dependências que antigamente ficavam invisíveis. Ao mesmo tempo, garantimos que a nossa estratégia de dados nasceu de forma integrada, implementando analytics e inteligência artificial na empresa inteira, não sendo limitada a iniciativas isoladas, sem conexão com a estratégia do negócio.

O resultado é um backlog de dados em constante evolução, com centenas de itens, os quais são priorizados baseado em critérios como aderência à estratégia, impacto financeiro, esforço necessário etc.

2. Cultura, pessoas e organização: decisão por meio de dados

Se olharmos para uma empresa como se fosse um mosaico e seus colaboradores como se fossem as suas peças, a cultura organizacional seria a cola que manteria essas peças unidas. Assim, cultura data-driven diz respeito à tomada de decisão baseada em conhecimentos extraídos a partir de dados. Quando isso acontece de forma natural, como um hábito, podemos dizer que essa empresa é data driven. Para chegar lá, precisamos desenvolver principalmente um mindset e comportamentos no dia a dia que promovam o uso de dados: qualquer hipótese deve ser apoiada por dados.

Photo by Wesley Tingey on Unsplash

Também é necessário evoluir as capacidades dos times em ler, trabalhar, analisar e comunicar com dados. Para desenvolver esse skill de data literacy na empresa inteira, temos programas de formação em dados. O primeiro passo nessa trilha é análise de dados que já faz parte do dia a dia dos nossos colegas. Aqui focamos no ensino de skills fundamentais como SQL e visualização de dados para preparar as pessoas para uma linha mais técnica (claro, para quem tiver interesse).

Por fim, o nosso time de dados também precisava de um modelo organizacional e de engajamento com as demais áreas. O nosso objetivo foi dar o máximo de autonomia e responsabilidade às pessoas, sem perder o alinhamento. Optamos por um modelo híbrido, que centraliza a gestão das pessoas da arquitetura de dados, engenharia de dados, ciência de dados e BI no nosso time, para garantir o crescimento profissional e ao mesmo tempo facilitar a criação de melhores práticas e disseminação de conhecimento. Por outro lado, descentralizamos a execução: ela acontece nos squads dentro das demais áreas para garantir o maior contexto possível, uma quantidade mínima de hand-overs e responsabilidade de início ao fim.

3. Tecnologia: autonomia para geração de novos insights

Em 2020, iniciamos a construção da nossa nova plataforma de dados na Google Cloud Platform (GCP), unificando todas as informações no BigQuery, pois não é suficiente ter a cultura certa com pessoas capacitadas, os dados também precisam ser fáceis de acessar na hora que a pessoa quiser.

O objetivo desse pilar estratégico é muito claro: dar mais autonomia às pessoas por meio da redução da dependência do time de tech, habilitando a geração de insights em todos os níveis da organização. Implementamos este conceito de self-service analytics no Grupo Boticário através de uma variedade de novas ferramentas, como por exemplo Tableau para BI, BigQuery, Cloud Data Fusion e Data Studio na GCP, e um chatbot, baseado em Dialogflow, que é integrado no nosso Slack. Juntas, elas permitem a criação de pipelines de dados desde o início ao fim (integração, análise e visualização de dados), substituindo aquelas planilhas gigantes com inúmeros VLOOKUPs e referências externas no Excel. Assim, democratizamos o acesso a dados e entregamos informações nas mãos de milhares dos nossos colegas.

Mas não são apenas pessoas que acessam os nossos dados no BigQuery. A nova plataforma de dados representa o coração do nosso ecossistema de beleza, habilitando a troca de informações entre todos os elementos. Por isso, também criamos APIs e migramos todas nossas pipelines de ETL e ML para a GCP, implementando soluções open-source e substituindo produtos de prateleira da arquitetura anterior de dados do Grupo Boticário.

4. Governança de dados: dados como um ativo da empresa

Colocamos dados nas mãos das pessoas, e é uma consequência natural que novas informações serão criadas e compartilhadas, pois esse é o objetivo. Exemplo: um novo KPI que foi criado no sandbox de uma área precisa ser “promovido” para nosso ambiente produtivo. Como podemos garantir que isso não vire uma grande bagunça com novos silos, dados duplicados ou dados de baixa qualidade?

A solução é governança de dados: um conjunto de processos, políticas e ferramentas para gestão de dados. Aqui, nossa prioridade é ampliar o uso e aumentar a qualidade dos dados. Consequentemente, não queremos uma governança pesada, que seja um grande guardião que controla tudo, virando um impedimento na prática. Por isso, escolhemos um modelo mais ágil e moderno do qual fazemos o máximo possível em código, utilizando a nossa estrutura de DataOps. Felizmente, existe hoje uma abundância de ferramentas open-source para qualidade de dados, data discovery (aqui usamos Amundsen), monitoramento de pipelines e gestão de acessos de dados, reduzindo a necessidade de intervenção humana. Com a participação ativa das pessoas de todas as áreas na governança de dados, nós promovemos ownership a partir de responsabilidades claras.

Em resumo, uma boa estratégia de dados deve ser baseada na estratégia de negócio e nos resultados esperados.

Quer saber mais? Siga o nosso Medium gb.tech, no qual publicamos frequentemente novos artigos sobre dados e tecnologia, e dê uma olhada nas nossas vagas, para embarcar junto com a gente nessa jornada (de qualquer lugar do Brasil e remote first para sempre)!

--

--