Data Science na crise: o que a Quero tem feito para conter as consequências da pandemia

Marcus Oliveira
Tech at Quero
Published in
8 min readMay 21, 2020

Com previsões, agilidade e reorganização do time, estamos contribuindo para conter os efeitos da crise atual

A crise pegou todos de surpresa e obrigou a sermos pragmáticos e racionais para traçar planos certeiros em um momento de incerteza. E, ao entrar em ação, o time de Data Science da Quero montou linhas de frente para tratar das consequências da pandemia antes mesmo que elas chegassem.

E foi mais uma vez utilizando um dos valores da cultura da Quero Educação que baseamos nossos planos. O “Primeiro, O Básico Bem Feito” ganhou muito mais força neste momento, mesmo ele já sendo um valor bastante importante para o time de cientistas de dados.

Chegou a hora de focar no trade off entre experimentação e entrega de resultado, garantindo que todas as linhas de frente explanadas abaixo pudessem ser atacadas para colher resultados positivos e manter nossa empresa saudável: trazendo ganhos, sem gerar muitos gastos.

Antes de tudo, as regras do jogo

Se nos basearmos no indicador PMI (Purchasing Managers Index), ao medir o grau de consumo durante a crise do covid-19, entendemos que a recuperação do mercado deverá acontecer somente em abril de 2021. Preocupante, não é mesmo?

PMI (Purchasing Managers Index) após a crise de saúde

Independente da clareza de resultados deste indicador ou não, resolvemos antes de tudo olhar para as seguintes regras do Manual de Machine Learning do Google antes de nos posicionarmos em nossas linhas de frente.

Rule #1: “Don’t be afraid to launch a product without machine learning.”

Rule #2: “First, design and implement metrics.”

Rule #3: “Choose machine learning over a complex heuristic.”

Com a munição pronta, é hora de partir para o ataque em: agilidade, olhar para o futuro, reorganização/engajamento e low hanging fruits. E, assim, nosso time de Data Science vem ajudando a empresa tanto no backoffice quanto os clientes finais.

Linha de frente # 01: Agilidade

Neste momento, devemos ser ágeis para resolver problemas e criarmos experimentações. Não podemos perder tempo, pois está mais que claro que a crise, com força, veio para ficar por algum tempo.

Seguindo as regras do Google acima, no nosso dia a dia ao atacar problemas, uma heurística às vezes pode funcionar perfeitamente para resolver um problema. Seguindo esta lógica, Henrique Costa, da tribo B2B, se uniu aos times de Business Intelligence e comercial para fazer melhorias na plataforma que ajuda as instituições de ensino da Quero Educação.

Plataforma de utilização das instituições de ensino

Assim, foram montadas as bases e o racional para criar heurísticas criando um rótulo de competitividade de preço. E isso foi feito sem a utilização de modelos de machine learning complexos. Focamos na necessidade do negócio e no que já tínhamos em mão, utilizamos a heurística do time comercial e racionalizamos tudo para criarmos um produto, um novo painel para as instituições de ensino entenderem se seu preço está competitivo.

Já a tribo do B2C, nas mãos dos data scientists Thiago Sato e Luan Fernandes, montou um framework de experimentação utilizando o teste bayesiano. O resultado foi, em média, um tempo de experimentação cinco vezes menor, como mostra a tabela abaixo.

Comparando, se fôssemos utilizar um modelo frequentista, precisaríamos de 124 dias para conseguir a base de usuários necessária para termos o poder estatístico necessário. Desta forma, em apenas 23 dias chegamos a uma conclusão de negócio.

Em outras palavras, em um cenário de pandemia, no qual a base de usuários fica reduzida, o número de acessos também fica menor. Com a estatística bayesiana, temos contribuído para aumentar a produtividade da empresa, da Engenharia e do Produto.

Linha de frente #02: Low-hanging fruits

Às vezes a solução está bem em nossa frente e não enxergamos o quão valiosa ela pode ser. Baseando-se nesse preceito, outro data scientist da tribo B2C, Kelvyn Rosinski, focou nas buscas do Quero Bolsa que não tinham nenhum resultado e transformou-as em uma nova solução.

Exemplo de resultado sem busca no site Quero Bolsa

Esse tipo de busca representa 10% das buscas totais de nossos usuários e, para não perder esses usuários, vamos criar recomendações para este caso. Por exemplo, se o aluno não achou o curso naquela cidade, o site recomenda o mesmo curso em uma cidade próxima ou um mesmo curso EaD. Vamos reutilizar um algoritmo de recomendação que já havia sido criado anteriormente, preparando acionáveis para reverter essas buscas sem resultado.

Resultado da busca com recomendações

Além disso, com a finalidade de reduzir custos a longo prazo, também estamos mirando em automação. Luan Fernandes, data scientist da tribo B2C, tem trabalhado na automação da comunicação com nossos clientes finais. Utilizando o framework do Rasa, criamos um chatbot com a Engenharia e o Produto. Nosso papel é criar testes para levantar os primeiros experimentos com um chatbot automatizado na seção de dúvidas de nossos usuários.

Experimentos com o chatbot da seção de dúvidas dos usuários do Quero Bolsa

O resultado é a redução de custo final, facilitando o acesso ao usuário com a automatização de processo. Em outras palavras, o aluno não precisará aguardar a disponibilidade de um guia do aluno para responder suas dúvidas.

Linha de frente #03: Olhando para o futuro

Desde o início da formação do time de Data Science da Quero Educação, lidamos com a sazonalidade semestre a semestre. Devemos entender quais são os meses de alta e os meses de baixa para assim antever o futuro.

Nosso cotidiano se resume em decompor a série temporal em vários componentes, entender qual é a tendência de crescimento, qual é o mês que mais influencia, qual é a sazonalidade do dia da semana, qual a sazonalidade mensal para nos ajudar a ter uma previsão de visitas, estoque e vendas para cada mês do ano.

O resultado disso é a possibilidade dos times de Business Intelligence e comercial de se planejar, criando metas quinzenais e não mais metas maiores de longo prazo. Dessa forma, entender a sazonalidade é essencial para nosso trabalho, entendendo como devemos performar a cada dia para ter saúde financeira de acordo com cada momento da crise.

Previsão e cenários para o Melhor Escola

Além disso, Celso Silva, data scientist do Melhor Escola (o Quero Bolsa do ensino básico), utilizou a estatística bayesiana com com pouquíssimos dados (cerca de 15 escolas) e conseguiu fazer uma previsão de caixa para esse setor da empresa.

Com a distribuição de mensalidade e captação, usou conhecimento a priori para conseguir fazer tal previsão. Utilizando a modelagem bayesiana, prova-se que é possível um time de data science contribuir na análise estatística robusta mesmo com poucos dados e, assim, ajudar os stakeholders na tomada da decisão.

Ainda nessa linha, Rodrigo Takeshi, data scientist do Quero Pago (nossa solução financeira de cobrança e de admissão digital) está atuando na modelagem da evasão e inadimplência dos alunos.

Com essa tecnologia vamos conseguir dar inteligência para as instituições precificando o risco dos alunos nesse momento incerteza, usamos todo o know-how e dados históricos para traçar o perfil de risco dos usuários finais. Isso maximiza nossa comunicação e torna nosso produto mais direcionado para a necessidade financeira e realidade de cada pessoa/instituição.

Linha de frente #04: Reorganização e engajamento

O time de Data Science está distribuído nas várias squads e tribos da Quero Educação e manter a equipe engajada pode ser um desafio. Para fazer isso acontecer, fazemos a troca entre projetos de longo prazo e o que conseguimos atacar agora.

Primeiramente, como estamos vivendo um momento de crise, foi necessário reorganizar as prioridades para fazermos um bom balanço entre curto, médio e longo prazo. Exemplos de itens da lista de prioridades estão criação de modelos de machine learning para ranqueamento da busca, recomendações, modelo de evasão e sugestões de precificação das ofertas.

A partir disso, reorganizamos nosso time para buscar maior engajamento. Montamos duplas em organização horizontal para atacarmos problemas específicos e criar novas soluções, em vez de cada um trabalhar focado em sua squad. Tudo isso é alinhando e definido na nossa chapter de Data Science. Essa abordagem trouxe engajamento, compartilhamento de conhecimento e robustez para os cenários propostos.

Batalhas diárias e pequenas vitórias

Em um momento de crise, cada dia vivemos uma pequena vitória. E, para isso, é necessário focarmos em nossas pequenas batalhas diárias para alcançarmos resultados mais assertivos.

Assim, dia após dia, nossa estratégia de combate é trabalhar com agilidade, utilizando Data Science para maximizar as entregas, melhorar a vida dos alunos, das IES e de todos os times da empresa (Produto, planejamento comercial, etc), fazendo previsões com seu time reorganizado.

O resultado disso é a vitória de batalhas diárias que me faz acreditar que, quando essa crise passar, a Ciência de Dados será ainda mais essencial para as empresas já que ela modela o futuro, traz inovação e entende de forma rápida e responsiva cada momento vivido em nossos negócios.

Somos um time forte

Por fim, gostaria de destacar a importância de ter um time sólido, unido é inteligente para combater em pequenas e grandes batalhas. E, felizmente, o time de Data Science da Quero conta com pessoas brilhantes e amigas.

A contribuição de cada um vem pouco a pouco montando uma base sólida para gerar produtos de dados essenciais para o contexto de Educação no Brasil.

Conheça mais sobre nosso time de Data Science no vídeo abaixo.

--

--