O mundo em crise: já parou para pensar como a Ciência de Dados mudou com a Pandemia do COVID-19?

Danilo Costa
Dadosfera
Published in
5 min readMar 24, 2020

Na história da humanidade, tivemos momentos de crise que modificaram a nossa sociedade de forma profunda: as duas guerras mundiais, a crise de 1929, o atentado às torres gêmeas em 2001, etc. A cada momento como o que passamos atualmente, nossos padrões estruturais mudam, e “outliers” acabam se tornando tendência, modelando e impactando nossos padrões comportamentais e indicadores de negócios. Estes que no passado nos forneciam inteligência e direcionamentos, hoje, tornam-se inverossímeis indicadores míopes que podem no guiar erroneamente.

Um exemplo clássico deste tipo de “guinada 180º” é o colapso do mercado financeiro em 1929, fruto de um modelo de produção pautado na criação de estoques sem planejamento referente a capacidade de absorção do mercado e nem os infinitos reveses globais que impactam essa capacidade de absorção.

Uma coisa é certa: quem não aprende com o passado, está fadado a repetir o fracasso no futuro.

“Porque o meu cálculo de CLTV está tão diferente do que estamos acostumados?”

O covid-19 está mudando o formato das tomadas de decisão

Embora o desastre de 29 já fosse algo previsível, assim como o COVID-19 e o potencial colapso dos sistemas de saúde, a grande maioria do público não se ateve aos sinais, e tememos que o mesmo esteja sendo feito agora com a esfera da ciência de dados.

O que estamos atualmente passando com a pandemia do Coronavirus está mudando rapidamente nossa sociedade, economia e, principalmente, nossos padrões de consumo e comportamento. Acredito que muitos dos que estão lendo estão em processo de adaptação ou já se adaptaram ao home-office, e estão seguindo as recomendações da Organização Mundial de Saúde, certo? Pois bem, já pararam para pensar que o “você hoje” é diferente de “você antes disso tudo”? Já parou pra pensar que além do home-office, você mudará drasticamente outros comportamentos do seu cotidiano?

Precisamos rever nossas estratégias

Mas o que isso significa então? O que isso tem a ver com ML?

Modelos matemáticos de machine learning são, em muitas organizações, as lentes dos óculos pelas quais as visões estratégicas dos departamentos de inteligência e B.I predizem o comportamento do mercado para desenvolvimento de táticas e estratégias que guiarão o rumo das ações de todos os departamentos, em direção ao sucesso da organização.

“Quebras estruturais em séries temporais”

As soluções de Machine Learning se baseiam em dados amostrais do passado para entender padrões e predizer possíveis cenários futuros. Com isso, mudanças profundas nas variáveis que são utilizadas nessa dinâmica afetam as respostas, uma vez que a ótica dos algoritmos e a forma com que os dados foram modelados remetem-se a uma outra realidade.

Séries históricas (vendas, acessos, ticket-médio, quantidade de horas assistidas em mídias digitais, etc), que antes possuíam padrões estáveis, podem ter rupturas que modificam sua estrutura original, e essas quebras podem acontecer de uma fase pré, durante e após um evento de pandemia. Ou seja, existe a possibilidade de mais de uma mudança.

Algoritmos e indicadores que antes representavam nossa realidade podem ser impactados diretamente e se tornarem obsoletos antes do tempo previsto, em outras palavras, os dados podem acabar apontando o caminho errado se nada for feito para atualizar seu modelo em relação à nova realidade.

Exemplos:

1 — Uma rede neural que previa valores futuros de vendas baseada nos últimos 6 meses de dados começará a divergir do valor previsto e do valor real, uma vez que a tendência de vendas e as variáveis consideradas na predição não levavam em consideração uma crise global.

2 — Um algoritmo de churn prediction em uma empresa de telecomunicações pode se tornar pouco assertivo, uma vez que não se esperava a mudança brusca de consumo que seus clientes passaram a ter ao permanecerem em suas casas, ou mesmo uma desaceleração inesperada da economia.

“As mudanças bruscas de comportamento podem deteriorar várias soluções baseadas em dados”

O que inevitavelmente irá acontecer é: a revisão sistemática de muitas soluções que já estão em fase produtiva, mas que por todos os motivos citados anteriormente perderam seu potencial preditivo e pereceram devido ao novo cenário brasileiro e global.

Dicas para manter tudo em ordem

Muita atenção agora em alguns pontos que podem ser vitais para que o seu vagão não saia do trilho.

Existem algumas diretivas que vão se tornar vitais nesse período:

  • Se não existe acompanhamento ainda das métricas de modelo e de negócio, é primordial que isso seja feito o quanto antes
  • Reavalie as features escolhidas e possíveis novas variáveis externas que podem adequar o modelo à nova realidade
  • Revise a modelagem utilizada e o possível viés que um evento atípico pode trazer nos resultados. Ex.: Idosos em grupos de risco deixando de consumir produtos em momentos de resguardo podem ser prejudicados em algoritmos de risco de crédito
  • Revise a periodicidade e granularidade das variáveis que o(s) modelo(s) utiliza(m). Por exemplo, se a solução utiliza as vendas diárias dos últimos 6 meses, provavelmente o último mês será impactado e causará uma ruptura e possível degradação
  • Considere criar modelos diferentes para períodos antes, durante e após mudanças estruturais de dados, além de avaliá-los
  • Avalie a frequência de treinamento. Ex. Se um modelo costumava a ser atualizado a cada mês, talvez seja melhor aumentar essa frequência em dias, horas ou mesmo optar por algoritmos de aprendizado on-line

Por fim, é importantíssimo à você, que se utiliza de modelos matemáticos para produção de inteligência na predição de comportamento para tomada de ações e desenvolvimento de estratégias, faça a revisão de seus modelos, uma vez que as lentes dos teus óculos possam estar começando a ficar “embaçadas” sem você notar.

Artigo escrito por:

Danilo C. M. Segura — Lead Data Scientist @DataSprints

André Gortari — Data Project Manager @DataSprints

--

--