Aplicando Machine Learning para Prever Inadimplência em Crédito Pessoal

Leonardo Janes Carneiro
Somos Tera
Published in
3 min readJan 5, 2021

Um relato da evolução do aprendizado e absorção do conhecimento durante o bootcamp Data Science e Machine Learning da Tera. [Parte I]

O presente artigo é o primeiro de uma série cujo objetivo é relatar a evolução do aprendizado e absorção do conhecimento de Ciência de Dados durante o bootcamp da Tera, bem como sua aplicação no projeto realizado por Alexandre Doria, Robson Fernandes, Miqueias Lima, Matteus Martins, Adams da Cruz e Leonardo Carneiro.

Nosso projeto tem por objetivo propor um modelo capaz de prever se um potencial cliente de uma fintech é inadimplente. A performance do modelo é crucial para que se possa reduzir a incerteza da fintech a respeito da capacidade de seus clientes em honrar pagamentos.

Introdução

Atualmente, no Brasil, vivemos num cenário de taxas de juros e de inflação historicamente baixas, com poucas alternativas de investimento gerando um retorno monetário razoável. Soma-se a isso uma crise econômica que se agravou com a pandemia de COVID-19, que causou significativas demissões e falências.

Segundo pesquisa realizada pelo Sebrae, 31% das empresas mudaram o funcionamento e precisaram se adaptar para manter a saúde financeira. A pandemia de coronavírus mudou o funcionamento de 5,3 milhões de pequenas empresas no Brasil, o que equivale a 31% do total. A pesquisa também revelou que a situação financeira da maioria das empresas (73,4%) já não estava boa antes mesmo da crise da Covid-19. Quase a metade dos empresários (49%) respondeu que as finanças estavam razoáveis, enquanto 24,4% responderam que estavam ruins.

Situação financeira das empresas pré-pandemia

Um volume significativo de empresas, 5,1 milhões, já tentaram buscar empréstimos para se manterem funcionando. Porém, apenas 567 mil conseguiram e outras 1,5 milhões ainda estão aguardando resposta.

O mundo entrou (e ainda continuará por algum tempo) na pandemia de COVID-19, causando desequilíbrios nas pessoas, na economia, no País e no mundo. O reflexo de toda essa situação gerou e continuará gerando crescentes demandas por crédito, que auxiliaria essas pessoas e empresas a superarem momentos de dificuldades.

Diante de uma demanda substancial por crédito, muitas empresas do setor financeiro aproveitaram a oportunidade para se lançar no mercado de crédito, buscando atrair clientes para os seus produtos. Porém, ao passo que a demanda por crédito tem aumentado, existe também uma parcela considerável da população que é inadimplente ou com potencial inadimplente. Isto é, não honra seus compromissos financeiros ou, diante das adversidades da economia, tem potencial para não honrar.

Problema de Negócio

A FINTECH X (seu verdadeiro nome será mantido em sigilo) é uma empresa que alia finanças a tecnologia e se destaca no mercado, principalmente por investir em crédito, que sempre teve um amplo domínio de bancos tradicionais. Logo, se por um lado a FINTECH X poderia aumentar seus lucros emprestando dinheiro para um número maior de clientes, por outro lado ela pode tomar prejuízo caso não escolha cuidadosamente seus clientes, visto que uma parte destes podem não ser bons pagadores.

Como forma de evitar o comprometimento de seus lucros com operações de risco, projetamos uma solução que utiliza Machine Learning para análises preditivas, por meio da construção de um modelo que possa efetivamente prever o grau de risco associado a um cliente em potencial para a FINTECH X. As etapas que envolvem o desenvolvimento deste modelo consistem de coleta de dados a respeito dos clientes para o treinamento do algoritmo de previsão e, posteriormente, para a sua validação e teste. Estes dados serão obtidos por meio de questionário enviado a todos os novos clientes interessados em abrir uma conta na FINTECH X.

--

--

Leonardo Janes Carneiro
Somos Tera

Economist, aspiring data scientist. Looking for the right questions to ask.