Minha primeira competição de dados

Christiano Peres
4 min readJan 9, 2024

--

No final de 2023, eu participei de uma competição de dados (primeira vez participando de uma), decidi espantar a síndrome do impostor e me abrir para fazer networking. Nesse post, conto mais detalhes da minha primeira experiência numa competição de dados.

Primeiramente, quero dizer, que se você está em transição de carreira para um novo mundo (assim como eu), é super importante fazer parte de uma comunidade. Estar em contato com pessoas que também compartilham o mesmo objetivo, compartilhar os problemas, desabafar e principalmente, criar relações, fazem toda diferença.

Num futuro post, vou falar mais sobre como está sendo minha transição de carreira. Voltando, no final do ano passado, eu decidi entrar na Comunidade DS, as quais compartilham os mesmos valores e objetivos que busco. E menos de 2 meses após entrar para a comunidade, decidi encarar de frente algumas limitações que minha cabeça havia colocado ali, me inscrevi para minha primeira competição de dados da Comunidade DS: O Hackday.

Hackday é um evento onde os alunos da comunidade formam times para resolver um problema de negócio de uma empresa, usando os conhecimentos em Ciência de Dados, dentro de prazo de 48h. Basicamente é um fim de semana dedicado a resolver um problema de negócio real.

Antes de realizar minha inscrição para o evento, a síndrome do impostor havia me pegado forte. Como estava no meu inicio da jornada na Comunidade DS, havia concluído apenas o projeto que demonstro minhas habilidades em Python, comecei a ter pensamentos limitantes, de que não conseguiria contribuir de forma significativa para o grupo, de que não era capaz de estar num evento desse porte, então comecei a me dar desculpas para afagar minha limitação. Desculpas como “No próximo evento estarei mais qualificado e participarei”, começaram a rondar minha cabeça, então, tive a percepção dessa ruminação de pensamentos, e assim como faço para todos pensamentos, dei um tempo, fiz uma mini meditação e encarei o pensamento da maneira mais lógica possível.

Faz sentido eu ter esse tipo de pensamento, mas percebi que ele estava me limitando, então não pensei muito, e só fui !! Me inscrevi para o evento, com os objetivos bem definidos: Ir mais pelo evento, para ver como funciona o trabalho em equipe na área de dados, para conhecer pessoas e trocar experiências, e espantar a síndrome do impostor.

No evento, tive a oportunidade de conhecer pessoas maravilhosas (Ian, Paula, Victor e Vinícius, se estiverem lendo isso, um grande abraço), as quais fizeram parte do meu time. Fiquei muito surpreso positivamente, pois pensei que não conseguisse ajudar muito, mas consegui dar boas contribuições.

Basicamente tivemos o seguinte problema de negócio: Fomos contratados como cientistas de dados do conglomerado de lojas, EletroPlaza, para criar um modelo de machine learning que preveja as vendas semanais para as últimas 5 semanas do ano, considerando o período de Black Friday e Natal, onde o consumo aumenta exponencialmente. Os dados foram disponíveis em plataforma pública de dados: https://www.kaggle.com/competitions/test-hackday-7/overview

Pois bem, eu tinha um conhecimento teórico no modelo de machine learning em questão: A regressão linear. Mas havia aplicado apenas uma única vez, no meu artigo científico que está sendo publicado num periódico científico. E só.

Foi um fim de semana diferente, nos reunimos logo cedo, trocamos experiências, ideias, aprendi bastante, e acabei fazendo networking. Não vou entrar muito na parte técnica de como resolvemos o problema, pois esse não é o objetivo desse post, mas se quiserem saber mais, um dos integrantes do meu grupo, o Ian, colocou tudo no Github, tá tudo lá bem explicado. Link: https://github.com/ChristianoDS/hackday_7_sales_prediction_regression

No final, conseguimos a terceira colocação no evento. Ah, e o nome do nosso grupo foi UMD (Unidos dos Magos dos Dados, olha o carnaval ai hehe).

Mas o resultado final não foi nossa colocação no ranking, e sim o saldo muito positivo de ter conhecido pessoas sensacionais, de ter visto como é criado uma solução real de um modelo de machine learning (sim, um problema real não é aquele que vemos muito em teoria, que tem alguma feature com correlação forte com nossa variável alvo, e sim, um problema que você não encontra nenhuma variável com correlação com sua variável alvo, ai entrou em ação a criação de novas features, e mais soluções práticas). Mas para mim, foi muito especial, pois espantei a sindrome do impostor, e consegui fazer ótimos contatos. Fica a dica, participem de eventos, de competições, espantem a síndrome do impostor.

Até a próxima !!

See you in data space… Cowboy

--

--

Christiano Peres

Data Scientist | Data Enthusiast (spreading the data-driven culture)