Competição Data Science Challenge ITA

Matheus Mota
RanbookM
Published in
2 min readAug 7, 2020

A competição Data Science Challenge, organizada pelo professor Felipe Verri, é uma competição de de ciência de dados promovida anualmente desde 2019 pelo ITA.

A edição da competição de 2020 foi a respeito da construção de um modelo de aprendizado de máquina para manutenção preditiva de aeronaves. Depois de assinar um termo de compromisso, cada participante recebeu uma base de dados confidenciais fictícia baseado em dados reais da EMBRAER. Os dados correspondem em medições de sensores e mensagens da aeronave ao longo do tempo, com data e horários.

Durante o período da competição ocorreu vários seminários a respeito de tópicos relacionados a ciência de dados, ministradas pelo professor Felipe Verri. O primeiro seminário foi uma apresentação de todos os grupos e uma discussão a respeito da limpeza da base da dados.

Nos seminários seguintes, o professor trabalhou na base de dados e mostrou resultados, sem mostrar o resultado final da competição. Das informações obtidas dos dados analisadas em conjunto, chegou-se a um consenso de que o problema era de série temporal junto com regressão.

O professor ensinou como limpar a base de dados, como construir uma rede neural, como construir um modelo de classificação e como construir um modelo de regressão usando séries temporais. Em cada seminário era discutido propostas e tiradas dúvidas a respeito de como obter melhores resultados utilizando técnicas estatísticas.

A primeira fase da competição consistia em obter tempos de manutenção de aeronaves o mais próximos possíveis dos resultados reais e colocar os resultados na plataforma Kaggle. A segunda fase da competição foi o planejamento de como o projeto seria apresentado à EMBRAER, sendo necessário explicar como foi realizada a limpeza dos dados, como funciona o modelo de aprendizado utilizado, qual métrica melhor se adequou ao modelo e testes estatísticos a respeito dos resultados para atender ao requisito do problema, que era obter uma ordem de períodos de modo a ter o menor intervalo possível entre as manutenções.

Eu participei da edição de 2020 e gostei muito da experiência. Aprendi muitas ferramentas de aprendizado de máquina e cada seminário foi muito importante para aplicação e discussão de conceitos.

--

--