Cientista de Dados no Itaú e as Horas de Estudo

Alceu Ferraz Costa
itau-data
Published in
3 min readDec 7, 2021

No Itaú, adotamos a prática de reservar oito horas por semana para que os Cientistas de Dados se dediquem a estudos. Neste post irei contar um pouco sobre a motivação por trás das horas de estudo e como elas funcionam.

Começando pelo contexto: a Ciência de dados é uma área que evolui bastante rápido. Não é raro que ferramentas e algoritmos que em um momento são consideradas estado da arte fiquem obsoletos com o surgimento de novas técnicas.

Nesse sentido, uma experiência que me marcou bastante se deu no campo da Visão Computacional. Comecei meu mestrado no ICMC da USP de São Carlos em 2010. O meu projeto de pesquisa consistia em desenvolver algoritmos para análise de imagens médicas (acabei focando em tomografias para diagnóstico de doenças pulmonares). Boa parte do meu trabalho envolveu algoritmos para extração de features das imagens que serviriam como input para classificadores.

No entanto, em setembro de 2012, um algoritmo chamado AlexNet ganhou a competição de reconhecimento de objetos ImageNet com um erro de classificação mais de 10 pontos percentuais menor que o segundo colocado. Além da margem de erro, considerada bastante impressionante, também chamou a atenção a técnica utilizada pelos autores da AlexNet: as Redes Neurais Convolucionais (ou CNNs da sigla em inglês Convolutional Neural Networks). O sucesso da AlexNet foi altamente influente. As CNNs, que até então eram pouco difundidas, passaram a dominar o campo da Visão Computacional. Já as soluções mais “artesanais” de desenvolvimento de features, como fiz em meu mestrado, ficaram cada vez menos populares.

A Ciência de Dados evolui bastante rápido. Ferramentas e algoritmos podem ficar obsoletos com o surgimento de novas técnicas. A figura ilustra imagens do dataset da competição ImageNet e as predições realizadas pela rede AlexNet que foi extremamente influente no campo da Visão Computacional (fonte Krizhevsky et al. 2012).

Essa minha experiência ilustra como é importante acompanhar a evolução da Ciência de Dados para manter-se atualizado. Considero que ler blogs e artigos científicos é excelente para se ter uma visão abrangente de tudo o que está acontecendo. No entanto, muitas vezes queremos ou precisamos nos aprofundar em algum tópico. Para esse fim, existem várias abordagens:

  • Fazer uma pós-graduação;
  • Colocar a mão na massa: desenvolver algum projeto utilizando a tecnologia que queremos aprender ou brincar com um determinado dataset para fixar o conhecimento de algum algoritmo;
  • Estudar para uma certificação;
  • Realizar um curso online;

Ou seja, manter-se atualizado no campo da Ciência de Dados demanda tempo. Por este motivo, todo Cientista de Dados do Itaú tem direito a 8 horas de estudo por semana. Essas horas podem ser distribuídas na semana de acordo a necessidade do Cientista e do time.

O Thiago Lira, por exemplo, faz parte do time de Ciência de Dados do Itaú que trabalha com Processamento de Linguagem Natural (NLP na sigla em inglês). Ele conta que utiliza as horas de estudo para se aprofundar em tópicos de NLP e para o desenvolvimento de projetos pessoais. Um dos projetos desenvolvidos consistiu em fazer um fine-tuning da rede GPT-2 para gerar roteiros de episódios de Pokémon. Com essa rede é possível propor um tema (ex.: “o Pikachu foi preso por sonegar impostos”) e gerar roteiros de episódios automaticamente.

Os Cientistas de Dados do Itaú utilizam as horas de estudo de diversas maneiras como, por exemplo, cursar pós-graduação, aprofundar em tópicos de interesse ou estudar para certificações.

Já o Thiago Rizuti, que também é Cientista de Dados no Itaú, conta que utiliza grande parte das horas de estudo para o desenvolvimento do Mestrado na UFABC. O projeto de pesquisa consiste no desenvolvimento de técnicas para sistemas de recomendação baseadas em co-clustering e algoritmos evolutivos. No começo do mestrado o Thiago utilizou as horas de estudo sobretudo para cursar disciplinas, incluindo Metodologia de Pesquisa Científica, Mineração de Dados, Inteligência Artificial e Fundamentos de Matemática. Agora que está na reta final do mestrado, as horas estudo tem sido empregadas para realização de experimentos e escrita da dissertação.

Nem sempre existe uma ligação direta entre o que o cientista está estudando e o projeto que está desenvolvendo no momento. No entanto, as horas de estudo permitem que os cientistas do Itaú continuem se desenvolvendo tecnicamente e acompanhando as novidades do mercado e da academia. Acredito que isso faz a diferença na qualidade das soluções de Ciência de Dados desenvolvidas no Itaú.

Qualquer opinião, resultado, conclusão ou recomendação expressa neste artigo é de responsabilidade do autor e não reflete necessariamente o ponto de vista do Itaú Unibanco S.A.

--

--