Como é ser um data scientist na academia

Entenda os principais desafios e vantagens de ser um cientista de dados na academia

Photo by Patrick Tomasso on Unsplash

Apesar da visão geral de data science em grande parte ser voltada para empresas, no geral ela tem um papel muito importante nas ciências como um todo, afinal ciência é levantar dados a partir de uma hipótese e com esses dados gerar uma teoria. Contudo, eu não vou ficar falando de método científico nem nada do tipo. Eu quero contar minha experiência na academia como data scientist.

Primeiramente, deixa eu me apresentar: eu sou o João Pedro Sobrinho, sou novo aqui no Data Hackers e quero apresentar uma visão diferente de data science, uma visão mais acadêmica. Bom, como já contei no meu Medium e como vocês podem ver em meu LinkedIn, eu faço um curso de engenharia e atualmente trabalho em duas frentes de pesquisa: de data science e de deep learning, sendo a primeira em foco aqui nesse post. Em resumo, eu basicamente pego os dados gerados na pesquisa e crio modelos para saber se eles são válidos ou não.

Então, vamos para esse artigo que vou te contar os principais problemas primeiro, claro sempre falando uma solução, e as vantagens que a gente tem nessa área. Vamos lá!

Alguns problemas

Ferramentas e Linguagens

Minha cara ao ver as pessoas usando Minitab

Quando comecei eu me assustei um pouco com um fator bem peculiar: na pesquisa cientifica, geralmente, as pessoas não trabalham com os programas ou ferramentas populares que se tem no mercado, por exemplo, quando eu comecei quase ninguém conhecia Python, Hadoop ou SAS. No geral a comunidade prefere lidar com programas e linguagens livres ou que são mais fáceis de manusear como R, Excel (no caso Libre, sim Libre) e Minitab, ele mesmo. Por conta disso eu tive um momento muito longo de adaptação e de fazer as pessoas se adaptarem as coisas “mais novas”, com isso atualmente eu sou “um dos responsáveis por popularizar o Python na minha faculdade” e essa foi minha primeira dificuldade encontrada.

Isso muito provavelmente se deve pelo fato de não se ter muita verba para as universidades, como vou comentar abaixo, geralmente o dinheiro nas faculdades é pouco e não se tem como comprar licenças mais caras, por exemplo, mas uma boa opção nesse caso é fazer o que acabei adotando, trabalhar com linguagens e ferramentas livres, mas melhores, como Python.

Os dados em geral

Um segundo problema e que provavelmente deve ser o parecido com o que se é encontrado por pessoas que trabalham no mercado é como os dados chegam pra você. Geralmente as pessoas que pegam os dados não sabem manusear o programa e alguns erros podem vir nos dados como, ao invés dos dados estarem em linhas e ordenados em colunas, eles são colocados em colunas e ordenados por linhas, e com isso você tem que ficar transpondo a tabela para poder trabalhar, ou mesmo as vezes alguns dados não são passados por falta de atenção, gerando valores nulos ou discrepantes.

Claro isso não é culpa de ninguém e pode ser evitado se você tiver como dar algum treinamento, o que muitas vezes é difícil, pois a pessoa que obtém os dados geralmente está longe da onde você está e você não tem verba para ir até ela dar o treinamento. Caindo no problema financeiro novamente.

Falta de verba

Para aonde foi minha grana?

E caímos, finalmente, no último problema que é a verba, geralmente quando se fala de mercado o que vem a cabeça é uma quantidade de dinheiro maior que nas universidades, se você quiser fazer uma pesquisa você tem que entrar em um edital, tomar cuidado para não ter nenhum erro de documentação, para poder tentar uma bolsa, e no geral isso é bem difícil, alem de verba para publicar, etc. Nisso não tem como passar panos quentes, infelizmente a pesquisa em nosso país é desvalorizada demais e é um cenário tenebroso nesse ponto.

Uma solução que está sendo pensada agora são parcerias publico-privadas aonde as empresas bancam as pesquisas e as universidades dão algo em troca, seja uma ferramente nova, uma técnica nova, ou algo do tipo, é uma aposta bem forte atualmente.

E esses são os principais problemas que eu encontrei ao cair dentro da pesquisa cientifica na universidade. Mas, nem tudo são coisas ruins no geral existem coisas boas e é delas que vamos falar daqui pra frente.

Vantagens

Pode aprender sozinho e se destacar

A primeira coisa que podemos citar é que se você tiver disposto a estudar você não precisa ter certificados de nada, literalmente, afinal as pessoas partem do pressuposto de que você está desenvolvendo seu conhecimento dentro da própria universidade, então eu mesmo quando comecei eu estudei tudo por conta própria em livros e só atualmente que faço alguns cursos, não só pelo certificado, mas para expandir meus conhecimentos e entender melhor com o conhecimentos passado de uma forma diferente, mas se você quiser ficar na carreira acadêmica e “não quiser gastar dinheiro” isso é bem possível.

Isso também é possível no mercado viu, existem maneiras de se aprender sem gastar nenhum centavo e ser reconhecido (fica a dica)! E outra, certificado não te faz especialista, existem pessoas que tem cursos e mais cursos e no final não sabem colocar em prática o que aprendem, só um disclaimer.

Interdisciplinaridade

Café, minha área de pesquisa atual e a bebida que move o conhecimento.

Há o que é pra mim a maior vantagem é a interdisciplinaridade. Eu mesmo trabalho analisando dados da biologia, com isso eu me vejo obrigado a aprender um pouco sobre a mesma, mais especificamente sobre cafés, e por conta disso você tem uma interdisciplinaridade que te faz sair da zona de conforto e ter que aprender coisas alem do que você realmente deve saber para poder desenvolver alguma aplicação. Essa é pra mim a uma das maiores vantagens que têm, quiçá a maior.

Criar novidades

Uma outra vantagem que se tem, e essa é bem massa também, é quando se cria alguma coisa, no geral, naquele instante de segundo só você conhece aquilo, pode parecer um pouco individualista, mas juro que não é, de longe é uma das maiores sensações que se tem. O físico data scientist Caio Gomes que trabalha na Amazon falou uma vez em um Nerdcast uma frase do tão famoso Stephen Hawking que é: “Quando se cria algo é como se você tivesse a mesma sensação de ter um filho, naquele instante, naquele momento, só você sabe aquilo, só você conhece e você criou”.

Eu não tenho filhos, nem fiz metade das coisas que Hawking ou Caio já fizeram, mas uma coisa eu garanto é a certeza que o que eles falam é real e verdadeiro.

Conclusão

Bom acho que já falei demais, certo?! Eu quis passar algumas coisas que acabei passando nessa “carreira” acadêmica. Eu não pretendo ficar nela, talvez faça mestrado e doutorado, mas pretendo ir para o mercado. Contudo, com toda certeza ainda pretendo fazer pesquisas, nem que seja em casa, lendo bastante artigos e colocando coisas em prática.

Algo interessante a se citar aqui é: leia e leia muito. Leia artigos, livros, posts, entre outras coisas. Mesmo que aquilo não tenha muito haver com o que você trabalha, só aprendendo que a gente evolui.

A vida na academia não tem glamour, não tem luxos, mas posso te garantir que pequenas coisas nelas fazem você evoluir e aprender sempre mais e mais, podem ter certeza que o aprendizado adquirido é gigantesco e isso ninguém te tira, a gente apanha muito, mas no final é muito satisfatório.

Os quatro de quem falo abaixo

Se quiser saber mais sobre como é ser um cientista, como uma visão mais ampla, você pode ouvir esse Nerdcast 475 com os brilhantes Caio Gomes, Atila Iamarino, Paulo Miranda (Aka Pirula) e André Sousa, sendo o ultimo uma inspiração pessoal pra mim, onde eles contam as experiencias deles na academia e o que cada um passou. Ainda, se como eu você for tarado em Nerdcast, você pode ouvir o outro N⁰ 634 com o André e o Caio sobre a profissão de cientistas no mercado, mais especifico em empresas de tecnologia, que é brilhante também.

No mais é só isso pessoal, qualquer duvida podem me mandar no LinkedIn ou entrar no meu Medium que ainda pretendo contar mais histórias por lá e, quem sabe, aqui também. Agradeço o pessoal do Data Hackers pela oportunidade e até mais!