Os melhores links da semana #3

Os melhores links da semana de 25 a 31 de Março de 2019!

Olá p-essoal! Sexta-feira chegou e mais uma edição dos melhores links da semana :-).

Mas o que é isso!?

Cientista de dados isso, cientista de dados aquilo. Se você acompanha o Data Hackers, já deve ter lido essa palavra muitas vezes. Já deve ter se perguntado (e obtido respostas através do material que o Data Hackers produz) várias coisas sobre ciência de dados mas aqui vai uma que talvez você não saiba: De onde veio esse nome cientista de dados?!

Dados, dados, dados ❤

Quem acompanhou os links das últimas semanas deve ter visto material sobre obtenção de dados para análise e análise de dados dos trens de São Paulo. Trago para vocês essa semana uma notícia boa! A RATP (empresa responsável pelos transportes públicos em Paris e nos seus arredores) é data friendly! O sistema de metrô de Paris é um dos 10 maiores do mundo, e a RATP opera também em outros países, totalizando mais de 16 milhões de viagem por dia! Em semanas anteriores, vocês viram sobre o Google dataset Search, mas no blog oficial da Google aqui eles escreveram um pouco mais sobre essa nova ferramenta. E não para pro aqui! A universidade de Harvard também tem se mostrado data friendly! Eles tem um repositório chamado de “dataverse” com mais de 80.000 datasets!!! Happy hacking ;-)

Networking

É evidente nos dias de hoje que networking deve fazer parte do dia a dia de qualquer profissional. Troca de cartões, conhecer novas pessoas, possíveis parceiros, aprender coisas novas e receber críticas construtivas sobre o que você está fazendo. Fundamental! Aqui você vai encontrar uma lista de encontros regulares que ocorrem ao redor do mundo onde o tema principal é ciência de dados! E se sua ferramenta de trabalho diária é o R, aqui você encontra uma lista de grupos de usuários de R que também costumam se encontrar regularmente.

Vamos analisar!

Durante suas análises, você deve ter se deparado tanto com situações onde você usa datasets de outras pessoas como também datasets que você montou, construiu, coletou. Em ambos os casos, é importante entender sobre metadados.

Se você usa R, com certeza já topou com os “malditos” factors. Muito script em R que vejo por aí já vem com o stringsAsFactors = FALSE por padrão. Mas será que esses factors são inúteis mesmo? Entenda aqui por que eles podem ser super legais!

Se você já teve que lidar com dados desbalanceados e não soube o que fazer, essa leitura pode te ajudar! E para terminar a seção com uma análise de fato, nessa febre de podcasts não é de se surpreender que já teve gente analisando-os!

Oportunidades!

Essa semana trago uma novidade para vocês que é uma seção para links de oportunidades que chegaram a mim. Segue:

  1. Pós-doutorado financiado pela BMBF em Machine Learning, Biologia Computacional, redução de dimensionalidade e modelagem de espaço latente para single-cell (biologia & genômica).
  2. Projeto financiado pela BMBF em Machine Learning na linha de single-cell (genômica).
  3. Posição de Cientista de Dados para atuar em machine learning na área biomédica e computação de alta performance.
  4. Posição de Cientista de Dados na Colômbia!

Como vocês sabem, essa série é uma versão resumida e mais contextualizada da série Best Links of the Week do meu blog pessoal. Caso queiram uma versão mais crua, mas mais extensa e completa, é só checar lá! Tem links fora da temática de data science também!

Espero que tenham gostado, e até mais [links]!