Dados, Blogs e análise de dados com R — Os melhores links da semana #10

Os melhores links da semana de 20 a 26 de Maio de 2019!

Marcel Ribeiro Dantas
Data Hackers
3 min readMay 31, 2019

--

Olá p-essoal! Sexta-feira chegou e mais uma edição dos melhores links da semana :-).

Bolo bom, é bolo com recheio bom!

Não adianta dominar as melhores técnicas de análise de dados, ter toda uma metodologia inovadora do que fazer, juntar as melhores mentes para fazer aquela análise e.. não ter dados. É como um bolo bonito sem recheio, sem nada dentro. Ás vezes até tem dados, mas não como você quer ou na área que você está buscando.

Abre a sacola, que hoje tem dataset sendo distribuído por aqui!!! Independente se o que você procura são dados governamentais, para processamento de linguagem natural, dados de saúde ou de transporte! Aqui você vai entrar 25 datasets para testar aquele algoritmo novo que você estudou e quer praticar! As nações unidas (ONU) também são data-friendly! Checa aqui os datasets que eles disponibilizaram!

Sugestão de leituras

O pessoal do CybrHome estão curando uma lista com mais de 200 blogs de Data Science! Vale a pena checar. A lista é encabeçada por uma outra lista de 20 blogs que eles mencionam ser de leitura obrigatória!!!!

Análise de dados com R

Se você está começando a estudar R, ou ainda acha que precisa fortalecer sua base, o Nick Tierney criou uma página com vários links para quem está querendo aprender mais R! Recomendo!

Quem leu o meu texto onde realizei uma breve análise dos decretos presidenciais desde a redemocratização no Brasil, com certeza notou os gráficos. Embora o código respectivo em R esteja sempre acompanhando as imagens, talvez um leitor curioso esteja interessado em saber mais sobre algumas coisas que fiz ali em termos de visualização. Pensando nisso, compartilho aqui alguns dos links que utilizei. Facetas são um recurso bem legal de visualização mas nem sempre a visualização sai ordenada como você gostaria. Aqui o Simon Jackson explica como fazer essa ordenação. Para quem quer adicionar alguma legenda ao final das curvas no ggplot2, acabou o mistério! Ele também explicou como resolver esse problema aqui. Para quem não o conhece, ele é o criador do pacote corrr do R. Nesse link ele explica como explorar correlações com o pacote que ele criou, e aqui ele fala mais um pouquinho sobre algumas coisas que você pode fazer com o pacote.

Se você faz análise de dados com R, certamente você usa ao menos alguns dos pacotes da coleção Tidyverse. Compartilho com vocês aqui algumas dicas de como utilizar o filter do dplyr e como utilizar o mutate em todas as colunas de um dataframe. Ainda nesse tema de análise de dados, Como, Quando e Por que você deve Normalizar / Estandardizar / Rescalar seus dados?

Code highlighting no Medium!

Enquanto escrevia o texto da análise dos decretos, peguei-me em uma situação onde não estava conseguindo de forma fácil escrever um trecho de código no post com highlighting. Buscando por uma solução, encontrei esse link! Quem ficou curioso como eu fiz no texto dos decretos, o segredo está para todos agora! Haha

Oportunidades

  1. Analista de Business Intelligence (Prevenção a Fraudes) no iFood.
  2. Analista de Dados no Grupo ZAP.
  3. Estágio em Data Analytics no Quinto Andar.
  4. Cientista de Dados na Ambev.
  5. Engenheiro(a) de Dados na Conta Azul.
  6. Cientista de Dados na Creditas.
  7. Engenheiro de Software Python na N2B.
  8. Engenheir@ de Dados na Social Miner.
  9. Desenvolvedor de Inteligência Artificial no Grupo Educacional Unis.

Como vocês sabem, essa série é uma versão resumida e mais contextualizada da série Best Links of the Week do meu blog pessoal. Caso queiram uma versão mais crua, mas mais extensa e completa, é só checar lá! Tem links fora da temática de data science também!

Espero que tenham gostado, e até mais [links]!

--

--

Marcel Ribeiro Dantas
Data Hackers

Early Stage Researcher at Institut Curie and PhD Student at Sorbonne Université. Data Scientist, Software Freedom Activist and Bioinformagician!