5 excelentes livros sobre Data Science para iniciantes começarem a praticar Ciências de Dados — E adquirirem uma sólida base de conhecimento

Adriano Soares
7 min readFeb 25, 2020

--

Modesta, porém muito boa, biblioteca de Ciência de Dados (e algumas outras coisas mais…) Foto de: Adriano Soares

A quantidade de dados gerados a todo momento na Internet, trazem com eles informações, tendências, insights, que em um primeiro momento, não é possível obter conhecimento, mas a partir do instante que esses dados são explorados, passam a apresentar de maneira clara, um caminho a ser feito. Essa área é conhecida como Data Science ou Ciência de Dados.

Ciência de Dados é um campo interdisciplinar de metodologias, sistemas científicos e processos, que auxiliam a extrair, armazenar, analisar e interpretar os dados de maneira eficaz, e apresentá-los em um formato simples para os usuários finais e tomadores de decisão.

O aprendizado de Ciência de Dados através dos livros nos auxilia a ter uma visão ampla sobre a mesma, pois Ciência de Dados não abrange somente a área da Ciência da Computação, mas também as áreas de Matemática e Estatística, assim como de Conhecimento das Áreas de Negócio.

Ao compreender os principais elementos da Ciência de Dados, você os aplicará em todos os seus projetos e aspectos do negócio, lhe trazendo amplos resultados no curto e longo prazo, assegurando que você se mantenha atualizado e indispensável.

Livros de Ciência de Dados para iniciantes

Aqui estão alguns dos melhores livros para iniciantes em Ciência de Dados que você pode ler para entender melhor os conceitos. Se você está iniciando o seu caminho e deseja excelentes livros para auxiliá-lo nos estudos, este artigo é exatamente o qual você estava buscando.

Data Science do Zero

Inicio com o clássico livro de Ciência de Dados, “Data Science do Zero”, escrito pelo engenheiro de software da Google, Joel Grus. Ele discorre sobre assuntos como estatística, álgebra linear, aprendizado de máquina, visualização de dados e oferece até mesmo um curso relâmpago de Python (pois é esse a linguagem adotada pelo autor para ensinar Data Science), de maneira clara e objetiva, abordando esses e outros temas de forma prática, construindo ferramentas e implementando algoritmos à mão, com o propósito de compreendê-los melhor.

Uma ressalva importante é sobre a versão do Python utilizada pelo autor, que é a 2.7, pois em sua opinião, importantes bibliotecas funcionam bem somente nela, pois o Python 3 não é compatível com a versão anterior do Python 2.

Até hoje é considerado um dos melhores livros sobre Ciência de Dados para iniciantes, tornando a sua leitura obrigatória.

Ele pode ser encontrado aqui: https://amzn.to/2KSwj1C

Clássico livro de Ciência de Dados, “Data Science do Zero”, escrito por Joel Grus — Foto de: Adriano Soares

R Para Data Science

Você praticou, testou, executou, criou projetos (até no GitHub eles estão!), está se aprofundando na linguagem Python e suas bibliotecas, então procura dar mais um passo em seu conhecimento, pois entre um projeto e outro, você leu um artigo que dizia que é indicado à um cientista de dados conhecer, no mínimo, duas linguagens de programação… E agora?

Você se pega questionando qual é a outra melhor linguagem para os seus projeto. Aquela que irá proporcionar mais familiaridade, assertividade e otimização do tempo… Você então, parte para o seu navegador preferido e após sete palavras, um “ENTER” e um “click”, descobre que a segunda linguagem de programação (a primeira é a Python) mais indicada à um cientista de dados saber é a linguagem R.

(Você ficou tentando em verificar, não é mesmo? Tudo bem, vai lá, eu aguardo… Mas volta!)

Lado a lado com Python, a linguagem R é muito popular entre os cientistas de dados, onde constantemente é relacionada a processamentos estatísticos em grandes volumes de dados. O livro “R Para Data Science” foi elaborado para que você aprenda ciência de dados praticando, contendo diversos exemplos e exercícios.

Um ponto negativo é para a impressão do livro, que é totalmente em preto e branco (a versão em inglês é colorida), atrapalhando por vezes a compreensão de determinados gráficos, porém é possível visualizar os mesmos em cores, através do site da editora.

Um livro muito bom, que apresenta conceitos essenciais para a compreensão e prática da linguagem R.

Ele pode ser encontrado aqui: https://amzn.to/35r1YB0

A linguagem R é muito popular entre os cientistas de dados, onde constantemente é relacionada a processamentos estatísticos em grandes volumes de dados - Foto de: Adriano Soares

Estatística Prática para Cientistas de Dados: 50 Conceitos Essenciais

Após alguns projetos e duas linguagens de programação, você percebe que para resolver os problemas de forma mais prática (e rápida!) se aprofundar em Estatística é preciso!

O livro “Estatística Prática para Cientistas de Dados: 50 Conceitos Essenciais” aborda os principais conceitos que são necessários a um cientista de dados aprender sobre estatística. Elaborado como um guia prático, o livro trata diversos métodos estatísticos, tais como análise exploratória, randomização, amostragem, regressão, entre outros, com diversos exemplos na linguagem R (que bom que você já conhece essa linguagem!).

Por tratar-se de um livro introdutório, os temas discutidos não são aprofundados, o que irá levá-lo(a) por vezes a procurar detalhes em outra fonte, porém isso não reduz a importância do livro, pois ele cumpre, e muito bem, o objetivo a que se propõe, o de construir uma boa base nos conceitos de Estatística aplicada em Ciência de Dados.

Ele pode ser encontrado aqui: https://amzn.to/2YmgmJ0

O livro “Estatística Prática para Cientistas de Dados: 50 Conceitos Essenciais” aborda os principais conceitos que são necessários a um cientista de dados aprender sobre estatística — Foto de: Adriano Soares

Storytelling com Dados: um Guia Sobre Visualização de Dados Para Profissionais de Negócios

Quanto mais perguntas você responde em sua jornada por esse imenso oceano de dados, outras mais surgem! E tenho certeza que uma delas é: “Eu estou apresentando os meus insights da melhor maneira?”

No excelente livro de Cole Nussbaumer Knaflic, atual gerente da equipe de People Analytics da Google, você irá descobrir que… pode melhorar na escolha e apresentação dos seus dados... Cole é especializada em apresentar de maneira eficiente informações quantitativas e escreve o conhecido blog (em inglês) storytellingwithdata.com (se você ainda não conhece, sugiro que faça uma visita).

O livro “Storytelling com Dados: um Guia Sobre Visualização de Dados Para Profissionais de Negócios” é um guia fácil de ler e aplicar, com excelentes exemplos de gráficos (em cores!) que melhoram a capacidade de explicar análises complicadas, em um gráfico claro e objetivo. Leitura indispensável para levar a sua habilidade em apresentar dados a um novo patamar.

Ele pode ser encontrado aqui: https://amzn.to/2WgW9ll

O livro “Storytelling com Dados: um Guia Sobre Visualização de Dados Para Profissionais de Negócios” é um guia fácil de ler e aplicar, com excelentes exemplos de gráficos — Foto de: Adriano Soares

Data Science para Negócios

Com conhecimento em duas linguagens de programação, uma sólida base de conhecimentos em Estatística e em visualização de dados (agora você já sabe que o mundo já viu gráficos de pizza o suficiente…), o próximo passo não poderia ser outro: Aprofundar seus conhecimentos em pensamento analítico de dados voltado para a área de negócios.

A minha última sugestão de livro dessa lista é o livro “Data Science para Negócios”. Os autores apresentam os princípios fundamentais de Data Science (ou Ciência de Dados) de uma maneira dinâmica e objetiva, sem algoritmos, apresentando conceitos fundamentais de técnicas que são a base da análise de problemas de negócios centrados em dados para extrair conhecimento relevante e tudo isso com exemplos de problemas de negócios reais, enfrentados por grandes empresas americanas. Utilizando uma combinação de texto e diagramas, os autores tem como objetivo levar o leitor a saber como abordar um problema e como ser bem-sucedido em sua resolução, mostrando que um cientista de dados não deve ter conhecimento apenas da área técnica, mas também da área de negócios.

Se você deseja melhorar o seu conhecimento de como as suas soluções e insights podem ser implantados de melhor maneira no campo empresarial, este livro é para você.

Ele pode ser encontrado aqui: https://amzn.to/2SqyhKY

O livro “Data Science para Negócios” trás os princípios fundamentais de Data Science de uma maneira dinâmica e com exemplos de problemas de negócios reais — Foto de: Adriano Soares

Uma base sólida

Selecionei esses cinco livros como fonte inicial porque, quando finalizados, creio que você terá uma base sólida para aplicar Ciência de Dados e explorá-la com precisão e profundidade. Tenho certeza que, se você seguir o método proposto em cada um desses livros, que nada mais é do que aplicar e praticar (praticar, praticar, praticar,…) os exemplos propostos, você não só terá um ótimo desenvolvimento em Ciência de Dados, como não lhe faltará motivação para superar os entraves que surgirão (pode contar que eles estarão sempre presentes, mas a cada dia em menor incidência) e seguir a sua caminhada no aprendizado e desenvolvimento em Ciência de Dados.

5 excelentes livros sobre Data Science para iniciantes começarem a praticar Ciências de Dados e adquirirem uma sólida base de conhecimento — Foto de: Adriano Soares

Espero que esses livros tornem a sua jornada menos árdua e o(a) ajude tanto quanto me ajudaram (e seguem ajudando).

Caso você tenha uma sugestão de livro que gostaria de compartilhar, deixe um comentário. Se você elaborar um projeto, eu gostaria de saber sobre ele também!

Meu perfil no Linkedin: https://bit.ly/2VoxdcO

--

--