Sua primeira linha de código com R
Uma introdução à linguagem R para análise de dados
O R é uma linguagem de programação altamente utilizada para estatística. Ele permite realizar análises estatísticas, visualização de dados, extração (mineração) de dados, e possui ainda outras muitas funcionalidades. Além disso, o R é um software livre e gratuito que conta com uma comunidade ativa de usuários ao redor do mundo.
Por essas características acima, novas atualizações e possibilidades de análise são frequentes no R — o tornando uma ferramenta bem importante para pesquisa científica, data science etc.
Dentre as razões para utilizar o R estão:
- Capacidades gráficas muito sofisticadas e melhores que muitos softwares.
- Possibilidade para desenvolver novas ferramentas.
- Comunidade de usuários muito ativa e participativa.
Linguagem R
Uma breve história sobre o R: antes do R, o S havia sido criado em 1976 por John Chambers nos Laboratórios Bell — laboratórios industriais americanos de propriedade da Nokia. Em 1992 na Nova Zelândia, Ross Ihaka e Robert Gentleman começaram a produzir o R baseando-se fortemente no software S. Em 1995 a primeira versão de R havia sido lançada. A primeira versão estável do R saiu em 2000.
A partir de 2018, Robert Chambers, criador do S, juntou-se ao time de desenvolvimento do R. Qualquer informação sobre o R pode ser consultada no site oficial do R: https://www.r-project.org/
Instalando o R
O R é gratuito. Para realizar o download do software, basta acessar o site https://cloud.r-project.org/ e escolher a versão apropriada para sua máquina.
Para utilizar o R, vamos utilizar o RStudio — uma interface que facilita o uso do R. Da mesma forma, o RStudio é gratuito e pode ser baixado aqui: https://www.rstudio.com/products/rstudio/download/
Para mexermos no R, basta abrir o RStudio!
Reconhecendo os quadrantes do R
Ao abrir o RStudio, você notará algumas divisões na tela. Cada divisão é representa um quadrante do R. Cada quadrante nos dá informações diferentes.
- Esquerdo-alto: editor ou script, você pode armazenar seus comandos e salvar os seus projetos.
- Direito-alto: espaço de trabalho e repositório de seus “objetos”.
- Direito-baixo: arquivos de ajuda, imagens e gráficos, e informações dos pacotes.
- Esquerdo-baixo: console e comando, mostra os registros de atividades, saídas de análises e é onde o “R” funciona.
Ah, caso queira iniciar outro script envolvendo um outro trabalho ou poucas linhas de código, você pode abrir uma nova aba de script no RStudio.
Para isso, basta ir acessar a aba do programa e clicar em File -> New File -> R Script
. Você agora terá mais um script para utilizar.
Usando o R como uma calculadora
Para começar, digite no campo 1 - esquerdo-alto (a partir de agora, chamado de editor ou script) a seguinte operação: 1 + 1
Ah! No final dessa publicação tem uma tela só para você brincar um pouco com R. Aproveita e vai fazendo os exercícios por lá :)
Agora, para o R reconhecer que você quer fazer o resultado dessa operação, você precisa rodar esse código.
Rodando um código: para seus comandos serem executados, selecione ou o início da linha de código, ou o final da linha de código, ou toda a linha de código, e então clique em Run.
- Windows: O comando
Run
pode ser substituído por “Ctrl + Enter”. - Mac: O comando
Run
pode ser substituído por “Cmd + Return”.
Para somar, usa-se +
, como já mostrado.
Subtrair usando -
. Por exemplo, 50 - 25.
Multiplicar usando *
. Por exemplo, 5 * 5
Dividir usando /
. Por exemplo, 50 / 2
Potencializar usando **
ou ^x
. Por exemplo, 5 ** 2
ou 5^2
Assim, uma série de operações podem ser feitas.
Em cálculos maiores, os parênteses ( )
são utilizados para priorizar os elementos que precisam ser calculados antes.
((10 * 20) / 8) ^ 2## [1] 625
Objetos no R
Até agora trabalhamos apenas com números inteiros e com cálculos.
É importante citar que o R é esperto suficiente para conseguir trabalhar com texto também.
Antes de aprender sobre isso, vamos aprender a criar um objeto.
Criando objetos
Um objeto é uma coisa que se pode mudar, mexer e brincar com. Ele possui atributos específicos, dependendo do que a gente coloca nele.
Para criar um objeto, primeiro se escolhe o seu nome e depois se atribuem os seus valores.
Ah, todas as linhas iniciadas em#
são comentários, e não são processadas como comandos pelo software.
# Esse é um comentário. Note que ele inicia com "#". O R não se importa com ele.# Vamos agora criar um objeto chamado "objeto".objeto <- 10
Pronto, agora objeto
possui valor 10
.
- Para criar objetos, é preciso definir seu nome: isso pode ser
objeto
, oux
, ounomeSuperLegal
(o R não se importa…). - Depois, é necessário colocar o sinal de atribuição
<-
, que pode significar possui o valor de. - Finalmente, dá-se o valor do objeto, que nesse caso é
10
.
objeto <- 10
pode ser lido como “criar objeto
que possui o valor de (<-
) 10
”
Depois de criado, se pedirmos apenas objeto
para o R, olhe o que ele nos retorna:
Output: ## [1] 10
O R nos retornou o valor 10! Ele entendeu que objeto
agora é 10
.
Assim, se eu quiser objeto * 2
, o R entende que a operação real é 10 * 2
Output: ## [1] 20
Podemos também fazer dois objetos interagirem:
a <- 30
b <- 3
a / b # 'a' dividido por 'b'
Output: ## [1] 10
String
Qualquer variável de texto (também chamadas de strings) deve ser compreendida por aspas únicas '
ou aspas duplas "
:
# Para criar uma string, deve-se colocar o valor desejado em aspas
string <- "Isso é uma string"
Instalando e lendo pacotes
Aqui, vale a pena dar uma pausa para mencionar os pacotes do R. Pacotes são conjuntos de linhas de código, funções e cálculos que se pode baixar diretamente no R.
Assim, ao invés de escrever algoritmos difíceis no R, podemos baixar pacotes que fazem isso para a gente.
Para instalar um pacote, basta executar o comando: install.packages("pacote")
É importante atentar para as aspas!
Vamos agora instalar um pacote bastante usado para a manipulação de dados — o pacote dplyr.
install.packages("dplyr")
Assim que instalado, para utilizar as funções de um pacote, é necessário trazê-lo ao R. Para isso, se utiliza a função library(pacote)
.
library(dplyr) # basta colocar dplyr no lugar do pacote
Brinque um pouco
Aqui vai uma janela com alguns dos exercícios que comentamos acima. Para mexer com o R, basta digitar os comandos na janela de cima e executá-los clicando em “Run”. Se divirta!
Procuramos fazer um material introdutório ao Python para quem nunca o usou. O objetivo aqui não foi estabelecer um material exaustivo sobre ele, cobrindo todos os assuntos, mas sim estabelecer um contato inicial com essa linguagem.
Esperamos que você tenha tido um bom primeiro contato. Caso deseje se aprofundar mais, sugerimos os seguintes materiais:
- Data Science Academy — Python Fundamentos para Análise de Dados. Curso gratuito em Python para análise de dados, partindo desde a instalação do Python e indo até os principais pacotes utilizados para compreensão de variáveis e bancos de dados.
- Curso em Vídeo — Curso de Python 3. Um curso gratuito bem bacana sobre o que se pode fazer com Python, bastante voltado à programação, sem grande ênfase em análise de dados. Bem bom para quem quer se aprofundar um pouco mais em funções básicas com Python.
Como procurar ajuda?
- Documentação oficial do Python (em inglês)
- Fóruns: https://pt.stackoverflow.com/
- Introdução mais completa de R em: https://rpubs.com/reisrgabriel/IntroAoR
Contato
Espero que tenha gostado! Qualquer dúvida, observação ou comentário são muito bem-vindos! Fique à vontade para se manifestar e vamos aprender juntos 😄
Para falar comigo, é só entrar em qualquer um desses links.
☕️ Gostou do post e vai usar algo? Se quiser, você pode me pagar um café.