Sua primeira linha de código com R

Gabriel Rodrigues
Datapsico

--

Uma introdução à linguagem R para análise de dados

O R é uma linguagem de programação altamente utilizada para estatística. Ele permite realizar análises estatísticas, visualização de dados, extração (mineração) de dados, e possui ainda outras muitas funcionalidades. Além disso, o R é um software livre e gratuito que conta com uma comunidade ativa de usuários ao redor do mundo.

Por essas características acima, novas atualizações e possibilidades de análise são frequentes no R — o tornando uma ferramenta bem importante para pesquisa científica, data science etc.

Dentre as razões para utilizar o R estão:

  • Capacidades gráficas muito sofisticadas e melhores que muitos softwares.
  • Possibilidade para desenvolver novas ferramentas.
  • Comunidade de usuários muito ativa e participativa.

Linguagem R

Logo do R.

Uma breve história sobre o R: antes do R, o S havia sido criado em 1976 por John Chambers nos Laboratórios Bell — laboratórios industriais americanos de propriedade da Nokia. Em 1992 na Nova Zelândia, Ross Ihaka e Robert Gentleman começaram a produzir o R baseando-se fortemente no software S. Em 1995 a primeira versão de R havia sido lançada. A primeira versão estável do R saiu em 2000.

A partir de 2018, Robert Chambers, criador do S, juntou-se ao time de desenvolvimento do R. Qualquer informação sobre o R pode ser consultada no site oficial do R: https://www.r-project.org/

Instalando o R

O R é gratuito. Para realizar o download do software, basta acessar o site https://cloud.r-project.org/ e escolher a versão apropriada para sua máquina.

Para utilizar o R, vamos utilizar o RStudio — uma interface que facilita o uso do R. Da mesma forma, o RStudio é gratuito e pode ser baixado aqui: https://www.rstudio.com/products/rstudio/download/

Para mexermos no R, basta abrir o RStudio!

Reconhecendo os quadrantes do R

Ao abrir o RStudio, você notará algumas divisões na tela. Cada divisão é representa um quadrante do R. Cada quadrante nos dá informações diferentes.

Quadrantes do RStudio.
  1. Esquerdo-alto: editor ou script, você pode armazenar seus comandos e salvar os seus projetos.
  2. Direito-alto: espaço de trabalho e repositório de seus “objetos”.
  3. Direito-baixo: arquivos de ajuda, imagens e gráficos, e informações dos pacotes.
  4. Esquerdo-baixo: console e comando, mostra os registros de atividades, saídas de análises e é onde o “R” funciona.

Ah, caso queira iniciar outro script envolvendo um outro trabalho ou poucas linhas de código, você pode abrir uma nova aba de script no RStudio.

Para isso, basta ir acessar a aba do programa e clicar em File -> New File -> R Script. Você agora terá mais um script para utilizar.

Usando o R como uma calculadora

Para começar, digite no campo 1 - esquerdo-alto (a partir de agora, chamado de editor ou script) a seguinte operação: 1 + 1

Ah! No final dessa publicação tem uma tela só para você brincar um pouco com R. Aproveita e vai fazendo os exercícios por lá :)

Agora, para o R reconhecer que você quer fazer o resultado dessa operação, você precisa rodar esse código.

Rodando um código: para seus comandos serem executados, selecione ou o início da linha de código, ou o final da linha de código, ou toda a linha de código, e então clique em Run.

Run: comando para rodar um código em R.
  • Windows: O comando Run pode ser substituído por “Ctrl + Enter”.
  • Mac: O comando Run pode ser substituído por “Cmd + Return”.

Para somar, usa-se +, como já mostrado.

Subtrair usando -. Por exemplo, 50 - 25.

Multiplicar usando *. Por exemplo, 5 * 5

Dividir usando /. Por exemplo, 50 / 2

Potencializar usando ** ou ^x. Por exemplo, 5 ** 2 ou 5^2

Assim, uma série de operações podem ser feitas.

Em cálculos maiores, os parênteses ( ) são utilizados para priorizar os elementos que precisam ser calculados antes.

((10 * 20) / 8) ^ 2## [1] 625

Objetos no R

Até agora trabalhamos apenas com números inteiros e com cálculos.

É importante citar que o R é esperto suficiente para conseguir trabalhar com texto também.

Antes de aprender sobre isso, vamos aprender a criar um objeto.

Criando objetos

Um objeto é uma coisa que se pode mudar, mexer e brincar com. Ele possui atributos específicos, dependendo do que a gente coloca nele.

Para criar um objeto, primeiro se escolhe o seu nome e depois se atribuem os seus valores.

Ah, todas as linhas iniciadas em#são comentários, e não são processadas como comandos pelo software.

# Esse é um comentário. Note que ele inicia com "#". O R não se importa com ele.# Vamos agora criar um objeto chamado "objeto".objeto <- 10

Pronto, agora objeto possui valor 10.

  • Para criar objetos, é preciso definir seu nome: isso pode ser objeto , ou x , ou nomeSuperLegal (o R não se importa…).
  • Depois, é necessário colocar o sinal de atribuição <-, que pode significar possui o valor de.
  • Finalmente, dá-se o valor do objeto, que nesse caso é 10.

objeto <- 10 pode ser lido como “criar objeto que possui o valor de (<-) 10

Depois de criado, se pedirmos apenas objeto para o R, olhe o que ele nos retorna:

Output: ## [1] 10

O R nos retornou o valor 10! Ele entendeu que objeto agora é 10.

Assim, se eu quiser objeto * 2 , o R entende que a operação real é 10 * 2

Output: ## [1] 20

Podemos também fazer dois objetos interagirem:

a <- 30

b <- 3

a / b # 'a' dividido por 'b'

Output: ## [1] 10

String

Qualquer variável de texto (também chamadas de strings) deve ser compreendida por aspas únicas ' ou aspas duplas " :

# Para criar uma string, deve-se colocar o valor desejado em aspas

string <- "Isso é uma string"

Instalando e lendo pacotes

Aqui, vale a pena dar uma pausa para mencionar os pacotes do R. Pacotes são conjuntos de linhas de código, funções e cálculos que se pode baixar diretamente no R.

Assim, ao invés de escrever algoritmos difíceis no R, podemos baixar pacotes que fazem isso para a gente.

Para instalar um pacote, basta executar o comando: install.packages("pacote")

É importante atentar para as aspas!

Vamos agora instalar um pacote bastante usado para a manipulação de dados — o pacote dplyr.

install.packages("dplyr")

Assim que instalado, para utilizar as funções de um pacote, é necessário trazê-lo ao R. Para isso, se utiliza a função library(pacote).

library(dplyr) # basta colocar dplyr no lugar do pacote

Brinque um pouco

Aqui vai uma janela com alguns dos exercícios que comentamos acima. Para mexer com o R, basta digitar os comandos na janela de cima e executá-los clicando em “Run”. Se divirta!

Procuramos fazer um material introdutório ao Python para quem nunca o usou. O objetivo aqui não foi estabelecer um material exaustivo sobre ele, cobrindo todos os assuntos, mas sim estabelecer um contato inicial com essa linguagem.

Esperamos que você tenha tido um bom primeiro contato. Caso deseje se aprofundar mais, sugerimos os seguintes materiais:

Como procurar ajuda?

Contato

Espero que tenha gostado! Qualquer dúvida, observação ou comentário são muito bem-vindos! Fique à vontade para se manifestar e vamos aprender juntos 😄

Para falar comigo, é só entrar em qualquer um desses links.

☕️ Gostou do post e vai usar algo? Se quiser, você pode me pagar um café.

--

--

Gabriel Rodrigues
Datapsico

Sou um psicólogo que trabalha com Análise e Ciência de Dados desde a graduação — busco criar e compartilhar conteúdo sobre esses assuntos. linktr.ee/gabrielrr