R para jornalistas: instalação, leitura e verificação de arquivo

gabriela caesar
May 3 · 5 min read


### Instalar bibliotecas

```{r}
install.packages(“data.table”)
install.packages(“tidyverse”)
install.packages(“ggplot2”)
```

## Carregar bibliotecas

```{r}
library(data.table)
library(tidyverse)
library(ggplot2)
```

## Importar o arquivo

```{r}
cota_senado <- fread(“https://gist.githubusercontent.com/gcaesar27/5faede8c1c6ffc82c7145dc3ececcbfe/raw/f3192ff17214c3c5d8eca4ebad42ba6f70d409aa/cota-senado-30-abril-2019")
```
```{r}
cota_senado2 <- fread(“https://gist.githubusercontent.com/gcaesar27/5faede8c1c6ffc82c7145dc3ececcbfe/raw/f3192ff17214c3c5d8eca4ebad42ba6f70d409aa/cota-senado-30-abril-2019", sep = “;”, header = TRUE, encoding = “UTF-8”, col.names = c(“ano”, “mes”, “senador”, “categoria”, “cnpj_cpj”, “empresa”, “n_documento”, “data”, “detalhamento”, “valor_reembolso”))
```
```{r}
cota_senado3 <- read.csv(“https://gist.githubusercontent.com/gcaesar27/5faede8c1c6ffc82c7145dc3ececcbfe/raw/f3192ff17214c3c5d8eca4ebad42ba6f70d409aa/cota-senado-30-abril-2019")
```

## Ver a estrutura do arquivo

```{r}
str(cota_senado)
```
Resultado de str(cota_senado)

## Verificar o arquivo

```{r}
summary(cota_senado)
```
Resultado de summary(cota_senado)

## Verificar a classe de uma coluna


```{r}
typeof(cota_senado$VALOR_REEMBOLSADO)
```
Resultado de typeof(cota_senado$VALOR_REEMBOLSADO)

## Ver os nomes das colunas do arquivo

```{r}
colnames(cota_senado)
```
Resultado de colnames(cota_senado)

## Renomear coluna do arquivo

```{r}
colnames(cota_senado)[1] <- "year"
colnames(cota_senado)
```
Resultado de colnames(cota_senado)[1] <- "year"

## Ver as primeiras linhas do arquivo

```{r}
head(cota_senado)
```
Resultado de head(cota_senado)

## Ver as últimas linhas do arquivo

```{r}
tail(cota_senado)
```
Resultado de tail(cota_senado)
```{r}
tail(cota_senado, 15)
```
Resultado de tail(cota_senado, 15)

pizzadedados

O primeiro podcast brasileiro sobre ciência de dados

gabriela caesar

Written by

jornalista de dados.

pizzadedados

O primeiro podcast brasileiro sobre ciência de dados