Analisando os Tweets da CBF no R

Vinícius Rodrigues
bio-data-blog
Published in
2 min readJan 15, 2021

Hoje veremos como coletar informações em uma conta no Twitter utilizando o R. Neste exemplo, utilizarei a conta da Confederação Brasileira de Futebol (@CBF_Futebol).

Pacotes necessários

Adicionando a conta e coletando os dados

Vamos criar o objeto “usuario” com os dados da conta que será analisada e coletar os 1000 últimos tweets:

Transformando e organizando os dados

Como podem observar, muitas informações são coletadas da conta. Inicialmente nós não utilizaremos tudo isso. Então vamos selecionar o que queremos e organizar melhor os dados:

Tweets com mais likes e retweets

Com os dados selecionados, vamos verificar quais postagem tiveram um maior número de likes e retweets:

A postagem com mais likes e retweets foi a em homenagem ao Maradona.

Maiores seguidores da conta da CBF

Agora vamos coletar informações sobre os seguidores da conta da CBF e verificar quais mais interagem com a conta:

Nuvem de hashtags

Por fim, vamos fazer uma núvem de palavras com as hashtags. Os pacotes necessários são:

Utilizaremos a coluna “hashtags” do banco incial “dados”:

Agora vamos limpar as palavras, removendo números, pontuações e espaços em branco:

Plotando o resultado:

Das últimas 1000 postagens, a hashtag “braxequ” foi a mais frequente.

O banco de dados de uma conta no Twitter é muito grande e dá pra explorar muitas outras coisas. Aqui foi só um pontapé inicial.

Abraços! Você pode me contactar por aqui ou aqui. Postagem inspirada por aqui e aqui.

--

--