Analisando os Tweets da CBF no R
Hoje veremos como coletar informações em uma conta no Twitter utilizando o R. Neste exemplo, utilizarei a conta da Confederação Brasileira de Futebol (@CBF_Futebol).
Pacotes necessários
Adicionando a conta e coletando os dados
Vamos criar o objeto “usuario” com os dados da conta que será analisada e coletar os 1000 últimos tweets:
Transformando e organizando os dados
Como podem observar, muitas informações são coletadas da conta. Inicialmente nós não utilizaremos tudo isso. Então vamos selecionar o que queremos e organizar melhor os dados:
Tweets com mais likes e retweets
Com os dados selecionados, vamos verificar quais postagem tiveram um maior número de likes e retweets:
A postagem com mais likes e retweets foi a em homenagem ao Maradona.
Maiores seguidores da conta da CBF
Agora vamos coletar informações sobre os seguidores da conta da CBF e verificar quais mais interagem com a conta:
Nuvem de hashtags
Por fim, vamos fazer uma núvem de palavras com as hashtags. Os pacotes necessários são:
Utilizaremos a coluna “hashtags” do banco incial “dados”:
Agora vamos limpar as palavras, removendo números, pontuações e espaços em branco:
Plotando o resultado:
Das últimas 1000 postagens, a hashtag “braxequ” foi a mais frequente.
O banco de dados de uma conta no Twitter é muito grande e dá pra explorar muitas outras coisas. Aqui foi só um pontapé inicial.