Análises Fantásticas #1 — Qual é o músico brasileiro mais talentoso da história?

Será que quando os dados falam, o Rei é mesmo Roberto Carlos?

Paulo Ribeiro
Data Noob
4 min readOct 26, 2017

--

A música é um das artes mais fascinantes. Por se tratar de uma experiência sensorial muito complexa, é natural que a preferência por estilo musical varie, dependendo de fatores genéticos, culturais e emocionais.

Contudo, isso não nos impede de tentar organizar as músicas em torno de alguma escala absoluta e organizar os estilos musicais através dela. Olhando para a composições musicais…

…que fatores podemos usar para dar nota à qualidade de uma música?

O Leo Sales chegou em uma resposta. E o trabalho de análise de dados realizado por ele é genial.

Encontrei o Leo por acaso. Estava procurando nomes para dar a este projeto, buscando várias combinações para investigar a disponibilidade.

Quando busquei “novato em ciência dos dados” para saber se alguém já teve esse ideia, dei de cara com o site do Leo Sales e a Análise da Música Brasileira.

A linha de raciocínio por trás da análise é bem simples:

Usar os acordes — tanto volume quanto diversidade para medir a complexidade da melodia

Usar as palavras da letra musical — também tanto em volume quanto em diversidade para medir a complexidade do conteúdo

Temos a escala de medida, mas como acessar todas as músicas brasileiras da história? Na internet! Sites como o Cifras possuem centenas de milhares de músicas disponíveis online, tanto com cifras quanto com letras.

O maravilhoso mundo de “data scrapping”

Uma operação bem útil em ciência de dados é “data scraping” — basicamente, escrever um “bot”, um código automático, que acesse páginas da internet e copie o conteúdo de modo estruturado em um banco de dados.

É uma habilidade extremamente poderosa e, nesse caso, foi explorado pelo Leo Sales para criar um banco de dados com “todas as músicas brasileiras da história”.

Aviso: Alguns sites consideram uma violação dos termos de uso a realização de data scrapping. Por quê? Cada página que o bot que você criou acessa para extrair os dados, é o equivalente a um acesso comum. Se você faz o data scrapping mal configurado, pode realizar muitos acessos por segundo e o servidor que hospeda o site não aguente tantas requisições de página. Essa metodologia é utilizada justamente como “ataques hackers” para tirar sites do ar — sobrecarregando o servidor com acessos de bots. Por isso, tenha bom senso na hora de utilizar.

O que podemos aprender sobre a música brasileira com os dados?

Eu não vou dar spoiler sobre todos os resultados que foram compartilhados. Adicionarei os links a seguir para você mergulhar no estudo. Quero focar a discussão apenas no artista brasileiro mais talentoso da história.

De maneira simplificada, vamos considerar o artista mais talentoso aquele com o conjunto de obras mais complexo. Sim, essa não é a melhor definição, a discussão de talento é muito profunda. Contudo, é uma escolha boa o suficiente com a qual podemos concordar, certo?

  • Quantidade de Músicas
  • Palavras Distintas
  • Percentual de Palavras Distintas
  • Raridade das Palavras
  • Acordes Distintos
  • Percentual de Acordes Distintos
  • Tamanho dos Acordes
  • Raridade dos Acordes

Montando um índice dos artistas brasileiros, considerando a nota composta pelos fatores acima, o resultado obtido pelo Leo foi o seguinte:

Nosso verdadeiro rei é Chico Buarque, de longe.

Roberto Carlos não aparece nem no Top 10.

Podemos olhar também para o ranking inverso — artistas “menos talentosos da história”. Para a revolta dos pernambucanos, Michelle Mello, uma famosa cantora de brega, apareceu em último lugar do ranking absoluto, abaixo até mesmo de Rouge.

Perguntas interessantes respondidas pela análise

  • Qual é o grupo musical com mais músicas?
  • Qual é o gênero que se destaca por mais palavras em cada música?
  • A música brasileira tem perdido a qualidade ao longo do tempo?
  • Se fôssemos rearranjar os artistas em novos grupos de gêneros musicais, decididos com base nos dados sobre arranjos e letras, como seria?

Análise da música brasileira: Parte #1 |Parte #2 |Parte #3 |Parte #4

Os dados da humanidade, à disposição de sua curiosidade

O que mais gostei desse estudo foi a demonstração do potencial que está na mão de cada um de nós se dominarmos as técnicas de ciência e análise dos dados.

É incrível que temos acesso ao conhecimento humano não apenas de modo “passivo”, mas também acesso aos dados brutos e, com determinadas habilidades, conseguimos destravá-los e dar vazão a nossa criatividade.

Foi uma análise única, brilhante e trouxe um novo entendimento sobre a música brasileira de uma perspectiva data-driven, deixando de lado as preferências pessoais. Fiquei com inveja, queria ter pensado nisso antes de tão brilhante. Realmente inspiradora!

Que análises interessantes você viu por aí? Conta pra gente.

Esta será uma coluna persistente em nossa publicação — compartilhando estudos interessantes, que façam nossos olhos brilhar e tragam inspiração de possíveis dados a manipular para responder nossas próprias perguntas.

Você viu algo interessante por aí? Compartilha conosco!

Se gostou do texto, lembre-se de dar aqueles 50 claps.

É algo simples, mas que tem um impacto enorme.

Ajuda bastante outras pessoas descobrirem esse tipo de conteúdo. Serei muito grato!

--

--

Paulo Ribeiro
Data Noob

Helping to change the real estate market by solving operation problems @loftbr