Análise da música brasileira

Leonardo Sales
datacoffee
Published in
3 min readJan 27, 2024

Veja o gráfico abaixo. Ele apresenta os diferentes estilos musicais brasileiros em 2 dimensões: harmonia e letra, observadas quanto a sua complexidade.

Ritmos brasileiros — dimensões de complexidade (melhor visualização aqui)

Eu raspei os dados de mais de 31 mil músicas do site Cifraclub. Analisei os dados em Python para criar 11 indicadores de complexidade das composições. As publicações seguintes (aqui e aqui) vão detalhar os resultados.

A posição da Bossa-Nova, bem à direita, indica a já conhecida riqueza das harmonias produzidas por Tom Jobim, João Gilberto e tantos outros. Em outra dimensão, a complexidade das letras destaca os artistas regionais, MPB, Samba, Bossa Nova e o conglomerado Hip-hop-rap em relação aos demais estilos. Quem fica mal na fita da complexidade é o piseiro, o funk, o trap e outros estilos mais, digamos… simples.

Mas entenda, não estamos falando aqui de qualidade, gosto pessoal, "essa música me lembra Mércia" ou qualquer coisa subjetiva do tipo, perceba que negritei o termo complexidade, que deve ser entendida aqui como um conjunto de ALGUNS indicadores mensuráveis nas harmonias ou nas letras das músicas.

Também existem limitações nos algoritmos utilizados. Sutilezas como o encaixe entre tonicidade das palavras e melodia, ou qualquer aspecto desta última, não estão sendo contabilizados aqui. Portanto, não entenda como uma avaliação técno-científica-poética das músicas, apenas como a observação das mesmas sob ALGUNS parâmetros objetivos. Não fique chateado se Manoel Gomes e sua caneta azul estão mal colocados, aquela "tremidinha" na voz dele passa imperceptível pelo nosso código, infelizmente!

Tudo precisa e vai ser bem explicado a seguir. Nos parágrafos e publicações seguintes mostro como afinal cheguei numa nota da complexidade de mais de 31 mil canções do repertório nacional.

Mas antes de explicar a metodologia desta análise, pra dar mais um gostinho dos resultados, já adianto quem são os artistas mais bem colocados sob esses critérios: Chico Buarque, Djavan, João Bosco, Ivan Lins, Jõao Gilberto e Tom Jobim. Entre os piores, encontramos Tiririca, A Turma do seu Lobato, Manoel Gomes e Mc Pipokinha.

Método

A seleção de músicas para análise foi feita por amostragem aleatória, que selecionou, como regra geral, 35 ou 70 músicas por artista¹.

Para calcular a complexidade das músicas, foram utilizados 2 grupos de indicadores: HARMONIA e LETRA.

Os indicadores de harmonia levam e conta características mais técnicas das composições, relacionadas especificamente aos acordes e às progressões utilizadas. Não foram analisados fatores ligados à melodia. Estes são os indicadores de complexidade harmônica:

  • Número de acordes distintos utilizados na música
  • Percentual de acordes fora do campo harmônico
  • Tamanho médio das progressões, considerando o tom da canção e o respectivo campo harmônico
  • Complexidade dos acordes, em que contabilizo a presença de quartas, sétimas, nonas, e outros acréscimos à tríade básica dos acordes
  • Raridade dos acordes, em que um tipo de acorde ganha mais valor quanto menos for utilizado por outros artistas

Os indicadores de letra consideram aspectos da riqueza da construção do texto. Estes são os indicadores:

  • Percentual de palavras distintas (pouco valor pra "índia seus cabelos" repetindo-se indefinidamente na letra)
  • Raridade das palavras utilizadas
  • Número de rimas na música (sim, é possível)
  • Número de rimas em classes gramaticais diferentes (sim, é possível)

Os indicadores acima foram medidos para cada música. Depois, agregados por artista. Após isso, mais 3 indicadores, ligados ao "conjunto da obra" do artista, foram adicionados na agregação final: número de músicas, vocabulário total utilizado (contagem de todas as palavras distintas usadas pelo artista nas músicas), e "acordário" total utilizado pelo artista, considerando todo o repertório de acordes utilizados em todas as músicas.

Os dados de 31 mil músicas foram obtidos por meio de raspagem (webscrapping) do site do cifraclub.com.br.

A análise foi feita em python. Eventualmente alguns trechos de código serão copiados nas publicações. O código completo está em meu github.

Vou aprofundar as 2 dimensões de complexidade das músicas e os resultados nas publicações seguintes, mas antes, como aprendi com meu filho a gostar de spoilers, veja mais um gráfico, que plota os artistas, segundo as notas de complexidade de harmonia e letra, coloridos de acordo com o respectivo estilo (filtrados apenas os top5 e tail5):

Artistas brasileiros — dimensões de complexidade (melhor visualização aqui)

Veja que os indicadores escolhidos claramente estão relacionados com os estilos musicais, quem sabe também com a época em que as músicas foram feitas (aliás, esse aspecto também será aprofundado). Isso tudo logo mais, chega de spoiler.

Acesse as publicações seguintes: aqui, aqui

Notas

[1] Para artistas com mais de 70 músicas, foram selecionadas 70. Para artistas com menos de 70 músicas, selecionei 35 músicas ou todas elas no caso de o artista ter menos do que isso disponível no site.

--

--

Leonardo Sales
datacoffee

Egresso das humanas, mestre em economia do setor público, apaixonado por dados, python e música, intrigado com política.