Mineração textual e os Cinco Traços de Personalidade nos planos de governo presidencial para 2018

Pedrenrique
pérabrasil
Published in
9 min readMar 25, 2019

O​s últimos meses foram marcados pela polarização social e política entre os eleitores. Das redes sociais às urnas, as hashtags #EleNão e #EleSim apontavam o contraste. Desta forma, o país levou ao segundo turno os presidenciáveis do PT, com 29,28% dos votos no 1o turno, e do PSL, com 46,03%. A disputa resultou na conquista do candidato do PSL à presidência com 55,13% dos votos válidos.

Apesar da assimetria entre os discursos, o ponto em comum entre os dois pólos é, sem dúvidas, o desejo por um Brasil melhor. Os planos de governo dos presidenciáveis foram apresentados com os títulos “O Brasil feliz de novo” do candidato do PT e “O caminho da prosperidade” do candidato do PSL. A afinidade entre os dois discursos se dá pela esperança de um futuro sólido, baseado nas propostas das suas candidaturas.

Logo, analisar os planos de governo dos presidenciáveis ao segundo turno é o ponto de partida e problema de pesquisa deste estudo. A relevância da análise se dá considerando-se que as propostas devem ir além de promessas para os próximos quatro anos, mas, que funcione também como uma ferramenta de auditoria e monitoramento da sociedade civil para com o governo eleito.

Os métodos aplicados aqui nesta pesquisa são baseados em metodologias digitais de análise textual (text analysis) usando práticas interpretativas assistidas por computador; no caso, através de ferramentas de código-aberto (open source) [1].

A partir do universo de planos de governo dos presidenciáveis em 2018, os documentos oficiais dos dois candidatos que disputaram o segundo turno e, disponibilizados na íntegra no site do TSE, serviram de amostra para tal análise. Comparamos os planos de governo dos candidatos do PT e PSL e medimos os pontosem comum e principais particularidades entre eles através da ferramenta canadense Voyant-Tools[2] .

Somados, os dois documentos contabilizam 39.899 palavras. No entanto, o plano de governo do presidenciável do PT apresenta 31.376 palavras, 78% do volume total, apresentado em cinco grandes tópicos e 62 páginas, enquanto o do PSL é composto por 8.523 palavras, 73% menor que seu adversário, e mais fluido, dividido por seis grandes assuntos e 81 páginas. Tabelas e imagens de página inteira justificam o maior volume de páginas e menor quantidade de textual disponível para análise, no caso.

A partir de ambos os corpus, foi levantado também as palavras mais usadas nos dois documentos, que são: governo (240); nacional (170); políticas (132); desenvolvimento (128) e política (125).

No plano de governo do candidato do PT, a palavra “desenvolvimento” aparece 115 vezes, sendo que a combinação “desenvolvimento” + “nacional” é visto nove vezes em seu documento. No plano de governo do candidato do PSL, a palavra desenvolvimento é encontrada ao lado de termos como: “tecnológico”, “econômico e social”, “grafeno e nióbio” e “rural e sustentável”.

Nuvem de palavras mais frequentes dos dois planos de governo // Voyant-Tools

Buscou-se analisar também a densidade do vocabulário de cada projeto: 6.042 palavras aparecem com exclusividade nos dois corpus, ocasionando uma densidade média de 15%. O presidenciável do PSL apresentou mais palavras únicas sobre o total de palavras, 27%, frente o texto de seu opositor com densidade de 16%.

Das palavras que aparecem exclusivamente em um único projeto, as mais usadas no plano do governo do candidato do PSL são: bilhões (11), esquerda (10), devemos (7), paulo (6), japão (6). O termo “esquerda” é usado, por exemplo, em dois subtítulos nomeados como: “Contra a Esquerda: Números e Lógica” e “Mais Mentiras da Esquerda”. O termo “esquerda” não aparece no plano de governo do candidato do PT. Já o termo “paulo” é citado três vezes em referência ao Foro de São Paulo e uma vez em relação ao educador Paulo Freire.

Distribuição e aparição dos termos mais frequentes no Plano de Governo do PSL // Voyant-Tools

Enquanto as palavras mais usadas no projeto do candidato do PT são: lula (52), ecológica (49), construção (38), urbana (36), promoção (36). A palavra “lula” é utilizada em referência ao ex-presidente Luiz Inácio Lula da Silva e, é acompanhado de “Dilma” 24 vezes durante o texto. Já o termo “ecológica” faz parte de um dos tópicos do plano do candidato do PT: “Transição Ecológica Para a Nova Sociedade do Século XXI”. A palavra não aparece no plano de governo do seu opositor.

Além disso, o plano de governo do PT apresenta, no início e final do projeto, frases do ex-presidente Lula: “Não adianta tentar parar as minhas ideias. Elas já estão pairando no ar, e não tem com prendê-las.” e “Nenhum país será grande se não pensar grande. Nenhum país terá futuro melhor se não construí-lo no presente.” Padrão não repetido pelo oponente. O candidato do PSL exibe um único versículo: “E conhecereis a verdade, e a verdade vos libertará. JOÃO 8: 32” no início do documento.

Distribuição e aparição dos termos mais frequentes no Plano de Governo do PT // Voyant-Tools

Além da análise dos termos mais recorrentes de ambos os textos, a pesquisa buscou comparar a incidência de termos-chave que representam pilares de governos e políticas públicas nacionais. A partir da ordem decrescente de palavras mais frequentes nos documentos, elencaram-se aquelas que mais dizem respeito a propostas efetivas de governabilidade: direitos (93), educação (91), saúde (84), economia (69), reforma (66) e segurança (49). Na respectiva ordem, estas palavras ocupam da oitava a trigésima sexta posição dentro dos termos mais frequentes analisados aqui.

Considerando ainda a diferença entre o tamanho textual de cada plano de governo analisado, as visualizações aqui foram retratadas em frequência relativa -e não absoluta, com o objetivo de uma comparação mais realista da composição de cada documento. É possível ver nesse espectro, como o plano de governo do PSL se fortalece muito no âmbito de políticas e conjuntura econômica enquanto para o plano do PT, o termo direitos se destaca em frequência relativa.

Com menor destaque que direitos, mas com inclinação de reta bem similar quanto às frequências relativas entre Bolsonaro e Haddad, o termo reforma performa como a segunda maior discrepância entre os planos sob a esfera do Plano de Governo do PT.

Interessante notar como saúde e segurança são termos que aparecem aproximadamente na mesma frequência em ambos os projetos. Há ligeira inclinação para o plano de Bolsonaro quanto a segurança enquanto o inverso ocorre com Haddad e saúde.

Comparação de ocorrência, em frequência relativa, de termos-chave

Afim de uma análise exploratória dos dois planos de governo dos presidenciáveis que chegaram ao segundo turno, também utilizamos como ferramenta de processamento textual o método da psicologia denominado Modelo dos Cinco Traços Fortes de Personalidade -5 Big Personality Traits (Big Five), mercadologicamente conhecido como o Modelo “OCEAN”, acrônimo das iniciais de cada um dos traços. Uma apresentação introdutória do método pode ser vista aqui .

Tratando da definição destes traços que compõem o modelo de personalidade; nas palavras de Silva e Barreto (2018)[3]:

Openness to Experience, ou Abertura a Experiências, representa o direcionamento do indivíduo a descobrir coisas novas e realizar ações não realizadas anteriormente. Conscientiousness, ou Conscienciosidade, trata do nível de reflexão e planejamento nas ações cotidianas sociais. Extraversion, ou Extroversão, refere-se à motivação de sociabilidade e prazer retirado no convívio com outros. Agreeableness, ou Amabilidade, refere-se ao interesse em buscar cooperação e harmonia social em oposição a conflito. Neuroticism, Neuroticismo, por fim, é apresentado em oposição à Estabilidade Emocional, e está relacionado à manutenção de estados emocionais. (Tarcizio Silva e Pedro Barreto, 2018, p.281).

Ainda que originalmente aplicado através de questionários em blocos, a prática é tratada através de “<Hipótese lexical>, ideia (que) se baseia na conclusão de que as sociedades desenvolveram sistemas linguísticos que englobam as nuances das personalidades e, por isto, sua expressão pode servir para sua correspondente medição” (Silva e Barreto, 2018).

Assim, esta última seção da investigação serviu como base para analisar os discursos utilizados nos dois documentos individualmente e também o resultado de uma amostra dos dois textos combinados. Para tanto, aplicamos o método através do sistema Personalitatem LexiconMiner [4] desenvolvido em língua portuguesa pela Universidade Federal de Sergipe.

O plano de governo do candidato do PSL, apresenta, como principal traço de personalidade a “Conscienciosidade” (99), tendo como sua principal faceta a “Auto-eficácia” e com menor índice a “Cautela”. Em segundo lugar, aparece o traço “Abertura a novos caminhos” (90) e, vale destacar neste traço: “Emocionalidade” como sua principal faceta e “Liberalismo” como indicador que menos performou neste traço.

“Extroversão” (99) foi o traço em destaque no plano de governo do candidato do PT. A faceta “Amistosidade” indicou alto índice, enquanto “Nível de Atividade” apontou o mais baixo. Em seguida, “Conscienciosidade” (96) apareceu em destaque, tendo como “Auto Eficácia” o índice que melhor performou, e “Cautela” com menor performance.

5 Traços Fortes de Personalidade no Plano do PSL // Personalitatem Lexicon Miner
5 Traços Fortes de Personalidade no Plano do PT // Personalitatem Lexicon Miner

Em última instância, foram copiadas as primeiras 1.500 palavras de cada corpus para se aplicar o mesmo teste léxico de traços de personalidade; totalizando um arquivo combinado de 3.000 palavras. Optou-se por um processamento sintético desta amostra tendo em vista o cálculo mínimo do método para análises consideradas fortes.

Quando aplicamos o método nos documentos combinados, “Amabilidade” (99) foi o traço com maior índice, seguido de “Conscienciosidade” (98).

As facetas presentes no primeiro traço em maior índice foram “Moralidade” e “Modéstia” e; em menor escore “Confiança” e “Cooperação”.

“Busca por realizações” e “Auto Eficácia” foram as facetas em destaque no segundo traço mais forte, enquanto “Cautela” e “Obediência” apontaram para os menores índice.

Radar comparativo dos 5 Traços de personalidade para cada plano e para “plano consolidado” // Autores

Ao levantar estes dados a pesquisa buscou apresentar novos caminhos para se pensar, discutir, e entender os planos de governo dos candidatos, assim como o mandato do presidente eleito, nos próximos quatro anos.

O estudo entende alcançar seus objetivos ao fomentar diferentes percepções sobre um tema de interesse público em momento tão polarizado. Mais que explorar a riqueza de análises textuais dentro do âmbito sócio-político e, através de ferramentas digitais, a provocação aqui exibida se propôs a realizar diferentes análises combinando ambos os documentos como simulação hipotética da busca por um plano ideal de governo brasileiro, onde os maiores interessados e afetados por tais planos, são os próprios (E)leitores.

Referências

[1] Para maior compreensão do universo de análise de texto automatizado para pesquisa com consumidor ver HUMPHREYS e WANG (2018), disponível em: https://www.researchgate.net/publication/324495873_Automated_Text_Analysis_for_Consumer_Research

[2]Documentação e apresentação da ferramenta de análise de texto automatizado open-source Voyant Tools em: http://docs.voyant-tools.org/start/

[3] BARRETO, P.; SILVA, Tarcízio. Modelos de Personalidade em Mídias Sociais: oportunidades e desafio para o marketing. In:SILVA, Tarcízio; BUCKSTEGGE, Jaqueline; ROGEDO, Pedro.(Org.). Estudando Cultura e Comunicação com Mídias Sociais. 1ed. Brasília: Editora IBPAD, 2018, v.1, p.275–291.

Acerca de aplicações conceituais dos cinco traços de personalidade para relações em redes sociais:

JOHN,O.P.; SRIVASTAVA, S. The Big Five trait taxonomy: History, measurement, and theoretical perspectives. Handbook of personality: Theory and research, v.2, n.1999, p.102–138,1999.

LIMA,M.P.;SIMÕES,A. A teoria dos cinco factores: Uma proposta inovadora ou apenas uma boa arrumação do caleidoscópio personológico? Análise Psicológica,v.18,n.2,p.171–179,2000.

LIMA, A.C.E.S. etal. Mineração de mídias sociais como ferramenta para a análise de tríade da persona virtual .Tese. (Doutorado em Engenharia Elétrica e Computação). São Paulo: Universidade Presbiteriana Mackenzie, 2016.

SILVA,I.; NAKANO, T. Modelo dos cinco grandes fatores da personalidade: análise de pesquisas. Avaliação Psicológica, v.10,n.1,2011

[4] Antonio A. A. Machado , Magalí T. Longhi , Maria A. S. N. Nunes , Thiago A. S. Pardo. Personalitatem Lexicon: Um Léxico em Portugûes Brasileiro para Mineração de traços de Personalidade em Textos. Anais do XXVI Simpósio Brasileiro de Informática na Educação (SBIE 2015). Disponível em: http://conteudo.icmc.usp.br/pessoas/taspardo/SBIE2015-MachadoEtAl.pdf

--

--