Ano eleitoral será propício para o jornalismo de algoritmos (mas sem esquecer o resto)

Fábio Takahashi
O jornalismo no Brasil em 2020
6 min readDec 19, 2019

--

Aplicação de inteligência artificial deve aproveitar a evolução dos profissionais e se apoiar em parcerias, mas sem esquecer os métodos clássicos da profissão

Quando comecei a trabalhar como jornalista, no início dos anos 2000, o mantra era “jornalista que não souber Excel fica para trás”. Sinto algo parecido hoje em dia com “jornalismo de dados”, “programação”, “inteligência artificial”.

Essas máximas podem soar como simplificação de um trabalho tão complexo e bonito que é o jornalismo. Há muitos caminhos para deixar nosso público bem informado. Mas, sim, vejo como inevitável que nosso meio acelere o uso de ferramentas que integram o guarda-chuva inteligência artificial, uma das frentes mais interessantes e promissoras que o jornalismo de dados vem desbravando.

Sim, inevitável. Por duas razões. Uma é a interessante troca de conhecimento e de experiências sobre técnicas, práticas, recursos. Seja virtualmente, nos inúmeros cursos online ou repositórios de conhecimento, seja presencialmente, em eventos como o Coda e o Congresso da Abraji. A outra razão é a competição. À medida que o campo jornalístico ganha experiência na área, diferentes veículos publicam projetos impactantes e consistentes. Quem não apostar nessa frente vai ficar para trás.

Em 2020, eventos certamente vão impulsionar esse movimento.

Mas antes de seguir com essa previsão, acho que vale delimitar o escopo das minhas ideias.

Primeiro, o que é inteligência artificial?

São várias as definições e formas de uso, mas, para simplificar, vou colocar na minha cesta as iniciativas que passam por automação de processos e/ou algoritmos que analisam um volume de dados tão grande que seria praticamente impossível fazer tal tarefa apenas com humanos.

Uma segunda delimitação é que vou falar sobre projetos, digamos, estritamente editoriais. Digo isso porque as redações pelo mundo estão usando diversas técnicas de inteligência artificial para aumentar suas audiências, o engajamento com seus públicos. A Patrícia Gomes, do Jota, escreveu sobre isso no especial O jornalismo no Brasil em 2019. Recentemente, uma cientista de dados falou como o NYT está atuando nessa frente.

Finalizado o parêntese, vamos adiante.

Por que em 2020 podemos ter no Brasil mais produtos jornalísticos em que veremos termos como algoritmo, script, aprendizado de máquinas?

Resposta: Olimpíada e, principalmente, eleições municipais, eventos que tanto recebem cobertura jornalística especial, quanto são grandes fontes de dados.

Na Olimpíada, serão mais de 11 mil atletas. Nas eleições, serão entre 400 mil e 500 mil candidatos (considerando os pleitos anteriores).

Uma olhada para o passado recente ajuda a prever o cenário para 2020.

As eleições de 2018 catapultaram produtos noticiosos que contaram com a ajuda das máquinas. Não encontrei nenhum dado objetivo disso, mas certamente tenho bons exemplos qualitativos.

Com produtos relacionados ao pleito presidencial, dois veículos brasileiros ficaram entre os finalistas de uma mesma categoria (inovação) no principal prêmio de jornalismo de dados do mundo, o Data Journalism Awards — algo inédito para o país.

Nós, da Folha, entramos com o projeto “GPS Eleitoral, uma campanha inteira categorizada”. Nele, sistematizamos tudo o que os candidatos a presidente falaram nos programas eleitorais e em vídeos no Youtube (transcrevemos todos os áudios) e também no Twitter e no Facebook. Um modelo estatístico nos indicava, semanalmente, o que cada candidato mais tinha priorizado naquele período.

O modelo não nos dava apenas uma nuvem de palavras. Era suficientemente inteligente para entender que termos como “escola”, “professor” e “avaliação” estavam relacionados (ou seja, educação). E que em outro grupo de termos relacionados vinham palavras como “assassinatos”, “polícia”, “crimes” (ou seja, segurança).

Foram mais de 1 milhão de palavras analisadas.

Nossos colegas do Estadão, o outro projeto finalista, analisaram o sentimento dos candidatos em um dos debates presidenciais, por meio de suas expressões. A máquina, após ter sido treinada com inúmeras imagens de pessoas, conseguia identificar que determinado candidato havia perdido a paciência após uma pergunta, pois aquele padrão de face era condizente com outras que ela já sabia que eram de impaciência. É algo que traz uma objetividade maior para a pergunta: quem venceu o debate?

Cito esses dois projetos por terem sido simbolicamente reconhecidos pelo prêmio. Mas há tantos outros. A Operação Serenata do Amor, por exemplo, abriu um caminho imenso ao procurar, de forma automatizada, gastos suspeitos de parlamentares.

Projetos como esses certamente vão inspirar jornalistas pelo país a fazerem seus próprios trabalhos. Como partem de um modelo já aplicado, terão todas as condições de criar produtos mais sofisticados e interessantes.

Com eleições municipais que são tão pulverizadas, há incontáveis frentes em que as automatizações poderão ajudar na cobertura pelo país. O que os candidatos a prefeito estão prometendo via redes sociais? Há mudanças no perfil dos candidatos a vereador?

Também não podemos desprezar o fato de que esses grandes eventos conseguem mobilizar mais as redações e equipes jornalísticas, muitas vezes até com recursos extras.

Claro que projetos com alto nível de automatização não são triviais. Exigem bom conhecimento de programação dos profissionais e bons equipamentos (notadamente máquinas e servidores para processar esse monte de informações).

Observo que cresce rapidamente o número de profissionais aptos a trabalhar com grandes projetos. E, para quem ainda está nos primeiros passos, felizmente, há ótimos cursos para aprender algumas das técnicas necessárias. Cito a Escola de Dados e o Knight Center, mas há muitos outros.

Outro caminho é fazer parcerias, de diversas formas. Universidades, por exemplo, têm bons profissionais de ciência de dados e muitas têm interesse em amplificar a divulgação de seus trabalhos por meio da imprensa. Um exemplo é o trabalho em conjunto da rede Americana NPR, da Northwestern University e do Chicago Reporter, que analisaram dados de infrações disciplinares de detentos e descobriram que as mulheres são desproporcionalmente mais punidas do que os homens.

Um setor em que percebo um desenvolvimento rápido de profissionais aptos a trabalhar com jornalismo é o dos pesquisadores de ciência política, da área de métodos quantitativos. São pessoas que têm aliado boa capacidade de programação e de análise dos resultados. Em São Paulo, estou em contato com ótimos pesquisadores desse campo na FGV, Unicamp e USP.

A Folha teve uma ótima experiência com o Volt Data Lab, que financiou uma pesquisa sobre os gastos e o funcionamento da Assembleia Legislativa de São Paulo. O jornal entrou com a apuração tradicional a partir dos dados e publicou duas reportagens.

Outra opção para veículos que não têm profissionais especialistas em inteligência artificial é integrar à redação pessoal com capacidade de programação (mesmo que seja apenas para um período determinado, como o das eleições).

Seja como for, a inclusão dessas novas formas de análise de dados não deve prescindir dos métodos clássicos do jornalismo.

Por melhor que seja o programador na pauta, por mais bem intencionado que seja o projeto com inteligência artificial, ele não está imune a problemas clássicos, como enviesamento. Não raro, damos ordens erradas à máquina.

Entrevistar especialistas para debater seus achados, por exemplo, pode levantar sinais amarelos para as conclusões.

Ganha força também a cultura de ampliação da divulgação das metodologias (e até dos códigos), que dão mais transparência e segurança aos resultados encontrados.

E, mesmo que esteja tudo certinho com o algoritmo, como fica melhor uma reportagem que traz, junto com belos infográficos, belas histórias de pessoas.

Este texto faz parte da série O Jornalismo no Brasil em 2020. A opinião dos autores não necessariamente representa a opinião da Abraji ou do Farol Jornalismo.

--

--

Fábio Takahashi
O jornalismo no Brasil em 2020

Editor do DeltaFolha (jornalismo de dados da Folha). Apresentador do podcast de educação Folha na Sala. Vice-presidente da Jeduca (Assoc. Jornalistas de Educ.)