Como começar a pesquisar jornalismo guiado por dados?

Marília Gehrke
Apr 8 · 8 min read
Source: Research Data Oxford — University of Oxford

O que grandes investigações jornalísticas como Wikileaks, Panama Papers, Paradise Papers e Implant Files têm em comum? A partir de documentos vazados e da extração e análise de dados, seus desdobramentos viraram reportagens de repercussão internacional. Mobilizados em uma rede global de investigação, jornalistas contaram histórias sobre diferentes irregularidades por meio de apuração norteada principalmente por fontes documentais, afastando-se do tradicional jornalismo declaratório.

O jornalismo guiado por dados compreende, basicamente, o emprego e a análise de informações estruturadas em bancos de dados. A narrativa perpassa desde a coleta — geralmente tais informações são obtidas por meio de bancos de dados públicos, vazamentos, pedidos via Lei de Acesso à Informação, estruturação própria do veículo, crowdsourcing e outros — até a análise e apresentação dos dados em visualizações, tudo isso feito com a ajuda de softwares que trabalham com planilhas ou mesmo com o auxílio de linguagem de programação, utilizada principalmente para análises de volumes maiores.

De uns anos para cá, especialmente por conta de políticas públicas de transparência, o interesse pelo jornalismo guiado por dados cresceu nas redações, que implantaram seu uso, e na academia, que passou a estudar o fenômeno. Muita gente me pergunta como começar a se apropriar do tema e pesquisar. Este post é uma tentativa de refazer os caminhos que percorri até aqui.

Defendi a dissertação “O uso de fontes documentais no jornalismo guiado por dados” no Programa de Pós-Graduação em Comunicação da Universidade Federal do Rio Grande do Sul (PPGCOM/UFRGS) no início de 2018. Em linhas gerais, analisei e classifiquei 213 fontes documentais encontradas em 60 notícias publicadas em seis veículos do Brasil, da Argentina e dos Estados Unidos. Propus três categorias: arquivo documental, estatística e reprodução. Quem quiser saber mais detalhes pode ler o material completo ou trocar uma ideia comigo.

Quem deseja estudar o jornalismo guiado por dados precisa estar ciente de que maior parte da bibliografia é em inglês. Especialmente os materiais de referência, que ajudarão a entender o contexto de seu surgimento. De qualquer forma, como mostrarei adiante, a produção em outros idiomas, inclusive em português, também vem crescendo.


Uma das minhas principais dúvidas como iniciante dizia respeito ao termo utilizado: é jornalismo de dados ou jornalismo guiado por dados? A resposta curta é: tanto faz, são sinônimos. Como eu havia dito em post anterior, costumamos dar vários nomes ao jornalismo. Em inglês, nos artigos científicos, você vai encontrar principalmente a forma data journalism; se você buscar algo no Twitter, porém, sugiro a forma #ddj (data-driven journalism). Eu mesma costumava utilizar jornalismo de dados nos meus primeiros artigos, porém passei a adotar o termo jornalismo guiado por dados por entender que revela melhor seu propósito: que os dados guiam a narrativa, são seus protagonistas. Há autores que problematizam a diferença do jornalismo de dados e com dados — esse último seria o uso meramente ilustrativo de estatística descritiva, por exemplo.

Você também pode encontrar outros termos relacionados ao JGD, como jornalismo de precisão, Reportagem Assistida por Computador (RAC) — ainda bastante utilizado nos Estados Unidos — e jornalismo computacional. Para quem tiver curiosidade, explico a diferença entre eles na página 52 da dissertação.

Um dos marcos do uso do termo como conhecemos hoje é atribuído ao jornalista e programador Adrian Holovaty. Em 2009, ele escreveu o texto intitulado A fundamental way newspapers need to change. O post se popularizou e traduz uma ideia simples: os jornalistas podem (e devem) estruturar e gerar dados a partir de sua própria apuração ao invés de noticiar apenas um caso específico. Uma das grandes sacadas do jornalismo guiado por dados é justamente poder recuperar informações já trabalhadas. Escrevi sobre isso em um artigo apresentado ao Intercom em 2016, trazendo como exemplo o banco de dados criado pelo jornal Diário Gaúcho e materializado no Dossiê DG Violência.


Penso que a melhor forma de começar a ter familiaridade com os conceitos e aspectos históricos do jornalismo guiado de dados é por meio dos manuais. Os textos, escritos por pesquisadores de diferentes países, não são teoricamente densos — é a medida ideal para quem quer começar a se aventurar pelo campo.

Quando escrevi a dissertação, meu contato inicial foi com a primeira versão do manual, de 2012, em inglês. Havia uma versão traduzida para o português, mas aparentemente o link está com problemas. Um dos textos introdutórios é assinado pelo professor Paul Bradshaw (Birmingham City University), uma das principais referências de jornalismo guiado por dados no mundo. Tive o privilégio de encontrá-lo ano passado no 2nd European Data and Computational Journalism, realizado em Cardiff. Toda a bibliografia produzida por ele merece ser lida.

Bradshaw mantém atualizado o site Online Journalism Blog e um de seus textos mais conhecidos propõe um modelo de pirâmide invertida no jornalismo guiado por dados. Também recomendo um de seus livros publicados mais recentemente: a segunda edição do Manual de Jornalismo Online, que apresenta um capítulo inteirinho sobre jornalismo guiado por dados.

Outros estudiosos que têm produzido conteúdo importante para o campo são a professora Bahareh Heravi (University College Dublin), que desenvolveu pesquisas sobre a presença do jornalismo guiado por dados junto às redações e freelancers do mundo e também sobre a relação do JGD com o ensino. A propósito, ela apresenta uma palestra muito bacana em que deixa clara a importância não só dos grandes conjuntos de dados, mas defende que é possível fazer jornalismo de dados usando um compilado mais enxuto de informações. Esse é o tipo de ideia que viabiliza a presença do JGD nas estruturas jornalísticas menores e com menos recursos.

O uso de dados na produção noticiosa não é de hoje, claro. Para quem deseja conhecer aspectos históricos — e que eu considero fundamentais — , vale ler o texto do Simon Rogers, escrito à época em que ele trabalhava no The Guardian e editava o Datablog. Rogers relata como o interesse de um médico em desvendar os casos de cólera mudou a perspectiva do uso de dados. E traz um insight: o começo de uma investigação pode partir da distribuição das informações em um mapa, possibilitando a identificação de padrões. O livro Facts are Sacred, assinado por Rogers, complementa esta perspectiva histórica do emprego de dados no jornalismo.

Falando em perspectiva histórica, não se pode fugir das raízes do termo, ligada a correntes teóricas desenvolvidas principalmente nos Estados Unidos. O jornalismo de precisão, criado por Philip Meyer na segunda metade dos anos de 1960 e que dá nome ao livro publicado pela primeira vez em 1973, defendia que o jornalismo se aproximasse da ciência, utilizando método adequado, e tivesse menor dependência das fontes oficiais. Sugeria, por exemplo, que os repórteres utilizassem técnicas de pesquisa social no trabalho de apuração. O próprio Meyer colocou esta ideia em prática — e deu tão certo que ele e a equipe foram premiados no ano de 1968 em uma das categorias do Pulitzer, principal prêmio de jornalismo no mundo, a partir da cobertura feita sobre os Detroit Riots, ocorridos no ano anterior. Ainda na linha do jornalismo de precisão, há o livro de José Luis Dader. Para o autor, os bancos de dados são fontes riquíssimas de histórias para os jornalistas.

Com a chegada dos computadores às redações e sua disseminação nos anos de 1980, surge um novo termo para designar a investigação jornalística que conta com o suporte de ferramentas da informática: Reportagem Assistida por Computador (RAC). Em inglês, o termo é conhecido como Computer-Assisted Reporting (CAR) e ainda é muito utilizado nos Estados Unidos, onde se desenvolveu. Aliás, ainda dá nome a uma das principais conferências investigativas daquele país, promovida pelo National Institute of Computer-Assisted Reporting (Nicar) e ligada à Investigative Reporters and Editors. Atualmente, de maneira geral, a RAC está associada à análise a partir de bases de dados pouco complexas ou ferramentas básicas, sem o uso de automação, por exemplo.

Vale ponderar, contudo, que o próprio Philip Meyer refuta a nomenclatura da RAC. Em entrevista feita por mim e minha orientadora de mestrado Luciana Mielniczuk (in memoriam), ele admite que existe um problema em associar a criação de termos a determinados meios ou aparatos tecnológicos. Disse, por exemplo, que nenhuma pessoa utiliza a expressão “reportagem assistida por telefone” porque é algo incorporado à rotina. Assim, prefere ser conhecido por sua contribuição a partir do método científico aplicado ao jornalismo.


A boa notícia é que pesquisadores brasileiros também estão se debruçando sobre o tema. A principal referência acadêmica de jornalismo guiado por dados no Brasil é o professor Marcelo Träsel (UFRGS), que escreveu a tese intitulada Entrevistando Planilhas, defendida em 2014. Em abordagem de inspiração etnográfica, ele faz cruzamentos entre teoria e prática a partir de observação participante no grupo de jornalismo de dados do Estadão, complementando com entrevistas a outros jornalistas. Também em sua tese de doutorado, em texto defendido em 2007, a professora Suzana Barbosa (UFBA) cita o JGD como parte do paradigma do Jornalismo Digital em Bases de Dados. A estruturação em bases de dados e a própria base como fonte para o jornalismo ainda foi amplamente discutida pelo professor Elias Machado (UFSC) na primeira década dos anos 2000.

Outra dica boa — e em português — é para quem quer compreender o básico de estatística e não errar a mão nas visualizações de dados. O livro é antigo, mas segue atual e apresenta bons exemplos: Como mentir com estatística, de Darrell Huff. Certamente você vai se lembrar dos gráficos esquisitos apresentados nas campanhas políticas por aí. Aliás, faz pouco tempo que o Nexo Jornal (super referência brasileira em jornalismo explicativo e de dados; sugiro fortemente acompanhar o trabalho) publicou uma lista com os erros mais comuns em gráficos, sugerindo ao que o leitor deve ficar atento.

Lembrando que, no jornalismo guiado por dados, o guru da visualização é o professor Alberto Cairo (University of Miami). Vale acompanhar seu perfil no Twitter — de vez em quando ele publica as apresentações das palestras — , os tutoriais (ver site) e livros que publicou — há opções em inglês e espanhol.


Para quem deseja aprender a colocar em prática todos esses conhecimentos, sugiro começar pelos cursos introdutórios oferecidos pela Associação Brasileira de Jornalismo Investigativo (Abraji) e pelo Centro Knight de Jornalismo para as Américas. O Centro Knight costuma oferecer versões gratuitas de cursos bacanas em que o aluno só paga pela certificação, se assim desejar. Os tutores de ambos são profissionais qualificados e que respondem rapidamente aos questionamentos surgidos durante o curso. Vale lembrar que a Escola de Dados possui tutoriais com todas as respostas possíveis. Também vale ficar de olho no Twitter, pois toda hora — é sério — tem thread nova com mil e uma dicas. Para quem cobre economia, a dica é verificar o Siga os Números, e-book criado pela Mariana Segala, jornalista especializada na área. Veja também as dicas da página Troco Dados, criada por mim e pela Fabiana Freitas, voltada principalmente para iniciantes a partir de dicas coletadas em congressos da área.

E aos que preferem cursos presenciais, sugiro acompanhar as ofertas de curso — e todos os trabalhos magníficos — do Volt Data Lab. Fiz o curso com o Sérgio Spagnuolo em Porto Alegre, no ano passado, e super recomendo. É a medida exata para quem quer sair do básico.

Além dos cursos aqui mencionados, há dois congressos brasileiros que oferecem palestras e oficinas sobre jornalismo guiado por dados: o da Associação Brasileira de Jornalismo Investigativo (Abraji), que ocorre anualmente no final de junho, em São Paulo; e a Conferência Brasileira de Jornalismo e Métodos Digitais (Coda BR), que também acontece anualmente em São Paulo, no mês de novembro.


O emprego de dados no jornalismo veio para ficar. Penso que as práticas do jornalismo guiado por dados vão ser incorporadas nas redações e também por freelancers. Talvez não se chame mais jornalismo guiado por dados no futuro, mas seu propósito continuará ganhando espaço. Em um cenário de desinformação, o uso de evidências traz alento. Acredito que este seja um campo de estudo em processo de solidificação e incorporação às práticas tradicionais, assim como verificação e fact-checking, jornalismo com o uso de robôs e outros processos de automatização. Enquanto todo esse conjunto de práticas ainda apresenta nomes específicos, vale conhecer um pouco mais do cenário até aqui para pensar em projeções.

Marília Gehrke

Written by

Journalist and PhD student in Communication at Federal University of Rio Grande do Sul, Porto Alegre, Brazil.

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade