Porque o jornalismo de dados não é só para jornalistas

E 20 recursos (quase todos gratuitos) para começar a usar os seus dados para melhorar o seu negócio e a sua vida

Gabriel Attuy
Medium Brasil

--

Nunca me dei muito bem com a língua portuguesa (disse o jornalista). Enquanto alguns dos meus colegas de faculdade passeavam em seus textos por histórias interessantes, ideias elegantes e belíssimas exposições, lá estava eu abraçando o bom e velho "manual de redação" procurando qualquer série de regras, alguma estrutura para conseguir escrever um texto objetivo e que fizesse sentido.

Quando o tal do jornalismo de dados meio que caiu no meu colo foi um alívio. Naquela época (por volta de 2005) o termo ainda não era muito popular e, no Brasil, pouca gente via isso como uma vertente a ser explorada.

A aplicação do jornalismo de dados, é claro, é muito mais antiga que isso. Em 1848 o New York Tribune compilou centenas de informações para denunciar os gastos inflados de congressistas americanos com viagens da capital aos seus respectivos estados. Mas o conceito moderno de jornalismo de dados tomou forma e se popularizou por volta de 2010 quando algumas das primeiras conferências internacionais sobre o assunto foram realizadas.

A busca por "data journalism" no Google ganhou relevância a partir de 2011

De volta à minha história… ainda na faculdade eu trabalhei no Anuário de Infra-Estrutura da Revista Exame da Editora Abril. Na minha entrevista com o então editor da publicação, Alexandre Secco, expliquei que o meu trabalho de conclusão de curso consistia de uma série de entrevistas com os fundadores e editores de algumas das mais reconhecidas publicações sobre música no Brasil. O meu objetivo era descobrir se era possível lançar uma revista nova no mercado. Secco me perguntou qual era a minha conclusão e eu disse que só um maluco tentaria lançar uma revista dessas naquele momento. Começou aí uma parceria que continua até hoje na Medialogue.

A reportagem do New York Tribune de 1848. Não deve ter sido fácil montar essa tabela

Depois de mais alguns projetos na Exame fui trabalhar na recém-criada Análise Editorial. O nosso negócio era conduzir pesquisas muito ambiciosas e traduzir todo o conteúdo em tabelas, gráficos, textos e análises. O desafio não era apenas jornalístico, mas tecnológico e de planejamento. Contratamos uma equipe de TI, desenvolvemos bases de dados e ferramentas para que pesquisadores e entrevistados pudessem responder a questionários online, e quebramos a cabeça para entender como produzir centenas e centenas de páginas (de papel mesmo!) recheadas de dados com uma equipe reduzida, poucos recursos e em pouco tempo.

O que eu fazia era puro jornalismo. Mais na tarde na Medialogue eu, Secco, e o Arthur Lopez descobrimos que os princípios do jornalismo de dados serviam para outros mundos. Lançamos a pesquisa Político 2.0 e nesta última semana a primeira edição de Cidades Conectadas que analisa a presença digital e a interação online entre governos e cidadãos nos maiores municípios de Santa Catarina. Nos links é possível baixar os relatórios completos, volto a isso um pouco depois.

O digital bagunçou os conceitos e deixou tudo mais interessante

A partir daí as coisas começaram a ficar (ainda mais) interessantes. A morte do jornalismo foi decretada pela enésima vez e as nossas cabeças se voltaram para o universo das redes sociais. O que de início me parecia mais uma plataforma para veicular "jornalismo" escondia um mundo de dados a serem analisados e aplicados.

Antes quero dizer que o jornalismo de dados vai muito bem obrigado. É só dar uma olhada no excelente Datablog do Guardian, no projeto brasileiro Volt ou nessa visualização que compilou dados por meio de crowdsourcing para criar uma base de dados de mortes causadas por policiais nos Estados Unidos. O jornal O Globo foi um dos primeiros veículos brasileiros a entrar a fundo no assunto. Confira o blog do núcleo de jornalismo de dados.

Análise da eleição na Turquia pelo Guardian
Os dados das demissões nos principais veículos de imprensa brasileiros no Volt
Projeto que agrega dados de 2011 a 2015 sobre mortes causadas por policiais nos EUA

Dados, dados, dados

Agora, tudo são dados. O seu telefone pode te dizer quantos passos você deu no dia, ou qual o seu consumo ideal de calorias. O seu software de CRM te diz quais dos seus clientes abriram o seu e-mail, o que eles mais gostam de ler e para quais vale a pena ligar primeiro para fechar negócios.

Mais do que isso, os dados de todo mundo estão disponíveis (para o bem e, às vezes, para o mal). O Netflix decidiu produzir a série House of Cards depois que eles analisaram os hábitos de seus clientes e perceberam que juntar o Kevin Spacey com o David Fincher em um drama político era uma boa ideia. A revolucionária campanha presidencial do Obama em 2008 investiu pesado em coleta e análise de dados para chegar até seus eleitores e prever resultados de votações.

Para quem trabalha no mundo das campanhas digitais e social analytics como a Medialogue os conceitos do jornalismo de dados se aplicam a entender o que costumamos chamar de "opinião social". Todo mundo nas redes sociais está conversando, saber o que elas pensam vale muito. Conseguir interpretar e apresentar essas informações de maneira clara e objetiva é a conclusão desse processo.

Por onde começar

Nos últimos anos novas ferramentas online democratizaram como e quem pode coletar e analisar dados. Vou listar aqui alguns recursos muito úteis e fontes de informação gratuitas disponíveis na web.

Projeto A World of Change sediado no Chrome Experiments

1) Dados: para começar a analisar dados, você precisa ter dados para analisar. O Google recentemente lançou o Google Trends Datastore onde é possível baixar dados de buscas de tópicos selecionados.

O Datablog do Guardian tem a política de publicar os seus dados brutos junto com as suas reportagens. Aqui, por exemplo, é possível baixar uma base de dados com o número de cavalos na União Europeia.

E no site do Ministério do Desenvolvimento brasileiro é possível baixar os principais indicadores do comércio exterior do país desde 1999.

Ou, melhor ainda, crie a sua própria base de dados. Ferramentas como Survey Monkey (pago mas com uma versão free limitada) e Google Forms (100% gratuita) são boas para isso.

Aqui tem uma lista mais extensa de bases de dados públicas.

2) Análise e manipulação: grande parte das bases de dados que utilizamos hoje estão guardadas em algum tipo de planilha. Você provavelmente já tem algo instalado no seu computador para fazer isso. Se não tiver baixe o Open Office ou use o Google Docs.

O Gephi é uma plataforma gratuita de visualização e análise de dados de redes. Open source e um recurso poderoso para manipular informações.

O OpenRefine é outra ferramenta open source hospedada no GitHub que te ajuda a trabalhar com dados "bagunçados" e refinar a sua base.

O Textexture é uma ferramenta para visualizar textos como redes

3) Visualização: não adianta ter uma série de dados interessante e uma análise poderosa se você não consegue explicar para ninguém o que encontrou. Ferramentas online como Infogram, Infoactive e Piktochart são uma mão na roda para criar gráficos bonitos e que funcionam.

Para usuários mais avançados aqui tem uma lista com algumas bibliotecas fantásticas para criar data visualizations.

E este site tem uma centena de recursos para criar visualizações de simples nuvens de palavras a sites inteiros.

Como continuamos a coletar, analisar e apresentar dados

Na Medialogue, que não é uma empresa de jornalismo, continuamos a usar vários elementos do jornalismo de dados para entender o mundo digital. A nossa mais recente empreitada é a pesquisa Cidades Conectadas. A primeira edição analisa 12 cidades catarinenses com mais de cem mil habitantes para verificar como esses municípios estão presentes na web, quais são e como funcionam os canais de contato entre o governo e a população, qual é o nível de oferta e atualização de informações online e como os munícipes interagem com os canais. Em seguida vamos partir para as cidades paulistas, o resultado deve estar disponível nas próximas semanas.

Já fizemos mais de 20 estudos desse tipo, entre eles a pesquisa Político 2.0, que partem de uma apuração de dados do zero para analisar as relações entre o mundo político, empresários, cidadãos e o ambiente digital. Confira esses estudos (todos disponíveis de graça) no nosso site.

Para terminar quero dizer que fazer jornalismo de dados é um barato. E o melhor é que agora todo mundo pode fazer. É só escolher por onde começar.

Siga a Medialogue no Medium para ler mais textos da nossa equipe.

E dê um like na nossa página no Facebook para saber o que estamos lendo e pensado sobre redes sociais, analytics e jornalismo.

--

--