Internet e periferia: em busca dos dados

Entre setembro e novembro, nós do data_labe trabalhamos em uma pauta junto com o pessoal da Escola de Jornalismo da Énois de São Paulo. O objetivo era falar sobre o acesso à internet como direito — quais as barreiras, quais os impactos da subconexão e as alternativas de acesso à rede — sob o nosso ponto de vista: das periferias do Rio e de São Paulo. A matéria completa você pode ver no site do Nexo Jornal.

Durante a apuração, boa parte das nossas experiências com a falta de conexão à internet fizeram parte da discussão. Casos como o da Kelayne, aluna da Énois, que só tem acesso à internet durante a aula da escola, por exemplo, é mais comum do que se imagina. Ou da Steph, que via as crianças em Guaianazes, periferia de São Paulo, irem atrás dos ônibus com wifi que ficavam parados no engarrafamento próximo à favela nos horários de rush. As histórias podem ser curiosas, mas em menor ou maior grau, as barreiras para quem está na periferia ter acesso à internet são quase sempre as mesmas. O custo, por exemplo, é um fator determinante para quem mora na periferia não ter internet em casa, segundo os dados do CETIC domicílios de 2015. Quando o problema não é o custo, a falta de infraestrutura é um dos argumentos que as empresas de telecomunicações usam para justificar quando “a internet não chega”.

Mas como falar disso em uma matéria? Como mostrar que a subconexão, num mundo em rede como o que vivemos, implica em questões sociais, educacionais, de formação, liberdade de expressão, informação, participação na vida pública e política do país.

Quando não encontramos respostas nas bases é preciso olhar além dos dados.

Para dar apoio às histórias que ouvimos e vivemos, recorremos aos dados. Buscar bases sobre uso da internet no Rio e em São Paulo não foi difícil. Perguntas sobre o tema foram incluídas nos últimos anos em pesquisas como a da PNAD (Pesquisa Nacional por Amostra de Domicílios), fornecida pelo IBGE (Instituto Brasileiro de Geografia e Estatística), e do CETIC (Centro Regional de Estudos para o Desenvolvimento da Sociedade da Informação), produzido pelo CGI, o Comitê Gestor da Internet, uma das organizações da sociedade civil que participou da elaboração do Marco Civil. No entanto, nossa maior dificuldade foi o acesso a essas bases, principalmente quando falamos dos dados brutos.

No caso das bases da PNAD, além de precisarmos solicitar os dados brutos para fazermos uma análise, tivemos dificuldades em lidar com as tabelas em R, linguagem de programação com a qual ainda não estamos familiarizados. Ou seja, mesmo os dados sendo disponibilizados publicamente, existe uma barreira técnica para seu acesso. Quem se propõe, como nós, a trabalhar com dados para a construção de narrativas, acaba passando por esse momento: o duelo com a programação.

Além disso, ter a base de dados bruta significa poder cruzar os dados disponíveis para então respondermos as perguntas que fizemos inicialmente e que não necessariamente estavam nos relatórios que encontramos. No caso, quem são as pessoas que tem mais acesso à internet no Brasil? Como as pessoas que estão nas periferias de Rio e São Paulo estão acessando à internet? Elas tem acesso afinal?

Todas essas perguntas nos levam a outro ponto, a falta de dados básicos sobre as realidades das quatro favelas que escolhemos abordar — Complexo da Maré e Complexo do Alemão, no Rio de Janeiro, e Heliópolis e Paraisópolis, em São Paulo. Nesse ponto do nosso trabalho, nos deparamos com a base de dados do Simet — também disponibilizada pelo CGI. Construída como um mapa, o Simet mostra a velocidade da internet por georeferenciamento. Basta digitar o CEP de um lugar pra saber quais operadoras estão disponíveis em uma região e qual é a velocidade de cada operadora. Parece ótimo à primeira vista, mas quando usamos o mapa, alguns dados não bateram com a realidade. Como, por exemplo, o fato de que no Complexo do Maré apenas a Oi presta serviço de internet, enquanto as outras operadoras não, o que contradiz o mapa do Simet.

Nos nossos trabalhos pelo data_labe, muitas vezes nos deparamos com dados que não condizem com nossas experiências em territórios de periferias e favelas. Mas e quando não encontramos os dados? Nesse caso, a questão interfere em muito mais coisas do que a criação de narrativas. A falta de dados mostra como alguns grupos da sociedade civil estão fora da criação de políticas públicas, da garantia de direitos que nos permite existir como cidadãos. Internet é um direito, garantido pelo Marco Civil, e se temos dados que não são capazes de se aproximar da realidade ou inexistentes, como pensar em políticas públicas para o acesso à informação, o direito à comunicação, à formação, dentre outras coisas no ambiente digital?

Por mais completa que possa ser a metodologia para a criação de uma base de dados, nem sempre ela é capaz de traduzir a realidade, principalmente quando falamos de periferias e favelas. Quando vamos em busca de bases de dados temos a preocupação de saber qual foi a metodologia usada para reunir e estruturar toda essa informação. Em um primeiro momento, porque é preciso entender o contexto e o objetivo dessa base, quais respostas ela pode dar para nós, e quando não chegamos nessas respostas é preciso olhar além desses dados.

É quando usamos outras formas de chegar à informações que os órgãos públicos ainda não são capazes de mensurar. Iniciativas como a do Grupo Gay da Bahia, que reúne dados sobre mortes de transsexuais no Brasil a partir de notícias retiradas de portais — e que foi usada na pesquisa do Eloi no ano passado, Transdados. Ou a iniciativa do fogo cruzado que, além de mostrar onde ocorrem tiroteios na cidade do Rio, passou a registrar também as consequências: escolas e postos de saúde fechados, quantos dias as crianças das favelas ficam sem aula e etc. Informações que não chegam se olharmos apenas para os dados oficiais. O fato é que cada vez mais estamos indo atrás do que não é mostrado oficialmente como forma de trazer à luz partes da realidade que antes estavam invisibilizadas pela metodologia.