Dados públicos — nem água, nem petróleo

A governança de dados no setor público ainda tem muito a avançar. Mas não precisamos esperar para começar a transformar dados em políticas públicas mais efetivas

--

“Os dados são o novo petróleo”. Talvez você já tenha ouvido essa comparação, que virou lugar-comum em falas que buscam ressaltar a importância do uso de dados em praticamente todos os aspectos da vida no século 21.

Outros preferem comparar os dados com a água: afinal, ambos existem em grandes quantidades, mas só têm valor quando adequadamente tratados e limpos.

Como todas as analogias, ambas têm alguma capacidade explicativa e muitos limites. Mas também revelam uma contradição interessante: ao longo do tempo, tanto o petróleo quanto a água suscitaram a criação de complexas cadeias produtivas, tecnologias de captação e tratamento e mecanismos de governança.

Já do ponto de vista dos dados — e, sobretudo, dos dados públicos — as estruturas de governança e os padrões de qualidade que permitiriam transformar esse ativo em qualidade de vida para as pessoas ainda estão engatinhando.

Governos e órgãos de controle têm sido chamados a se pronunciar com cada vez mais frequência sobre o uso e a troca de dados por cidadãos e empresas. Por outro lado, sendo elas próprias grandes produtoras e depositárias de informações públicas e privadas, essas instituições ainda têm feito pouco para indicar como pretendem trabalhar para transformar os dados que possuem em melhores serviços prestados à população.

Um oceano de dados desprezados

O primeiro artigo da série sobre o projeto Bússola falou de como a tendência atual de construir painéis enciclopédicos ajuda pouco a promover uma atuação verdadeiramente baseada em dados no setor público. O artigo tratou da importância de priorizar informações e temas críticos, e de como o projeto Bússola tem trabalhado essas questões.

Este segundo artigo, tratamos de um aspecto sem o qual nenhuma estratégia de monitoramento e intervenção baseada em dados vai para frente: o acesso e a qualidade das bases de origem.

Quarto com paredes e piso repleto de livros e papéis totalmente desorganizados
Às vezes, a falta de uma gestão eficiente da informação é o principal obstáculo para melhorar as políticas públicas. Fonte: atribuído à CBC.CA.

Entre quem trabalha tentando extrair informações relevantes a partir de enormes conjuntos de planilhas e tabelas, é recorrente a afirmação de que a modelagem e o uso de inteligência computacional são apenas uma pequena fração do trabalho por trás dos “robôs” que brilham os olhos dos usuários e gestores.

Há até um percentual que se popularizou a partir de uma pesquisa com integrantes da profissão mais quente do século 21: cerca de 80% do trabalho de um cientista de dados consiste em obter, limpar e organizar os dados antes de analisá-los. Em um ambiente de escassez de mão de obra especializada para lidar com dados — que é a realidade da maior parte do setor público brasileiro — esse custo pode ser proibitivo.

Isso para não falar no potencial para atrasos, erros, omissões e adulterações intencionais em todo o caminho entre a fonte do dado e a sua utilização pelo usuário final do painel, alerta ou narrativa que consome essas informações.

O que chama mais atenção nessa realidade é que ela pouco tem a ver com alguma questão tecnológica. A multiplicidade de padrões para representar informações de interesse sobre uma mesma política pública; de repositórios para armazenar essas informações; e de políticas de acesso e compartilhamento costumam refletir uma atmosfera de pouco compromisso com a transparência e a governança dos dados públicos.

Para piorar, há ainda questões anteriores relacionadas à confiança, atualização e suporte de coleta dos dados, que igualmente refletem o compromisso (ou sua falta) com uma atuação baseada em dados.

Boletim de medição de obra de saneamento do Governo do Estado do Rio de Janeiro. Papel assinado e escaneado, com dobras.
Caso real: planilhas como essa poderiam estar alimentando o controle de obras de despoluição da Baía da Guanabara… se não fossem impressas, assinadas e escaneadas de novo. Fonte: SEI.

Nessas situações, cada órgão e cada estrutura tende a se tornar um feudo informacional, que não trabalha com os demais e não presta contas para a sociedade.

Do ponto de vista do controle, a situação é ainda pior: parece simplesmente impossível navegar o mar de informações dispersas, sistemas mal documentados, planilhas mal formatadas e documentos escaneados que os controlados muitas vezes fornecem aos órgãos de controle. Quem dirá, então, usar esses dados para determinar se as políticas públicas estão sendo executadas da maneira mais custo-efetiva.

Mas não precisa ser assim.

Duas dimensões, sete critérios

Enquanto o uso de padrões de dados abertos e de dados conectados não se tornam mais comuns no setor público, qualquer projeto que pretenda melhorar a efetividade dos serviços prestados à população deve levar em conta duas dimensões fundamentais: o valor de uma informação para o monitoramento e aperfeiçoamento de uma política pública, e o custo de produzir, obter e tratar os dados necessários.

Três pessoas de costas, viradas para uma parede com post-its coloridos. Na parede, há um eixo com o título “Custo”.
É importante que a definição de custo e valor dos indicadores contem com a validação de diferentes especialistas na área. Atividades colaborativas podem ajudar nesse processo.

A construção do projeto Bússola incluiu todo o caminho desde a priorização de indicadores até a garantia do acesso aos dados e a montagem de uma arquitetura de coleta contínua, com ferramentas de computação em nuvem.

O objetivo era garantir que o dado produzido na unidade que presta o serviço público — quer seja um hospital, uma obra de saneamento ou uma unidade prisional — chegue diretamente ao gestor e ao controlador e, quando a informação não for sigilosa, à sociedade, em tempo real e com alto grau de confiança.

Para isso, é essencial focar nos dados certos, isto é, aqueles que trazem o maior valor, com o menor custo de produção, obtenção e tratamento. Reconhecer esses dados não é simples.

No Bússola, o processo envolve momentos de construção coletiva para pesquisa de fontes de informação; ou para a priorização dos indicadores mais críticos. No meio do caminho, podem ser necessárias ainda algumas horas de trabalho da equipe, pesquisando projetos com escopos parecidos, revisando publicações acadêmicas e buscando a documentação — às vezes, bastante escondida — dos sistemas de informação utilizados pelos órgãos.

Para transformar as informações recolhidas em uma lista de indicadores priorizados, a equipe responsável pelo projeto classifica os potenciais indicadores de acordo com três critérios de valor e quatro critérios de custo e qualidade do dado:

Valor

  • Gravidade: um problema relacionado a esse indicador seria muito ou pouco sério?
  • Frequência de ocorrência: quais são as chances de um problema relacionado a esse indicador acontecer?
  • Controle por parte da gestão: é possível para o gestor fazer algo em relação a um problema mostrado por esse indicador?

Custo e qualidade

  • Formato de armazenamento: os dados necessários estão registrados em papel? Em planilhas? Em sistemas informatizados? Estão em formato de texto ou são estruturados em formatos legíveis por máquina?
  • Grau de dispersão: os dados registrados nas unidades são centralizados em um mesmo formato por algum órgão municipal, estadual ou federal? Se a informação é registrada em sistemas comerciais, existe algum fornecedor que detém a maior parte do mercado?
  • Frequência de atualização: com que frequência os dados são registrados ou atualizados na fonte?
  • Confiabilidade: os dados registrados costumam refletir a realidade da prestação do serviço?

Essa lista de critérios auxilia a priorização de dados para abertura e monitoramento, mas também serve para o gestor que deseja enfrentar os desafios da governança da informação em seu órgão. Por exemplo, dados de alto valor, mas muito dispersos, são bons candidatos para começar a adotar ontologias e vocabulários controlados.

Se a confiabilidade dos dados é baixa, esse pode ser um bom indicativo para buscar soluções já disponíveis, baseadas em monitoramento colaborativo, sensoriamento remoto, internet das coisas ou até blockchain.

(Para um exemplo de como transformar esses critérios em uma lista de indicadores priorizados, veja o relatório do Bússola _ Gestão Hospitalar, que conta como foi esse processo no caso de dois hospitais em Volta Redonda).

Da priorização ao acesso direto

Mesmo a melhor priorização pode naufragar quando falta uma estratégia de acesso aos dados que garanta a autenticidade e a rapidez na prestação de contas.

O Ministério Público tem prerrogativa legal de acesso direto e incondicional a bancos de dados relativos a serviços públicos. Isso significa que o órgão de controle pode ligar suas ferramentas de acompanhamento e inteligência diretamente aos sistemas das unidades que prestam o serviço público.

É a melhor forma — talvez a única — de garantir que os dados estejam sempre atualizados, e não tenham sido adulterados ou omitidos no caminho.

Três homens sentados ao redor de uma mesa, em uma sala cheia de computadores. Um deles mostra a outro algo em um monitor.
Coleta de dados no Hospital São João Batista, em Volta Redonda. O acesso direto aos sistemas das unidades pode ser a única maneira de garantir o monitoramento sempre atualizado e fiel da prestação dos serviços públicos.

O Bússola envolveu uma estratégia legal para fazer valer essa estratégia de acesso direto. A partir de requisições dos promotores parceiros do projeto, as unidades e secretarias envolvidas no projeto passaram a compartilhar as informações priorizadas nas etapas anteriores do projeto.

Primeiro, com uma coleta dos dados históricos existentes até o momento, para validar as estimativas valor e custo dos dados e para fornecer um padrão de comparação. Em seguida, com uma arquitetura de dados propriamente dita, para coleta em tempo real.

Outras instituições de controle e órgãos de governo podem adaptar essas estratégias para suas próprias realidades. Lideranças comprometidas com a melhoria de custo-efetividade dos serviços públicos podem e devem facilitar o acesso a dados públicos por meio de normas infralegais e de dispositivos contratuais (por exemplo, neste caso ligado ao Bússola _ Gestão Hospitalar). E é sempre bom lembrar que a maior parte desses dados já deveria ser ativamente disponibilizada, conforme exige a Lei de Acesso à Informação.

Uma vez priorizados e obtidos os dados, o próximo passo é transformá-los em visualizações e narrativas que façam sentido para o seu usuário final — o gestor, controlador ou cidadão. Esse é o tema do próximo e último artigo desta série sobre o Bússola.

Siga a revista para acompanhar essa e outras publicações sobre inovação em governo e controle. Se tiver alguma experiência que gostaria de compartilhar sobre o tema, deixe um comentário.

Com contribuições de Beatriz Ferreira, Breno Gouvea, Daniel Lima Ribeiro, Gabriel Delman, Júlia Rosa, Leonardo Santanna, Letícia Albrecht, Manuella Caputo, Marcelo Coutinho e Matheus Donato.

Este artigo não representa a opinião institucional do Ministério Público do Estado do Rio de Janeiro, de seus órgãos ou integrantes, sendo de iniciativa e responsabilidade exclusivamente pessoal do autor.

Este material é disponibilizado sob licença Creative Commons Atribuição 4.0 Internacional (CC-BY 4.0). Você é livre para compartilhar e readaptar o conteúdo para qualquer fim, mesmo que comercial, desde que cite a fonte original.

A licença não inclui trechos de texto ou mídia de outros autores reproduzidos no post. Verifique com o autor do trabalho original sobre as condições para compartilhamento e reuso.

--

--