‘Mathwashing’, Facebook e o zeitgeist da adoração aos dados

Tecs: grupo de comput{ação social} da USP
Tecs USP
Published in
4 min readApr 22, 2018

[Esta entrevista foi originalmente publicada em 8 de junho de 2016, no Technical.ly, e traduzida pela equipe do Tecs em 20 de abril de 2018.]

Technical.ly Brooklyn: Bom, eu deparei-me com o seu uso de mathwashing e é um conceito sobre o qual tenho pensado muito ultimamente. O que ele significa?

Fred Benenson: Mathwashing pode ser pensado como o uso de termos matemáticos (algoritmo, modelo, etc.) para encobrir uma realidade mais subjetiva. Por exemplo, diversas pessoas acreditaram que o Facebook utilizava um algoritmo não viesado para determinar seus trending topics, ainda que eles tenham admitido que humanos estavam envolvidos no processo.

TB: De onde o conceito vem? O que fez com que você falasse sobre ele?

FB: Quando surgiram as notícias de que os editores do Facebook estavam suprimindo algumas histórias e injetando outras [nos trending topics], pensei que era importante examinar por que acreditávamos que essas ferramentas eram objetivas em primeiro lugar. Então eu inventei o termo mathwashing em uma tentativa de descrever a tendência de pessoas da área de tecnologia (e de repórteres!) de usar as conotações objetivas de termos matemáticos para descrever produtos e ferramentas que são provavelmente mais subjetivas do que os usuários pensam. Esse hábito remonta aos primórdios da computação, quando os computadores começaram a ser inseridos nas empresas nos anos 1960 e 1970: todos esperavam que as respostas fornecidas por eles fossem mais verdadeiras do que as pensadas por humanos, mas eventualmente perceberam que os computadores são apenas tão bons quanto seus programadores.

Eu não quero entrar na história etimológica de quem chamou de algoritmo e quando fez isso, mas eu não acho que os trending topics do Facebook podem ser chamados assim. É importante para nós (e para o Facebook) reconhecer isso. Está mais para uma seleção editorial influenciada por dados.

A sufixação X-washing foi inspirada por “pinkwashing” e “greenwashing”, que por sua vez são derivadas do mais frequente “whitewashing”. No caso do pinkwashing, o termo foi originalmente empregado para descrever táticas utilizadas por empresas para vender produtos para a comunidade do câncer de mama. Sobre greewashing, pense na British Petroleum ou na Chevrolet usando campanhas verdes ou focadas no meio ambiente para vender seus produtos: eles estão se beneficiando das conotações de “verde” enquanto vendem produtos como gasolina e carros que na verdade não são compatíveis com o ambientalismo consciente.

TB: Você é um cientista de dados. Por que não é herege não se ater estritamente aos números? Nós deveríamos todos começar a tomar decisões baseadas nos nossos instintos?

FB: Eu acredito que o termo mathwashing deveria ser mais um aviso aos colegas da área de tecnologia: não menospreze a subjetividade inerente de construir coisas com dados só porque você está usando matemática. Algoritmos e produtos guiados por dados sempre refletirão as escolhas de design tomadas pelos humanos que os construíram, e é irresponsável assumir o contrário.

Então, embora a matemática possa ajudar a descrever os dados de maneira objetiva, a ciência de dados é muito mais do que isso — é desenvolver produtos utilizando nossas observações do mundo real, quantificando coisas caóticas como o comportamento humano, fenômenos naturais, etc. Não existem dados perfeitos, e se você coletar os dados incorretamente, matemática nenhuma irá lhe prevenir de construir um produto ruim ou perigoso. Em outras palavras, qualquer coisa que construirmos com dados irá refletir os vieses e decisões que tomamos quando coletamos tais dados.

Se nós queremos “nos ater aos números”, temos que ser honestos intelectualmente sobre o entendimento de como os coletamos. Quem os registrou e qual critério foi utilizado?

TB: E o que é certeza? Você encontrou certeza em algum dos seus projetos de dados ou qualquer outro projeto na sua carreira?

FB: Primeiro, eu acredito que certeza é diferente de objetividade. É razoável utilizar dados para se sentir confiante sobre todo tipo de cenário, mas não deveríamos confundir isso com ter encontrado algum tipo de verdade objetiva. Especialmente no caso de produtos guiados por dados, se sentir razoavelmente confiante é, às vezes, a única coisa que temos. E tudo bem! Eu acho que é importante reconhecer essa limitação. Eu tentei fazer isso ao longo da minha carreira de cientista de dados, e não acho que essa visão é fundamentalmente diferente de como diversos cientistas descrevem suas teorias: elas são verdadeiras na medida em que podem explicar os dados coletados (e não serem contrariadas por eles).

Mas, dando um passo atrás e tentando responder sua pergunta: um dos meus assuntos preferidos na faculdade era a incompletude — o teorema da incompletude de Gödel afirma que mesmo a matemática de números inteiros não pode provar sua própria consistência (i.e., ela se baseia em hipóteses sobre axiomas que tomamos como verdadeiros). O teorema vai além do tipo de ciência de dados do dia a dia que faço, mas acredito que prova um ponto importante de como a objetividade percebida da matemática é ilusória.

--

--