Os preconceitos ocultos na inteligência artificial, e como removê-los

Gustavo Carvalho
Legal Labs
Published in
6 min readMay 21, 2018
Photo by William Stitt on Unsplash

Com avanços a passos largos, as técnicas de Inteligência Artificial (IA) vêm superando a performance humana em diversas tarefas que há poucos anos eram solucionadas apenas por especialistas. Com cada vez mais decisões importantes sendo tomadas por estes algoritmos, é fundamental compreender os fatores que levam as IAs a tomar decisões. A seguir, iremos desmistificar o funcionamento da inteligência artificial e apresentar a importância de treinar estes algoritmos adequadamente.

Como uma inteligência artificial aprende?

Assim como recorremos a especialistas para aprender, a inteligência artificial necessita de professores para ensiná-la. O procedimento mais comum para que uma IA aprenda a realizar alguma tarefa, como a classificação de imagens ou processos jurídicos, é conhecido como aprendizado supervisionado.

Processo de aprendizado supervisionado da Inteligência Artificial

Em uma etapa de treinamento, apresentamos um exemplo para a IA e esperamos sua resposta. Caso esta não acerte em sua decisão, realiza-se uma intervenção, informando qual deveria ser a classificação adequada. O procedimento é realizado até que a IA seja capaz de classificar os exemplos com mínima necessidade de correção. Neste momento, considera-se que a Inteligência Artificial foi treinada para realizar a tarefa desejada. Em seguida, em uma etapa conhecida como validação, exemplos nunca vistos pela IA são apresentados, a fim de verificar se o aprendizado foi efetivo.

Uma analogia comum com o processo de aprendizado humano é pensar no treinamento de uma IA como um curso. Neste, a etapa de treinamento seria o equivalente a realização de uma lista de exercícios com gabarito, em que exemplos são apresentados até que o aluno esteja apto a realizá-los. Já a prova final, em que novos problemas são apresentados ao estudante com o objetivo de verificar a compreensão dos conceitos necessários, consiste na etapa de validação.

Transformando palavras em números

Mas, como uma Inteligência Artificial é capaz de ler? Afinal, uma IA é em sua essência um complexo modelo matemático. É necessário, portanto, realizar a transformação de palavras em números. A forma mais simples de efetuar este processo é associar cada palavra a um respectivo número. Em um vocabulário com as palavras cachorro, gato, maçã e banana, podemos transformar cada uma aos números 1, 2, 3 e 4, respectivamente.

Entretanto, é intuitivo perceber que esta não é uma boa representação. Apenas olhando estes números, não é possível identificar que a semântica de gato é mais próxima a cachorro do que a maçã, implicando dificuldades no processo de aprendizado.

Para solucionar este problema, técnicas mais avançadas conhecidas como word embedding representam palavras de maneira mais rica, utilizando vetores, ou seja, uma sequência de números. Uma forma lúdica de compreender o funcionamento destas técnicas é pensar em cada um destes números como uma característica da palavra. Neste caso, valores próximos a 1 indicam a presença da característica (por exemplo, laranja e maçã apresentam valores altos para “Comida” , 0.99 e 0.95, respectivamente), enquanto valores próximos a 0 remetem a falta (como cachorro com valor 0.05 em “Verbo”).

Representação computacional de palavras por Word Embedding

Uma das grandes vantagens desta técnica é a possibilidade de verificação da adequação destas características. Por exemplo, ao observar o campo “Felino” podemos analisar o quão “felina” é cada palavra. Como veremos, essa simples análise pode ter impactos significativos, quando realizada observando o contexto social dessas características.

O reflexo da sociedade

Tal como um aluno é fortemente influenciado por seus professores, a representação semântica aprendida por um word embedding depende da qualidade dos exemplos apresentados. Analisemos o caso prático de um word embedding desenvolvido pela USP que aprendeu conceitos linguísticos a partir de textos da Wikipedia, notícias, livros, entre outros.

Para verificar o poder de aprendizado da IA, pedimos que ela avaliasse qual gênero, masculino ou feminino, está mais ligado ao conceito de algumas profissões. Visto de maneira simplificada, pode-se pensar neste processo como a verificação da característica “Gênero”, em que valores próximos a 1 indicam o gênero feminino e valores próximos a 0, o masculino. Valores intermediários, ou seja, próximos a 0,5 são tomados como neutros.

Nos exemplos apresentados, podemos perceber que a IA aprendeu a classificar corretamente as profissões com definição de gênero. Para as profissões independentes de gênero, no entanto, observamos que a máquina relacionou as profissões aos seus estereótipos sociais.

Para compreender os sérios problemas que estes conceitos aprendidos podem gerar, vamos ao exemplo de uma IA de avaliação automática de currículos, que utilize este word embedding para selecionar candidatos. No caso da escolha do melhor candidato a vaga de economista, é muito provável que homens tenham preferência em relação a mulheres, já que, para a IA, na própria definição de economista está o conceito de homem.

Podemos estender a análise de gênero para etnias. Agora, solicitamos à IA que indique as 20 profissões mais relacionadas a etnia branca e as 20 profissões menos brancas.

Observamos que as profissões que exigem maior nível de escolaridade são mais relacionadas a etnia branca, enquanto as profissões com menor exigência de escolaridade são tidas como não-brancas. É difícil imaginar situações em que estas informações preconceituosas aprendidas não apresentem consequências negativas à sociedade.

Removendo os preconceitos históricos

Como visto, os conceitos aprendidos pela IA nada mais são do que o reflexo de nossa sociedade. A fim de evitar a propagação de nossos erros, podemos aplicar diversas técnicas avançadas que removem estes preconceitos. De modo geral, a ideia é analisar o campo desejado, como “Gênero”, e alterar seu valor de maneira adequada. Assim, podemos ensinar para a IA que todas as profissões — ou decisões judiciais, recomendações de filmes, etc. — não devem ter qualquer preferência por etnia ou gênero.

Após aplicar estas técnicas, fazemos as mesmas perguntas anteriores à IA.

Vemos que, desta forma, os preconceitos ocultos na linguagem apresentados para a IA são eliminados. A consciência destes problemas e o conhecimento das metodologias de correção são essenciais para todos aqueles que trabalham com Inteligência Artificial, de modo a evitar o desenvolvimento de sistemas que prejudiquem ou beneficiem um indivíduo de acordo com seu gênero, etnia ou outra característica. De fato, pesquisas avançadas vem sendo desenvolvidas por diversos grupos em todo o mundo, dado que a constante preocupação com o lado social é fundamental para o futuro da Inteligência Artificial.

"A redução das tendênciosidades em sistemas de computadores pode auxiliar no processo de mitigação dos preconceitos na sociedade"

Como afirma um dos grupos focados em técnicas de remoção de preconceitos, liderado por Bolukbasi, uma das perspectivas que se pode ter do problema é que estes preconceitos meramente refletem a sociedade, de modo que pode-se argumentar que o viés social deve ser removido anteriormente ao viés em word embeddings. Entretanto, Bolukbasi afirma ainda que a redução das tendênciosidades em sistemas de computadores pode auxiliar no processo de mitigação dos preconceitos na sociedade, ou ao menos evitar a sua amplificação.

--

--