Uso de algoritmo de aprendizado não supervisionado para predição de concentração de sílica na flotação no processo de beneficiamento de minério de ferro

Daniele Kappes
Industrial Insights
4 min readAug 16, 2018

A Flotação é um processo de concentração bastante usado no processo de beneficiamento de minério de ferro. Ela se baseia no comportamento da superfície das partículas de minério suspensas em fase aquosa: a maioria dos minerais possuem características hidrofílica, ou seja, possuem afinidade com a água, portanto é preciso adicionar reagentes à superfície do minério para que seja possível flotar os minerais que se deseja (através de absorção de sílica em bolhas de ar, por exemplo).

O Brasil é um dos maiores produtores de minério de ferro do mundo. Atualmente o mercado requer um alto grau de concentração de ferro, e com isso, a importância da flotação vem crescendo ainda mais. O acompanhamento do teor de sílica no processo industrial de flotação é um dos grandes problemas enfrentados pelas grandes produtoras de minério de ferro. Geralmente, a análise de teor de sílica na flotação é feita em laboratório e leva em média duas horas para ser concluída. Portanto, qualquer ação de processo que precisa ser feita para corrigir (aumentar ou diminuir) o teor de sílica só pode ser feita duas horas após o teor de sílica estar fora da especificação.

Uma das soluções para que seja possível atuar no processo mais rapidamente seria utilizar uma técnica de predição. Poderíamos aplicá-la para predizer o teor de sílica usando dados de processo (concentração de reagentes, densidade, pH, etc) e dados de qualidade do minério (teor de Mn nas últimas horas, por exemplo).

Essa tentativa de predição pode ser feita através de um algoritmo chamado Mapas Auto Organizáveis que consiste em organizar dimensionalmente dados complexos em grupos (Clusters), ou seja, através de parâmetros de entrada (dados de processo e de qualidade), o algoritmo agrupa o conjunto de dados em dois grupos: alto teor de sílica e baixo teor de sílica, como mostrado na figura abaixo:

Os quadrados próximos da cor branca (ou seja, próximos do valor de 1) representam outliers classificados segundo o algoritmo (cada quadrado possui um conjunto de dados de entrada). E os quadrados próximos da cor preta (ou seja, próximos do valor de 0) representam conjunto de dados “normais” segundo o algoritmo:

Para saber o desempenho do algoritmo é preciso então verificar quais regiões do mapa realmente significam alto teor de sílica e baixo teor de sílica. A figura a seguir cruza esses dados treinados pelo algoritmo com os dados reais (teor de sílica). Cada círculo vermelho mostra que aquele conjunto de dados daquele quadrado possui alto teor de sílica e cada quadrado verde mostra que aquele conjunto de dados daquele quadrado possui baixo teor de sílica:

Como é possível ver na imagem, quase todos os quadrados escuros (próximos do valor 0) possuem realmente valores de teor de sílica baixo, mas o algoritmo erra bastante quanto aos valores reais de alto teor de sílica.

Para que o algoritmo tivesse uma boa assertividade, tanto para dados de alto teor de sílica quanto para os de baixo teor, os círculos vermelhos deveriam estar concentrados nos quadrados próximos da cor branca (próximo de 1):

Ou seja, para usar essa abordagem ainda é necessário alguns ajustes no algoritmo, como taxa de aprendizado e número de iterações do algoritmo. Vale a pena lembrar também que para este exemplo, foram usados poucos dados, e que pode ser interessante explorar o algoritmo utilizando uma maior quantidade de dados.

--

--

Daniele Kappes
Industrial Insights

Experienced Data Scientist with a demonstrated history of working in the automation technology and services industry.