Insights, uma nova forma de validar documentos
Conheça a nova ferramenta de automatização de validação de documentos da Acesso Digital
Vinte e sete minutos.
Quando se trata de um processo de admissão, agilidade é um ponto crucial. Diante de atrasos, não é incomum que alguns candidatos cheguem até a desistir de uma vaga — o que acontece geralmente por causa da dificuldade de se deslocar até o local para a entrega da documentação necessária ou mesmo por outra empresa ter sido mais rápida para contratá-lo.
O AcessoRH é um dos produtos da Acesso Digital que nasceu justamente para simplificar essa relação entre candidatos e empresas, tornando possível a condução de processos de admissão de maneira completamente digital e, ainda por cima, validando toda a documentação envolvida e garantindo a sua autenticidade junto ao e-Social.
Desde o princípio do produto, nossa equipe de engenharia tem caminhado junto com a nossa equipe de análise, responsável pela validação da documentação de candidatos. Apesar dessa equipe ser composta unicamente por especialistas, no passado, uma etapa de validação documental completa de um único candidato chegava a levar mais de 30 minutos. Levando em consideração que cada um desses candidatos pode enviar algum comprovante ou informação incorretos, exigindo correção e nova análise, esse tempo poderia, ainda, se multiplicar por inúmeras vezes.
Além disso, com o crescimento do produto e com a expansão da nossa base de clientes, também cresce a quantidade de candidatos a serem analisados. Hoje, por conta desse movimento, o volume de documentos que recebemos e analisamos mensalmente beiram dezenas de milhares.
A conjunção desses pontos só deixou mais clara a grande necessidade de otimizar esse processo. Assim, usando a tecnologia a nosso favor, foi que nasceu o Insights, o nosso serviço de automatização de validações de documentos.
Hoje, enquanto o candidato preenche o seu cadastro, seus documentos vão passando por uma validação automática, feita pelo Insights, que é responsável por tipificar cada documento e tentar validar todos os seus dados.
E o resultado disso? Vinte e sete minutos. Esse é o tempo médio que passamos a economizar por análise documental completa, por cada candidato analisado de cada um dos nossos clientes. Dos 30 minutos que a nossa equipe de análise precisava no passado em uma etapa de validação documental completa de um único candidato, hoje não precisa de mais que 3.
A criação do Insights
Foram cerca de 30 dias desde a sua concepção até a sua primeira versão, criada colaborativamente por uma equipe técnica de desenvolvedores composta inicialmente por 5 pessoas. Combinando técnicas de Machine Learning com a ferramenta de OCR (Optical Character Recognition, em inglês) da Google — Google Cloud Vision — para identificação de textos em imagens, conseguimos dar uma assertividade gigantesca ao Insights.
Já mais recentemente, criamos também, dentro do AcessoRH, o conceito de microtipificação de documentos, que reforça ainda mais a precisão da ferramenta, já que ela nos permite reduzir as chances de os candidatos enviarem documentos de tipo incorreto para a nossa análise manual (ex: uma CNH como comprovante de RG, que não pode ser aceito).
A tecnologia por trás da tecnologia
Toda a lógica de microtipificação nasceu diretamente de conceitos de Text Mining, que é uma tecnologia bastante comum quando falamos de algoritmos de Machine Learning.
Geralmente, esse tipo de tecnologia busca encontrar os elementos mais relevantes em meio a grandes quantidades de dados textuais. Nesse caso, os termos mais relevantes são, geralmente, aqueles que são mais raros quando comparamos vários documentos de um mesmo tipo. Estes mesmos elementos, portanto, conseguem definir como cada documento é único.
Daí, veio uma grande sacada: e se utilizássemos a lógica inversa dessa tecnologia para identificar não os termos mais relevantes, mas aqueles que se repetem várias e várias vezes dentro de um mesmo espaço amostral? Foi daí que nasceram o que, para nós, são os subtipos de documentos.
Para nós, todo documento pode ser representado por um arquétipo: RG, CPF, PIS, etc. Cada um desses arquétipos, por sua vez, é composto inúmeros subtipos, que nada mais são que todas as variações possíveis de comprovante para um mesmo arquétipo.
Por exemplo, podem ser utilizados como comprovante de CPF: a frente de um cartão CPF (azul), a frente de um cartão CIC, comprovantes de inscrição emitidos pela Caixa Econômica Federal, verso do RG, frente da CNH, dentre outros. Cada um desses comprovantes representa, para o Insights, um subtipo completamente diferente.
Assim, quando alguém envia um comprovante, o Insights tem a certeza não só de seu tipo específico, mas qual é o seu subtipo e quais tipos de informação podem estar contidas nele, garantindo uma assertividade gigantesca.
Outro grande diferencial que temos em relação a outras tecnologias é o potencial de escalabilidade. Diferentemente daquelas que envolvem o uso de Inteligência Artificial para a identificação de padrões em imagens, o Insights baseia-se em aspectos mais simples para construir os seus modelos de tipificação.
No caso de uso de IA, podem ser necessárias centenas de imagens para garantir um modelo que seja suficientemente assertivo. Para o Insights, menos de 5 imagens já conseguem compor um modelo de assertividade igual ou mesmo maior.
Por conta disso, temos hoje mais de 350 subtipos de documentos mapeados, dentro de dezenas de arquétipos diferentes.
Validando dados com o Insights
Após a definição do subtipo de cada comprovante, o Insights prossegue para uma etapa de validação de dados, buscando, no comprovante enviado, cada um dos campos de documentos preenchidos pelo candidato através de um conjunto de configurações pré-definidas.
Por exemplo: para evitar que um candidato nos envie um documento de outra pessoa, primeiramente procuramos pelo seu nome no comprovante enviado. Para encontrar esta informação, entregamos uma configuração específica ao Insights, envolvendo informações como: o valor a ser encontrado, se o valor enviado é composto por vários termos, se esses termos devem ser encontrados em uma ordem específica, entre outros.
O Insights conta com dezenas de configurações possíveis, contando com a possibilidade de identificação não somente de valores específicos, mas também padrões de números de documentos, datas, e outros tipos de dados relacionados ao contexto brasileiro.
Com a implementação dessas tecnologias, o Insights valida automaticamente cerca de 67% dos mais de 200 mil dados inseridos mensalmente por candidatos, ou seja, a carga enviada para a nossa equipe de análise foi reduzida drasticamente desde o início do produto.
E ainda mais: por conta do aumento da qualidade dos dados enviados para a nossa equipe de análise, a nossa taxa de recusa de documentos caiu em mais de 57% no mesmo período.
E é essa assertividade, combinada à evolução contínua do conhecimento dos nossos especialistas, é o que nos permite hoje realizar uma admissão em questão de horas, desde a criação da sua vaga no dashboard do AcessoRH até a validação completa dos documentos do candidato.
Olhando para o futuro
Acreditamos que o Insights tem um potencial gigantesco, e pretendemos expandir ainda mais a base de documentos que ele tem a capacidade de entender, bem como aprimorar a sua capacidade de validação de dados.
O Insights foi criado para ajudar o AcessoRH, justamente por facilitar o trabalho em relação à análise. Porém, devido ao sucesso inicial, há grande expectativa de que a ferramenta crie vida própria e torne-se um produto em si.
Autores
Flávio Tonon — Back-End Software Developer da Acesso Digital
Rafael Souza — Lead Back-End Software Developer da Acesso Digital