Equivalência de produtos no ecommerce

Buscando sempre aumentar a diversidade e qualidade de sua oferta, o Magazine Luiza disponibiliza em seu ecommerce milhões de produtos. Além disso, muitos destes produtos são oferecidos por milhares de lojistas que utilizam a plataforma de marketplace para alcançar mais clientes. Diante deste cenário, surge um dos maiores — e menos conhecidos — desafios de qualquer ecommerce: gerenciar seu catálogo para encontrar produtos equivalentes — similares ou idênticos.

Me acompanhem no seguinte cenário. Um dos lojistas do marketplace decide inserir um novo produto em seu catálogo. Neste momento, o Magazine precisa saber se este é um produto que já está presente em seu catálogo de produtos. Se isto não ocorre, o cliente pode visualizar itens duplicados ao buscar algum produto, o que prejudica a experiência de compra. Encontrar esta equivalência, além de melhorar a visibilidade dos produtos no site, permite que os clientes do ecommerce possam, em uma única página, saber quais lojistas ofertam um produto, em que condições, etc.

Além da vantagem na usabilidade da busca no site, outros motivos relevantes para buscar equivalências de produtos são:

  • clientes compararem atributos como preços, prazo de entrega e condições de compra entre os diferentes lojistas;
  • enriquecimento cruzado dos dados dos produtos;
  • lojistas poderem fazer o benchmarking dos preços praticados em seus produtos;
  • lojistas poderem avaliar o sortimento dos seus catálogos.

Este é o primeiro de uma série de artigos que pretendem abordar os desafios relacionados a encontrar equivalência de produtos e demonstrar algumas das abordagens que estamos investigando no luizalabs.

O desafio

Apesar de parecer uma tarefa trivial — afinal, qualquer pessoa é capaz de comparar dois produtos facilmente — encontrar equivalências de forma automatizada não é tão simples. Vejamos um exemplo:

Título: Jogo ps3 Plants vs Zombies garden warfare Marca: Jogos PlayStation
Título: Jogo PS4 Plants vs Zombies Marca: Jogos PlayStation EA

Neste caso, este par de produtos é equivalente? Sabemos que não são idênticos pois um é para PlayStation 4 e outro para PlayStation 3. Mas, se tratando dos dados disponíveis, são produtos difíceis de serem distinguidos por um algoritmo. Além de possuírem imagens semelhantes, as estruturas do título e da marca também são parecidas. Some isto ao fato dos diferentes lojistas usarem diferentes padrões de anúncio, diferentes informações para descrever os atributos de um produto, ângulos e iluminação distintos nas fotos, etc. Em uma base tão grande quanto a do Magazine, o cenário fica ainda mais complexo.

Por último, o processo de encontrar equivalências necessita ser extremamente preciso. O cliente entrará em uma página única de um produto, podendo visualizar as condições de compra em cada lojista. Se a equivalência for incorreta, o produto de um lojista pode ser agrupado com um produto diferente de outro lojista, levando a comprar produtos indesejados. Essa matriz de confusão está detalhada melhor no esquema abaixo.

Algumas abordagens possíveis

Aqui, no luizalabs, estamos investigando algumas abordagens para resolver este problema para uma grande quantidade de dados e requisitos de qualidade muito altos. Abaixo estão os demais artigos que aprofundam nossos estudos e ângulos na resolução da busca de equivalência de produtos — os links serão atualizados na medida que os artigos forem lançados.

Like what you read? Give Raphael Coelho a round of applause.

From a quick cheer to a standing ovation, clap to show how much you enjoyed this story.