B2W Digital + UFSCar = #sucesso

Livy Real
b2w engineering
Published in
8 min readMay 5, 2021

Quando a expertise de profissionais se une ao mundo acadêmico para inovar e trazer novas soluções ao mercado.

Para dar continuidade ao processo de inovação que faz da B2W Digital uma empresa referência em tecnologia no país, constantemente realizamos diversas parcerias com universidades e polos de ensino tecnológico de todo Brasil.

Nosso objetivo é dar oportunidade a jovens talentos para desenvolverem seus projetos com o auxílio dos nossos profissionais para render frutos promissores para ambos os lados.

Uma dessas parcerias é realizada junto ao Departamento de Computação da Universidade Federal de São Carlos (DC/UFSCar). Essa história remonta ao início em 2016 e se iniciou em uma empresa júnior incorporada à B2W: a MYBoo, especializada em aplicações de busca no domínio do e-commerce.

Desde 2016, temos trabalhado juntos em projetos de processamento de linguagem natural, aprendizado de máquina e arquitetura de sistemas. Hoje, contamos com 6 alunos de mestrado e 6 alunos de graduação trabalhando junto às áreas de negócio e de tecnologia da empresa.

Nesse texto, vou falar um pouquinho sobre cada um desses projetos.

Processamento de texto e de imagem na descrição online de produtos — 2016

Em nossa primeira iniciativa, alunos de graduação trabalharam com pesquisa e desenvolvimento de recursos e ferramentas capazes de processar textos e imagens no domínio do e-commerce.

No decorrer do projeto “Processamento de texto e de imagem na descrição online de produtos”, em uma das atividades ligadas ao processamento de texto, seis estudantes de graduação e pós-graduação do curso de letras/linguística do DL (Departamento de Letras) da UFSCar foram contratados para realizarem a anotação linguística dos textos. A coordenação dessa atividade de anotação ficou a cargo da Profa. Dra. Helena Caseli.

Assim, essa parceria se estendeu também para esses 6 alunos, proporcionando uma experiência de aplicação prática dos conhecimentos teóricos por eles adquiridos durante a formação acadêmica.

Neste projeto, a equipe formada por seis alunos de graduação investigou, propôs, implementou e avaliou ferramentas para manipulação automática de textos e imagens em páginas Web de e-commerce.

A base de dados de textos com descrição de produtos e imagens da empresa foi disponibilizada para que a equipe pudesse estudá-la e propor ferramentas específicas para o domínio do e-commerce.

Para os alunos envolvidos, o estágio realizado juntamente com a empresa lhes proporcionou conhecimento do mercado de trabalho em uma área em franca expansão: o e-commerce.

Essa parceria teve, portanto, um impacto muito importante para a formação dos profissionais envolvidos. Os professores da equipe tiveram a oportunidade de ver suas áreas de pesquisa aplicadas ao mercado de trabalho, estendendo o conhecimento acadêmico para aplicações práticas e enriquecendo seus conhecimentos para aprimoramento dos cursos e das pesquisas com os quais colaboram.

Por fim, para a B2W Digital, esta foi uma grande oportunidade de unir pesquisa com mercado de trabalho.

Marvin e Aprendizado de Máquina Automatizado — 2018

No início de 2018, um dos antigos sócios da MYBoo, Daniel Takabayashi, novo gerente de TI da B2W Digital, procurou a Profa. Helena Caseli para uma nova parceria.

As reinvindicações agora eram de aprendizado de máquina, em especial o aprendizado de máquina automatizado (AutoML) e arquitetura de software, com o foco em uma plataforma de aprendizado de código aberto desenvolvida pela B2W Digital: o Marvin.

Com essas demandas, foram incorporados ao projeto os professores Dr. Diego Silva (especialista em aprendizado de máquina) e Dr. Daniel Lucrédio (especialista em arquitetura de software), que tem no blog um texto publicado sobre a demistitificação da programação degenerativa.

Em março de 2019, o projeto “Investigação e desenvolvimento de módulos de AutoML na plataforma Marvin, em consonância com requisitos de desempenho e alta disponibilidade” teve início com o ingresso de 4 alunos de mestrado no Programa de Pós-graduação em Ciência da Computação da UFSCar: Bruno Sette, Lucas Cardoso, Fernando Zagatti e Lucas Nildaimon. A B2W, então, montou um pequeno laboratório dentro do DC da UFSCar para abrigar este projeto.

Essa parceria está prevista para ser finalizada no primeiro semestre de 2021, com a defesa dos mestrandos, mas já rendeu muitos frutos.

Hoje, o Marvin se transformou em Apache Marvin-AI (https://marvin.apache.org/) e está incubado na Apache Software Foundation. A Apache é uma fundação que apoia projetos de código aberto com grande impacto na comunidade, tais como o Apache HTTP Server, o banco de dados Cassandra, o Lucene, o Hadoop, o Kafka, o Maven… A lista é grande, impressionante e o Apache Marvin-AI é o primeiro projeto 100% brasileiro nessa lista.

Se você ainda não conhece o que é AutoML, o Fernando Zagatti, um dos autores do blog, explica para você. Clique aqui e confira e conteúdo.

Na fase atual do projeto de incubação, a Apache pretende que a plataforma saia do escopo da B2W Digital e estabeleça uma comunidade independente, responsável por conduzir o projeto de maneira independente, seguindo o “jeito” Apache.

Neste sentido, a parceria com a UFSCar tem sido fundamental. Desde o início do projeto, o B2W-UFSCar Lab exerce papel de liderança no desenvolvimento da plataforma, entregando novas features, corrigindo bugs, produzindo documentação e promovendo discussões arquiteturais para que a comunidade se fortaleça, levando o Marvin além da fase de incubação e pronto para se tornar um projeto regular da Apache.

Em paralelo ao esforço aplicado ao Apache Marvin-AI, os alunos de mestrado têm conduzido pesquisas inovadoras na área de Automated Machine Learning (AutoML) e Machine Learning Operations (MLOps).

Tais atividades já renderam frutos como a publicação de um artigo completo intitulado Benchmarking Machine Learning Solutions in Production, apresentado na conferência ICMLA 2020–19th IEEE International Conference on Machine Learning and Applications, um dos principais encontros do universo de Machine Learning.

O artigo descreve uma das features incorporadas ao Apache Marvin-AI nesta pesquisa, que permite aos desenvolvedores conseguir facilmente mensurar o consumo de recursos de hardware (processamento, memória, entre outros) em projetos de Machine Learning. Um dos autores deste artigo, Lucas Cardoso, já publicou aqui no blog sobre o assunto.

Dos dados ao Conhecimento — 2020

No início de 2020, começamos uma nova parceria: “Dos dados ao conhecimento: extração e representação de informação no domínio do e-commerce”.

Essa iniciativa visa trabalhar em três frentes de pesquisa, todas relacionadas às informações referentes aos produtos a venda em sites de e-commerce: (1) extração e organização da informação sobre tais produtos, (2) processamento conjunto de informações em modalidades diferentes (texto e imagem) referentes a esses produtos, e (3) avaliação da qualidade da informação apresentada ao cliente.

Com a expansão da parceria, também expandimos o B2W-UFSCar Lab. Atualmente, a B2W Digital conta com um laboratório dentro do DC da UFSCar para 12 associados.

Desde março de 2020, estes associados que estariam trabalhando no B2W-UFSCar Lab estão trabalhando em home office, como medida preventiva ao Covid-19.

Os trabalhos continuam à distância, mostrando que um laboratório de pesquisa e desenvolvimento é feito pelas pessoas que o compõe e não apenas do laboratório físico (que a gente adora também!).

Bom, dentro deste projeto, temos dois novos alunos de mestrado no PPGCC/UFSCar: Alan Romualdo e João Gabriel Barbirato, orientados pela Prof. Helena Caseli.

O Alan está trabalhando com multimodalidade para estruturar os produtos do Americanas Mundo, a iniciativa da B2W Digital de trazer vendedores de todas as partes do mundo para o público brasileiro. Quem nunca sofreu ao tentar comprar esses produtos internacionais? O Alan é quem está nos ajudando a melhorar a vida dos nossos clientes!

Já o João está focado na estruturação da nossa base de produtos. Queremos ter um gráfico de conhecimento relacionando nossos produtos por seus atributos. Imagina um cliente comprar um sofá e nós já pudermos indicar quais almofadas combinam com ele? Que bacana seria, não é mesmo?

Esses dois projetos trabalham com tecnologias e abordagens estado-da-arte e estão sendo desenvolvidos para o processamento de português, uma língua que infelizmente não conta com muitos recursos computacionais.

Ainda no âmbito da parceria “Dos Dados ao conhecimento”, temos dois projetos de extensão com alunos de graduação. Assim, além dos três docentes orientadores professores da universidade (Helena Caseli, Diego Furtado e Daniel Lucrédio) e dos 2 alunos de mestrado (Alan e João), agora contamos com mais seis bolsistas da graduação: Bianca M. Lopes, Fernanda M. Assi, Julia T. C. Jesus, Karina M. Johansson, Reynold N. Mazo e Wesley.

A Bianca e a Julia são do Departamento de Linguística e trouxeram ainda mais multidisciplinariedade para essa parceria. Atualmente, estamos trabalhando com a avaliação de qualidade da informação que chega aos nossos clientes.

Vale lembrar que ambas já tiveram um trabalho aceito no 68º Seminário do Grupo de Estudos Linguísticos (GEL). O trabalho intitulado “Títulos de e-commerce: investigação de critérios de qualidade” resume uma parte essencial desse projeto, a identificação rigorosa de quais critérios linguísticos fazem de um título de produto um bom título.

Futuro

Com tanta coisa rolando, tecnologias recentes sendo usadas para resolver problemas reais, um time super disposto a aprender e colaborar, resultados diretos para o negócio, além de publicações em conferências de impacto, formação de pesquisadores brasileiros, projetos open source e fomento à pesquisa, a gente não pode parar por aqui, né?

Este ano, a parceria com a UFSCar vai crescer e vamos investir em uma nova empreitada. Queremos viabilizar também pesquisas de doutorado, sempre com dois focos: melhorar a experiência do nosso usuário e investigar as tecnologias mais recentes das áreas.

Por enquanto, estamos trabalhando junto às áreas de negócio processos de design thinking para identificar quais são nossas demandas mais urgentes. Em paralelo, continuamos estudando tecnologias inovadoras que podem (e vão!) trazer impacto tanto para a companhia quanto para as comunidades científica-tecnológicas.

Bom, vou parar por aqui para não dar spoiler! Mas logo mais eu volto com novidades!

Se você busca uma oportunidade de desenvolvimento, trabalhando com inovação em um negócio de alto impacto, acesse o portal B2W Carreiras! Nele, você consegue acessar todas as vagas disponíveis. Venha fazer parte do nosso time!

--

--

Livy Real
b2w engineering

Livy Real é doutora em Linguística e atua com Processamento de Linguagem Natural e Inovação Aberta. Acredita no software livre e na conexão ciência-sociedade.