Supermercado: O melhor ou o mais próximo?

Uma análise de dados em conjunto com Gustavo Bezerra

Thiago de Oliveira
adap-nord
7 min readAug 27, 2020

--

Foto por oxana v do Unsplash

Introdução

Quem aqui nunca foi em um supermercado? Ir no supermercado é uma atividade básica no dia-a-dia e que todo mundo provavelmente já fez. Mas você já parou pra pensar no que faz você escolher um Supermercado? O que faz você escolher um Nordestão a outro? Será que são os produtos disponíveis na loja? Ou talvez o preço? Quem sabe a localização? Na aventura de hoje, iremos tentar responder essa pergunta fazendo uma análise geográfica de como nossos clientes estão distribuídos por Natal e quais são suas lojas preferidas. Essas informações podem nos ajudar a entender quem são os clientes que compram em nossas lojas. Será que eles moram perto da loja que compram? Ou será que aproveitam a saída do trabalho pra passar no Nordestão ali perto e comprar?

Para entender esse contexto, iremos fazer uma análise das compras de nossos clientes, levando em conta seus endereços e criar algumas visualizações bonitinhas usando mapas e alguns tipos de gráficos que possam nos ajudar a tirar essas dúvidas.

Com base nessas informações vamos começar a fazer a nossa análise. ENTÃO VAMOS LÁ!

Dados

Para que possamos realizar nossa análise, primeiramente, precisamos de dados. Dessa forma, decidimos pegar as informações de compras de clientes no mês de janeiro. Por que escolhemos apenas um mês? A quantidade de dados é um pouco grande, então decidimos restringir um pouco nosso conjunto de dados.

Ao pegar nossa base de dados percebemos alguns problemas. Primeiro, não temos geolocalização, então não temos como fazer um mapa. Segundo, muitas informações representavam a mesma coisa, mas estavam escritas de formas de diferentes(Alecrim estava escrito Alecri, Allecrim, entre outros). Estes problemas iriam afetar drasticamente nossa visualização então tivemos que deixar esses dados organizados. Mas como fazemos isso? Easy peasy lemon squeezy.

Para conseguirmos a geolocalização, nós pegamos os endereços de nossas bases de dados e ficamos jogando no google maps para capturar a latitude e longitude, tudo utilizando Python e Selenium. Existem formas melhores de conseguir essas informações? Obviamente, porém para essas outras formas haviam restrições da quantidade de usos e seria necessário um pequeno investimento. Como nosso objetivo é apenas para aprendizado, decidimos fazer de um jeito diferente e free. Com isso resolvemos nosso primeiro problema.

O segundo problema são os dados bagunçados que representam a mesma coisa, bairros de Natal. Utilizamos um algoritmo de similaridade que tem como ideia básica encontrar a maior combinação contínua que não contém “lixo”, pra quem tem interesse, segue o link. Utilizando este algoritmo como base, pegamos os bairros definidos pela SEMURB e fizemos a similaridade com os nomes que estavam em nossa base.

E pronto, Top Show, conseguimos arrumar os dados.

Gráficos Bonitinhos

Com nossos dados arrumados e prontos para serem usados, vamos começar a criar nossas visualizações.

A primeira pergunta que gostaríamos de responder é:

De onde vem os clientes de cada loja?

Para responder essa pergunta críamos esse mapa:

Wow, that’s too much information. Como nós fizemos essa pergunta para todas as lojas, fica um pouco difícil de entender devido a grande quantidade de informações, então vamos tornar essa pergunta um pouco mais específica. De onde vem os clientes da loja do Cidade Jardim?

Ficou melhor agora não é? A Loja Cidade Jardim é bem antiga e fica localizada na Roberto Freire, uma das avenidas com maior fluxo em Natal. Daí o fato dela atrair clientes de vários locais da cidade. São pessoas que possivelmente moram longe e se deslocam para trabalhar ou mesmo ir à praia de Ponta Negra e a encontram no caminho.

Vamos se isso acontece com outra loja, chama na Igapó.

Como podemos observar, a loja de Igapó possui uma concentração de clientes bem maior na Zona Norte do que pelo resto de Natal,o que pode indicar que esse mesmo efeito não acontece lá e que para ela a vizinhança da loja é bem mais importante no seu faturamento. .

Massa, mas eu realmente queria responder a minha pergunta inicial com um gráfico que mostra as informações de forma mais limpa.

Com esse mapa de calor podemos ver como os clientes do Nordestão estão distribuídos em Natal e responder nossa pergunta inicial de uma forma melhor.

Agora vamos para a nossa segunda pergunta

Quais as lojas preferidas de nossos clientes?

Vamos usar uma abordagem diferente para esse pergunta, ao invés mostrar um mapa, vamos usar gráficos de pizza para mostrar a preferência de lojas por cada bairro e vamos levar em conta que a loja preferida de um cliente é a que ele mais frequenta.

Huuumm. Analisando esses dois gráficos, podemos perceber que nos bairros que possuem um Nordestão, a maioria dos clientes frequentam mais a loja do próprio bairro, contudo em 2 casos isso fica um pouco nebuloso. É o caso de Capim Macio e Petrópolis. Vamos olhar mais de perto.

Isso acontece pois em ambos os casos, existe mais de um Nordestão próximo. Em Capim Macio, a loja Cidade Jardim e Ponta Negra são muito próximas e em Petrópolis ocorre o mesmo com as lojas de Petrópolis e Tirol.

Uma dúvida ainda fica no ar “Porque os moradores de petrópolis preferem fazer compras na loja Tirol?”. Isso pode ser explicado pela localização da loja Tirol que fica próxima a diversos locais de trabalho, instituições, escolas e hospitais facilitando o acesso para o cliente em final de expediente. Além disso, reza a lenda que Petrópolis é um bairro “dormitório” onde a maioria de seus habitantes trabalha em bairros como Lagoa Nova ou Tirol. Um outro possível indicador é que os clientes de Petrópolis se identificam melhor com o mix da Loja Tirol. Essa teoria fica para uma próxima análise.

Apesar de Petrópolis ser considerado um dos bairros que pertence ao Centro de Natal, cidades são bastante mutáveis, em 10 anos os centros comerciais delas podem mudar, em 15 bairros antigos são revisitados, em 20 elas podem até mudar o nome, mas estas sempre sintetizam as preferências de seus habitantes.

A loja Lagoa Nova, por exemplo, está no que hoje pode ser considerado o centro de Natal, fica perto de centros comerciais e faculdades e no meio de uma das avenidas mais movimentadas da cidade. Assim, essa a loja tem um grande número de vendas e de clientes de praticamente todos os bairros de Natal.

Conclusões (So What?)

Pô, essa análise ficou legal, os gráficos ficaram bonitos tudo muito lindo e tal, mas o que vai isso vai ajudar? O que a gente consegue fazer com essa informação?

É claro que cada loja tem sua maior fatia de clientes que moram nas áreas mais próximas. Entretanto também vimos que a loja do Cidade Jardim tem muitos clientes por toda Natal, com uma quantidade considerável em quase todas as regiões, por que isso acontece? Será que muitas pessoas acabam passando perto do Cidade Jardim na ida e volta do trabalho e acabam fazendo compras lá por ser caminho? Ou será que o cliente vai lá apenas por gostar mais da estrutura dessa loja do que a mais próxima do seu bairro? Ou será que na loja do bairro dele não está vendendo aquela cachaça com mel que ele gosta tanto e toma todo final de semana?

Muitas análises ainda podem e serão feitas, mas isso vai ficar para outro dia. É isso galera, espero que tenham gostado da nossa pequena análise e boas compras!

--

--