Mineração de dados: o que é e como funciona o Data Mining?

Os dados são o novo petróleo do mundo e combustível para o futuro dos negócios, saiba como extrair, analisar e tomar melhores decisões

--

A frase “Data is the new oil”, no português “dados são o novo petróleo”, foi criada por Clive Humby, um matemático especializado em dados. Humby afirma que o dado é muito valioso, mas para ter um melhor uso precisa ser bem refinado e analisado.

De forma a explorá-los em seu potencial máximo, profissionais e empresas precisam estar cada vez mais alfabetizados em dados. O Business Intelligence (BI) pode ser um grande aliado para fazer um melhor uso desse grande conjunto de dados.

Enquanto o petróleo é escasso, finito, os dados não são. Se fizermos uma analogia, da mesma forma que muitos países ficaram ricos com a comercialização do petróleo, existe uma grande tendência de crescimento para as organizações que souberem trabalhar os seus dados.

Ajay Banga, CEO global da Mastercard.

Sobre a importância dos dados, o CEO da Mastercard, Ajay Banga, fala que: “a diferença é que o petróleo vai acabar um dia. Os dados, não”. Ele entende que a importância dos dados só deve aumentar ao longo dos próximos anos e que um dos fatores para essa expansão será com a ajuda da internet das coisas (IoT), impulsionada pela tecnologia 5G que transformará os celulares em supercomputadores.

Virtualmente, grande parte das nossas atividades tem um traço digital, seja assistindo uma série, realizando uma reunião ou prospecção online, ouvindo uma música no carro, fazendo alguma atividade física com uso de aplicativos, assistindo TV ou vídeo com a família. E esses são alguns exemplos, que só aumentam ao longo dos anos.

Outra característica de que os dados estão cada vez mais popularizados entre nós, está na família dos “Gs”: o 3G gerou a primeira conexão no celular, o 4G marcou a era do Streaming e o 5G transformará os celulares em supercomputadores. Dispositivos com técnicas de Artificial Intelligence (AI), como Machine Learning (ML), extraem ainda mais valor dos dados.

Diferentemente do petróleo, no qual um dos maiores desafios é localizar reservas subterrâneas onde possamos encontrá-lo, o ponto-chave no mundo dos dados é outro. Localizá-los já não é um problema, tendo em vista que hoje eles estão à nossa disposição. Agora, o maior desafio é saber como fazer bom uso dessa fonte de inesgotáveis possibilidades.

A seguir, veja as marcas referência em gestão quando o assunto é Big Data. Já renomadas no mercado, essas empresas estão longe de enganar seus consumidores, e muitos desses serviços são gratuitos. O grande lance estratégico é que, nós, os usuários, pagamos esses serviços, sem saber, entregando os nossos valiosíssimos dados.

Capa do documentário “Dilema das redes” disponível no Netflix.

Assista o documentário no Netflix sobre as Big Techs (Google, Facebook, Instagram e várias outras) e os dados dos usuários: “Dilema das redes”.

Saiba quem são as líderes do petróleo digital

Mesmo sabendo da exposição dos seus dados à essas empresas, você conseguiria viver sem a internet? Como sobreviver sem o Google? Ou perder o privilégio das entregas em um dia da Amazon? Consegue imaginar a sua vida sem rolar no feed de notícias do Facebook?

Líderes nesse segmento estão a Alphabet, considerada a companhia mãe do Google, Amazon, Apple, Facebook e Microsoft. As cinco corporações mais valiosas do mundo parecem imparáveis quando o assunto é tecnologia e captura de dados, que coletivamente reuniram mais de 25 bilhões de dólares de lucro líquido no primeiro trimestre de 2017.

A Amazon detém metade de todos os dólares gastos online nos Estados Unidos. Google e Facebook contabilizaram quase toda a receita de crescimento em propaganda digital nos Estados Unidos no último ano. Este domínio gerou pedidos para que as gigantes de tecnologia fossem divididas, como ocorreu com a Standard Oil no começo do século XX.

Uma das consequências do avanço da tecnologia é a grande variedade de informações produzidas em diferentes aplicações, por exemplo os principais assuntos discutidos em redes sociais, as pesquisas realizadas em sites de comércio eletrônico e muito mais. Para extrair dados relevantes dentro desse leque abrangente de informações, utilizamos a técnica de mineração de dados.

Em inglês, o termo é Data Mining e surgiu por volta de 1990 com base em outras disciplinas científicas, como a estatística, a Artificial Intelligence e Machine Learning. Entender esse conceito é importante para pessoas programadoras porque, atualmente, ele é utilizado em diversas situações, como para avaliar a tendência de vendas em e-commerces, fazer análises de riscos e de concorrência em empresas, entre outros.

Para demonstrar como essa ferramenta de análise funciona, fizemos este post que contém os seguintes tópicos:

  • O que é mineração de dados?
  • Como funciona a mineração de dados: 4 principais etapas
  • Qual a importância da mineração de dados?
  • Quais as principais aplicações da mineração de dados?
  • Saiba mais sobre os líderes do petróleo digital: 5 cases

Boa leitura!

O que é mineração de dados?

Basicamente, mineração de dados é uma técnica utilizada para analisar um grande volume de dados e obter informações relevantes que possam ser utilizadas para várias finalidades, como para avaliar quais produtos são mais pesquisados em uma loja virtual ou para selecionar pessoas com determinadas habilidades profissionais em um processo seletivo.

Como mencionamos, o processo de mineração utiliza recursos de outras áreas científicas, como a estatística, que realiza cálculos matemáticos para avaliar cenários diversos, a Artificial Intelligence, que é criada com recursos computacionais e Machine Learning, que significa aprendizado de máquina e utiliza algoritmos complexos capazes de avaliar situações futuras.

Os dados utilizados na mineração podem ser coletados de grandes bancos de dados e de diferentes modelos, como Data Warehouse, que significa armazém de dados, banco de dados relacionais, entre outros. Além disso, também é possível analisar dados não estruturados, como os conteúdos diversos da internet — entre eles, pesquisas realizadas em sites, postagens em redes sociais etc.

Como funciona a mineração de dados: 4 principais etapas

Um dos principais objetivos da mineração de dados é oferecer informações confiáveis e atualizadas para que as empresas possam tomar decisões estratégicas ou obter insights sobre diferentes assuntos. Por isso, a extração e análise de dados deve passar por algumas etapas essenciais, de que falaremos a seguir.

1. Definir o problema

O primeiro passo é definir um objetivo para a mineração de dados, ou seja, sobre qual tema será realizada a pesquisa. É importante entender o que o negócio pretende fazer com base nas informações obtidas, por exemplo, aumentar as vendas em um e-commerce. Dessa forma, será possível definir quais as possibilidades de coleta desses registros.

2. Reduzir a duplicidade de informações

A próxima etapa consiste em coletar os dados, que podem vir de diferentes fontes. Por isso, é preciso realizar um trabalho minucioso para não gerar conteúdos duplicados. Muitas vezes a coleta de dados é realizada em diferentes sistemas, que podem ter informações repetidas, por exemplo o endereço de uma mesma pessoa. Nesse caso, é preciso excluir a redundância.

Portanto, a mineração de dados é uma atividade trabalhosa, que requer uma análise inteligente para conseguir, por exemplo, complementar dados que estão separados em diferentes fontes, mas que se referem a um mesmo registro principal. Por isso, é preciso avaliar o que é importante, o que é duplicado e o que pode ser descartado durante a mineração.

3. Realizar a mineração de dados

Existem várias técnicas para realizar a mineração dos dados, que são feitas com base em critérios de manipulação. Alguns deles são:

  • classificação: organização dos dados com base em um critério específico;
  • agregação: um conjunto de informações diferentes é adicionado a outros dados para compor um resultado específico e complementar;
  • smoothing ou suavização: que elimina o que não é necessário;
  • clustering: identifica informações semelhantes;
  • generalização: são aplicadas técnicas para oferecer um resultado mais genérico, por exemplo, agrupar pessoas por estado em vez de agrupá-las por suas cidades de origem.

4. Definir o modelo que será apresentado

Por fim, é feita uma modelagem sobre o que será apresentado após o processo de mineração de dados. Isso significa definir quais informações e em que formato elas serão apresentadas para o negócio com base em toda a análise realizada.

A definição deve ser feita de acordo com o objetivo definido no início do processo e deve obter a aprovação das pessoas que gerenciam o negócio, já que o resultado deve permitir que elas realizem tomadas de decisões estratégicas na empresa.

Escritório da empresa Statista, a alemã que é especializada em dados.

Qual a importância da mineração de dados?

De acordo com o levantamento disponível no site statista.com sobre o volume de dados criados, capturados, produzidos e consumidos no mundo entre 2010 e 2024, vemos que em 2020 o valor deve chegar a 59 zettabytes, enquanto que a estimativa para 2024 é do consumo de 149 zettabytes.

Diante desses números, é fácil compreender a importância de tecnologias como o Data Mining, pois é preciso processar um grande volume de dados, estruturados ou não, para extrair informações que sirvam de apoio para inúmeras outras análises e decisões.

Quais as principais aplicações da mineração de dados?

A mineração de dados pode ser aplicada em diversos setores de negócio. Confira, a seguir, algumas formas de utilizar essa ferramenta de análise.

Análise comportamental de clientes

O marketing é um dos setores que se beneficia com o uso da mineração de dados, pois ele precisa conhecer e avaliar cada passo dado pelo cliente em direção à jornada de compras para decidir qual estratégia adotar para atingir o seu objetivo, que é captar novos clientes e aumentar as vendas.

Por isso, precisa avaliar questões como o comportamento dos clientes, suas principais preferências e características. A mineração de dados é essencial nesse processo, pois ela é capaz de oferecer as informações necessárias para conduzir o cliente da melhor maneira pelo funil de vendas.

Análise de crédito

Os bancos também utilizam a mineração de dados para oferecer benefícios aos seus correntistas. Por meio da análise de informações, como o saldo médio da conta, quanto tempo a pessoa utiliza o cheque especial e outras informações relevantes, ele consegue realizar a análise de crédito para avaliar os riscos e calcular a taxa de juros mais apropriada para cada perfil de cliente.

A mineração de dados é uma técnica de análise que utiliza grandes volumes de dados e de diferentes fontes e formatos para a extração de informações relevantes referentes a um determinado objetivo. Portanto, é uma ferramenta extremamente importante para a realização de análises de negócios.

Saiba mais sobre os líderes, em seus setores, do petróleo digital: 5 cases

Agora, conheça outras 5 empresas que tiveram grandes insights com o Big Data, e viram uma grande oportunidade de diversificar ainda mais os serviços oferecidos ao usuário, além de conseguirem fazer a leitura dos hábitos, preferências, modelos de compra, gerando fidelização de seus clientes e, consequentemente, aumento dos lucros.

1 — Target

O case dessa marca ficou extremamente conhecido por ter realizado algo incrível: prever quais clientes estavam grávidas. A equipe de análise de dados da rede criou modelos para entender e conhecer a fundo os hábitos de compra de seus clientes.

Dessa forma, foi possível criar perfis de comprador, baseando-se em suas compras e dados demográficos, idade e até a situação da vida pessoal da pessoa. Assim, a empresa poderia oferecer ofertas de produtos que cada perfil estava mais propenso a comprar. E foi assim que ele passaram a mapear quais clientes estavam grávidas, e até qual o mês da gestação, baseando-se nos hábitos de compra.

Até hoje, há um grande debate sobre privacidade e até onde é correto utilizar as informações dos clientes para tal ações. Porém, é inegável a genialidade do uso do Big Data. Apesar de ter gerado muita polêmica, foi evidente o aumento da assertividade das ofertas e além disso, maior número de compras e fidelizações.

2 — American Express

Imagine a quantidade de dados que a empresa mais famosa de serviços financeiros dos Estados Unidos possui? Pensando em como tirar proveito disso, a American Express/Amex começou a utilizar a análise de dados e o Machine Learning para tomar importantes decisões. Uma das soluções alcançadas foi detectar fraudes com muito mais facilidade.

Com esse recurso, eles percebem padrões que correspondem a transações fraudulentas, pensando em detectar rapidamente para minimizar perdas. Assim, os algoritmos, através do dados aprendem o padrão de consumo de cada usuário. Sempre que há algum tipo de transação que foge do usual, o usuário e a empresa são notificados. O resultado? A empresa economizou milhões.

3 — Shell

A Shell, uma das maiores empresas petrolíferas do mundo passou a usar o Big Data para reduzir consideravelmente seus gastos de operação. Para perfurar um local para extração de petróleo, além de muito caro ocasiona em um grande impacto ambiental. Para minimizar os riscos e diminuir custos, é preciso estudar bem quais áreas estão propensas a entregarem melhor resultado.

Com a análise, ela monitora as ondas sísmicas de baixa frequência abaixo da superfície da Terra. Essas ondas se registram de maneira diferente nos sensores enquanto viajam pela crosta terrestre. Dessa forma, podem prever o tamanho provável dos recursos de petróleo e gás.

4 — Amazon

Sempre em destaque pelo uso inteligente de tecnologia e Big Data, recentemente, se tornou a segunda empresa americana a alcançar o valor de mercado de US$ 1 trilhão, o que deixa claro sua força. E nada disso teria sido possível sem o uso dos dados.

Os algoritmos criados pela Amazon possuem principalmente a função de levar as ofertas mais personalizadas possível para cada pessoa. Resultado: cliente satisfeito, empresa vendendo mais.

Através de Machine Learning e do armazenamento em cloud computing, eles aprendem como cada consumidor se comporta. É possível até prever que tipo de mercadoria o cliente poderia se interessar. O objetivo é entregar produtos ideias para os clientes sem que eles tenham sequer pedido.

5 — Delta Airlines

Pensando em como ir além, a empresa Delta resolveu uma das maiores dores dos passageiros quando viajam: bagagem extraviada.

Com uma solução simples, porém muito inteligente e eficaz, eles pensaram em um sistema que permite cada passageiro a acompanhar onde está sua bagagem. Além de deixar as pessoas mais tranquilas, ajudou a evitar grandes dores de cabeça para a empresa. São mais de 130 milhões de bagagens despachadas por ano, um grande volume de informações com cada uma delas.

Uma fonte inesgotável de possibilidades

As empresas citadas acima são uma grande exemplo de como a captura e o uso bem feitos dos dados não está distante de nossa realidade, ou seja, já é utilizado por muitas marcas e pode ser utilizado por qualquer tipo de empresa.

Para muitos especialistas, os dados já não são o novo petróleo: são ainda mais valiosos. Porém, assim como muitos países enriqueceram com o combustível do século, só enriquecerão com dados aqueles que souberem usá-los da melhor forma, sempre levando em consideração que eles são o combustível que vai moldar o futuro.

Gostou do conteúdo sobre o que é mineração de dados? Conte nos comentários outros cases de empresas que souberam utilizar os dados ao seu favor!

--

--

Pedro Henrique Passos Catini
Pedro Henrique Passos Catini

Inovação & Startups. Com design organizacional e adaptação cultural é possível conectar startups à corporates e acelerar a transformação digital.