#5 Big Data, a camisa amarela e os desafios de aprender em real-time

Carlos Raffaeli
4 min readFeb 4, 2016

No post anterior tentei falar sobre como a Big Data já afeta a nossa vida sem parecer um conspiration-freak. O desafio hoje é falar sobre as diferentes formas de dados sem parecer técnico demais.

Todos os dias, nós produzimos cerca de 3 quintilhões de bytes de data. Colocando em perspectiva — ou tentando — isso significa que geramos dados o suficiente para encher em torno de 3 bilhões de disquetes por dia. Sem parar.

Lembra deles?

Mas o termo BIG não se refere apenas ao tamanho de informação que isso significa. Na verdade, isso se relaciona muito mais à complexidade que isso gera do que a quantidade propriamente dita.

Tradicionalmente, as companhias montavam seus sistemas de relacionamento com seus clientes e armazenavam apenas as informações que julgavam importantes. O restante, era descartado pois o armazenamento de informações e, principalmente, o acesso a elas sempre custou muito caro.

Com o crescimento da Big Data, a manipulação de dados precisou se desenvolver pois, além de crescer em volume, hoje extrai-se dados de uma imensa quantidade de fontes, que vão desde formulários em sites e resultados de buscas no Google, até câmeras de vigilância, sensores, fotos em redes sociais e posicionamento de GPS. E esse tanto de fonte fornece dados em outros tantos formatos diferentes.

Aliás, você já parou para pensar? Como uma foto que eu poste no instagram consegue dizer algo sobre mim? Ou melhor, como que uma foto minha no instagram pode ser lida por um algoritmo e, a partir disso, gerar um insight sobre mim?

Você entra em uma loja e a vendedora te oferece uma camisa amarela por que as últimas três últimas camisas que você comprou naquela loja foram bege, amarela e marrom claro. Isso é o dado estruturado. Isso quer dizer que, além de você ter um gosto duvidoso para moda, esse é o tipo de informação que tanto humanos quanto computadores são capazes de ler e organizar, geralmente produzido por interações e registros feitos no passado.

Um futuro menos bege e com mais dados.

Porém, como é possível que essa loja lhe ofereça uma camisa amarela se as únicas informações que ela tem sobre você são as suas últimas fotos em redes sociais, uma com a camisa bege e outra com a marrom?

Vamos considerar que a loja não usa escravos para monitorar todos os possíveis clientes, claro.

Fotos, sensores, interações em mídias sociais geram dados não-estruturados, ou seja, cuja leitura e organização só é possível a partir de algoritmos. Esses algoritmos filtram possíveis compradores levando em consideração variáveis como idade e localização e podem analisar fotos, vídeos e postagens a fim de identificar padrões de consumo como cor de roupa, estilo e outros hábitos. E não só identificar, mas também organizar essas informações de uma forma que tomadores de decisões possam utilizar.

O seu gosto por camisa é um dado que lojas vão aprender sobre você a partir de interaçòes que você teve no passado. Mas essa informação não tem valor se você estiver em outra cidade ou, digamos, naquela semana em que seu salário já foi embora.

Por isso, o conhecimento por seu gosto em camisa é cruzado com a informações geradas em real-time, como a sua posição de GPS e o seu humor nos posts no Facebook. No seu caminho de volta do trabalho, uma unidade da loja que tiver uma camisa amarela em estoque pode gerar aquele cupom de desconto que vai fazer seu resto de dia mais feliz.

O que qualifica a estratégia de TI de uma empresa é a sua habilidade de traçar o mix ideal entre os diferentes tipos de dados, e de empregar em tempo ideal a velocidade e a qualidade correta a fim de gerar insights acertivos. E insights acertivos significam maior eficiencia nas relações de marketing.

Estratégia de TI para dados são usados para além da camisa amarela. Governos usam inteligência de dados para detectar padrões nas declarações de impostos para detectar fraudes; hospitais podem monitorar padrões e resultados médicos de seus pacientes a fim de oferecerem tratamentos mais acertivos.

A velocidade com que dados são gerados e analisados geram importantes desafios, fazendo com que o aprendizado deixe de estar focado no que sabemos do passado, mas sim em como conseguimos aprender a informação gerada em tempo real.

Este blog é para falar sobre tecnologias que estão moldando nosso futuro, de uma maneira simples e sincera. Conheça mais sobre mim no meu Facebook, LinkedIn ePortifólio.

--

--