De números a insights: Como transformar dados em soluções.

CESAR
CESAR Reports
Published in
7 min readMar 17, 2017

Por Paulo Urbano

Vivemos em um tempo onde informação, escondida em uma quantidade cada vez maior de dados, pode ser a base para geração de valor e inovação. A concretização desse potencial, no entanto, exige mais do que tecnologia.

A quantidade de dados produzida por atividades diversas como por exemplo a produção industrial, as interações em redes sociais, o monitoramento hospitalar e o controle de frotas de veículos, tem crescido de forma acelerada na última década. Dados de 2012 indicam que um volume de 2.500 Terabytes de dados estava sendo gerado diariamente em todo o mundo, e a expectativa era de que esse valor duplicasse até 2016. Atualmente, a quantidade de dados trafegada a cada segundo na Internet é superior ao volume total de dados armazenados na rede no início dos anos 1990 [1]. O Facebook, rede social líder em número de usuários e tempo de engajamento diário, tem 1,65 bilhão de usuários ativos por mês [2], ou seja, aproximadamente 22% da população mundial, que produz cerca de 4 bilhões de interações diárias.

Apesar dos números impressionantes, estimativas apontam que menos de 1% dos dados gerados globalmente é analisado [3]. Combinando-se isso ao fato de que aproximadamente 90% dos dados gerados não tem estrutura [4], a exemplo de e-mails, fotos e vídeos, chega-se à conclusão de que existem grandes desafios para que se possa extrair todo o potencial de geração de informação dos dados disponíveis.

Em resposta aos desafios encontrados para o processamento do volume sem precedentes de dados agora disponíveis mesmo em suas formas não estruturadas, nos últimos anos foram criadas novas abordagens e ferramentas de coleta, armazenamento e processamento. Estes novos sistemas computacionais oferecem a possibilidade de avaliar o sentido geral de e-mails e mensagens de textos enviadas por consumidores; e até mesmo encontrar pessoas ou objetos em fotos e vídeos. Já dentro dos dados estruturados, é possível mesmo para empresas de pequeno e médio porte, processar não apenas meses, como também décadas de registros de negócio, identificando padrões de comportamento de clientes e do mercado em geral.

A capacidade de processamento para realizar tarefas desta natureza, antes acessível apenas para grandes corporações, capazes de fazer investimentos em licenças de software corporativo e infraestrutura, hoje tem uma barreira de entrada muito menor.

Plataformas de software tais como a Presto, criada no Facebook, e a TensorFlow, criada no Google, foram colocadas à disposição da indústria no formato de software de código aberto, sem custo. A Presto permite que volumes de dados de milhares de gigabytes sejam divididos em vários servidores e que buscas sejam realizadas em questão de segundos. Já a TensorFlow usa resultados recentes de inteligência artificial, como Deep Learning, para, entre outras coisas, permitir a criação de aplicações que extraem informações de dados não estruturados.

Mesmo sem a necessidade de aquisição de licenças, o custo da infraestrutura necessária para analisar dados usando as plataformas de software mencionadas seria proibitivo para boa parte das empresas. No entanto, existem hoje diversas infraestruturas computacionais disponíveis em nuvem, como o Amazon AWS, o Google Cloud Computing e o Microsoft Azure, onde o tempo de processamento pode ser contratado sem a necessidade de aquisição de hardware, reduzindo o custo operacional envolvido.

A combinação de tecnologias de código aberto e computação em nuvem abre um horizonte de grandes possibilidades, mas isto é de pouco valor sem uma estratégia bem estruturada. A visão de geração de valor orientada por dados surge de uma evolução [5] que começa pelo monitoramento de processos de negócio, passando pela criação de insights e chegando em uma abordagem de otimização de negócios.

O monitoramento de processos de negócio é o estágio atual da maioria das empresas que realizam investimento em coleta e análise de dados. Indicadores de desempenho (KPIs) são escolhidos para determinados processos de maior prioridade, para os quais dados são coletados. Ferramentas tradicionais de Business Intelligence (BI) e Data Warehouse (DW) têm bom desempenho para a percepção do que aconteceu no passado, indicando a evolução das KPIs (Key Performance Indicator ou Indicadores Chaves de desempenho) ao longo do tempo. No entanto, estas apresentam limitações ao tentar tratar dados com o volume, velocidade de alteração e nível de estruturação como os mencionados anteriormente.

A criação de insights, evolução natural no nível de maturidade de aplicação de soluções orientadas por dados em uma organização, acontece quando é possível correlacionar dados relacionados à uma mesma KPI, mas vindos de diferentes fontes, perspectivas e contextos dentro do negócio. A descoberta de correlações entre estes diferentes aspectos leva a um entendimento mais profundo dos dados, que permitem entender não apenas o que aconteceu no passado mas também os motivos que levaram ao acontecimento e os mais prováveis cenários futuros. Assim, o resultado da análise deixa de ser um relatório ou um dashboard, passando a ser um modelo estatístico com base no qual podem ser feitas análises preditivas, indicando possíveis tendências futuras do KPI.

A geração de valor realmente acontece quando a identificação de insights sobre os processos de negócio de uma empresa dá suporte à avaliação contínua e à melhoria de seus produtos e serviços. Ao coletar em tempo real o comportamento dos usuários ao interagir com seus serviços e automatizar etapas de análise e geração de insights, uma empresa pode reduzir o tempo até que que oportunidades de atuação sejam identificadas e ações relacionadas.

Como exemplo de aplicação de abordagens dessa natureza, podemos citar operadoras de telefonia que tenham como KPIs a quantidade de reclamações por indisponibilidade de infraestrutura. Neste exemplo, a evolução deve partir de uma abordagem de monitoramento de processos, onde as queixas são registradas em um relatório periódico, para uma outra com criação de insights, onde os dados de monitoramentos de vários equipamentos de rede estejam correlacionados para identificar causas raiz e desta para outra ainda mais avançada, onde tendências de falhas sejam identificadas com antecedência, criando ordens de serviço para manutenção antes que uma falha real ocorra, atingindo os clientes. O nível de valor agregado por cada uma das abordagens é crescente, permitindo a migração de uma abordagem reativa para outra prescritiva, onde ações são sugeridas pelo sistema em resposta a padrões identificados na operação.

Um outro exemplo seria o de um desenvolvedor de aplicativos para dispositivos móveis, onde os KPIs (Indicadores-Chave) são a média de avaliação do app em lojas de aplicativos. Uma abordagem de monitoramento padrão acompanharia a evolução da média de avaliações ao longo do tempo, já uma abordagem de insights usaria abordagens de processamento de linguagem natural para identificar, dentro dos possíveis milhares de posts com comentários, os pontos mais frequentes de descontentamento ou satisfação dos clientes, identificando insights sobre o porquê das variações de avaliação, enquanto uma abordagem integrada pode monitorar continuamente o aplicativo, mapeando padrões de comportamento fora do comum nas interações dos usuários com o aplicativo, levantando possíveis pontos de melhoria.

O uso de redes sociais como canais de comunicação e interação com a base de clientes também pode ilustrar a evolução do uso de dados de forma a gerar valor. A análise de redes sociais concentra-se, com frequência, no acompanhamento da evolução de seguidores, número de interações (curtidas, compartilhamentos) e número de pessoas atingidas pelo conteúdo ao longo do tempo. Apesar de esta abordagem ser útil como acompanhamento de histórico, ela é pouco esclarecedora sobre o porquê das métricas terem o comportamento que tiveram ou sobre o que fazer para influenciá-las por exemplo. Mas ao coletar dados sobre quem são as pessoas que mais frequentemente interagem e quem são seus amigos e os amigos de seus amigos, é possível identificar padrões de propagação de informação na rede social, criando material suficiente para a identificação um modelo de comportamento. Com isso, é possível orientar ações de marketing e vendas pelo comportamento dos usuários, potencializando as taxas de conversão e o retorno do investimento associado.

Dentro da sua missão de identificar e concretizar oportunidades de transformação de empresas, o CESAR possui um processo contínuo de investigação que conecta desafios encontrados no mercado com soluções inovadoras em um contexto de geração de valor. Os cases descritos anteriormente representam exemplos de esforços conjuntos entre empresas parceiras e equipes de especialistas do CESAR, que partindo de um desafio concreto, conseguiram modelar e evoluir soluções de real valor agregado para produtos e serviços, utilizando abordagens de análise de grandes volumes de dados.

A criação de produtos e serviços inovadores que ofereçam valor agregado com base nos dados gerados por processos produtivos é uma grande oportunidade de diferenciação, aberta para empresas de todas as naturezas e tamanhos. A disponibilidade de dados e o baixo custo de soluções de análise e de infraestrutura de suporte facilitam criações inovadoras na área. No entanto, é preciso possuir estratégias claras, para que o potencial de criação de processos de melhoria contínua de produtos e serviços possa ser concretizado.

Paulo Urbano é mestre em Sistemas Embarcados e Aplicações Distribuídas pela Universität Stuttgart, Alemanha, e especialização em Data Science pela Johns Hopkins University/Coursera. Com 20 anos de experiência profissional em empresas no Brasil, França e na Alemanha, hoje atua como coordenador técnico e gerente de projetos do CESAR.

Referências:

[1] Harvard Business Review, Outubro 2012. http://bit.ly/11bRO4X

[2] Zephoria, Maio 2016. http://bit.ly/1MsvKaE

[3] EMC², Dezembro 2012. http://bit.ly/1uWFazZ

[4] Computer World,Junho 2011. http://bit.ly/1H5UN1V

[5] Driving Business Strategies with Data Science. Bill Schmarzo, Wiley (2015) ISBN: 9781119238881

--

--

CESAR
CESAR Reports

Instituto privado que inova em produtos, serviços e empresas com TICs — Tecnologias da Informação e Comunicação. | A brazilian private institute for innovation.