Big Data, Ciência de Dados e Business Intelligence. O que são?

Big Data Brasil
Big Data Blog
Published in
7 min readOct 22, 2020
Photo by John Schnobrich on Unsplash

por Alisson Hayasi, Estagiário em Ciência de Dados na Big Data.

Desde a explosão das áreas relacionadas a dados em meados de 2012, diversos termos, jargões e chavões (ou buzzwords) como Big Data, Big Data Analytics, Data Science e Business Intelligence inundaram a indústria, gerando muita confusão sobre o que cada um desses termos significam, áreas que representam e escopo de atuação dessas áreas.

Portanto, aqui vamos tentar esclarecer algumas questões como:

  • O que é Big Data, Ciência de Dados e Business Intelligence?
  • Quais são as diferenças?
  • Por que esses conceitos e tecnologias são tão importantes?

Porém, antes, é importante ressaltar que como toda buzzword e campos em ascensão (e formação), não existe um consenso universal sobre o papel exclusivo de cada área. Logo, aqui apresentamos o que tem se mostrado mais comum na indústria e não uma verdade absoluta sobre cada um dos assuntos abordados.

Afinal, o que é Big Data?

Big Data é um termo utilizado (geralmente) para se referir a dados excepcionalmente grandes em volume, variedade e velocidade de crescimento. Essas bases de dados são tão grandes e complexas que é quase impossível de serem manipuladas através de métodos tradicionais¹.

Em função dessa dificuldade, os grandes dados (ou seja, big data) necessitam de novos processos, métodos e tecnologias para que sejam armazenados e gerenciados de forma eficiente.

Os V’s do Big Data

Nos anos 2000, para diferenciar precisamente Big Data dos dados convencionais, o analista Doug Laney caracterizou o novo paradigma de dados em três propriedades essenciais conhecidas como Três V’s: Volume, Velocidade e Variedade.

  • Volume. Na Era Big Data, os dados não são apenas grandes, eles são absurdamente grandes. Por exemplo, de acordo com a Statista, o volume de dados produzido ao redor do mundo em 2012 foi de 6.5 Zettabytes. Em 2019, o volume de dados foi de aproximadamente 41 Zettabytes (ou 41,000,000,000,000 Gigabytes), 530% maior do que em 2012. Assim, com o barateamento constante dos dispositivos de armazenamento, as companhias podem coletar, armazenar e usufruir desses dados para gerar insights, tomar decisões melhores ou então fazer análises preditivas para o seu négocio.
  • Velocidade. Além de grandes, os dados também crescem rápido. No exemplo dado, entre 2012 e 2019 houve um crescimento de 530% na produção de dados. Mas, caso isso não tenha sido o suficiente para te convencer o quão rápido os dados crescem, aqui vão mais algumas estatísticas publicadas na oitava edição do Data Never Sleeps: A cada minuto do dia, 147,000 fotos são carregadas no Facebook. 41,666,667 mensagens são enviadas através do WhatsApp. No e-commerce, consumidores gastam 1,000,000 de dólares.
  • Variedade. Diferentes de dados tradicionais que, em geral, são bem estruturados e podem ser organizados em bancos de dados relacionais, com Big Data não é tão simples. Afinal, dados podem ser coletados de diversas fontes, em diversos tipos, formatos e raramente são estruturados. Assim, é necessário o desenvolvimento de rotinas de processamento escaláveis e robustas para que os dados possam ser efetivamente utilizados.
Infográfico da Quantidade de Dados Gerados por Minuto no Mundo (Fonte: Domo, Inc.)

Embora os 3 V’s resumam as características principais do big data, com o amadurecimento do conceito a comunidade incluiu mais dois V’s para especificar ainda melhor os grandes dados, são eles: Veracidade e Valor.

  • Veracidade. Esta propriedade diz que os dados devem corresponder com a realidade, serem autênticos e confiáveis. Em alguns casos, o grande volume, velocidade e variedade podem prejudicar a veracidade do dado. Porém, ter um dado autêntico é tão importante quanto ter o próprio dado.
  • Valor. Dados devem gerar valor. Ter uma grande quantidade de dados armazenados não garante que estes contribuirão para sua empresa.

Onde Entra Big Data Analytics?

Big Data Analytics é a buzzword utilizada para se referir ao uso de técnicas avançadas de análise em Big Data, para extração de informação. Contudo, é comum ver o uso de Big Data Analytics pra se referir ao que chamamos de Ciência de Dados!

Quem é Você, Ciência de Dados?

A grande quantidade de dados torna necessária a demanda por profissionais capazes de lidar com esses dados e trazer valor para sua companhia. Esse é o papel de cientistas de dados.

Em resumo, a Ciência de Dados (Data Science) é um campo multidisciplinar cujo foco é a extração de informação e produção de conhecimento a partir de grandes bases de dados (ou seja, big data) por meio de algoritmos, processos sistematizados, métodos estatísticos e científicos.

A Importância da Ciência de Dados

Com certeza, a ciência de dados não é algo totalmente novo e por ser uma área em alta, repleta de jargões, você pode acabar querendo ignorá-la. No entanto, a capacidade de gerar valor através de dados torna “data science” a principal ferramenta para o crescimento e inovação de qualquer negócio.

Seja para analisar vendas, descobrir as necessidades do mercado, avaliar a saúde de um negócio, analisar o que faz um produto ter sucesso a fim de auxiliar na criação de um novo produto ou, principalmente, apoiar a tomada de decisões, a ciência de dados é, sem dúvidas, a ferramenta mais importante para qualquer companhia em qualquer indústria².

Ainda em 2011, o economista Erik Brynjolfsson realizou um estudo³ que mostrou, estatisticamente, que quanto mais orientada à dados (ou “data-driven”) uma empresa é, maior sua produtividade. No mesmo estudo, Brynjolfsson mostrou que as decisões orientadas a dados estavam correlacionadas (e a relação parece ser causal) com maior retorno sobre ativos, patrimônio líquido e valor de mercado,

A Big Data, ao encontrar o sortimento ideal de cada produto em cada ponto de venda foi capaz de aumentar o lucro bruto de uma empresa de bens de consumo em 12% ao mês. No varejo farmacêutico, a precificação dinâmica de 14 mil produtos em cada loja da rede gerou um aumento de lucro bruto de 4,3%.

Portanto, não é exagero dizer que hoje o sucesso de uma companhia depende de quão bem ela consegue utilizar os dados disponíveis a seu favor. Afinal, como disse o consultor de administração e autor Geoffrey Moore:

“Without big data analytics, companies are blind and deaf, wandering out onto the web like deer on a freeway.” — Geoffrey Moore

Enfim, a ciência de dados ainda é um campo em desenvolvimento. Contudo, não importa o quão bem você acha que seu negócio está indo, você ainda pode melhorá-lo através do uso eficiente de dados.

Business Intelligence

De acordo com a definição da Gartner Group, Business Intelligence é (em tradução livre):

“Um termo abrangente que inclui aplicativos, infraestrutura, ferramentas e as melhores práticas que permitem o acesso e a análise de informações para melhorar e otimizar decisões e desempenho.”

Em outras palavras, Business Intelligence (BI) é o processo de coletar, integrar, analisar e apresentar dados de forma a otimizar operações, processos de negócios e, principalmente, ajudar pessoas executivas a tomarem decisões melhores e mais assertivas com base em dados (e não na intuição).

Qual a Diferença Entre Business Intelligence e Ciência de Dados?

Ambas, Ciência de Dados e Business Intelligence, usam dados como matéria-prima para gerar valor e possuem profissionais com grande capacidade de interpretar dados e transformar essas interpretações em insights. Além disso, ambas atuam como uma forma confiável de suporte a tomada de decisão.

Porém, a maior diferença está nas perguntas que cada área tenta responder e como fazem isso. De modo geral, podemos dizer que Business Intelligence tem como foco interpretar dados do passado e presente, através de análises descritivas e diagnósticas, para responder perguntas como: “O que aconteceu?”, “Por que aconteceu?”. Já a Ciência de Dados, além de ter capacidade para responder as mesmas perguntas que BI, também atua buscando tendências e padrões a fim de realizar predições assertivas sobre eventos futuros, respondendo perguntas como: “O que vai acontecer?”, “O que deve ser feito?”

Além disso, enquanto analistas de BI trabalham com dados estáticos e estruturados, cientistas de dados trabalham tanto com dados estruturados quanto não estruturados, de diversas fontes, tipos e complexidades, que precisam ser tratados antes de utilizados. Ainda, a ciência de dados faz uso intensivo de métodos estatísticos, científicos e inteligência artificial para construir produtos orientados à dados (ou “data-driven”), como, por exemplo, encontrar o sortimento ideal de produtos por ponto de venda de forma rápida e simples, a fim de maximizar o lucro ou venda.

Conclusão

De fato, a grande quantidade de buzzwords, termos e conceitos das áreas relacionadas a dados torna difícil quantificar separadamente e com precisão a importância de cada um dos temas. Mas, a questão mais importante não é o que essas palavras significam e sim quais os benefícios que podem trazer para sua empresa.

Notas e Referências

Caso tenha interesse, leia mais sobre o conteúdo nas referências utilizadas!

[1] — S. Sagiroglu and D. Sinanc, “Big data: A review,” 2013 International Conference on Collaboration Technologies and Systems (CTS), San Diego, CA, 2013, pp. 42–47, doi: 10.1109/CTS.2013.6567202.

[2] — Provost, Foster, and Tom Fawcett. Data Science for Business: What you need to know about data mining and data-analytic thinking. “ O’Reilly Media, Inc.”, 2013.

[3] — Brynjolfsson, Erik, Lorin M. Hitt, and Heekyung Hellen Kim. “Strength in numbers: How does data-driven decisionmaking affect firm performance?.” Available at SSRN 1819486 (2011).

--

--