Glossário de dados: O que é Data Science?

O que é Data Science? Qual é a diferença entre ele e o BI tradicional?

DataLakers Tecnologia
Blog DataLakers
4 min readJul 7, 2021

--

Pixabay, via Pexels

Data Science (ou ciência de dados, na tradução) pode ser considerado uma das operações mais importantes para que uma empresa se mantenha entre as melhores do seu segmento nos dias de hoje.

Seja para entender profundamente o seu consumidor, seu mercado ou seu próprio negócio, o Data Science é uma ferramenta incrível para extrair inteligência de seus dados.

Em resumo, Data Science constitui um conjunto de práticas de estatística, análise de dados e programação para a realização de cruzamentos complexos de dados que resultam na geração de insights aprofundados.

Mas para elaborar um pouco mais essa definição, vamos primeiro entender os tipos de análises de dados que podemos realizar:

  • Análise descritiva: aplicável para descrever um cenário através de dados consolidados. Assim são obtidos, por exemplo, valores como a “média de acesso em um site durante o mês de Maio” ou “quantidades de registros por hora no sistema”.
  • Análise diagnóstica: visa elucidar as causas por trás de determinado resultado. Aqui, o foco é buscar causalidade e explicar ocorrências empregando conhecimentos de contexto e mercado, além de testes de hipóteses como testes A/B.
  • Análise preditiva: consiste em gerar previsões de cenários futuros com base padrões identificados através dos dados. Um exemplo de análise preditiva são as análises de créditos, realizadas por bancos, com base em scores do cliente em outras bases de dados.
  • Análise prescritiva: dita ações que devem ser tomadas para atingir um resultado desejado no futuro, com base no histórico de dados. Busca avaliar diferentes opções e indicar as de melhor impacto, através de correlações complexas. Um sistema que deseja aumentar as vendas em um e-commerce, através de recomendações de produtos, pode ser baseado em análise prescritiva, por exemplo.

Em geral, as análises descritivas e diagnósticas olham para trás, avaliando dados consolidados para chegar a conclusões sobre períodos passados.

Já as análises preditivas e prescritivas utilizam esses mesmos dados como insumo para olhar para o futuro, apontar caminhos possíveis e definir linhas de ação.

O Data Science tem como foco análises preditivas e prescritivas, já que consegue empregar grande poder computacional para a geração de vários cenários, levando em consideração diversas variáveis, e então avaliar quais geram resultados otimizados.

Mas e o BI?

É sabido que as áreas de Bussiness Inteligence (BI) já trabalham com a premissa de gerar valor e insights para as organizações através da análise de dados. Então, como Data Science e BI se encaixam?

O Data Science não veio para substituir o BI, mas para complementá-lo e expandi-lo. As duas disciplinas atendem a mesma finalidade, mas com práticas diferentes.

Além do enfoque analítico distinto, como citamos acima, o Data Science permite às organizações se aprofundarem em outro tipo de dado: dados não estruturados.

É fácil de entender o impacto que esse aprofundamento causa quando pensamos que dados não estruturados constituem cerca de 80% dos dados das empresas. Ele nos permite agregar um volume imenso de novas informações ao processo de tomada de decisão.

Portanto, o BI continuará sendo um braço essencial para entender dados estruturados e responder inúmeras perguntas de negócio, mas o Data Science vem para introduz novas possibilidades.

A Ciência de Dados em ação

Na prática, o profissional de ciência de dados vai precisar aliar bom conhecimentos em estatística, ciência da computação e domínio do setor de atuação para formular boas perguntas de negócio.

O escopo da ciência de dados é amplo. Seja logística, manutenção ou marketing, vários departamentos (de qualquer vertical do mercado) podem aproveitar o conhecimento advindo dos dados. Vamos ver alguns exemplos da aplicação de Data Science:

  • Utilizar PLN (processamento de linguagem natural) para realizar análises de sentimento do público através dos comentários em redes sociais, e entender a repercussão do lançamento de um novo produto.
  • Acompanhar tendências de vendas no comércio para orientar gerenciamento de estoque e logística.
  • Utilizar dados históricos de pacientes para identificar quais possuem tendência em desenvolver diabetes e indicar medidas preventivas.

Para tanto, o cientista de dados vai utilizar de Machine Learning, ou seja, algoritmos que aprendem à medida que consomem mais dados. Isso, aliado ao Big Data disponível, permite programas que geram insights muito apurados. Para um maior nível de abstração, pode-se ainda aplicar os conceitos de Deep Learning.

Para implementar esses modelos em operação e larga escala, pode existir no time um engenheiro de Machine Learning. Ainda assim, o cientista de dados é o responsável pela aplicação do método científico, análises de dados e criação e treinamento dos modelos de ML.

Nos dias de hoje, práticas de BI e Data Science podem, juntas, trazer a aceleração e inovação vital às organizações.

Em suma, a maior vantagem do Data Science é superar a simples geração de insights a partir dos dados e permitir previsões e projeções baseadas em padrões, habilitando a mudança de postura estratégica da empresa de reativa para proativa.

--

--

DataLakers Tecnologia
Blog DataLakers

As melhores soluções para seu projeto de Big Data. A DataLakers Tecnologia é uma empresa especializada em automatização de pipeline e governança de dados.