Virtualização de Dados: integração facilitada para pipelines complexas

DataLakers Tecnologia
Blog DataLakers
Published in
4 min readJul 30, 2021
Ali Pazani, via Pexels

Hoje, o mercado oferece uma ampla gama de opções IaaS para armazenamento de dados, com diversas nuvens públicas disputando a atenção de seus clientes corporativos e tentando tornar suas carteiras de soluções cada vez mais atrativas.

Ainda assim, sistemas on-premise continuam sendo uma opção e várias empresas preferem manter sua própria nuvem privada. Sem mencionar as diversas outras aplicações SaaS que fazem parte das rotinas, e outras fontes de dados como aplicações Web, APIs, conteúdo em PDF e planilhas Excel…

Nesse cenário, é comum que organizações tenham não apenas um ou dois repositórios simultâneos, mas vários. A flexibilidade e otimização de custo costuma ser chave nessas combinações.

Entretanto, operar nesse modelo também tem suas desvantagens.

Quando precisamos unificar dados para análises holísticas, consultas complexas ou aplicação em Data Science, o processo de integração costuma introduzir uma camada adicional de complexidade.

Isso acontece porque, atualmente, ferramentas de integração tradicionais precisam copiar todos os dados para um repositório intermediário, o que consome tempo e recursos.

A Virtualização de Dados, por outro lado, deixa os dados em seus sistemas de origem e simplesmente expõe uma visão integrada aos consumidores. Conforme os usuários analisam e exploram, a ferramenta de virtualização busca os dados em tempo real nos sistemas conectados.

Esse método descarta a necessidade de mais processos ETL na pipeline de dados exclusivamente para o consumo, diminuindo carga de trabalho e agilizando o acesso às informações.

A Denodo é líder no oferecimento de Virtualização de Dados no mercado internacional, e suas soluções levam toda a facilidade dessa abordagem moderna de Data Fabric às empresas.

Como funciona

A Virtualização de Dados Denodo trabalha em um princípio simples de três passos: Conectar-Combinar-Consumir.

É possível criar conexões com uma ampla variedade de fontes de dados, sejam estruturados ou não estruturados, incluindo databases, sistemas de Big Data, streaming, repositórios em nuvem, fontes NoSQL ou arquivos (diretamente).

São empregados conectores especializados para acessar repositórios ou aplicações de dados e realizar as conversões e normalizações necessárias para que todas as visões base sejam apresentadas como visões relacionais.

Na etapa de combinação, é possível gerar combinações de dados independente de seus formatos originais (base de dados relacionais, NoSQL, Hadoop, etc.).

Por fim, a camada de consumo oferece um ponto de saída unificado, a partir do qual os usuários podem consumir os dados no próprio catálogo de dados do Denodo, que acaba funcionando como um Data Marketplace, ou através de relatórios, dashboards, apps mobile, aplicações na Web, entre outros.

Impactos da Virtualização de Dados

Como a ferramenta se encarrega da integração dos dados para o consumo, o Data Squad pode manter-se focado na manutenção dos ambientes e ingestão, sem precisar investir tempo em processos intrincados de integração, criação de novas camadas dentro dos DW/DL ou geração de repositórios intermediários.

Isso permite que o time de TI fique menos sobrecarregado e possa focar em outras demandas, além de permitir mais agilidade aos times de negócio, que poderão consumir os dados através da Virtualização.

Além disso, a centralização de consumo pela Virtualização de Dados colabora diretamente com a manutenção das políticas de governança da empresa.

A plataforma da Denodo permite:

  • Consultas às linhagens de dados, desde a origem até a disponibilização
  • Exportação de todos os metadados e integração com ferramentas de governança (IBM IGC, Collibra, etc.)
  • Integração de modelos de dados

Por fim, a plataforma em si funciona como um catálogo de dados diretamente para o consumidor final, permitindo que ele entenda quais dados estão disponíveis e em quais datasets encontrá-los.

A partir disso, o usuário ainda pode criar suas visualizações personalizadas de maneira intuitiva, através de uma funcionalidade de clicar e arrastar, salvá-las e consumi-las sob demanda.

A DataLakers Tecnologia é parceira oficial Denodo, empresa nomeada “Líder” na pesquisa 2020 Gartner Magic Quadrant for Data Integration Tools através de sua ferramenta de Virtualização de Dados.

Contamos com um time especializado e certificado que está pronto para fornecer aos nossos clientes toda a praticidade das soluções Denodo para gestão e governança de dados, gerando redução de custos e ganho de agilidade através da Virtualização de Dados.

Ficou interessado? Envie um email para [contato@datalakers.com.br].

* No nosso canal do Youtube você encontra uma playlist completa explicando em detalhes as funcionalidades e o desempenho otimizado que são obtidos com a Virtualização de Dados. Não perca!

--

--

DataLakers Tecnologia
Blog DataLakers

As melhores soluções para seu projeto de Big Data. A DataLakers Tecnologia é uma empresa especializada em automatização de pipeline e governança de dados.