Azure for AWSers: Dados

Anselmo Borges
Rescue Point
Published in
6 min readMay 23, 2021
Meu resumo pra decorar essa mistura de letras entre as clouds.

Estou iniciando em um projeto que usa Azure, logo, inicia-se uma curva de aprendizado muito parecida com a que tive que fazer com o OCI da Oracle.

Tenho conhecimentos bem legais de AWS e GCP do Google mas nunca tive a oportunidade real de atuar com Azure, logo iniciamos aqui o:

Uma analise de comparação de serviços de dados entre as 2 Clouds

Nesse episódio vamos falar sobre as ferramentas de dados da Azure e fazer uma analogia com as ferramentas de dados da AWS (que é a mais conhecida), porem posso fazer analogias com as outras 2 clouds que conheço.

Não entrarei a fundo sobre essas ferramentas, esse post serve como uma base de conhecimento pra mim e pra pessoas que tem uma noção razoavel de AWS e Cloud em geral.

Meu core principal é dados então vamos iniciar por eles:

Azure SQL

É a versão SQL Server na cloud da Azure, vem bem customizado e otimizado por ser um database na Microsoft, tem um processo de migração de SQL Server on Premisses para a cloud bem facilitado com o apoio do Azure Database Migration Service (ADMS).

Um lance legal aqui é que tenho uma opção chamada “Database Query Editor”, onde consigo passar o acesso para meus desenvolvedores por exemplo para realizarem suas consultas e desenvolvimento através de uma interface Web, sem a necessidade de instalações de clients e outras funções mantendo seu desenvolvimento centralizado. A autenticação pode ser de usuários do Database ou sincronizado com uma base de autenticação da própria Azure chamado Azure Active Directory onde falaremos em outro post.

Ele possui uma única limitação a qual falo na próxima opção de SQL.

Analogia a AWS: Uma solução bem foda para o RDS SQL Server da Amazon, pois trata-se de ser um banco Microsoft.

Azure Managed instance SQL

Vamos supor que você tem alguma configuração muito especifica no seu SQL Server, digamos que uma customização pro seu cenário e algo do tipo, onde alterações no core do SQL Server foram feitas, logo não será suportado por uma solução Azure SQL, visando isso a Microsoft criou essa possibilidade customizada onde posso ter acesso a alguns controles e parametrizações que são limitadas na opção anterior.

Analogia a AWS: Não há

Azure Synapse Analytics

(anteriormente Azure SQL Data Warehouse) é um serviço de análise ilimitado que reúne armazenamento de dados corporativos e análise de big data. Você pode consultar dados em seus termos, usando recursos sem servidor ou provisionados em escala. Particularmente não conheci como era antes, mas acredito que era uma ferramenta parecida com o Teradata da informática que é uma solução parruda de DataWareHouse, mas pelo que ví aqui ele dá possibilidade de uso de Spark e outras ferramentas de bigdata.

Analogia a AWS: A ideia inicial é bem parecida com o Redshift, masss, com uma pitadinha de EMR possibilitando eu colocar uns Sparks pra rodar, não usei e não tenho detalhes de como funciona.

Aproveitando esses 2 últimos, durante a criação desses serviços um dos passos é você poder contratar o…

Azure Defender for SQL

Uma solução de Defesa, que avalia possíveis vulnerabilidades como SQL injection, vendido pela MS por 15 doleta que defende os bancos:

  • Azure Synapse
  • Azure SQL
  • Azure managed instances SQL

Azure CosmosDB

É a base de dados NoSQL da Azure, na real ela não tem uma definição de qual é o modelo que ela trabalha, ele cria uma camada de abstração, mas básicamente na criação dela você escolhe qual API quer usar sendo eles:

Tipos de APIs possíveis no CosmosDB

Sendo assim eu subo meus dados no formato que eu achar conveniente ou que a aplicação precisar.

Analogia a AWS: Um concorrente pro DynamoDB

Azure HDInsight

Uma solução de Bigdata para o Azure que cria um cluster com ferramentas como Spark, Kafka, HBase, Hadoop, Storm, ferramentas de ETL e Machine Learning. Ele é uma solução barata para processamentos pontuais de Bigdata, imagina subir um cluster Cloudera por 24h dia sendo que você faz um processamento em 3 horas. Aqui você provisiona, usa, extrai o resultado exclui, pagando apenas pelo que usou.

Analogia a AWS: Concorrente para o EMR da Amazon.

Azure Datababricks

A solução de Databricks da Azure já licenciada e com facilidade de provisionamento e disposição pela Cloud, com todas integrações possíveis com ferramentas de data lake como Datalake Storage ou serviços de fila como EventHub que é o Kafka da Azure. Ele não aparece no grupo de databases mas se for no search tem ele lá pra provisionar.

Analogia a AWS: Não existe uma solução de Databricks sem ser Market Place na AWS.

Azure DataLake Analytics

É uma ferramenta de Analise pesada de dados Pay-as-go, qual é a ideia? Você tem um volume muito grande de dados pra fazer uma analise, que em banco convencionais demorariam bastante. Você teria que provisionar uma infra e configurar as ferramentas e comunicações necessárias para analise. Com o DataLake Analytics meio que você já tem seus dados dispostos no Storage da Azure, aponta pra eles, define schema e outras funções necessárias para a analise e poe pra rodar, a própria ferramenta vai provisionar a infra necessária para que a consulta SQL execute, retorna o resultado e boa… você paga pelo uso.

Analogia a AWS: Amazon Athena e no Google GCP é o BigQuery

Azure Postgres SQL

Uma solução com base Postgres para Azure, bem padrão AWS mesmo, você instancia um Postgres já com monitoramento, backup, possibilidade de ajustar parâmetros. Uma funcionalidade legal é que posso usar o recurso de Hyperscale (Citus) que permite o crescimento horizontal do Postgres via Cluster, recurso que não é um padrão geralmente de bancos relacionais.

Analogia a AWS: RDS Postgres e Aurora Postgres

Azure MySQL e MariaDB

Assim como o Postgres a Azure tem uma solução pra databases MySQL e MariaDB, não ví uma opção em cluster com replica read only assim como a AWS oferece com o Aurora, mas existem algumas soluções oferecidas no MarketPlace e não sei se usam do Database as service como esse serviço sugere. Ele te dá opções de backup, monitoramento, migração e outras soluções integradas e quase eliminam a necessidade de um DBA.

Analogia a AWS: RDS Mysql ou MariaDB

Azure Database Migration Service

Uma solução usada pela Azure que auxilia na migração de bancos de dados On premisses para a Cloud Azure. Aparentemente suporta quase todos os tipos de bancos listados anteriomente.

Analogia a AWS: Database Migration Service, é o mesmo nome, rs

O que não encontrei nas opções da Azure é a criação de um Oracle Database de nenhum tipo, achei no Market Place uma opções de instalação mas não acredito que seja um DaaS como os demais citados.

No Market Place apareceram essas opções

Ou seja a Opção de RDS para Oracle como existe na AWS.

Nesse post era isso, como vou continuar desbravando o caminho dos dados na Azure, no próximo post vou falar sobre armazenamento, já que o plano é fazer um datalake, ter object storage, usar serviços de fila e a Azure tem algumas soluções prontinhas pra isso, integrando inclusive com o Databricks e outras soluções (falamos disso quando eu estiver mais maduro no assunto, rs)

Espero que ajude.

Anselmo Borges

--

--

Anselmo Borges
Rescue Point

Bigdata Engineer, Cloud Architect, Nerd, Alcoholic, Brazilian Jiujitsu Black belt and hide and seek World champion.