Observabilidade na transformação digital das operações de TI

Gerson Neto
Data Hackers
Published in
4 min readJul 12, 2022
Photo by Luca Bravo on Unsplash

Recentemente o termo observability começou a ficar em alta, quando estamos buscando temas relacionados ao monitoramento de aplicação, infraestrutura, logs e experiência do usuário. Mas de fato, o que é observabilidade? é um conceito novo? Uma evolução do monitoramento? É apenas uma buzzword?

Bem, se você também já se questionou sobre esse termo, você está no lugar certo! vou explicar brevemente do que se trata e como isso pode impactar as operações de TI.

A origem do termo Observabilidade

O termo originou-se em agosto de 1960 através de Rudolf E. Kálmán com a citação em seu livro “Teoria dos sistemas de controle” (On the general theory of control systems):

“definindo como a medida dos estados internos de um sistema podem ser captados através do conhecimento das saídas externas”.

Existe também uma definição pelo Wikipédia:

“Um sistema é dito ser observável se, para qualquer possível sequência de vetores de estado e de controle, o estado atual pode ser determinado em tempo finito usando apenas as saídas”

Com isso, podemos dizer que observabilidade esta presente desde a concepção de desenvolvimento de um software até os ambientes distribuídos de infraestrutura (contêineres, servidores, banco de dados, cloud).

Os pilares da Observabilidade

Podemos considerar os pilares de observabilidade as métricas, eventos, logs e traces, que é uma tradução do acrônimo em inglês M.E.L.T (metrics, events, logs and traces). Esses pilares contribuem nas transformações digitais nas operações de TI e nas mudanças constantes das tecnologias, com isso, se faz necessário “observar” o comportamento das aplicações/serviços e os impactos no usuário final.

Pilares da observabilidade — Fonte do autor

Com esses pilares podemos correlacionar as métricas, obter informações relevantes e acelerar o diagnóstico de causa raiz nos incidentes das operações. Com isso, um serviço observável ajuda a reduzir os silos das ferramentas nas operações, uma vez que os dados são integrados e correlacionados em um só lugar. Deste modo, pode-se obter o detalhamento dos serviços monitorados e usar recursos de inteligência artificial na prevenção de problemas de sistemas, detecção de comportamentos anômalos e auxiliar na tomada de decisão das operações de TI.

Elastic Observability

Dentre as ferramentas de mercado, a Elastic possui uma solução para observabilidade, no qual utiliza todo o poder da stack na ingestão de todos os dados de telemetria com alta cardinalidade e dimensionalidade, permitindo realizar análise de contexto em tempo real para uma rápida identificação da causa raiz.

Imagem do site — Elastic Observability, uma solução criada sobre a plataforma Elasticsearch | Elastic

Elastic Observability, potencializa uma visibilidade em ambientes de nuvem hibrida e sistemas/serviços com uso de machine learning, que integrado, correlaciona automaticamente as anomalias aos dados downstream e dependências para encontrar a causa raiz, ou seja, o mecanismo de machine learning independe do método ou formato de transmissão dos dados e pode ser facilmente estendido para oferecer suporte a qualquer dado ingerido no Elastic.

A solução permite uma ingestão rápida e fácil de métricas, logs e traces de aplicações hospedadas em um datacenter ou em provedores de serviços em nuvem como AWS, Microsoft Azure e Google Cloud. Assim, você poderá adotar tecnologias nativas da nuvem e de micros serviços, como Kubernetes e serverless.

A elastic pelo segundo ano seguido foi nomeado um Visionário no Quadrante Mágico Gartner deste ano para APM e Observabilidade:

Elastic named Visionary in 2022 Gartner Magic Quadrant for Application Performance Monitoring | Elastic

Conclusão

Neste artigo descrevemos o conceito de Observabilidade e como pode ajudar a reduzir os silos de dados e ferramentas nas operações de TI, através da ingestão de todos os dados operacionais e de negócios com integrações da Elastic, incluindo suporte para padrões abertos e projetos open source, como OpenTelemetry, Jaeger e Prometheus. Contudo, com observabilidade é possível realizar análises interativas (busca, detalhamento, dinamização e visualização) ou análises automatizadas (alerta, detecção de anomalia orientada por machine learning) de todos os seus dados no contexto, facilitando a compreensão da correlação e da causa em diferentes tipos de dados de telemetria.

Onde aprender mais?

Caso você queira aprender um pouco mais sobre o Elastic Stack, estou iniciando um canal no Youtube com o objetivo de explicar do zero, como instalar a solução e falar mais aprofundado sobre cada módulo que compõe a stack. Também existe a comunidade oficial da elastic e os grupos de meetups e telegram em várias cidades do Brasil.

Espero que tenham conseguido extrair novos conhecimentos. Caso tenham alguma dúvida, sintam-se livres para em entrar em contato, ou deixar um comentário que irei responder assim que possível.

Obrigado!

--

--

Gerson Neto
Data Hackers

Amante de tecnologia e inovação, acredito que a tecnologia e a educação pode ser um meio para transformação digital, unindo pessoas para um mundo melhor.