Marcio Andrade
OPANehtech
Published in
3 min readNov 18, 2022

--

Durante muitos anos as empresas não atentavam para os impactos e seus riscos, apenas observavam a arquitetura e engenharia de suas soluções, ou focavam o quanto economizariam trocando um equipamento por outro devido a valores e custos. Podemos citar, como exemplo, a indústria aeronáutica. Durante os primeiros anos da aviação não existia a obrigatoriedade do uso de cintos de segurança, tal medida foi adotada apenas pouco antes da segunda guerra mundial. Em um outro caso temos o vazamento de óleo da BP no golfo do México ocorrido há alguns anos, que causou grandes prejuízos de vidas e recursos, sem falar da destruição da fauna marinha da região. Esses casos citados mostram o quanto as empresas não estavam preocupadas com a resiliência de suas operações nem com a confiabilidade dos seus produtos, não tinham o cuidado de “monitorar” seus ambientes corretamente.

Navio de Guerra rompendo fortes ondas e ventos, avançando frente a qualquer intempérie.

No início do século 21 a T.I. (Tecnologia da Informação) extrapolou as barreiras “do apenas” possuir o “ferramental tecnológico” certo para o processo e começou a olhar o quão confiável era sua operação e resiliência diante de QUALQUER evento. Assim iniciou um processo de se antecipar (proatividade) aos eventos e intempéries para que a sua recuperação fosse mais rápida, reduzindo o tempo de impacto para seus clientes. Dessa forma o esforço atual não é mais manter a tecnologia operacional, mas sim o negócio. Assim recursos tecnológicos devem capacitar a empresa a manter sua operação e sua continuidade, portanto proporcionando alta produtividade e entrega dos seus produtos e serviços sob qualquer imprevisto. Esse conceito e abordagem fazem parte da cultura e ações SRE (Site Reliability Engineering).

24x7 Operações do Command Center Digital

O Banco Pan implantou o Command Center Digital (CCD), que por sua vez adotou o framework SRE, para suportar sua operação, focando na continuidade e resiliência dos seus serviços financeiros aos clientes. Em poucos meses de atuação do CCD, que opera 24x7, os resultados foram relevantes, onde entre um período de seis meses iniciais houve uma redução de 50% dos alertas/incidentes. Visibilidade da operação e negócio, velocidade na identificação dos eventos e impactos, rápida atuação nos alertas e incidentes proporcionando a continuidade das operações, integração e parceria do CCD com diversos times para melhorias e otimizações dos produtos do Banco Pan… Enfim, a lista de conquistas continua crescendo tornando o CCD mais robusto e imprescindível à operação do Banco Pan.

Agora, quais os recursos que estão sendo utilizados para que o CCD tenha tamanha relevância e importância para operação do Pan? A tecnologia tem sido a ferramenta de apoio para essa conquista com a cultura DevOps, soluções de ITSM / IT-OPs e AIOPs, automações, CI/CD, adoção multi-cloud e etc, contudo o mais importante são as pessoas do Pan (“pessoas capacitadas integradas à cultura da empresa e foco no negócio”) juntamente com o time CCD, com sua atuação técnica e orquestrando os acionamentos e atendimentos, proporcionando um crescimento orgânico e saudável para nossas operações.

--

--

Marcio Andrade
OPANehtech
0 Followers
Writer for

Senior Cloud & On-Premises Production Analyst no Banco Pan — https://www.linkedin.com/in/marcioandrade/