Cuando Falla la Nube
La gran diferencia entre una cosa que puede fallar y otra que no puede fallar es que cuando la cosa que no puede fallar falla normalmente es imposible de reparar.
Douglas Adams, Mostly Harmless
Llevo ya un año estudiando sobre la nube, y en ese tiempo he encontrado una tecnología la cual me apasiona y que sinceramente creo es el futuro de la computación. Estoy claro que en 5 años mis labores profesionales van a estar centradas alrededor de la nube, y estoy feliz por ello.
Y hoy la nube falló.
Microsoft Azure suffers outage after cooling issue
No vamos a defender a nadie. La falla en la infraestructura de Microsoft Azure del 2018–09–04 va a ser muy dañina para Microsoft en particular (como sería para cualquier proveedor de servicios) y para la tecnología de nube en general. Cuando se prometen tantas cosas como se han prometido en la publicidad de la nube, estas fallas van a causar graves decepciones en los clientes.
¿Qué podemos aprender nosotros de este evento?
Debemos diseñar para el fallo. Un gran maestro en la escuela, hablando de diseño de circuitos, nos explicó que debíamos diseñarlos para “fallar bien”. Que al fallar se apagaran en vez de explotar. Que enviaran una señal que se tuviese que interpretar como un error en vez de “ocultar” el hecho de que no estaban funcionando.
Porque los fallos suceden.
Y eso le puede pasar a empresas incluso del tamaño, y con los recursos, de Microsoft.
La nube nos da herramientas para prepararnos para la falla, de nuestros sistemas o incluso de su infraestructura. Zonas de disponibilidad. Regiones aisladas. Monitoreo fácil y accesible. Alertas que envían mensajes e incluso arrancan procesos de mitigación automáticamente. Todo está ahí. Solo debemos aprender a utilizarlo, y tomarnos el tiempo de estar listos. Hacer nuestro “playbook” para emergencias. Realizar simulacros (como de terremotos, pero para fallas de la infraestructura, sistemas o incluso personas).
Debemos tener los medios disponibles, el conocimiento fresco, los procedimientos de emergencia listos.
Más vale prevenir que lamentar. Nuestros clientes lo merecen.
