Camino para ser Site Reliability Engineering [SRE] en 2022

Site reliability engineering es una de estas profesiones que apareció y en poco tiempo ya está en todos lados (no todos tienen los mismos problemas que google, pero si hay que errar mejor como el más grande).

Esta es la ruta de aprendizaje que seguiré para ser SRE o lo que suceda, lo documentó, para eso de crear contenido :) .

Disclaimer: No soy experto en nada, solo sé cosas.

“Un viaje de mil millas comienza con un primer paso” — Lao-Tse

  1. Conceptos Básicos
  • ¿Que es un SRE?
  • SRE Vs DevOps
  • SLIs, SLAs y SLOs
  • Repositorio Git y workflow
  • Ciclo de vida de una App
  • Testing

2. Control de versiones con GIT

  • Git & Github

3. Terminal (CLI)

  • Monitoreo de procesos | ps, top, htop
  • Manipulación de texto | awk , sed, grep, sort, uniq, cat, cut, echo
  • Network | nmap, tcpdump, ping, traceroute, iptables, netstat
  • Rendimiento del sistema | nmon, iostat, vmstat
  • Misceláneos | uname, df, history, systemtap
  • Editor de Texto : Vim
  • Multiplexores de terminal (tmux)

4. Scripting

  • Bash
  • PowerShell

5. Lenguaje de programación

  • Python
  • Golang
  • Rust

6. Sistemas Operativos

  • Ubuntu

7. Administrador Servidores

  • Administrar procesos
  • Threads y Concurrencia
  • Básico POSIX
  • Administración I/O
  • Virtualización
  • Memoria / Almacenamiento
  • File System
  • Administrar Servicios
  • Configurar arranque (systemd & initd)
  • Sockets

8. Redes, seguridad y protocolos

  • FTP
  • HTTP/HTTPS
  • SSL /TLS
  • SSH Key Management
  • Port Forwarding
  • SNMP, IP, DNS Name Resolution

9. Configuraciones

  • Firewall
  • Proxy Servers
  • Reverse Proxy
  • Load Balancer
  • Caching Server
  • Forward Proxy

10. Web Server

  • Nginx
  • Apache
  • Traefik

11. Databases

  • RDBMS
  • PostgreSQL
  • MySQL
  • MongoDB
  • dynamoDB
  • Redis
  • 12. Container
  • Docker

13. Orquestador

  • Kubernetes
  • Helm — Manejador de paquetes K8s
  • Docker swarm

14. Proveedores de nube

  • Amazon web services (AWS)
  • Google cloud platform (GCP)
  • Microsoft Azure
  • Digital Ocean
  • Heroku

15. Infraestructura

  • Administración de Configuración: Ansible
  • Infrastructure: Terraform / Cloudformation / ARM templates
  • Monitorear: Prometheus / Grafana / Nagios / Zabbix / Loki
  • Administración de logs: Elastic Stack / Pagerduty
  • Service Mesh: Istio
  • Monitoreo de aplicaciones: Opentracing / Jaeger / Datadog / Graphite / Opentelemetry / Google Trace Agent
  • Mobile deployment: Bitrise / Android store
  • Servicios de mensajería: RabbitMQ / Kafka

16. Continuous Integration & Continuous Deployment (CI/CD)

  • Deployment strategies
  • Jenkins
  • Gitlab
  • Github Actions
  • ArgoCD
  • AWS cloud pipeline

17. Build Tools & Package Management

  • ¿Que es Build Tools & Package Management ?
  • Repositorio de artefactos: Docker Hub / Nexus
  • Automatización: Selenium / Cypress / Appium
  • Diferencias entre repositorios: maven / npm

18. Crear artefactos y desplegar

  • Java (gradle & maven)
  • JavaScript
  • Golang
  • Rust

19. Fundamentos MLOps

  • Luigi

--

--