Como me convertí en S.R.E. o Web Operator

Antonio Jerez
5 min readMay 24, 2015

--

Hace unos 9 años, cuando empecé a trabajar en www.uptodown.com, existían dos perfiles bien diferenciados en el ámbito tecnológico, Administradores de sistemas y Desarrolladores de software.

Cada uno vivía en armonía como señor de su reino, era raro que un desarrollador de software supiera siquiera gestionar su entorno de desarrollo en un servidor, o que un Administrador de sistemas programara en algo que no fuera bash, C o como mucho Python.
Estos fueron tiempos felices para todos, las máquinas eran poco potentes y bastante caras y las grandes empresas, que servían mucho tráfico, podían permitirse hardware y personal suficiente para alimentar sus necesidades tecnológicas.

Hasta aquella fecha, siempre había pensado que me gustaría ser “Administrador de sistemas” tal y como se entendía entonces, pero la oferta para la que me llamaron era como desarrollador PHP, y como era mi primer trabajo serio, en un proyecto que pintaba muy bien, y la conexión con @pepedom y @luishg fué bastante buena en la entrevista, no me lo pensé dos veces, y a los dos días estaba trabajando con ellos.

Durante un año, puede que algo más, desarrollamos código prácticamente para todas las secciones del sitio, durante este tiempo, pude ir familiarizándome con la aplicación en si, y con las cosillas de programar para alto tráfico, lo típico:

  • No enlazar más CSSs de los necesarios: Por aquellos años, la transferencia se pagaba, y cara.
  • No consultar la base de datos como si las consultas fueran gratis.
  • Cache de consultas y elementos html.
  • Optimización de servicios.

Pasado un tiempo, llego el punto de inflexión, una Due Diligence, acompañada de una auditoria de sistemas. Justo en ese momento, Uptodown se alojaba en Interdominios, en varios servidores independientes sin estructura ninguna, por ejemplo había un servidor con MySQL, si este servidor caia, adios al servicio, y así con todos los servicios.

Así que había que ponerse las pilas, a @pepedom, @luishg y a mi nos pillo un poco por sorpresa, ambos son muy buenos técnicos, y @pepedom como CTO pilotaba todos los servidores por aquella época, ellos solos se hubieran apañado perfectamente, pero había mucho trabajo, y me pasaron el testigo, y yo lo tomé orgulloso, me lo tomé como la oportunidad para hacerme “Administrador de sistemas” como siempre había pensado.

Así que allí me encontraba, sin tener ni idea de lo que implica servir varios millones de páginas vistas, y fantaseando con balanceadores de carga, clusters de bases de datos y cosas por el estilo que nos gustan a los informáticos.

Afortunadamente, @pepedom y @luishg hablaron con la gente de mundoanuncio, y accedieron a realizarnos una consultoria, en la cual nos enseñarían los entresijos de las infraestructuras de alto tráfico. Isart Montané Mogas fué con el que más contacto mantuve,y aún nos seguimos la pista, un crack en toda regla, de no ser por el y su tutorización, dudo mucho que hubiéramos conseguido consolidar los sistemas de Uptodown en tan poco tiempo.

Sin saberlo por aquel entonces, esa consultoría marcaría mis pasos dentro de este mundo.

Definitivamente este fue otro punto de inflexión en mi carrera como S.R.E.

El día que recibí el informe me sonó todo a chino:

  • Balanceador de carga para tráfico http.
  • Firewall
  • MySQL Dual Master.
  • NFS para almacenamiento compartido.

Finalmente, el Dual Master resultó ser un fiasco, y decidimos no gestionar nosotros el balanceador de carga, así que como el nuevo proveedor de Uptodown iba a ser NTT, y ofrecía Firewall dedicado, así como balanceador de carga, no lo dudamos y nos quitamos esos dos servicios de encima, en poco más de dos meses, teníamos Uptodown en Ntt con balanceador de carga y maestro esclavo en base de datos.

Como resultado, en cosa de año y medio, sin pretenderlo, me había hecho un master en desarrollo PHP y Administración de Sistemas en entornos de alta carga.

Una anécdota curiosa, de este periodo, es sobre el día que vinieron a hacernos la auditoria de sistemas, el elegido para la tarea fué Ricardo Galli, Fundador de meneame.net, ese día yo parecía una quinceañera en la puerta de un concierto de Justin Bieber, ahí estaba yo, un tío con 1 año de experiencia en el tema, presentándole a Ricardo Galli, eminencia de la escalabilidad, como habíamos montado Uptodown en Ntt sin acabar yo de verlo claro. Pero fué todo muy fácil la verdad, le enseñe cuatro detalles que me pidió de las configuraciones, el esquema de red, y las gráficas de monitorización, y el resto del tiempo lo pasamos charlando, y fumando, por que no veas como fumas Ricardo! recuerdo que ese día volví a fumar, despues de un año “limpio”, en fin, el dato curioso era otro, le estaba contando a Ricardo Galli todo el proceso mental por el que habíamos pasado hasta llegar al esquema de red actual, y recuerdo perfectamente que me dijo:

“No se que os pasa a los informáticos, que escucháis balanceador de carga, o cluster, y se os pone dura! “

A Partir de aquí pasaron muchas cosas, vino VisualizeUs, dejé Uptodown, intenté montar varios proyectos fallidos, el boom de VisualizeUs, el declive de VisualizeUs, Freelance AWS, S.R.E. Contractor en Resultados-futbol y Freepik, y por último, hasta ahora, S.R.E. en www.chicfy.com

Durante todos estos años, he seguido ejerciendo como administrador y desarrollador, pero siempre prestando especial atención a como afecta la aplicación en la infraestructura de red, y viceversa, para intentar conseguir que todo fluya, y mantener los recursos a raya, ofreciendo los menores tiempos de respuesta posibles.

En medio de toda esta vorágine, me enteré de todo el movimiento DevOps, que si en Google se había inventado un perfil “nuevo”, “Site Reliability Engineer” el cual en Facebook hacía lo mismo y se llamaba “Web Operator Engineer” en fin, había un poco de confusión al respecto, y yo creo que todavía la hay, pero me sentí bastante identificado con los perfiles estos, durante un tiempo, me hice llamar DevOps, luego Web Operator, y ahora me ha dado por S.R.E. , lo he estado meditando, y para mi cada uno de estos perfiles tendrían “competencias deseables” distintas, pero eso es un asunto que me gustaría tratar en otro post, que este ya se ha alargado bastante.

Mientras tanto, ya no me siento como Chandler Bing, que nadie sabe de que trabaja, ahora tampoco lo sabe casi nadie, pero al menos puedo decir Site Reliability Engineer, aunque suene bastante pedante, pero ese es otro problema...

--

--

Antonio Jerez

S.R.E. por vocación, padre de profesión y geek como afición.