IRGM: el gen que volvió de entre los muertos.
La historia de un gen que, tras estar “muerto” durante millones de años, resucitó.
Ahora que ha terminado la semana santa, os voy a contar la historia de un gen que murió y resucitó, y que ahora lo tenemos incorporado en nuestro propio genoma. Se trata del gen IRGM humano, a quien C. Bepken (descubridor de su origen evolutivo) llegó a denominar el gen Jesús.
Los genes IRGM, que pueden encontrarse en la mayoría de mamíferos, codifican a una familia de proteínas con el mismo nombre relacionadas con la respuesta inmune de las células a la invasión de algunos patógenos externos, como las bacterias causantes de la tuberculosis y la salmonela. Además, los polimorfismos (mutaciones) de estos genes se han relacionado recientemente con patologías autoinmunes como la enfermedad de Crohn.
Justamente debido al interés en la enfermedad de Crohn se investigó el origen evolutivo del gen IRGM humano, encontrándose una sorpresa: este gen se murió hace unos 50 millones de años, pero resucitó en los primates hace unos pocos millones de años. Pero empecemos por el principio.
La multiplicación de los panes… y los genes
En los algunos mamíferos, como los ratones y los perros, el gen IRGM aparece por triplicado, con variantes muy semejantes entre sí (pues sí, como la santísima trinidad). Estos genes se originan mediante una multiplicación previa del gen original, evolucionando posteriormente cada uno de ellos por separado. A este tipo de genes semejantes en una misma especie se les denomina parálogos. Posteriormente, dos de estos genes se desactivaron debido a mutaciones, como se observa por ejemplo en el lémur ratón gris, y al final se contrajeron en un solo gen.
Pasión y muerte de un gen
Todo iba bien hasta que algo ocurrió hace unos 50 millones de años (vamos, anteayer). Fue entonces cuando a una secuencia de ADN pizpireta y saltarina (ALU, muy conocida por los genetistas por su propensión a autorreplicarse en distintos genes) se le ocurrió insertarse en la secuencia del gen IRGM.
Pero para entender qué pasó es necesario hacer un pequeño paréntesis y explicar un poco cómo funciona el paso de ADN a proteínas. El ADN está formado por una combinación de cuatro nucleótidos distintos, que se etiquetan según la base nitrogenada que contienen — adenina (A), timina (T), guanina (G) o citosina (C). Estos nucleótidos, leídos de tres en tres (los denominados codones), se convierten en un aminoácido concreto de la proteína en construcción, según un determinado código genético. Fíjate en que hay unos codones que se encargan de codificar el inicio de la lectura (ATG, que también se convierte en el aminoácido metionina) y de su final (TAA, TAG y TGA).
Para que se pueda sintetizar la proteína a partir del ADN (con un paso previo por ARN que no es importante para esta explicación) el orden de lectura ha de ser el adecuado, es decir, las enzimas que leen el ADN han de empezar por el primero de los nucleótidos de un codón correcto. Piensa que existen tres formas de lectura en función de cuál es el primer nucleótido empezando por un extremo de la cadena de ADN, más tres formas de lectura por el otro lado; son los denominados marcos abiertos de lectura — en inglés, open reading frames (ORF). Si tiene lugar un borrado o inserción en el gen (o las cercanías de este) puede cambiar el marco de lectura, por lo que la proteína obtenida no sería la correcta. Espero que puedas entender bien este punto a partir de la siguiente figura.
Una vez hecho este paréntesis, volvamos a nuestro gen IRGM. Como decía, hace unos 50 millones de años se insertó en un punto anterior a la secuencia de este gen una secuencia ALU. Esto provocó un desplazamiento del marco de lectura que convirtieron al IRGM en un gen no funcional (denominados pseudogenes). Además, en algunas especies este desplazamiento vino agravado por desplazamientos del marco adicionales debidos a inserciones o borrados y/o por un truncamiento del gen. Por ejemplo, en el caso del mono Rhesus (Macaca mulatta) aparece un desplazamiento de marco seguido por un codón de terminación (TGA). Además, el gen se acorta a más de la mitad.
Y al tercer día, resucitó
Bueno, no exactamente. La resurrección tuvo lugar hace unos 10 o 20 millones de años, y tuvo como actor principal a otro conocido del ADN humano: el retrovirus endógeno ERV9. Sí, he dicho un virus. Los retrovirus endógenos se caracterizan por insertarse en el ADN de las células huésped, lo cual no supone ningún problema a menos que lo hagan en células que participan en la generación de células sexuales, en cuyo caso se transmiten a su descendencia. Esto es tan habitual en el caso de los humanos, que este tipo de virus compone cerca del 8% de nuestro ADN.
En el caso del gen objeto de este artículo, se observa la presencia del virus ERV9 en el gen IRGM de una gran variedad de primates y en el ser humano. La inserción de este virus en la zona del gen anterior a la secuencia ALU pudo restaurar el marco de lectura correcta, haciendo de nuevo funcional el gen.
Por último, y para tener un visión general de la evolución de este gen, aquí tienes una visión general de toda su historia. ¡Ah! Y si te apetece escribir algún comentario, puedes hacerlo buscando los signos ‘+’ que se encuentran a la derecha de cada párrafo.
Referencias
- Bekpen C, Marques-Bonet T, Alkan C, Antonacci F, Leogrande MB, et al. (2009) Death and Resurrection of the Human IRGM Gene. PLoS Genet 5(3): e1000403. doi:10.1371/journal.pgen.1000403.
- Bekpen C, Xavier RJ, Eichler EE (2010). “Human IRGM gene “to be or not to be”.”. Semin Immunopathol 32 (4): 437–44. doi:10.1007/s00281-010-0224-x. PMID 20737271.