Wikipedia Commons

IRGM: el gen que volvió de entre los muertos.

La historia de un gen que, tras estar “muerto” durante millones de años, resucitó.

Guillermo Peris
El blog de Melquíades
5 min readApr 22, 2014

--

Ahora que ha terminado la semana santa, os voy a contar la historia de un gen que murió y resucitó, y que ahora lo tenemos incorporado en nuestro propio genoma. Se trata del gen IRGM humano, a quien C. Bepken (descubridor de su origen evolutivo) llegó a denominar el gen Jesús.

Los genes IRGM, que pueden encontrarse en la mayoría de mamíferos, codifican a una familia de proteínas con el mismo nombre relacionadas con la respuesta inmune de las células a la invasión de algunos patógenos externos, como las bacterias causantes de la tuberculosis y la salmonela. Además, los polimorfismos (mutaciones) de estos genes se han relacionado recientemente con patologías autoinmunes como la enfermedad de Crohn.

Justamente debido al interés en la enfermedad de Crohn se investigó el origen evolutivo del gen IRGM humano, encontrándose una sorpresa: este gen se murió hace unos 50 millones de años, pero resucitó en los primates hace unos pocos millones de años. Pero empecemos por el principio.

La multiplicación de los panes… y los genes

En los algunos mamíferos, como los ratones y los perros, el gen IRGM aparece por triplicado, con variantes muy semejantes entre sí (pues sí, como la santísima trinidad). Estos genes se originan mediante una multiplicación previa del gen original, evolucionando posteriormente cada uno de ellos por separado. A este tipo de genes semejantes en una misma especie se les denomina parálogos. Posteriormente, dos de estos genes se desactivaron debido a mutaciones, como se observa por ejemplo en el lémur ratón gris, y al final se contrajeron en un solo gen.

Ilustración de los genes IRGM en el perro, ratón y lémur ratón gris. En verde los genes activos, en rojo los pseudogenes (no activos), y en naranja genes que no codifican proteínas funcionales. En el lémur se observa que ya solo queda un gen IRGM funcional. Esta imagen ha sido adaptada de la figura 1 del artículo de Bepken et al, PLoS Genetics, 5 (3) 2009. Para información sobre el significado de otros colores, consultar la fuente original.

Pasión y muerte de un gen

Todo iba bien hasta que algo ocurrió hace unos 50 millones de años (vamos, anteayer). Fue entonces cuando a una secuencia de ADN pizpireta y saltarina (ALU, muy conocida por los genetistas por su propensión a autorreplicarse en distintos genes) se le ocurrió insertarse en la secuencia del gen IRGM.

Código genético. Cada codón (triplete de nucleótidos) leído desde el interior hacia el exterior se traduce al aminoácido que se indica en el exterior (abreviatura de una letra, abreviatura de tres letras y nombre del aminoácido, del exterior hacia el interior, respectivamente). Además, un codón codifica el inicio de la lectura (ATG) y otros tres el final de la misma (TAA, TAG y TGA).

Pero para entender qué pasó es necesario hacer un pequeño paréntesis y explicar un poco cómo funciona el paso de ADN a proteínas. El ADN está formado por una combinación de cuatro nucleótidos distintos, que se etiquetan según la base nitrogenada que contienen — adenina (A), timina (T), guanina (G) o citosina (C). Estos nucleótidos, leídos de tres en tres (los denominados codones), se convierten en un aminoácido concreto de la proteína en construcción, según un determinado código genético. Fíjate en que hay unos codones que se encargan de codificar el inicio de la lectura (ATG, que también se convierte en el aminoácido metionina) y de su final (TAA, TAG y TGA).

Para que se pueda sintetizar la proteína a partir del ADN (con un paso previo por ARN que no es importante para esta explicación) el orden de lectura ha de ser el adecuado, es decir, las enzimas que leen el ADN han de empezar por el primero de los nucleótidos de un codón correcto. Piensa que existen tres formas de lectura en función de cuál es el primer nucleótido empezando por un extremo de la cadena de ADN, más tres formas de lectura por el otro lado; son los denominados marcos abiertos de lectura — en inglés, open reading frames (ORF). Si tiene lugar un borrado o inserción en el gen (o las cercanías de este) puede cambiar el marco de lectura, por lo que la proteína obtenida no sería la correcta. Espero que puedas entender bien este punto a partir de la siguiente figura.

Marco abierto de lectura (open reading frame). En la figura se muestra como la inserción de un nuevo nucleótido en una cadena de ADN cambia el marco de lectura, por lo que la proteína obtenida es completamente distinta. Lo mismo ocurre en un borrado de nucleótidos, o en mutaciones puntuales (en este caso, pueden cambiar los codones de inicio o fin del gen).

Una vez hecho este paréntesis, volvamos a nuestro gen IRGM. Como decía, hace unos 50 millones de años se insertó en un punto anterior a la secuencia de este gen una secuencia ALU. Esto provocó un desplazamiento del marco de lectura que convirtieron al IRGM en un gen no funcional (denominados pseudogenes). Además, en algunas especies este desplazamiento vino agravado por desplazamientos del marco adicionales debidos a inserciones o borrados y/o por un truncamiento del gen. Por ejemplo, en el caso del mono Rhesus (Macaca mulatta) aparece un desplazamiento de marco seguido por un codón de terminación (TGA). Además, el gen se acorta a más de la mitad.

Representación del gen IRGM en el mono Rhesus con la secuencia ALU (en amarillo). Se incluye el gen equivalente del lémur ratón gris por comparación. FS (frameshift) hace referencia a un desplazamiento del marco de lectura y TGA es un codón de terminación.

Y al tercer día, resucitó

Bueno, no exactamente. La resurrección tuvo lugar hace unos 10 o 20 millones de años, y tuvo como actor principal a otro conocido del ADN humano: el retrovirus endógeno ERV9. Sí, he dicho un virus. Los retrovirus endógenos se caracterizan por insertarse en el ADN de las células huésped, lo cual no supone ningún problema a menos que lo hagan en células que participan en la generación de células sexuales, en cuyo caso se transmiten a su descendencia. Esto es tan habitual en el caso de los humanos, que este tipo de virus compone cerca del 8% de nuestro ADN.

En el caso del gen objeto de este artículo, se observa la presencia del virus ERV9 en el gen IRGM de una gran variedad de primates y en el ser humano. La inserción de este virus en la zona del gen anterior a la secuencia ALU pudo restaurar el marco de lectura correcta, haciendo de nuevo funcional el gen.

Gen IRGM humano con las secuencia ERV9 en negro. El gen del mono Rhesus se muestra para comparación. Los detalles de otras etiquetas y colores se dan en figuras previas.

Por último, y para tener un visión general de la evolución de este gen, aquí tienes una visión general de toda su historia. ¡Ah! Y si te apetece escribir algún comentario, puedes hacerlo buscando los signos ‘+’ que se encuentran a la derecha de cada párrafo.

Imagen con la evolución completa del gen IRGM humano. Imagen tomada de Bepken et al, PLoS Genetics, 5 (3) 2009 (Creative Commons).

Referencias

  • Bekpen C, Marques-Bonet T, Alkan C, Antonacci F, Leogrande MB, et al. (2009) Death and Resurrection of the Human IRGM Gene. PLoS Genet 5(3): e1000403. doi:10.1371/journal.pgen.1000403.
  • Bekpen C, Xavier RJ, Eichler EE (2010). “Human IRGM gene “to be or not to be”.”. Semin Immunopathol 32 (4): 437–44. doi:10.1007/s00281-010-0224-x. PMID 20737271.

--

--

Guillermo Peris
El blog de Melquíades

Aprendiendo a divulgar ciencia y desmontar pseudociencias. A veces escribo cuentos. Y a veces bailo. Cientifista (eso me dicen).