Идентичность и кроссинговер

Andrey Pshenichnov
7 min readJul 14, 2019

--

Winter solstice I” by Dferous

Вскоре после зимнего солнцестояния 2018 года вышла моя статья про обновляющийся вид. Я пообщался с друзьями и понял, что статья тяжёлая для восприятия, к ней нужны дополнительные пояснения.

«Идентичность и кроссинговер» — статья-объяснялка с картинками про коалесценцию линий (lineage coalescence) и последнего общего предка (MRCA, most recent common ancestor) в скрещивающихся популяциях. Без претензии на новизну, я привожу ряд интересных выводов из теории коалесценции самым простым языком, на который я способен.

На примере людей я расскажу, почему у скрещивающихся форм не может быть последнего общего предка (MRCA) как особи. Что у них много MRCA для разных кусков генома, которые жили в разное время. MRCA можно выделить только на уровне сущностей, которые воспроизводятся с сохранением идентичности потомка предку (то есть — путём полного самокопирования, без кроссинговера).

Если вы знаете, что такое рекомбинация и митохондриальная Ева, то, я надеюсь, вы всё поймёте. А потом вам будет проще понять идею обновляющегося вида.

Идентичность по происхождению и MRCA

Эволюционная биология опирается на генетические механизмы наследственности и изменчивости. Мы понимаем механику эволюции для сущностей, которые воспроизводят идентичные копии себя (наследственность) с некоторой долей изменений, мутаций (изменчивость).

Бесполые организмы копируют свой геном целиком, чтобы передать его потомку. Потомка можно идентифицировать с одним конкретным предком. В итоге эволюционные механизмы дрейфа и отбора действуют на уровне «целых геномов». У всех рецентных организмов когда-то был последний общий предок (MRCA), конкретное существо, геном которого теоретически можно реконструировать.

У скрещивающихся (типа нас) организмов такого нет: любой из нас не может быть идентифицирован только с мамой или только с папой, является не чьей-то «копией с небольшими изменениями». Уже к следующему поколению, при формировании половых клеток, наш геном снова будет разрушен кроссинговером. Время существования сингамных геномов крайне ограничено.

Зато идентичность по происхождению есть на уровне отдельных фрагментов ДНК. Каждая небольшая часть нашего генома идентична по происхождению с частью генома либо мамы, либо папы, без перемешивания. Так что механизмы эволюции на основе наследственности и изменчивости в скрещивающихся популяциях действуют не на уровне «популяций геномов», как у бесполых организмов, а на уровне пулов фрагментов ДНК.

В конечном счёте это значит, что у популяции скрещивающихся организмов не может быть одной или двух особей-MRCA. Разбираемся, почему это так и что у скрещивающихся вместо таких MRCA.

Нерекомбинантные участки в геномах скрещивающихся организмов

Идентичность по происхождению и MRCA в сингамных геномах можно определить для фрагментов, которые передаются от родителя к потомку целиком без разрушения рекомбинацией — назовём их нерекомбинантными. Сам такой участок может рекомбинировать с соседними фрагментами, с которыми находится на одной хромосоме, а также со всеми генами в других хромосомах.

Самые популярные примеры нерекомбинантных фрагментов у людей — это мтДНК и нерекомбинирующая часть Y-хромосомы (NRY, названная так, потому что она не рекомбинирует с X-хромосомой перед образованием сперматозоидов).

Протяжённые нерекомбинантные участки существуют и в аутосомах, и в X-хромосомах. Такой аутосомный участок человек получает в двух экземплярах, по одному от каждого родителя. Между этими экземплярами не происходит рекомбинации при образовании гаплоидных половых клеток, просто в каждую половую клетку случайным образом попадает один из вариантов. Аналогичная ситуация с X-сцепленными генами у женщин.

Рецентное разнообразие каждого нерекомбинантного участка можно проследить до его MRCA, последнего общего предка. Любой прямой предок MRCA тоже являются общим предком всех рецентных форм.

MRCA нерекомбинантных участков:

  • Все мтДНК людей сходятся к MRCA-мтДНК. MRCA-мтДНК находилась в митохондрии, которая находилась в женщине, которую принято называть митохондриальной Евой. Считается, что мтЕва жила 120–156 тыс. лет назад.
  • Все Y-хромосомы людей сходятся к MRCA Y-хромосомы. Мужчину, который был носителем этой Y-хромосомы, называют Y-хромосомным Адамом, который жил 200–300 тыс. лет назад.
  • С любым конкретным аутосомным или X-сцепленным нерекомбинирующим локусом будет та же история. Все его варианты будут сходиться к одному MRCA, который существовал в некоем человеке, причём не Y-Адаме и не мтЕве. Для каждого такого локуса есть свой человек, который жил в своё время и в своём месте. Я не слышал, чтобы кто-то давал им имена (хотя чем они хуже?) Сколько таких фрагментов вы изучите, столько имён вам придётся придумывать.

Что же тогда такое MRCA всех людей?

MRCA всех людей

— это не особь. У скрещивающихся организмов просто теоретически не может быть MRCA как целостного организма. Объясню с картинками.

Представим себе ооочень простую модельную популяцию со скрещиванием. В ней всё будет настолько просто, мы сможем уложить в голове историю каждого нерекомбинирующего фрагмента.

Рисунок 1. Модельный организм и его диплоидный геном
Рисунок 1. Модельный организм и его диплоидный геном

Организм

  • Размножается скрещиванием.
  • Мы исследуем организмы в диплоидной фазе, когда их геном состоит из двух наборов генов.
  • Каждый набор генов — всего из трёх нерекомбинирующих участков (т.е. внутри них не происходит рекомбинация): α, β и γ.
  • α, β и γ свободно рекомбинируют между собой: потомок особи на картинке унаследует от неё любой из 2×2×2=8 возможных рекомбинантных наборов генов α, β и γ: 1–1–1, 1–1–2, … , 2–2–2.

Популяция таких организмов на протяжении многих-многих поколений состоит всего из двух особей. Мы рассмотрим 4 исторических момента:

Рисунок 2. Четыре поколения, которые мы рассматриваем

Филогенетические древо фрагмента α, на котором отображается его история.

Рисунок 3. История аллелей локуса α

Поколение (−B) — это момент коалесценции всех существующих в нынешнем поколении вариантов аллеля α к их MRCA. Я покрасил все рецентные α и их прямых предков в одинаковый салатовый цвет. Но это не значит, что они генетически идентичны. За поколения с момента MRCA(α) линии наверняка словили ещё несколько мутаций по сравнению с MRCA, так что рецентные варианты могут отличаться от MRCA. Цвет просто обозначает принадлежность к одной ветке филогенетического древа, происходящей от MRCA и некоторого количества его прямых предков.

В поколениях (−A), (−B), (−C) существуют и другие варианты α, не дошедшие до нынешнего поколения (другие оттенки зелёного). В более ранних поколениях, не попавших в наш перископ (ранее −C), эти варианты коалесцируют и с MRCA(α).

История фрагментов β и γ: всё то же самое, только MRCA для β и γ — в других поколениях.

Рисунок 4. История аллелей локусов β и γ

Всё на одной картинке: MRCA для трёх фрагментов попадают в самые разные поколения.

Рисунок 5. Все истории на одной картинке

Если мы ожидаем, что MRCA — это некая особь, у которой α, β и γ представлены MRCA-аллелями, то такой особи не может быть. В нашем примере на рис. 5 MRCA трёх фрагментов просто не оказались в одном поколении, тем более — в одном организме.

В реальных сингамных геномах из тысяч и миллионов рекомбинирующих фрагментов, в популяциях с численностью, которая исторически не опускается ниже десятков особей, практически невероятно, чтобы в прошлом существовала особь-MRCA всей рецентной популяции в указанном смысле — когда все нерекомбинирующие участки её генома представляют собой соответствующие MRCA.

Случается, что популяции оснует пара особей (приносит до 4 аллелей в каждом аутосомном локусе) или одна гермафродитная особь (приносит до 2 аллелей в каждом аутосомном локусе). Пример основания парой — это рис. 5, просто представьте себе, что наверху изображены два основателя.

При таком основании можно говорить об одном или паре особей-общих предков всей популяции. Но «общий» и «последний общий» — большая разница.

  • В каждом локусе MRCA для 2–4 привнесённых аллелей будет находиться в прошлых поколениях популяции, из которой пришли основатели, а не в геноме основателей. Так что для некоторых локусов MRCA будет «попадать» в более ранний момент, чем поколение основателей.
  • Часть фрагментов ДНК основателей окажется не представлена уже в первом поколении потомства, будет потеряна за счёт генетического дрейфа. Так что геномы основателей состоят не только из фрагментов, ставших предковыми для геномов рецентной популяции, но и «исторического мусора».
  • Чем дальше от момента основания, тем больше нерекомбинирующих участков будут иметь MRCA в более позднем поколении, чем основатели. Какой-либо аллель основателя будет предком этого MRCA.

Два основателя на рис. 5 несут только один MRCA — синий. Остальные фрагменты, салатовый и красный — просто common ancestors.

В общем случае, невероятно, чтобы геномы основателей представляли собой исключительно MRCA-аллели.

Нет общей истории, только частные

MRCA в сингамной популяции не может быть конкретной особью или парой особей-основателей. Идентичность геномов по происхождению разрушается кроссинговером в каждом поколении, и MRCA имеет смысл определять только для отдельных нерекомбинирующих фрагментов, а не для всего генома. MRCA-фрагменты существовали в разных организмах, живших в разное время в прошлом.

Теоретически идея MRCA применима хотя бы к популяциям бесполых организмов. Но в реальных популяциях происходит интенсивный горизонтальный перенос генов (ГПГ). Его эффект с точки зрения истории нерекомбинирующих участков генома такой же, как эффект от кроссинговера в сингамных популяциях: для всего генома бесполого организма так же невозможно указать одного MRCA, как для всего генома сингамных организмов. Впрочем, пока речь о долях процентов генома, принято игнорировать ГПГ и считать «главной» филогению основного генома. Роскошь, которую мы, скрещивающиеся, с нашим ГПГ в виде кроссинговера в каждом поколении, не можем себе позволить.

Что дальше

Если что-то непонятно или некорректно — пишите в комменты или мне на почту pxemon@gmail.com. Я буду рад критике и обратной связи и постараюсь сделать выкладки понятнее, проапдейтить статью.

Если вам всё понятно и вы убедились, что в сингамных популяциях не было MRCA как отдельной особи, вам будет проще понять концепцию обновляющегося вида, общее популяционно-генетическое определение вида для скрещивающихся и бесполых организмов. Это расширение биологической концепции вида Майра, основанной на скрещивании. В новой формулировке концепция применимая и для скрещивающихся, и для бесполых организмов.

--

--