Полное секвенирование Y-хромосомы позволило генетически проверить генеалогическое дерево, а также вычислить скорость мутаций и предположить направление миграций

Статья российских генетиков с коллегами из Казахстана и других стран, опубликованная 7 апреля в журнале PLoS ONE, показывает, какие возможности открываются перед популяционной генетикой благодаря применению современных методов. Если раньше ученые исследовали отдельные генетические вариации, например, в Y-хромосоме или митохондриальной ДНК, то теперь ту же Y-хромосому можно полностью секвенировать. И в результате, гораздо глубже заглянуть в историю человеческих популяций, которая записана в генах.

В данной работе, которая проведена под руководством доктора биологических наук Олега Балановского, руководителя лаборатории геногеографии Института общей генетики РАН, и доктора биологических наук Елены Балановской, руководителя лаборатории популяционной генетики Медико-генетического научного центра, предметом исследования стала гаплогруппа Y-хромосомы G1.

Прежде всего, поясним, что это такое. Гаплогруппа, это группа гаплотипов общего происхождения. А гаплотип — это генетический вариант, имеющийся на одной хромосоме (поэтому «гапло»). Этот вариант может отличаться от других по определенным нуклеотидам в каких-либо участках ДНК (это однонуклеотидный полиморфизм, SNP). А может — количеством повторов коротких последовательностей в других участках ДНК (это короткие тандемные повторы, STR). От одних гаплотипов возникают другие в результате мутаций. Гаплогрупа объединяет гаплотипы, которые когда-то произошли от общего предка. Существует общепринятая классификация гаплогрупп Y-хромосомы и митохондриальной ДНК, которые представляют собой очень удобный инструмент для изучения генетического разнообразия популяций.

Y-хромосомная гаплогруппа G1 (в отличие от R1a, о которой в последнее время много говорится) до сих пор не слишком привлекала внимание генетиков. Причина в том, что на большей части территории планеты она совсем не встречается, а в других регионах ее частота невелика. Но зато в некоторых популяциях Юго-Западной и Центральной Азии она достигает частоты 80%.

Дерево из пяти ветвей

Российские исследователи с участием коллег из Казахстана и других стран изучили распространение гаплогруппы G1 в 27 популяциях Евразии. Проведя генетический анализ 5346 мужчин, они нашли ее у 367 человек, и у этих носителей стали изучать дальше. Для этого они применили как традиционные, так и новые методы, то есть исследовали разнообразие гаплогруппы G1 по однонуклеотидному полиморфизму (SNP) и коротким тандемным повторам (STR), а кроме того полностью секвенировали ее у 19 человек. Сама процедура секвенирования (чтение нуклеотидной последовательности) проходила на базе американской компании, но для обработки данных российские специалисты разработали и собственный алгоритм.

Карта распространения гаплогруппы G1. Черными т...

Карта распространения гаплогруппы G1. Черными точками обозначены популяции, для которых известна частота этой гаплогруппы, на остальных территориях показаны интерполированные значения. Справа приведена цветовая шкала частот.

Использовав свои данные и данные из литературы, исследователи построили детальную карту распространения гаплогруппы G1. Как показывает карта, гаплогруппа G1 встречается на обширной территории, но высокой частоты достигает в ограниченном ареале, включающем центральноазиатские степи, Иранское нагорье и Армянское нагорье. Два пика частоты наблюдаются на противоположных частях этого ареала — в степях Северного Казахстана (до 80%), и в горах Армении (до 42%).

По разнообразию STR-гаплотипов авторы построили сеть гаплогруппы G1, в которой четко выделились узлы — группировки по сходству — генетики называют их кластерами. Это казахский кластер, два армянских и башкирский. Выяснилось, что во всех трех этносах носители гаплогруппы G1 принадлежат к определенным родам — у казахов это аргыны, у армян амшены, у башкир — канглы.

Обработав данные по полному секвенированию Y-хромосомы, ученые построили дерево гаплогруппы G1, ветви которого обозначают родственные связи между ее погдруппами (субкладами). На этом дереве четко выделяются три больших ветви, соответствующие ранее найденным кластерам (казахская, армянская, башкирская). Кроме того, имеются еще индийская и монгольская ветви, это выявилось благодаря тому, что исследователи помимо собственных данных использовали данные проекта «1000 геномов» по другим популяциям.

Генетика подтвердила генеалогию

Один из наиболее интересных результатов работы состоит в том, что ученым удалось напрямую сопоставить генетические данные с историческими источниками по казахским родам. На основе полностью секвенированных Y-хромосом девяти казахов — носителей гаплогруппы G1 они построили филогенетическое дерево (рисунок), которое показывает родственные связи между всеми вариантами гаплогруппы.

А затем ученые обратились к казахскому эпосу и казахской генеалогии. Род аргынов (к которому и принадлежат носители гаплогруппы G1) по легенде ведет начало от одного человека по имени Аргын. Хотя сам он — личность легендарная, не имеющая подтверждения в исторических источниках, такие подтверждения появляются у его потомков. Правнук Аргына Караходжа — историческое лицо, он упоминается как посланник хана Тохтамыша — предводителя Золотой орды — к Тамерлану в 1405 году. Большинство из рода аргынов считают себя потомками Караходжи, а другие — потомками его брата Сомдыка.

А) Генетическое дерево, построенное по дан...

А) Генетическое дерево, построенное по данным полного секвенирования Y-хромосомы образцов казахов; В) Генеалогическое дерево казахского рода аргынов. Каждый казах, Y-хромосому которого секвенировали, принадлежит к одному из кланов.

Генетическое дерево шести казахов удивительно точно совпало с из генеалогическим деревом аргынов. Те шесть гаплотипов, которые сформировали первую группу на генетическом дереве, как раз принадлежат тем казахам, которые считают себя потомками Караходжи, а вторая группа из трех казахов, по генетическим данным происходящих из другого, но близкого корня, считает себя потомками Сомдыка. Таким образом, легенда получила биологическое подтверждение, а легендарные предки стали генетическими предками.

Скорость мутаций

Ученые сделали и еще один, чрезвычайно важный для науки шаг. Имея в распоряжении исторические датировки (в частности, о времени жизни Караходжи), они откалибровали по времени генетические данные по полному секвенированию и на основании их вычислили скорость мутирования Y-хромосомы. Скорость мутирования — это показатель, о который сломано немало копий в научных и околонаучных кругах. Всем хочется точности датировок, а «молекулярные часы», отсчитывающие время по количеству мутаций, идут, к сожалению, не так точно, как того бы хотелось.

Авторы исходили из того, что Караходжа, вероятно, стал отцом около 1385 года, а время рождения его самого и его брата примерно на 30 лет раньше (30 лет — средняя длина мужских поколений). Средняя дата рождения ныне живущих казахов, участников исследования, пришлась на 1982 год. Таким образом, наблюдаемые на дереве мутации накапливались с 1355 по 1982 годы, то есть в течение 627 лет. Авторы учли также общую длину Y-хромосомных сегментов, секвенированных в каждом образце (9972660 нуклеотидов), и среднее число мутаций у каждого ныне живущего представителя рода по сравнению с родоначальников (4,89 мутаций). По этим исходным данным они вычислили скорость мутаций в изученном участке Y-хромосомы. Скорость составила 0,78×10-9 на нуклеотид в год (то есть каждый год с вероятностью 0,78 мутирует каждый миллиардный нуклеотид).

Эту скорость исследователи назвали «клановой», они подчеркивают, что она протестирована лишь на определенном временном промежутке (в несколько веков), но может оказаться очень полезной там, где археологи не совсем уверены в датировках.

К вопросу о прародине индоевропейцев

Что же до распространения гаплогруппы G1, то ее анализ может помочь разобраться в истории миграций групп населения. Дело в том, что ареал гаплогруппы G1 хорошо совпадает с ареалом проживания ираноязычных популяций во втором и первом тысячелетиях до н.э. Миграция ираноязычных популяций между центральноазиатскими степями и возвышенностями Юго-Западной Азии — это ключевой вопрос в поиске прародины индоевропейцев. В соответствии с курганной гипотезой, носители иранских языков распространились с территории евразийских степей на территорию современного Ирана. Альтернативная анатолийская гипотеза помещает прародину индоевропейцев в восточную Анатолию, предполагая, что ираноязычные популяции именно оттуда мигрировали в степи.

Карта гаплотипического разнообразия гаплогруппы...

Карта гаплотипического разнообразия гаплогруппы G1. Черными точками обозначены популяции, для которых эта величина была вычислена. Степень разнообразия соответствует цветовой шкале справа.

Вопрос возникает в том, где прародина гаплогруппы G1 — горы или степи. Намного большее разнообразие ее в западной части Иранского и Армянского нагорий делает горную прародину более вероятным кандидатом. Это соотносится с анатолийской гипотезой возникновения индоевропейцев. Но сама по себе гаплогруппа G1 не может служить маркером распространения индоевропейцев, поскольку при любой миграции перемещается часть популяции, состоящая из носителей разных гаплогрупп. Авторы подчеркивают, что ее можно рассматривать только как генетический компонент, принесенный волной ираноязычной миграции, двигающейся на север к степям Евразии.

«Это всего лишь второй случай, когда полное секвенирование Y-хромосомы позволило проследить историю отдельной гаплогруппы, — сказал первый автор статьи доктор биологических наук Олег Балановский. — Первый раз это было в исследовании гаплогруппы R1a у популяции евреев ашкенази. Замечательно также то, что генетические данные в нашей работе совпали с генеалогическими, и это позволило вычислить скорость мутирования».

Более подробный текст о данном исследовании читайте на сайте Генофонд.рф