Восстановление днк предков из других источников 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Восстановление днк предков из других источников



 

Небольшое количество компаний работает над восстановлением ДНК с конвертов, старых марок, расчесок и других реликвий. Хотя был достигнут некоторый ограниченный успех, я не думаю, что есть какие-либо готовые для потребителей услуги, но это может стать реальностью в будущем.

 

Опять же, поможет ли это как в анализе Y-ДНК, так и в анализе аутосомной ДНК или только в одном из двух, пока неизвестно, но это потенциально захватывающая новая разработка. Так что пока что не выбрасывайте эти реликвии!

 

Другие стратегии тестирования - Y-ДНК-тестирование ваших известных родственников

 

Я уже сказал, что обычно сам не защищаю это, потому что мой главный интерес заключается в разгадывании генеалогических загадок, и я уже знаю, как я связан с моими известными родственниками; и тестирование близких родственников также совершенно не поможет вам понять вашу генеалогию в более ранние сроки.

 

Но все же есть причины, по которым вы можете попросить своих известных родственников также проверить их Y-ДНК. Вот некоторые из наиболее распространенных:

 

· Картирование генетических мутаций в вашей известной семье; часто в наследство для будущих поколений, у которых не будет доступа к людям, живущим сегодня;

 

· Или получение имен ваших неназванных SNP и добавление ваших частных SNP в общедоступное гаплотерево Y-ДНК. Некоторые люди находят это более полезным для своего анализа (потому что, по сути, тогда компания, управляющая общедоступным гаплотеревом Y-ДНК, либо выполняет анализ ветвления за вас, либо, по крайней мере, подтверждает анализ, который вы уже сделали. Но тест результаты на самом деле не меняются только потому, что SNP получают имена, и компания помещает их в свое общедоступное гаплотерево Y-ДНК; если вы не против провести собственный анализ или уже имеете доступ к опытному аналитику Y-ДНК, потратите деньги на проверять своих знакомых родственников может не стоить.

 

 

Другие стратегии тестирования - анализ Y-ДНК по другим отцовским линиям

 

Многие люди просто проверяют себя или своих ближайших родственников мужского пола, чтобы найти в Y-ДНК ключи к их собственной отцовской линии, но Y-ДНК, безусловно, может помочь исследовать любую родовую линию, для которой все еще есть потомки мужского пола, которые могут предоставить Y-ДНК.

 

Рис. 12-9. Сколько отцовских линий вы можете протестировать (один даже не показывает потомка!)?

 

 

Ваша мужская родословная, конечно же, включает гораздо больше родовых линий, чем только ваша отцовская линия; он включает в себя отцовские линии вашей матери, бабушек и всех других ваших предков (на самом деле у вас есть 2 (N-1) отцовские линии на каждые N поколений в вашей родословной!). Это дает вам сотни линий Y-ДНК, по которым вы можете проследить буквально за последние несколько сотен лет. Хотя многие люди, конечно, очень эффективно используют Y-ДНК, чтобы узнать больше о своей отцовской линии, она может быть полезным инструментом для любой родовой линии, у которой все еще есть потомки мужского пола.

 

Уловка, конечно же, заключается в том, чтобы найти этих мужчин для тестирования. Самые близкие вам, вероятно, известны - ваши отцы, братья, дяди, двоюродные братья и сестры, даже деды или двоюродные дедушки и так далее. Но за пределами, возможно, 2 - й кузенов многие люди не знают всех своих более дальних родственников, так что вы, возможно, придется сделать некоторые исследования на потомков ваших более далеких предков, чтобы идентифицировать живых людей, которые до сих пор несущие линии Y-ДНК, которые вы увлекающийся.

 

Аутосомное ДНК-тестирование может быть мощным инструментом для поиска этих дальних родственников мужского пола, по крайней мере, в пределах от 4- го до, возможно, 5- го кузена (иногда и дальше, но не всегда). Ищите аутосомные совпадения, которые несут интересующие вас фамилии (если фамилии применимы), или составьте карту генеалогий ваших аутосомных совпадений, чтобы найти дальних потомков правильных предков и посмотреть, есть ли у них родственники мужского пола, которые соответствовали бы Y-ДНК строки, которые вы ищете.

 

РАЗДЕЛ ТРЕТИЙ

 

 

Y-ДНК: помимо основ

 

 

 

 

13. Генетика STR и SNP

 

Уровень: Продвинутый

Консультации по математике / науке: GN (некоторая генетика), M (некоторая математика)

Предлагаемое предварительное чтение: главы 5. 6.

 

 

я

Если вы генетик или хотите им стать, возможно, вам будет очень интересно начать эту главу, особенно если вы прочитали все разделы первый и второй, где я оттолкнул вас и пообещал, что затрону некоторые темы генетики в Разделах 3 и теперь вы готовы к хорошему.

 

Что ж, тогда приготовьтесь к дальнейшему разочарованию.

 

Весь третий раздел по-прежнему написан для специалистов по генетической генеалогии и значительно упрощает совокупное знание жизненной работы многих генетиков, на самом деле, вероятно, настолько упрощает его, что, вероятно, вынудит тех же генетиков броситься и утопить свои печали в ведре. Кровавой Мэри. Если вы действительно интересуетесь генетикой Y-хромосомы на уровне генетика, пожалуйста, остановитесь здесь и поищите более подходящий справочный материал для ваших интересов (хотя, если вы действительно заинтересованы в том, чтобы стать генетиком, вероятно, ведро Кровавой Мэри в любом случае хорошо иметь под рукой).

 

Для всех, кто читает этот Раздел третий, я заключу сделку - я обещаю, что буду держать генетику на очень высоком уровне и опишу только то, что поможет вам понять ее с точки зрения генетической генеалогии, если вы Обещай вместе со мной сделать вид, что именно поэтому я даю вам только обзор, и это абсолютно не потому, что я совершенно не в состоянии описать это более подробно, чем это.

 

Итак, сразу переходя к основам ДНК, мы можем начать с того места, где снова начинается почти каждое объяснение ДНК в генетической генеалогии, за исключением того, что здесь мы говорим только об Y-хромосоме, которая, как и все другие ДНК, состоит из двойной спирали, где две нити спирали соединены парами нуклеотидов в нескольких положениях по их длине. Каждая пара нуклеотидов называется парой оснований, и каждый нуклеотид включает одно из четырех различных азотистых оснований: тимин, цитозин, аденин или гуанин, сокращенно T, C, A или G.

 

 

Рисунок 13-1. Нуклеотиды вдоль двойной спирали ДНК.

 

 

У каждой базы есть определенный комплемент или партнер - G партнером C, а T партнером A - и каждая пара оснований всегда состоит из одного из четырех оснований и его партнера, поэтому мы можем описать цепь ДНК уникальным образом, перечислив только одна из его цепей (например, GAAGCTCCGAA… на рис. 13-1), потому что другая цепь является просто нуклеотидами-партнерами этой последовательности. Для этой цели всегда выбирается одна из двух нитей двойной спирали, называемая «шаблонной» или «кодирующей» цепью. Поэтому, хотя мы называем позиции «парами оснований», мы приводим их примеры, перечисляя одну последовательность букв с буквами G, C, T или A вместо каждой позиции «пары оснований».

 

Генетика коротких тандемных повторов (STR)

 

Короткие тандемные повторы встречаются в определенных положениях вдоль Y-хромосомы, где шаблоны оснований повторяются. Эти повторяющиеся паттерны различаются по количеству и типу оснований, и когда происходит мутация, повторы обычно либо добавляются, либо удаляются.

 

Например, рассмотрим цепь ДНК, которая содержит STR, показанную на рисунке 13-2.

 

 

Рисунок 13-2. Пример цепи ДНК с 4-мя повторами STR.

 

В этом примере мы бы сказали, что значение аллеля STR равно 4.

 

Если бы это произошло с мужчиной, у которого были сыновья и внуки (и если бы STR был очень быстро мутирующим), результаты могли бы выглядеть как на рис. 13-3.

 

 

Рисунок 13-3. Как STR может мутировать.

 

 

На рис. 13-3 STR мутировал с 4 на 5 в Сыне 1, но остался 4 в Сыне 2. Сын 1 затем передал значение 5 своему Внуку 1a, но маркер снова мутировал до 6 у Внука 1b. Эта STR также могла легко мутировать вниз; пример показывает только два случая восходящей мутации.

 

Затем во время теста Y-ДНК эти позиции считываются и сообщаются для многих STR из разных частей Y-хромосомы. Примером может служить рисунок 13-4, где первые три маркера показаны в цепи ДНК (с меньшими номерами для простоты примера), а повторы подсчитаны и представлены в виде полного «гаплотипа» или полного набора сообщили значения аллеля STR.

 

Рисунок 13-4. Сообщение о нескольких СПО.

 

STR Microalleles

 

В некоторых отчетах об испытаниях Y-ДНК вы можете увидеть значения аллелей для определенных STR, представленные в нечетном формате; вместо обычных чисел они будут представлены в виде числа, за которым следует десятичная точка с буквой или цифрой после нее, например «10.g» или «4.1». Это микроаллели (также называемые микровариантами), которые представляют собой дополнительные мутации внутри самого STR. См. Рисунок 13-5 с примерами микроаллелей.

 

 

Рисунок 13-5. Микроаллели могут возникать в результате различных типов мутаций в STR.

 

 

Согласно примеру на рисунке 13-5, если исходный шаблон повторения STR был «CTA» и произошла замена «CTG», этот STR мог бы быть сообщен как «4.g» вместо просто «4». Также могут происходить удаления и вставки, которые могут привести к тому, что STR будет сообщаться как «4.1» или «4.2».

 

Различные тестирующие компании непоследовательно сообщают о микроаллелях - в некоторых отчетах тестирования они удаляются (и поэтому для всех примеров на Рисунке 13-5 будет просто указано «4»), а в другие отчеты тестирования от другой тестирующей компании они могут быть включены. Хотя они действительно представляют собой мутации, неизвестно, ведут ли они себя так же, как повторы STR, или достаточно надежны для использования в генетической генеалогии. По этим причинам они обычно игнорируются в текущем анализе Y-ДНК (и поэтому часто исключаются из отчетов об испытаниях). На данный момент микроаллели представляют собой возможный источник дополнительных данных, которые могут оказаться полезными в анализе Y-ДНК в будущем.

 

Наборы STR - Набор Family Tree DNA 111

 

На заре тестирования Y-ДНК эта группа STR была первой последовательно собранной и последовательно сравниваемой группой мутаций, и она до сих пор остается наиболее изученной из групп STR, доступных для анализа Y-ДНК. Эти СПО также в настоящее время представляют собой наиболее последовательный набор данных о мутациях, доступных для всех мужчин, протестировавших свою Y-ДНК, поэтому, если компании сообщают о каких-либо СПО, они обычно сообщают о максимально возможном их количестве.

 

Более десятка различных исследований рассчитали или оценили частоту мутаций по крайней мере для подмножества этих STR, а любители собрали по крайней мере 6 различных полных наборов, так что вы иногда будете видеть дискуссии между людьми, которые знают частоту мутаций, о том, какой набор лучше; обычно относится к наборам частоты мутаций по имени первого ученого в конкретном опубликованном исследовании: Хейнила, Литтл, Чандлер, Клёсов, Бургарелла, Баллантайн или Макдональд (или другие). Хотя сами скорости мутаций действительно различаются между исследованиями, ранжирование этих STR от более быстро мутирующих к более медленным мутациям остается относительно постоянным. CDYa / b, DYS710 и DYS712 последовательно оцениваются как маркеры с самой быстрой мутацией с самой высокой частотой примерно одной мутации каждые 850 лет, а DYS472, DYS632, DYS435 и DYS578 последовательно оцениваются как маркеры с самой медленной мутацией с самой медленной. частота примерно одной мутации каждые 3 000 000 лет.

 

В главе 5 я перечислил всю группу из 111 STR на рисунках 5-5a, 5-5b и 5-5c, а также (для простоты) разбивку скорости мутации каждого маркера на шесть категорий: очень медленные, медленные, Средне-медленно, Средне-быстро, быстро и очень быстро. Это было задумано как удобный справочник для перекрестной проверки мутации, которая может показаться особенно полезной в определенной группе наборов.

 

111 STR обычно разбиваются на четыре подгруппы на основе вариантов тестирования, составляющих основную часть подходящих баз данных: 12, 37, 67 и 111 маркеров. Сравнение этих подгрупп с точки зрения частоты мутаций выглядит следующим образом:

 

· Для сравнения, первые 12 маркеров относительно медленные; наличие средней скорости мутаций по всем 12 маркерам примерно одной мутации каждые 16 000 лет (приведенные здесь показатели могут незначительно отличаться от других приведенных показателей в зависимости от того, в каком исследовании используется частота мутаций. Приведенные здесь цифры усреднены по всем исследованиям);

 

· Для сравнения, первые 37 маркеров являются наиболее изменчивыми (это означает, что STR 13–37 особенно быстро меняются как группа); наличие средней скорости мутаций по всем 37 маркерам примерно одной мутации каждые 7700 лет;

 

· Первые 67 маркеров в сумме обеспечивают некоторую дополнительную стабильность, имея среднюю скорость мутаций по всем 67 маркерам примерно одной мутации каждые 11000 лет;

 

· И полный набор из 111 маркеров также имеет среднюю скорость мутаций по всем 111 маркерам примерно одной мутации каждые 11000 лет.

 

Приведенные выше цифры означают, что в среднем (но не в каждом случае обязательно) первые 37 маркеров будут иметь больше мутаций, чем полный набор 111 STR, что делает тест Y37 особенно полезным в качестве первого теста для идентификации ветвей, в то время как дополнительные маркеры в наборы от 67 до 111 помогают уточнить решения ветвления.

 

 

Наборы СПО - дополнительная панель 6 и 7 СПО генеалогического древа ДНК

 

В рамках тестов Big Y SNP Family Tree DNA гарантирует получение отчетов о первых 111 STR, которые они называют панелями с 1 по 5. Они также предоставляют до дополнительных 727 маркеров помимо тех, для которых они разработали собственные названия:

 

· Группа 6 STR - это набор из 450 STR, первоначально полученных в результате теста Big Y-500 Family Tree DNA, который в 2018 году был заменен на Big Y-700, который также сообщает о них. Хотя ни ссылочные позиции, ни частота мутаций для этих STR не были обнародованы, из повторных испытаний ясно, что они имеют чрезвычайно низкие частоты мутаций; настолько низкий на самом деле, что мутации по этим маркерам должны быть надежными индикаторами ветвей; фактически было предложено, чтобы эти маркеры, по существу, рассматривались как SNP внутри любой конкретной гаплогруппы.

 

· Группа 7 STR, дополнительные 277 STR, впервые зарегистрированные в тесте Big Y-700. Опять же, ни ссылочные позиции, ни частота мутаций для этих STR не были обнародованы, но собранный опыт тестирования показывает, что эти маркеры мутируют быстрее, чем STR из Панели 6, и, вероятно, имеют в среднем примерно такую ​​же скорость мутаций, как и более медленная половина оригинала. 111 комплектов СПО. Это означает, что STR панели 7 с большей вероятностью предложат ответвления в группе наборов, и их следует рассматривать больше как исходные 111 маркеров, где «STR-сигнатуры» следует считать более надежными с двумя или более не модальными маркерами.

 

Одним из недостатков анализа с использованием этих STR является то, что Big Y-700 не дает достоверных отчетов обо всех потенциальных 727 общих STR, включенных в панели 6 и 7, поскольку технология тестирования NGS не гарантирует надежного отчета обо всех целевых позициях. На практике любой конкретный тест сообщит не менее 589 из этих маркеров (или ДНК Семейного древа повторно запустит тест), в результате чего потенциально до 138 из СПО Панели 6 и 7 остаются незарегистрированными.

 

Это одна из причин, по которой ДНК Семейного древа сообщает об эквиваленте «генетического расстояния» для этих маркеров в отдельной колонке «STR-различия», потому что количество маркеров, которые будут иметь общие два набора, варьируется в зависимости от того, какой из 727 маркеров был сообщается каждым их тестом.

 

Наборы СПО - дополнительные СПО, предоставленные YSEQ

 

Тесты YSEQ Delta и Gamma STR проверяют как минимум 14 дополнительных STR, не включенных ни в одну панель ДНК генеалогического древа. Когда группа мужчин не показывает достаточного разнообразия мутаций среди других наборов STR, это может представлять собой относительно недорогой способ добавить дополнительную информацию к их сравнениям STR Y-ДНК, если достаточное количество группы проверяет эти дополнительные маркеры для изучения их мутаций. среди группы.

 

Наборы СПО - Дополнительные СПО предоставлены YFull

 

YFull сообщает как можно больше STR из файла BAM пользователя, включая весь набор ДНК Семейного древа из 111 маркеров (если они доступны) и большинство, если не все дополнительные STR, предоставленные YSEQ. Они также определили многие СПО групп 6 и 7 ДНК генеалогического древа и также сообщают о них. Их список СПО включает возможность сообщать до 150 дополнительных СПО помимо любого известного набора, хотя некоторые из них могут перекрываться с дополнительными маркерами 6 и 7 панели ДНК семейного древа под разными именами.

 

Это дает еще одно подмножество STR, которые могут идентифицировать общее ветвление внутри группы, хотя полная группа должна иметь файлы BAM и отправлять их в YFull для анализа; поэтому, поскольку файлы BAM обычно создаются с помощью тестов NGS или WGS, YFull STR представляют собой полезный дополнительный набор данных, который реально может дополнить комбинированный анализ SNP и STR для конкретной группы. Опять же, потребуется также достаточное тестирование NGS или WGS среди рассматриваемой группы комплектов, чтобы определить общие ветви из этих дополнительных данных.

 

Таблицы частот STR-аллелей

 

Для любых наборов STR (но чаще для исходного набора 111 из ДНК Семейного древа) администраторы проектов гаплогрупп часто составляют таблицы частот аллелей, как в примере на Рисунке 13-6.

 

 

Рисунок 13-6. Пример части таблицы частот аллелей.

 

Это просто рассчитанные отношения того, как часто значение конкретного аллеля появляется среди членов этой гаплогруппы (обычно среди членов, которые присоединились к конкретному проекту гаплогруппы). Например, если в проекте 1000 участников, и 400 из них имеют значение 18 для маркера DYS456, то частота 18 для DYS456 составляет 40% или 0,4.

 

Таблицы частот аллелей имеют ряд применений, одно из которых - оценить, сколько совпадений конкретного набора, вероятно, будет совпадением из-за конвергенции (или отсутствия расхождения), а не из-за использования общих ветвей. Если набор имеет чрезвычайно распространенный гаплотип для конкретной гаплогруппы, тогда (по определению) больше других наборов будут близки по значениям аллелей, и больше из них будут отображаться как совпадения, независимо от того, являются ли они на самом деле близкими или нет. С другой стороны, «более редкий» гаплотип обычно приводит к меньшему количеству совпадений в целом, и более высокий процент из них с большей вероятностью будет фактическим близким совпадением.

 

Таблицы частот аллелей также могут помочь оценить, является ли «подпись» STR, особенно с одной или двумя STR, более вероятной случайной или действительно указывает на общую ветвь для тех совпадений, которые ее несут. Если значения внемодальных аллелей, составляющих сигнатуру, необычны для основной гаплогруппы набора, то сигнатура с большей вероятностью указывает на общую ветвь.

 

Генетика SNP

 

Не говоря уже о некоторых различиях в положениях Y-хромосомы, о которых я расскажу в главе 15, любая из 57 миллионов позиций в нашей Y-ДНК является потенциальным кандидатом на мутации различных типов.

 

Хотя в генетической генеалогии мы объединяем все эти типы мутаций под общим термином «SNP», это что-то вроде неправильного названия. Точнее, ключевое название для типов мутаций, которые нас интересуют, - это уникальный полиморфизм событий или UEP, что просто означает мутацию, которая считается достаточно уникальной, чтобы, когда она происходит у одного человека, она передается всем его потомкам мужского пола. По сути, это центральный принцип, на котором основано все гаплотерево Y-ДНК и наш анализ ветвления с использованием SNP.

 

«SNP» более точно - это разница в один нуклеотид между двумя мужчинами, которая идентифицирует мутацию. Например, используя ту же цепь ДНК, что и на рисунке 13-3, мы видим на рисунке 13-7, что общий предок начинался с T в определенной позиции (с помощью SNP мы можем сказать, что T является его аллельным значением в этом человек). Сын 2 наследует ту же цепь Y-ДНК и не имеет мутации в этом положении. С другой стороны, у сына 1 была замена T на A, которую он передает обоим своим сыновьям, внуку 1a и внуку 1b. Они, в свою очередь, передадут значение аллеля А своим сыновьям, и таким образом родится гаплогруппа.

 

 

Рисунок 13-7. Мутация SNP, состоящая из замены T на A в Son 1.

Если бы был протестирован только один потомок Сына 1, то этот SNP, по-видимому, был бы частным SNP для этого потомка, и мутация SNP была бы известна только по его ссылочному номеру положения на Y-хромосоме, поскольку еще не было бы известно, где эта мутация произошел. Однако после того, как два или более потомка протестируют и определили его как общую мутацию, тестирующая компания или лаборатория дадут ему имя (или, возможно, несколько синонимов несколькими лабораториями), и с этого момента SNP будет известен под этими именами.

 

Иногда можно встретить формат имени SNP, например, «rs9786153»; это известно как rsid, сокращение от Reference SNP Cluster Id. Это имена SNP, присвоенные базой данных dbSNP Национального центра биотехнологической информации (NCBI) при отправке SNP в их базу данных. База данных dbSNP не включает все SNP, используемые в генетической генеалогии, но включает многие, особенно старые SNP, которые были обнаружены в первые дни тестирования SNP. Имена rsid для SNP обычно не используются в генетической генеалогии Y-ДНК, но иногда их можно увидеть в различных отчетах.

 

Независимо от того, назван SNP или нет, он все еще имеет позицию на Y-хромосоме и мутацию. Таким образом, иногда вы также можете видеть SNP, упоминаемый в формате, например, 12345678G-A, что означает, что SNP был мутацией от G до A в позиции 12345678 на Y-хромосоме.

 

Рисунок 13-7 представляет собой «классический» пример мутации SNP и фактически представляет как SNP, так и UEP. Однако не все UEP являются SNP. Некоторые из них, которые технически не являются SNP, показаны на рис. 13-8.

 

 

Рисунок 13-8. Примеры возможных "не-SNP UEP"

«Индели» - это мутации, которые вставляют или удаляют основания в цепи ДНК, в то время как двойные нуклеотидные полиморфизмы (DNP), тройные нуклеотидные полиморфизмы (TNP) и другие многонуклеотидные полиморфизмы или MNP также существуют, и также существуют их вариации. Они не так распространены (быстрый обзор более 1 миллиона SNP, зарегистрированных в YBrowse, показывает, что не-SNP-мутации составляют менее 1% из них), но они случаются, и в обычной практике мы называем их «SNP». в генетической генеалогии.

 

 

Триаллельные и квадаллельные SNP

 

Большинство SNP также являются двуаллельными, что означает, что они принимают только одно из двух значений. В нашем примере на рисунке 13-7 SNP имеет одно из двух значений аллеля, либо T, либо A.

 

Иногда две разные мутации могут происходить в одной и той же референтной позиции, например, одна и та же позиция на рисунке 13-7 может отдельно мутировать из Т в С у совершенно другого человека в совершенно другой момент времени. Когда это происходит, позиция иногда называется триаллельным SNP, поскольку позиция может принимать одно из трех возможных значений. Если бы снова у совершенно другого человека та же самая позиция изменилась с T на G, то это было бы названо квадаллельным SNP.

 

Что происходит, так это то, что по мере обнаружения этих различных мутаций различным мутациям присваиваются разные имена SNP; поэтому в нашем примере мутация от T до A может называться X001, а мутация от T до C может называться Y992. Тогда SNP X001 и Y992 не являются синонимами, поскольку они представляют разные мутации, но они оба имеют одинаковый ссылочный номер позиции. Это может вызвать случайную путаницу, пока не выяснится, что одна и та же позиция имела две разные мутации.

 

Поскольку на практике они обозначаются разными именами SNP, термины «триаллельный SNP» и «квадаллельный SNP» употребляются неправильно. На самом деле это два или три названных SNP, а не один; они просто занимают один и тот же номер позиции. Если бы вы ссылались на них только по их SNP-именам и никогда не заботились об их позициях, вы бы никогда не узнали, что возникла какая-то путаница. Но наличие одного и того же номера позиции определенно сбивает с толку, если вы посмотрите глубже.

 

Обратите внимание, что повторяющийся SNP, означающий одно и то же изменение значений аллелей, происходящее у двух разных мужчин в разные моменты времени, аналогичен триаллельному SNP, за исключением того, что обе мутации были идентичны, и в этих случаях ему дается одно и то же имя SNP для обеих мутаций. Это снова может вызвать некоторую путаницу, но поскольку две мутации обычно находятся в совершенно разных частях гаплотерева, повторяющиеся SNP обычно не считаются проблемой.

 

Однако, чтобы избежать малейшей вероятности возникновения проблем с новым повторяющимся SNP, всегда рекомендуется, чтобы любой, кто хочет протестировать один SNP, должен выбрать два SNP, SNP, который они хотят подтвердить, и один известный SNP, полученный немного ранее. та же ветка или более старая ветка. Это подтвердит, что первый SNP, если он положительный, также находится на ожидаемой ветви гаплотерева (и хотя шансы повторяющегося SNP уже очень малы, шансы того, что оба этих SNP будут повторяться, пренебрежимо малы).

 

Референсные, предковые и производные аллели

 

Первое картирование генома человека было объявлено завершенным в 2003 году, и с тех пор у нас есть эталонный геном, хотя регулярно выпускаются обновления. Эта ссылка особенно полезна при определении того, когда SNP мутировал, поскольку указанное значение аллеля позиции на Y-хромосоме из данного теста можно сравнить с этим эталонным геномом, чтобы увидеть, мутировало ли положение или нет. Очень часто в отчетах об испытаниях вы увидите два значения для сообщаемого SNP - значение для «эталона» и значение для «производного» или «генотипа» - первое - это значение аллеля в эталонном геноме в этой позиции, а второе. является значением, найденным в этом конкретном тесте («производный» или «генотип» оба означают значение в этом конкретном тестере).

 

На практике, когда дело касается Y-хромосомы, у этого подхода есть две проблемы. Первая проблема заключается в том, что даже самый последний доступный сегодня эталонный геном (hg38) покрывает только около 55% Y-хромосомы, потому что остальные представляют собой участки с трудностями для секвенирования, которые еще не были формально секвенированы для добавления к эталону (подробнее об этом в главе 15).

 

Вторая проблема заключается в том, что эталонный геном Y-хромосомы не представляет собой наследственную Y-хромосому всех мужчин, это просто репрезентативная Y-хромосома. Для целей генетики не очень важно, чтобы он представлял наследственную ценность каждого SNP, и многие позиции вдоль ссылки просто представляют значения, которые были репрезентативными для мужчин, использованных для создания ссылки. Если все эти люди (или большинство) уже произошли от определенной гаплогруппы, эталонный геном может фактически уже отражать положительный статус SNP, которые определяют эту гаплогруппу.

 

В результате у любого SNP есть три состояния по сравнению с тестом любого человека - наследственное, эталонное и производное. Предком всегда является «немутантное» или «отрицательное» состояние SNP, «производное» - это мутированное или «положительное» состояние SNP, а ссылка обычно совпадает с отрицательным состоянием, но в некоторых случаях (обычно с очень древними SNP) может быть положительным.

 

В качестве примера они обычно могут видеть два результата: один для SNP, где ссылкой является C, а их значение - C, и их результат теста говорит, что они отрицательны для этого SNP, и другой SNP, где ссылкой является C, а их значение - C. значение равно G, и результат их теста говорит, что они положительны для этого SNP. Это нормальные результаты.

 

Но иногда SNP будет говорить, что его ссылка - C, а их значение - C, и они помечаются как положительные для этого SNP. Это те случаи, когда эталонное значение фактически уже является положительным состоянием, и их тест просто подтвердил, что они также имеют ту же мутацию.

 

Как испытательная компания узнает, что ссылка не совпадает с исходной? Обычно потому, что повторное тестирование показало, что общий предок, предшествующий этому конкретному SNP, должен иметь значение аллеля, отличное от значения в эталонном геноме.

 

Различия в SNP «Качество»

 

В отчетах об испытаниях от разных компаний, которые включают SNP, вы увидите много разных способов представления информации, но многие из них составляют список положительных SNP, а иногда и список положительных и отрицательных SNP, но без каких-либо подробностей относительно уровня уверенности, как к тому, как они были определены. Другие компании разбивают свои отчеты на SNP с несколькими различными рейтингами качества. В некоторых случаях тот же SNP, которому была присвоена низкая оценка качества в тесте одного человека, может получить более высокую оценку качества в тесте другого человека. В тех случаях, когда приводятся эти определения качества, они иногда основываются на внутренних критериях компании, а различия в уровнях «качества» часто плохо объясняются.

 

В этом контексте, конечно, «качество» SNP означает конкретно две вещи: во-первых, насколько компания уверена в заявленном положительном или отрицательном значении этого SNP в этом наборе, а во-вторых, насколько они уверены в том, что SNP соответствует действительности. на самом деле UEP, что означает, что он мутировал только один раз (по крайней мере, в этой линии) и последовательно передавался в своем положительном состоянии всем потомкам человека, у которого он произошел. Или, другими словами, подходит ли SNP для использования в анализе Y-ДНК для генетической генеалогии.

 

Хотя определения качества иногда могут зависеть от более тонких критериев, эти критерии обычно включают четыре основные категории:

 

1. Сообщается ли SNP другими наборами. Если SNP когда-либо наблюдался только у одного испытуемого человека или не был обнаружен достаточное количество раз, чтобы считаться надежным, то он часто не считается достаточно надежным, чтобы быть включенным в качестве «качественного» SNP. У разных компаний разные пороговые значения того, сколько раз следует сообщать SNP, но это одна из основных причин того, что частным SNP даже не дается имена, пока они не пройдут более обширное тестирование.

 

2. Что это за мутация. Фактические SNP - точечные замены мутации - известны как более надежные и получат более высокие оценки качества; Indels и MNP могут считаться менее надежными, если другие критерии не перевешивают склонность быть более осторожными с менее изученными типами мутаций. Одним из примеров действительно ненадежной мутации был SNP P25, который изначально был одним из идентифицирующих SNP для гаплогруппы R1b, но оказался ненадежным «вариантом паралогичной последовательности», возможно, подверженным событиям конверсии гена (подробнее о них в главе 15) и больше не используется в гаплотереве Y-ДНК.

 

3. Сколько раз позиция читалась и читалась достоверно. Секвенирование следующего поколения работает со многими копиями одних и тех же цепей ДНК и многократно считывает одну и ту же ДНК, отчасти потому, что время от времени будут возникать проблемы с выравниванием, которые приведут к неверным результатам для некоторых копий ДНК. Чтобы быть уверенным в окончательном решении о нуклеотиде в любой данной позиции, он должен не только быть прочитан несколько раз, но и иметь одно и то же постоянно сообщаемое значение. У многих компаний есть критерии, которые могут потребовать, например, не менее 10 считываний с 90% согласованными результатами, чтобы считать сообщенное значение нуклеотида достаточно точным для «качественного SNP». Но некоторые компании также сообщают значения любых прочитанных позиций, даже если они были прочитаны только один раз.

 

4. Где SNP находится на Y-хромосоме. Я подробно рассмотрю региональные различия Y-хромосомы в главе 15, для наших целей здесь я просто скажу, что некоторые позиции вдоль Y-хромосомы, как известно, совершенно ненадежны, другие потенциально ненадежны и, возможно, 20% Y-хромосомы. считается «качеством», хотя есть несколько разных регионов в зависимости от того, как это определяется. Однако в некоторых регионах сама мутация не может передаваться всем потомкам, а в других регионах труднее быть уверенным, что нуклеотид был достоверно зарегистрирован, и обе проблемы могут способствовать тому, что SNP либо не сообщается вообще, или сообщается с более низким рейтингом качества.

 

Даже в одной и той же компании могут быть разные определения «качества SNP» в зависимости от того, как используется SNP.

 

Большинство компаний, например, сообщат о каждом SNP, который соответствует их критериям отчетности, в результатах ваших тестов, но будут использовать более ограниченные критерии для использования SNP в своем гаплотереве Y-ДНК, если он у них есть. Вот почему, например, дерево блоков ДНК Семейного древа может показывать количество частных вариантов, которое меньше числа, указанного в вашем тесте - потому что они имеют более ограниченную версию четырех пунктов выше для этих частных вариантов, которые будут размещены на Дерево блоков. Если компания проводит оценку возраста, то для этой цели у нее может быть еще более ограниченный набор критериев; YFull, например, принимает ограниченное количество SNP за пределами их области качества «combBED» в свое гаплотерево, но ограничивает их оценку возраста, чтобы использовать только SNP из их области качества (и я расскажу об оценке возраста более подробно в главе 16).

 

В конце концов, каким SNP должен доверять человек из своего отчета об испытаниях? Ответ зависит от того, для чего вы хотите их использовать. На самом деле любой SNP может быть надежным до сегодняшнего дня, а завтра внезапно показать себя ненадежным в новом тестере. Для SNP, которые компании приняли в свои гаплотеревы, это все еще может произойти, но будет чрезвычайно редким и эквивалентно обнаружению, что запись о рождении вашего предка была подделана - возможно, но вас простят за то, что вы этого не предвидели.

 

По-прежнему стоит изучить SNP «меньшего качества» среди группы, которую вы, возможно, анализируете, просто чтобы увидеть, не предполагает ли какой-либо из них ответвления в группе, не подтвержденные SNP «более высокого качества». Если у вас есть такие примеры, вам следует выяснить, почему они не считаются более качественными и являются ли они полностью подозрительными или, вероятно, надежными, но еще не совсем доказанными. Эти определения помогут вам решить, можете ли вы использовать эти SNP для своих собственных групповых отчетов, но, возможно, вам будет полезно рассматривать эти определения ветвления как «рабочие теории» до тех пор, пока они не будут подтверждены дополнительными SNP, STR или дополнительной генеалогической информацией.

 

 

 



Поделиться:


Последнее изменение этой страницы: 2021-12-07; просмотров: 49; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.21.244.137 (0.124 с.)