Главный генетик популярной компании по поиску предков признал, что это «частью наука, частью искусство»
Один набор однояйцевых близнецов, и два разных профиля для предков. По крайней мере, так следует из результатов работы одной из крупнейших компаний, разыскивающей предков через ДНК.
Прошлой весной Чарлзи Агро и её сестра-близнец Карли купили себе наборы для проверки ДНК от AncestryDNA, MyHeritage, 23andMe, FamilyTreeDNA и Living DNA, и по отдельности отправили образцы своей ДНК в каждую из компаний на анализ. И, несмотря на то, что их ДНК практически одинаковы, они не получили сходных результатов ни от одной из них.
В большинстве случаев одна и та же компания отслеживала предков близнецов до одинаковых частей света – с разной вероятностью. Но результаты от 23andMe дают понять, что у каждой из близняшек в родословной был неожиданный поворот. Если верить им, наследственность у Чарлзи на 10% менее «общеевропейская», чем у Карли. Также у неё есть предки из Франции и Германии (2,6%), которых нет у её сестры.
Также у близнецов оказались разные степени принадлежности к предкам из Восточной Европы – 28% у Чарлзи и 24,7% у Карли. И если у Карли эти предки связаны с Польшей, то у Чарлзи точное их происхождение было не указано.
«То, что они выдали разные результаты для вас и для вашей сестры, я нахожу крайне загадочным», — сказал Марк Герштейн, вычислительный биолог из Йельского университета.
«Шокирующе похожие» ДНК близнецов
Близнецы отправили результаты, полученные из всех пяти компаний, на анализ команде Герштейна. Он говорит, что любые результаты, полученные от одной компании каждым близнецом должны быть идентичны. И тому есть простая причина: собранные данные по ДНК сестёр практически идентичны. «Они шокирующе похожи», — сказал он.
Команда из Йельского университета смогла скачать и проанализировать исходные данные, использованные каждой из компаний для расчётов. Полный образец ДНК состоит из трёх миллиардов частей, но компании, занимающиеся проверкой происхождения, используют порядка 700 000 из них, чтобы работать с генетическими различиями.
Согласно данным от 23andMe, 99,6% частей были одинаковыми, отчего Герштейн с командой и были так удивлены результатом. Они пришли к выводу, что исходные данные четырёх других компаний также были статистически идентичными. Но при этом, ни одна из пяти компаний не выдала идентичной истории происхождения близнецам.
«Мы думаем, что числа должны были точно совпадать», — сказал Герштейн. И хотя он не может сказать точно, почему возникли эти различия, он подозревает, что всё дело в алгоритмах, используемых компаниями для обработки ДНК пользователей. «Всё дело должно быть в подсчётах. Эти подсчёты осуществляются разными методами».
В ответ на вопрос, почему близнецы не получили одинаковых результатов, несмотря на схожесть их ДНК, представитель сайта 23andMe сообщил, что даже такие небольшие различия могут привести к тому, что их алгоритм выдаст немного отличающиеся оценки вероятности происхождения. Хотя в компании и говорят, что они подходят к разработке своих инструментов и отчётов с научной строгостью, но признают, что результаты являются «статистическим приближением».
Различия по пяти компаниям
В FamilyTreeDNA близнецам сообщили, что их предки жили на Сицилии, в Польше и на Украине. Однако результаты, полученные каждой из сестёр, содержат весьма удивительные – а в некоторых случаях и противоречивые – детали семейной истории.
В AncestryDNA обнаружили, что большая часть предков близнецов происходит из Восточной Европы (38% для Карли и 39% для Чарльзи). Результаты тестов MyHeritage относят большую часть их предков к Балканскому региону (60,6% для Карли и 60,7% для Чарльзи).
Более удивительные результаты представила компания Living DNA, согласно которым небольшая часть предков Карли жила в Англии, а предки Чарльзи жили в Шотландии и Ирландии.
Ещё один неожиданный поворот нашёлся в результатах от FamilyTreeDNA, отнёсшей 13-14% предков близнецов к Ближнему Востоку – гораздо больше, чем у других компаний, если учесть, что две из них вообще не нашли никаких ближневосточных корней.
Пол Майер, главный генетик из FamilyTreeDNA, признаёт, что определение генетических различий людей, происходящих из разных мест, является сложной задачей. «Сам по себе поиск границ – это передний край науки, поэтому эта задача стоит на стыке науки и искусства», — сказал Майер в интервью по телефону.
Как это работает
Чтобы узнать о предках человека, такие компании, как 23andMe, сравнивают образец ДНК с тем, что называется эталонной панелью. Она состоит из набора образцов ДНК пользователей, проходивших тест ранее, и из образцов, взятых из публично доступных баз данных.
Доктор Саймон Грэвел, специалист по популяционной генетике из Университета Макгилл, участвующий в проекте 1000 Genomes Project, говорит, что подобные компании берут порядка 700 000 сегментов ДНК и используют алгоритм, сравнивающий их с сегментами из эталонной панели.
«Они ищут совпадения с различными регионами мира, — сказал он. – В итоге у них получается некоторая оценка вклада той части эталонной панели, которая сильнее совпадает с вашей ДНК, и из этого выводится оценка вашего происхождения». Разные компании пользуются разными панелями, поэтому каждая из них, вероятно, выдаст одному человеку разные результаты.
В AncestryDNA признали, что размер эталонной панели – это основной фактор. Нам сообщили, что компания «постоянно работает над улучшением научного подхода», и что «новая, более крупная панель даст пользователям более точные результаты».
Откуда взялись отличия?
Как говорит Грэвел, множество факторов могут влиять на точность результатов, полученных от компании, занимающейся наследственностью, но размер и качество эталонной панели особенно важны. Чем она больше, тем точнее результаты, говорит он. «Если у вас есть меньше людей для сравнения, вам приходится срезать углы активнее, — сказал он. – Также вы рискуете потерять разнообразие, о существовании которого в определённом регионе вы не знали».
Другая причина расхождений результатов разных компаний – произвольный подход к разделению мира на регионы, говорит Грэвел. «Им приходится, грубо говоря, брать в руки карандаш и говорить: „Вот это будет регион“. И разные компании рисуют разные границы».
Он также говорит, что тесты оказываются более точными для людей европейского происхождения, поскольку их прошло большее количество людей с такой наследственностью.
Он предупреждает, что не стоит считать полученные результаты определёнными. Он говорит, что компания может отслеживать наследственность человека по образцу ДНК на определённом континенте со статистической погрешностью, но какие-то более конкретные сведения, вроде страны или города происхождения не будут надёжными.
Отсутствие надзора
Крупнейшие компании, занимающиеся изучением наследственности по ДНК, протестировали уже миллионы людей. MyHeritage, к примеру, говорит, что в этом году ожидает превысить планку в $100 млн по продажам услуг. Но, несмотря на популярность подобного тестирования, за этой индустрией не осуществляется никакого правительственного или профессионального надзора, который бы гарантировал подлинность результатов. У Грэвела такая ситуация вызывает беспокойство.
«В науке обычно присутствует процесс проведения экспертных оценок и открывается доступ к данным и алгоритмам – так мы гарантируем высокое качество данных, — сказал он. – А в данном случае к ним нет доступа, поскольку компании держат данные в секрете».
Поэтому, говорит Грэвел, потребители должны скептически относиться к результатам этих тестов скептически. Людям нужно понять, что эти тесты не удовлетворяют таким стандартам, как, например, проведение медицинских анализов. Данные тесты больше похожи на «научное развлечение», — сказал он.
Как и в компании 23andMe, в MyHeritage говорят, что их результаты являются «приблизительными этническими оценками». Когда Рафи Мендельсона, представителя MyHeritage, спросили, почему компания предлагает свои результаты с такой определённостью – в видеоролике с результатами тестирования, который получает пользователь, указано «вы принадлежите к» перед родословной пользователя – он сказал, что считает очевидным, что пользователи получают оценочные результаты, и что это особенно понятно пользователям из Северной Америки.
Результаты могут меняться
Какие бы результаты вы не получили, не стоит к ним сильно привязываться. Они могут измениться. В сентябре AncestryDNA сообщила клиентам об обновлении оценок следующим сообщением:
«Ваша ДНК не меняется, но у нас теперь есть 13 000 дополнительных эталонных образцов и новый мощный научный метод, что позволяет дать вам улучшенные результаты по этническому происхождению». В статье использованы результаты, полученные 6 ноября 2018 года, когда компания уже обновила свои данные. В обновлённых результатах были обнаружены родственные связи с Россией, Грецией, Балканами и странами Балтии, которых не было указано раньше.
Автор: SLY_G