Привет! Мы — биотех-стартап «Мой ген». Мы хотим принести в Россию дивный новый мир персональной генетики. В нашем блоге мы планируем размещать последние новости в этой области, представлять интересные научные статьи по биоинформатике, и наверное даже расскажем однажды, каково это — быть биостартапом в нашей стране. Надеемся, что уже скоро в нашу жизнь войдут концепции «облачная лаборатория» и «генетика вещей» (puns intended), и будем этому всячески способствовать своими усилиями.
Сегодня мы расскажем про [недавнюю статью][http://dx.doi.org/10.1371/journal.pgen.1004224] в Plos Genetics, о новом подходе к генетическому предсказанию черт лица. Дело это особенно интересное на контрасте, если вспомнить о недавних новостях на похожую тему, например, про художницу из Нью-Йорка, печатающую портреты на 3d-принтере якобы по анализам ДНК. Одно дело — buzzword-показуха, и другое, когда за дело берутся настоящие учёные.
До этого исследования все попытки найти связь между формой лица (да, в принципе, и любым другим сложно формализуемым признаком) и генетикой использовали простейшие подходы к оценке лица, поскольку в генетике традиционно использовались одномерные переменные для ассоциации (например, болеет ли человек конкретной болезнью, или какой у него рост; см. GWAS). В худшем случае просто замеряли расстояния и углы между глазами, носом и прочими примечательностями лица, которые могут отличаться между разными популяциями или внутри них. В более прогрессивных исследованиях использовали метод главных компонент, который на основе таких замеров представлял ряд абстрагированных метрик (такой может быть, например, уже «восточность») в виде, собственно, главных компонент.
Методика же этого исследования (картинки кликабельны, там описания) начинается с трёхмерного сканирования субъекта, в процессе которого выделяется область лица, определяется примерное направление лица по пяти основным точкам, и накладывается антропометрическая маска, состоящая из 7150 «псевдопримечательностей» (quasi-landmarks, перевод авторский; из текста статьи не очевидно, рассчитывались ли они в процессе работы, или использовались готовые, скорее всего последнее), причём это делается в два подхода с усреднением (если точнее, то с использованием Procrustes superimposition): сначала на нормальном скане, потом на его зеркальном отображении, чтобы избавиться от природной асимметрии человеческого лица. Полученные многомерные данные от 592 человек — а в исследовании участвовали граждане США, Бразилии и Кабо-Верде (острова Зелёного Мыса) — использовались всё в том же самом методе главных компонент, было выявлено 44 компоненты, отвечающие за 98% всей изменчивости. Влияние 10 самых значимых компонент можно наблюдать ниже:
Далее в дело вступает хардкорная статистика, а именно собственный метод BRIM (Bootstrapped response-based imputation modelling), за деталями реализации которого проще сразу отослать к неприметному Supplementary text. Метод основан на PLSR (partial least squares regression) и по сути производит из независимых и зависимых переменных регрессии некую гибридную переменную, названную RIP (response-based imputed predictor). Последнюю можно использовать вместо независимых переменных и получить RIP высшего порядка, в этом и заключается бутстреп. Так вот, было получено несколько разных гибридных переменных: RIP-S, выражающая зависимость лица от пола; RIP-A, от генетического происхождения; и наконец ряд RIP-G, от конкретных генетических полиморфизмов. Влияние RIP-A и RIP-S, выраженное в вариативности участков маски, разнице их площади и наклона, и отклонении по нормали, так сказать, налицо:
Кроме этого, в статье показали хорошую корреляцию между гибридными переменными и естественной оценкой тех же факторов людьми (то есть, провели банальный соцопрос, «насколько это лицо кажется вам женским, похоже ли оно на негритянское»), и обнаружили действие отдельных генов и полиморфизмов на некоторые черты лица.
Очевидно, наибольшее прикладное значение такие исследования имеют в криминалистике. Уже сейчас (лет семь уж как) можно, имея тысячу-другую образцов ДНК людей разных национальностей, составить генетическую карту и по ней предсказать национальность (пардон, имеется в виду этнический состав) любого преступника, оставившего частичку себя в качестве улик. Теперь же стало возможным не просто сузить круг подозреваемых, но и составить фоторобот. Параноикам и конспирологам, кстати, не стоит особенно волноваться насчёт биометрических паспортов — в них используются (если вообще) технологии прошлого века, годные разве что только для сопоставления 1-к-1, так же работают отпечатки пальцев. Полногеномный анализ пока слишком дорог для сколько-нибудь массового применения.
Однако можно пойти чуть дальше и в чуть другом направлении. Многие наверняка слышали про услуги ЭКО (экстракорпорального оплодотворения). Опять же, уже сейчас наиболее продвинутые клиники предлагают в довесок ещё и преимплантационную генетическую диагностику, позволяющую выбрать эмбрион желаемого пола и заведомо без некоторых болезней. Теперь представьте, что вы можете ещё и нарисовать лицо своего ребёнка. А потом накинуть +5 к выносливости и +3 к интеллекту. А потом… Кто сказал «Гаттака»? Есть опасения, что упоминание этого фильма с каждой новостью про персональную генетику скоро станет дурным тоном. Мы больше не будем, нам же это ещё продавать.
Источник КДПВ: www.spiegel.de/fotostrecke/erbgut-bestimmt-die-form-von-gesichtern-fotostrecke-112776.html
Автор: SamuelNakshon