Подход под названием "кладистика" работает с живыми организмами, ископаемыми останками и ДНК
Откуда нам знать, на что были похожи сегодняшние формы жизни, когда они впервые эволюционировали? Годами биологи могли делать выводы о том, каких общих предков имеют сегодняшние формы жизни, на основании кладистики, оценивавшей количество сходных черт. Этот подход работал с ископаемыми и с живыми существами, и позволял нам классифицировать их в ветвящиеся иерархии, исходившие из общего предка. Но сегодня у нас вместо форм костей и количества зубов есть ДНК.
Как нам построить дерево для неё? Оказывается, что общий кладистический подход работает и здесь.
Кладистика
Допустим, нам нужно разобраться в предках млекопитающих. Для этого нужно взять отдельную, но родственную группу – для млекопитающих подойдут рептилии. У рептилий и млекопитающих много общих черт – четыре конечности (все они являются тетраподами, даже змеи и киты с рудиментарными конечностями). Есть и различия – мех или особые кости во внутреннем ухе. Есть частично схожие черты – откладывание яиц у утконоса, или черты, присутствующие лишь у некоторой группы – полёт у летучих мышей.
Используя эти особенности, можно отследить, как всё группируется. Хотя летучие мыши и киты сильно отличаются, яиц они не откладывают, поэтому, скорее всего, они связаны узами родства друг с другом сильнее, чем с яйцекладущими. И так как последние откладывают яйца, как и рептилии, они, скорее всего, ответвились от дерева развития млекопитающих довольно рано.
Иногда странные особенности нарушают стройность дерева – например, и змеи, и киты обладают лишь рудиментарными конечностями, при том, что по остальным признакам они слабо связаны. Такие проблемы иногда решаются сбором информации о достаточном количестве особенностей. Количество отличий, разделяющих китов и других млекопитающих, меньше, чем количество схожих особенностей.
Логика такого анализа проста: чем члены группы сильнее связаны родством, тем меньше у них отличий. Поэтому люди явно относятся к приматам, а не к грызунам.
Кладистика может помочь разобраться в прошлом. Рептилии и яйцекладущие откладывают яйца, как и утконосы, можно предположить, что в момент, когда он дерева млекопитающих отделились яйцекладущие, все их предки также откладывали яйца. Можно разбираться, какие особенности впервые появлялись у уже вымерших млекопитающих, и составить порядок ответвления от дерева развития.
Акулы / Лучепёрые рыбы / Амфибии / Приматы / Грызуны / Крокодилы / Птицы
Ответвления снизу вверх: костяной скелет, тетраподы, амнион, мех
Важно отметить, что такие рассуждения не всегда идеальны. К примеру, известно, что киты и гиппопотамы довольно близкие родственники. Они обитают в воде, поэтому было бы логично предположить, что их предок жил там же. Однако же окаменелости говорят об обратном – они представляют два разных ответвления от предков, живших на суше.
Кладистика проникает в генетику
Удобно, что те же рассуждения пригодны и для ДНК. Кладистика основана на идее, что организмы с минимальным количеством отличий должны быть ближе всех связаны родством. Почти каждые спаренные основания могут измениться из-за мутации (за исключением оснований самых важных генов). Поэтому каждая пара способна стать отличительной чертой. Небольшое количество изменений требует небольшого количества мутаций, поэтому оно, скорее всего, означает небольшое различие между последовательностями ДНК.
Три последовательности на картинке снизу – разные, и разница во второй и третьей относительно первой отмечена красным. Между первой и второй отличий всего два, а между первой и третьей – четыре. Значит, первые две последовательности связаны более близкими узами.
А какая же из первых двух последовательностей находится ближе к третьей? Для этого повторим процесс, только отметим различия по отношению к третьей последовательности.
Видно, что у первой и второй одинаковое количество различий с третьей. Нельзя сказать, кто из них ближе. Дерево, построенное на основе этих взаимоотношений, будет выглядеть так:
Исследователи, выясняя родство двух организмов, полагаются на нечто большее, чем просто десяток спаренных оснований, но, по сути, процесс похож. Нужно поместить последовательность на предполагаемом дереве и посмотреть, какое количество изменений потребуется для каждой из ветвей. Перемешать дерево и повторить анализ. В результате задача сводится к простому поиску дерева, требующего наименьшего количества изменений.
Ну, или к почти простому. Одна из проблем – определение эквивалентных последовательностей. Множество генов позвоночных относится к более крупным генетическим семействам. У людей есть 22 разных члена семейства генов FGF. Сравнивая их с мышиными, нужно сравнивать человеческие FGF-14 с мышиным эквивалентом FGF-14, а не с другими членами семейства. Многие из них могут теряться или дублироваться, и тогда у вида могут встречаться два гена типа FGF-14, или ни одного.
Эти события – дублирование и удаление последовательностей – постоянно происходят и вне генов. При сравнении разных последовательностей нужно понимать, что некоторые основания могут не измениться, а пропасть. Другие последовательности могут испытывать вставку оснований, что тоже нужно учесть. Но при достаточном объёме ДНК и осторожном анализе можно воссоздать эволюционные деревья так же хорошо, как и с помощью особенностей организмов.
Однако можно воссоздать и прошлое. Взглянем на те же три последовательности, размеченные по-другому.
Теперь красным отмечены основания, отличающиеся от статистически наиболее часто встречающихся оснований у этих трёх последовательностей. Если у нас есть доказательства, что у этих последовательностей был общий предок, то, скорее всего, эти отличия представляют собою одиночные мутации в прошлом. Если так, то можно предполагать о последовательности их предка – она требует наименьшее количество изменений для получения потомков. Следовательно, если на первом основании у двух из трёх последовательностей стоит G, а у одной – A, то вероятнее всего, у их предка там было G.
И у такого анализа есть свои ограничения. Нельзя узнать, менялось ли основание за всю историю существования более одного раза – а это становится проблемой при погружении в далёкое прошлое. Но технология работает. Мы использовали её для воссоздания древних белков, многие из которых способны функционировать и в современных условиях. Во многих случаях у них есть разные свойства – допустим, переносимость высоких температур – которые могут рассказать нам о среде обитания организмов.
Возможно использовать это и для ответа на вопрос о том, когда существовал белок-предок или виды, его использовавшие. Для большинства родословных можно рассчитать количество новых мутаций, возникновение которых типично для каждого поколения. Его можно сравнить с общим количеством мутаций и посчитать количество поколений, требовавшееся для достижения последовательностью текущего состояния. Добавив среднее время между поколениями, можно прикинуть срок, потребовавшийся для выработки сегодняшней ДНК. Погрешности получаются большими, но такой подход имеет свои преимущества.
«Прошлого не вернуть» – это клише. Но прошлое, очевидно, оставляет свой след в настоящем. Читая следы, можно составить яркую и информативную картинку прошлого, даже не имея машины времени для того, чтобы отправиться туда лично.
Прим. перев: интересный пример использования технологии оценки времени, потребовавшегося для появления современной ДНК, представлен в научной работе Киттлера, Кайзера и Стоункинга. Известно, что вши, живущие в волосах на голове человека, и вши, живущие в его одежде – родственники, хотя и дальние. Получается, что можно подсчитать, как давно разошлись их генетические дорожки – и эта дата будет характеризовать тот момент, когда люди массово начали облачаться в одежду. По подсчётам учёных получилось, что это произошло примерно 72 000 лет назад. Правда, и погрешность немалая: ± 42 000 лет.
Автор: SLY_G