Пару месяцев назад я рассказывал о приближенных результатах в задаче о сворачивании РНК. Напомню требуется свернуть вироидный рибозим NC_003540 организма Chrysanthemum chlorotic mottle viroid, третичная структура которого неизвестна.
И вот оно свершилось — рибозим свернулся !
Смотрим его конечное состояние, а под катом еще его траекторию сворачивания, а также подводим итоги.
Смотрим его траекторию сворачивания
Disclaimer
А биологию забудьте дома, а также физику, химию ...
Подход с помощью которого я получил данную траекторию сворачивания будем называть кибернетико-геометрическим подходом. Он существенно по постановки задачи отличается от биологических подходов. В данном подходе считается, что проблематика сворачивания белков и РНК это задача ни биологии, ни физики, ни химии, ни любых их пересечений (напр., биофизика, биохимия). Это задача сугубо кибернетическая.
Почему? — спросите Вы.
Данный подход исходит из постулата: для того, чтобы белок или РНК принял правильную, существующую в реальности нативную структуру нужно всего лишь учитывать образование водородных связей, а также ещё некоторые геометрические взаимоположения между атомами нуклеотидов.
Отказ от ответственности таким образом состоит в том, что данный подход не гарантирует идентичного соответствия модели и реального нативного состояния. Более того в данном подходе наличие соответствия вторично, примерно также как наличие естественного интеллекта для сферы искусственного интеллекта.
А методы решения соответственно кибернетические, частично из области искусственного интеллекта.
В данный момент, метод основан на общей постановки в рамках задачи теории игр, и применения ряд эвристик. Соединение ряда эвристик и нахождение точного метода сопряженно с решение проблемы названной мной «проблемой двух учителей», изложенная в Резюме проблемы «двух и более учителей» и субъективное мнение о ИИ-сообществе и в Понятие о структурной адаптации и введение в «чистое обобщение». Под определенном углом зрения эта проблема связанна с «проблемой инвариантного представления в искусственных нейронных сетях».
Пробежимся по предыдущим статьям
Теперь после некоторого опыта можно констатировать, где и в чем я и мои оппоненты прежде были не правы и неточны.
1. От белков к РНК — это просто популярное введение в биологическую терминологию, её не много и этого достаточно для понимания обсуждаемого.
2. Мат. критерии — это некоторые нюансы свойственные задачи сворачивания РНК. Требуется для более глубокого понимания и попыток саму что-то свернуть. Но уже здесь завязался диалог суть которого как раз указывает на направленность подхода. В статье говорится о том на каких характеристиках нужно основываться, чтобы задать функцию пригодности (а, что это такое мы жевали тут). Так вот биофизики любят исходить из физических параметров. Так вот это совершенно лишние — достаточно описать геометрические условия свойственные этой задаче. Иметь дело с физическими параметрами сильно накладно — неоправданно сложные расчеты, которые все равно не точны и не могут воссоздать реальную биологическую среду. Просчитывать физические условия в клетке все равно, что если бы в искусственном интеллекте мы рассчитывали все нервные импульсы
3. Как уменьшить число поворотов цепи? — здесь как раз описываются/критикуются текущие подходы при решении задач о сворачивании. Показывается, что мало того, что мы имеем погрешности в расчете физических условий, так еще ищем что попало методом Монте-Карло, или в лучше случае методом отжига. Это все равно, что играть в шахматы случайно делая ходы. Там же описывается более современный подход от Rhiju Das and David Baker, но увы теперь можно сказать, что он избыточен и тяжел для вычислений.
4. Как оценить ход сворачивания односпиральной РНК? — здесь выявленные нами геометрические характеристики комбинируются для создания функции пригодности.
5. Ограничение оптимизирующих методов в играх с противником и без — наглядное пояснение почему ряд методов, которые используют случайность для поиска новых состояний — непригодны для этой задачи.
6. Одна фундаментальная проблема — тут первые штрихи к описанию проблемы «обучения двух учителей» в данной задаче. А также там мы обсуждали возможность использования «инверсной кинематики» (которая используется для расчета суставов в робототехнике), но все это ужасно медленно. Соответственно разрабатываемый метод, может быть применен не только к проблеме сворачивания РНК, но и для улучшения решения проблем из области робототехники. Кстати, сворачивание о сродни решению проблемы «парковки автомашины» в каждом отдельно взятом случае контакта двух нуклеотидов.
7. Введение в сворачивание многоспиральных РНК — основы понимания, почему спираль свернуть легко, а две сложно. Тут основы правильной модели.
8. RNAInSpace — программное обеспечение для полуавтоматического конструирования РНК в пространстве — не удачное демо
9. История одного реинжиниринга или RNAInSpace v.1.3. Demo — удачно демо. Пробуем основы! У меня почти нет обратной связи :), помогайте…
10. Биовычисления по сворачиванию. Снова простым языком о полученной модели сворачивания — описанная здесь модель сворачивания — ложна. Ну, не так чтобы совсем — но все таки. Это как раз было проверено, и оказалось, что вот он набор глупостей:
Но существуют еще так называемые стэкинг взаимодействия… Так вот если РНК появляется постепенно, то до того как может образоваться первая водородная связь нужно чтобы появилось как минимум двадцать нуклеотидов.… И раньше я считал, что они просто вытянуты в цепь.… Стэкинг оказывается важен как создание начального положения
Начальное положение должно быть хаотичным и вытянутым. Стэкинг важен лишь в определенных местах, где нет водородных связей. И вообще стэкинг — это просто дополнительные геометрические соотношения.
В чем же фича?
Есть три момента, почему тут мне удалось свернуть, а до этого не удавалось.
1. Повысили скорость сворачивания отдельных спиралей всего до нескольких часов (против ранее дней). Следствие набора причин: отказались от подхода Rhiju Das, когда углы выбираются из базы, теперь только поиск в окрестности ± 5 градусов от текущего положения. Важно вначале пройтись при поиске с шагом 10 градусов, а потом 0.2 градуса. Использовавшийся ранее шаг 0.1 градус мелкие и излишен. Достаточно изменять 6 углов в главной цепи и один угол для боковой, т.е. исключено изменение конформации сахара.
2. Использовались изменение углов в ручную. Тут важно, что в ручную очень сложно делать «тонкие» движения — т.е. образовать водородные связи в ручную не реально. Но был один момент биологический — данный рибозим саморазрезается на две части. И именно это показала траектория сворачивания в один момент времени, при сворачивании необходимо «пересечь два конца», моделируя как бы разрезание. Также в ручную вмешивались и по другой не биологической причине. У меня пока нет программы выхода из запрещенных состояний — когда образуются недопустимые ковалентные связи (проще говоря атомы сталкиваются — подходят на недопустимые расстояния). Поэтому выходим в ручную. Но таких ручных вмешательств сравнительно мало 10 шт, на 20000 автоматических ходов. Правда еще нужно раз 100 управлять направлением автоматического поиска.
3. На последних этапах важно, что для части цепи нужно разрешать образование запрещенных ковалентных связей. Это проблема моделирования — расчетная траектория движения не может быть с отсутствие упругих столкновений, а столкновения рассчитывать ужасно дорого. Поэтому пока сворачиваем одни части, столкновения в других можно игнорировать.
Что дальше?
Главное, что описанный подход (на скорую руку правда, т.к. хотелось побыстрее сообщить, да к тому же более детальные описания думаю утомили бы) — позволяет принципиально свернуть многоспиральные РНК. А это пусть малое — но достижение. Такой автоматики, которая проста на самом деле и еще не до конца проработана еще нет ни у кого. Максимальное приближение это в научной-игре FoldIt, но там все куда сложнее для возможности свернуть.
Далее думаю тестировать на тРНК — там уже три спирали в достаточно сложной комбинации.
P.S. Извиняюсь за некоторую сумбурность…
Автор: tac
Я д.ф.м.н. главный научн.сотр. И-та Динами Геосфер (москва), мне 70, 25 лет я ркводил лаб. им Шмидта в ИФЗ а затем в ИДГ. Обо мне можно узнать в и-е. Я просил 2 года своего аспиранта заняться вашей темой. но он отказался. У меня есть несколько вопросов по поводу рибозим. Андрей