«Предком» AlphaFold является алгоритм AlphaGo, который стал играть в го лучше любого человека. Источник: DeepMind
Разработчики из Deep Mind за последние пару лет стали известны благодаря многим своим проектам. В частности, они научили искусственный интеллект (слабую его форму) играть в Go, классические Atari-тайтлы и некоторые другие игры, сложные для «понимания» машиной. Сейчас наступил черед более серьезных занятий — Deep Mind постепенно меняет специализацию ИИ на молекулярную биологию.
Если точнее, то искусственный интеллект учат прогнозировать структуру белка на основе фрагмента последовательности аминокислот — этих кирпичиков белковой жизни. Проект, о котором идет речь, получил название AlphaFold. ИИ научили работать быстрее и точнее, чем люди благодаря обучению по базе последовательностей, собранных генетиками за несколько лет.
В конкурсе Critical Assessment of Structure Prediction (CASP), где необходимо было прогнозировать структуру белка, искусственный интеллект от Deep Mind занял первое место, став лидером среди 98 участников. ИИ удалось правильно предсказать структуру 25 из 43 белков. На втором месте — команда, которой удалось правильно предсказать структуру 3 из 43 белков. В ходе «соревнования» каждой команде ежемесячно отправляли определенный набор аминокислот. Это происходило в течение нескольких месяцев. Команды, получив все элементы, должны были предсказать структуру белка, который составляют эти аминокислоты. Структура ранее была уже определена учеными, так что правильный ответ был у организаторов.
Для науки исследования такого рода имеют первостепенное значение, поскольку белок — это основа жизни. Соответственно, предсказывая структуру белка, можно научиться понимать многие биологические функции и процессы. Стоит отметить, что в некоторых случаях ученые тратят годы на то, чтобы предсказать структуру определенного белка. Проблема в том, что в ДНК обычно есть данные о последовательностях аминокислот, но не структурах, которые формируют цепочки из них.
В организме человека содержится огромное количество разновидностей белка. По разным оценкам, оно может достигать нескольких миллиардов. Структур белка и того больше — количество описывает число с 300 нулями. 3D форма белка зависит от многих факторов — количества аминокислот, длины цепочки и т.п. Пространственная структура определяется еще и ролью, которую выполняет определенный белок в организме человека.
К примеру, клетки сердца строятся при помощи белка, сложенного таким образом, чтобы молекулы адреналина, идущие по кровеносной системе человека, задерживались и ускоряли темп биения сердечной мышцы. Практически любая из способностей и возможностей организма зависит от формы определенного белка — от сокращения мышц до зрения.
Чем сложнее белковая структура, тем сложнее ее моделировать. Стоит отметить, что некоторые болезни, считающиеся проблемой нового века, вызываются ошибочным сворачиванием белковых структур. К таким заболеваниям относятся, в частности, болезнь Альцгеймера, Паркинсона, кистозный фиброз и болезнь Гентингтона.
Источник: DeepMind
Понимание структуры белков определенного типа позволит создать реагенты, которые смогут активно воздействовать на эти белки. В качестве юзкейса можно назвать ликвидацию разлившейся нефти или создание недорогого быстро разлагающегося пластика.
По словам одного из представителей DeepMind, их исследование является предвестником новой эры. Работа относится к числу тех, что решают фундаментальные проблемы как науки, так и технологий. Стоит отметить, что специалисты DeepMind занялись созданием нового ИИ после того, как их алгоритм AlphaGo победил в игре в го Ли Седоля, чемпиона мира.
После этого ИИ научили проходить сложные для машин компьютерные игры, включая «Месть Монтесумы». Разработчики говорят, что их целью никогда не было получить побольше очков в какой-либо игре, чтобы показать силу своего ИИ. Настоящая цель — разработка алгоритмов, которые могут помочь человеку в решении вопросов науки и техники, таких, как структура белков и ее предсказание.
Ученые смогли научить AlphaFold определять расстояние между парами аминокислот, а также конфигурацию химической связи. Второй этап заключался в поиске наиболее энергоэффективной структуры каждого предполагаемого белка. Сейчас у алгоритма на выполнение задачи уходит всего несколько часов — в то время, как люди тратят на то же самое месяцы или даже годы.
Автор: marks