Секвенирование генома человека десять лет назад явилось причиной вычислительной революции в биологии. Оно стало стимулом для создания бо́льшего числа новых алгоритмов, чем в любой другой фундаментальной области науки.
21 октября мы с Филлипом Компо и Павлом Певзнером из Университета Калифорнии запускаем онлайн-курс по алгоритмам в биоинформатике на Coursera. Уже до 21 октября можно посмотреть содержание первой главы курса и порешать задачи на нашем новом образовательном проекте Stepic, над которым работает команда широко известного в узких (биоинформатических) кругах проекта Розалинд.
Секвенирование генома является лишь одной из сотен биологических задач, которые стали неразрывно связаны с вычислительными методами, необходимыми для их решения. В этом курсе будут рассмотрены алгоритмические идеи, которые являются фундаментальными для понимания современной биологии. Такие вычислительные понятия, как динамическое программирование и теория графов, помогут изучить алгоритмы, применяемые в широком спектре биологических задач: сборке геномов, сравнении последовательностей ДНК и белков, поиске регуляторных мотивов, анализе перестроек генома, идентификации белков, восстановлении дерева жизни и многих других. На протяжении всего курса, участники будут применять реальные алгоритмы из биоинформатики к реальным генетических данным.
Каждая глава курса содержит отдельно взятую биологическую тему. Например, первая глава посвящена поиску точек начала репликации (позиций в геноме, с которых ДНК начинает делиться в клетке), и как эту с первого взгляда сугубо биологическую задачу можно решить с помощью простого программирования и анализа геномных последовательностей.
Программа курса по неделям
- Поиск точек начала репликации: Where Does DNA Replication Begin? (Algorithmic Warm-up)
- Вычислительная масс-спектрометрия: How Do We Sequence Antibiotics? (Brute Force Algorithms)
- Поиск часто повторяющихся последовательностей (регуляторных мотивов): Which DNA Patterns Act As Cellular Clocks? (Greedy and Randomized Algorithms)
- Сборка геномов: How Do We Assemble Genomes? (Graph Algorithms)
- Геномные перестройки: Are There Fragile Regions in the Human Genome? (Combinatorial Algorithms)
- Выравнивание строк: How Do We Compare Biological Sequences? (Dynamic Programming Algorithms)
- Быстрый поиск подстроки, индексирование строк: How Do We Locate Disease-Causing Mutations? (Combinatorial Pattern Matching)
Вступительное видео профессора Певзнера
Massive Open Online Research
Важной составляющей курса являются открытые научные задачи, сформулированные к каждой главе. Дискуссию по каждой задаче будет курировать ведущий учёный-биоинформатик в каждой конкретной области. Например, открытые задачи из первой главы курса курируют Михаил Гельфанд (ИППИ РАН, МГУ), Uri Keich (University of Sydney) и Glenn Tesler (UCSD).
Ссылки по теме
- Coursera: Bioinformatics Algorithms (Part 1)
- Stepic: Bioinformatics Algorithms: An Active-Learning Approach
- Пресс-релиз курса от University of California, San Diego
- Пресс-релиз курса от California Institute for Telecommunications and Information Technology
- UC San Diego Team To Intro Massive Open Online Research
- Предварительная детализированная программа курса (pdf)
- Розалинд — платформа для изучения биоинформатики
- Институт биоинформатики
Автор: vyahhi