Широко известны сайты для решения олимпиадных задач по программированию, такие, как, например, TopCoder и Codeforces, а также сборники математических задач-головоломок, например, Project Euler. За последний год произошёл бум онлайн образования: возникли стартапы Coursera и Udacity, предоставляющие онлайн курсы от топовых университетов США… но для тех, кто хочет изучить биоинформатику, пока ничего нет.
Розалинд — проект, разрабатываемый в Санкт-Петербуге и University of California, San Diego с мая 2012 года, как раз заполняет эту нишу. Это платформа для обучения биоинформатике с помощью решения задач, бесплатная и открытая.
Всё обучение строится вокруг задач, которые и составляют основное содержание сайта:
Каждая задача содержит биологическое обоснование и строгую формулировку, достаточную для формального решения. Например, в двенадцатой задаче необходимо из небольших фрагментов ДНК собрать геном. Также там рассказывается, что такое секвенирование и зачем это нужно:
Пользователь может решать задачи на любом языке программирования и даже на бумажке, но после скачивания с сайта тестового датасета у него будет лишь пять минут для его обработки. Если ответ неверный, ничего страшного, можно пробовать неограниченное количество раз, но при этом датасет каждый раз генерируется заново.
Не все задачи можно решать сразу, вернее, сразу можно решить только первую. Задачи выстраиваются в граф зависимостей, чтобы процесс обучения был осмысленнее и материал осваивался по порядку. Но если вас больше интересует, например, только сборка геномов (genome assembly), либо выравнивание (sequence alignment), либо вычислительная протеомика (computational proteomics), то можно углубиться в определённом направлении по графу зависимостей и не решать другие задачи. Таким образом, полученные знания будут глубже в выбранной теме.
И, конечно, на сайте есть профили, а также зачатки игровой механики: уровни и бейджи.
Надеюсь, Розалинд будет полезен всем, кто хочет окунуться в этот интереснейший мир биоинформатики или просто изучить что-то новое.
Проект активно развивается, поэтому мы с радостью выслушаем любую критику. В частности, 26 августа в Петербурге пройдёт международная конференция RECOMB Bioinformatics Education, одной из главных тем которой станет Розалинд.
Система уже поддерживает переиспользование задач в своих курсах, так называемые «профессорские аккаунты», благодаря чему мы внедрим Розалинд в образовательный процесс UCSD и Harvey Mudd весной 2013. Для России это не так востребовано, потому что программ по биоинформатике особо-то нигде и нет. Но с Розалинд это становится проще, — может быть, появятся?
Мы постоянно добавляем новые задачи: сейчас их 42 и примерно столько же находятся в черновиках. Недавно появилась возможность принимать и курировать пользовательские идеи для задач, чтобы биоинформатическое сообщество смогло участвовать в процессе создания контента.
В планах видеозапись лекций по биоинформатике в UCSD и создание нескольких онлайн курсов на основе этого материала.
P.S. Проект назван в честь Розалинд Франклин, чьи исследования привели Уотсона и Крика к открытию спиралевидной структуры ДНК. Розалинд умерла от рака за четыре года до присуждения Нобелевской премии за это открытие, в 37 лет, так как имела наследственную предросположенность и много работала с радиацией.
Автор: vyahhi