Одно из наиболее интересных подразделений в Microsoft — это Microsoft Research. В этом подразделении ведутся исследования и разработки на самые разные темы и, помимо всего прочего, присутствует такой проект, как Microsoft Azure for Research. Этот проект помогает исследователям использовать облачные вычисления в своей работе путем безвозмездного предоставления вычислительных мощностей Microsoft Azure. Наш Центр изучения Интернета и общества получил этот грант, и в этом посте я расскажу, как это было и что из этого вышло.
Немного о нашем проекте, под который мы получали грант
Социальная сеть ВКонтакте на сегодняшний день в 5-10 раз больше русскоязычного Facebook и представляет большой интерес для исследователей. Граф пользователей содержит около 220 миллионов узлов, а количество постов исчисляется миллиардами. При этом, ВКонтакте часто игнорируется исследователями из социальных дисциплин, несмотря на более открытую политику конфиденциальности, чем, например, у Facebook. Частично это можно объяснить сложностью сбора большого объема данных, включающих пользователей и их друзей, посты и комментарии к ним, данные по лайкам и репостам. Кроме того, отсутствуют готовые инструменты анализа, как, например, NodeXL для Facebook. Можно предположить, что социологи не всегда обладают необходимыми навыками программирования и управления базами данных. Цель нашего проекта — решить эту проблему и выпустить в открытом доступе анонимизированный набор данных, содержащий связи между пользователями, группами, постами и лайками. Благодаря Microsoft Azure мы постараемся упростить задачу ученых из социальных наук и дать им дополнительные возможности для анализа.
Заявка на грант
Процесс получения гранта начинается с написания заявки, подробные требования к которой описаны на сайте проекта — http://research.microsoft.com/en-us/projects/azure/. Вкратце, заявка должна быть не более трех страниц в свободной форме, в ней должна быть описана проблема, над которой работают исследователи, и почему она важна. Кроме того, необходимо описать требуемые ресурсы. При этом не стоит стесняться и запрашивать меньше необходимого — размер гранта большой, и, как написано на сайте в разделе FAQ, запрос на 200 Тб хранилища и 200 000 часов является допустимым. В своей заявке мы написали, что нуждаемся в 4 Тб SQL Premium, 8 Тб хранилища, 32 экземплярах облачной службы и 30 Тб трафика.
После того, как заявка написана, необходимо заполнить простую форму на сайте (http://www.windowsazurepass.com/research) и надеяться, что вашу заявку одобрят. Заявки рассматриваются 15 числа каждого четного месяца — поэтому процесс получения гранта может несколько затянуться, но на электронную почту будет приходить оповещения о прохождении заявки по инстанциям, так что вы всегда будете в курсе текущей ситуации.
Несмотря на то, что тематика проектов не ограничивается, иногда проводятся специальные программы. Так, 15 апреля был дедлайн по проекту “Виртуальные машины для исследований”, а на текущий момент присутствует проект “Климатические данные” с дедлайном 15 июня.
Результаты
Мы отправили нашу заявку 24 января, 2 февраля на почту пришло сообщение, что наша заявка находится на рассмотрении и это может занять до 60 дней, а 7 марта нашу заявку одобрили. Таким образом, весь процесс (не считая времени написания заявки) занял 42 дня.
В итоге мы получили:
- 32 экземпляра облачной службы для виртуальных машин
- 10 Тб хранилища
- 1 млрд. транзакций с хранилищем
- 10 Shared-веб-сайтов / мобильных служб
- 100 млн сообщений Service Bus
- 100 Гб SQL Database
- 2 Тб трафика в месяц
Длительность гранта составляет 1 год, что вполне подходит для нашей задачи. Непонятно только, почему нам дали всего 100 Гб SQL Database. На текущий момент максимально возможный размер SQL Database составляет 150Гб, а SQL Database Premium — 500 Гб. Могли бы дать и больше :)
Так что, если вы работает в исследовательской организации, то вполне можете получить этот грант. Как показал наш опыт — это вполне реально, надо только собраться и написать заявку.
Автор: jgc128