Сегодня я рад презентовать на Хабре образовательную программу «Специалист по большим данным» — интенсивный трехмесячный курс «Лаборатории новых профессий» для разработчиков и экспертов по IT-инфраструктуре, которые хотят войти в быстро в растущую индустрию Big Data.
Самая горячая профессия в IT
Несколько слов о нас: «Лаборатория новых профессий» это образовательный проект Digital October. Мы исследуем рынок труда, находим перспективные быстро развивающиеся ниши в области IT и digital и разрабатываем учебные программы, нацеленные на сложившихся профессионалов, которые хотят сделать быстрый скачок в карьере вместе с растущей индустрией.
Отрасль Big Data дает простор для такого скачка. После всплеска интереса к большим данным и волны первых разочарований, технология начинает находить применение в широком круге реальных проектов. К примеру, в декабре Яндекс объявил о запуске Yandex Data Factory, а на прошлой неделе очередной стартап в области Big Data получил $56 миллионов долларов инвестиций.
Международные источники тоже оптимистичны: IDC называет большие данные одним из важнейших технологических трендов 2015, а авторитетный журнал Inc. включает Big Data в топ 6 важнейших технологических компетенций этого года. Рекрутинговый сервис Glassdoor и вовсе назвал Data Scientist самой горячей IT-профессией 2015 года.
И самое главное: в России несмотря на кризис тоже огромный спрос на специалистов по Big Data — это мы узнали эмпирическим путем. Еще на начальных этапах подготовки программы к нам стали обращаться ведущие технологические компании в поиске сотрудников, специализирующихся на больших данных. Сейчас у нас есть шесть конкретных предложений от компаний (это банки, ритейл и мобильные операторы), готовых взять на борт наших выпускников. В общем, время для входа в отрасль самое благоприятное.
Если рассматривать Big Data на кривой зрелости (hype cycle), о которой не так давно писал Хабр, сейчас технология находится на стадии «склона просвещения»
Обучение через практику
Итак, цель нашей программы — научить разработчиков и технических специалистов на практике решать важнейшие задачи, которыми занимаются специалисты по Big Data. Подобный подход отражается в структуре курса. Курс состоит из трех конкретных кейсов, каждый из которых занимает 1 месяц. Это:
- Анализ социальных графов
- Создание мультиклассных классификаторов на основе анализа веб-логов
- Разработка рекомендательных систем
С нашей точки зрения, это самые важные задачи в области анализа данных, и мы обеспечим студентам полное погружение в каждую тему.
Преподают только представители индустрии
Наши преподаватели — опытные практики, которые своими руками создают приложения на основе больших данных. Вести занятия на курсе в разное время будут Валерий Топинский (экc-Яндекс, ШАД), Константин Круглов (основатель D.C.A. Alliance), Киншук Мишра (Spotify) и другие люди из ведущих российских и международных компаний, использующих в работе Big Data. Индустрия меняется очень стремительно, и мы даем навыки и умения, актуальные прямо сейчас.
Каждый слушатель также получит персонального тьютора, который будет регулярно отслеживать прогресс в выполнении лабораторных работ, смотреть код, помогать с поисками решений и давать обратную связь.
СEO «Лаборатории новых профессий» Дмитрий Репин (справа) и директор образовательных программ Александр Турилин открывают занятие
Kaggle, реальные массивы данных и мастер-классы
Каждый из кейсов в нашей программе преподается в три этапа. Сначала студенты учатся видеть общие закономерности и разбирают хорошо проработанные задачи из Kaggle. Дальше выполняют самостоятельные проекты с реальными данными под руководством тьюторов. К примеру, в рамках второго кейса студенты попробуют оптимизировать алгоритмы показа рекламы в системе D.C.A. Alliance — а тот, кто добьется хороших результатов, не только получит одобрение преподавателей, но и сможет полностью отбить стоимость обучения.
На первых двух этапах студентам даются практические навыки по полному циклу работы с большими данными. Это:
- Развертывание Hadoop/HDFS/HBase
- Предобработка и очистка данных
- Построение модели предсказания
- Выбор оптимального алгоритма машинного обучения
- Калибровка модели
Третья часть кейса позволяет познакомиться с готовыми инструментами и лучшими практиками. Спикеры из Яндекса, Сбертеха, Spotify, МТС, IBM, Cloudera будут проводить мастер-классы и рассказывать, как собирают, хранят и используют большие данные в их компаниях. В этом блоке студенты смогут оценить, насколько специфика данных в различных индустриях влияет на выбор инструментов и алгоритмов анализа.
Собеседование после окончания курса
Как было сказано выше, пока мы готовили курс к нам обратилось сразу несколько компаний в надежде найти специалистов по большим данным. Каждый студент, который успешно выполнит итоговые квалификационные задания (к слову, непростые), получит возможность пройти собеседование. Стратегические партнеры программы — Сбербанк-Технологии и D.C.A. Alliance, они готовы принять на работу большое количество квалифицированных людей. Мы будем внимательно следить за успехами и предпочтениями каждого студента, чтобы помочь найти работу, соответствующую его интересам и компетенции.
Онлайн как оффлайн
Еще одна приятная фишка — возможность учиться из любой точки мира, нисколько не теряя в качестве. Занятия проходят в центре Digital October три раза в неделю по вечерами, но в них можно принять участие и удаленно. Студенты, проходящие обучения в онлайне, ощущают себя полноценными участниками занятий благодаря профессиональной многокамерной съемке — в режиме видеоконференции можно задавать вопросы преподавателю и активно принимать участие в дискуссии. Также записи всех занятий доступны студентам в личном кабинете.
Наши требования к студентам
Сейчас в России есть несколько образовательных проектов для тех, кто хочет связать свою жизнь с большими данными — это “Школа анализа данных” Яндекса и магистерская программа “Системы больших данных” в Вышке — правда, они длятся по несколько лет и ориентированы на студентов и недавних выпускников.
Мы же, напротив, ориентируемся на сложившихся профессионалов, которые хотят совмещать учебу с работой. Курс получился сложным и насыщенным, новичкам он не подойдет. Мы мы честно предупреждаем, что на программе «Специалист по большим данным» придется работать очень интенсивно — как в классе, так и за его пределами, и ждем подготовленных слушателей. Минимальные требования такие:
- Хорошие рабочие знания по основам теории вероятностей и математической статистики
- Опыт разработки приложений от 2-х лет
- Также (очень желательно) знать основы теории машинного обучения.
P.S. А еще мы подумали, что стоит дать пяти талантливым молодым разработчикам шанс поступить на программу бесплатно. Так родился конкурс Big Data Young Champion. Условия участия смотрите на нашей странице в Facebook.
Автор: sashaturilin