27 сентября начинается курс по машинному обучению от Почты Mail.Ru. Занятия будут проходить два раза в неделю в офисе Mail.Ru Group в течение трех месяцев. Регистрация открыта для студентов московских ВУЗов.
В ходе курса специалисты Почты и Антиспама Mail.Ru расскажут об ML-технологиях, которые применяются для того, чтобы сделать Почту еще более удобным и современным продуктом. Под катом подробности о курсе: формат, программа, авторы и перспективы для выпускников.
Формат
Курс состоит из 20 занятий: 18 лекций и 2 экзамена (промежуточный и финальный). Каждое занятие содержит теоретическую и практическую части; в ходе практической части слушатели разработают несколько классификаторов, основательно поработают с текстом и реализуют базовые алгоритмы, понимание которых необходимо в работе.
Также участников ждет 5 практических домашних заданий. По словам авторов, «сложность будет подобрана так, чтобы над задачей нужно было поломать голову, но не в ущерб учебе в университете».
Программа
- Регрессия от одной переменной и нескольких переменных. Переобучение и способы борьбы с ним.
- Логистическая регрессия. Бинарная и многоклассовая классификация. Классификатор kNN.
- Метод опорных векторов.
- Работа с текстом: препроцессинг и векторное представление, задачи классификации.
- Тематическое моделирование: pLSI, LDA.
- Векторное представление текста: word2vec, fastText.
- Алгоритмы понижения размерности: PCA, LSH.
- EM-алгоритм, k-means и s-means алгоритм.
- Иерархические алгоритмы кластеризации. Метрики оценки кластеризации.
- Деревья решений. Ансамбли деревьев: случайный лес.
- Градиентный бустинг над деревьями: xgboost.
- AB-тестирование.
- Интервальные оценки качества классификаторов в production.
Занятия будут проходить два раза в неделю (вторник, четверг) с 18:00 до 21:00 в офисе Mail.Ru Group с 27 сентября по 11 декабря.
Курс разработан для того, чтобы подробнее рассказать, как машинное обучение используется в реальных задачах. В отличие от большинства курсов по ML, в данном сделан упор на практику, а не на академическую составляющую. Главная цель авторов заключается в том, чтобы после прохождения курса студенты могли решать типовые практические задачи.
Стажировка после обучения
Выпускникам будет предложена оплачиваемая стажировка в командах машинного обучения Почты и Антиспама, где методами ML решаются такие задачи, как фильтрация нежелательного трафика, определение взломов, отделение важных писем от неважных, классификация смысловой направленности писем и др. Видео о команде Почты.
Стажеры работают над боевыми задачами, их единственное отличие от опытных коллег — возможность выстроить гибкий график, работая 20 часов в неделю. На стажировку можно попасть только после завершения образовательных проектов компании Mail.Ru Group.
Как поступить на курс
Курс рассчитан на старшекурсников и аспирантов технических ВУЗов, обучающихся на математическом или физико-техническом направлении.
Чтобы попасть на курс, необходимо зарегистрироваться по ссылке до 10:00 (мск) 22 сентября и пройти онлайн-тестирование в любое время с 10:00 22 сентября по 10:00 24 сентября. Ссылка на тест придет на почту, указанную при регистрации, и будет доступна в течение двух суток. Занятия начнутся 27 сентября.
Необходимый минимум для поступления:
- знания линейной алгебры и теории вероятностей;
- умение программировать на Python;
- знакомство с Numpy и Sklearn;
- плюсом будет знание методов оптимизации.
Материалы для подготовки:
- книги: Зорич «Математический анализ», Ю.В. Прохоров, Л.С. Пономаренко «Лекции по теории вероятностей и математической статистике», Боровков А.А. «Теория вероятностей», Гмурман В.Е. «Теория вероятностей и математическая статистика»;
- курс лекций «Нейронные сети в ML» на обучающем канале Технострим: https://www.youtube.com/playlist?list=PLrCZzMib1e9oOGNLh6_d65HyfdqlJwTQP;
- полезная информация по Python: http://www.bafflednerd.com/learn-python-online/.
Первое занятие пройдет уже на следующей неделе. Регистрируйтесь на курс, проходите обучение и присоединяйтесь к ML-индустрии!
Автор: Olga_ol