На платформе Coursera запускается специализация по анализу данных и машинному обучению от специалистов из Яндекс и МФТИ. Специализация состоит из 6 курсов, которые будут стартовать с февраля до июля. На первый можно записаться уже сейчас.
В основе обучения на курсах лежит решение реальных задач анализа данных. Но чтобы сделать специализацию максимально удобной для изучения, его создатели тоже решали задачи. И решили! В этом посте они сами рассказывают о результатах.
1. Расширение круга слушателей
Задача:
Для работы с методами машинного обучения необходимо знать основы высшей математики и программирования. Не все желающие освоить профессию data scientist, идеально знают теорию. Как сделать курс по машинному обучению доступным самому широкому кругу?
Решение:
Евгений Соколов. В специализации есть первый курс, который помогает людям втянуться. Он учит их языку Python и той математике, которая может в дальнейшем пригодиться. Это сделано для того, чтобы слушатели курса не пугались слов типа «производная» и «вектор».
Эмели Драль. Вводный курс разработан для тех, кто чего-то не знает когда-то знал, но забыл. Нужно напомнить какие-то факты из линейной алгебры или статистики. Допустим, проверку гипотез, потому что слушатель не работал с этим в жизни. Если слушатель не умеет использовать Python, мы рассказываем о нём.
Поэтому в нашей специализации мы можем позволить себе в рамках первого курса сделать вступление, а дальше плавно вводить в машинное обучение. У нас будет более низкий темп, но при этом порог вхождения будет более приемлемым.
Ответ:
Понизить входной порог. Сделать вводный курс, который рассказывает о базовых инструментах машинного обучения.
2. Составление логичной программы
Задача:
Преподаватели курса занимаются анализом данных каждый день и знают, какими знаниями нужно обладать и что уметь, чтобы решать задачи этой области. Перед ними стоит педагогическая задача — отобрать только нужную информацию для курса и изложить её понятно. Какой материал и в каком порядке давать, чтобы слушателям курсов было легко усвоить материал?
Решение:
Эмели Драль. Основная задача, которую мы пытаемся решить специализацией, – это дать людям возможность, знания, инструментарий для того, чтобы они могли заниматься классическим анализом данных. Например, делать построение рекомендательных систем. Последний курс – это финальный проект, решение прикладной задачи. Специализация выстроена так, что каждый предыдущий курс готовит человека к следующему.
Ответ:
Сделать специализацию ориентированной на практику. Каждый курс — это этап решения какой-то большой задачи анализа данных.
3. Практическая ориентированность
Задача:
Потенциальные слушатели специализации хотят применять полученные знания на практике. Чтобы они действительно могли это сделать, какой-то практикум должен быть внутри специализации. Какие задачи необходимо решать, чтобы курс был действительно полезным?
Решение:
Евгений Соколов. Курс с финальным проектом нужен, чтобы слушателям могли хорошенько попрактиковаться. Взять задачу и решить её от начала и до конца, применяя то, что они узнали. Мы подумали, что будет здорово, если выходом проекта будет не просто оценка, а работающая модель. То есть демонстрационная веб-страничка, на которую можно зайти, ввести текст, получить его окрас. Или ввести временной ряд и получить его прогноз.
Это должно быть что-то, что человек сможет развивать дальше. Что-то, что он сможет показывать работодателю на собеседовании или указывать в резюме.
Евгений Рябенко. Мы рассчитываем, что слушатели, которые уже работают, смогут брать свои рабочие проекты, а потом применять к ним новые инструменты.
Эмели Драль. В финальном проекте мы будем давать интересные данные, максимально близкие к настоящим. Мы дадим людям возможность почувствовать себя серьёзными data scientists.
Ответ:
Разбор задач на реальных данных. Отдельный курс для написания финального проекта.
4. Проверка знаний
Задача:
Анализ данных отличается от других точных дисциплин. Например, в математике решение всегда одно, и другого быть не может. В программировании обычно проверяют строгие алгоритмы. В анализе данных всё немного случайное. Можно по-разному оценивать какие-то величины, по-разному включать алгоритмы. Из-за этого ответы сложно проверять. Как выстроить проверку знаний на платформе Coursera и учесть случайность возможных ответов?
Решение:
Евгений Соколов. В ШАДе все задания по машинному обучению проверяют люди. На Coursera, разумеется, так нельзя. Поэтому нам приходится от этого отстраняться и давать полноценные задания, но проверять только маленькие части, для которых мы точно можем проверить ответ. Например, попросим назвать важные признаки в задаче. Будут тесты, которые проверяют, на сколько слушатели поняли материал.
На Coursera есть возможности устраивать peer review: система, когда студенты проверяют задания друг у друга. Но проблема в том, что другие студенты могут просто безответственно относиться к этому, писать в ответ отписки.
Евгений Рябенко. Мы думали для финального проекта сделать leader boards на каждый класс. Чтобы студенты могли сравнивать решения друг друга. Чтобы они видели, как по качеству их алгоритм соотносится с самым лучшим и с самым простым.
Мы подразумеваем, что будет четыре блока задач и внутри каждого блока можно сравнивать друг с другом.
Ответ:
Проверка ключевых однозначных кусков задачи. Peer review. Leader boards.
5. Разрушение стереотипов
Задача:
Один из мощнейших инструментов аналитиков сегодня — это Exel. Но при работе с большими или очень большими объёмами данных он перестаёт быть эффективным. Тем не менее, многие просто привыкли к старым инструментам и с большой неохотой переходят на новые. Как объяснить аналитикам, что новые инструменты выведут их на качественно новый уровень?
Решение:
Эмели Драль. Я думаю, что аналитикам близка математика, поэтому им должно быть легко. Поначалу, возможно, будет некомфортно. Потому что многие привыкли, что в Exel всё работает кнопочками, а в Python надо код написать. Зато потом у слушателя курса в арсенале будет много инструментов. Он будет хорошо понимать, какие задачи лучше решать в Exel, а какие в Python. Слушатель сможет решать больше задач и понимать, как их решать более оптимально.
Ответ:
Вводный курс для введение в программирование. Показываем альтернативные инструменты решения стандартных задач.
6. Открытое образование
Задача:
Политика создателей курса — максимальная открытость образования и доступные знания. Одновременно с этим Coursera — развивающийся стартап, который нуждается в монетизации. Чтобы пройти тесты и получить сертификат пользователям необходимо платить. Как оставаться максимально открытыми на Coursera?
Решение:
Александр Купцов. Большая часть возможностей специализации: просмотр видеолекций, конспектов, форум, проверочные задания для самостоятельной работы — доступна бесплатно. Но задания, которые нужно пройти для получения сертификата, помечены “замком”. Они доступны только после оплаты. Учитывая эту особенность, мы постарались разработать достаточное количество открытых заданий, чтобы слушатель даже без оплаты сертификата мог пройти полноценный курс.
Получить бесплатный доступ ко всем заданиям и сертификату можно, для этого существует программа Coursera Financial Aid. Чтобы получить помощь от Coursera нужно заполнить краткую заявку, с описанием своего финансового положения и причиной зачисления на курс. При заполнении заявки необходимо подтвердить, что:
- Вы затрудняетесь оплатить стоимость сертификата курса;
- Сертификат очень важен для вашего образования или карьеры;
- Вы готовы проходить курс честно и участвовать в жизни сообщества.
Будьте внимательны, кнопка запроса финансовой помощи находится не в самом очевидном месте
Не стоит стесняться пользоваться этой возможностью, так как в прошлом году было одобрено более 100 тысяч заявок Coursera Financial Aid.
Ответ:
Дополнительные тесты без оценки. Кнопка “запросить финансовую поддержку”.
Автор: