Вот уже «тысячу лет» ничего не писал, но вдруг неожиданно появился повод сдуть пыль с мини-цикла публикаций по «обучению Data Science с нуля». В контекстной рекламе одной из соцсетей, а также на любимом «Хабре», я наткнулся на информацию о курсе «Старт в Data Science». Стоил он сущие копейки, описание курса было красочное и многообещающее. «Почему бы не восстановить, запылившиеся от ненадобности навыки пройдя очередной курс?» — подумал я. Также свою роль сыграло любопытство, давно хотелось посмотреть, как устроена организация обучения у этой конторы.
Сразу предупрежу, я никак не аффилирован с разработками курса или их конкурентами. Весь материал статьи — мое субъективное оценочное суждение с легким налетом иронии.
Итак, вы все еще не знаете куда стоит вложить свои кровные 990 рублей? Тогда милости прошу под кат.
В качестве небольшого предисловия скажу о том, что несколько скептически отношусь к многообещающим курсам способным из новичка в короткие сроки сделать «успешного аналитика данных с зарплатой свыше 100 000 рублей» (хотя вы наверняка об этом догадались по заглавной картинке статьи).
Несколько лет назад на волне активной рекламы обучения Data Science, я попробовал разными способами освоить хоть что-нибудь из области науки о данных и поделился о своих шишках с читателями Хабра.
- «Ловись Data большая и маленькая!» — (Краткий обзор курсов по Data Science от Cognitive Class)
- «Теперь он и тебя сосчитал» или Наука о данных с нуля (Data Science from Scratch)
- «Айсберг вместо Оскара!» или как я пробовал освоить азы DataScience на kaggle
- «Паровозик, который смог!» или «Специализация Машинное обучение и анализ данных», глазами новичка в Data Science
2. Практикуем первые навыки
- “Восстание МашинLearning” или совмещаем хобби по Data Science и анализу спектров лампочек
- «Как по нотам!» или Машинное обучение (Data science) на C# с помощью Accord.NET Framework
- «Используй Силу машинного обучения, Люк!» или автоматическая классификация светильников по КСС
- «4 свадьбы и одни похороны» или линейная регрессия для анализа открытых данных правительства Москвы
- «Письмо турецкому султану» или линейная регрессия на C# с помощью Accord.NET для анализа открытых данных Москвы
И вот спустя долгое время я решил попробовать еще один курс.
Описание курса:
Описание курса «Старт в Data Science» обещает, что, потратив всего 990 рублей (на момент написания статьи) мы получим четырехнедельный курс в формате видеолекций и практических заданий для новичков. Также не забудем про компенсацию части стоимости курса в виде налогового вычета (Обещают все документы выслать на почту).
В рамках курса есть два условных блока, один расскажет о том, что такое «Наука о данных», какие есть популярные направления, как можно развивать карьеру в сфере DataScience. Второй блок рассматривает пять инструментов для анализа данных: Excel, SQL, Python, Power BI и «Культура работы с данными».
Ну что же звучит «вкусно» оплачиваем курс и ждем даты старта.
В предвкушении заходим в личный кабинет за день до начала курса, листаем напутственные слова от разработчиков и ждем уведомления о долгожданном старте курса.
Время пролетело незаметно, «День Д» настал, можно приступать к обучению. Открыв первый урок, мы увидим привычную для систем онлайн обучения схему – видеолекция, дополнительные материалы, тесты и домашние задания. Если вы когда-либо пользовались Coursera, EDX, Stepik то никаких проблем у вас возникнуть не должно.
Внутри курса:
Пойдем по порядку. Тема первого урока — «Обзор DS: основа, польза, применение», начинается он с видеолекции, как и все последующие уроки.
И вот уже самого начала чувствуется, что товарищи руководствовались подходом «Итак сойдет» из моего любимого советского мультфильма.
С первой же минуты понимаешь, что материал для курса не был записан специально, а был выдран из каких-то других открытых уроков или профильных курсов. Также к видео отсутствуют субтитры и возможность загрузки для просмотра оффлайн.
После лекции предложены дополнительные материалы к уроку (презентация из видеолекции и рекомендуемая литература), их мы разбирать не будем.
Затем нас ожидает тест. Тесты бывают разные по степени сложности и адекватности вопросов пройденному материалу.
И вот тут еще раз проявляется отсутствие заинтересованности в результате обучения, тест можно завалить, но это ни на что не повлияет, урок вы все равно успешно пройдете, а вот запрос дополнительной попытки для пересдачи останется скорей всего без ответа.
В последующем, схема занятия: «видео -> доп. материалы -> тест» – будет основой всего курса.
Иногда урок будет разбавляться анкетированием и самостоятельными домашними заданиями.
Домашних заданий всего два. И если честно прошел я только одно.
Первым домашним заданием необходимо отправить свое резюме с описанием ключевых навыков. Не могу утверждать на 100%, но мне кажется, что примут практически любое резюме и задание зачтут. После задания вам пришлют дополнительные материалы — рекомендации. Вспоминая, как я мучился с домашними заданиями на Coursera я даже немного расстроился такой простоте.
После завершения вводной части начинается изучение долгожданных «Инструментов для начала работы в Data Science». И первым идет урок с громким заголовком: «Работа в Excel: прокачка навыков от нуля до аналитика».
Ого! Звучит заманчиво, но на деле разница между ожиданием и фактом такая же как между фотографией гамбургера из рекламы фастфуда и тем, что вам отдадут на кассе.
По сути, мы будем наблюдать как двигаясь от автозаполнения ячеек в Excel до сбивчивого описания функции «ВПР()», преподаватель будет как Гамлет колебаться, на тему вопроса «To be, or not to be» «Объяснить все для новичков» или «Дать материал интересный для профи». По моему субъективному мнению, не получилось ни того, ни другого.
Особенно здорово, что несмотря на то, что в рамках курса не предусматривается живого вебинара. То есть это не записи тех занятий что вы пропустили, а просто записи занятий, которые прошли когда-то давно (см. рисунок ниже), авторы все равно решили сохранить атмосферу (а может просто поленились) и заставляют вас по пять минут смотреть, как преподаватель решает проблемы со звуком.
После видео по стандартной схеме следуют – дополнительные материал и тест.
Следующая тема про язык SQL. В уроке даны самые основы и примеры работы с SQL запросами, в принципе видео и статьи на подобную тему можно спокойно найти в интернете совершенно бесплатно.
За SQL идет урок по обработке датасета с Kagle с помощью библиотеки Python «Pandas». Схема занятия не изменилась: видео -> доп. материалы -> тест. Никаких дополнительных заданий не предусмотрено, нет даже задания с автоматической проверкой результатов. Таким образом ставить «Анаконду» и писать код вам точно не придется. Также стоит отметить мелкий шрифт кода в видеолекции, на телефоне ее смотреть – бессмысленно, да и на мониторе пришлось смотреть практически в упор.
Четвертый урок «Визуализация отчета по логистике в PBI за 10 минут» (видео кстати длится минут 50)
. В данном видео расскажут про любопытный инструмент Power BI, если честно никогда раньше о нем не слышал.
Неожиданное завершение курса:
Финальный пятый урок расскажет, об общих принципах грамотного хранения данных, лекция опять-таки выдрана из другого курса. В данном уроке помимо стандартного теста снова появляется домашнее задание, но делать я его не стал. Хотите узнать почему?
Потому, что, открыв сегодня страницу курса, пройденного только на половину, я увидел это:
То есть система посчитала, что курс я успешно прошел, хотя по факту я его не завершил.
Причем после просмотра всех оставшихся видео и провождения тестов, счетчик не изменился, а так и остался на отметке 56%. Я предполагаю, что мог бы вообще ничего не смотреть и не проходить тестов и все равно получил бы «Диплом».
Особенно удивительно, то что в рассылке официально курс длился с 22 июля по 14 августа, а «Диплом» мне выдали уже 04.08.2019.
Итог обучения
Сайт компании по окончании обучения обещает нам: «Вашу квалификацию подтвердят документы установленного образца». Но вот беда, данный курс похоже не является ни программой переподготовки, ни программой повышения квалификации, а значит вы получите просто «сертификат», который официального статуса в принципе не имеет.
Наверное, резонным будет вопрос: «А что ты ожидал за 990 рублей?». Если честно – ничего не ожидал. Понятно, что качественные курсы стоят существенно дороже. Но вся беда в том, что есть бесплатные курсы, которые сделаны не то, что не хуже, а в разы более профессионально, например курсы от MVA или от Cognitive Class. Тот же самый «сертификат» о прохождении курса (если он хоть кому-то нужен), там можно получить совершенно бесплатно.
Из плюсов, можно отметить то, что данные обзорные материалы собраны в одном месте и совсем незнакомому с Data Science человеку будет действительно проще сориентироваться в этой области.
По окончанию курса нам обещают, что мы выучим кучу инструментов, а в своем резюме сможем написать вот так:
По факту это очень сильное преувеличение. О многих инструментах вы по сути просто услышите и не больше.
Резюме
На мой взгляд курс несет минимум полезной нагрузки, особенно огорчает то, что авторы поленились записать отдельные видеолекции для него. По-хорошему за такое стыдно просить деньги, ну или надо просить раз в 10 меньше.
Но еще раз повторюсь, что всё вышесказанное лишь мое субъективное оценочное суждение, проходить этот курс или нет — решать Вам.
P.S. Возможно со временем авторы курса его доработают и вся статья потеряет актуальность.
На всякий случай напишу, что справедлива она для самого первого запуска этого курса с 22 июля по 14 августа
P.P.S. Если пост на столько вышел неудачным, я его удалю, но в начале хотелось бы почитать критику, может просто что-то надо подредактировать. А то пока это выглядит, как минусование неудобной критики некачественного курса
Автор: Роман