Биткоин-бот имени Дональда Трампа, победа AlphaGo над одним из сильнейших игроков в го Ли Седолем, изучение английского языка — что объединяет эти три ситуации? Везде в той или иной степени присутствует машинное обучение.
Компьютер может не только генерировать сюжетную канву, как Scheherazade, или отвечать на письма вместо пользователей, как Google Smart Reply, но и создавать идеальные учебники английского языка.
В помощь учителю
В Skyeng все учителя ведут уроки при помощи интерактивной онлайн-платформы Vimbox. Все материалы урока, упражнения, тексты, аудио- и видеофайлы хранятся на платформе. Урок на Vimbox спланирован буквально по минутам: учитель видит подсказки о том, какие вопросы задать ученику, как лучше отработать упражнение и что задать на дом. Занятия проходят в интерактивном формате – учитель видит, как ученик выполняет упражнения, какие слова добавляет в словарь и какие грамматические конструкции вызывают у него трудности; при этом он может оперативно помочь, объяснить нужную тему.
В процессе собирается большой объем статистических данных. Платформа фиксирует все действия ученика и учителя – сколько они разговаривали, на каком языке, как быстро ученик делал упражнения, какие у него получились ответы и где учитель ему помогал. Мы можем оценить объем домашнего задания, скорость взаимодействия с текстами и упражнениями, объем объяснений, количество прослушанных записей и много других параметров взаимодействия учителя и ученика на уроке. Ученик же может дать оценку и материалам урока, и преподавателю (эту оценку учитель не видит).
Этот массив данных служит помощником для преподавателя. Перед каждым уроком система напомнит ему, каким объемом лексики владеет ученик, с какими проблемами пришлось столкнуться на предыдущих занятиях, какие задания были выданы и насколько быстро студент с ними справился и т.д., вплоть до его интересов и хобби. Это важное подспорье, поскольку преподаватель не может помнить все подробности про каждого своего ученика. Однако пока учитель анализирует эту информацию самостоятельно и выстраивает урок на основании собственных выводов. Может ли ему помочь обучающаяся машина?
Мы считаем, что да. Объем собираемой во время уроков информации настолько велик, что учитель просто не сможет всю ее переварить за пять минут подготовки к уроку. А машина – вполне. Мало того, она может сравнить данные конкретного студента с базой данных по всем ученикам, выявить закономерности, и на основании всего этого массива анализировать текущий урок «на лету», выдавая преподавателю подсказки: с этой грамматической конструкцией у студента будут проблемы, заостряем на ней внимание; это задание можно пропустить, потому что оно не вызовет никаких трудностей, заменяем его вот этим; эта тема ученику интересна, а с этой он, скорее всего, «закроется» и т.д. Обучающаяся машина становится своего рода вторым, закулисным преподавателем, повышающим эффективность урока.
Применение машинного обучения выгодно нам и коммерчески:
— экономится время преподавателей и методистов. ИИ может взять на себя как рутинную работу, так и базовую аналитику;
— повышается эффективность преподавателей. Машина всегда подскажет, если учитель что-то забыл, пропустил или допустил ошибку;
— перед нами открывается масса новых возможностей. Мы можем создавать уникальные продукты, недоступные нам ранее;
— наконец, мы с полным основанием можем рассказывать о своей высокотехнологичности в маркетинговых материалах.
Семантический анализ
Еще одна задача из области изучения языка, которую можно успешно решить машинным обучением – создание семантического анализатора. Предположим, вы читаете текст на любимом веб-сайте или пост в социальной сети. Вам попадается незнакомое слово на английском, нужен его перевод в данном контексте. Не все варианты значения слова, представленные в англо-русском словаре, и не машинный перевод всей фразы, а именно перевод данного слова в данном месте. Семантический «парсер» анализирует все слова в тексте и связи между ними, делает разметку, чтобы выудить релевантное значение нужного слова.
Забивать все возможные семантические связи вручную – задача практически невыполнимая. Здесь нам тоже на помощь приходит машинное обучение. Учитель в ходе обычного урока просто «подправляет» автоматический перевод, а анализатор, просмотрев окружающий текст, старается обнаружить и запомнить все закономерности. Несколько таких поправок – и результат перевода становится близким к идеальному.
Семантический анализатор поможет читать тексты, сразу получать релевантные переводы и добавлять слова в нужном значении в персональный словарь. В Vimbox словарь функционально связан с мобильным приложением, которое используется для повторения слов между уроками. Работа мобильного приложения основана на алгоритме, который копирует системность работы долговременной памяти, поэтому заучивание слов происходит не рандомно, а с определенными интервалами. Но это темя для отдельной публикации, которую мы тоже готовим.
Идеальный учебник
Процесс улучшения содержания учебных материалов – важная задача, которой озабочены все мировые издатели учебников, такие как Oxford University Press, Macmillan, Cambridge и Pearson. Неоценимую помощь в этом деле оказывает богатая статистическая база о взаимоотношениях ученика и учителя, собранная школой Skyeng.
Мы проанализировали 308 000 уроков, проведенных на платформе Vimbox, и пришли к интересным выводам. Например, есть упражнения, которые учителя регулярно пропускают и не задают своим ученикам. Есть упражнения, где количество правильных ответов достигает 98%. Мы задались вопросом – в чем смысл таких упражнений, не являются ли они слишком легкими и очевидными с точки зрения ученика? Несут ли они педагогический эффект?
Преподаватель пропускает то или иное упражнение на основе собственных опыта и интуиции. Используя алгоритмы машинного обучения и накопленные данные, мы можем создать систему, имитирующую опыт и интуицию сразу всех наших преподавателей, и создать с ее помощью «идеальный урок» для каждого ученика, а из таких уроков – персонифицированый «идеальный учебник».
В обучении английскому можно анализировать учебник и составить какое-то подобие Google Knowledge Graph. Например, в какой последовательности повторяется ранее пройденный материал, как лексический, так и грамматический, правильно ли идет изучение грамматики, насколько взаимосвязаны изучаемые темы. Можно выявлять оптимальную длину аудирования для того или иного уровня знания английского, настраивать показ видеороликов, оптимальную модель чередования письменных и устных упражнений – все это будет возможно при помощи машинного обучения. Мы сможем анализировать типичные ошибки в письменных работах учеников в нашем инструменте Эссе и проверять работы в полуавтоматическом режиме с выдачей подсказок для оптимизации работы.
Мы пока находимся в самом начале пути, поэтому активно интересуемся всеми современными наработками в области машинного обучения, стараемся участвовать в экспериментах, связанных с этой темой. Один из таких экспериментов – конкурс BlackBoxChallenge, партнером которого является школа Skyeng. Знатоки языка Python могут попробовать свои силы в создании искусственного интеллекта – агента, отправляющегося в Черный Ящик, где его ждут неведомые приключения и загадки. На входе участники не имеют никакой информации о том, что происходит в Ящике, и им нужно создать Агента, который сможет сам научиться играть в игру с неизвестными правилами.
Конкурс уже подходит к концу — прием решений завершается 30 мая.
Призовой фонд составляет 600 000 рублей, сейчас за него борются около 1280 человек.
Автор: