Вчера в блоге Microsoft Education Team была опубликована обширная запись, которая презентует голосового ассистента для пакета продуктов Office 365, а также ряд обновлений других продуктов. В первую очередь речь идет о добавлении функций Dictation for Office 365 Desktop Apps в веб-версии продуктов Office 365 для учащихся, а также выход продукта Office Lens на платформе Android, который ранее был доступен только пользователям iOS. И это не полный список всех «вкусностей» от Microsoft. Все эти активности проходят совместно с организацией Made Dyslexia, в рамках которых технологический гигант планирует создавать учебные материалы и пособия для учеников и студентов, страдающих дислексией.
Важность публикации MS Education Team еще и в том, что она явно показывает один из приоритетных, а главное потенциально конкурентных направлений деятельности компании — развитие систем голосового ввода и распознавания текстов на пользовательских устройствах для всех существующих экосистем, подробнее о которых под катом. Там мы кратко расскажем о новинках от Microsoft без маркетинговых восторгов и обсудим, что вообще происходит и почему когда-то «главная корпорация зла» внезапно оказалась на передовой в области обучения подрастающего поколения.
По приводимой сотрудниками Microsoft статистике практически каждый пятый учащийся (по другим данным — до 15%) страдает той или иной формой дислексии — избирательным нарушением способности распознавать части написанного текста либо писать самостоятельно, без нарушений способности к обучению. Часто дислексия сопровождается СДВГ (о котором на Хабре можно почитать тут «из первых рук»). Фактически люди с дислексией обладают нормальным интеллектом, могут и зачастую хотят учиться, но не способны это делать из-за особенностей работы собственного головного
Как мы говорили выше, Microsoft выносит свой Dictation for Office 365 из приложения в веб-надстройку для Word Online и OneNote Online, который будет работать под любым современным браузером (да, ожидаемого подвоха с прибитым гвоздями функционалом к Edge не произошло, но об этом чуть позже).
Второй важный продукт, который попадает в широкий доступ — Immersive Reader. Эта разработка организует построчное прочтение текста с математическими формулами для облегчения восприятия такого смешанного текста:
Все это будет работать в связке с Math Pane, другим обучающим продуктом компании. Immersive Reader будет доступен на недавно приобретенной Microsoft образовательной платформе Flipgrid, которую компания купила в июле этого года и перевела на бесплатную основу. Этот вектор развития продуктов Microsoft направлен на борьбу с конкретным видом дислексии — дискалькулией, при наличии которой человек с трудом визуально воспринимает математические выражения и формулы. Проистекает это заболевание из неспособности
Кроме этого Immersive Reader перекочует и на Andoid, на этот раз в связке с Office Lens — что обеспечивает захват и оцифровку напечатанного текста. Ранее продукт был доступен только для iOS.
Все описанные выше «читалки» не ограничиваются английским и имеют обширный перечень поддерживаемых языков, в том числе и русский (ознакомиться можно тут). Edge также не обошли стороной нововведения. В свой браузер Microsoft встраивает словарь для ePub и PDF-файлов, а также новый режим построчного просмотра текста.
Что вообще происходит?
Если вы не следите за деятельностью Microsoft или соприкасаетесь с новостями компании только в рамках просмотра презентации xBox на E3, то вполне закономерно, что ваша реакция может быть примерно такой:
Есть четкое ощущение, что Microsoft намеревается выплатить свои кармические долги за предыдущие годы работы (а как минимум верстальщикам за IE6 они задолжали немало), и активно расширяет свое присутствие в образовательной и Open Source-сферах.
Кроме платинового членства в Linux Foundation, корпорация активно развивает комплексные решения для учебных заведений всех ступеней образования. Причем если 10-15 лет назад этот процесс начинался с продажи пакетов лицензий для компьютерных классов, то сейчас Microsoft предлагает школам и высшим учебным заведениям комплексные программно-аппаратные решения на базе Windows 10 и Office 365. Объективно, на этом рынке сопоставимого по размерам и ресурсам конкурента у Microsoft нет. Потенциально с гигантом могут тягаться только Amazon и Apple, но обе компании концентрируются на других сегментах рынка и не заинтересованы в образовательном сегменте так, как Microsoft.
В последней презентации важно то, что значительная часть презентованных Microsoft новинок будет доступна уже к концу октября, причем бесплатно. Тот же Flipgrid был выкуплен Microsoft и переведен на бесплатную основу, хотя изначально проект имел коммерческую природу. Также функция иммерсивнного чтения успешно существует минимум в Word Online (вкладка «Вид») и неплохо читает по-русски.
Не стоит забывать о том, что у представленных в рамках образовательных программ Microsoft продуктов и функций, при правильном их внедрении, есть большое будущее. До сих пор на рынке не было реализовано сколь угодно приличное и при этом простое решение по переводу надиктованного текста в письменный вид. Единственный нюанс — устная речь зачастую намного проще, чем письменный текст. Сейчас Microsoft работают в обратном направлении и специально для дислексиков разрабатывают алгоритмы, которые бы упрощали сложные письменные тексты до более простого уровня, чтобы облегчить их восприятие на слух. Если корпорация сможет в будущем развернуть эти работы на 180 градусов и научить голосовые системы ввода «облагораживать» устную речь до приемлемого для письменной речи уровня, это будет определенно прорыв.
Другая область применения системы — конвертация голосовых сообщений в текст в рамках общения в мессенджерах. Зачаток этой системы несколько лет назад тестировался в рамках Skype (система синхронного перевода), но из-за своей сложности не получила должного распространения. С другой стороны, голосовые сообщения сейчас крайне распространены в социальных сетях или Telegram, но часть аудитории просто отказывается ими пользоваться по ряду причин. Например потому, что это удобно только для «отправляющей» голосовое сообщение стороны, а вот «принимающий» аудиозапись тратит значительное время на прослушивание. Страшно сказать, но функция Voice-to-Text могла бы даже вдохнуть новую жизнь в агонизирующий Skype (после серьезной переработки и облегчения этого продукта, само собой).
Автор: Crossover