Система оптического распознавания текстов (OCR) на Google Drive пополнила список поддерживаемых языков — теперь их количество превышает 200 (клингонского пока нет). Вместе с тем, число систем письма, в которых может быть написан текст, выросло до 25. Для добавления новых языков и улучшения распознавания старых инженеры используют скрытые модели Маркова, которые применяются в компании для возможностей распознавания речи и голосового поиска.
Последовательность распознавания текста очень проста. Необходимо загрузить файл (картинки в JPG, PNG, GIF-форматах или PDF-документ) на сервис:
И открыть его с помощью Google Docs — в примере используется фрагмент на хинди. Аналогично процесс выглядит и на Android. Распознанный текст появится ниже используемой картинки. Система обрабатывает графические файлы в течение примерно 30 секунд, распознавание PDF может длиться до минуты.
Совсем без ограничений использовать сервис не получится: максимальный объём загружаемой картинки составляет 2 Мб, а в PDF-документе будут обработаны только первые десять страниц.
Ранее Google представила инструмент для рукописного ввода теста на сенсорных экранах, которое используется в мобильных приложениях Google Translate и в специально выпущенной клавиатуре. Ввод рукописного русского текста в приложениях поддерживается достаточно хорошо для беглого и не очень аккуратного почерка.
Автор: jeston