Яндекс.Диск теперь умеет распознавать текст на изображениях форматов JPEG, GIF и PNG, об этом компания объявила в своём блоге. Таким образом система позволит искать среди сохранённых фотографий на диске нужную — например, найти скан договора или визитку.
Для распознавания текста используется технология оптического распознавания символов, разработанная в стенах Яндекса.
Для разных видов изображений она разная. Например, для отсканированных документов точность распознавания текстов на русском языке составляет около 80%, для фотографий с надписями — 63,2%, а для скриншотов приближается к 100%. Помимо русского языка, система также распознаёт английский, украинский и турецкий. Точность распознавания текстов всего потока изображений более 70%. Это неплохой результат, но мы будем работать над его улучшением.