Понадобилось мне получить значения забитмапленных чисел. Числа грабились с экрана.
Я подумал, а не попробовать ли мне OCR? Попробовал Tesseract.
Ниже я расскажу как я пытался приспособить Tesseract, зачем я его тренировал, и что из этого получилось. В проекте на гитхабе лежит cmd-скрипт, автоматизирующий насколько возможно процесс тренировки, и данные, на которых я проводил тренировку. Словом, есть все что нужно, чтобы с места в карьер обучить Tesseract чему-нибудь полезному.
Подготовка
Клонируем <a rel="nofollow"Читать полностью »