Главная

Метка «tesseract»

«Оцифровываем» каптчу единого реестра сайтов, защищающего людей от информации

2012-11-02 в 10:27, admin, рубрики: bash, imagemagick, linux, tesseract, информационная безопасность, каптча, реестр запрещенных сайтов, метки: bash, imagemagick, tesseract, каптча, реестр запрещенных сайтов

Совсем недавно открылся портал Единого государственного реестра сайтов. Отдельно от всего прочего мне приглянулась очень слабая каптча, и я решил её побороть.

Подобными вещами я уже занимался, правда, не в таком масштабе. Если вам интересно, как получить КПД распознавания в 57% используя только GNU/Bash, imagemagick и Tesseract-ocr, добро пожаловать под кат.

Нижеследующая инструкция может быть легко модифицирована под любые другие подобные слабые каптчи.
Читать полностью »

Оптическое распознавание символов в Linux

2012-10-06 в 13:44, admin, рубрики: cli, Finereader, GUI, linux, ocr, tesseract, обработка изображений, сравнение, тест, метки: cli, Finereader, gui, linux, ocr, tesseract, сравнение, тест

Введение

Это не просто обзор существующих OCR (мы будем говорить всего о трёх) и не руководство по установке (хотя установка будет описана). Эта статья была создана с целью разобраться, что и как реально может распознать русский и английский языки в Linux.
Читать полностью »

Обработка изображений / Как я распознавал числа с экрана при помощи TESSERACT и что из этого получилось. Песочница для тренировки tesseract прилагается

2012-03-07 в 12:12, admin, рубрики: ocr, tesseract, метки: ocr, tesseract

Понадобилось мне получить значения забитмапленных чисел. Числа грабились с экрана.

Я подумал, а не попробовать ли мне OCR? Попробовал Tesseract.

Ниже я расскажу как я пытался приспособить Tesseract, зачем я его тренировал, и что из этого получилось. В проекте на гитхабе лежит cmd-скрипт, автоматизирующий насколько возможно процесс тренировки, и данные, на которых я проводил тренировку. Словом, есть все что нужно, чтобы с места в карьер обучить Tesseract чему-нибудь полезному.

Подготовка

Клонируем <a rel="nofollow"Читать полностью »

Публикации RSS | Комментарии RSS

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js

Информация

Комментарии

Рекомендуем