Рубрика «ocr» - 6

image

Яндекс в своём блоге объявил о новой возможности файлохранилища Яндекс.Диск. Теперь файловый поиск может находить картинки JPEG, GIF и PNG, содержащие текст поискового запроса, Система научилась распознавать текст на изображениях.
Читать полностью »

На сегодняшний день трудно найти человека, который хоть раз в жизни не сталкивался прямым или косвенным образом с распознаванием документов. Действительно, когда в мире для совершения любого сколь угодно серьезного дела необходима идентификация личности мы то и дело слышим «Можно ваш паспорт», чтобы очередной раз ввести ваши данные в компьютер с целью проверки разрешен ли вам вход, нет ли каких-либо неоплаченных долгов и так далее.

Читать полностью »

Об этом приложении написало множество мировых изданий. И не только технических вроде Engadget, Techcrunch и CNET. Небольшой апп попал в поле зрения таких грандов, как журнал Time, Forbes и Business Insider и шоу Эллен ДеДженерес.

Истории о разработчиках: PhotoMath от MicroBlink - 1

Так почему приложение PhotoMath вызывает такой интерес? Возможно потому, что хорватская команда разработчиков MicroBlink воплотила нашу детскую мечту, вручив волшебную палочку для решения даже сложных математических уравнений (на самом деле, нисколько не вредную, а, наоборот, полезную для обучения математическим наукам, но об этом после). Нашим коллегам удалось связаться с девелоперами и поговорить о том, как создавалось это небольшое, но успешное приложение, и о том, что нам ждать от них в будущем. Ну а пока ваш ребенок сжигает последний томик «Готовых домашних заданий», разрешите пригласить вас ознакомиться с выдержками из этого интервью.
Читать полностью »

Наткнулся однажды на этот пост и мне подумалось — раз у нас есть такая прекрасная, полностью открытая галерея частных данных (Radikal.ru), не попытаться ли извлечь из нее эти данные в удобном для обработки виде? То есть:

  • Скачать картинки;
  • Распознать текст на них;
  • Выделить из этого текста полезную информацию и классифицировать ее для дальнейшего анализа.

И в результате, после нескольких вечеров, работающий прототип был сделан. Много технических деталей:
Читать полностью »

Укрощение строптивого (на самом деле, нет) FineReader

После короткого рассказа о том, как устроен ABBYY FineReader (aka «теоретическая часть»), самое время перейти к применению полученных знаний. И да, котиков под катом нет: всё очень серьёзно.

Как пользователю поучаствовать в обработке документа

Чтобы не изобретать велосипед, начну с простой и понятной схемы из Справки (см. рисунок справа).

Теперь, зная список всех операций, посмотрим на конкретном примере – что может пойти не по плану и как с этим бороться.
Читать полностью »

На пути к профессиональному использованию современных OCR. Understanding FineReaderЯ занимаюсь разработкой технологий, используемых в продуктах распознавания текста компании ABBYY. Самым известным продуктом (а точнее – семейством продуктов), использующим эти технологии, является FineReader.

Что я понимаю под «технологиями»

Иногда все технологические модули (невидимые пользователю части программы) вместе называют «движком распознавания» («движок» — от английского «Engine»), что не совсем верно – они выполняют не только распознавание символов, но и кучу других действий, подробнее о которых ниже.

Чем занимается программа FineReader?

Сейчас любой из настольных вариантов FineReader может проделать все самостоятельно от получения изображения со сканера, камеры или из готового файла до выдачи результата обработки в файл или в указанное приложение, так, что человек остается «за кадром». Программа сама «распознаёт» всё что нужно (в кавычках, так как при этом программа определяет места расположения текста, таблиц, картинок, OCRит обнаруженные участки с изображённым текстом, формирует документ, который сохраняет в желаемом формате с указанными настройками)

Пара скриншотов

На пути к профессиональному использованию современных OCR. Understanding FineReader

На пути к профессиональному использованию современных OCR. Understanding FineReader

А чем занимается пользователь?

Читать полностью »

Столкнулся я с этим устройством много лет назад, когда по долгу службы собирал в сети некоторые данные. Сотнями гигабайт с просторов всемирной и глобальной добывал я адреса и телефоны, имена и должности, сферы деятельности и прочую потенциально полезную для компании информацию. Что с ней дальше делала машина компании мне не сообщалось, да и я, в общем-то, не очень уж и интересовался. Знаю лишь, что фильтровалась она особым способом, да складировалось в железных сундуках серверной и периодически использовалась в благих, безусловно, целях. Работа была не пыльная и была бы она скучна, как сольная карьера Влада Сташевского, если бы не одно замечание, вернее сказать, особенность — сервисы, то есть справочники, которые так любезно предоставляли мне информацию: иногда они жадничали и вредничали, словно красивые девочки. Блокировали мой IP, просили ввести им капчу, некоторые откровенно подсовывали ложную информацию, но самые интересные были те, что не позволяли глядеть их текст в HTML, а кокетливо отображали его в виде нарисованных на картинке символов. Вот они то, сами того не ведая, и скрашивали, шельмочки, мои серые будни. И был у меня тогда особый интерес, даже сказать, азарт — распознать тот текст на картинке без помощи сторонних библиотек (про них я, быть может, скажу позже), а только лишь средствами прекрасного, во всех отношениях .NET. И теперь, много лет спустя, я хотел бы, с вашего позволения, проникнуться, что называется, ностальгией.
Читать полностью »

Internet Archive закачает на Flickr более 14 млн свободных исторических изображений

Один из работников Internet Archive разработал программу для автоматического извлечения иллюстраций из миллионов книг в процессе OCR-сканирования, которое сейчас осуществляет Internet Archive. Калев Литару (Kalev Leetaru) использовал существующий модуль распознавания текста: тот сначала определяет границы иллюстраций, чтобы отбросить иллюстрации перед OCR. Но зачем материалу пропадать?

Все извлечённые иллюстрации были выровнены, кадрированы, очищены и закачаны на фотохостинг Flickr с сопровождающим текстом из книги. Таким образом, возможен полнотекстовый поиск по архиву иллюстраций Internet Archive Book Images, которые находятся в общественном достоянии.

Всего на Flickr закачают 14 млн картинок (на данный момент закачано 2,6 млн).
Читать полностью »

Победители 22 го конкурса IOCCC

Опубликован исходный код программ-победителей 22-го конкурса программ с обфусцированным кодом на C. Участвовать в конкурсе могут готовые программы размером меньше 4096 байт, при этом количество значимых символов, без учёта пробелов, знаков табуляции и знаков; ( ), не должно превышать 2048. Впрочем, в этом году многие участники воспользовались эксплоитом для бага в модуле вычисления размера программы, так что в 2013 году на конкурс были представлены, пожалуй, самые продвинутые программы за все годы проведения соревнований.

Например, вызывает искреннее восхищение эмулятор 8086-компьютера размером 4043 байта (исходный код) с полным набором инструкций 8086/186, который поддерживает флоппи-диски и HDD и PC-спикер.
Читать полностью »

Питер Пургатофер (Peter Purgathofer), доцент Венского университета технологий, выразил свой протест против DRM и подобного рода технологий самым естественным для гика образом — он, используя лазейку в пользовательском соглашении, сумел воспользоваться ей и при помощи нехитрого механизма получил легальный текст с его читалки Kindle, не обременённый никакими навязанными ограничениями.

Идея очень простая и показана на видео ниже: читалка располагается на собранной из Lego подставке, установленной перед веб-камерой ноутбука. Подставка умеет помимо своего прямого предназначения нажимать на кнопку пролистывания на Kindle и нажимать на клавишу пробела на клавиатуре, благодаря чему веб-камера делает снимок экрана читалки и загружает его на облачный OCR-сервис. Распознанный текст аккуратно собирается в файлы, которые законодательно оказываются абсолютно честны перед законом.

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js