Метка «распознавание текста»

Распознавание текста в ABBYY FineReader

2014-06-08 в 19:36, admin, рубрики: Блог компании ABBYY, искусственный интеллект, Программирование, распознавание текста, метки: распознавание текста

Систему распознавания текста в FineReader можно описать очень просто.

У нас есть страница с текстом, мы разбираем ее на текстовые блоки, затем блоки разбираем на отдельные строчки, строчки на слова, слова на буквы, буквы распознаем, дальше по цепочке собираем все обратно в текст страницы.

Распознавание текста в ABBYY FineReader

Выглядит очень просто, но дьявол, как обычно, кроется в деталях.

Про уровень от документа до строки текста поговорим как-нибудь в следующий раз. Это большая система, в которой есть много своих сложностей. В качестве некоторого введения, пожалуй, можно оставить здесь вот такую иллюстрацию к алгоритму выделения строк.

Распознавание текста в ABBYY FineReader

В этой статье мы начнём рассказ про распознавание текста от уровня строки и ниже.Читать полностью »

Проблемы снятия регулярных помех в формах с рукопечатным заполнением

2013-11-12 в 12:22, admin, рубрики: Алгоритмы, Блог компании Cognitive Technologies, помехи, распознавание текста, метки: Алгоритмы, помехи, распознавание текста

Привет!

Этой статьей мы начинаем серию публикаций о технологиях оптического распознавания (OCR, ICR) и понимания документов, разработанных специалистами компании Cognitive Technologies. Многие из этих решений более 10 лет успешно функционируют в разных организациях и помогают оптимизировать процессы обработки бланков Пенсионного фонда, анкет на получение загранпаспорта, платежных поручений Сбербанка РФ, результатов голосования акционеров Газпрома и десятки других документов.
Сегодня наш рассказ об одной из наиболее сложных и интересных с научной точки зрения проблем, которую приходится решать при распознавании деловых документов, это снятие помех или отделение полезной информации от «мусора».
Вначале необходимо определить, что речь идет о документах с рукопечатным заполнением, построенных по заранее известной форме.
Читать полностью »

Улучшенное распознование речи используя категории

2013-07-06 в 16:37, admin, рубрики: data mining, Google API, google app engine, распознавание речи, распознавание текста, метки: распознавание речи, распознавание текста

На данный момент большой проблемой распознавания речи (и смысла текста) является сложность предугадать смысл, а точнее контекст в котором находится слово. Часть проблемы решается дополнительным анализом соседних слов и предложения, а в тексте также анализируются заголовки документов. Большая проблема состоит в сложности реализации алгоритмов, особенно если речь идет о мобильных приложениях которые имеют ограниченные ресурсы.

Проблема может быть решена если автор приложения сам укажет контекст в котором произнесена фраза или написано сообщение для анализа.
Читать полностью »

Простой классификатор на PyBrain и PyQt4 (Python3)

2013-03-08 в 6:54, admin, рубрики: pybrain, pyqt, pyqt4, python, python3, Qt Software, ИНС, искусственный интеллект, примеры кода, распознавание текста, метки: pybrain, pyqt, pyqt4, python3, ИНС, примеры кода, распознавание текста

Изучая Python3, я портировал (как смог) библиотечку PyBrain. Об этом я уже писал здесь.

Теперь же я хочу немного «поиграть» с данной библиотечкой. Как я уже говорил в предыдущем посте, питон я только начал изучать, так что все написанное в этой статье не стоит воспринимать как Истину. Изучение — это путь, и он извилист.

Задачу поставим перед искусственной нейронной сетью (ИНС) весьма простую — классификацию, а именно: распознавание букв латинского алфавита.

Вроде бы классический пример, про него уже писали на хабре неоднократно: «Что такое искусственные нейронные сети?», «Нейронные сети и распознавание символов» и т.д.
Но моей целью стоит изучение питона на не самых простых примерах. Т.е. учимся сразу на сложном и незнакомом. Так мы найдем в два раза больше граблей, что позволит нам копнуть в глубины языка, разбираясь с «почему не работает?».

Под хабракатом вас ждёт: описание способа подготовки данных на PyQt4, использование модуля argparse, ну и конечно же PyBrain!
Читать полностью »

Умрет ли слитное письмо?

2012-11-23 в 10:51, admin, рубрики: Блог компании ASUS Russia, письмо, распознавание речи, распознавание текста, метки: письмо, распознавание речи, распознавание текста

Под натиском информационных технологий абсолютно привычные и понятные вещи начинают забываться и приходить в упадок. Думаю, все помнят часы, проведенные над прописью, в попытках вывести ровные контуры букв. Многие педагоги старой советской школы считают, что слитное письмо развивает мелкую моторику и, как следствие, интеллект. Но правительство США решило по-другому: с прошлого года пропись стала необязательным предметом и школы могут принимать работы учеников, написанные печатными буквами: школьники будут писать лишь печатными буквами. Давайте постараемся разобраться, почему это произошло и как современные технологии поддерживают печатные буквы.
Умрет ли слитное письмо?
Читать полностью »

Автоматический ввод капчи – теория и практика покорения Интернет

2012-10-03 в 16:30, admin, рубрики: капча, обработка изображений, распознавание текста, спам, Спам (и антиспам), метки: капча, распознавание текста, спам

В 2011 году 75-летний юбилей термина «спам» знаменовался вводом капчи 200 миллионов раз ЕЖЕДНЕВНО!

Автоматический ввод капчи – теория и практика покорения Интернет

Все эти вводы — следствие борьбы администраторов сайтов со спам-ботами.

Автоматизация процесса распознавания капчи для множества людей, активно ведущих бизнес в Интернете, является насущной проблемой. Можно относиться к таким бизнесменам и специалистам как к «нехорошим и надоедливым спамерам». Однако остановить процесс спам-постинга, по крайней мере, в обозримом будущем возможным не представляется.

Ссылочный маркетинг здесь полноценно и уникально сочетает в себе решение задач продвижения, повышения репутации продвигаемого сайта в глазах поисковых систем. Происходит это по той простой причине, что каждая ссылка на сайт (в т.ч. и из спам-поста) повышает его позиции в выдачах Google, Яндекса и т.д. Следовательно, такой способ «убийства двух зайцев одним выстрелом» выгоден изначально. И значительная часть Интернет-бизнесменов должны не бороться со спам-постингом, а пытаться использовать его в своих целях.

Итак, актуальность решения задачи «обход капчи» сомнений не вызывает.

Читать полностью »

Теперь Google Translate для Android переводит с фотографий

2012-08-10 в 19:23, admin, рубрики: android, Google Translate, распознавание текста, метки: android, Google Translate, распознавание текста

Теперь Google Translate для Android переводит с фотографий Заграничные поездки становятся всё проще и проще. Приложение Google Translate для платформы Android было значительно обновлено, и новой функцией является перевод с фотографии.

Теперь приложение может распознавать текст и переводить на ваш родной русский, английский, немецкий, французский, чешский, нидерландский, итальянский, польский, португальский, испанский или турецкий язык вывески или даже блюда в меню, поэтому в кафе на чужбине больше не придется после заказа нервно готовить желудок к чему-то непонятному.

Принцип работы программы прост: пользователь делает снимок с нужным фрагментом и выделяет необходимую для перевода область. Далее происходит распознание текста и перевод на серверах Google. Для работы приложения необходимо активное соединение с Интернетом.Читать полностью »

How am I driving?

2012-04-15 в 5:47, admin, рубрики: дополненная реальность, Идеи для стартапов, распознавание текста, метки: дополненная реальность, распознавание текста

Смотреть на gps карту в машине, когда ты едешь по маршруту в сотый раз невыносимо скучно, гораздо интересней было бы оставлять комментарии другим участникам движения, а так же узнать, что они о тебе думают:

How am I driving?

Для этого нужно не так уж и много — приложение с дополненной реальностью и распознаванием номеров на телефоне планшете навигаторе бортовом компьютере с камерой и доступом в интернет.

Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Метка «распознавание текста»

Распознавание текста в ABBYY FineReader

Проблемы снятия регулярных помех в формах с рукопечатным заполнением

Привет!

Улучшенное распознование речи используя категории

Простой классификатор на PyBrain и PyQt4 (Python3)

Умрет ли слитное письмо?

Автоматический ввод капчи – теория и практика покорения Интернет

Итак, актуальность решения задачи «обход капчи» сомнений не вызывает.

Теперь Google Translate для Android переводит с фотографий

How am I driving?

Архив

Информация

Обсуждаемое

Рекомендуем

Метка «распознавание текста»

Привет!

Итак, актуальность решения задачи «обход капчи» сомнений не вызывает.

Новости

Актуальные темы

Архив