Как вы знаете, в ситуациях, когда необходимо быстро и безопасно обработать данные паспорта и любых других документов, технологии распознавания Smart Engines творят настоящие чудеса. Качеству и надежности нашей технологии доверяют лидеры цифровой трансформации: госведомства, ведущие банки, аэропорты, промышленность и бизнес. Мы ценим доверие наших клиентов, а для вас, дорогие читатели, решили наглядно показать эффективность наших систем. Так сказать, лучше один раз увидеть, чем сто раз услышать. Летс гоу!
Рубрика «OCR-технологии»
Адские условия: Самый суровый краш-тест технологии распознавания паспорта
2024-10-04 в 8:21, admin, рубрики: ocr, OCR-технологии, smart engines, документы, Компьютерное зрение, распознавание изображений, распознавание образов, распознавание паспорта, распознавание текста, тестИтоги ICDAR-2024: Как и зачем нужно делать распознавание объяснимым
2024-09-11 в 8:26, admin, рубрики: icdar, ocr, OCR-технологии, ИИ, обработка данных, обработка изображений, распознавание документов, распознавание паспорта, распознавание речи, репортажПочему ICDAR?
Море, солнце, пляжЧитать полностью »
Создание плагина для распознавания текста на иврите: мой опыт и решения
2024-08-17 в 14:15, admin, рубрики: easyocr, OCR-технологии, paddleocr, python, tesseract ocr, аугментация, искусственный интеллект, распознавание текстаВсем привет! Хочу поделиться недавним проектом, в котором я разрабатывал плагин для распознавания текста на иврите. Задача была непростая, особенно учитывая, что клиент уже пытался использовать Tesseract OCR, но точность распознавания оставляла желать лучшего. В этой статье расскажу о том, с какими трудностями я столкнулся и как их преодолел.
Проблемы с Tesseract OCR
8-битные сети на Эльбрусе, есть ли смысл?
2020-03-31 в 8:07, admin, рубрики: ocr, OCR-технологии, Блог компании Smart Engines, искусственный интеллект, машинное обучение, нейросетевой модель, обработка изображений, программирование микроконтроллеров, распознавание образов, Эльбрус, эльбрус-4сПривет! Мы вдруг поняли, что наша последняя статья про Эльбрус вышла год назад. Поэтому мы решили исправить эту досадную оплошность, ведь мы не бросили эту тему!
Сложно представить распознавание без нейронных сетей, поэтому мы расскажем о том, как мы запустили 8-битные сетки на Эльбрусе и что из этого получилось. Вообще, модель с 8-битными коэффициентами и входами и 32-битными промежуточными вычислениями крайне популярна. Например, Google [1] и Facebook [2] завели ее собственные реализации, которые оптимизируют доступ в память, задействуют SIMD и позволяют ускорить вычисления на 25% и больше без заметного снижения точности (это конечно зависит от архитектуры нейронной сети и вычислителя, но нужно же было объяснить, насколько это круто?).
Сложности применения технологий OCR в DLP-системах, или Как мы OCR готовим
2019-08-08 в 8:00, admin, рубрики: dlp-системы, OCR-технологии, информационная безопасность, обработка изображений, распознавание изображений, СофтРешение задачи распознавания изображений (OCR) сопряжено с различными сложностями. То картинку не получается распознать из-за нестандартной цветовой схемы или из-за искажений. То заказчик хочет распознавать все изображения без каких-либо ограничений, а это далеко не всегда возможно. Проблемы разные, и решить их сходу не всегда удается. В этом посте мы дадим несколько полезных советов, исходя из опыта разруливания реальных ситуаций у заказчиков.Читать полностью »
Зачем нужна низкоуровневая оптимизация на Эльбрусе или как ускорить распознающую систему в полтора раза
2019-02-06 в 4:06, admin, рубрики: ocr, OCR-технологии, Алгоритмы, Блог компании Smart Engines, машинное обучение, обработка изображений, программирование микроконтроллеров, распознавание образов, ЭльбрусВстретив 2019 год и немного отдохнув от разработки новых фич для Smart IDReader, мы вспомнили, что давно ничего не писали об отечественных процессорах. Поэтому мы решили срочно исправиться и показать еще одну распознающую систему на Эльбрусе.
В качестве распознающей системы была рассмотрена система распознавания объектов живописи “в неконтролируемых условиях методом с обучением по одному примеру” [1]. Эта система строит описание изображения на основе особых точек и их дескрипторов, по которому выполняет поиск в индексированной базе картин. Мы проанализировали производительность данной системы и выделили наиболее времязатратную низкоуровневую часть алгоритма, который затем оптимизировали с помощью инструментов платформы Эльбрус.
Сравнение Эльбрус-4С и Эльбрус-8С в нескольких задачах машинного зрения
2017-05-31 в 10:05, admin, рубрики: OCR-технологии, Алгоритмы, Блог компании Smart Engines, машинное обучение, обработка изображений, Программирование, распознавание образов, распознавание паспорта, ЭльбрусВ этой статье мы покажем, как работают технологии распознавания образов на Эльбрус-4С и на новом Эльбрус-8С: рассмотрим несколько задач машинного зрения, немного расскажем об алгоритмах их решения, приведем результаты бенчмаркинга и наконец покажем видео.
Эльбрус-8С — новый 8-ядерный процессор МЦСТ с VLIW-архитектурой. Мы тестировали инженерный образец с частотой 1.3 ГГц. Возможно, в серийном выпуске она еще возрастет.
Мобильный OCR. Как всё начиналось (часть 2)
2017-01-10 в 20:33, admin, рубрики: ABBYY, OCR-технологии, Блог компании ABBYY, обработка изображений, разработка мобильных приложений, разработка под iOSВ предыдущем посте мы начали рассказывать, как OCR-технологии «переезжали» с настольных компьютеров в смартфоны – а началось всё с приложения для сканирования визиток Business Card Reader. Но сканирование визиток – это только один сценарий, где нужно мобильное распознавание. О том, как решались другие задачи хотелки пользователей, – читайте ниже.
Как мы уже говорили, перенос технологии распознавания на смартфоны связан с кучей ограничений и сложностей. Главной была и остаётся ресурсоёмкость технологии – невозможно перенести ее в мобильное устройство как есть. Но у нас уже с 2007 года был готовый инструментарий разработчика ABBYY Mobile OCR SDK, который позволял на мобильном оцифровать изображение и выдать результат в формате TXT без сохранения форматирования. И для начала в 2011 году мы решили воплотить в жизнь небольшие пользовательские сценарии, в которых такое «элементарное» распознавание вполне подходило.Читать полностью »
Распознавание цифр на микроконтроллере
2016-08-29 в 8:06, admin, рубрики: arduino, diy или сделай сам, OCR-технологии, Интернет вещей, Компьютерное зрение, программирование микроконтроллеров, распознавание, распознавание цифр
Как видно из названия речь в этой статье пойдет о распознавании цифр на микроконтроллере. Сразу хочу оговориться, что в данной статье не будет приведен исходный код, рассматриваться технология или алгоритм распознавания, скажу лишь, что используются идеи системного подхода. Некоторые из них изложены в наших статьях (здесь, здесь и вот здесь). Это связано с тем, что наш подход тянет на оригинальность, но требует уточнения некоторых вопросов. Кто-то может сказать: «очередная статья про программирование микроконтроллеров». Отнюдь нет, поиск подобных проектов не дал каких-то внятных результатов, за исключением этого видео. Из обсуждений на форумах понятно одно: идея получения подобного устройства (камера + микроконтроллер = результат распознавания на выходе, а не просто снятая картинка) приходила многим, но оставалась без реализации. Да и распознавание, по общему мнению, требует много вычислительных ресурсов и микроконтроллеры для этого не подходят, в частности про Arduino были высказывания, что это вообще невозможно. Если стало интересно прошу под кат.