Рубрика «обработка изображений» - 84

Привет!

Небольшое вступление

Довольно давно я работаю тестировщиком мобильных приложений. Преимущественно, android-приложений (хотя были и WinCE, и iOS). Преимущественно, руками (хотя пробовал и автоматизировать с monkeyrunner и uiautomator). В последнее время все больше времени приходится уделять проектированию интерфейсов, вопросам менеджмента, релизам и другим делам. Одним словом, задачки приходится решать хоть обычно и несложные, но довольно разнообразные. Об одной из них мне бы хотелось рассказать.

В чем, собственно, дело

Недавно мы с коллегой в команде Rumsunrise экспериментировали с поддержкой android 5 и material design в наших приложениях. В процессе подготовки проекта столкнулись с неожиданной мелкой проблемой из области дизайна.
Читать полностью »

Укрощение строптивого (на самом деле, нет) FineReader

После короткого рассказа о том, как устроен ABBYY FineReader (aka «теоретическая часть»), самое время перейти к применению полученных знаний. И да, котиков под катом нет: всё очень серьёзно.

Как пользователю поучаствовать в обработке документа

Чтобы не изобретать велосипед, начну с простой и понятной схемы из Справки (см. рисунок справа).

Теперь, зная список всех операций, посмотрим на конкретном примере – что может пойти не по плану и как с этим бороться.
Читать полностью »

Распознавание и автоматическое решение уравнений

Бесплатное приложение PhotoMath пригодится многим школьникам. При наведении камеры на уравнение программа распознаёт математические символы в формуле (работает OCR), производит вычисления — и выдаёт правильный ответ.

Идея настолько проста, что здесь даже нечего объяснять. Возникает только два вопроса: почему никто не сделал это раньше и почему этого не было, когда я учился в школе.
Читать полностью »

На пути к профессиональному использованию современных OCR. Understanding FineReaderЯ занимаюсь разработкой технологий, используемых в продуктах распознавания текста компании ABBYY. Самым известным продуктом (а точнее – семейством продуктов), использующим эти технологии, является FineReader.

Что я понимаю под «технологиями»

Иногда все технологические модули (невидимые пользователю части программы) вместе называют «движком распознавания» («движок» — от английского «Engine»), что не совсем верно – они выполняют не только распознавание символов, но и кучу других действий, подробнее о которых ниже.

Чем занимается программа FineReader?

Сейчас любой из настольных вариантов FineReader может проделать все самостоятельно от получения изображения со сканера, камеры или из готового файла до выдачи результата обработки в файл или в указанное приложение, так, что человек остается «за кадром». Программа сама «распознаёт» всё что нужно (в кавычках, так как при этом программа определяет места расположения текста, таблиц, картинок, OCRит обнаруженные участки с изображённым текстом, формирует документ, который сохраняет в желаемом формате с указанными настройками)

Пара скриншотов

На пути к профессиональному использованию современных OCR. Understanding FineReader

На пути к профессиональному использованию современных OCR. Understanding FineReader

А чем занимается пользователь?

Читать полностью »

Не смотря на сумасшедший темп развития технологий на планете, существуют такие консервативные области знания, где любая новация может появиться только спустя десятилетия пристальных сравнительных экспериментов. Одна из таких областей — метеорология. Плюсы и минусы такого положения на примере конкретного измерительного прибора — осадкомера — предлагаю пообсуждать под катом.

Читать полностью »

Гифки сейчас повсюду — но сам формат, несмотря на свою художественную выразительность, остаётся архаичным — .gif был создан в 1989 году, он старше многих читателей этого поста — в результате имеем анимацию в небольших разрешениях, часто посредственного качества и почти всегда — огромного веса. Один из крупнейших картингохостингов мира Imgur устал тратиться на расширение серверов взялся исправить ситуацию, представив проект .gifv.

Imgur предлагает перейти на gifv: как gif, только легче, качественнее и без тормозов
Пример гифки в старом формате

По сути, это просто контейнер для .mp4-видео, лишённого всех кнопок управления видео вроде паузы и промотки, проще говоря — зацикленное видео без звука.
Читать полностью »

Столкнулся я с этим устройством много лет назад, когда по долгу службы собирал в сети некоторые данные. Сотнями гигабайт с просторов всемирной и глобальной добывал я адреса и телефоны, имена и должности, сферы деятельности и прочую потенциально полезную для компании информацию. Что с ней дальше делала машина компании мне не сообщалось, да и я, в общем-то, не очень уж и интересовался. Знаю лишь, что фильтровалась она особым способом, да складировалось в железных сундуках серверной и периодически использовалась в благих, безусловно, целях. Работа была не пыльная и была бы она скучна, как сольная карьера Влада Сташевского, если бы не одно замечание, вернее сказать, особенность — сервисы, то есть справочники, которые так любезно предоставляли мне информацию: иногда они жадничали и вредничали, словно красивые девочки. Блокировали мой IP, просили ввести им капчу, некоторые откровенно подсовывали ложную информацию, но самые интересные были те, что не позволяли глядеть их текст в HTML, а кокетливо отображали его в виде нарисованных на картинке символов. Вот они то, сами того не ведая, и скрашивали, шельмочки, мои серые будни. И был у меня тогда особый интерес, даже сказать, азарт — распознать тот текст на картинке без помощи сторонних библиотек (про них я, быть может, скажу позже), а только лишь средствами прекрасного, во всех отношениях .NET. И теперь, много лет спустя, я хотел бы, с вашего позволения, проникнуться, что называется, ностальгией.
Читать полностью »

Telescope

[От переводчика] Наверное многие, когда речь заходит о поиске экзопланет, представляет себе человека, смотрящего в окуляр огромного телескопа. К сожалению, это так не работает. Даже для самых лучших современных телескопов наблюдение экзопланеты — сложная задача, так как сами планеты имеют маленький размер, а их излучение чрезвычайно сложно отличить от излучения звезды. Для этого применяют ряд интересных методов, один из которых — ADI (Angular Differential Imaging) — и будет рассмотрен в этой статье.
Читать полностью »

Где ошибаются алгоритмы распознавания лиц

Дуэт художников из Южной Кореи Shinseungback Kimyonghun постоянно организует необычные выставки, на пересечении живописи, фотоискусства и компьютерных технологий. Например, последняя их выставка называется «Облачное лицо» (Cloud Face). Здесь выставлены фотографии облаков, на которых ошибочно сработала библиотека компьютерного зрения OpenCV.
Читать полностью »

С завидной регулярностью на Хабре появляются статьи, рассказывающие о тех или иных методах распознавания лиц. Мы решили не просто поддержать эту замечательную тему, но выложить наш внутренний документ, который освещает пусть и не все, но многие подходы к распознаванию лиц, их сильные и слабые места. Он был составлен Андреем Гусаком, нашим инженером, для молодых сотрудников отдела машинного зрения в образовательных, так сказать, целях. Сегодня предлагаем его все желающим. В конце статьи – впечатляющих размеров список литературы для самых любознательных.Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js