Рубрика «Компьютерное зрение» - 16

Вычисление фрактальной размерности Минковского для плоского изображения Доброго времени суток читатель. Сегодняшний пост будет посвящен вычислению приближенного значения фрактальной размерности плоского изображения, которая тесно связано с размерности Минковского. Это интересно как минимум по двум причинам. Во-первых оказывается, что размерность ограниченного множества в метрическом пространстве может быть не только целым числом, но и любым не отрицательным. Во-вторых значение размерности контура изображения (а это ограниченное множество в метрическом пространстве) является хорошим признаком. В рамках сегодняшнего поста не предусмотрено исследование робастности этого признака, но давайте рассмотрим показательный пример. Множество различных характеристик клеток опухолей молочной железы, полученное в результате анализа снимков тонкоигольной пункционной биопсии. Множество данных состоит из 30 признаков (поля таблицы) с пометкой злокачественная или доброкачественная опухоль, и одним из признаков является как раз фрактальная размерность ядер клеток опухоли. Под катом вас ждет объяснение смысла фрактальной размерности множества, по возможности доступным языком, алгоритм вычисления приближенного значения этой размерности, его реализация на c# и ряд примеров с картинками. Возможно вы открыли этот пост только из-за картинки справа, это изображение я позаимствовал из инстаграмма Jennifer Selter, и в конце мы вычислим фрактальную размерность, так сказать филейной части Дженифер. Хочется кстати вас попросить ответить на пару вопросов в конце поста.

Читать полностью »

В одном из проектов компании Itseez, связанных с компьютерным зрением, мы используем Raspberry Pi для обработки видео потока с веб-камеры, и недавно столкнулись с проблемой записи видео на флеш-карту. Трудность состояла в том, что ресурсы ЦП съедались другими более важными задачами, однако сохранять видео все же было нужно. Причем предпочтений, каким кодеком сжимать и какой формат использовать, не было, лишь бы это никак не сказывалось на fps (количестве кадров в секунду). Перепробовав большое число программных кодеков от RAW до H.264 (использовалась обертка OpenCV над FFmpeg), пришли к выводу, что ничего из этого не выйдет, т.к. при высокой нагрузке fps проседал с 20 до 5 кадров в секунду, при том что картинка – черно-белая с разрешением 320x240. Немного погуглив, выяснили, что в процессоре Raspberry Pi есть аппаратный кодер с поддержкой стандарта H.264 (насколько мне известно, лицензия приобретена только для него). Плюсом ко всему было то, что взаимодействие с кодером реализовано по стандарту OpenMAX, поэтому было решено взяться за написание кода с использованием OpenMAX, и посмотреть, что из этого получится. Получилось, кстати, очень даже недурно!
Читать полностью »

Автор: Виктор Ерухимов, исполнительный директор Itseez, председатель рабочей группы OpenVX

OpenVX: стандарт компьютерного зренияThe Khronos Group 18 ноября 2013 года представила предварительную спецификацию стандарта OpenVX 1.0 для компьютерного зрения. Поскольку Itseez был одним из инициаторов этой деятельности и активно участвовал в создании спецификации, мы решили рассказать про этот стандарт аудитории Хабрахабра.

Читать полностью »

Область применения компьютерного зрения очень широка: от считывателей штрихкодов в супермаркетах до дополненной реальности. Из этой лекции вы узнаете, где используется и как работает компьютерное зрение, как выглядят изображения в цифрах, какие задачи в этой области решаются относительно легко, какие трудно, и почему.

Лекция рассчитана на старшеклассников – студентов Малого ШАДа, но и взрослые смогут почерпнуть из нее много полезного.

Возможность видеть и распознавать объекты – естественная и привычная возможность для человека. Однако для компьютера пока что – это чрезвычайно сложная задача. Сейчас предпринимаются попытки научить компьютер хотя бы толике того, что человек использует каждый день, даже не замечая того.

Наверное, чаще всего обычный человек встречается с компьютерным зрением на кассе в супермаркете. Конечно, речь идет о считывании штрихкодов. Они были разработаны специально именно таким образом, чтобы максимально упростить компьютеру процесс считывания. Но есть и более сложные задачи: считывание номеров автомобилей, анализ медицинских снимков, дефектоскопия на производстве, распознавание лиц и т.д. Активно развивается применение компьютерного зрения для создания систем дополненной реальности.

Читать полностью »

image

Что такое ABBYY FineScanner

ABBYY FineScanner – программа для iOS-устройств, которая может фотографировать документы и обрабатывать снимки так, чтобы получившиеся электронные копии (по сути – сканы) были удобны для работы – чтения, печати или хранения/пересылки в удобочитаемом виде. О выходе первой версии мы писали здесь.

Фотографии документов, получаемые на мобильных устройствах, обладают различными искажениями по сравнению с изображениями, получаемыми из обычного сканнера. К таким искажениям относятся: цифровой шум, геометрические искажения, вызванные поворотом документа или наличием перспективы, неравномерность в освещенности, расфокусировка, смаз. Далее мы опишем алгоритм, который позволяет автоматически устранить геометрические искажения документа на изображении.

Весь процесс можно разделить на несколько основных этапов:

1) Уменьшение исходного изображения
2) Выбор наиболее информативного канала
3) Предобработка изображения, выделение контуров
4) Детектирование границ и определение углов документа
5) Проверка полученных гипотез
6) Уточнение координат углов документа

Рассмотрим каждый из этапов подробнее.
Читать полностью »

Сегодня Яндекс запустил поиск картинки по загруженному изображению. В этом посте мы хотим рассказать о технологии, которая стоит за этим сервисом, и о том, как её делали.

Технология внутри Яндекса получила название «Сибирь». От CBIR — Content-Based Image Retrieval.

Конечно, сама по себе задача не нова, и ей посвящено множество исследований. Но сделать прототип, работающий на академической коллекции, и построить промышленную систему, которая работает с миллиардами изображений и большим потоком запросов — очень разные истории.

Яндекс, роботы и Сибирь — как мы сделали систему поиска по загруженному изображению

Для чего всё это нужно?

Есть три сценария, при которых нужен поиск по загруженной картинке и которые нам и нужно было научиться обрабатывать.
Читать полностью »

Люди могут различать примерно 10 000 визуальных категорий высокого уровня, но мы можем различать гораздо больший спектр визуальных импульсов, называемых особыми признаками. Эти признаки могут соответствовать частям объекта, конечностям животного, архитектурным деталям, Читать полностью »

Фасеточные глаза, состоящие из множества узких светочувствительных конусов, называемых омматидиями, характерны для насекомых и ракообразных. Хотя они имеют меньшее разрешение, чем глаза позвоночных, у них есть ряд преимуществ — они менее инерционны (некоторые насекомые способны воспринимать мелькания с частотой до 300 Гц ), не требуют фокусировки и могут различать не только цвет но и направление поляризации света. Команда учёных из Федеральной политехнической школы Лозанны (EPFL) создала прототип искусственного фасеточного глаза, который использует преимущества такой конструкции.

Швейцарские учёные разработали искусственный фасеточный глаз
Читать полностью »

Учёные разрабатывают робота ищейку для пожарныхИсследователи из Калифорнийского университета в Сан-Диего разработали прототип двухколёсного робота для разведки и поиска людей во время пожара. Предполагается, что робот будет недорогим, быстрым и простым в использовании, кроме того, подобно своре опытных охотничьих собак, несколько роботов смогут совместно обследовать горящее здание, за считанные минуты составляя трёхмерную карту помещений и обнаруживая людей, заблокированных в здании пожаром.

Робот напоминает электросамокат Сигвей, но в отличие от него умеет преодолевать ступеньки и довольно высокие препятствия. Это достигается простым и элегантным инженерным решением: “туловище” робота представляет собой плоскую доску, которая может двигаться вверх и вниз относительно шасси. Выдвигаясь, нижний конец этой доски поднимает шасси робота в воздух, причём, чтобы удержать равновесие, робот балансирует колёсами, используя их как силовые гироскопы. Как только колёса поднимаются на нужную высоту, робот опирается ими о препятствие и подтягивает “туловище” вверх.
Читать полностью »

Качество систем распознавания лиц наконец-то достигло уровня, когда можно обойтись вообще без каких-либо дополнительных идентификаторов личности, уверены основатели Uniqul. С помощью их платёжной системы можно будет расплатиться за купленный товар или услугу, просто подойдя к терминалу и нажав кнопку «ОК», после того как система узнает вас в лицо. Весь процесс оплаты занимает меньше 5 секунд. Первые терминалы Uniqul скоро должны появиться в Хельсинки. По словам представителей Uniqul, их система распознавания уверенно различает даже идентичных близнецов.


Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js