Рубрика «Компьютерное зрение» - 15

Посмотрите на это фото.

Чтобы распознавать картинки, не нужно распознавать картинки - 1

Это совершенно обычная фотография, найденная в гугле по запросу «железная дорога». И сама дорога тоже ничем особенным не отличается.

Что будет, если убрать это фото и попросить вас нарисовать железную дорогу по памяти?

Если вы ребенок лет семи, и никогда раньше не учились рисовать, то очень может быть, что у вас получится что-то такое:
Читать полностью »

На его основе будет создана платформа автопилота для автомобилей

nVidia показала свой новый «мобильный суперчип» - 1Несколько часов назад вечером в Лас-Вегасе в рамках пресс-конференции нулевого дня Международной выставки потребительской электроники 2015 года глава nVidia Жэнь-Сунь Хуан вышел на сцену и рассказал о новом мобильном решении «система на кристалле» под названием Tegra X1.

X1 — это логическое продолжение Tegra K1, в котором впервые для nVidia была проведена унификация архитектур мобильных и настольных устройств. X1 уже производится, вероятно, скоро появятся планшеты на его основе.

Может показаться, что этот анонс будет интересен только геймерам, использующим высокопроизводительные и дорогие портативные устройства. Но это далеко не так. Большая часть конференции была посвящена автомобильным системам.
Читать полностью »

Маски, которые обманывают алгоритмы распознавания лиц - 1

Художник Стерлинг Криспин (Sterling Crispin) продолжает пополнять на своём сайте коллекцию дата-масок, созданных специально для обмана алгоритмов распознавания лиц в уличных видеокамерах наблюдения.

Программы компьютерного зрения после тренировки на больших коллекциях фотографий вырабатывают специфические признаки, по которым отличают один объект от другого. Эти признаки можно вычислить, если скрестить алгоритм генерации случайных изображений с системой распознавания образов.
Читать полностью »

От переводчика: мы в компании Энтерра очень любим алгоритмы компьютерного зрения. Работаем чаще всего с OpenCv. Время от времени нам пишут разные разработчики с вопросами: «А как лучше начать работать с OpenCv?» или «Какую интересную задачу можно просто решить с помощью OpenCv?» В связи с чем мы решили перевести очень хорошую статью, которая будет полезна всем, кто интересуется компьютерным зрением.

Распознаем штрихкоды на изображениях с помощью Python и OpenCV - 1

Черная Пятница близко.

Толпы злых покупателей. Рой одинаковых теток среднего возраста, готовых сожрать практически всё, что угодно, в ближайшем супермаркете — главное, что со скидкой 75%. Они выстроятся в очереди перед дверьми магазинов в полночь Дня благодарения. Они будут ломиться внутрь, стучать в запертые двери кулаками и головами, пока не сплющат друг друга и не разобьют руки в кровь, став похожими на зомби из «28 дней спустя». Но вместо человеческой плоти, они жаждут удовлетворить инстинкт покупателя. Их боевые кличи о скидках и распродажах достигают небес. А их громовая поступь способна привести к землетрясению на Великой Равнине.

Естественно, от СМИ помощи не жди — они будут смаковать каждую подробность. От обмороженных семейств, ночевавших в палатке на морозе, до старой леди, растоптанной охотниками за скидкой в момент, когда открылись двери. Что-то похожее случилось с галлимимусом в «Парке Юрского периода». А она просто хотела купить Halo для девятилетнего внука Тимми, чьи родители забыли это сделать в прошлом году. В Wal-Mart. Во время Черной Пятницы.

И я обязан спросить: весь этот хаос и бедлам стоят того?

Чёрт возьми, нет!

Любая покупка, которую я совершу в эту Черную Пятницу, будет сделана совершенно безопасно с помощью ноутбука. Но если вы решите выйти в реальный мир и вступить в схватку с охотниками за наживой, вам в первую очередь понадобится загрузить код из оригинального поста.

Просто представьте, как глупо вы будете выглядеть, стоя в очереди в ожидании свободной кассы – только для того, чтобы после сканирования штрихкода последнего сезона «Игры Престолов» выяснить, что в Target его можно купить на 5 долларов дешевле?

Собственно, далее я покажу, как можно обнаружить штрихкод на изображении, используя только Python и OpenCV.Читать полностью »

Здравствуйте, дорогие читатели.

Я студент МГТУ им. Баумана. Спешу поделиться опытом в области обработки изображений и восстановлении трехмерных объектов активным параллаксным методом.

В настоящее время в различных областях деятельности, в таких как производство, медицина, компьютерная графика, робототехника и техническое зрение активно используется трехмерное моделирование и прототипирование объектов реального мира. В связи с этим все более актуальным становится разработка 3d сканеров и камер, которые создают 3d модель регистрируемого объекта.
Читать полностью »

Интересную презентацию подготовили для Европейской конференции по компьютерному зрению (ECCV-2014) исследователи из Вашингтонского университета. Это технология покадровой реконструкции 3D-модели на видео.

Реконструкция 3D модели движущегося лица

Используя видеоролик с YouTube, программа автоматически строит 3D-модели высокой степени детализации для каждого кадра.

Это очень впечатляющий результат, учитывая сложность задачи, ведь мимика человеческого лица очень сложна. Для распознавания эмоций важно видеть точное положение глаз, изгиб бровей, морщинки. Малейшая погрешность в такой 3D-модели сильно бросается в глаза.
Читать полностью »

Достался мне тут довольно интересный проектик: на рентгенограммах сварных швов находить проволочные образцы стандартных размеров. Казалось бы, сколько уже было написано по поводу поиска паттернов на изображении, выработаны стандартные подходы и методики, но когда речь заходит о реальных задачах академические методы оказываются не настолько эффективны, как от них ожидается. Для затравочки, попробуйте найти здесь все семь проволочек:

image

Читать полностью »

В Псковской области много лесов, и, соответственно, в теплое время года много пожаров — горят и сами леса, и торфяники. Людей, чтобы отследить такие массивы, не хватает.

Что делают псковичи? Лезут на сотовые вышки и ставят там видеокамеры:
Мониторинг лесных пожаров
Читать полностью »

Structure from Motion — классическая реализация

Есть такая интересная задача — построение 3D структуры по набору изображений (фотографий) — Structure from Motion. Как её можно решить? После некоторых размышлений приходит на ум такой алгоритм. Найдём на всех изображениях характерные особенности (точки), сопоставим их друг с другом и триангуляцией найдём их трёхмерные координаты. Тут правда есть проблема — неизвестно положение камер при съёмке. Можно ли их найти? Вроде можно. Действительно, пусть у нас N точек на кадре и M кадров. Тогда неизвестных будет 3 * N (трёхмерные координаты точек) + 6 * (M — 1) (координаты камер (вместо 6 может стоять другое число, но сути это не меняет)). Уравнений же у нас 2 * M * N (у каждой точки на каждом изображении есть две координаты). Выходит, что уже для двух изображений и 6 точек задачка разрешима. Под катом описание принципиальной схемы решения задачи SfM (по возможности без формул — но со ссылками для вдумчивого изучения).
Читать полностью »

Приходилось ли вам, перейдя по ссылке на интересный видеоролик на Youtube, обнаруживать, что ради нескольких секунд, где действительно происходит что-то интересное, вы только что потратили нескольк минут на созерцание совершенно бесполезного «мусора» только потому, что автор видео выложил целиком файл с видеорегистратора или смартфона? Количество видеокамер стремительно растёт, а количество людей, способных хотя бы обрезать пару лишних фрагментов, похоже, остаётся постоянным. И проблема не только в нескольких минутах убитого в интернете времени — ведь есть и более серьёзные случаи, например, десятки и сотни часов видео с камер наблюдения, которые иногда приходится просматривать, чтобы раскрыть преступление.

Учёные из университета Карнеги-Меллон разработали эффективный алгоритм выделения наиболее интересных фрагментов видео на основе машинного обучения. Новый алгоритм, названный ими «LiveLight» значительно превосходит аналоги по скорости и качеству работы. LiveLight выделяет характерные фрагменты видео и сотавляет их «словарь», а затем пытается предсказать на их основе следующий кадр. Если это удаётся с достаточной степенью точности, то это значит, что кадр не добавляет практически никакой новой информации и его можно исключить. В отличие от «механических» подходов, реагирующих на любое движение в кадре либо резкое изменение яркости, цвета или контраста, LiveLight достаточно универсален — он хорошо работает и на видео, снятым неподвижной камерой, и на любительской съемке трясущимся смартфоном.


Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js