Рубрика «Компьютерное зрение» - 13

Компьютерное зрение и мобильные роботы. Часть 1 — V-REP, Python, OpenCV - 1

Когда прочитал публикацию про запуск беспилотных гоночных автомобилей — подумал, было бы интересно сделать что-то подобное. Конечно не гоночный болид, но по крайней мере мобильный робот, что ориентируется в пространстве посредством камеры — распознаванием образов.

В нашем хакспейсе — создать робота не такая большая проблема. Но не у всех и не всегда есть возможность экспериментировать с реальным «железом» — поэтому интересно было попробовать решить задачу — в виртуальной среде, и после уже оживить «железо».

Так и возникла идея серии статей, про решение простейшей задачи ориентации робота в пространстве — от виртуальной симуляции, до воплощения в реальном мобильном роботе:

Часть 1. Настройка виртуальной среды, интеграция с python и OpenCV для распознавания образов из виртуального мира.
Часть 2. Создание виртуального мобильного робота, алгоритм автономного перемещения (поиск объекта)
Часть 3. Создание реального робота, перенос логики на него.

Хочется добиться такого результата — чтобы python скрипт, управляющий виртуальным роботом — был бы максимально идентичным тому, что будет управлять реальным роботом.

Мозгом робота будет микрокомпьютер RaspberryPi2 — на котором без проблем работает и python, и OpenCV. Таким образом необходимо состыковать систему виртуальной робототехники V-REP — с Python и OpenCV. Вот про это и будет первая часть — данная публикация.

Видео, что получилось (поиск зеленого объекта)


На верхнем окне — прямое изображение с видео-камеры в 3д виртуальном мире, на нижнем окне — результат выполнения python скрипта, что получает изображение передаёт её OpenCV и рисует маркер, вокруг найденного объекта.

Нарисуем архитектуру нашего мобильного робота.
Читать полностью »

Microsoft выложила на Github инструментарий CNTK для глубинного обучения - 1

Microsoft выложила в открытый доступ исходный код инструментов, которые используются в компании для ускорения разработок в области искусственного интеллекта: набор Computational Network Toolkit опубликован на Github.
Читать полностью »

Постановка задачи компьютерного зрения - 1
Последние лет восемь я активно занимаюсь задачами, связанными с распознаванием образов, компьютерным зрением, машинным обучением. Получилось накопить достаточно большой багаж опыта и проектов (что-то своё, что-то в ранге штатного программиста, что-то под заказ). К тому же, с тех пор, как я написал пару статей на Хабре, со мной часто связываются читатели, просят помочь с их задачей, посоветовать что-то. Так что достаточно часто натыкаюсь на совершенно непредсказуемые применения CV алгоритмов.
Но, чёрт подери, в 90% случаев я вижу одну и ту же системную ошибку. Раз за разом. За последние лет 5 я её объяснял уже десяткам людей. Да что там, периодически и сам её совершаю…

В 99% задач компьютерного зрения то представление о задаче, которое вы сформулировали у себя в голове, а тем более тот путь решения, который вы наметили, не имеет с реальностью ничего общего. Всегда будут возникать ситуации, про которые вы даже не могли подумать. Единственный способ сформулировать задачу — набрать базу примеров и работать с ней, учитывая как идеальные, так и самые плохие ситуации. Чем шире база-тем точнее поставлена задача. Без базы говорить о задаче нельзя.

Тривиальная мысль. Но все ошибаются. Абсолютно все. В статье я приведу несколько примеров таких ситуаций. Когда задача поставлена плохо, когда хорошо. И какие подводные камни вас ждут в формировании ТЗ для систем компьютерного зрения.
Читать полностью »

Новинки от Intel - 1С 18 августа на Intel Developer Forum 2015 было представлено сразу несколько новинок: это новая микроархитектура Skylake, накопители Optane, новый форм-фактор материнских плат 5×5 и несколько устройств Интернета вещей.

Skylake

5 августа были продемонстрированы два процессора — первые представители новой микроархитектуры Skylake. Это был не полноценный анонс, а два продукта линейки. Вторую (но не последнюю) порцию данных о Skylake Intel выдала 18 августа. «Скайлейк» — это «так» 14-нанометрового техпроцесса. «Тиком» был Broadwell, в котором в основном шло уменьшение размера элементов на схеме и переход с 22 нм на 14.
Читать полностью »

Facebook научился узнавать людей без лица - 1

Технологии распознавания лиц Facebook достигли такого уровня, что способны идентифицировать человека даже если лица вообще не видно (например, со спины). Такое стало возможным благодаря последним достижениям систем компьютерного зрения, пишет New Scientist.

Экспериментальная нейросеть, разработанная в лаборатории ИИ, натренирована по дополнительным признакам, таким как причёска, цвет волос, одежда, фигура и поза.
Читать полностью »

Самообучаемая программа от Disney Research для распознавания образов - 1

Группа исследователей из питтсбургского подразделения Disney Research разработала систему компьютерного зрения, которая использует некоторые принципы человеческого зрения (pdf). В частности, она содержит алгоритмы для самообучения и способна со временем улучшать распознавание объектов.
Читать полностью »

Всем привет! Эта статья посвящена итогам первого года работы лаборатории компьютерного зрения в Детском Технопарке Новосибирска (официально «Центр развития творчества детей и юношества»). «Лаборатория компьютерного зрения» звучит, конечно, громко, но что-то мы сделать всё же успели.

image
Читать полностью »

В МТИ разработали алгоритм, который удаляет с фотографий отражения в окнах - 1

Если подойти к окну и попытаться сделать фотографию через стекло, то будет трудно избежать отражения собственной фигуры. Ненужный объект будет тем заметнее, чем темнее пространство за окном. Профессиональные фотографы решают эту проблему, подводя объектив камеры вплотную к стеклу и применяя множество других приёмов, к примеру, поляризационные фильтры. Но зачастую в распоряжении имеется только «глазок» смартфона, или возможности для съёмки ограничены, и с наличием отражения приходится мириться. Исследователи Массачусетского технологического института нашли алгоритмическое решение этой проблемы.
Читать полностью »

Сегодня мы публикуем шестую лекцию из курса «Анализ изображений и видео», прочитанного Натальей Васильевой в петербургском Computer Science Center, который создан по совместной инициативе Школы анализа данных Яндекса, JetBrains и CS-клуба.

Всего в программе девять лекций, из которых уже были опубликованы:

  1. Введение в курс «Анализ изображений и видео».
  2. Основы пространственной и частотной обработки изображений.
  3. Морфологическая обработка изображений.
  4. Построение признаков и сравнение изображений: глобальные признаки.
  5. Построение признаков и сравнение изображений: локальные признаки.

Под катом, вы найдете план новой лекции, слайды и подробную расшифровку.
Читать полностью »

Вероятностное программирование в компьютерном зрении: 31 строка кода вместо тысяч - 1
Верхний ряд — 2D-фотографии человеческих лиц; средний ряд — результат 3D-моделирования в программе MIT; нижний ряд — результат 3D-моделирования в одной из предыдущих программ

Множество программных приложений последнего времени, в том числе распознавание образов и речи, обнаружение спама и кредитный скоринг, — это результат работы алгоритмов машинного обучения, когда нейросеть обучается на большом объёме данных.

Данная область бурно развивается в последнее время, а сфера применения машинного обучения становится шире. Неудивительно, что в 2013 году DARPA запустило четырёхлетний исследовательских проект для поиска более эффективных способов разработки приложений, в частности — для разработки языков так называемого вероятностного программирования.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js