Рубрика «Компьютерное зрение» - 11

Готовился к очередному хакатону, решил обновить свои знания в области компьютерного зрения. В прошлый раз задачу распознавания номеров авто в видеопотоке я так и не смог решить быстро «в лоб». Сейчас, поразмыслив, решил немного упростить задачу. Было много идей, листал фотки в телефоне и наткнулся на привычный кейс для всех, кто бывал в магазине ikea — фотографию с чеком, где указан номер товара и его положение на складе самообслуживания.

Компьютерное зрение на примере приложения для IKEA. Часть 1 - 1Читать полностью »

Лето — пора отпусков, каникул и, конечно же, стажировок. Будучи студентом третьего курса по направлению «Прикладная математика и информатика» Иркутского государственного университета, ими я интересовался больше всего. Мне посчастливилось на три месяца присоединиться к службе компьютерного зрения Яндекса. В этом посте я хочу рассказать, каково быть стажером в Яндексе, какие на самом деле задачи перед ними ставят, и что вам вообще за все это будет. Признаюсь, я прошел отбор не без труда, поэтому думаю, что мой пост может быть полезен тем, кто сейчас планирует свое лето.

Яндекс глазами стажера - 1
Команда компьютерного зрения и я в серой футболке

Как это начиналось

Сложности подстерегали меня еще на этапе заполнения анкеты — несколько часов кропотливого труда по заполнению формочек были безжалостно уничтожены ночным обновлением системы. Не идеально, по моему мнению, решив тестовые задачи, я почти начал сомневаться в своих шансах. И вдруг мне ответили и предложили познакомиться с группой нейросетевых технологий, входящей в состав службы компьютерного зрения, так как я указал это направление в своих интересах. Поговорив с сотрудниками Яндекса «за жизнь» и обсудив возможные задачи, я принялся за работу над новым тестовым заданием — построением текстового классификатора.

Читать полностью »

Привет. Это пост-отчет-тьюториал про беспилотные автомобили — как (начать) делать свой без расходов на оборудование. Весь код доступен на github, и помимо прочего вы научитесь легко генерить такие класные картинки:

SLAM trajectory + map example

Поехали! Читать полностью »

Второе почетное. Заметки участника конкурса Dstl Satellite Imagery Feature Detection - 1

Недавно закончилось соревнование по машинному обучению Dstl Satellite Imagery Feature Detection в котором приняло участие аж трое сотрудников Avito. Я хочу поделиться опытом участия от своего лица и рассказать о решении.
Читать полностью »

Недавно, в связи с разработкой новой линейки продукции, в нашей компании встала задача поиска идентичных изображений в базе.

Отдавать реализацию на аутсорс слишком дорого и не гарантирует наилучшего решения. Отдать на откуп фрилансеру — дешевле, но и решение скорее всего будет таким же дешевым и основанным на существующих библиотеках, типа OpenCV. Но если бы задача решалась так просто, то конкуренты уже давно бы этим воспользовались и сделали достойный продукт, но его на рынке нет. В общем, присущие нам перфекционизм, амбициозность и желание быть лучшими, не позволяют нам выводить на рынок продукт «как у всех», нам нужно лучше, быстрее, сильнее. Приняли решение самостоятельно разобраться в вопросе, выработать решение, написать подробное техническое задание и уже отдать на реализацию фрилансеру. Была надежда, что существуют готовые решения, которых просто не заметили конкуренты. Но изучив вопрос (а вместе с ним и алгоритмы ORB, BRIEF, FAST, SIFT, SURF, BRISK, A-KAZE, Viola-Jones и еще несколько) стало понятно, что у всех этих алгоритмов есть свои недостатки. Хотя для решения нашей задачи некоторые из вышеперечисленных алгоритмов и подходили, но как то неожиданно захотелось уникальности и простоты решения. И вот выношу на суд сообщества, алгоритм собственного сочинения.

Любителей покритиковать (конструктивно) прошу под кат.
Читать полностью »

Я увлекаюсь роботами, постоянно мониторю интернет в поисках интересных решений. Случайно нашел очень интересный проект, спешу поделиться информацией с Вами. Краудфандинговый проект JeVois это Opensource платформа машинного зрения: видео датчик и четырехъядерный процессор в крохотном корпусе 28 куб. см. Доставка намечена на февраль 2017. Данный модуль способен передавать данные по USB или последовательному порту. По заявлению авторов проекта все должно работать из коробки. Все что требуется это вставить карту памяти microSD с Вашей программой (заявлена поддержка opencv 3.1 и многих других алгоритмов) и подключить к компьютеру или микроконтроллеру.

JeVois начал развиваться как учебный проект, так как авторы поняли острую необходимость в подобном модуле искусственного зрения при проектировании в робототехнике. На текущий момент отсутствуют специализированные решения, способные работать с raspberry pi или arduino из коробки.
Читать полностью »

Мы решили пофантазировать и заглянуть в будущее на 1 год, на 10 и на 69 лет вперед. Под катом вы найдете 17 прогнозов от женщин-исследователей из подразделения Microsoft Research на 2017 и на 2027 годы, а также поздравительную открытку, которая перенесёт вас в 2086 год.

17 прогнозов на 2017 год: исследователи корпорации Microsoft — о том, чего ожидать в 2017 году и через десять лет - 1
Читать полностью »

Как мы приготовились к UAV Challenge 2016 - 1

Квадро-самолет Мурена во время тестовых полетов

UAV Challenge – это ежегодное мероприятие, направленное на расширение возможностей БЛА и, по совместительству, одно из самых масштабных роботехнических соревнований в мире. Влияние события на отрасль довольно велико: в 2014 году, например, в UAV Challenge участвовали постоянные контрибьюторы таких популярных проектов, как Ardupilot, PX4 и Paparazzi, так что многие из существующих сегодня фич этих контроллеров полета были сформированы именно под влиянием требований этих соревнований. Каждые два года соревнование открыто для команд со всего мира, и при этом тематикой становится миссия по спасению человека. В этом году нам тоже удалось попасть в список из десяти команд, прошедших три предварительных этапа UAV Challenge, и поехать на мероприятия финальной части, которые проходили с 27 по 29 сентября в Далби, Австралия. Чэллендж закончилось два месяца назад – с тех пор наши впечатления успокоились, мы проанализировали опыт и теперь готовы описать те два летательных аппарата, с которыми мы приехали на меропритие.
Читать полностью »

Китайский робот-охранник с электрошокером AnBot заступил в патруль - 1

В Шэньчжэне начал работу первый патрульный робот для работы с гражданским населением, у которого есть вооружение. AnBot похож на своих сородичей как и формой ездящего яйца, так и основной функцией — аудиовизуально искать нарушения и сообщать об этом человеку. У AnBot есть небольшое отличие: он может не просто сообщать об угрозе, но и разгонять толпу электрошокером.

Впервые робота показали в апреле этого года. Разработка Университета национальной обороны Народно-освободительной армии Китая напоминает Далека из «Доктора Кто»: весит 78 килограммов, имеет рост в полтора метра и диаметр в 80 сантиметров. При внешней неповоротливости разработчики обещают максимальную скорость в 18 километров в час — сравнимо со средней скоростью бега. Впрочем, патрульная скорость робота — 1 км/ч, о возможности езды по препятствиям ничего не сообщается. AnBot работает до 8 часов на одном заряде.
Читать полностью »

IBM и MIT хотят научить искусственный интеллект видеть и слышать, как человек - 1

IBM начала долгосрочное сотрудничество с Массачусетским технологическим институтом (Massachusetts Institute of Technology, MIT), подразделением Department of Brain & Cognitive Sciences. В рамках нового проекта создана лаборатория, которая будет заниматься разработкой когнитивных компьютерных систем, способных понимать и анализировать данные из внешних источников, подобно человеку. В первую очередь, речь идет об аудио и визуальной информации. Полученные данные компьютер должен уметь использовать для построения картины мира, который его окружает.

По мнению специалистов, когнитивные «умные» системы могут быть использованы в таких отраслях, как здравоохранение, образование, развлечения. Проще говоря, объединенная команда IBM-MIT будет обучать машины понимать то, что они видят и слышат. Например, для человека не представляет особой сложности описать все, что он увидел в коротком ролике. Машины пока не могут справиться с этой задачей, поскольку им требуется надежная система распознавания изображений и образов.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js