Рубрика «распознавание образов» - 6

Постановка задачи компьютерного зрения - 1
Последние лет восемь я активно занимаюсь задачами, связанными с распознаванием образов, компьютерным зрением, машинным обучением. Получилось накопить достаточно большой багаж опыта и проектов (что-то своё, что-то в ранге штатного программиста, что-то под заказ). К тому же, с тех пор, как я написал пару статей на Хабре, со мной часто связываются читатели, просят помочь с их задачей, посоветовать что-то. Так что достаточно часто натыкаюсь на совершенно непредсказуемые применения CV алгоритмов.
Но, чёрт подери, в 90% случаев я вижу одну и ту же системную ошибку. Раз за разом. За последние лет 5 я её объяснял уже десяткам людей. Да что там, периодически и сам её совершаю…

В 99% задач компьютерного зрения то представление о задаче, которое вы сформулировали у себя в голове, а тем более тот путь решения, который вы наметили, не имеет с реальностью ничего общего. Всегда будут возникать ситуации, про которые вы даже не могли подумать. Единственный способ сформулировать задачу — набрать базу примеров и работать с ней, учитывая как идеальные, так и самые плохие ситуации. Чем шире база-тем точнее поставлена задача. Без базы говорить о задаче нельзя.

Тривиальная мысль. Но все ошибаются. Абсолютно все. В статье я приведу несколько примеров таких ситуаций. Когда задача поставлена плохо, когда хорошо. И какие подводные камни вас ждут в формировании ТЗ для систем компьютерного зрения.
Читать полностью »

Американский программист сделал прототип робота для уборки мусора - 1

Программист по профессии, и любитель робототехники по жизни, пользователь сайта HackADay под ником BDM разместил на ресурсе описание своего проекта – автоматический сборщик мусора «Lazy Cleaner 9000».

Сборщик собран на базе детского электромобиля, использует Raspberry Pi для работы софта, камеру Rasp. Pi NOIR cam для съёмки и получения картинки, которую затем обрабатывает алгоритм распознавания образов.
Читать полностью »

Автомобили Google будут распознавать пешеходов с высокой точностью - 1

До появления в продаже беспилотных автомобилей осталось не так много времени. Google доводит до ума технологии машинного зрения и один из самых важных элементов — распознавание пешеходов в реальном времени.

Исследователи из Google Research Алекс Крижевский (Alex Krizhevsky), Анелия Ангелова (Anelia Angelova) с коллегами представили новый метод детектирования пешеходов с помощью нейросетей. Метод показал обнадёживающий результат: пешехода удаётся заметить с высокой точностью 73,8% случаев по тесту Caltech Pedestrian, который содержит базу данных с 50 000 помеченных пешеходов в городских и сельских условиях. Такой результат сравним с самыми лучшими альтернативными разработками.
Читать полностью »

Первый в мире случай читерства в исследованиях ИИ - 1

Imagenet Challenge — международный конкурс для систем распознавания образов. По условиям, компьютерная программа должна распознать и классифицировать ряд объектов на цифровых изображениях, определив одну из 1000 тематических категорий.

В соревновании участвуют многие крупные компании, которые выделяют большие бюджеты на подобные разработки. Поэтому новость о читерстве китайской компании Baidu вызвала настоящий скандал: говорят, это первый случай мошенничества в сфере разработок систем искусственного интеллекта. В результате, Baidu исключена из соревнований Imagenet на следующий год.
Читать полностью »

Чтобы хорошо готовить говядину, нужно сначала испортить несколько килограммов мяса. Повара годами учатся делать блюда идеальными, в случае неудачи выбрасывая их в мусорный бак. Стартап из Сан-Франциско предлагает очередной лёгкий способ готовить — «умную» духовку June. Это кухонное «чудо» распознаёт еду, чтобы подобрать идеальный вариант её приготовления, и транслирует видео на смартфон.

image
Читать полностью »

Самообучаемая программа от Disney Research для распознавания образов - 1

Группа исследователей из питтсбургского подразделения Disney Research разработала систему компьютерного зрения, которая использует некоторые принципы человеческого зрения (pdf). В частности, она содержит алгоритмы для самообучения и способна со временем улучшать распознавание объектов.
Читать полностью »

Известный сайт для хранения и публикации фотографий столкнулся с характерной проблемой любых автоматических средств, которые пытаются заменить человека при анализе нестандартной информации. Пользователи заметили, что функция автоматического присваивания тегов зачастую распознаёт объекты на фотографиях мало того, что некорректно, так ещё и многие теги оказываются просто оскорбительными. К примеру, фотографии чернокожего мужчины, по мнению Flickr, должны быть присвоены кроме прочих теги «animal»(животное) и «ape» (обезьяна).
Читать полностью »

Wolfram Alpha научился описывать содержимое любых картинок и фото - 1

Разработчики сайта Wolfram Alpha добавили в копилку уникальных возможностей системы ещё одну удивительную функцию – распознавание любых фотографий. Каждый желающий может опробовать ImageIdentify в работе. Достаточно загрузить картинку на демонстрационный сайт и через несколько секунд вы получите ответ. Как утверждают сами разработчики – почти всегда правильный.

Стивен Вольфрам, основатель и главный идеолог компании, подробно описывает работу системы в записи в своём блоге. Стивен говорит, что 40 лет ждал момента, когда компьютеры научатся распознавать изображения, и был уверен в том, что этот момент настанет. Задача распознавания – одна из самых базовых для человека, и одна из самых сложных – для компьютерных систем и алгоритмов.

Стивен пишет, что хотя алгоритм и не всегда распознаёт изображения верно, даже его ошибки сильно напоминают человеческие.

Распознавание изображений теперь работает не только на демонстрационном сайте, но и в самом Wolfram Language. Можно задать изображение, получить его описание, а потом использовать уже само описание – получить, например, определение предмета из словарной статьи, или построить облако слов из статьи в Википедии.
Читать полностью »

Lily: умная камера-дрон летает за тобой - 1

Многие люди любят делать автопортреты и даже применяют для этого всякие хитрые приспособления вроде палок с дистанционным спуском фотоаппарата и т. д. Но как сфотографироваться, если ты спускаешься на лыжах или усиленно гребёшь на лодке?

Здесь на помощь придёт Lily — гибрид личного смартфона и квадрокоптера. Лили будет неотрывно следить за тобой и снимать.
Читать полностью »

Мы мельком заглянули в будущее онлайн поиска, и вот что мы там увидели: 17 секундное видео со щеночком, предоставленное Clarifai – небольшим стартапом, специализирующимся на искусственном интеллекте.

Видео показывает милого щеночка, тыкающегося в свою хозяйку, но самое интересное находится в линиях снизу видео. Использую базу данных из 10 000 визуальных категорий, которую Clarifai собрали за последние пол года, программное обеспечение компании следит за каждым кадром видео, автоматически описывая их такими словами, как «собака», «женщина», «глаза» и даже «милый».

image
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js