Рубрика «обработка изображений» - 42

Презентация робота SpotMini от Boston Dynamics

2018-07-12 в 9:15, admin, рубрики: atlas, BigDog, Boston Dynamics, Handle, Spot, SpotMini, обработка изображений, Презентации, программирование микроконтроллеров, Разработка робототехники, робототехника

Это видео где Marc Raibert основатель Boston Dynamics рассказывает про роботов: BigDog, Spot, SpotMini, Atlas. На основании этого видео и других видео где выступал Marc, я опишу кратко технологии роботов и дальнейшие планы компании.
Читать полностью »

AI, практический курс. Обзор нейронных сетей для классификации изображений

2018-07-09 в 10:58, admin, рубрики: Hands on AI практический курс, Блог компании Intel, машинное обучение, обработка изображений, Программирование

В данной статье приводится доступный теоретический обзор сверточных нейронных сетей (Convolutional Neural Network, CNN) и разъясняется их применение к задаче классификации изображений.

AI, практический курс. Обзор нейронных сетей для классификации изображений - 1
Читать полностью »

kaggle: IEEE’s Camera Model Identification

2018-07-05 в 11:05, admin, рубрики: computer science, computer vision, image processing, kaggle, python, Блог компании Open Data Science, машинное обучение, обработка изображений, управление разработкой

В конце зимы этого года прошло соревнование IEEE's Signal Processing Society — Camera Model Identification. Я участвовал в этом командном соревновании в качестве ментора. Об альтернативном способе формирования команды, решении и втором этапе под катом
kaggle: IEEE's Camera Model Identification - 1
Читать полностью »

Распознавание товаров на полках с помощью нейронных сетей на технологиях Keras и Tensorflow Object Detection API

2018-07-04 в 7:47, admin, рубрики: computer vision, detection, keras, python, recognition, TensorFlow, Блог компании EastBanc Technologies, искусственный интеллект, машинное обучение, нейронные сети, обработка изображений, распознавание изображений

В статье мы расскажем о применении свёрточных нейронных сетей для решения практической бизнес-задачи восстановления реалограммы по фотографии полок с товарами. С помощью Tensorflow Object Detection API мы натренируем модель поиска/локализации. Улучшим качество поиска мелких товаров на фотографиях с большим разрешением с помощью плавающего окна и алгоритма подавления немаксимумов. На Keras реализуем классификатор товаров по брендам. Параллельно будем сравнивать подходы и результаты с решениями 4 летней давности. Все данные, использованные в статье, доступны для скачивания, а полностью рабочий код есть на GitHub и оформлен в виде tutorial.

Распознавание товаров на полках с помощью нейронных сетей на технологиях Keras и Tensorflow Object Detection API - 1
Читать полностью »

Кодек нового поколения AV1: корректирующий направленный фильтр CDEF

2018-07-03 в 12:20, admin, рубрики: AV1, CDEF, Daala, DCT, Thor, Алгоритмы, блочные артефакты, кодек, обработка изображений, подавление шума, Работа с видео, энкодер

Кодек нового поколения AV1: корректирующий направленный фильтр CDEF - 1

Автор: Monty (monty@xiph.org, cmontgomery@mozilla.com). Опубликовано 28 июня 2018 года.

Кодек нового поколения AV1: корректирующий направленный фильтр CDEF - 2 Если кто не читал предыдущую статью… AV1 — это новый универсальный видеокодек, разработанный Альянсом за открытые медиа (Alliance for Open Media). Альянс взял за основу кодек VPX от Google, Thor от Cisco и Daala от Mozilla/Xiph.Org. Кодек AV1 превосходит по производительности VP9 и HEVC, что делает его кодеком не завтрашнего, а послезавтрашнего дня. Формат AV1 свободен от любых роялти и навсегда останется таковым с разрешительной лицензией.

Эта статья задумывалась как вторая в серии статей, которые подробно описывают функциональность AV1 и новых технологий, которые лежат в его основе и впервые используются в продакшне. Предыдущая статья на Xiph.org объясняла функцию прогнозирования яркости Chroma from Luma (CfL). Сегодня мы расскажем об ограниченном направленном корректирующем фильтр (Constrained Directional Enhancement Filter). Если вы всегда задавались вопросом, что нужно для написания кодека, пристегните ремни и приготовьтесь к образованию!
Читать полностью »

Машинное зрение для ритейла. Как прочитать ценники в магазине

2018-07-02 в 6:57, admin, рубрики: big data, computer vision, machine learning, sap, TensorFlow, Блог компании SAP, Компьютерное зрение, машинное зрение, машинное обучение, обработка изображений, распознавание изображений

Машинное зрение – очень актуальная тема в наши дни. Для решения задачи по распознаванию магазинных ценников с использованием нейронных сетей мы выбрали фреймворк TensorFlow.

В статье пойдет речь именно о том, как с его помощью локализовать и идентифицировать несколько объектов на одном магазинном ценнике, а также распознать его содержимое. Похожая задача распознавания ценников IKEA уже решалась на Хабре с применением классических инструментов обработки изображений, доступных в библиотеке OpenCV.

Отдельно хотелось бы отметить, что решение может работать как на платформе SAP HANA в связке с Tensorflow Serving, так и на SAP Cloud Platform.

Задача распознавания цены товара актуальна и для покупателей, которые хотят «шарить» цены друг с другом и выбирать магазин для покупок, и для ритейлеров — они хотят узнавать про цены конкурентов в режиме реального времени.

Хватит лирики – гоу в технику!
Читать полностью »

Аппаратное кодирование видео потока на камере Logitech C920 и отправка его в ROS по wifi с задержкой менее 0.2 секунды

2018-06-30 в 9:10, admin, рубрики: EduMip, gscam, gstreamer, Logitech C920, robotic operating system, ROS, обработка изображений, Работа с видео, Разработка на Raspberry Pi, Разработка робототехники, робототехника

В этой инструкции мы отправим аппаратно закодированный h264 видео поток камеры Logitech C920 переданный c BeagleBone Blue по wifi сети на ноутбук, а затем примем его в узел ROS gscam и произведем поиск и распознавание изображений карт таро и бутылки кетчупа по пути движения робота EduMIP.
Читать полностью »

Виртуальный зал Эрмитажа — первый шаг к будущему по Пелевину

2018-06-28 в 7:05, admin, рубрики: 3d, VR, Блог компании КРОК, виртуальная реальность, обработка изображений, Разработка под AR и VR, трехмерное моделирование, эрмитаж

Виртуальный зал Эрмитажа — первый шаг к будущему по Пелевину - 1

Мы застряли с оцифровкой зала Эрмитажа примерно на месяц. Изначально мы думали, что имеющиеся решения для переноса объектов в 3D (типа лазерных сканеров) будут отлично работать и вопрос исключительно технический. На деле оказалось, что эта область не очень-то проработана и подводных камней там море.

За проект попали на конференцию FMX по иммерсионным технологиям и графике. Российские разработчики попадают на эту конференцию с докладом впервые. Мы выступаем вместе с Пиксаром и ребятами, которые делали «Игру престолов». Не то чтобы мы такие крутые, как Пиксар, просто агрегировали всё лучшее, что было на рынке, лучшие практики по фотограмметрии и опытным путём всё это применяли. Оказалось, так ещё никто не делал.

Но давайте начнём с того, что может быть сложного в оцифровке зала со статуей. Делов-то на пару дней, правда?
Читать полностью »

Фотографии 19-го века удалось восстановить при помощи технологий 21-го века

2018-06-26 в 8:21, admin, рубрики: дагерротип, история фотографии, обработка изображений, фотография, Фототехника

Первая работоспособная технология фотографии называлась дагеротипия. Это фотографический процесс, основа которого — светочувствительность йодистого серебра. Технология пользовалась заслуженной популярностью в течение примерно 20 лет, пока на смену ей не пришли более практичные (а главное — дешевые) процессы.

Современные снимки по внешнему виду отличаются от дагеротипов. Последние больше напоминают отражение в зеркале. Причина этого то, что «картинка» получалась при помощи смеси серебра и ртути. Ее называли зеркалом с памятью. В зависимости от угла наклона пластинки к источнику света дагеротип может выглядеть и как позитив, и как негатив. Недостатком такого типа получения изображений была недолговечность результата.
Читать полностью »

Как нам удалось прочитать рукопись, найденную в 80-х возле третьего крематория в Аушвице-Биркенау

2018-06-25 в 11:31, admin, рубрики: photoshop, Алгоритмы, война, история, концлагеря, марсель наджари, мультиспектральный анализ, Научно-популярное, обработка изображений, периферия

Эта история для меня началась в 2015 году, когда я посмотрел передачу на Youtube с Павлом Поляном, посвященную 70-летию освобождения Аушвица-Биркенау. Он рассказывал о своей книге «Свитки из пепла», его новых переводах с оригиналов документов от непосредственных свидетелей холокоста — членов зондеркоммандо, о найденных им цензурированных первыми переводчиками местах, о состоянии рукописей и о технических проблемах чтения, с которыми он столкнулся.

Меня заинтересовал момент: каким же образом выглядит процесс перевода военных документов, насколько качественно они были оцифрованы, все ли было сделано для того, чтобы не ломать глаза переводчику. Когда я получил на анализ копии оцифрованных документов, я был удивлен нераскрытым потенциалом одной их них – Марселя Наджари. Ее часть в «свитках из пепла» занимала совсем малую главу, через несколько лет эта история раскрутилась до публикаций в мировых СМИ. Она интересна так же, как и страшна.

Как нам удалось прочитать рукопись, найденную в 80-х возле третьего крематория в Аушвице-Биркенау - 1
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «обработка изображений» - 42

Презентация робота SpotMini от Boston Dynamics

AI, практический курс. Обзор нейронных сетей для классификации изображений

kaggle: IEEE’s Camera Model Identification

Распознавание товаров на полках с помощью нейронных сетей на технологиях Keras и Tensorflow Object Detection API

Кодек нового поколения AV1: корректирующий направленный фильтр CDEF

Машинное зрение для ритейла. Как прочитать ценники в магазине

Аппаратное кодирование видео потока на камере Logitech C920 и отправка его в ROS по wifi с задержкой менее 0.2 секунды

Виртуальный зал Эрмитажа — первый шаг к будущему по Пелевину

Фотографии 19-го века удалось восстановить при помощи технологий 21-го века

Как нам удалось прочитать рукопись, найденную в 80-х возле третьего крематория в Аушвице-Биркенау

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «обработка изображений» - 42

Новости

Актуальные темы

Архив