В данной статье приводится доступный теоретический обзор сверточных нейронных сетей (Convolutional Neural Network, CNN) и разъясняется их применение к задаче классификации изображений.
Рубрика «обработка изображений» - 42
AI, практический курс. Обзор нейронных сетей для классификации изображений
2018-07-09 в 10:58, admin, рубрики: Hands on AI практический курс, Блог компании Intel, машинное обучение, обработка изображений, Программированиеkaggle: IEEE’s Camera Model Identification
2018-07-05 в 11:05, admin, рубрики: computer science, computer vision, image processing, kaggle, python, Блог компании Open Data Science, машинное обучение, обработка изображений, управление разработкойВ конце зимы этого года прошло соревнование IEEE's Signal Processing Society — Camera Model Identification. Я участвовал в этом командном соревновании в качестве ментора. Об альтернативном способе формирования команды, решении и втором этапе под катом
Читать полностью »
Распознавание товаров на полках с помощью нейронных сетей на технологиях Keras и Tensorflow Object Detection API
2018-07-04 в 7:47, admin, рубрики: computer vision, detection, keras, python, recognition, TensorFlow, Блог компании EastBanc Technologies, искусственный интеллект, машинное обучение, нейронные сети, обработка изображений, распознавание изображенийВ статье мы расскажем о применении свёрточных нейронных сетей для решения практической бизнес-задачи восстановления реалограммы по фотографии полок с товарами. С помощью Tensorflow Object Detection API мы натренируем модель поиска/локализации. Улучшим качество поиска мелких товаров на фотографиях с большим разрешением с помощью плавающего окна и алгоритма подавления немаксимумов. На Keras реализуем классификатор товаров по брендам. Параллельно будем сравнивать подходы и результаты с решениями 4 летней давности. Все данные, использованные в статье, доступны для скачивания, а полностью рабочий код есть на GitHub и оформлен в виде tutorial.
Читать полностью »
Кодек нового поколения AV1: корректирующий направленный фильтр CDEF
2018-07-03 в 12:20, admin, рубрики: AV1, CDEF, Daala, DCT, Thor, Алгоритмы, блочные артефакты, кодек, обработка изображений, подавление шума, Работа с видео, энкодер
Автор: Monty (monty@xiph.org, cmontgomery@mozilla.com). Опубликовано 28 июня 2018 года.
Если кто не читал предыдущую статью… AV1 — это новый универсальный видеокодек, разработанный Альянсом за открытые медиа (Alliance for Open Media). Альянс взял за основу кодек VPX от Google, Thor от Cisco и Daala от Mozilla/Xiph.Org. Кодек AV1 превосходит по производительности VP9 и HEVC, что делает его кодеком не завтрашнего, а послезавтрашнего дня. Формат AV1 свободен от любых роялти и навсегда останется таковым с разрешительной лицензией.
Эта статья задумывалась как вторая в серии статей, которые подробно описывают функциональность AV1 и новых технологий, которые лежат в его основе и впервые используются в продакшне. Предыдущая статья на Xiph.org объясняла функцию прогнозирования яркости Chroma from Luma (CfL). Сегодня мы расскажем об ограниченном направленном корректирующем фильтр (Constrained Directional Enhancement Filter). Если вы всегда задавались вопросом, что нужно для написания кодека, пристегните ремни и приготовьтесь к образованию!
Читать полностью »
Машинное зрение для ритейла. Как прочитать ценники в магазине
2018-07-02 в 6:57, admin, рубрики: big data, computer vision, machine learning, sap, TensorFlow, Блог компании SAP, Компьютерное зрение, машинное зрение, машинное обучение, обработка изображений, распознавание изображенийМашинное зрение – очень актуальная тема в наши дни. Для решения задачи по распознаванию магазинных ценников с использованием нейронных сетей мы выбрали фреймворк TensorFlow.
В статье пойдет речь именно о том, как с его помощью локализовать и идентифицировать несколько объектов на одном магазинном ценнике, а также распознать его содержимое. Похожая задача распознавания ценников IKEA уже решалась на Хабре с применением классических инструментов обработки изображений, доступных в библиотеке OpenCV.
Отдельно хотелось бы отметить, что решение может работать как на платформе SAP HANA в связке с Tensorflow Serving, так и на SAP Cloud Platform.
Задача распознавания цены товара актуальна и для покупателей, которые хотят «шарить» цены друг с другом и выбирать магазин для покупок, и для ритейлеров — они хотят узнавать про цены конкурентов в режиме реального времени.
Хватит лирики – гоу в технику!
Читать полностью »
Виртуальный зал Эрмитажа — первый шаг к будущему по Пелевину
2018-06-28 в 7:05, admin, рубрики: 3d, VR, Блог компании КРОК, виртуальная реальность, обработка изображений, Разработка под AR и VR, трехмерное моделирование, эрмитаж
Мы застряли с оцифровкой зала Эрмитажа примерно на месяц. Изначально мы думали, что имеющиеся решения для переноса объектов в 3D (типа лазерных сканеров) будут отлично работать и вопрос исключительно технический. На деле оказалось, что эта область не очень-то проработана и подводных камней там море.
За проект попали на конференцию FMX по иммерсионным технологиям и графике. Российские разработчики попадают на эту конференцию с докладом впервые. Мы выступаем вместе с Пиксаром и ребятами, которые делали «Игру престолов». Не то чтобы мы такие крутые, как Пиксар, просто агрегировали всё лучшее, что было на рынке, лучшие практики по фотограмметрии и опытным путём всё это применяли. Оказалось, так ещё никто не делал.
Но давайте начнём с того, что может быть сложного в оцифровке зала со статуей. Делов-то на пару дней, правда?
Читать полностью »
Фотографии 19-го века удалось восстановить при помощи технологий 21-го века
2018-06-26 в 8:21, admin, рубрики: дагерротип, история фотографии, обработка изображений, фотография, ФототехникаПервая работоспособная технология фотографии называлась дагеротипия. Это фотографический процесс, основа которого — светочувствительность йодистого серебра. Технология пользовалась заслуженной популярностью в течение примерно 20 лет, пока на смену ей не пришли более практичные (а главное — дешевые) процессы.
Современные снимки по внешнему виду отличаются от дагеротипов. Последние больше напоминают отражение в зеркале. Причина этого то, что «картинка» получалась при помощи смеси серебра и ртути. Ее называли зеркалом с памятью. В зависимости от угла наклона пластинки к источнику света дагеротип может выглядеть и как позитив, и как негатив. Недостатком такого типа получения изображений была недолговечность результата.
Читать полностью »
Как нам удалось прочитать рукопись, найденную в 80-х возле третьего крематория в Аушвице-Биркенау
2018-06-25 в 11:31, admin, рубрики: photoshop, Алгоритмы, война, история, концлагеря, марсель наджари, мультиспектральный анализ, Научно-популярное, обработка изображений, периферияЭта история для меня началась в 2015 году, когда я посмотрел передачу на Youtube с Павлом Поляном, посвященную 70-летию освобождения Аушвица-Биркенау. Он рассказывал о своей книге «Свитки из пепла», его новых переводах с оригиналов документов от непосредственных свидетелей холокоста — членов зондеркоммандо, о найденных им цензурированных первыми переводчиками местах, о состоянии рукописей и о технических проблемах чтения, с которыми он столкнулся.
Меня заинтересовал момент: каким же образом выглядит процесс перевода военных документов, насколько качественно они были оцифрованы, все ли было сделано для того, чтобы не ломать глаза переводчику. Когда я получил на анализ копии оцифрованных документов, я был удивлен нераскрытым потенциалом одной их них – Марселя Наджари. Ее часть в «свитках из пепла» занимала совсем малую главу, через несколько лет эта история раскрутилась до публикаций в мировых СМИ. Она интересна так же, как и страшна.
AI, практический курс. Предобработка и дополнение данных с изображениями
2018-06-25 в 9:16, admin, рубрики: Hands on AI практический курс, Блог компании Intel, машинное обучение, обработка изображений, ПрограммированиеПредобработка — это общий термин для всех манипуляций, производимых с данными перед передачей их модели, включая центрирование, нормализацию, сдвиг, вращение, обрезку и т. п. Как правило, предобработка требуется в двух случаях.
- Очистка данных. Предположим, что на изображениях присутствуют некоторые артефакты. Чтобы облегчить обучение модели, артефакты необходимо удалить на этапе предобработки.
- Дополнение данных. Иногда небольших наборов данных недостаточно для качественного глубокого обучения модели. Подход с дополнением данных весьма полезен при решении этой проблемы. Это процесс трансформации каждого образца данных различными способами и добавления к набору данных таких измененных образцов. Таким образом можно повысить эффективный размер набора данных.
Рассмотрим некоторые возможные методы трансформации при предобработке и их реализацию через Keras.