Доброго времени суток. Уже столько сказано о методах деконволюции изображений, кажется добавить больше нечего. Однако всегда найдется алгоритм лучше и новее предыдущих. Не так давно был описан итерационный алгоритм, имеющий линейную скорость сходимости при малых затратах памяти, стабильный и хорошо распараллеливаемый. А через некоторое время он был улучшен еще и до квадратичной сходимости. Встречайте: (Fast) Iterative Shrinkage-Thresholding Algorithm.
Рубрика «обработка изображений» - 60
Еще один алгоритм для восстановления смазанных изображений
2017-03-15 в 19:55, admin, рубрики: fista, GPU вычисления, ista, Matlab, математика, обработка изображений, оптимизацияLIFT: Learned Invariant Feature Transform
2017-03-14 в 5:47, admin, рубрики: computer vision, deep learning, machine learning, Алгоритмы, машинное обучение, обработка изображений
Введение
В последние годы вездесущие нейронные сети находят все больше и больше применений в различных областях знаний, вытесняя классические алгоритмы, использовавшиеся многие годы. Не стала исключением и область компьютерного зрения, где год за годом все больше и больше задач решаются при помощи современных нейронных сетей. Настало время написать об еще одном павшем бойце в войне "Традиционное зрение vs. Глубокое Обучение". Долгие годы на задаче поиска локальных особенностей изображений (так называемых ключевых точек) безраздельно властвовал алгоритм SIFT(Scale-invariant Feature Transform), предложеный в далеком 1999 году, многие сложили головы в попытках превзойти его, но удалось это лишь Deep Learning'у. Итак, встречайте, новый алгоритм поиска локальных особенностей — LIFT (Learned Invariant Feature Transform).
Урок photoshop. Как вырезать сложный объект из фона
2017-03-08 в 16:25, admin, рубрики: matte painting, обработка изображений, уроки photoshop, метки: matte painting, уроки photoshopНа базе создания одной иллюстрации, заснял серию обучающих уроков, думаю некоторым будет в помощь :)
Как я разрушил продуктивность офиса с помощью Slack-бота, заменяющего лица
2017-03-07 в 11:02, admin, рубрики: Go, slack, Wirex, Блог компании Wirex, графика, искусственный интеллект, обработка изображений, ПрограммированиеАвтор материала знакомит нас со своим коллегой Крисом — @Malakhor9000
Крис работает в офисе, где есть целая куча сотрудников, которым нравится «лепить» его лицо фотошопом на самые разные фотки, и постить все это в Slack-канале компании.
Однако постоянно открывать редактор и «копипастить» вырезки лица — дело нудное, особенно когда Крис пытается отвлечь коллег рассказами о своих геройствах в Smite. И вот после многих ночей, проведенных в фотошопе на протяжении нескольких недель, автор материала решительно захотел найти более удобный способ. Так на свет появилась идея написания @Chrisbot. Подробности этой истории ниже.
Изначально, когда я обдумывал идею, я знал, что в проекте будет три главных компонента:
- Простая обработка изображения.
- Интеграция со Slack.
- Распознавание лиц.
Pix2Pix: Как работает генератор кошечек
2017-03-07 в 3:32, admin, рубрики: deep learning, image processing, машинное обучение, обработка изображенийВы все, наверное, уже видели сверх-реалистичных кошечек, которых можно рисовать вот тут:
https://affinelayer.com/pixsrv/
Давайте разбираться, что же там внутре.
Умная кормушка: Machine Learning, Raspberry Pi, Telegram, немножко магии обучения + инструкция по сборке
2017-02-27 в 0:56, admin, рубрики: caffe, computer vision, machine learning, open source, opencv, Raspberry Pi, SqueezeNet, telegram, Алгоритмы, кормушка, машинное зрение, машинное обучение, обработка изображений, птицы, семечки, Системы обмена сообщениямиВсё началось с того, что жена захотела повесить кормушку для птиц. Идея мне понравилась, но сразу захотелось оптимизировать. Световой день зимой короткий — сидеть днём и смотреть на кормушку времени нет. Значит нужно больше Computer Vision!
Идея была простой: прилетает птичка — вжуууух — она оказывается на телефоне. Осталось придумать как это сделать и реализовать.
В статье:
- Запуск Caffe на Raspberry Pi B+ (давно хотел это сделать)
- Построение системы сбора данных
- Выбор нейронной сети, оптимизация архитектуры, обучение
- Оборачивание, выбор и приделывание интерфейса
Все исходники открыты + описан полный порядок развёртывания получившейся конструкции.
Читать полностью »
Технология JPEG: анализ пространства решений
2017-02-25 в 11:22, admin, рубрики: IT-стандарты, jpeg, PDF, Клиентская оптимизация, обработка изображений, оптимизация изображений, хранение изображенийИзображения в формате JPEG, помимо собственно файлов с расширением .jpg, можно встретить внутри PDF-файлов и TIFF-файлов.
Стейкхолдеров технологии JPEG можно, наверное, разделить на следующие группы:
- разработчики фотоаппаратов и сканеров;
- фотографы (большие фотографии в хорошем разрешении с высокими требованиями к качеству);
- соцсети и CDN'ы типа imgix, которые раздают залитые фоточки неконтролируемого UGC-происхождения, количества и размера в пережатом виде;
- вебмастеры, которые управляют умеренным количеством не-UGC картинок с контролируемым качеством;
- любители отсканированных бумажных книг и прочих исторических источников;
Автор этой статьи принадлежит в основном к последней группе, и точно не принадлежит к числу художественных фотографов. Это должно вносить в повествование определенный перекос, который, тем не менее, полезен как раз для иллюстрации возможных траекторий в пространстве решений.
Нейронные сети: практическое применение
2017-02-22 в 14:23, admin, рубрики: Алгоритмы, глубинное обучение, машинное обучение, нейронные сети, обработка изображений, обучение, Перцептрон
Наталья Ефремова погружает публику в специфику практического использования нейросетей. Это — расшифровка доклада Highload++.
Добрый день, меня зовут Наталья Ефремова, и я research scientist в компании N-TechLab. Сегодня я буду рассказывать про виды нейронных сетей и их применение.
Сначала скажу пару слов о нашей компании. Компания новая, может быть многие из вас еще не знают, чем мы занимаемся. В прошлом году мы выиграли состязание MegaFace. Это международное состязание по распознаванию лиц. В этом же году была открыта наша компания, то есть мы на рынке уже около года, даже чуть больше. Соответственно, мы одна из лидирующих компаний в распознавании лиц и обработке биометрических изображений.
Первая часть моего доклада будет направлена тем, кто незнаком с нейронными сетями. Я занимаюсь непосредственно deep learning. В этой области я работаю более 10 лет. Хотя она появилась чуть меньше, чем десятилетие назад, раньше были некие зачатки нейронных сетей, которые были похожи на систему deep learning.
Читать полностью »
Как я сделал самый быстрый ресайз изображений. Часть 1, общие оптимизации
2017-02-21 в 13:12, admin, рубрики: C, pillow, pillow-simd, python, sse, uploadcare, x87, высокая производительность, обработка изображений, оптимизация, производительность, ресайзВ пилотной части я рассказал о задаче как можно подробнее. Рассказ получился долгим и беспредметным — в нем не было ни одной строчки кода. Но без понимания задачи очень сложно заниматься оптимизацией. Конечно, некоторые техники можно применять, имея на руках только код. Например, кешировать вычисления, сокращать ветвления. Но мне кажется, что некоторые вещи без понимания задачи просто никогда не сделать. Это и отличает человека от оптимизирующего компилятора. Поэтому ручная оптимизация все еще играет огромную роль: у компилятора есть только код, а у человека есть понимание задачи. Компилятор не может принять решение, что значение "4" достаточно случайно, а человек может.
Напомню, что речь пойдет об оптимизации операции ресайза изображения методом сверток в реально существующей библиотеке Pillow. Я буду рассказывать о тех изменениях, что я делал несколько лет назад. Но это не будет повторение слово-в-слово: оптимизации будут описаны в порядке, удобном для повествования. Для этих статей я сделал в репозитории отдельную ветку от версии 2.6.2 — именно с этого момента и будет идти повествование.
Создаём нейронную сеть InceptionV3 для распознавания изображений
2017-02-14 в 14:15, admin, рубрики: cnn, deep learning, Google, image classification, python, transfer learning, Алгоритмы, глубокие сверточные нейронные сети, глубокое обучение, машинное обучение, нейронные сети, нейросети, обработка изображений, технологии будущего
Привет! Под катом пойдёт речь о реализации свёрточной нейронной сети архитектуры InceptionV3 с использованием фреймворка Keras. Статью я решил написать после ознакомления с туториалом "Построение мощных моделей классификации с использованием небольшого количества данных". С одобрения автора туториала я немного изменил содержание своей статьи. В отличие от предложенной автором нейронной сети VGG16, мы будем обучать гугловскую глубокую нейронную сеть Inception V3, которая уже предустановлена в Keras.
Вы научитесь:
- Импортировать нейронную сеть Inception V3 из библиотеки Keras;
- Настраивать сеть: загружать веса, изменять верхнюю часть модели (fc-layers), таким образом, приспосабливая модель под бинарную классификацию;
- Проводить тонкую настройку нижнего свёрточного слоя нейронной сети;
- Применять аугментацию данных при помощи ImageDataGenerator;
- Обучать сеть по частям для экономии ресурсов и времени;
- Оценивать работу модели.
При написании статьи я ставил перед собой задачу представить максимально практичный материал, который раскроет некоторые интересные возможности фреймворка Keras.
Читать полностью »