Рубрика «обработка изображений» - 69

Нейронная сеть как предиктор для кодирования изображений формата PNG

2016-06-22 в 10:27, admin, рубрики: java, PNG, компрессия, нейронная сеть, обработка изображений, предиктивные технологии, сжатие графики, сжатие данных

Предлагаю вашему внианию перевод статьи Neural Network As Predictor For Image Coding (PNG). Блог автора находится здесь.

Тема исследования

Главной причиной данной работы было улучшение существующих предварительных фильтров. Создать новый фильтр, который с помощью искусственной нейронной сети делал бы наилучший прогноз, приводящий к лучшему сжатию файла.

Сжатие

Классически PNG-компрессия делится на два шага:

Предварительная фильтрация (с использованием предикторов);
Компрессия (с помощью DEFLATE).

В данной статье важен только первый шаг. На рисунке ниже вы можете видеть существующие на данный момент предварительные фильтры, и как они сохраняют разницу между реальным и предсказанным пикселем.
Читать полностью »

Ещё раз про быстрый JPEG на CUDA

2016-06-15 в 15:52, admin, рубрики: 12-bit JPEG, CUDA JPEG Codec, fast lossy compression, gpgpu, GPU JPEG benchmark, HPC, JPEG encoder and decoder on GPU, JPEG performance, NVIDIA GeForce 1080, быстрое сжатие изображений, высокая производительность, кодек джипег, обработка изображений, параллельное программирование, параллельные вычисления, сжатие данных, метки: CUDA JPEG Codec, GPU JPEG benchmark, JPEG encoder and decoder on GPU, NVIDIA GeForce 1080

В 2012 году на Хабре уже была моя статья про быстрое сжатие в JPEG на видеокарте. С тех пор прошло уже довольно много времени и мне хотелось бы в общих чертах рассказать про результаты, которые были получены по этой теме. Надеюсь, многим будет интересно узнать, какой уровень производительности можно получить на современных видеокартах NVIDIA при решении практических задач на CUDA.
Читать полностью »

Intel Media SDK 2016 R2 — что нового?

2016-06-15 в 13:52, admin, рубрики: Intel Media SDK, Блог компании Intel, обработка изображений, Программирование, метки: intel media sdk

Intel Media SDK 2016 R2 — что нового? - 1 Увидела свет новая версия комплекса средств для разработки ПО кодирования и воспроизведения медиа контента Intel Media SDK 2016. Обновление содержит ряд существенных изменений:

Добавлена поддержка процессоров Intel Core седьмого поколения (Kabylake);
Улучшена работа Media RAW Accelerator для обеспечения гибкости и производительности;
Добавлены новые возможности при кодировании AVC/H.264 для видеоконференций и облачных игровых сервисов;
Добавлены новые VPP-фильтры и улучшены существующие;
Внедрена новая версия API c улучшениями в управлении памятью и функционалом запроса платформы;
Внедрена поддержка Windows Redstone Preview.

Под катом — краткий обзор текущей функциональности Intel Media SDK 2016.
Читать полностью »

Инструменты Intel для создателей видео кодеков

2016-06-14 в 12:50, admin, рубрики: intel, validations, video compression, video encoding, Блог компании Intel, обработка изображений, Программирование

На Хабре в блоге Intel регулярно появляются статьи с описанием технологий и инструментов, созданных в стенах Intel. Многие из них так или иначе связаны с обработкой и анализом видео и изображений. Это такие продукты как, например, Intel Media Server Studio или Intel RealSense. Однако, существует набор инструментов, не так широко представленных в медиа пространстве, но не менее значимых для такой категории разработчиков, как создатели медиа кодеков. Именно этот пробел мы и попытаемся восполнить в данном топике. Речь пойдет про Intel Video Pro Analyzer (Intel VPA) и Intel Stress Bitstreams and Encoder (Intel SBE), а также про те возможности, что скрываются за этими названиями.

Для начала определимся с предметом, сущностью, с которой работают вышеназванные инструменты. Это битовые стримы. Битовый стрим – это то, что получается после того, как отработал видео энкодер. Битовый стрим – это поток битов, отвечающий спецификации того или иного кодека. Если мы заглянем в спецификацию большинства кодеков, то увидим, что этот битстрим представляет из себя ничто иное как набор синтаксических элементов данного кодека различной длины. Это, к примеру, ширина и высота картинки, профиль кодирования, коэффициенты трансформации, различные битовые флаги и т.д. Для стандарта HEVC это сотни синтаксических элементов. После кодирования эти битовые стримы доходят до пользователей, помещенные в различные медиа контейнеры – avi, mp4, mpeg ts и т.д. Но разработчики кодеков в основном работают именно с битовыми стримами. Разработчики ПО, дизайнеры, инженеры – электронщики, тестеры имеют свои инструменты для работы. Почему же разработчикам кодеков их не иметь?
Читать полностью »

Эволюция нейросетей для распознавания изображений в Google: Inception-ResNet

2016-06-14 в 7:17, admin, рубрики: cnn, deep learning, Google, image classification, microsoft, машинное обучение, обработка изображений

Буду потихоньку дорассказывать про Inception.
Предыдущая часть здесь — https://habrahabr.ru/post/302242/.
Мы остановились на том, Inception-v3 не выиграл Imagenet Recognition Challange в 2015-м, потому что появились ResNets (Residual Networks).

Что такое вообще ResNets?

Эволюция нейросетей для распознавания изображений в Google: Inception-ResNet - 1 Читать полностью »

Повышение производительности мультимедиа приложений с помощью аппаратного ускорения

2016-06-03 в 6:21, admin, рубрики: cloud computing, data center, graphics, Intel Media Server Studio, Media Processing, Media SDK for Windows, Блог компании Intel, высокая производительность, обработка изображений, Программирование

Повышение производительности мультимедиа приложений с помощью аппаратного ускорения - 1
Архитектура процессоров Intel становится все более ориентированной на ГП, что открывает удивительные возможности для резкого повышения производительности просто за счет разгрузки обработки мультимедиа с ЦП на ГП. Существует немало инструментов, доступных разработчикам для повышения производительности мультимедиа приложений. В числе этих инструментов есть бесплатные и простые в использовании.
В этой публикации вы найдете:

Обзор вычислительных архитектур и текущие возможности ГП Intel
Реализацию аппаратного ускорения с помощью FFmpeg
Реализацию аппаратного ускорения с помощью Intel Media SDK или аналогичного компонента Intel Media Server Studio (в зависимости от целевой платформы)

Читать полностью »

Эволюция нейросетей для распознавания изображений в Google: Inception-v3

2016-05-31 в 6:03, admin, рубрики: cnn, deep learning, Google, image classification, машинное обучение, обработка изображений

Продолжаю рассказывать про жизнь Inception architecture — архитеткуры Гугла для convnets.
(первая часть — вот тут)
Итак, проходит год, мужики публикуют успехи развития со времени GoogLeNet.
Вот страшная картинка как выглядит финальная сеть:

Что же за ужас там происходит?

Читать полностью »

Рисуйте, рисуйте, рисуйте: скоро выйдет Inkscape 0.92

2016-05-30 в 12:23, admin, рубрики: corel draw, illustrator, inkscape, open source, обработка изображений

Статья про предыдущую версию Inkscape была очень тепло принята, что в связи с ближайшим выходом новой версии Inkscape 0.92 сподвигло меня описать ключевые особенности грядущего релиза. Сам релиз состоится в ближайшее время — во всяком случае пререлиз под *.nix уже тут.

Немного истории: пользователь ДевианАрт flutterguy317 форкнул Inkscape и пытался построить свой редактор Ponyscape с дружбой и магией до 4 февраля 2013 г., после чего проект был заморожен навсегда. И вот теперь, в версии Inkscape 0.92, появилась импортированная из Ponyscape иерархия документа. В связи с этим в иллюстрировании статьи будет немного арта из сообщества Ponyscape Vectors а так же много дружбы и магии.

Рисуйте, рисуйте, рисуйте: скоро выйдет Inkscape 0.92 - 1
Иллюстрация основана на работах flutterguy317 «Ponyscape» и Ambassad0r «No Time To Explain»
Читать полностью »

Structure from motion

2016-05-30 в 4:44, admin, рубрики: computer vision, essential matrix, fundamental matrix, Structure from motion, Алгоритмы, математика, обработка изображений

Structure from motion - 1
Если посмотреть на последовательность кадров, в которых движется камера, то мозг легко воспринимает геометрическую структуру содержимого. Однако, в компьютерном зрении это не тривиальная проблема. В этой статье я постараюсь описать возможное решение этой задачи.
Читать полностью »

База фотографий Google Photos выросла до 13,7 петабайт

2016-05-28 в 10:08, admin, рубрики: Google, Google Photos, дата-майнинг, ИИ, искусственный интеллект, обработка изображений, Софт

За год люди сделали 24 миллиарда селфи

База фотографий Google Photos выросла до 13,7 петабайт - 1
^{Композитные изображения, которые соответствует оптимальным стимулам для нейрона-классификатора кошки и человека в нейросети Google, во время первого эксперимента 2012 года}

Человечество продолжает усиленно фотографироваться, снабжая Google обильным потоком информации для обучения систем искусственного интеллекта. Нейросеть Google уже умеет определять страну по фотографии, распознавать объекты, распределять фотографии по тематическим группам, автоматически генерировать видеоролики и коллажи и многое другое.

Сами пользователи получают бесплатный хостинг неограниченного размера, что очень удобно: можно освободить место и никогда не волноваться о потере фотографий.
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «обработка изображений» - 69

Нейронная сеть как предиктор для кодирования изображений формата PNG

Тема исследования

Сжатие

Ещё раз про быстрый JPEG на CUDA

Intel Media SDK 2016 R2 — что нового?

Инструменты Intel для создателей видео кодеков

Эволюция нейросетей для распознавания изображений в Google: Inception-ResNet

Что такое вообще ResNets?

Повышение производительности мультимедиа приложений с помощью аппаратного ускорения

Эволюция нейросетей для распознавания изображений в Google: Inception-v3

Рисуйте, рисуйте, рисуйте: скоро выйдет Inkscape 0.92

Structure from motion

База фотографий Google Photos выросла до 13,7 петабайт

За год люди сделали 24 миллиарда селфи

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «обработка изображений» - 69

Тема исследования

Сжатие

Что такое вообще ResNets?

За год люди сделали 24 миллиарда селфи

Новости

Актуальные темы

Архив