В 2012 году на Хабре уже была моя статья про быстрое сжатие в JPEG на видеокарте. С тех пор прошло уже довольно много времени и мне хотелось бы в общих чертах рассказать про результаты, которые были получены по этой теме. Надеюсь, многим будет интересно узнать, какой уровень производительности можно получить на современных видеокартах NVIDIA при решении практических задач на CUDA.
Читать полностью »
Рубрика «обработка изображений» - 69
Ещё раз про быстрый JPEG на CUDA
2016-06-15 в 15:52, admin, рубрики: 12-bit JPEG, CUDA JPEG Codec, fast lossy compression, gpgpu, GPU JPEG benchmark, HPC, JPEG encoder and decoder on GPU, JPEG performance, NVIDIA GeForce 1080, быстрое сжатие изображений, высокая производительность, кодек джипег, обработка изображений, параллельное программирование, параллельные вычисления, сжатие данных, метки: CUDA JPEG Codec, GPU JPEG benchmark, JPEG encoder and decoder on GPU, NVIDIA GeForce 1080Intel Media SDK 2016 R2 — что нового?
2016-06-15 в 13:52, admin, рубрики: Intel Media SDK, Блог компании Intel, обработка изображений, Программирование, метки: intel media sdkУвидела свет новая версия комплекса средств для разработки ПО кодирования и воспроизведения медиа контента Intel Media SDK 2016. Обновление содержит ряд существенных изменений:
- Добавлена поддержка процессоров Intel Core седьмого поколения (Kabylake);
- Улучшена работа Media RAW Accelerator для обеспечения гибкости и производительности;
- Добавлены новые возможности при кодировании AVC/H.264 для видеоконференций и облачных игровых сервисов;
- Добавлены новые VPP-фильтры и улучшены существующие;
- Внедрена новая версия API c улучшениями в управлении памятью и функционалом запроса платформы;
- Внедрена поддержка Windows Redstone Preview.
Под катом — краткий обзор текущей функциональности Intel Media SDK 2016.
Читать полностью »
Инструменты Intel для создателей видео кодеков
2016-06-14 в 12:50, admin, рубрики: intel, validations, video compression, video encoding, Блог компании Intel, обработка изображений, ПрограммированиеНа Хабре в блоге Intel регулярно появляются статьи с описанием технологий и инструментов, созданных в стенах Intel. Многие из них так или иначе связаны с обработкой и анализом видео и изображений. Это такие продукты как, например, Intel Media Server Studio или Intel RealSense. Однако, существует набор инструментов, не так широко представленных в медиа пространстве, но не менее значимых для такой категории разработчиков, как создатели медиа кодеков. Именно этот пробел мы и попытаемся восполнить в данном топике. Речь пойдет про Intel Video Pro Analyzer (Intel VPA) и Intel Stress Bitstreams and Encoder (Intel SBE), а также про те возможности, что скрываются за этими названиями.
Для начала определимся с предметом, сущностью, с которой работают вышеназванные инструменты. Это битовые стримы. Битовый стрим – это то, что получается после того, как отработал видео энкодер. Битовый стрим – это поток битов, отвечающий спецификации того или иного кодека. Если мы заглянем в спецификацию большинства кодеков, то увидим, что этот битстрим представляет из себя ничто иное как набор синтаксических элементов данного кодека различной длины. Это, к примеру, ширина и высота картинки, профиль кодирования, коэффициенты трансформации, различные битовые флаги и т.д. Для стандарта HEVC это сотни синтаксических элементов. После кодирования эти битовые стримы доходят до пользователей, помещенные в различные медиа контейнеры – avi, mp4, mpeg ts и т.д. Но разработчики кодеков в основном работают именно с битовыми стримами. Разработчики ПО, дизайнеры, инженеры – электронщики, тестеры имеют свои инструменты для работы. Почему же разработчикам кодеков их не иметь?
Читать полностью »
Эволюция нейросетей для распознавания изображений в Google: Inception-ResNet
2016-06-14 в 7:17, admin, рубрики: cnn, deep learning, Google, image classification, microsoft, машинное обучение, обработка изображенийБуду потихоньку дорассказывать про Inception.
Предыдущая часть здесь — https://habrahabr.ru/post/302242/.
Мы остановились на том, Inception-v3 не выиграл Imagenet Recognition Challange в 2015-м, потому что появились ResNets (Residual Networks).
Что такое вообще ResNets?
Повышение производительности мультимедиа приложений с помощью аппаратного ускорения
2016-06-03 в 6:21, admin, рубрики: cloud computing, data center, graphics, Intel Media Server Studio, Media Processing, Media SDK for Windows, Блог компании Intel, высокая производительность, обработка изображений, Программирование
Архитектура процессоров Intel становится все более ориентированной на ГП, что открывает удивительные возможности для резкого повышения производительности просто за счет разгрузки обработки мультимедиа с ЦП на ГП. Существует немало инструментов, доступных разработчикам для повышения производительности мультимедиа приложений. В числе этих инструментов есть бесплатные и простые в использовании.
В этой публикации вы найдете:
- Обзор вычислительных архитектур и текущие возможности ГП Intel
- Реализацию аппаратного ускорения с помощью FFmpeg
- Реализацию аппаратного ускорения с помощью Intel Media SDK или аналогичного компонента Intel Media Server Studio (в зависимости от целевой платформы)
Эволюция нейросетей для распознавания изображений в Google: Inception-v3
2016-05-31 в 6:03, admin, рубрики: cnn, deep learning, Google, image classification, машинное обучение, обработка изображенийПродолжаю рассказывать про жизнь Inception architecture — архитеткуры Гугла для convnets.
(первая часть — вот тут)
Итак, проходит год, мужики публикуют успехи развития со времени GoogLeNet.
Вот страшная картинка как выглядит финальная сеть:
Что же за ужас там происходит?
Рисуйте, рисуйте, рисуйте: скоро выйдет Inkscape 0.92
2016-05-30 в 12:23, admin, рубрики: corel draw, illustrator, inkscape, open source, обработка изображенийСтатья про предыдущую версию Inkscape была очень тепло принята, что в связи с ближайшим выходом новой версии Inkscape 0.92 сподвигло меня описать ключевые особенности грядущего релиза. Сам релиз состоится в ближайшее время — во всяком случае пререлиз под *.nix уже тут.
Немного истории: пользователь ДевианАрт flutterguy317 форкнул Inkscape и пытался построить свой редактор Ponyscape с дружбой и магией до 4 февраля 2013 г., после чего проект был заморожен навсегда. И вот теперь, в версии Inkscape 0.92, появилась импортированная из Ponyscape иерархия документа. В связи с этим в иллюстрировании статьи будет немного арта из сообщества Ponyscape Vectors а так же много дружбы и магии.
Иллюстрация основана на работах flutterguy317 «Ponyscape» и Ambassad0r «No Time To Explain»
Читать полностью »
Structure from motion
2016-05-30 в 4:44, admin, рубрики: computer vision, essential matrix, fundamental matrix, Structure from motion, Алгоритмы, математика, обработка изображений
Если посмотреть на последовательность кадров, в которых движется камера, то мозг легко воспринимает геометрическую структуру содержимого. Однако, в компьютерном зрении это не тривиальная проблема. В этой статье я постараюсь описать возможное решение этой задачи.
Читать полностью »
База фотографий Google Photos выросла до 13,7 петабайт
2016-05-28 в 10:08, admin, рубрики: Google, Google Photos, дата-майнинг, ИИ, искусственный интеллект, обработка изображений, СофтЗа год люди сделали 24 миллиарда селфи
Композитные изображения, которые соответствует оптимальным стимулам для нейрона-классификатора кошки и человека в нейросети Google, во время первого эксперимента 2012 года
Человечество продолжает усиленно фотографироваться, снабжая Google обильным потоком информации для обучения систем искусственного интеллекта. Нейросеть Google уже умеет определять страну по фотографии, распознавать объекты, распределять фотографии по тематическим группам, автоматически генерировать видеоролики и коллажи и многое другое.
Сами пользователи получают бесплатный хостинг неограниченного размера, что очень удобно: можно освободить место и никогда не волноваться о потере фотографий.
Читать полностью »
Pillow-SIMD
2016-05-24 в 10:00, admin, рубрики: AVX2, gaussian blur, image processing, image resize, imagemagick, pillow, pillow-simd, python, simd, SSE4, высокая производительность, обработка изображенийУскорение операций в 2.5 раза по сравнению с Pillow и в 10 по сравнению с ImageMagick
Pillow-SIMD — это «форк-последователь» библиотеки работы с изображениями Pillow (которая сама является форком библиотеки PIL, ныне покойной). «Последователь» означает, что проект не становится самостоятельным, а будет обновляться вместе с Pillow и иметь ту же нумерацию версий, только с суффиксом. Я надеюсь более-менее оперативно выпускать версии Pillow-SIMD сразу после выхода версий Pillow.
Почему SIMD
Есть несколько способов улучшения производительности обработки изображений (да и всех остальных вещей, наверное, тоже).
- Можно использовать более хорошие алгоритмы, которые дают такой же результат.
- Можно сделать более быструю реализацию существующего алгоритма.
- Можно подключить больше вычислительных ресурсов для решения той же задачи: дополнительные ядра CPU, GPU.