В прошлой статье мы рассмотрели, как работает аппаратное ускорение кодирования и декодирования видео Quick Sync Video (QSV) в процессорах 6-го поколения Skylake. Маленький участок SoC специально выделили для размещения специализированных интегральных схем, которые занимаются только обработкой видео. Воспроизведение видео с аппаратной поддержкой стало гораздо меньше отнимать ресурсов у других задач в ОС, меньше нагревать CPU и потреблять меньше электроэнергии. Благодаря QSV, например, ноутбук MacBook Air воспроизводит более 10 часов видео на одном заряде аккумулятора.
Читать полностью »
Рубрика «обработка изображений» - 64
Просто, мощно, навсегда. Элекард CodecWorks 990 — программный лайв транскодер для AVC и HEVC
2016-10-25 в 11:28, admin, рубрики: avc, CodecWorks 990, ffmpeg, h264, H265, HEVC, Intel Media SDK 2.0, Intel Media Server Studio, libavcodec, QSV, Quick Sync Video, Skylake, Алгоритмы, Блог компании Intel, высокая производительность, кодеки, обработка изображений, транскодер, цифровое ТВ, ЭлекардGoogle Cloud Vision API. Будущее Computer Vision as a service настало?
2016-10-19 в 21:23, admin, рубрики: Clarifai, Cloud sight, cloud vision api, computer vision, dlib, face detection, Google API, google cloud, label detection, Landmark Detection, machine learning, Microsoft Azure, Microsoft recognition api, ocr, visual search, Алгоритмы, Анализ и проектирование систем, машинное обучение, обработка изображений, метки: cloud vision api, Google cloudГод назад Google сваял платформу Cloud Vision API. Идея платформы — предоставить технологии Computer Vision, в которых Google является безусловным лидером, как сервис. Пару лет назад под каждую задачу существовала своя технология. Нельзя было взять что-то общее и добиться, чтобы алгоритм решал всё. Но Google замахнулся. Вот, прошёл уже год. А технология всё так же не на слуху. На хабре одна статья. Да и та ещё не про Cloud Vision api, а про Face api, которое было предшественником. Англоязычный интернет тоже не пестрит статьями. Разве что от самого Google. Это провал?
Мне было интересно посмотреть что это такое ещё весной. Но сил полноценно посидеть не хватало. Изредка что-то отдельное тестировал. Периодически приходили заказчики и спрашивали, почему нельзя применить Cloud Api. Приходилось отвечать. Или наоборот, отсылать с порога в этом направлении. И внезапно понял, что материала на статью уже достаточно. Поехали.
Читать полностью »
Почему супер-мега-про машинного обучения за 15 минут всё же не стать
2016-10-18 в 16:08, admin, рубрики: detectnet, Nvidia, opencv, rectangle detector, Алгоритмы, Блог компании Recognitor, машинное обучение, обработка изображенийВчера я опубликовал статью про машинное обучение и NVIDIA DIGITS. Как и обещал, сегодняшняя статья — почему всё не так уж и хорошо + пример выделения объектов в кадре на DIGITS.
NVIDIA подняла волну пиара по поводу разработанной и имплиментированной в DIGITS сетки DetectNet. Сетка позиционируется как решение для поиска одинаковых/похожих объектов на изображении.
Устранение перспективных искажений и разгибание кривых строк на фотографиях книжных разворотов
2016-10-18 в 8:54, admin, рубрики: ocr, Алгоритмы, Блог компании ABBYY, коррекция фотографий, обработка изображений, распознавание текстаВ прошлый раз в статье «Поиск линии корешка на фотографиях книжных разворотов» мы обещали рассказать о том, что случается с фотографией книжного разворота после этого, а именно — про устранение перспективных искажений и разгибание кривых строк текста. Без этого получить качественные результаты OCR практически невозможно.
Итак, считаем, что мы уже нашли на фотографии линию корешка, воспользуемся этим знанием, чтобы определить ваниш-точки для страниц разворота (vanishing point). Ваниш-точки – это точки схождения параллельных прямых в перспективной проекции книги на плоскость изображения. Они обе должны располагаться на продолжении этой линии, но для каждой из страниц положение точки может быть свое. Схематически это показано на следующей иллюстрации (на самом деле, это лог для отладки). Линия корешка выделена красным, линии, пересекающиеся в ваниш-точках, – зеленым.
Новые возможности Intel RealSense SDK 2016 R2
2016-10-18 в 7:10, admin, рубрики: F200 Camera, Intel RealSense SDK, Intel RealSense Technology, R200 Camera, SR300 Camera, Блог компании Intel, обработка изображений, Программирование, Разработка для интернета вещейВторой выпуск Intel RealSense SDK (для Windows) в 2016 году (2016R2) — версия 10.0.26.0396. В новой версии значительно улучшена работа модулей сегментации фона (BGS), отслеживания рук в режиме указателя и модуля 3D Scan для камеры SR300. Первые два модуля доступны уже в виде «золотой» версии, модуль 3DScan для SR300 перешел на уровень бета-версии. Для камеры R200 некоторые компоненты модуля Enhanced Photography (EP) перешли на «золотой» уровень, в том числе EP Meaurement. При этом модули EP Realtime Depth Enhancement и EP Tracking пока остались на уровне предварительного ознакомления. Остальные функции R200 не изменились.
Как стать супер-мега-про машинного обучения за 15 минут
2016-10-17 в 20:47, admin, рубрики: caffe, DIGITS, machine learning, Nvidia, машинное обучение, обработка изображений, метки: DIGITS
Недавно на Хабре проскакивал пост vfdev-5 о DIGITS. Давайте поподробнее разберёмся что это такое и с чём его едят. Если в двух словах. Это среда, которая позволяет решить 30-50% задачек машинного обучения на коленке в течении 5 минут. Без умения программировать. Ну, при наличии базы, конечно. И более-менее адекватной карточки от NVIDIA.
Читать полностью »
Колыбель для AI
2016-10-16 в 21:28, admin, рубрики: машинное зрение, машинное обучение, обработка изображений, разметка фотографий
Есть одна тема в современном Computer Vision, которая часто остаётся за кадром. В ней нет сложной математики и глубокой логики. Но то что её никак не освещают — вгоняет в ступор многих новичков. А тема не проста: имеет множество граблей, про которые не узнаешь, пока не наступишь.
Тема — называется так: подготовка базы изображений для дальнейшего обучения.
В статье:
- Как можно отличить хорошую базу
- Примеры хороших баз
- Примеры программ, которыми удобно размечать базы
Обзор топологий глубоких сверточных нейронных сетей
2016-10-12 в 15:59, admin, рубрики: alexnet, artificial intelligence, convolutional neural network, ImageNet, inception, lenet, math, neural networks, nin, resnet, skynet, vgg, Алгоритмы, Блог компании Mail.Ru Group, математика, машинное обучение, обработка изображенийЭто будет длиннопост. Я давно хотел написать этот обзор, но sim0nsays меня опередил, и я решил выждать момент, например как появятся результаты ImageNet’а. Вот момент настал, но имаджнет не преподнес никаких сюрпризов, кроме того, что на первом месте по классификации находятся китайские эфэсбэшники. Их модель в лучших традициях кэгла является ансамблем нескольких моделей (Inception, ResNet, Inception ResNet) и обгоняет победителей прошлого всего на полпроцента (кстати, публикации еще нет, и есть мизерный шанс, что там реально что-то новое). Кстати, как видите из результатов имаджнета, что-то пошло не так с добавлением слоев, о чем свидетельствует рост в ширину архитектуры итоговой модели. Может, из нейросетей уже выжали все что можно? Или NVidia слишком задрала цены на GPU и тем самым тормозит развитие ИИ? Зима близко? В общем, на эти вопросы я тут не отвечу. Зато под катом вас ждет много картинок, слоев и танцев с бубном. Подразумевается, что вы уже знакомы с алгоритмом обратного распространения ошибки и понимаете, как работают основные строительные блоки сверточных нейронных сетей: свертки и пулинг.
EBU R128-BS.1770-3: Пакетная нормализация громкости аудио-видео файлов
2016-10-05 в 8:23, admin, рубрики: BS.1770-3, EBU R128, ffmpeg, open source, r128gain, sox, Занимательные задачки, обработка изображений, метки: BS.1770-3, EBU R128, EBU128, r128gainВсем привет!
Решил поделиться опытом автоматизации контроля громкости вещания своего СМИ. Думаю, у всех профильных технарей давно болит голова, точно продолжает болеть. Введенная Минкомсвязи рекомендация в области нормирования громкости звуковых сигналов вызвала волны возмущения.
Не было предоставлено ни средств контроля, ни средств производства. Крутитесь как хотите.
Впрочем, уже давно, задолго до того знакового события существуют различные плагины к монтажным программам.
Но как быть если уже накоплена огроменная медиабаза?
Читать полностью »
Ночь ученых 2016: как популяризируют науку на Западе
2016-10-03 в 20:44, admin, рубрики: Компьютерное зрение, моделирование социальных процессов, наука, Научно-популярное, обработка изображений, популяризация науки, робототехника, строительные материалыДобрый день читатели !
В пятницу 30 сентября по всей Европе проходила ежегодная акция Ночь ученых. В рамках этой акции различные университеты и исследовательские организации открывают свои двери всем желающим познакомиться с научной сферой. Дополнительным плюсом можно считать, что все это совершенно бесплатно. Особенно приятно, что много детей участвует в таких экскурсиях. По популярности эту акцию можно сравнить с Ночью музеев. В этой статье я хотел бы рассказать о своих впечатлениях от посещения мероприятий в рамках этого события в городе Брно (Чехия). Кстати, прошу прощения за плохое качество некоторых фотографий — снимал на телефон. Кому интересно, прошу под кат.
Читать полностью »