Мы возвращаемся к рассказу об open source библиотеке компьютерного зрения OpenCV. Проект живет и развивается, движимый командой разработчиков, работающих в компании Intel, а также неугасающей поддержкой community. В конце 2018 года увидел свет первый стабильный релиз из ветки 4.х, а буквально месяц назад вышло новое обновление — версия 4.1. Мы попросили авторов библиотеки перечислить кратко, что нового привнесли эти две версии в функционал OpenCV.
Читать полностью »
Рубрика «обработка изображений» - 30
OpenCV 4.0 и 4.1 — что нового?
2019-05-24 в 6:11, admin, рубрики: open source, opencv, Блог компании Intel, обработка изображенийПоиск похожих изображений, разбор одного алгоритма
2019-05-20 в 8:39, admin, рубрики: Алгоритмы, Блог компании FunCorp, обработка изображений, сравнение изображенийПришлось мне недавно решать задачку по оптимизации поиска дубликатов изображений.
Существующее решение работает на довольно известной библиотеке, написанной на Python, — Image Match, основанной на работе «AN IMAGE SIGNATURE FOR ANY KIND OF IMAGE» за авторством H. Chi Wong, Marshall Bern и David Goldberg.
По ряду причин было принято решение переписать всё на Kotlin, заодно отказавшись от хранения и поиска в ElasticSearch, который требует заметно больше ресурсов, как железных, так и человеческих на поддержку и администрирование, в пользу поиска в локальном in-memory кэше.
Для понимания того, как оно работает, пришлось с головой погружаться в «эталонный» код на Python, так как оригинальная работа порой не совсем очевидна, а в паре мест заставляет вспомнить мем «как нарисовать сову». Собственно, результатами этого изучения я и хочу поделиться, заодно рассказав про некоторые оптимизации, как по объёму данных, так и по скорости поиска. Может, кому пригодится.
Читать полностью »
Как мы боремся с копированием контента, или первая adversarial attack в проде
2019-05-16 в 12:59, admin, рубрики: adversarial attacks, computer vision, machine learning, object detection, Алгоритмы, машинное обучение, обработка изображений, ПрограммированиеПривет.
Вы знали, что платформы для размещения объявлений часто копируют контент у конкурентов, чтобы увеличить количество объявлений у себя? Они делают это так: обзванивают продавцов и предлагают им разместиться на своей платформе. А иногда и вовсе копируют объявления без разрешения пользователей. Авито — популярная площадка, и мы часто сталкиваемся с такой недобросовестной конкуренцией. О том, как мы боремся с этим явлением, читайте под катом.
Как и зачем мы делали распознавание достопримечательностей в Облаке Mail.ru
2019-05-14 в 10:22, admin, рубрики: computer vision, deep learning, landmark recognition, machine learning, Алгоритмы, Блог компании Mail.Ru Group, искусственный интеллект, машинное обучение, обработка изображенийС появлением качественных камер в мобильных телефонах мы все больше и чаще фотографируем, снимаем видео ярких и важных моментов нашей жизни. У многих из нас фотоархивы насчитывают десятки лет и тысячи фотографий, ориентироваться в которых становится все труднее. Вспомните, сколько времени зачастую занимал поиск нужной фотографии несколько лет назад.
Одной из целей Облака Mail.ru является обеспечение наиболее удобного доступа и поиска по своему фото и видеоархиву. Для этого мы — команда машинного зрения Mail.ru — создали и внедрили системы «умной» обработки фотографий: поиск по объектам, сценам, лицам и др. Еще одной такой яркой технологией является распознавание достопримечательностей. И сегодня я расскажу про то, как с помощью Deep Learning мы решили эту задачу.
Читать полностью »
Почему векторная графика 2D намного сложнее, чем 3D
2019-05-12 в 9:48, admin, рубрики: Oculus Medium, postscript, sdf, signed distance fields, tex, кривые безье, неявные кривые, неявные поверхности, обработка изображений, поля расстояний со знаком, Работа с векторной графикой, типографикаВ последнее время появилось много фантастических исследований по 2D-рендерингу. Пётр Кобаличек и Фабиан Айзерман работают над Blend2D: это один из самых быстрых и точных CPU-растеризаторов на рынке, с инновационной техникой JIT. Патрик Уолтон из Mozilla изучил не один, а три разных подхода в Pathfinder, кульминацией чего стал Pathfinder v3. Раф Левиен построил вычислительный конвейер по технологии, описанной в научной статье Гана с коллегами о векторных текстурах (2014). Похоже, некое дальнейшее развитие получают поля расстояний со знаком: здесь независимо работают Адам Симмонс и Сара Фрискен.
Кто-то может спросить: а почему вокруг 2D так много шума? Это ведь не может быть намного сложнее, чем 3D, верно? 3D — совершенно другое измерение! Тут у нас на носу трассировка лучей в режиме реального времени с точным освещением, а вы не можете осилить невзрачную 2D-графику со сплошными цветами?
Для тех, кто не очень хорошо разбирается в деталях современного GPU, это вправду очень удивительно! Но в 2D-графике множество уникальных ограничений, которые чрезвычайно её усложняют. К тому же она не поддаётся параллелизации. Давайте прогуляемся по исторической дорожке, которая нас сюда привела.
Читать полностью »
В этом году все уличные видеокамеры Москвы подключат к системе распознавания лиц
2019-05-12 в 5:20, admin, рубрики: будущее здесь, видеонаблюдение, Законодательство в IT, информационная безопасность, Киберпанк, обработка изображений, продажа персональных данных, распознавание лиц
Система распознавания лиц компании NTechLab. Фото: NtechLab
Многие слышали про успехи системы видеонаблюдения в Китае, которая объединяет более 170 млн видеокамер, подключённых к единой системе распознавания лиц. К 2020 году количество камер увеличится до 400 млн, плюс видеонаблюдение заработает через другие устройства, в том числе через «умные» очки полицейских. Благодаря тотальной слежке власти надеются, что смогут быстро определять местоположение любого преступника, который находится в федеральном розыске. Разумеется, доступ к такой системе даёт массу иных преимуществ.
Аналогичная система развернётся в Москве. В этом году власти собираются подключить к системе распознавания лиц все уличные видеокамеры, сообщают государственные СМИ. Таким образом, по темпам интеграции Москва не отстаёт от Китая.
Читать полностью »
PIL на Python от простого к сложному
2019-05-08 в 20:55, admin, рубрики: PIL, python, изображения, обработка изображенийЧтобы дойти до сложных алгоритмов обработки, стоит проанализировать стандартные схемы, с чего я и предлагаю начать.
Для примеров обработки будет использоваться изображение с различным наборов цветов:
Для старта нам потребуется два модуля библиотеки:
from PIL import Image, ImageDraw
Настроим инструменты для комфортной дальнейшей работы:
image = Image.open('test.jpg') # Открываем изображение
draw = ImageDraw.Draw(image) # Создаем инструмент для рисования
width = image.size[0] # Определяем ширину
height = image.size[1] # Определяем высоту
pix = image.load() # Выгружаем значения пикселей
Приступим
PIL работает с изображениями в формате RGB.
Читать полностью »
Deep Learning в вычислении оптического потока
2019-05-06 в 11:00, admin, рубрики: deep learning, flownet, machine learning, optical flow, pwc-net, spynet, Блог компании Open Data Science, искусственный интеллект, машинное обучение, обработка изображений, Работа с видеоС появлением множества различных архитектур нейронных сетей, многие классические Computer Vision методы ушли в прошлое. Все реже люди используют SIFT и HOG для object detection, а MBH для action recognition, а если и используют, то скорее как handcrafted-признаки для соответствующих сеток. Сегодня мы рассмотрим одну из классических CV-задач, в которой первенство по-прежнему остается за классическими методами, а DL-архитектуры томно дышат им в затылок.
Под белым флагом пост, или Как я спас ваш видеокурс от появления на трекере
2019-05-02 в 16:08, admin, рубрики: python, водяные знаки, интеллектуальная собственность, инфопротектор, информационная безопасность, копирайт, обработка изображений, Работа с видео
Привет! Хм, у меня такое чувство, будто мы уже встречались… Ах, да. Вот же тот пост, где мы лампово обсудили, приемлемо ли мониторить окружение, ограничивать пользователя в количестве устройств для просмотра, предоставлять исполняемые файлы вместо оплаченных видео и по-другому всячески некультурно себя вести при организации «защиты» видеокурсов от пиратства.
И все бы ничего, да вот только нельзя критиковать, не предлагая взамен своего решения. «Ты можешь лучше, что ли?!», — раздавались возгласы из комментариев. «Лучше бы поддержал соотечественника, помог сделать их продукт лучше!», — вкратце пересказываю я некоторые общие мысли. Справедливо. Так вот, я и правда могу лучше. По крайней мере, мое предложение не будет требовать от конечного пользователя запуска кривого софта вместо ожидаемых видеофайлов.
Читать полностью »
ResNet50. Своя реализация
2019-05-02 в 14:55, admin, рубрики: resnet, машинное обучение, нейронные сети, обработка изображенийВсем привет. Библиотека нейросети описана в моей прошлой статье. Здесь решил показать как можно использовать обученную сеть из TF (Tensorflow) в своем решении, и стоит ли.
Под катом сравнение с оригинальной реализацией TF, демо приложение для распознавания картинок, ну и… выводы. Кому интересно, прошу.
Читать полностью »