Рубрика «обработка изображений» - 26

Американские политики призывают удалить «опасное» российское приложение FaceApp

2019-07-18 в 14:10, admin, рубрики: Faceapp, Wireless Lab, нейросети, обработка изображений, разработка мобильных приложений, старение

Сегодня американский сенатор Чак Шумер попросил ФБР и Федеральную торговую комиссию проверить российское приложение FaceApp на предмет возможных угроз безопасности граждан США.

Почему? «Потому что его используют миллионы американцев. А оно принадлежит российской компании. И пользователи обязаны предоставить полный, безотзывный доступ к своим личным фотографиям и данным», — написал Шумер в твиттере.

BIG: Share if you used #FaceApp:

The @FBI & @FTC must look into the national security & privacy risks now

Because millions of Americans have used it

It’s owned by a Russia-based company

And users are required to provide full, irrevocable access to their personal photos & data pic.twitter.com/cejLLwBQcr

— Chuck Schumer (@SenSchumer) July 18, 2019

Безусловно, всё это выглядит очень подозрительно. Причём подозрения сенатора разделает Национальный комитет Демократической партии США.
Читать полностью »

Издевательски точный, быстрый и легковесный поиск баркодов через семантическую сегментацию

2019-07-17 в 12:09, admin, рубрики: ABBYY, barcode, neural networks, object detection, Блог компании ABBYY, искусственный интеллект, машинное обучение, нейросети, обработка изображений

Издевательски точный, быстрый и легковесный поиск баркодов через семантическую сегментацию - 1 Поиск объектов на изображениях? Имея обучающую выборку и минимальный набор знаний о нейросетях, любой студент сегодня может получить решение определенной точности. Однако большинство нейросетей, использующихся для решения этой задачи, достаточно глубокие, а соответственно, требуют много данных для обучения, сравнительно медленно работают на этапе inference (особенно если на устройстве отсутствует GPU), много весят и достаточно энергозатратны. Все вышеперечисленное может быть весьма критично в определенных случаях, в первую очередь, для мобильных приложений.

Баркоды — объекты с достаточно простой структурой. В ходе исследований у нас получилось с помощью сравнительно оригинального подхода искать такие простые объекты весьма точно (мы побили state-of-the-art) и достаточно быстро (real-time на среднем CPU). Плюс наш детектор очень легкий, имеющий всего 30к весов. О результатах нашего исследования мы и расскажем в этой статье.Читать полностью »

Как мы обучили нейронную сеть классифицировать шурупы

2019-07-16 в 12:00, admin, рубрики: computer vision, data mining, machine learning, u-net, usedataconf, Алгоритмы, Блог компании Конференции Олега Бунина (Онтико), классификация, машинное обучение, обработка изображений, распознавание образов

Нейронная сеть может опознать котика на фотографии, найти диван, улучшить видеозапись, нарисовать картинку из щенят или простого наброска. К этому мы уже привыкли. Новости о нейросетях появляются почти каждый день и стали обыденными. Компании Grid Dynamics поставили задачу не обыденную, а сложную — научить нейросеть находить специфический шуруп или болт в огромном каталоге интернет-магазина по одной фотографии. Задачка сложнее, чем найти котика.

Как мы обучили нейронную сеть классифицировать шурупы - 1

Проблема интернет-магазина шурупов — в ассортименте. Тысячи или десятки тысяч моделей. У каждого шурупа свое описание и характеристики, поэтому на фильтры нет надежды. Что делать? Искать вручную или искать в гипермаркете на полках? В обоих случаях это потеря времени. В итоге клиент устанет и пойдет забивать гвоздь. Чтобы помочь ему, воспользуемся нейросетью. Если она может находить котиков или диваны, то пусть занимается чем-то полезным — подбирает шурупы и болты. Как научить нейросеть подбирать для пользователя шурупы быстро и точно, расскажем в расшифровке доклада Марии Мацкевичус, которая в компании Grid Dynamics занимается анализом данных и машинным обучением.
Читать полностью »

AI-Based Photo Restoration

2019-07-12 в 8:11, admin, рубрики: AI, inpainting, photo restoration, unet, Алгоритмы, Блог компании Mail.Ru Group, машинное обучение, обработка изображений

AI-Based Photo Restoration - 1

Hi everybody! I’m a research engineer at the Mail.ru Group computer vision team. In this article, I’m going to tell a story of how we’ve created AI-based restoration project for old military photos. What is «photo restoration»? It consists of three steps:

we find all the image defects: fractures, scuffs, holes;
we inpaint the discovered defects, based on the pixel values around them;
we colorize the image.

Further, I’ll describe every step of photo restoration and tell you how we got our data, what nets we trained, what we accomplished, and what mistakes we made.
Читать полностью »

Как распознать текст с фото: новые возможности фреймворка Vision

2019-07-11 в 15:06, admin, рубрики: Dodo Pizza Engineering, dodopizzaio, framework, iOS, ios development, ios programming, Vision, Блог компании Dodo Pizza Engineering, обработка изображений, Программирование, разработка мобильных приложений, разработка под iOS, распознавание изображений, распознавание текста

Теперь фреймворк Vision умеет распознавать текст по-настоящему, а не как раньше. С нетерпением ждём, когда сможем применить это в Dodo IS. А пока перевод статьи о распознавании карточек из настольной игры Magic The Gathering и извлечении из них текстовой информации.

Как распознать текст с фото: новые возможности фреймворка Vision - 1
Читать полностью »

GitHub удаляет открытые версии DeepNude

2019-07-10 в 17:59, admin, рубрики: AI, Deepfake, deepnude, github, искусственный интеллект, машинное обучение, обработка изображений, обработка фото, Софт

GitHub удаляет открытые версии DeepNude - 1

Сервис GitHub начал удалять страницы, содержащие код программы DeepNude — приложения на основе искусственного интеллекта, которое «раздевает» женщин на фотографиях.

Фрагменты кода были сгенерированы из копии приложения DeepNude, которое вышло в продажу в прошлом месяце. Материал был помещен в удаленный на текущий момент репозиторий GitHub. Как пишет издание The Verge со ссылкой на Motherboard, представители GitHub пояснили, что приложение нарушает правила в отношении «сексуально непристойного контента». С GitHub были удалены несколько репозиториев, включая тот, что был официально создан разработчиком DeepNude.
Читать полностью »

Вижу, значит существую: обзор Deep Learning в Computer Vision (часть 2)

2019-07-10 в 12:54, admin, рубрики: AI, computer vision, deep learning, deep learning school, dlschool, mipt, neural nets, neuruslab, psami mipt, Блог компании Московский физико-технический институт (МФТИ), ИИ, искусственный интеллект, Компьютерное зрение, машинное обучение, МФТИ, нейронные сети, неурус, обработка изображений, Программирование, фпми мфти

Продолжаем постигать современную магию (компьютерное зрение). Часть 2 не значит, что нужно сначала читать часть 1. Часть 2 значит, что теперь всё серьёзно — мы хотим понять всю мощь нейросетей в зрении. Детектирование, трекинг, сегментация, оценка позы, распознавание действий… Самые модные и крутые архитектуры, сотни слоёв и десятки гениальных идей уже ждут вас под катом!

Вижу, значит существую: обзор Deep Learning в Computer Vision (часть 2) - 1
Читать полностью »

Агро-робот с ИИ научился аккуратно собирать с грядки только созревший салат

2019-07-10 в 8:20, admin, рубрики: Vegebot, изображение, ИИ, искусственный интеллект, кочан, машинное обучение, Научно-популярное, обработка изображений, робототехника, салат, уборка, урожай

Агро-робот с ИИ научился аккуратно собирать с грядки только созревший салат - 1
Многие виды растений и сельхозкультур до сих пор собираются только вручную.

Инженеры из Кембриджского университета (Великобритания) создали рабочий прототип роботизированного сборщика урожая, способного самостоятельно распознавать готовые к срезанию неповрежденные кочаны салата, а также аккуратно их обрабатывать и собирать.
Читать полностью »

Преобразуем изображение в звук — что можно услышать?

2019-07-05 в 19:34, admin, рубрики: numpy, python, звук, Научно-популярное, обработка изображений, Программирование

В недавней публикации здесь на сайте описывалось устройство, позволяющее незрячим людям «видеть» изображение, преобразуя его с помощью звуковых волн. С технической точки зрения, в той статье не было никаких деталей вообще (~~а вдруг украдут идею за миллион~~), но сама концепция показалась интересной. Имея некоторый опыт обработки сигналов, я решил поэкспериментировать самостоятельно.

Преобразуем изображение в звук — что можно услышать? - 1

Что из этого получилось, подробности и примеры файлов под катом.
Читать полностью »

Распознавание источников освещения на картах окружения

2019-07-03 в 7:17, admin, рубрики: environment map, python, алгоритм Брезенхэма, Алгоритмы, обработка изображений, преобразование координат, Работа с 3D-графикой, ряд ван дер корпута

В этой статье представлена реализация на Python алгоритма распознавания источников освещения на картах окружения (LDR или HDR) при помощи равнопромежуточной проекции (equirectangular projection). Однако после внесения незначительных изменений её также можно использовать с простыми фоновыми изображениями или кубическими картами. Примеры возможного применения алгоритма: программы трассировки лучей, в которых требуется распознавать первичные источники освещения для испускания из них лучей; в растеризованных рендерерах он может применяться для отбрасывания теней, использующих карту окружения; кроме того, алгоритм также можно применять в программах устранения засветов, например в AR.

Алгоритм состоит из следующих этапов:

Снижение разрешения исходного изображения, например, до 1024.
Преобразование изображения в яркость (luminance), при необходимости с размытием изображения.
Применение метода квази-Монте-Карло.
Преобразование из сферических координат в равнопромежуточные.
Фильтрация сэмплов на основании яркости соседа.
Сортировка сэмплов на основании их яркости.
Фильтрация сэмплов на основании евклидовой метрики.
Слияние сэмплов при помощи алгоритма Брезенхэма.
Вычисление позиции кластера освещения на основании его яркости.

Существует множество алгоритмов снижения разрешения изображений. Билинейная фильтрация — самый быстрый или простой в реализации, к тому же он лучше всего подходит в большинстве случаев. Для преобразования яркости и в LDR-, и HDR-изображениях можно использовать стандартную формулу:

  lum = img[:, :, 0] * 0.2126 + img[:, :, 1] * 0.7152 + img[:, :, 2] * 0.0722

Дополнительно можно применить к изображению яркости небольшое размытие, например, в 1-2 пикселя для изображения разрешением 1024, для устранения всех высокочастотных деталей (в частности, вызванных снижением разрешения).
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «обработка изображений» - 26

Американские политики призывают удалить «опасное» российское приложение FaceApp

Издевательски точный, быстрый и легковесный поиск баркодов через семантическую сегментацию

Как мы обучили нейронную сеть классифицировать шурупы

AI-Based Photo Restoration

Как распознать текст с фото: новые возможности фреймворка Vision

GitHub удаляет открытые версии DeepNude

Вижу, значит существую: обзор Deep Learning в Computer Vision (часть 2)

Агро-робот с ИИ научился аккуратно собирать с грядки только созревший салат

Преобразуем изображение в звук — что можно услышать?

Распознавание источников освещения на картах окружения

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «обработка изображений» - 26

Новости

Актуальные темы

Архив