Рубрика «обработка изображений» - 25

imageРешение задачи распознавания изображений (OCR) сопряжено с различными сложностями. То картинку не получается распознать из-за нестандартной цветовой схемы или из-за искажений. То заказчик хочет распознавать все изображения без каких-либо ограничений, а это далеко не всегда возможно. Проблемы разные, и решить их сходу не всегда удается. В этом посте мы дадим несколько полезных советов, исходя из опыта разруливания реальных ситуаций у заказчиков.Читать полностью »

ГИБДД, ЦОДД Москвы и РСА начали проверять наличие полиса ОСАГО с помощью дорожных камер - 1

Выявленных в автоматическом тестовом режиме путем анализа данных видеофиксации нарушителей пока не штрафуют. Автовладельцам, не оформившим ОСАГО, столичное ГИБДД отправляет письма с рекомендацией приобрести полис. По окончании тестирования водители получат штраф в размере 800 рублей. Первые письма направили уже 5,5 тысячи нарушителей, причем отсутствие у них полиса было выявлено еще 21 мая. Общее число выявленных нарушений за три месяца тестирования системы — более 700 тысяч будущих штрафов.
Читать полностью »

Выставка победителей конкурса «Снимай Науку» - 1

Весной этого года телеканал «Наука» совместно с русскоязычной Википедией провели конкурс научной фотографии «Снимай Науку», результаты которого были подведены в июле. В конкурсе приняло участие более 400 авторов, которые представили почти 2200 работ в 5 различных номинациях.
Читать полностью »

Строим систему распознавания лиц на основе Golang и OpenCV - 1

OpenCV — библиотека, разработанная для проектов по компьютерному зрению. Ей уже около 20 лет. Я использовал ее еще в колледже и до сих пор применяю для своих проектов на C++ и Python, поскольку она имеет неплохую поддержку этих языков.

Но когда я начал изучать и использовать Go, мне стало интересно, можно ли применить OpenCV для работы с этим языком. В то время уже существовали примеры и туториалы по интеграции, но мне показалось, что они слишком сложные. Чуть позже мне в руки попался враппер, созданный командой The Hybrid Group. В этой статье я покажу, как начать с GoCV, разработав простую систему распознавания лиц с каскадами Хаара (Haar Cascades).
Читать полностью »

Разработчики центра Samsung в Сколково научили нейросеть рендерить видео из любой точки - 1

Три исследователя Samsung AI Center в Сколково разработали нейросеть, способную воспроизводить фотореалистичные сцены из видео с нового угла зрения.
Система использует набор точек, которые представляют собой геометрический аналог сцены из видео. Сеть обрабатывает облако точек так, чтобы в итоге получилось изображение с другой точки обзора. Такой подход можно использовать для моделирования изображений из видео без построения сетки.

Как сообщил Дмитрий Ульянов, один из авторов разработки, в комментарии The Next Web, «идея состоит в том, чтобы научиться визуализировать сцену с любой точки зрения».
Читать полностью »

Алгоритм коллапса волновой функции (Wavefunction Collapse Algorithm) учит компьютер импровизировать. На входе он получает архетипичные данные и создаёт процедурно генерируемые данные, похожие на исходные.

Доступное объяснение алгоритма коллапса волновой функции - 1

(Источник)

Чаще всего он используется для создания изображений, но может также строить города, скейтпарки и писать ужасные стихи.

Доступное объяснение алгоритма коллапса волновой функции - 2

(Источник)

Коллапс волновой функции — это очень независимо мыслящий алгоритм, не требующий практически никакой помощи или инструкций извне. Вам нужен только пример стиля, которого нужно достичь, а всё остальное он сделает сам. Несмотря на свою самодостаточность, он на удивление прост. Он не использует никаких нейронных сетей, случайных лесов или чего-то другого, похожего на машинное обучение. Если разобраться с идеей, он станет для вас очень понятным и интуитивным.

Большинство реализаций и объяснений коллапса волновой функции — это полная, оптимизированная по скорости версия алгоритма. Разумеется, все они важны и необходимы, но в них сложно разобраться с нуля. В этом посте я буду объяснять всё понятным я простым языком, сосредоточившись на версии Wavefunction с ограничениями, которую я назвал Even Simpler Tiled Model. Кроме того, я выложил пример реализации ESTM на Github. Код в нём неэффективный и медленный, но очень хорошо читаемый и подробно прокомментирован. Как только вы разберётесь в технологии, лежащей в основе ESTM, то станете ближе к пониманию более сложных версий алгоритма. Если хотите понять алгоритм коллапса волновой функции, то эта статья будет хорошим началом.
Читать полностью »

Трагедия не приходит одна - 1

В 2016 году уязвимость ImageTragick в библиотеке ImageMagick наделала много шума. Как способ снижения риска предлагалось использовать GraphicsMagick — форк библиотеки ImageMagick, нацеленный на более стабильный и производительный API. Оригинальная уязвимость CVE-2016-3717, обнаруженная stewie, позволяла злоумышленнику прочитать произвольный файл на файловой системе при помощи специально созданного изображения. Сегодня я рассмотрю аналогичную уязвимость в GraphicsMagick, обнаруженную мной в ходе анализа исходного кода библиотеки.

Читать полностью »

Вместо тысячи слов...

Безумный конвертер GIF'ок в анимированные стикеры для Telegram - 1

xZibit тоже рад, ведь здесь GIF вставлены в стикеры, чтобы быть вставлеными в GIF для КДПВ!

А теперь о подробностях реализации.
Читать полностью »

Опыт моделеварения от команды Computer Vision Mail.ru - 1

Меня зовут Эдуард Тянтов, я руковожу командой Computer Vision в Mail.ru Group. За несколько лет существования наша команда решила десятки задач компьютерного зрения, и сегодня расскажу вам о том, какие методики мы используем для успешного создания моделей машинного обучения, которые работают на широком спектре задач. Поделюсь трюками, которые могут ускорить получение модели на всех этапах: постановка задачи, подготовка данных, обучение и развертывание в продакшен.
Читать полностью »

Сегодня американский сенатор Чак Шумер попросил ФБР и Федеральную торговую комиссию проверить российское приложение FaceApp на предмет возможных угроз безопасности граждан США.

Почему? «Потому что его используют миллионы американцев. А оно принадлежит российской компании. И пользователи обязаны предоставить полный, безотзывный доступ к своим личным фотографиям и данным», — написал Шумер в твиттере.

Безусловно, всё это выглядит очень подозрительно. Причём подозрения сенатора разделает Национальный комитет Демократической партии США.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js