Рубрика «обработка изображений» - 70

Рисуйте, рисуйте, рисуйте: скоро выйдет Inkscape 0.92

2016-05-30 в 12:23, admin, рубрики: corel draw, illustrator, inkscape, open source, обработка изображений

Статья про предыдущую версию Inkscape была очень тепло принята, что в связи с ближайшим выходом новой версии Inkscape 0.92 сподвигло меня описать ключевые особенности грядущего релиза. Сам релиз состоится в ближайшее время — во всяком случае пререлиз под *.nix уже тут.

Немного истории: пользователь ДевианАрт flutterguy317 форкнул Inkscape и пытался построить свой редактор Ponyscape с дружбой и магией до 4 февраля 2013 г., после чего проект был заморожен навсегда. И вот теперь, в версии Inkscape 0.92, появилась импортированная из Ponyscape иерархия документа. В связи с этим в иллюстрировании статьи будет немного арта из сообщества Ponyscape Vectors а так же много дружбы и магии.

Рисуйте, рисуйте, рисуйте: скоро выйдет Inkscape 0.92 - 1
Иллюстрация основана на работах flutterguy317 «Ponyscape» и Ambassad0r «No Time To Explain»
Читать полностью »

Structure from motion

2016-05-30 в 4:44, admin, рубрики: computer vision, essential matrix, fundamental matrix, Structure from motion, Алгоритмы, математика, обработка изображений

Structure from motion - 1
Если посмотреть на последовательность кадров, в которых движется камера, то мозг легко воспринимает геометрическую структуру содержимого. Однако, в компьютерном зрении это не тривиальная проблема. В этой статье я постараюсь описать возможное решение этой задачи.
Читать полностью »

База фотографий Google Photos выросла до 13,7 петабайт

2016-05-28 в 10:08, admin, рубрики: Google, Google Photos, дата-майнинг, ИИ, искусственный интеллект, обработка изображений, Софт

За год люди сделали 24 миллиарда селфи

База фотографий Google Photos выросла до 13,7 петабайт - 1
^{Композитные изображения, которые соответствует оптимальным стимулам для нейрона-классификатора кошки и человека в нейросети Google, во время первого эксперимента 2012 года}

Человечество продолжает усиленно фотографироваться, снабжая Google обильным потоком информации для обучения систем искусственного интеллекта. Нейросеть Google уже умеет определять страну по фотографии, распознавать объекты, распределять фотографии по тематическим группам, автоматически генерировать видеоролики и коллажи и многое другое.

Сами пользователи получают бесплатный хостинг неограниченного размера, что очень удобно: можно освободить место и никогда не волноваться о потере фотографий.
Читать полностью »

Pillow-SIMD

2016-05-24 в 10:00, admin, рубрики: AVX2, gaussian blur, image processing, image resize, imagemagick, pillow, pillow-simd, python, simd, SSE4, высокая производительность, обработка изображений

Ускорение операций в 2.5 раза по сравнению с Pillow и в 10 по сравнению с ImageMagick

Pillow-SIMD - 1

Pillow-SIMD — это «форк-последователь» библиотеки работы с изображениями Pillow (которая сама является форком библиотеки PIL, ныне покойной). «Последователь» означает, что проект не становится самостоятельным, а будет обновляться вместе с Pillow и иметь ту же нумерацию версий, только с суффиксом. Я надеюсь более-менее оперативно выпускать версии Pillow-SIMD сразу после выхода версий Pillow.

Почему SIMD

Есть несколько способов улучшения производительности обработки изображений (да и всех остальных вещей, наверное, тоже).

Можно использовать более хорошие алгоритмы, которые дают такой же результат.
Можно сделать более быструю реализацию существующего алгоритма.
Можно подключить больше вычислительных ресурсов для решения той же задачи: дополнительные ядра CPU, GPU.

Читать полностью »

Совсем не нейронные сети

2016-05-22 в 19:39, admin, рубрики: Блог компании Recognitor, машинное обучение, нейронные сети, обработка изображений, распознавание автомобильных номеров, распознавание изображений, сверточные нейронные сети

Совсем не нейронные сети - 1

Недавно ZlodeiBaal писал о достижениях в сверточных нейронных сетях (CNN) (и, кстати, тут же успешно настроил и обучил сеть для поиска области автомобильного номера).
А я хочу рассказать про принципиально иную и, наверное, более сложную модель, которую сейчас развивает Алексей Редозубов (
AlexeyR), и про то, как мы, конечно проигнорировав некоторые важные элементы, и ее применили для распознавания автомобильных регистрационных знаков!

В статье несколько упрощенно напомню о некоторых моментах этой концепции и покажу, как оно сработало в нашей задаче.
Читать полностью »

Разведка и инженерное дело: 3D-модели зданий, развязок и карьеров по фото

2016-05-19 в 7:01, admin, рубрики: 3d, 3D по фото, архитектура, Блог компании КРОК, восстановление проекта, Геоинформационные сервисы, дрон, здание, инженерные объекты, карьер, обработка изображений, фото, фотометрия

Разведка и инженерное дело: 3D-модели зданий, развязок и карьеров по фото - 1

В какой-то момент у нас на пороге появился человек в штатском с целым жёстким диском фотографий одного инженерного объекта (назовём его для определённости путепроводом через железную дорогу). Задача сводилась к традиционному «когда-то давно строили, а потом потеряли исходную документацию», и нужно восстановить проект с погрешностью в сантиметр-два.

Чтобы понять, насколько хорошую точность можно получить в архитектуре и инженерных изысканиях подобного рода, мы решили отснять свой 11-этажный офис и создать 3D-модель. В конце работы мы получили модель здания и замерили по ней пару окон. Потом пошли и измерили эти же окна в реальном мире — среднее расхождение было в пределах сантиметра, максимум — двух.

Кстати, в чём-то похожая задача была у одного из наших партнёров — нужно было снять карьер площадью 470 Га и:

Определить объёмы выработки породы.
Подсчитать объём склада продукции.
Получить поверхность для уточнения уровня гидроотвала.
Получить 3D-модель всей территории.

Разведка и инженерное дело: 3D-модели зданий, развязок и карьеров по фото - 2
Часть маршрутов

Её решили с помощью беспилотника, длинных гвоздей, GPS-приёмника и двух пачек пластиковых тарелок за 5 рублей за штуку.Читать полностью »

Распознаем лица на фото с помощью Python и OpenCV

2016-05-18 в 8:10, admin, рубрики: opencv, python, Алгоритмы, новичкам, обработка изображений, распознавание образов

Распознаем лица на фото с помощью Python и OpenCV - 1
В этой статье я хотел бы остановиться на алгоритмах распознавания лиц, а заодно познакомить вас с очень интересной и полезной библиотекой OpenCV. Уверен, что этот материал окажется полезным для новичков в этой области.

Что нам понадобится:
• Установленный Python 2.7 с библиотеками NumPy и PIL
• OpenCV 2-й версии

Здесь ссылка на материал по установке всех необходимых компонентов. Установка всего необходимого не составит труда.
Читать полностью »

Эволюция нейросетей для распознавания изображений в Google: GoogLeNet

2016-05-18 в 7:07, admin, рубрики: cnn, deep learning, Google, image classification, машинное обучение, обработка изображений

У меня тут синхронизируется VM надолго, поэтому есть время рассказать про то, что я недавно читал.
Например, про GoogLeNet.
GoogLeNet — это первая инкарнация так называемой Inception architecture, которая референс всем понятно на что:

(кстати, ссылка на него идет первой в списке референсов статьи, чуваки жгут)

Она выиграла ImageNet recognition challenge в 2014-м году с результатом 6.67% top 5 error. Напомню, top 5 error — метрика, в которой алгоритм может выдать 5 вариантов класса картинки и ошибка засчитывается, если среди всех этих вариантов нет правильного. Всего в тестовом датасете 150K картинок и 1000 категорий, то есть задача крайне нетривиальна.

Чтобы понять зачем, как и почему устроен GoogLeNet, как обычно, немного контекста.

Читать полностью »

Готическое распознавание: как мы помогали оцифровывать Национальную библиотеку Латвии

2016-05-17 в 21:00, admin, рубрики: ABBYY, finereader engine, recognition server, Блог компании ABBYY, обработка изображений, оцифровка книг

Готическое распознавание: как мы помогали оцифровывать Национальную библиотеку Латвии - 1

Сегодня мы хотим рассказать, как оцифровывали издания Национальной библиотеки Латвии. Если вы следите за нашим блогом, вы наверняка читали, как наши технологии помогают оцифровать литературное наследие разных библиотек, а также статьи, посвященные отдельным проектам — оцифровке в Сахалинской библиотеке, королевском ботаническом саду Эдинбурга и библиотеке Хартли. Сегодня история о том, как это было в Риге. Итак, Национальная библиотека Латвии – крупнейшая в стране, основана в 1919 году, обладает 4,5-миллионным собранием книг и документов, в том числе на латышском языке в уникальном готическом написании. Читать полностью »

Сжатие и передача потокового видео по TCP с помощью OpenCV

2016-05-17 в 11:11, admin, рубрики: c++, image processing, opencv, обработка изображений, С++, Сетевые технологии

По работе я занимаюсь разработкой алгоритмов обработки изображений и в частности алгоритмами автоматического слежения за объектами на видео для специального применения. Недавно понадобилось сделать модель алгоритма, управляемую с удаленного компьютера для отладки логики работы в сложной системе. Раньше такая задача не стояла, т.к. все алгоритмы реализовывались в итоге на FPGA. Давно работаю с OpenCV и, потерев руки, подошел к написанию программы. Но энтузиазм быстро погас, когда столкнулся непосредственно с передачей видео по сети.

Задача заключалась в следующем:

1. Написать программу сервер, которая загружает видео из файла, сжимает в JPEG и передает по протоколу TCP программе клиенту.
2. Написать программу клиент, которая принимает видео по TCP, декодирует и отображает.
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «обработка изображений» - 70

Рисуйте, рисуйте, рисуйте: скоро выйдет Inkscape 0.92

Structure from motion

База фотографий Google Photos выросла до 13,7 петабайт

За год люди сделали 24 миллиарда селфи

Pillow-SIMD

Ускорение операций в 2.5 раза по сравнению с Pillow и в 10 по сравнению с ImageMagick

Почему SIMD

Совсем не нейронные сети

Разведка и инженерное дело: 3D-модели зданий, развязок и карьеров по фото

Распознаем лица на фото с помощью Python и OpenCV

Эволюция нейросетей для распознавания изображений в Google: GoogLeNet

Готическое распознавание: как мы помогали оцифровывать Национальную библиотеку Латвии

Сжатие и передача потокового видео по TCP с помощью OpenCV

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «обработка изображений» - 70

За год люди сделали 24 миллиарда селфи

Ускорение операций в 2.5 раза по сравнению с Pillow и в 10 по сравнению с ImageMagick

Почему SIMD

Новости

Актуальные темы

Архив