Представляем вам завершающую статью из цикла по Deep Learning, в которой отражены итоги работы по обучению ГСНС для изображений из определенных областей на примере распознавания и тегирования элементов одежды. Предыдущие части вы найдете под катом.
Рубрика «обработка изображений» - 63
Deep Learning: Cочетание глубокой сверточной нейронной сети с рекуррентной нейронной сетью
2016-11-29 в 14:56, admin, рубрики: cnn, deep learning, Google, image classification, microsoft, transfer learning, Алгоритмы, Блог компании Microsoft, глубокие сверточные нейронные сети, глубокое обучение, машинное обучение, медицина будущего, медицинские технологии, нейронные сети, нейросети, обработка изображений, технологии будущегоНейросеть Pix2pix реалистично расцвечивает карандашные наброски и чёрно-белые фотографии
2016-11-22 в 16:32, admin, рубрики: cGAN, GAN, open source, искусственный интеллект, нейросеть, обработка изображений, Софт
Четыре примера работы программы, код которой опубликован в открытом доступе. Слева показаны исходные изображения, справа — результат автоматической обработки
Многие задачи в обработке изображений, компьютерной графике и компьютерном зрении можно свести к задаче «трансляции» одного изображения (на входе) в другое (на выходе). Так же как один и тот же текст можно представить на английском или русском языке, так и изображение можно представить в RGB-цветах, в градиентах, в виде карты границ объектов, карты семантических меток и т.д. По образцу систем автоматического перевода текстов, разработчики из лаборатории Berkeley AI Research (BAIR) Калифорнийского университета в Беркли создали приложение для автоматической трансляции изображений из одного представления в другое. Например, из чёрно-белого наброска в полноцветную картинку.
Читать полностью »
Квантизация изображений
2016-11-18 в 6:47, admin, рубрики: Lena Söderberg, python, алгоритм Флойда-Стейнберга, Алгоритмы, квантизация, метод медианного сечения, обработка изображений, создание палитры, метки: Lena Söderberg, алгоритм Флойда-Стейнберга, квантизация, метод медианного сечения, создание палитрыКвантизация — уменьшение цветов изображения (wiki). Конечно, сейчас мало кому это необходимо, но задача сама по себе интересная.
Квантизированная Лена привлекает внимание
Например, старый добрый формат GIF использует палитру, максимум на 256 цветов. Если вы захотите сохранить серию своих селфи как gif-анимацию (кому бы это надо было), то первое, что вам, а точнее программе, которую вы будете для этого использовать, надо будет сделать – создать палитру. Можно использовать статическую палитру, например web-safe colors, алгоритм квантизации получиться очень простым и быстрым, но результат будет «не очень». Можно создать оптимальную палитру на основе цветов изображения, что даст результат наиболее визуально похожий на оригинал.
Алгоритмов создания оптимальной палитры несколько, каждый имеет свои плюсы и минусы. Я не стану утруждать читателя нудной теорией и формулами, во первых мне лень, во вторых большинству это не интересно – статью просто пролистают, рассматривая картинки.
Далее вас ждёт скучное и непонятное повествование о методе медианного сечения, алгоритму рассеивания ошибок (шума квантизации) по Флойду-Стейнбергу (и не только), особенностях цветового восприятия человеческого глаза, а так же немного говнокода.Читать полностью »
Deep Learning: Transfer learning и тонкая настройка глубоких сверточных нейронных сетей
2016-11-10 в 14:35, admin, рубрики: cnn, deep learning, Google, image classification, microsoft, transfer learning, Алгоритмы, Блог компании Microsoft, глубокие сверточные нейронные сети, глубокое обучение, машинное обучение, медицина будущего, медицинские технологии, нейронные сети, нейросети, обработка изображений, технологии будущегоВ предыдущей статье из цикла «Deep Learning» вы узнали о сравнении фреймворков для символьного глубокого обучения. В этом материале речь пойдет о глубокой настройке сверточных нейронных сетей для повышения средней точности и эффективности классификации медицинских изображений.
Как технологии ABBYY помогают улучшить работу систем обнаружения утечек данных
2016-11-09 в 19:56, admin, рубрики: ABBYY, dlp, finereader engine, searchinform, Блог компании ABBYY, информационная безопасность, обработка изображенийНесмотря на прогнозы о скором наступлении светлого безбумажного будущего, объём бумажных документов всё ещё огромен. Часть из них сканируется и продолжает свою «жизнь» уже в электронном варианте – но только в виде изображений. В среднем в организациях объем сканированных копий составляет 30% от всех документов, которые хранятся в электронном виде. В госсекторе он достигает 41,5%, в ритейле – 17%, в сфере услуг – 23%, в банках и телеком-сфере приближается к 45%. Когда сканы документов лежат себе в нужной папке или делают работу, для которой они предназначены, – это хорошо. Плохо, когда кто-то пытается использовать данные из этих сканов в мошеннических схемах или как-то иначе злоупотреблять ими. Чтобы конфиденциальная информация не «утекла», в информационные системы компаний устанавливают DLP – системы предотвращения утечек.
Сегодня мы расскажем, как в одну из таких программ – Контур информационной безопасности SearchInform – был интегрирован SDK-продукт ABBYY FineReader Engine и что из этого получилось.
Читать полностью »
Itseez, дважды Intel Company
2016-11-09 в 11:52, admin, рубрики: itseez, opencv, Блог компании Intel, обработка изображений, ПрограммированиеIntel, как и другие корпорации, постоянно покупает и продает бизнесы – в этом нет ничего необычного. Однако покупка российской компании для нее – событие крайне неординарное. Да и сама покупка — неординарна. Этот пост про последнее приобретение Intel – фирму Itseez, известную, прежде всего, своей ключевой ролью в развитии библиотеки OpenCV.
Синтез изображений с помощью глубоких нейросетей. Лекция в Яндексе
2016-11-06 в 10:47, admin, рубрики: Prisma, torch, Алгоритмы, Блог компании Яндекс, Занимательные задачки, нейронные сети, нейросети, обработка изображений, синтез изображений, Сколтех, сравнение изображений, стилизацияПусть в блоге Яндекса на Хабрахабре эта неделя пройдет под знаком нейронных сетей. Как мы видим, нейросети сейчас начинают использоваться в очень многих областях, включая поиск. Кажется, что «модно» искать для них новые сферы применения, а в тех сферах, где они работают уже какое-то время, процессы не такие интересные.
Однако события в мире синтеза визуальных образов доказывают обратное. Да, компании еще несколько лет назад начали использовать нейросети для операций с изображениями — но это был не конец пути, а его начало. Недавно руководитель группы компьютерного зрения «Сколтеха» и большой друг Яндекса и ШАДа Виктор Лемпицкий рассказал о нескольких новых способах применения сетей к изображениям. Поскольку сегодняшняя лекция — про картинки, то она очень наглядная.
Под катом — расшифровка и большинство слайдов.
Как pdf (изображения) преобразовать в текстовый txt-файл
2016-11-02 в 12:40, admin, рубрики: languagetool, ocr, PDF, python, stduviewer, tesseract, txt, обработка изображенийВы скажете, что самый простой способ — выделить весь текст в pdf, скопировать его в буфер обмена и вставить из буфера обмена в текстовый файл. И будете правы. Но это не наш случай. Файл pdf — результат сканирования многостраничного документа. Т.е. содержимое pdf — это изображения текста.
Предлагаемый вариант решения реализован под Windows-8, но с небольшими корректировками, думаю, вполне может быть использован для Linux и OS X.
Читать полностью »
Фонд перспективных исследований: конкурс на лучшую интеллектуальную технологию дешифрирования аэрокосмической информации
2016-10-28 в 10:27, admin, рубрики: Блог компании Фонд перспективных исследований, Геоинформационные сервисы, геолокация, ДЗЗ, машинное обучение, обработка изображений, Программирование, сколково, ФПИРазработка интеллектуальных систем распознавания данных становится все более актуальной по мере развития интернета вещей и стремительного увеличения количества информации, которую собирают и которой обмениваются устройства: от камер систем безопасности до спутников, производящих съемку поверхности Земли. Однако анализ этой информации и последующее принятие решений пока остается за человеком: в силу естественных ограничений он не может быстро обрабатывать большие объемы данных и поэтому остается “узким местом” в процессе сбора и управления информацией.
Информационное моделирование зданий (BIM): как построить стадион (или другое здание) с первого раза и под контролем
2016-10-27 в 7:15, admin, рубрики: Bentley, bim, loy&hutz, trimble, Анализ и проектирование систем, Блог компании КРОК, визуализация данных, здания, инженерные сооружения, инфомоделирование, инфраструктура, контроль, обработка изображений, строительство, стройка, стройплощадка
Пересечение CAD-чертежей и актуальной оперативной информации.
Представьте, что у вас 20 строительных площадок, и на каждой что-то каждый день происходит. Вы, естественно, хотите знать, что, как и почему. Раньше вы обходили их ногами, потом стали пользоваться данными веб-камер, а теперь стандартом в индустрии становится информационное моделирование зданий/сооружений, или BIM (Building Information Modelling). Это проектирование, строительство и эксплуатация в одной IDE. Собственно, такой подход уже стал государственным в Великобритании, Сингапуре, Норвегии и Китае. У нас же BIM пока применяется для того, чтобы на этапе предпроекта или проекта визуализировать то, что собираются построить. А ещё сейчас делают первые шаги, чтобы ловить проблемы в момент появления, а не когда о них доложат.
Естественно, было бы странно, если бы всё то, что касается финансов и начинается со слов «очень наглядный», не встречалось бы в штыки.
Ещё пример правильного решения — прокладка новой трассы. Нужно решить задачу расчёта оптимальной траектории, обхода преград, оптимизации выкупаемых участков по кадастру, взаимосвязи с существующей сетью дорог и инфраструктурой. Получается довольно объёмная система нелинейных уравнений, и её решение — только начало BIM.
Или, например, вы строите стадион.
Читать полностью »