Рубрика «image classification»

Мэтчинг персонажей. Level Hard

2024-12-22 в 13:42, admin, рубрики: computer vision, detection, image classification, image segmentation, self-supervised

Интро

Для всех, кто знаком со свертками, задача мэтчинга персонажейне кажется сверхсложной. На Kaggle есть даже соревнования с подобной задачей и размеченный датасет с персонажами мультсериала Симпсоны. Но здесь ключевое слово — «размеченный».

Что делать, если датасет не размеченный и на каждом изображении несколько персонажей, а размечать все это очень не хочется? Тут на помощь приходят алгоритмы сегментации и контрастивное обучение, но обо всем по порядку.

Какие данные

Мы работали с коллекцией гравюр Британского музея. Все гравюры Читать полностью »

Нейронные сети предпочитают текстуры и как с этим бороться

2019-05-29 в 10:57, admin, рубрики: bag-of-features, bag-of-words, bagnet, datasets, deep learning, image classification, image recognition, ImageNet, machine learning, ods, ods.ai, open data science, resnet, ResNet-50, Блог компании Open Data Science, искусственный интеллект, машинное обучение, мозг, обработка изображений

Нейронные сети предпочитают текстуры и как с этим бороться - 1

В последнее время вышло несколько статей с критикой ImageNet, пожалуй самого известного набора изображений, использующегося для обучения нейронных сетей.

В первой статье Approximating CNNs with bag-of-local features models works surprisingly well on ImageNet авторы берут модель, похожую на bag-of-words, и в качестве "слов" используют фрагменты из изображения. Эти фрагменты могут быть вплоть до 9х9 пикселей. И при этом, на такой модели, где полностью отсутствует какая-либо информация о пространственном расположении этих фрагментов, авторы получают точность от 70 до 86% (для примера, точность обычной ResNet-50 составляет ~93%).

Во второй статье ImageNet-trained CNNs are biased towards texture авторы приходят к выводу, что виной всему сам набор данных ImageNet и то, как изображения воспринимают люди и нейронные сети, и предлагают использовать новый датасет – Stylized-ImageNet.

Более подробно о том, что на картинках видят люди, а что нейронные сети Читать полностью »

Quick Draw Doodle Recognition: как подружить R, C++ и нейросетки

2019-03-25 в 16:09, admin, рубрики: c++, deep learning, image classification, kaggle, keras, monetdb, R, rcpp, Администрирование баз данных, Блог компании Open Data Science, машинное обучение, обработка изображений

Quick Draw Doodle Recognition: как подружить R, C++ и нейросетки - 1

Привет!

Осенью прошлого года на Kaggle проходил конкурс по классификации нарисованных от руки картинок Quick Draw Doodle Recognition, в котором среди прочих поучаствовала команда R-щиков в составе Артема Клевцова, Филиппа Управителева и Андрея Огурцова. Подробно описывать соревнование не будем, это уже сделано в недавней публикации.

С фармом медалек в этот раз не сложилось, но было получено много ценного опыта, поэтому о ряде наиболее интересных и полезных на Кагле и в повседневной работе вещей хотелось бы рассказать сообществу. Среди рассмотренных тем: нелегкая жизнь без OpenCV, парсинг JSON-ов (на этих примерах рассматривается интеграции кода на С++ в скрипты или пакеты на R посредством Rcpp), параметризация скриптов и докеризация итогового решения. Весь код из сообщения в пригодном для запуска виде доступен в репозитории.

Содержание:

Эффективная загрузка данных из CSV в базу MonetDB
Подготовка батчей
Итераторы для выгрузки батчей из БД
Выбор архитектуры модели
Параметризация скриптов
Докеризация скриптов
Использование нескольких GPU в облаке Google Cloud
Вместо заключения

Читать полностью »

Создаём нейронную сеть InceptionV3 для распознавания изображений

2017-02-14 в 14:15, admin, рубрики: cnn, deep learning, Google, image classification, python, transfer learning, Алгоритмы, глубокие сверточные нейронные сети, глубокое обучение, машинное обучение, нейронные сети, нейросети, обработка изображений, технологии будущего

Создаём нейронную сеть InceptionV3 для распознавания изображений - 1

Привет! Под катом пойдёт речь о реализации свёрточной нейронной сети архитектуры InceptionV3 с использованием фреймворка Keras. Статью я решил написать после ознакомления с туториалом "Построение мощных моделей классификации с использованием небольшого количества данных". С одобрения автора туториала я немного изменил содержание своей статьи. В отличие от предложенной автором нейронной сети VGG16, мы будем обучать гугловскую глубокую нейронную сеть Inception V3, которая уже предустановлена в Keras.

Вы научитесь:

Импортировать нейронную сеть Inception V3 из библиотеки Keras;
Настраивать сеть: загружать веса, изменять верхнюю часть модели (fc-layers), таким образом, приспосабливая модель под бинарную классификацию;
Проводить тонкую настройку нижнего свёрточного слоя нейронной сети;
Применять аугментацию данных при помощи ImageDataGenerator;
Обучать сеть по частям для экономии ресурсов и времени;
Оценивать работу модели.

При написании статьи я ставил перед собой задачу представить максимально практичный материал, который раскроет некоторые интересные возможности фреймворка Keras.
Читать полностью »

Deep Learning: Cочетание глубокой сверточной нейронной сети с рекуррентной нейронной сетью

2016-11-29 в 14:56, admin, рубрики: cnn, deep learning, Google, image classification, microsoft, transfer learning, Алгоритмы, Блог компании Microsoft, глубокие сверточные нейронные сети, глубокое обучение, машинное обучение, медицина будущего, медицинские технологии, нейронные сети, нейросети, обработка изображений, технологии будущего

Представляем вам завершающую статью из цикла по Deep Learning, в которой отражены итоги работы по обучению ГСНС для изображений из определенных областей на примере распознавания и тегирования элементов одежды. Предыдущие части вы найдете под катом.

Deep Learning: Cочетание глубокой сверточной нейронной сети с рекуррентной нейронной сетью - 1
Читать полностью »

Deep Learning: Transfer learning и тонкая настройка глубоких сверточных нейронных сетей

2016-11-10 в 14:35, admin, рубрики: cnn, deep learning, Google, image classification, microsoft, transfer learning, Алгоритмы, Блог компании Microsoft, глубокие сверточные нейронные сети, глубокое обучение, машинное обучение, медицина будущего, медицинские технологии, нейронные сети, нейросети, обработка изображений, технологии будущего

В предыдущей статье из цикла «Deep Learning» вы узнали о сравнении фреймворков для символьного глубокого обучения. В этом материале речь пойдет о глубокой настройке сверточных нейронных сетей для повышения средней точности и эффективности классификации медицинских изображений.

Deep Learning: Transfer learning и тонкая настройка глубоких сверточных нейронных сетей - 1
Читать полностью »

Эволюция нейросетей для распознавания изображений в Google: Inception-ResNet

2016-06-14 в 7:17, admin, рубрики: cnn, deep learning, Google, image classification, microsoft, машинное обучение, обработка изображений

Буду потихоньку дорассказывать про Inception.
Предыдущая часть здесь — https://habrahabr.ru/post/302242/.
Мы остановились на том, Inception-v3 не выиграл Imagenet Recognition Challange в 2015-м, потому что появились ResNets (Residual Networks).

Что такое вообще ResNets?

Эволюция нейросетей для распознавания изображений в Google: Inception-ResNet - 1 Читать полностью »

Эволюция нейросетей для распознавания изображений в Google: Inception-v3

2016-05-31 в 6:03, admin, рубрики: cnn, deep learning, Google, image classification, машинное обучение, обработка изображений

Продолжаю рассказывать про жизнь Inception architecture — архитеткуры Гугла для convnets.
(первая часть — вот тут)
Итак, проходит год, мужики публикуют успехи развития со времени GoogLeNet.
Вот страшная картинка как выглядит финальная сеть:

Что же за ужас там происходит?

Читать полностью »

Эволюция нейросетей для распознавания изображений в Google: GoogLeNet

2016-05-18 в 7:07, admin, рубрики: cnn, deep learning, Google, image classification, машинное обучение, обработка изображений

У меня тут синхронизируется VM надолго, поэтому есть время рассказать про то, что я недавно читал.
Например, про GoogLeNet.
GoogLeNet — это первая инкарнация так называемой Inception architecture, которая референс всем понятно на что:

(кстати, ссылка на него идет первой в списке референсов статьи, чуваки жгут)

Она выиграла ImageNet recognition challenge в 2014-м году с результатом 6.67% top 5 error. Напомню, top 5 error — метрика, в которой алгоритм может выдать 5 вариантов класса картинки и ошибка засчитывается, если среди всех этих вариантов нет правильного. Всего в тестовом датасете 150K картинок и 1000 категорий, то есть задача крайне нетривиальна.

Чтобы понять зачем, как и почему устроен GoogLeNet, как обычно, немного контекста.

Читать полностью »

Информация

Комментарии

Рекомендуем

Рубрика «image classification»

Мэтчинг персонажей. Level Hard

Интро

Какие данные

Нейронные сети предпочитают текстуры и как с этим бороться

Quick Draw Doodle Recognition: как подружить R, C++ и нейросетки

Содержание:

Создаём нейронную сеть InceptionV3 для распознавания изображений

Deep Learning: Cочетание глубокой сверточной нейронной сети с рекуррентной нейронной сетью

Deep Learning: Transfer learning и тонкая настройка глубоких сверточных нейронных сетей

Эволюция нейросетей для распознавания изображений в Google: Inception-ResNet

Что такое вообще ResNets?

Эволюция нейросетей для распознавания изображений в Google: Inception-v3

Эволюция нейросетей для распознавания изображений в Google: GoogLeNet