Рубрика «GAN» - 4

Содержание

(Из-за вчерашнего бага с перезалитыми картинками на хабрасторейдж, случившегося не по моей вине, вчера был вынужден убрать эту статью сразу после публикации. Выкладываю заново.)

При всех преимуществах вариационных автоэнкодеров VAE, которыми мы занимались в предыдущих постах, они обладают одним существенным недостатком: из-за плохого способа сравнения оригинальных и восстановленных объектов, сгенерированные ими объекты хоть и похожи на объекты из обучающей выборки, но легко от них отличимы (например, размыты).

Этот недостаток в куда меньшей степени проявляется у другого подхода, а именно у генеративных состязающихся сетейGAN’ов.

Формально GAN’ы, конечно, не относятся к автоэнкодерам, однако между ними и вариационными автоэнкодерами есть сходства, они также пригодятся для следующей части. Так что не будет лишним с ними тоже познакомиться.

Коротко о GAN

GAN’ы впервые были предложены в статье [1, Generative Adversarial Nets, Goodfellow et al, 2014] и сейчас очень активно исследуются. Наиболее state-of-the-art генеративные модели так или иначе используют adversarial.

Схема GAN:

Автоэнкодеры в Keras, Часть 5: GAN(Generative Adversarial Networks) и tensorflow - 1

Читать полностью »

Нейросеть научилась состаривать и омолаживать людей по фото - 1
Оригинальная фотография (a), первоначальная реконструкция (b), два варианта оптимизации реконструкции (с) и результат состаривания/омолаживания лиц со вторым вариантом оптимизации IP, то есть с лучшим сохранением узнаваемости лица (d)

Состаривание лица (синтез возраста) с морфингом фотографии — важная задача, которая имеет много практических применений. Такое состаривание необходимо делать для корректной работы систем распознавания лиц. Оно нужно при поиске пропавших детей спустя годы или десятилетия после пропажи. Ну и конечно, морфинг лиц используется в индустрии развлечений — например, в кинематографе. Вероятно, мобильные приложения c такой функцией могут стать популярными. Каждому интересно посмотреть, как в молодости выглядел этот старичок-преподаватель или какой станет ваша красавица-однокурсница через 40-50 лет.
Читать полностью »

Apple опубликовала первую работу по ИИ - 1
Обучение состязательной нейросети на основе аннотированных синтетических и неаннотированных реальных изображений. Иллюстрация из первой научной работы Apple по ИИ

Представьте будущее, в котором системы искусственного интеллекта крупных корпораций будут конкурировать между собой, зарабатывая деньги для своих акционеров. Разумеется, у корпоративного ИИ основной задачей будет максимизация прибыли. Хорошо, если акционерами компании будут люди и прибыль достанется им. Программы ИИ могут анализировать рынок, определять наиболее перспективные рыночные ниши, устанавливать сотрудникам задачи по разработке новых продуктов. Возможно, ИИ может и сам генерировать продукты, но проверять их надо на людях, так что живые сотрудники всё равно необходимы корпорации для тестирования.

Такое киберпанковское будущее становится немного ближе.
Читать полностью »

Нейросеть Pix2pix реалистично расцвечивает карандашные наброски и чёрно-белые фотографии - 1
Четыре примера работы программы, код которой опубликован в открытом доступе. Слева показаны исходные изображения, справа — результат автоматической обработки

Многие задачи в обработке изображений, компьютерной графике и компьютерном зрении можно свести к задаче «трансляции» одного изображения (на входе) в другое (на выходе). Так же как один и тот же текст можно представить на английском или русском языке, так и изображение можно представить в RGB-цветах, в градиентах, в виде карты границ объектов, карты семантических меток и т.д. По образцу систем автоматического перевода текстов, разработчики из лаборатории Berkeley AI Research (BAIR) Калифорнийского университета в Беркли создали приложение для автоматической трансляции изображений из одного представления в другое. Например, из чёрно-белого наброска в полноцветную картинку.
Читать полностью »

Мировой рекорд беспроводной передачи данных: 6 Гбит-с на 37 километров - 1

Инженеры из института прикладной физики твёрдого тела Фраунгофера с коллегами из университета Штутгарта, Технологического института Карлсруэ и компании Radiometer Physics установили новый мировой рекорд беспроводной передачи данных на расстояние 36,7 км между приёмником и передатчиком. Скорость передачи достигала 6 Гбит/с, что на порядок превышает любые существующие сегодня решения.

Радиопередача осуществлялась в диапазоне 71-76 ГГц (E band), зарезервированном для наземного и спутникового вещания. Только в этом диапазоне миллиметровых волн существует полосы, доступные для передачи очень больших объёмов данных.
Читать полностью »

Результаты конкурса Google на самый эффективный инвертор - 1

Почти два года назад компания Google объявила конкурс Little Box Challenge с призовым фондом 1 миллион долларов на разработку самого эффективного компактного инвертора, преобразующего постоянный ток в переменный. Для победы нужно было создать двухкиловаттный инвертор с удельной плотностью мощности не менее 50 ватт на кубический дюйм (3,05 Вт на см3).
Читать полностью »

Generative adversarial networks (GAN) пользуются все большей популярностью. Многие говорят о них, кто-то даже уже использует… но, как выясняется, пока мало кто (даже из тех кто пользуется) понимает и может объяснить. ;-)
Давайте разберем на самом простом примере, как же они работают, чему учатся и что на самом деле порождают.Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js