Водопад курильщика и водопад здорового человека
Все мы знаем, как нарисовать сову. Нужно сначала нарисовать овал, потом еще окружность, ну а потом — получается шикарная сова. Конечно, это шутка, причем очень старая, но инженеры Nvidia постарались сделать так, чтобы фантазия стала реальностью.
Новая разработка, которая называется GauGAN, создает шикарные пейзажи из очень простых набросков (действительно простых — окружности, линии и все). Конечно, в основе этой разработки лежат современные технологии — а именно генеративные состязательные нейросети.
GauGAN позволяет создавать красочные виртуальные миры — и не только для развлечения, но и для работы. Так, архитекторы, специалисты по ландшафтному дизайну, разработчики игр — все они могут почерпнуть что-то полезное. Искусственный интеллект сходу «понимает», чего хочет человек и дополняет изначальную идею огромным количеством деталей.
«Мозговой штурм в плане разработки дизайна дается гораздо легче с использованием помощи GauGAN, поскольку умная кисть может дополнить изначальный набросок, добавив качественные изображения», — заявил один из разработчиков GauGAN.
Пользователи этого инструмента могут изменять изначальную задумку, модифицировать пейзаж или другое изображение, добавлять небо, пески, море и т.п. Все, что душе угодно, причем добавление происходит всего за пару секунд.
Нейросеть тренировали с использованием базы в миллионы изображений. Благодаря этому система может понять, чего хочет человек и как добиться желаемого. Причем нейросеть не забывает о мельчайших деталях. Так, если нарисовать схематично пруд и какие-то деревья рядом с ним, то после оживления пейзажа все близлежащие объекты будут отражаться в зеркале воды пруда.
Системе можно указывать, какой должна быть видимая поверхность — она может быть покрыта травой, снегом, водой или песком. Все это можно за секунду преобразовать, так что снег станет песком и вместо заснеженной пустоши художник получит пустынный ландшафт.
«Это как книжка раскраска, в которой говорится, где размещать дерево, где — солнце, а где — небо. Затем, после изначальной задачи нейронная сеть оживляет картину, добавляет необходимые детали и текстуры, прорисовывает отражения. Все это основывается на реальных изображениях», — говорит один из разработчиков.
Несмотря на то, что системе не хватает «понимания» реального мира, система создает впечатляющие пейзажи. Все потому, что здесь используются две нейросети, генератор и дискриминатор. Генератор создает изображение и показывает его дискриминатору. Тот, основываясь на миллионах виденных ранее изображений, выбирает наиболее реалистичные варианты.
Именно поэтому генератор «знает», где должны быть отражения. Стоит отметить, что инструмент весьма гибкий и оснащен большим количеством настроек. Так, с его помощью можно писать картины, подстраиваясь под стиль определенного художника или просто баловаться с быстрым добавлением восхода или заката.
Разработчики утверждают, что система не просто берет откуда-то изображения, складывает вместе и получает результат. Нет, все получаемые «картинки» являются генерированными. То есть нейросеть «творит», как настоящий художник (или даже лучше).
Пока что программы нет в свободном доступе, но вскоре ее можно будет опробовать в работе. Это можно сделать на технологической выставке GPU Technology Conference 2019, которая прямо сейчас идет в Калифорнии. Счастливчики, которые смогли посетит выставку, уже могут потестировать GauGAN.
Нейросети уже давно учат принимать участие в творческом процессе. Например, в прошлом году, некоторые из них могли создавать 3D модели. Кроме того, разработчики из DeepMind обучили нейросеть восстанавливать трехмерные пространства и объекты по рисункам, фотографиям, наброскам. Для того, чтобы воссоздать простую фигуру, нейросети хватает одной картинки, для создания более сложных объектов требуется пять картинок для «натаскивания».
Что касается GauGAN, то этот инструмент явно найдет достойное коммерческое применение — у многих направлений бизнеса и науки есть необходимость в подобных сервисах.
Автор: Максим Агаджанов