Сравнение визуала графических нейросетей

в 15:43, , рубрики: flux, ideogram, midjourney, визуализация, генеративные модели, генеративный ии, генерация изображений

Хочется больше внимания уделить стилям изображений и продемонстрировать их различия на ярких примерах. Взяла 4 нейронки: Flux, Ideogram, Visual Electric и конечно же Midjourney. Чтобы никто не отвлекался на лица, в промпте указала, что девушка бежит спиной к зрителю. Отправной точкой в нашем сравнении будет картинка из Флакса.

Сравнение визуала графических нейросетей - 1

Идеограм (пикча ниже) позволяет ремиксить в нём картинку-оригинал вплоть до 100 процентов смешения. При этом даже на 100%, разумеется, меняется цветовой, светотеневой рисунки и анатомия.

Для наглядности я смешала на 80%, чтобы было чётко видно различие в стилях.

Сравнение визуала графических нейросетей - 2
  1. И возможно не самое явное отличие — увеличение деталей и шероховатости изображения. Мыльный Флакс превращается в детализированную картинку.

  2. То, что сразу и явно бросается в глаза — потеря насыщенности.

  3. И не самое очевидное — изображение становится более плоским. Старички знают, что для оценки светотеневого рисунка, надо перевести фото в чб (щас такому на энтих вашенских курсах не учут). Таким образом мы можем увидеть потерю глубины и объёма:

    Сравнение визуала графических нейросетей - 3
    Сравнение визуала графических нейросетей - 4
  4. А если приблизим картинку, то увидим, что детали-то как раз потерялись, теневые участки попросту "выбиты", информация в них потеряна и такие участки без перегенерации восстановить невозможно:

Сравнение визуала графических нейросетей - 5
Сравнение визуала графических нейросетей - 6

А сейчас придётся сделать небольшое отступление. Так ремиксят ту же самую картинку Вижуал Электрик и Миджорни:

Сравнение визуала графических нейросетей - 7
Сравнение визуала графических нейросетей - 8

И так как Вижуал Электрик почти потерял свой стилёк при ремиксе картинки, а Миджорни… я даже хз как объяснить то, что он сделал, проведём сравнение на промпте. Выбрала варианты с блондами, так будет более наглядно.

Сравнение визуала графических нейросетей - 9
  1. На этой картинке яркая демонстрация по-настоящему высокой контрастности и насыщенности. Кстати говоря, в чб такая пикча смотрится лучше остальных, но есть свои нюансы. Например, фон с деревьями сильно темнее и контрастнее девушки, что делает его как будто бы резче. И это, к слову, одна из причин, почему в цветном варианте изображение выглядит "вырвиглазно".

Сравнение визуала графических нейросетей - 10
  1. А вот в случае с Миджи можно сказать, что достигнут идеальный баланс. Спасибо нейробогу, что мы не видим девушку ниже грудного отдела, а то можно было бы разочароваться. Но по цветам, текстуре, светотеневому рисунку и воздушной перспективе это эталон художественной фотографии. Такие картинки легко идут на баннеры и блоги путешествий. А вот "фотография" с Вижуал Электрик явно больше подойдёт для новости о каких-нибудь спортивных соревах.

Сравнение визуала графических нейросетей - 11
Сравнение визуала графических нейросетей - 12

Ну и завершила всё общими раскладками для наглядной демонстрации.

Сравнение визуала графических нейросетей - 13
Сравнение визуала графических нейросетей - 14
Сравнение визуала графических нейросетей - 15

Задавайте вопросы, дополняйте комментариями, а при большом желании можете подписаться на мой ТГ-канал, где я рассказываю о работе дизайнера с нейросетями и не только.

Автор: 85GB

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js