
Вчера Илон Маск и компания xAI объявили, что Grok 3 будет бесплатным для всех в течение ограниченного времени. Это означает, что вы можете использовать Grok 3 для обычных чатов, глубокого исследования темы и даже для создания изображений.
В этом посте я сосредоточусь на возможностях Grok 3 по созданию изображений. Я сравню, насколько он стал лучше по сравнению с Grok 2, и посмотрю, как он выглядит в сравнении с другими ИИ-генераторами изображений, такими как ChatGPT и Flux от Black Forest Labs.
Давайте начнем.
Что такое Grok 3?
Grok 3 - это мультимодальная ИИ-модель, которую Маск называет «самым умным ИИ на земле». Во время презентации, транслировавшейся в прямом эфире, он добавил: «[Это] максимально правдивый ИИ, даже если эта правда иногда расходится с политической корректностью».
По данным xAI, Grok 3 в 10-15 раз мощнее своего предшественника. Он работает на суперкомпьютере Colossus, оснащенном 100 000 графических процессоров Nvidia H100, которые используют 200 миллионов GPU-часов для обучения. Благодаря такому уровню вычислительной мощности Grok 3 может обрабатывать огромные массивы данных с высокой скоростью и точностью, поднимая возможности ИИ на совершенно новый уровень.

По данным бенчмарков, предоставленных xAI, Grok 3 выигрывает у GPT-4o в нескольких сравнениях, включая AIME (оценивает производительность модели на выборке математических вопросов) и GPQA (оценивает модели на основе задач по физике, биологии и химии уровня доктора наук).
Как получить доступ к нейросети для генерации изображений Grok 3
Существует 3 способа получить доступ к генератору изображений Grok. Первый и, вероятно, самый простой - через платформу X. Просто перейдите на вкладку Grok, выберите модель Grok 3 и попросите ее сгенерировать изображение.

xAI также представила новый отдельный сайт grok.com. Преимущество использования отдельного сайта в том, что на нем больше возможностей, чем в X.

Третий способ - через недавно выпущенное приложение Grok, доступное в Apple App Store.

Примеры сгенерированных в Grok 3 изображений
Теперь давайте попробуем сгенерировать несколько изображений с помощью Grok 3.
Промпт: a river otter playing a ukelele


Реалистичность этих изображений впечатляет, особенно это касается текстуры меха выдры и тщательно детализированной травы. Освещение и тени способствуют созданию ощущения естественности, делая сцену визуально убедительной.
Однако есть небольшие несоответствия в анатомии, которые немного нарушают иллюзию - в первую очередь это недостающая нижняя лапа на одном изображении и недостающая верхняя лапа - на втором. В остальном изображение выглядит удивительно реалистично.
Вот что делает его интересным: обратите внимание, что вы можете ввести повторный промпт, чтобы еще больше изменить предыдущие изображения.

Попробую добавить в изображение элемент «under a rainbow», и вот какие результат у меня получился:

Это очень круто. Вы можете продолжать улучшать результаты, просто давая указания Grok.
Давайте рассмотрим другие примеры:
Промпт: A fluffy cat curled up inside a transparent wine glass with realistic fur details, glass reflections, and accurate light refraction.


К сожалению, ни на одном из двух изображений ИИ-генератору не удалось изобразить кошку, свернувшуюся калачиком внутри винного бокала, как было задумано. ИИ не смог правильно расположить кошку в бокале, вероятно, из-за сложности сочетания прозрачности, отражений и точной кошачьей анатомии в ограниченном пространстве.
Мне было интересно посмотреть, как другие модели ИИ справляются с этой задачей, я решил проверить ее с помощью Flux 1.1 Pro Ultra. По сравнению с предыдущими результатами, Flux показал гораздо лучшее понимание промпта, успешно передав как прозрачность стекла, так и естественную позу кошки.

Композиция кажется более целостной, а реалистичность взаимодействия кошки с окружающей средой повысилась. Хотя ни одна ИИ-модель не может быть идеальной, рендеринг Flux гораздо точнее соответствует запросу.
Далее посмотрим, как с подобными промптами справляется ChatGPT.

Как видите, ChatGPT с моделью GPT-4o лучше справляется с генерацией изображений, чем Grok 3.
Возвращаясь к Grok, давайте посмотрим, насколько хорошо он генерирует текст на изображениях.
Промпт: tars in a galaxy spelling “Grok”


Великолепно. Мне нравится, насколько разборчивы буквы и как хорошо стиль сочетается с фоном.
Наконец, давайте оценим реалистичность генерации изображений в Grok. Насколько хорошо он справляется с анатомически точными человеческими фигурами? Убедительно ли он передает текстуру кожи, мелкие детали, такие как пряди волос, и общую пропорциональность? Давайте оценим.
Промпт: An elderly potter shaping a clay pot on a spinning wheel, with detailed wrinkles, veins on his hands, and wet clay sticking to his fingers.


Качество впечатляет. Одним из первых моментов, который я проверил, было количество пальцев на руках, поскольку ИИ-модели иногда испытывают трудности с этим, и, на удивление, Grok сделал все правильно. Я также обратил внимание на степень загрязнения рук во время изготовления глиняного горшка, и рендер хорошо передал это. Детали на коже и отдельные пряди волос также хорошо проработаны, что делает изображение еще более реалистичным.
В этом случае качество уже находится на одном уровне с Flux 1.1 Pro Ultra и Midjourney, что впечатляет, учитывая, насколько сложными для ИИ могут быть анатомия человека и детали текстур.
Судя по моим тестам, создатели Grok 3 проделали большую работу, поэтому этот ИИ-генератор по качеству изображения уже не уступает Midjourney и Flux 1.1 Pro Ultra. Детализация текстур, освещения и анатомии впечатляет, а с некоторыми промптами он справляется на удивление хорошо.
Тем не менее, есть несколько заметных недостатков. Он не справляется со сложными композициями, иногда неправильно понимает взаимодействие объектов и поддерживает только соотношение сторон 1:1. Эти проблемы могут расстроить, особенно в сравнении с более гибкими ИИ-генераторами изображений.
Но если учесть, что сейчас Grok можно использовать совершенно бесплатно, то причин для недовольства практически нет. Кроме того, Маск заявил, что модель ежедневно совершенствуется, так что в ближайшем будущем мы можем увидеть значительные обновления. Следует помнить, что бесплатный доступ предоставлен только на ограниченное время.Если вам интересно, как Grok генерирует изображения, сейчас самое время испытать его. Напишите в комментариях, как вы оцениваете его возможности.
Автор: NeyroEntuziast