Эту историю для моего блога рассказал нейрорежиссер Егор Апполонов.
Двадцать лет я занимался журналистикой. Работал в крупных изданиях, снимал документальные фильмы и репортажи. Устал от классической журналистики и ушел в маркетинг. Нейросети интересовали меня с самого начала их активного развития. Сначала генерировал статичные изображения, затем анимированные, теперь создаю полноценные видео.
Журнал «Синтетика»: первый масштабный проект
Первым крупным проектом стал онлайн-журнал «Синтетика». Его концепция: медиа, где статьи пишет ИИ, а изображения генерируют нейросети.
Название объединяет два смысла: синтетический контент (искусственный) и синтетическая этика (размышления об этичности использования нейросетей для создания дипфейков).
Процесс создания начинался с идеи. Записывал задумки в специальный файл, затем реализовывал их. Технологии того времени не позволяли воплотить все замыслы, многие идеи пришлось отложить.
Технологии для «Синтетики»
Для создания изображений использовал преимущественно Midjourney. Генерация визуального контента занимала большую часть времени. Тщательно работал над каждым изображением, чтобы избежать типичных нейросетевых артефактов: лишних конечностей или искаженных лиц.
Основной критерий качества: изображение должно выглядеть реалистично. Читатель должен не сразу понять, что статья создана искусственным интеллектом.
Текст генерировал с помощью ChatGPT. Нейросеть быстро усвоила нужный стиль и тон повествования.
Сами материалы
В журнале публиковались разнообразные вымышленные новости и истории:
-
Находка археологов в Гизе: технологии будущего в Древнем Египте (туалеты со смывом, велосипеды, пицца)
-
Скандальная коллекция фотографа, личность которого не установлена
-
Новая линейка кроссовок Nike в честь Хогвартса
-
Каталог ИКЕА с «грязными комнатами» — реалистичные интерьеры вместо идеальных картинок
Победа на фестивале ИИ-фильмов
После экспериментов с «Синтетикой» логичным шагом стало участие в фестивалях ИИ-фильмов.
Первый конкурс — фестиваль от Runway. Не выиграл, но получил ценный опыт. Изучив работы победителей, понял, что фестиваль ориентирован на арт-хаус, а не на мой подход к созданию контента.
Второй фестиваль — MyFilm 48. Задача: создать фильм за 48 часов по одному из творческих заданий. Выбрал тему про инопланетян и роботов из пяти предложенных вариантов.
Процесс создания фильма
Разработку сюжета начал с выбора формата. Вдохновился фильмом «Район №9» и решил сделать псевдодокументалистику: новостные репортажи, съемки с места событий, интервью очевидцев.
Основа сюжета: инопланетные корабли атакуют Землю, элитное подразделение роботизированного спецназа вступает в бой с пришельцами.
Первый этап — набросок структуры фильма. Выписал ключевые сцены, драматургические повороты, составил поэпизодник.
Для разработки диалогов и репортажных текстов использовал Gemini от Google. ChatGPT не подошел из-за недостаточной глубины, а Claude оказался слишком «зацензуренным» для историй с насилием.
Параллельно изучал визуальные референсы. Анализировал операторские приемы и монтажные решения из «Района №9», открытого на втором экране.
Визуальные решения фильма
Фильм построен по принципу документальной съемки. Основной визуальный прием — hand-held camera (съемка с рук). Камера трясется, не всегда точно фокусируется, создавая эффект репортажа с места событий.
Первый кадр фильма показывает человека с плакатом, протестующего против пришельцев. Этот репортаж прямо с улицы, мы прямо на пикете.

Резкий зум-ин со съемкой с вертолета создает ощущение погружения в эпицентр событий. Тряска камеры имитирует съемку военным, находящимся в вертолете. Статичный кадр выглядел бы ненатурально, а тряска добавляет документальной достоверности.

Монтажные переходы между видом корабля со стороны и из кабины вертолета дают зрителю разные ракурсы восприятия. Я стремился показать не просто набор движущихся картинок, а дать возможность увидеть события глазами участников. Логичная монтажная драматургия требует показать космический корабль из разных точек.

Кадры с новостной ведущей выполняют информационную функцию. Они дают зрителю необходимый контекст, рассказывая о вторжении и текущей ситуации. Вставки вызывают доверие зрителя из-за привычного формата новостей.

Роботы элитного подразделения показаны без лишних художественных приемов. Сам робот выступает главным элементом драматургии этих кадров. Следующий план показывает человека в кабине робота, раскрывая важный сюжетный момент: этими машинами управляют люди.


Кадр с кораблем — это прямая отсылка к «Району №9». Я специально взял похожий космический корабль и добавил эффект VHS-съемки.

Финальные кадры с истребителями F-16 дают зрителю возможность пережить эмоцию, недоступную в реальной жизни – увидеть космический корабль глазами пилота истребителя.

Инопланетянин в костюме Adidas и пришелец с гамбургером в финале фильма выполняют двойную функцию: с одной стороны, это была часть конкурсного задания, с другой – эти образы создают культурный контраст, представляя захватчиков через земные, узнаваемые атрибуты.
Завершающий кадр с горящим космическим кораблем оставляет открытый финал. Зритель видит намек на возможную победу людей, но полной уверенности нет. Зритель может додумать историю сам.
Я сделал резкий монтаж и быстрые смены планов, это удержит напряжение зрителя на протяжении 90 секунд фильма.
Технический стек
Для плаката с текстом и парня в шапочке из фольги использовал Flux с реалистичной лорой. Получился трушный, замыленный вид, как на любительской съемке.
Озвучку делал через Eleven Labs. Сделал уникальные голосовые профили для каждого персонажа:
-
Новостной ведущий с официальными интонациями
-
Парень в шапке из фольги с «даунской» интонацией
-
Разные персонажи с характерными особенностями речи

Для синхронизации голоса с движением губ использовал сервисы липсинка: Hedra и Kling. Процесс: совмещаешь видео с открывающимся ртом и аудиофайл, ИИ автоматически синхронизирует.
Звуковые эффекты окружения (вертолеты, взрывы, крики толпы) генерировал в Eleven Labs. Саунд-дизайн — одна из самых сложных частей монтажа.
Для визуальных эффектов разрушений использовал комбинацию Minimax, Kling и Midjourney. Качественный продукт невозможно создать одной нейросетью — нужен «оркестр» инструментов.
Весь процесс занял около 30 часов непрерывной работы. На генерацию визуального контента ушло примерно 30% времени, остальные 70% заняли монтаж и саунд-дизайн.
Полный технологический стек:
-
Midjourney, Minimax, Flux — генерация визуального контента
-
Gemini от Google — сценарий
-
Eleven Labs — голоса и звуковые эффекты
-
Hedra и Kling — липсинк
-
Final Cut Pro — монтаж
-
Runway Gen3 — один кадр с космическим кораблем над Землей
Фильм занял первое место на фестивале.
Реклама, о которой меня не просили
Я стараюсь участвовать максимально в конкурсах — потому что это вызов, и новый опыт, и возможность себя оценить. Например, когда МТС делали конкурс на рекламный видео-ролик — я участвовал. Главный приз был планшет, планшет мне не нужен, я просто принимал вызов.
Когда я увидел рекламу Porsche от Ласло Газали, сделанную полностью с помощью ИИ, я понял — что это вызов. У меня как раз под рукой был новенький Veo 2 от Google — генератора видео с невероятной реалистичностью, мне хотелось проверить его в бою.
Я сделал оммаж рекламе Porsche, перенеся действие из солнечной Италии в российскую глубинку. Вместо итальянской семьи Пьетро — семья Ивановых, вместо Porsche — классические «Жигули».
Сюжет и реализация
Структура оригинальной рекламы: рассказчик говорит о необычной особенности главного героя, его отца и деда (гибкая шея), причина раскрывается в финале. В моей версии у Петра, его отца и деда были сильные руки.
Мне нужно было показать, что Ивановы это семья, я придумал простой способ — рыжие волосы. Рыжий полный мужик в советской пилотке с рыжими усами и его тощий, но сильный рыжий сын.

Технологии и процесс создания
Для этого проекта использовал минимальный технологический стек: только Veo 2 от Google для генерации видео и Final Cut Pro для монтажа.
Единственный не-ИИ элемент — русская озвучка. Пришлось привлечь живого диктора, так как нейросети плохо справляются с русским языком. Для английской версии клонировал голос из оригинальной рекламы Porsche через Eleven Labs.
Работа с Veo 2 требует глубоких знаний кинопроизводства. Для каждого кадра необходимо детально описать:
-
Крупность плана
-
Движение камеры
-
Глубину резкости
-
Освещение
-
Оптику
Пример промпта: «средний крупный план с глубиной резкости диафрагмы 2.8, движение камеры — долли аут». Долли аут — это когда камера чуть-чуть отъезжает, для создания динамики кадра
Сложности и решения
Главная сложность — сохранение постоянства персонажа в разных сценах. В Veo 2 нет функции лор (в отличие от генераторов изображений). Приходилось каждый раз детально описывать персонажа текстовыми промптами.

Отдельные детали требовали особого внимания. Например, кадр с газетой «Правда» пришлось генерировать более 15 раз, чтобы добиться читаемого русского текста.

Время и стоимость
Проект занял около пяти дней при работе по 3-5 часов в день параллельно с другими проектами. При полной концентрации только на этом проекте хватило бы двух дней.
Финансовые затраты:
-
Veo 2 — около 6 центов за генерацию
-
Около 300 дублей для проекта
-
Итоговая стоимость генерации контента — 200-250 долларов
Общая стоимость инструментов и выводы
Ежемесячные затраты на технологический стек — 450-500 долларов:
-
Kling — 90 долларов
-
Minimax — 90 долларов
-
Eleven Labs — 20 долларов
-
Sora
-
Adobe
-
Final Cut Pro
-
Midjourney
Работа с нейросетями требует постоянного обучения. Технологии развиваются ежедневно, невозможно остановиться на достигнутом.
Главная проблема многих нейросетевых видео — отсутствие киношного бэкграунда у создателей. Качественное видео — это не просто движущиеся картинки, а история с драматургией, персонажами, продуманным звуком и монтажом.
Ключевой принцип успешной работы: никогда ничего не получается с первого раза. Генерация контента — это многократные попытки с постоянной корректировкой промптов для достижения идеального результата.
Полные видео-ролики можно посмотреть в моем блоге Сегодня без ИИ, а завтра без работы. В блоге вышли уже три подробных интервью, таких как это.
Автор: neuroAnn