Я никогда не был писателем, и мыслей таких не было. Хотя опыт написания небольших статей и ведения блога у меня был. Но часто так бывает, что мне в голову приходят разные «книжные» сценарии, которые я обыгрываю в голове по пути на работу или в свободное время. И в какой-то момент я подумал, а что если один из таких сценариев "скормить" языковой модели и попросить написать на его основе рассказ. Мне показалось интересным читать рассказы, написанные по моим собственным идеям, ожидая, что из сухой мысли родится красочный, детальный рассказ, которым можно насладиться в свободное время. Эта идея захватила меня и не откладывая в долгий ящик я решил попробовал это сделать с помощью GPT-4o. Но полученный сходу результат меня откровенно разочаровал. Совсем не это я ожидал увидеть. Рассказ получился скомканный и очень короткий. Основная идея, которая по задумке должна была разворачиваться в его ходе, погружая читателя (то есть меня) в ход событий была сформулирована в несколько предложений, причем очень топорно, но зато совершенно ненужных, а порой нелепых деталей, было предостаточно. Но я так просто не сдался, решив, что промпт был просто недостаточно детальный и «фантазия» модели уводит ее не в ту сторону, которую я планировал. Расписав более детально сюжет, оставив явные указания на события, что и где нужно описать более подробно, а что можно опустить, я попытался еще раз. Результат был лучше, но по прежнему очень далек от того, что я представлял. Проделав несколько попыток я решил, что возможно нужно попробовать другую модель. Выбор пал на Claude Sonnet 3.5 (на тот момент это была актуальная версия). У него очень хорошо с программированием, а значит должно быть хорошо и с логикой. С ним я уже сразу начал с детализированного промпта. Что могу сказать, с подобными задачами он справляется хоть и не идеально, но точно лучше детища OpenAI. Чувствуется продуманность сюжета, уместные детали. Хуже было то, что по прежнему получался очень короткий рассказ на 1-2 листа, что совершенно неприемлемо и недостаточно, чтобы погрузиться в историю. И никакие ухищрения не позволяли добиться действительно полноценного рассказа, хотя размер контекстного окна модели должен позволять это делать. В итоге все закончилось тем, что размер промпта сам стал занимать 2 листа, и по сути модель просто пересказывала мне то, что я написал, но своими словами.
Еще были попытки с DeepSeek, Google Flash, но результат везде был примерно одинаковый — писатель из LLM модели совершенно никакой. При наличии детального промпта они могут что-то сделать удобочитаемое, хотя и весьма ограниченное по размеру, но если предоставить их самим себе, то результат очень печальный. Все это было очень далеко от первоначальной идеи - быстро и просто получать интересные рассказы из краткого сценария.
Каков итог этого эксперимента? Я настолько далеко зашел в процессе написания промптов моделям, что в какой-то момент решил, что уже сам могу написать эту историю, без помощи посредников. Что и сделал, получив на выходе сначала первую книгу («Хранитель Потока», если кому-то интересно. На ВК лежит бесплатная версия, чтобы не дай бог кто что не подумал) ), а затем и вторую часть.
В чем действительно помог ИИ в этом увлекательном процессе?
1. С его помощью очень удобно придумывать имена героев, не ломая над этим голову )
2. При достаточном размере контекстного окна он может выполнять функции редактора, корректора и критика для готовой книги. Не идеально конечно, но на твердую 4 из 5.
3. Помогает для готовой книги составить аннотации
4. Ну и куда без генерационных моделей в деле рисования обложки.
По итогам этого увлекательного и нового для себя опыта я сделал вывод о том, что несмотря на явный интерес индустрии к технологиям генерации видео и даже игрового процесса, с креативом на длинной дистанции у современных моделей пока все плохо. Поэтому увидеть целиком сгенерированный ИИ фильм мы сможем еще не скоро. Равно как и поиграть в увлекательную игру, сюжет которой также будет динамически создаваться с помощью ИИ.
Проблема, как мне видится, кроется с одной стороны в процессе обучения, где основной массив обучающей информации — это относительно краткие фрагменты текста. С другой стороны в механизме внимания, который на больших контекстах «размывается», начинает терять детали, порождая галлюцинации.
PS. Пока писал эту статью увидел новость о том, что OpenAI создала ИИ-модель для написания художественных текстов. Не знаю, насколько она хороша в этом, пока модель только анонсирована, но не выпущена. Но подозреваю, что сделали они это, увидев все мои мучения с их ChatGPT в попытке выстрадать что-то похожее на интересный рассказ )
Автор: aka352