- PVSM.RU - https://www.pvsm.ru -
Модель подходит для создания бесшовных узоров, абстрактных рисунков и стилизованных под акварель образов. Как использовать модель и как обучить нейросеть на своих картинках?
Скачать модель здесь: https://huggingface.co/netsvetaev/netsvetaev-free [1]
Как использовать .ckpt модель
Качаете файл .ckpt, кидаете в папку с моделями — а дальше все зависит от форка, который вы используете. В InvokeAI [2], которым пользуюсь я, модели добавляются обычной загрузкой invoke.py и выполнением команды !import_model в консоли.
Как обучить нейросеть на своих картинках, если нет нвидии 4090
У гугла есть замечательный сервис colab — гугл дает бесплатное железо примерно на час. Этого достаточно, чтобы создать модель на основе 15-30-50 изображений.
Сначала идем сюда и знакомимся с колабом (но ничего не трогаем): https://colab.research.google.com/github/ShivamShrirao/diffusers/blob/main/examples/dreambooth/DreamBooth_Stable_Diffusion.ipynb [3]
Все, что требуется от пользователя, кроме прокликивания каждого окна с кодом и загрузки картинок, — ключ от hugging face.
Регистрируемся на huggingface.co [4], а затем создаем ключ в настройках https://huggingface.co/settings/tokens [5]
Ключ вставляем сюда:
Отмечаем сохранение модели в гуглдрайв и указываем папку, если хотите (она создастся автоматически, в ней будет лежать модель)
Далее указываем, как будем вызывать свой стиль или объект
Конкретный токен не так важен, но главное, чтобы вы сами это запомнили. И если он будет коротким — вам будет проще вписывать его в запрос.
Затем загружаем картинки:
У загрузчика есть проблемы с сафари, лучше загружать из хрома. Или сначала добавить картинки в папку на гугл-диске, а потом указать путь до нее.
Нужно использовать размер 512x512 и лучше подготовить изображения заранее. Что вырезать — решайте сами, но я рекомендую вырезать так, чтобы сохранялась композиция и значимые объекты целиком. Можно сделать несколько отдельных картинок с увеличенным масштабом.
В зависимости от количества изображений, можно изменить количество шагов обучения. Разумное количество — 100 шагов * количество картинок. Для 8 картинок — а хватит и 8 — достаточно 800 шагов. Слишком много шагов тоже плохо: генерации станут слишком контрастными и на них появятся артефакты.
Далее просто запускайте каждый блок в колабе кнопкой Play в левом верхнем углу и здите завершения каждого кода. Когда доберетесь до участка, показанного выше, увидите процесс обучения. Он займет примерно 10 минут + еще 10-30 минут, в зависимости от количества картинок и шагов.
После обучения можно проверить модель на тестовой генерации и сконвертировать в формат .ckpt:
Теперь файл у вас на диске — скачивайте и добавляйте в любимый форк.
Дополнительно можно удалить лишние файлы и завершить процесс
О себе: Меня зовут Артур Нецветаев, я менеджер продуктов, предприниматель и дизайнер интерфейсов [6]. Я помогаю с разработкой интерфейса InvokeAI и пользуюсь им сам с момента создания.
Автор: Artur Netsvetaev
Источник [7]
Сайт-источник PVSM.RU: https://www.pvsm.ru
Путь до страницы источника: https://www.pvsm.ru/python/380487
Ссылки в тексте:
[1] https://huggingface.co/netsvetaev/netsvetaev-free: https://huggingface.co/netsvetaev/netsvetaev-free?ref=dtf.ru
[2] InvokeAI: https://github.com/invoke-ai
[3] https://colab.research.google.com/github/ShivamShrirao/diffusers/blob/main/examples/dreambooth/DreamBooth_Stable_Diffusion.ipynb: https://colab.research.google.com/github/ShivamShrirao/diffusers/blob/main/examples/dreambooth/DreamBooth_Stable_Diffusion.ipynb?ref=dtf.ru
[4] huggingface.co: http://huggingface.co/
[5] https://huggingface.co/settings/tokens: https://huggingface.co/settings/tokens?ref=dtf.ru
[6] дизайнер интерфейсов: https://netsvetaev.com/
[7] Источник: https://habr.com/ru/post/698998/?utm_source=habrahabr&utm_medium=rss&utm_campaign=698998
Нажмите здесь для печати.