Генеративные нейросети бесплатно без СМС
4 ноября 2024
В последние годы активно развиваются генеративные нейросети. Существует множество онлайн-сервисов, где можно ввести любой текст и искусственный интеллект сгенерирует картинку по вашему описанию. Но, как правило, данные сервисы предоставляются либо на платной основе (обычно оплачивается или определённое количество изображений, или процессорное время), либо с большим количеством ограничений (водяные знаки, строго заданные размеры и т.д.). Сегодня мы запустим нейросети на своём компьютере без регистрации без СМС.
Речь пойдёт о нейросети FLUX. Это мощная модель для генерации изображений по текстовому описанию от создателей Stable Diffusion.
Прежде чем мы начнём всё устанавливать, необходимо убедиться, что компьютер соответствует минимальным требованиям. А минимальные требования — это видеокарта семейства RTX. Лучше RTX3xxx/4xxx. Пойдут и RTX1xxx/2xxx. Работа на других видеокартах либо не гарантируется совсем, либо будет очень долгой.
Также нам потребуется 20-80 ГБ (в зависимости от устанавливаемых модулей) на SSD накопителе. Можете конечно попробовать установить и на обычный HDD, но тормозить будет сильно.
Идём на гитхаб и скачиваем архив webui_forge_cu121_torch231.7z с готовой сборкой по ссылке: https://github.com/lllyasviel/stable-diffusion-webui-forge/releases . Содержимое распаковываем в отдельную папку.
Теперь скачиваем файл модели flux1-dev-bnb-nf4-v2.safetensors (12 ГБ) по ссылке: https://huggingface.co/lllyasviel/flux1-dev-bnb-nf4/blob/main/flux1-dev-bnb-nf4-v2.safetensors . Его помещаем в папку webui\models\Stable-diffusion\
В распакованной папке мы видим несколько bat-файлов:
Сначала обязательно запускаем update.bat. Необходимые для работы компоненты автоматически обновятся до последних версий. При последующей работе уже можно запускать run.bat (но иногда следует всё-таки запускать обновление).
В результате в браузере должен запуститься web-интерфейс для нейросети. Убедитесь, что в поле Checkpoint выбрана скачанная модель.
txt2img
Пробуем ввести какой-нибудь запрос, например: «The city of the future, houses are made of electronic circuit board components«. Получаем изображение:
Да, запросы необходимо вводить на английском языке. Кстати, у системы есть API, поэтому никто не мешает написать на Python небольшое приложение, которое будет обращаться к какому-нибудь переводчику, и переводить текст перед передачей его нейросети.
Ещё несколько примеров:
С отрисовкой людей нейросеть справляется хорошо:
Обратите внимание, как нейросеть справляется с отрисовкой рук и пальцев.
Суровых бородатых мужиков она тоже умеет рисовать)
Все генерируемые изображения сохраняются в папке webui\outputs\txt2img-images, откуда их можно достать в любое время.
Рассмотрим ещё несколько возможностей нейросети.
img2img
В данном режиме можно генерировать изображения по шаблону уже имеющейся фотографии. Но нельзя сохранить в точности лицо человека или другой объект. Нейросеть лишь сделает похожее фото.
«anime style»:
Можете пробовать загружать свои фотографии и видоизменять их.
Если всё-таки необходимо сохранить что-либо на исходном фото, то можно воспользоваться режимом Inpaint, в котором необходимо закрасить с помощью мыши ту часть фото, которую необходимо изменить:
Обратите внимание на изображение за стеклом. Выбирая исходное фото, желательно чтобы за объектом не было других похожих объектов. В данном случае нейросеть ошиблась из-за других автомобилей, стоящих рядом.
Если необходимо выделить объект более точно, то можно в любом редакторе изготовить маску, а затем загрузить её вместе с изображением в режиме Inpaint upload.
Теперь перейдём на вкладку Spaces и рассмотрим ещё несколько нейросеток. Для этого их необходимо будет предварительно установить (кнопка Install), а затем запустить (Launch). Внимание! Каждая из данных нейросетей при установке скачает от нескольких до десятков гигабайт файлов.
BiRefNet
IC-Light
Мощная генеративная нейросетевая модель, которая позволяет управлять условиями освещения изображения, включая передний план, фон и общее окружающее освещение.
IDM-VTON
Improving Diffusion Models for Authentic Virtual Try-on — это революционная модель диффузии, позволяющая реалистично примерять виртуальную одежду.




















