Как использовать стабильную диффузию для создания изображений, сгенерированных искусственным интеллектом

7 апреля, 2023

57

Запуск и настройка веб-интерфейса

акие как ChatGPT, в последнее время стали невероятно мощными — о них говорят во всех новостях! Но не забывайте о генераторах изображений ИИ (таких как Stable Diffusion, DALL-E и Midjourney). Они могут создать практически любое изображение, если им предоставить всего несколько слов. Следуйте этому руководству, чтобы узнать, как сделать это бесплатно и без ограничений, запустив Stable Diffusion на своем компьютере.

Полезно знать: изучите как исправить внутреннюю ошибку сервера ChatGPT .

Что такое стабильная диффузия?

Stable Diffusion – это бесплатная модель машинного обучения преобразования текста в изображения с открытым исходным кодом. По сути, это программа, которая позволяет вам описать изображение с помощью текста, а затем создает изображение для вас. Ему дали миллиарды изображений и сопровождающих их текстовых описаний, научили анализировать и реконструировать их.

Stabl

Contents

1 Что такое стабильная диффузия?
2 Системные требования
3 Установить веб-интерфейс AUTOMATIC1111
4 Установить модель
5 Запуск и настройка веб-интерфейса
6 Используйте txt2txt для создания концептуальных изображений
7 Поиск подсказок, использованных для прошлых изображений
8 Используйте img2img для создания похожих изображений
9 Использование Inpaint для изменения части изображения
10 Увеличьте масштаб изображения
- 10.1 Установите расширение Ultimate SD Upscale
- 10.2 Изменить размер изображения
11 Часто задаваемые вопросы

Что такое стабильная диффузия?

вы используете напрямую. Думайте о ней скорее как о базовом программном инструменте, который используют другие программы. В этом руководстве показано, как установить программу Stable Diffusion на ваш компьютер. Обратите внимание, что существует множество программ и веб-сайтов, использующих Stable Diffusion, но многие из них взимают с вас деньги и не предоставляют такого большого контроля.

Системные требования

Приблизительные рекомендации относительно того, к чему вам следует стремиться, заключаются в следующем:

macOS: Apple Silicon ( Чип серии М )

Windows или Linux: NVIDIA или AMD GPU
ОЗУ: 16 ГБ для наилучших результатов.
Видеопамять графического процессора: не менее 4 ГБ
Память: не менее 15 ГБ

Установить веб-интерфейс AUTOMATIC1111

Для доступа к Stable Diffusion мы используем программу АВТОМАТИЧЕСКИЙ1111 Веб-интерфейс , доступную во всех основных настольных операционных системах. Обязательно запишите, куда загружается каталог «stable-diffiusion-webui».

Веб-интерфейс AUTOMATIC1111 на macOS

В Терминале установите Homebrew, введя команду:

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

Стабильная диффузия Macos Установка Homebrew

Полезно знать: узнайте больше о Системные требованияспользовать доморощенный">как использовать доморощенный в этом руководстве.

Скопируйте две команды для добавления Homebrew в свой PATH и введите их.

Стабильная диффузия Macos добавляет доморощенный вариант в путь

Закройте и снова откройте терминал, затем введите:

brew install cmake protobuf rust python@3.10 git wget

Установить веб-интерфейс AUTOMATIC1111iffusion Macos Brew">

Введите:

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui

Стабильная диффузия Macos Git Clone Web Ui

Веб-интерфейс AUTOMATIC1111 в Windows

Загрузите Веб-интерфейс AUTOMATIC1111 на macOSоследняя стабильная версия Python 3.10 .

Стабильное распространение Веб-сайт Windows Python Стабильная версия 3 10 1

Запустите установщик Python, установите флажок «Добавить python.exe в PATH» и нажмите «Установить сейчас».

Стабильное распространение Установка Windows Python 3 Добавить в путь

Перейдите к разделу AUTOMATIC1111 Репозиторий веб-интерфейса на GitHub, нажмите «Код», затем нажмите «Загрузить ZIP» и распакуйте его.

Загрузка кода Stable Diffusion для Windows на Github

Веб-интерфейс AUTOMATIC1111 в Linux

Откройте терминал.

Открытый терминал Stable Diffusion Linux

Введите одну из следующих команд, в зависимости от твой вкус Linux :

На базе Debian, включая Ubuntu:

sudo apt-get update
sudo apt install wget git python3 python3-venv

На основе Red Hat:

sudo dnf install wget git python3

На основе арки:

sudo pacman -S wget git python3

Установите в «/home/$(whoami)/
Веб-интерфейс AUTOMATIC1111 в Windows
оманду:

bash <(wget -qO- https://raw.githubusercontent.com/AUTOMATIC1111/stable-diffusion-webui/master/webui.sh)

Веб-интерфейс установки Stable Diffusion Linux

Совет. обратитесь за помощью в принятии решения, стоит ли вам купить внешний графический процессор .

Установить модель

Вам все равно потребуется добавить хотя бы одну модель, прежде чем вы сможете начать использовать веб-интерфейс.

Перейти к СИВИТАЙ .

Нажмите стрелку раскрывающегося списка на кнопке загрузки и выберите «Модель SafeTensor».

Стабильная диффузия Civit Ai намеренно скачать модель Safetensor 1

Переместите файл.safetensors, загруженный на шаге 2, в папку «stable-diffiusion-webui/models/Stable-diffusion».

Стабильная диффузия Переместить в папку мо<h3><span id=

Веб-интерфейс AUTOMATIC1111 в Linux веб-интерфейса

На этом этапе вы готовы запустить и начать использовать программу Stable Diffusion в своем веб-браузере.

В терминале откройте каталог «stable-diffusion-webui» и введите команду ./webui.sh --xformersдля Linux/macOS или ./webui-user.batдля Windows. По завершении выберите и скопируйте URL-адрес рядом с надписью «Выполнение по локальному URL-адресу», который должен выглядеть так: http://127.0.0.1:7860.

Стабильная диффузия Локальный URL-адрес Webui Xformers

Вставьте ссылку в адресную строку браузера и нажмите Enter. Появится веб-сайт с веб-интерфейсом.

Стабильный браузер веб-сайтов Diffusion Webui

Давайте изменим некоторые настройки для достижения лучших результатов. Перейдите в «Настройки ->Стабильная диффузия».

Настройки стабильной диффузии Стабильная диффузия

Прокрутите вниз и установите флажок «Включить квантование в сэмплерах K для более четких и чистых результатов».

Стабильные настройки диффузии. Квантование. Пробоотборники K. Четче. Чище.

Прокрутите вверх и нажмите «Применить настройки», затем «Обновить интерфейс».

Настройки стабильной диффузии Применить настройки Обновить ин<h2><span id=

Установить модель>К вашему сведению: Если вам нужно найти источник изображения , воспользуйтесь Google.

Используйте txt2txt для создания концептуальных изображений

Теперь самое интересное: создайте несколько исходных изображений и найдите тот, который наиболее точно соответствует желаемому виду.

Перейдите на вкладку «txt2img».
В первом текстовом поле введите слова, описывающие ваше изображение, через запятую. Полезно включать слова, описывающие стиль изображения, например «реалистичный», «детализированный» или «портрет крупным планом».

В расположенном ниже текстовом поле «минус-подсказка» введите ключевые слова, на которые вы не хотите, чтобы ваше изображение выглядело. Например, если вы пытаетесь создать реалистичное изображение, добавьте такие слова, как «видеоигра», «искусство» и «иллюстрация».

Отрицательная подсказка о стабильной диффузии Txt2img

Прокрутите вниз и установите для параметра «Размер пакета» значение «4». В результате Stable Diffusion создаст четыре разных изображения из вашего приглашения.

Стабильная диффузионная партия, размер 4

Увеличьте значение «Масштаб CFG», если вы хотите, чтобы Stable Diffusion более строго следовал ключевым словам подсказки, или понизьте значение, если вы хотите, чтобы он был более креативным. Низкое значение (например, значение по умолчанию, равное 7) обычно создает изображения хорошего качества и креативные.

Остальные настройки пока оставьте по умолчанию. Нажмите большую кнопку «Создать» вверху, чтобы Stable Diffusion начал работать.

Кнопка создания стабильной диффузии Txt2img 1

Под кнопкой «Создать» нажмите миниатюры изображений, чтобы просмотреть их и определить, нравится ли вам какое-либо из них.

Если вам не нравится какое-либо изображение, повторите шаги с 1 по 5 с небольшими изменениями.

Если вам нравится одно изображение в целом, но вы хотите изменить его или исправить проблемы (искаженное лицо, анатомические проблемы и т. д.), нажмите «Отправить в img2img» или «Отправить в inpaint». Ваше изображение будет скопировано, и вам будет предложено перейти на соответствующие вкладки, где вы можете улучшить изображение.

Если изображение исключительно интересное или хорошее, нажмите кнопку «Сохранить», а затем кнопку «Загрузить».

Поиск подсказок, использованных для прошлых изображений

После того, как вы создали несколько изображений, полезно получить подсказки и настройки, используемые для создания изображения постфактум.

Перейдите на вкладку «Информация о PNG».

Загрузите изображение в коробку. Все подсказки и другие сведения о вашем изображении появятся справа.

стабильная диффузия Png результаты информации

Используйте txt2txt для создания концептуальных изображений

//saintist.ru/2023/03/26/okna-instrumentov-paketnogo-redaktirovaniya-izobrazheniy/" title="Инструменты Windows для пакетного редактирования изображений">Инструменты Windows для пакетного редактирования изображений .

Используйте img2img для создания похожих изображений

Вы можете использовать функцию img2img для создания новых изображений, имитирующих общий вид любого базового изображения.

На вкладке «img2img» убедитесь, что вы используете ранее созданное изображение с теми же подсказками.

<ол старт="2">

Увеличьте или уменьшите значение «Сила шумоподавления», чтобы регенерировать большую или меньшую часть изображения (0,50 регенерирует 50%, а 1 регенерирует 100%).

Стабильная эффективность диффузионного шумоподавления 04

Нажмите «Создать» и просмотрите различия. Если вас что-то не устраивает, повторите шаги с 1 по 3 после изменения настроек.

Либо нажмите «Отправить в img2img», чтобы продолжить внесение изменений на основе нового изображения.

Перепишите запросы, чтобы добавить к изображению совершенно новые элементы и настроить другие параметры по желанию.

Стабильная диффузия Img2img 2 Новые подсказки

Нажмите «Создать» и просмотрите результат.

Использование Inpaint для изменения части изображения

Функция Inpaint – это мощный инструмент, который позволяет выполнять точную точечную коррекцию базового изображения, «закрашивая» мышью части изображения, которые вы хотите восстановить. Детали, которые вы не покрасили, не изменяются.

На вкладке «img2img ->вкладка Inpaint» убедитесь, что вы используете ранее созданное изображение.

<ол старт="2">

Измените подсказки, если вам нужны новые визуальные элементы.

Stable Diffusion Inpaint Новые подсказки

Используйте мышь, чтобы закрасить ту часть изображения, которую вы хотите изменить.

Стабильная диффузия Inpaint Draw с помощью мыши

Измените «Метод выборки» на DDIM, который рекомендуется для рисования.

Метод отбора проб стабильной диффузии Inpaint Ddim

Установите «Сила шумоподавления», выбрав более высокое значение, если вы вносите слишком большие изменения.

Стабильная способность к шумоподавлению при диффузионной краске 08

Нажмите «Создать» и просмотрите результат.

Стабильный результат диффузионной окраски

Stable Diffusion, вероятно, не исправит все с первой попытки, поэтому вы можете нажать «Отправить в inpaint» и повторить описанные выше шаги столько раз, сколько захотите.

Полезно знать: просмотрите эти сайты для поиска изображений с прозрачным фоном .

Увеличьте масштаб изображения

До этого момента вы создавали относительно небольшие изображения размером 512 x 512 пикселей, но если вы увеличите разрешение изображения, это также повысит уровень визуальной детализации.

Установите расширение Ultimate SD Upscale

Нажмите «Расширения ->Доступно ->Загрузить из».

Поиск подсказок, использованных для прошлых изображенийons-Available-Load-From.png" alt="Стабильные диффузионные расширения, доступные для загрузки">

Прокрутите вниз, чтобы найти «Манипуляции Ultimate SD Upscale», и нажмите «Установить».

Доступны стабильные диффузионные расширения Ultimate Sd Upscale

Прокрутите вверх и нажмите вкладку «Установлено». Установите флажок «Ultimate-upscale-for-automatic1111», затем нажмите «Применить и перезапустить пользовательский интерфейс».

Установлены стабильные расширения Diffusion. Проверьте Ultimate Sd Upscale. Примените и перезапустите пользовательский интерфейс.

Изменить размер изображения

На вкладке «img2img» убедитесь, что вы используете ранее созданное изображение с теми же подсказками. В начале подсказки добавьте такие фразы, как «4k», «UHD», «фото в высоком разрешении», «RAW», «крупный план», «поры кожи» и «детальные глаза», чтобы еще больше отточить ее. Чтобы уйти от них, в начале отрицательной подсказки добавьте такие фразы, как «селфи», «размытие», «низкое разрешение» и «телефонная камера».

Используйте img2img для создания похожих изображенийновите низкое значение параметра «Сила шумоподавления» (около 0,25) и удвойте значения «Ширина» и «Высота».

Стабильная диффузия Изменение размера Ширина Высота Шумоподавление Сила

В раскрывающемся списке «Скрипт» выберите «Ultimate SD upscale», затем в разделе «Upscaler» установите флажок «R-ESRGAN 4x+».

Сценарий стабильной диффузии Ultimate Sd Upscaler R Esrgan

Нажмите «Создать» и просмотрите результат. Вы должны заметить незначительные изменения и более четкие детали.

Стабильный результат изменения размера диффузии

Вы можете увеличить разрешение еще больше, нажав «Отправить в img2img» и повторив шаги, увеличивая значения «Ширина» и «Высота» и настраивая «Сила шумоподавления».

Часто задаваемые вопросы

В чем разница между Stable Diffusion, DALL-E и Midjourney?

Все три — программы искусственного интеллекта, которые могут создать практически любое изображение из текстовой подсказки. Самая большая разница в том, что только Stable Diffusion полностью бесплатен и имеет открытый исходный код. Вы можете запустить его на своем компьютере, ничего не платя, и каждый может учиться на коде Stable Diffusion и улучшать его. Однако тот факт, что вам нужно установить его самостоятельно, усложняет его использование.

DALL-E и Midjourney имеют закрытый исходный код. Доступ к DALL-E можно получить в основном через его сайт , и он предлагает ограниченное количество генераций изображений в месяц, прежде чем вас попросят заплатить. Доступ к Середина пути можно получить в основном с помощью команд на его сервер Discord , и он имеет разные уровни подписки.

Что такое модель в стабильной диффузии?

Модель – это файл, представляющий алгоритм искусственного интеллекта, обученный на конкретных изображениях и ключевых словах. Разные модели лучше подходят для создания разных типов изображений: у вас может быть одна модель, которая хорошо

Использование Inpaint для изменения части изображения

ия 2D-персонажей мультфильмов, а третья — для создания пейзажей.

Модель Deliberate, которую мы установили в этом руководстве, — популярная модель, которая подходит для большинства изображений, но вы можете проверить все виды моделей на таких веб-сайтах, как Чивитаи или Обнимающее лицо . Загрузив файл.safetensors, вы можете импортировать его в веб-интерфейс AUTOMATIC1111, используя те же инструкции, что и в этом руководстве.

В чем разница между SafeTensor и PickleTensor?

Короче говоря, всегда используйте SafeTensor для защиты вашего компьютера от угроз безопасности.

Хотя и SafeTensor, и PickleTensor — это форматы файлов, используемые для хранения моделей для Stable Diffusion, PickleTensor — более старый и менее безопасный формат. Модель PickleTensor может выполнять произвольный код (включая вредоносное ПО) в вашей системе.

Следует ли мне использовать настройку размера пакета или количества пакетов?

Вы можете использовать оба. Пакет — это группа изображений, генерируемых параллельно. Параметр размера пакета определяет количество изображений в одном пакете. Параметр количества пакетов определяет, сколько пакетов выполняется за одно поколение; каждый пакет выполняется последовательно.

Если у вас количество пакетов равно 2, а размер пакета — 4, вы создадите два пакета и всего восемь изображений.

Если вы предпочитаете рисовать самостоятельно, ознакомьтесь с нашим список приложений для рисования эскизов для Windows .

Изображение предоставлено: Pixabay . Все скриншоты сделаны Брэндоном Ли.

Увеличьте масштаб изображения

Установите расширение Ultimate SD Upscale

Изменить размер изображения

Часто задаваемые вопросы

В чем разница между Stable Diffusion, DALL-E и Midjourney?

Что такое модель в стабильной диффузии?

В чем разница между SafeTensor и PickleTensor?

Следует ли мне использовать настройку размера пакета или количества пакетов?

Предыдущая статья

Процессоры AMD против Intel: кто победит в 2023 году?

Следующая статья

Как удалить людей из друзей на Facebook

Как использовать стабильную диффузию для создания изображений, сгенерированных искусственным интеллектом

Запуск и настройка веб-интерфейса

Что такое стабильная диффузия?

Что такое стабильная диффузия?

Системные требования

Установить веб-интерфейс AUTOMATIC1111

Веб-интерфейс AUTOMATIC1111 на macOS

Веб-интерфейс AUTOMATIC1111 в Windows

Веб-интерфейс AUTOMATIC1111 в Linux

Веб-интерфейс AUTOMATIC1111 в Windows

Установить модель

Используйте txt2txt для создания концептуальных изображений

Поиск подсказок, использованных для прошлых изображений

Используйте txt2txt для создания концептуальных изображений

Используйте img2img для создания похожих изображений

Использование Inpaint для изменения части изображения

Увеличьте масштаб изображения

Установите расширение Ultimate SD Upscale

Изменить размер изображения

Часто задаваемые вопросы

В чем разница между Stable Diffusion, DALL-E и Midjourney?

Что такое модель в стабильной диффузии?

Использование Inpaint для изменения части изображения

В чем разница между SafeTensor и PickleTensor?

Следует ли мне использовать настройку размера пакета или количества пакетов?

Увеличьте масштаб изображения

Установите расширение Ultimate SD Upscale

Изменить размер изображения

Часто задаваемые вопросы

В чем разница между Stable Diffusion, DALL-E и Midjourney?

Что такое модель в стабильной диффузии?

В чем разница между SafeTensor и PickleTensor?

Следует ли мне использовать настройку размера пакета или количества пакетов?

Популярные записи

О нас