С древнейших времен человек создавал разнообразные орудия труда. За несколько тысячелетий человечество прошло путь от колесниц и глиняных табличек до компьютеров и космических спутников. Сегодня прогресс покусился на самое святое – на творчество. Речь о нейросетях. Теперь, чтобы создать картину, не нужно долгие годы оттачивать свое мастерство, часами корпеть над мольбертом или, в крайнем случае, графическим планшетом. Достаточно ввести пару слов, и все остальное сделает наш друг искусственный интеллект! Правда, это не совсем так. То есть, наверное, так, если цель – написать «Эпический котик на Марсе» и посмеяться над сгенерированной картинкой. А когда требуется получить конкретный результат по четкому техническому заданию, одного описания не достаточно. Но даже если дело касается только хобби, сможет ли нейросеть придать нашему котику нужную степень эпичности?
Да, вполне. По крайней мере, если мы говорим о Stable Diffusion, где взаимодействие человека с ИИ не ограничивается текстовыми запросами. Большое количество настроек позволит приблизить результат к желаемому. Например, выбрать требуемый стиль, в котором мы хотим сотворить нашего хвостатого космонавта – от аниме и фотореализма до стилизаций известных художников и объединения нескольких стилей одновременно.
Stable Diffusion активно развивается благодаря открытому исходному коду. Это означает, что любой желающий может принять участие в улучшении этого инструмента. Установка Stable Diffusion может потребовать определенных технических навыков, но она абсолютно бесплатна и доступна каждому, и будет доступна всегда. Да, совершенно бесплатно, без подписок, скрытых платежей и текста мелким шрифтом.
Stable Diffusion можно установить непосредственно на компьютер, скачав дистрибутив с GitHub. Увы, красивого установщика в один клик здесь не предполагается, так что, если для вас это в новинку, может показаться немножко сложным. Но всё преодолимо! Главное – не бояться.
Еще один важный момент – технические характеристики компьютера. Если требованиям к оперативной памяти (не менее 8ГБ) и процессору (собственно, практически любой) соответствует большинство современных компьютеров, то наличие видеокарты с не менее чем 4ГБ памяти может стать ограничивающим фактором. Если таковой не имеется, можно прикоснуться к миру Stable Diffusion онлайн на сайте https://stablediffusionweb.com/. Там также есть пара-другая настроек, возможность выбрать нужный стиль, но все же не тот бесконечный океан свободного творчества, путешествие по которому начинается в то мгновение, когда в черном окне консоли вам сообщат об окончании установки.
И тут главное – не потеряться.
Курс состоит из двадцати двух коротких уроков. В принципе, его можно пройти за неделю. Разобраться самостоятельно со всеми хитростями Stable Diffusion за такой срок вряд ли удастся. Большое количество возможностей неизбежно ведет к перегруженному интерфейсу, и бесконечные вкладки, кнопки и ползунки не очень приветливы для начинающего. Курс исходит из того, что вы никогда не пользовались Stable Diffusion. Разбирается каждая вкладка по отдельности, дается описание всех основных полей, благодаря чему вы последовательно погрузитесь в логику работы программы, увидите, как влияют изменения на результат, и сможете осознанно работать с настройками, чтобы получать то, что нужно.
Здесь также рассказывается о моделях, доступных в Stable Diffusion, и о том, с какой модели лучше начать. На пятом уроке мы уже изучаем запросы. И наш «эпический котик в вакууме» (ну, на Марсе-то атмосфера не очень плотная) превращается в более конкретное описание, возможно, с негативным запросом или даже сложным запросом, а слово «эпический» внезапно становится токеном. И тем самым мы значимо приблизим результат к нашему идеалу. Может быть, звучит непонятно. Но это сейчас. Благодаря подробным объяснениям разбираться с этим будет не так и сложно. Вот интересно – да!
Собственно, интересное здесь только начинается. Дальше узнаем, как сделать картинку из картинки, из картинки и текста, как получить ультраширокое изображение из квадратного , а из фотографии со старой Nokia – 4K изображение. И, наконец, доберемся до плагинов, благодаря которым расширим функционал нашего приложения в нужном нам направлении.
Если вы уже знакомы с Stable Diffusion, то, вероятно, слышали о плагине ControlNet, расширяющем возможности запроса. Умение работать с ним позволит получить результат, который в принципе сложно достичь с помощью обычных запросов, сделать это быстро, с минимальным количеством генераций, что ценно, так как создание изображения занимает от 10 секунд до нескольких минут в зависимости от вашего компьютера. Этому плагину посвящено несколько отдельных уроков – от установки до применения. И оно того стоит.
Также по ходу курса дается немало полезных ссылок: где скачать модели, а где плагины, где еще можно узнать о графических нейросетях вообще и посмотреть на сгенерированные ими изображения – и не просто изображения, а еще и на сгенерировавшие их запросы.
К тому же большинство уроков сопровождаются заданиями, начиная от собственно установки приложения – и оно, пожалуй, самое сложное и долгое (хотя, благодаря подробной инструкции, скорее просто долгое) – до генерации и улучшения картинок самыми разными способами.
На курсе рассматривается работа с нейросетью Stable Diffusion при помощи самой популярной оболочки Automatic1111. Но полученные знания пригодятся вам и при работе в другом юзер-интерфейсе, так как общие принципы остаются неизменными, меняется лишь визуальное представление.
Разбираются типовые методы работы с нейросетью, без которых не обойтись, если, например, не устраивает лишнее количество пальцев, или цвет волос, или пропорции сгенерированного персонажа, а также если нужно изменить размер определенной части изображения, да и много чего еще.
Как уже говорилось, в обилии полей и настроек Stable Diffusion вкупе с плагинами легко потеряться. Но с помощью курса, который будет у вас всегда под рукой, вы сможете быстро сориентироваться и решить большинство проблем, которые могут встретиться вам на пути покорения стихии Stable Diffusion.
А если вы не найдете решения в самом курсе, вы сможете задать свой вопрос в комментариях, и Тимур вам быстро ответит. Ну, а когда вопросов не возникнет, а написать что-нибудь хочется, то, наряду с благодарностями, почему бы не спросить о том, как так получилось, что ни в одном из уроков нет решительно ни одного кота. И в этом, пожалуй, главный, если не единственный, недостаток курса. Вот даже лягушка есть, а котиков – ровно ноль! Хотя… мы вот тут по ходу текста кота вообще на Марс пытались отправить… Так что не будем придираться.