

Нейросети давно стали партнёрами дизайнеров, помогая вторым выполнять рутинные задачи. Особенно это заметно в графическом дизайне, где важно быстро воплотить идею. Stable Diffusion — одна из самых мощных нейросетей для генерации изображений. Она открытая, гибкая, работает офлайн и даёт огромное пространство для экспериментов. Но если не понимать, как формулировать промпты, можно часами получать что угодно, кроме нужного результата. Чем лучше разберётесь в ней, тем больше будете экономить время и тем точнее результат будет получаться.
На курсе «Графический дизайнер» в школе Логомашина мы учим не только правилам композиции, но и работе с самыми популярными нейросетями. Потому что сегодня хороший дизайнер умеет управлять цифровыми инструментами.
В статье мы разберём, как работает Stable Diffusion, как правильно писать промпты, какие настройки влияют на результат, на что обратить внимание, чтобы не тратить время зря.
Чем Stable Diffusion отличается от других нейросетей
Всё началось с Эмадома Мостака, который решил, что искусственным интеллектом должны пользоваться все. Вместо того чтобы монетизировать нейросеть по подписке, как это делают другие, он выложил Stable Diffusion в открытый доступ (большое спасибо ему за это). Такая щедрость сразу сделала Stable Diffusion одной из самых популярных нейросетей в мире.
Большой плюс нейронки — локальная установка. Stable Diffusion можно запустить на своём компьютере, без интернета. Особенно круто работает режим img2img, когда ты загружаешь набросок, коллаж или даже фотку, и нейросеть на его основе создаёт новую версию. Именно с помощью этой техники пользователи стилизуют скриншоты, раскрашивают детские рисунки.
Ещё с её помощью можно дорисовывать недостающие элементы на изображении (outpainting), заменять объекты (inpainting), генерировать ассеты прямо в игровую среду, а также стилизовать картинку под любого художника — хоть Ван Гога, хоть Бэнкси. Пользователи даже интегрируют нейросеть в 3D-движки, используют в рекламных роликах.
Что такое промты
Промт (или промпт) — это текстовое описание, по которому нейросеть генерирует изображение. Это может быть одно слово («cat»), но тогда нейросеть выдаст кошку случайного цвета, размера. Может даже нарисовать невнятное лого в углу, как в нашем случае.
Если нужно, чтобы кошка спала на кровати, а лапки её были белые, всё это необходимо прописывать отдельно.
Именно подробное, грамотное описание помогает добиться нужного стиля, композиции, атмосферы. Если описать всё кратко или подобрать не те слова, то Stable Diffusion будет добавлять какие-то элементы на своё усмотрение. Такие неправильные промты приводят к недостоверному изображению.
Например, тут кошка решила одним глазом понаблюдать за лапой, а вторым спать.
Нейросеть может работать в двух режимах:
- Text-to-Image (текст → изображение)
Это когда ты пишешь промт — например, «a sleeping cat with white paws on a windowsill, soft lighting, realistic style» — и нейросеть полностью с нуля генерирует изображение по текстовому описанию. В этом режиме она ничего не «видит», только интерпретирует текст и рисует на его основе. - Image-to-Image (изображение + текст → новое изображение)
Ты загружаешь исходную картинку, пишешь к ней промт, и нейросеть трансформирует её: меняет стиль, добавляет детали или даже полностью перерисовывает. Этот режим называют img2img. Промт по картинке онлайн можно сгенерировать автоматически или прописать вручную.
Можно просто через запятую написать ключевые слова или в свободной форме описать (как если наговаривать другу) сам объект, освещение и какие-то дополнительные детали. Но при таком подходе корректировки будут долгими, раздражающими.
А вот если следовать некоторым правилам, работать с stable diffusion станет проще. Что это за правила?
- Чем раньше написано слово, тем больше веса оно имеет. Если написать вначале «кошка», а потом что она будет делать, главным объектом по-прежнему останется животное, а комната, фон, свет где-то на втором плане.
- Используй негативный промт. В нём указывают то, что точно не должно находиться на фото. Туда обычно вписывают следующие слова: blurry, watermark, text, out of frame.
- Для генерации изображений нужно быть конкретным. Фразы вроде «весна, лёгкий дождь» лучше заменить на «spring landscape, fresh grass, gentle rain, warm lighting» — так нейросеть лучше поймёт, что ты хочешь показать.
Какие пункты включают хорошие промты для генерации изображений:
- Объект — кто или что должно быть изображено (cat, girl, spaceship).
- Характеристики объекта — одежда, поза, цвет, выражение (wearing boots, smiling).
- Окружение — где всё происходит (on a table, in a forest, underwater).
- Стиль, тип изображения (digital painting, 3D render, pixel art).
- Свет, атмосфера — мягкий свет, дождь, туман (dramatic lighting, fog, sunset).
- Качество — детальность, уровень проработки (high quality, ultra detailed, 8K).
Как мы уже писали, Stable Diffusion придаёт больше значения словам, стоящим в начале, но ты также можешь усилить любой фрагмент, обернув его в круглые скобки.
Как это выглядит:
- ((black boots)) +20% к важности
- (((black boots))) +30–40%
Чем больше скобок, тем выше приоритет, но перебарщивать не стоит: изображение может стать неестественным или попросту глупым. Вот, например, что произошло, когда мы попросили нарисовать кота в сапогах, но поставили три скобки на втором слове (сапог стал главнее кошки).
Можно ещё тоньше управлять акцентами, указывая вес числом (black boots:1.2 — повышает важность, white background:0.6 — понижает важность).
Как это выглядит: cat in boots:1.3, sitting on windowsill, cinematic lighting
В промте также можно смешивать некоторые слова. Для этого используют квадратные скобки. Например, мы хотим получить новое животное котопес ([cat:dog:0.3] sits on a bench).
Ещё ими можно понижать значимость:
cat, forest background, [fog:0.4]. Фон будет туманный, но не затмит кота.
Инструменты, которые помогут составлять промты
На старте всем сложно разбираться в написании промтов. Да и когда генерировать нужно очень много изображений, проще обзавестись помощниками. Хорошая новость: есть целый набор онлайн-инструментов, которые быстро составляют промты. Ниже подборка таких сервисов.
Ресурсы с примерами: где можно взять готовый промт
Эти сайты-библиотеки с уже сгенерированными изображениями и промтами к ним. Здесь можно скопировать промт, адаптировать его под свою задачу.
- PromptHero — сайт с огромным архивом промтов, сгенерированных в Midjourney, DALL·E, Stable Diffusion, другие.
- Lexica.art — поисковик по базе генераций. Вводишь, например, «cyberpunk cat» — получаешь сотни вариантов с промтами.
- CivitAI — платформа, где хранятся тысячи кастомных моделей и LoRA (лёгких обучающих надстроек), а вместе с ними — промты.
- Prompt1.ru — русскоязычный ресурс с галереей картинок и тегами.
- DTF.ru — здесь часто публикуют подборки удачных промтов и результатов генерации.
- Pixel Tools — Telegram-бот и веб-версия с примерами, сохранением промтов.
Где можно протестировать и настроить
Эти платформы позволяют ввести свой промт, настроить модель, параметры, и сразу увидеть результат.
- Mage.space — это онлайн-интерфейс для генерации изображений с помощью Stable Diffusion, где можно сразу протестировать промт, не устанавливая ничего на компьютер. Работает с img2img, inpainting. В бесплатной версии есть ограничения на количество изображений.
- Promptomania — визуальный конструктор промтов с выбором стиля, предметов и среды.
- Tagger на Hugging Face — если у тебя есть картинка, но ты не знаешь, как составить под неё промт. Он анализирует изображение и выдаёт список тегов, которые можно использовать как основу для промта.
- ChatGPT + Stable Diffusion. У ChatGPT можно попросить помощь в составлении. Как примерно выглядит запрос:
«Составь промт для SDXL: кот в сапогах, в стиле мультфильма, закат, фон — деревня».
Ты получишь вариант вроде:
«a cat wearing leather boots and a feathered hat, standing heroically on a dirt road, sunset lighting, cartoon style, background with medieval village».
Разные версии Stable Diffusion: как выбрать и подстроить промпт
Нейронка имеет несколько версий. Stable Diffusion 1.5 — это классика, работает с разрешением 512×512 пикселей. Хорошо подходит для генерации изображений в различных стилях, но для достижения качественного результата требуется детально проработанный промт, часто с использованием весов (важности слов).
(majestic lion), standing on a cliff, (sunset sky), cinematic lighting, golden fur, powerful stance, epic atmosphere, highly detailed, concept art, in the style of Greg Rutkowski, digital painting, 4k.
Stable Diffusion XL (SDXL) — более продвинутая версия, способная генерировать изображения с разрешением до 1024×1024 пикселей. Она использует два текстовых энкодера, более крупную архитектуру, поэтому лучше понимает сложные, длинные описания.
При работе с SDXL рекомендуется использовать более естественные описания.
Например, вместо коротких тегов, как в версии 1.5, лучше писать полные предложения: «A majestic lion with golden fur standing confidently on the edge of a rocky cliff during sunset. The scene is lit with warm cinematic lighting, and the background shows dramatic clouds and glowing light rays. The image is in the style of a digital painting by Greg Rutkowski, concept art, ultra-detailed, 4k».
Но это не всё. Есть ещё кастовые модели — такие надстройки, которые можно «подключить» к основным версиям. Это дополнительные данные, сделанные энтузиастами, которые работают в определённом стиле: аниме, пиксель-арт, глянцевая 3D, стиль конкретного художника. Такие модели можно скачать на CivitAI. В названии будет пометка (Anime Pastel, Realistic Vision, Deliberat). Промты для аниме и других стилей пишутся по аналогии выше, просто добавь нужный стиль в конце.
Ошибки при создании промптов и как их избежать
- Слишком общее описание. В таком случае ответственность перекладывается на нейросеть. Она будет додумывать всё на своё усмотрение.
cat → нейросеть сгенерирует любую кошку: стоящую, спящую, в прыжке.
Лучше: «a sleeping cat with white paws, lying on a windowsill, soft lighting». - Недостаточно контекста. Для тебя какая-то цепочка событий возможно очевидна по умолчанию, но для Stable Diffusion это не так.
girl, rain → где она? внутри? на улице?
Лучше: «a girl sitting by the window, it’s raining outside, cozy room». - Противоречивые указания.
dark room, bright sunlight — нейросеть не понимает, что главное.
Лучше: «a dark room lit by a single ray of sunlight coming through the window». Либо можно использовать скобки, чтобы указать вес слов. - Сложные метафоры, поэтика
white sail of loneliness — красиво, но непонятно.
Лучше: «a lone white sailboat in the middle of a calm blue sea». - Отсутствие или перегрузка негативного промта
Нет негативного промта → может появиться текст, водяные знаки.
Используй: «blurry, low quality, watermark, text». - Нет точного указания на стиль, в таком случае генерация картинки будет на усмотрении ИИ.
«man on a mountain» — непонятно, реализм это, арт или пиксель.
Лучше: «a man standing on a mountain peak, digital painting, concept art style».
Примеры промтов и получившийся результат
Фото интерьера в стиле лофт
Spacious loft-style living room with exposed brick walls, industrial lamps, metal shelving and vintage leather furniture. Natural light from tall windows, minimalistic decor with a creative touch, captured like a modern architectural photoshoot.
Портрет, ближний план (готическая эстетика)
Close-up portrait of a gothic woman with expressive eyes and dark makeup, wearing a velvet choker. Studio lighting, shallow depth of field, cinematic composition, subtle vintage tint.
Ночной город
Long-exposure night shot of a Tokyo street with blurred light trails, passing cars and reflections on wet asphalt. Slightly surreal vibe with glowing signs and ghosted silhouettes of people.
Неоновый стиль (лого)
Stylized glowing logo of a pink cat face with sunglasses on a dark futuristic background. Cyberpunk neon vibe, minimal vector shape, deep blue and black shadows, perfect for a video game interface.
Пиксель-арт
Colorful pixel-art illustration of an old haunted mansion on a hill under the moonlight. Blocky textures, retro 8-bit style, spooky trees, glowing windows, and tiny animated bats in the sky.
Иллюстрация в духе фэнтези-карты
A hand-drawn fantasy map of a mythical land with mountains, rivers, forests and medieval castles. Old parchment background, isometric top-down view, stylized icons and fantasy typography.
Пластилиновый монстр
a goofy monster made of clay, plasticine texture, colorful, ((handmade look)), kid-friendly design, on a white background, stop-motion style, soft lighting
Промты — это язык общения с нейросетью. От того, как ты сформулируешь запрос, зависит всё: и композиция, и стиль, и точность картинки. Если ты графический дизайнер, иллюстратор или просто хочешь визуализировать идеи — освоение промтов даст тебе невероятную свободу.
- Научим создавать логотипы, дизайн упаковки, фирменный стиль, рекламные баннеры, айдентику
- Дадим безлимитную обратную связь по учебным и реальным проектам
- Подарим 2 курса: нейросети и английский для дизайнеров
Краткое содержание
Что такое промт и зачем он нужен?
Промт — это текстовое описание для нейросети, по которому она создаёт изображение. Чем точнее его составить, тем лучше будет результат.
Как составить короткий, но понятный промт для Стейбл Дифьюжн?
Начни с объекта → добавь детали → уточни стиль, освещение, прочие детали.
Что такое Stable Diffusion и чем она крута?
Это открытая нейросеть для генерации изображений. Работает офлайн, гибкая, понятная, не требует подписки, поддерживает кучу кастомных моделей. Идеальна для дизайнеров, художников.