Что такое Midjourney и как ею пользоваться: возможности, ограничения и практические сценарии

Опубликовано: 18 Июля, 2023
Что такое Midjourney и как ею пользоваться: возможности, ограничения и практические сценарии

1) Введение

Midjourney — это генеративная система, которая создаёт изображения (и, в ряде режимов, короткие видео) по текстовому описанию. На практике Midjourney используют как инструмент для быстрого прототипирования визуальных идей: иллюстраций, концепт-арта, обложек, рекламных креативов, фонов, moodboard-ов, стилизаций.

Ключевое отличие от графических редакторов (Photoshop, Illustrator и т. п.) — Midjourney не “редактирует пиксели руками пользователя”, а генерирует картинку по запросу (prompt) и набору управляющих параметров. Управление здесь устроено не через слои и кисти, а через итерации: “сформулировал → получил варианты → уточнил → усилил/ослабил стиль → добился результата”.


2) Что такое Midjourney с технической точки зрения

Midjourney относится к классу генеративных моделей: система обучена на больших массивах изображений и связанных с ними описаний и умеет синтезировать новые изображения по заданному тексту.

Практически важно понимать две вещи:

  1. Midjourney работает вероятностно. Даже при одинаковом запросе результат может отличаться, если не фиксировать параметры повторяемости (например, seed).

  2. Midjourney интерпретирует запрос как набор “сигналов” о содержании, стиле и композиции. Если запрос конфликтует сам с собой (например, “минималистичный детализированный кадр” без уточнений), результат будет непредсказуемее.


3) Где работает Midjourney: Discord и веб-интерфейс

Midjourney можно использовать двумя базовыми способами:

  • В Discord через команды бота (классический способ).

  • В веб-интерфейсе через строку генерации (Imagine bar) и панель настроек.

Оба пути ведут к одной логике: запрос → сет из вариантов → увеличение (upscale) / вариации → итерации.


4) Быстрый старт: первые шаги без лишней теории

4.1. Старт через веб-интерфейс

  1. Войти в аккаунт Midjourney и выбрать тариф (без подписки генерации обычно недоступны).

  2. Перейти на страницу создания (Create).

  3. Ввести запрос в поле генерации (Imagine bar) и отправить.

  4. Получить сет вариантов, выбрать лучший и:

    • увеличить (upscale),

    • сделать вариации (variations),

    • применить кадрирование/панорамирование (в зависимости от доступных инструментов),

    • уточнить запрос и повторить.

4.2. Старт через Discord

  1. Открыть Discord и зайти в канал, где есть доступ к Midjourney Bot.

  2. В поле ввода набрать /imagine.

  3. Вставить текстовый prompt.

  4. Дождаться результата и выбрать действия кнопками под сетом (увеличение, вариации и др.).


5) Основные команды в Discord: что реально нужно новичку

Ниже — команды, которые закрывают 90% повседневного использования:

  • /imagine — сгенерировать изображение по запросу.

  • /settings — открыть и настроить дефолтные параметры генерации (версия модели, стилизация, скорость и т. п.).

  • /describe — загрузить картинку и получить несколько примерных промптов, которые могли бы дать похожий результат.

  • /blend — смешать несколько изображений (быстрый способ получить композиционную “среднюю”).

  • /info — посмотреть информацию по аккаунту и очереди задач.

  • /fast, /relax, /turbo — переключение режимов расхода GPU и скорости генерации (зависит от тарифа).

  • /prefer remix — включить/выключить Remix Mode (важно для управляемых вариаций).

  • /shorten — “сжать” длинный запрос и получить подсказки, что можно упростить.

Отдельно полезно знать:

  • /stealth и /public — режим приватности результатов на сайте (обычно доступно только на старших тарифах).


6) Как устроен цикл работы: prompt → варианты → закрепление результата

Типовой рабочий цикл выглядит так:

  1. Черновая генерация
    Цель — поймать композицию и общий стиль. Здесь полезны умеренные значения stylize и небольшой chaos.

  2. Выбор удачного варианта
    Оценка: композиция, силуэт, свет, стилистика, “настроение”, читаемость.

  3. Увеличение (Upscale)
    Делает выбранный вариант более пригодным к использованию и последующей доработке.

  4. Вариации (Variations)
    Сохраняют идею, но предлагают отличия (детали, поза, материалы, цвет, окружение). Вариации — основной инструмент итеративного “дожима”.

  5. Точная настройка параметров
    Если результаты “слишком художественные” — снизить stylize или включить raw.
    Если варианты “слишком похожи” — повысить chaos.
    Если надо повторить направление — фиксировать seed.


7) Параметры Midjourney: как управлять результатом без магии

В Midjourney параметры добавляются в конце промпта через двойное тире --. Важно соблюдать формат:

  • параметры ставятся после текста запроса;

  • между текстом и параметрами нужен пробел;

  • без лишней пунктуации в параметрах.

Ниже — наиболее практичные параметры (и несколько продвинутых, которые часто нужны в реальной работе).

7.1. Таблица ключевых параметров

Параметр Что делает Когда применять
--ar (aspect ratio) Соотношение сторон изображения Под формат: 1:1, 16:9, 9:16, 4:5 и т. п.
--s (stylize) Сила художественной стилизации (по умолчанию 100; диапазон 0–1000) Низко — ближе к запросу; высоко — больше “артовости”
--c (chaos) Разброс вариантов (0–100) Низко — стабильность; высоко — больше разнообразия
--q (quality) Детализация/время обработки Если важны детали и есть бюджет времени/GPU
--seed Фиксирует “случайность” для воспроизводимости Чтобы повторять направление и сравнивать правки
--no Негативные требования (“что исключить”) Убирать текст, логотипы, лишние объекты, артефакты
--raw Raw Mode: меньше “авто-стилизации”, больше буквального следования запросу Когда нужен контроль и точное соответствие
--v Выбор версии модели Если требуется поведение конкретной версии
--tile Бесшовный паттерн Для фонов, текстур, повторяющихся узоров
--r (repeat) Генерация нескольких сетов по одному запросу Быстро “настрелять” больше вариантов
--draft Черновая генерация (в V7 — дешевле по GPU) Быстрый поиск композиции и идеи
--weird “Странность”/эксцентрика Для сюрреализма и нетиповых образов
--iw Вес входного изображения (image prompt weight) Когда используете изображение как основу/референс
--sref Style Reference: перенос стиля с референса Когда нужен похожий “почерк”/визуальный язык
--sv Версия механизма Style Reference Для точного контроля поведения sref
--sw Сила влияния Style Reference Если стиль “давит” или, наоборот, слабый
--oref Omni Reference: референс персонажа/объекта (в актуальных версиях заменяет character reference) Для согласованности персонажа/объекта между сценами

7.2. Параметры для видео (если используете video-генерацию)

В Midjourney есть режим, где из одного изображения/кадра создаётся короткое видео (типично около 5 секунд). Для видео применяются специальные параметры:

  • --motion low / --motion high — интенсивность движения.

  • --loop — сделать зацикливание.

  • --end — задать конечный кадр (логика зависит от режима).

  • --bs — batch size (сколько вариантов видео генерировать за раз).

  • --raw — применимо и к видео-пайплайну (в зависимости от режима).


8) Как писать промпты: структура, которая даёт управляемый результат

8.1. Рабочий шаблон промпта

Удобный порядок (не обязательный, но дисциплинирует):

  1. Сюжет/объект: кто/что в кадре

  2. Контекст: где находится, что происходит

  3. Композиция и камера: крупность, ракурс, “объектив”, перспектива

  4. Свет: источник, характер (мягкий/жёсткий), время суток

  5. Материалы и фактуры: металл, стекло, ткань, дерево, кожа

  6. Стиль: иллюстрация, реализм, 3D, постер, минимализм и т. п.

  7. Ограничения через --no и параметры управления

8.2. Примеры промптов (как “скелет”, без ссылок)

1) Реалистичный предметный кадр

product photo of a matte black wireless mouse on a neutral studio background, softbox lighting, shallow depth of field, clean composition, high detail --ar 4:5 --s 100 --c 10 --q 1

2) Иллюстрация для статьи

editorial illustration of a person analyzing charts on multiple screens, minimal color palette, clear silhouette, modern flat shading, clean background --ar 16:9 --s 250 --c 15 --no text

3) Концепт-арт окружения

abandoned research station in arctic tundra, dramatic overcast sky, cold color grading, cinematic wide shot, atmospheric fog, high detail --ar 21:9 --s 300 --c 20

4) Сюрреализм (контролируемо)

surreal portrait of a dancer made of origami paper, studio spotlight, high contrast, smooth background, elegant pose --ar 2:3 --s 400 --weird 200 --c 25

8.3. Типовые ошибки промптов

  • Слишком общо: “красивая картинка, супер качество”. Без объекта, сцены и ограничений это почти неуправляемо.

  • Конфликтующие требования: “минимализм” + “очень много деталей” без приоритетов.

  • Перегруз деталями на старте: лучше найти композицию в черновике, а затем уточнять.

  • Ожидание “идеального текста на изображении”: генеративные модели часто ошибаются в типографике и надписях; если нужен точный текст — обычно проще добавлять его отдельно в редакторе.


9) Как улучшать результат итерациями: практическая методика

9.1. Метод “от общего к частному”

  1. Первый запрос — только ключевое: объект + сцена + стиль + формат (--ar).

  2. Второй шаг — уточнить свет/камеру/материал.

  3. Третий — бороться с дефектами через --no и корректировки параметров.

9.2. Управление разнообразием и “послушностью”

  • Нужно больше разнообразия: повышать --c (chaos).

  • Нужно больше соответствия тексту: снижать --s и/или включать --raw.

  • Нужно много вариантов быстро: --draft и/или --r (repeat).

9.3. Повторяемость: как “не потерять удачную дорожку”

  • Фиксировать --seed на удачном направлении.

  • Менять только один фактор за итерацию (например, свет или материалы), иначе сложно понять, что повлияло.


10) Референсы: стиль, персонажи и согласованность результата

10.1. Style Reference (--sref)

Если нужно выдержать единый визуальный язык (цвет, контраст, “пластика”, тип освещения), используют Style Reference. Логика простая:

  • берёте изображение-референс (как файл/источник),

  • подключаете его как style reference,

  • регулируете силу влияния параметрами --sw и выбором версии --sv.

Практический принцип:

  • если стиль “слишком доминирует” и ломает содержание — уменьшать --sw или усиливать текстовый промпт;

  • если стиль “не прилипает” — увеличивать --sw и убирать конфликтующие стилистические слова из текста.

10.2. Omni Reference (--oref)

Omni Reference используют, когда нужно, чтобы персонаж или объект сохранял узнаваемые особенности между разными генерациями (условная “консистентность”). Это полезно для:

  • серии иллюстраций с одним героем,

  • продуктовых креативов с одним объектом,

  • повторяемых ассетов.

Ограничение: идеальной “один-в-один” консистентности ждать не стоит; генеративная модель стремится к похожести, а не к точному копированию.


11) Практические сценарии использования (и как под них настраивать)

11.1. Иллюстрации для статей и блогов

Цель: понятная композиция, читаемый силуэт, минимум лишнего.

  • чаще полезно --ar 16:9 или --ar 4:5;

  • умеренная стилизация --s 150–350;

  • ограничить текст на картинке: --no text.

11.2. Обложки и постеры

Цель: сильная композиция, контраст, “плакатность”.

  • выше stylize;

  • можно увеличить chaos на этапе поиска идей, затем снижать;

  • заранее планировать место под заголовок (в промпте просить “empty space at top” и т. п.).

11.3. Рекламные креативы и product-visuals

Цель: “чистый” кадр, контролируемый фон, реалистичные материалы.

  • чаще включают --raw;

  • stylize умеренно или низко;

  • обязательно фиксировать формат и композицию.

11.4. Moodboard и концепт-арт

Цель: много разнообразных направлений.

  • --c выше среднего;

  • --r (repeat) для пачки сетов;

  • --draft на первом проходе.

11.5. Паттерны и фоны

  • --tile для бесшовности;

  • промпт максимально “материальный”: узор, фактура, масштаб.


12) Подписки и режимы скорости: что важно понимать до начала работы

Midjourney использует подписки с различиями по:

  • Fast GPU time (приоритетное время генерации),

  • наличию Relax Mode (медленнее, но без расхода fast-лимита для изображений на ряде тарифов),

  • доступу к Stealth Mode (приватность результатов на сайте),

  • возможностям генерации видео в разных режимах.

Базовая логика тарифов (в общих чертах):

  • существует несколько уровней подписки (например, Basic/Standard/Pro/Mega);

  • на старших тарифах доступнее безлимитные генерации в Relax Mode и приватность (Stealth);

  • видео обычно “дороже” по GPU, а режимы видео зависят от тарифа.

Если цель — иногда генерировать иллюстрации, обычно достаточно базового уровня. Если цель — постоянная генерация и серия итераций в рабочем процессе, чаще выбирают тарифы с Relax Mode и большим объёмом Fast GPU time.


13) Ограничения и типовые проблемы

13.1. Текст и типографика

Читаемый и точный текст на изображении — слабое место большинства генераторов. Даже если “вроде получилось”, при крупном использовании могут всплыть ошибки в буквах. Практика: генерировать изображение без текста и добавлять типографику отдельно.

13.2. Мелкие детали

В сложных сценах страдают:

  • пальцы/кисти,

  • мелкая механика (шестерёнки, разъёмы),

  • мелкий повторяющийся орнамент.
    Решение: упрощать кадр, усиливать контроль (raw, снижение stylize), делать несколько итераций, работать от крупного к частному.

13.3. Повторяемость персонажей

Даже с референсами консистентность не абсолютна. Лучший подход — фиксировать один удачный образ, затем строить вариации вокруг него, используя референсы и seed.

13.4. Юридические и этические риски

  • Избегать использования узнаваемых логотипов и брендовых элементов в коммерческих материалах без прав.

  • С осторожностью относиться к генерации “в стиле конкретного живого автора”, если это требуется для коммерции: даже при технической возможности это может быть конфликтно с точки зрения политики и практики рынка.


14) Плюсы и минусы Midjourney

Плюсы

  • Быстрый выход на визуальный результат без ручной отрисовки.

  • Итеративный подход: варианты/вариации позволяют “нащупать” удачную композицию.

  • Сильная стилизация и хорошая “художественная” выразительность при правильных настройках.

  • Гибкое управление через параметры (aspect ratio, stylize, chaos, raw и т. п.).

  • Поддержка референсов стиля и (в актуальных режимах) согласованности персонажа/объекта.

Минусы

  • Вероятностная природа: результат не гарантирован “с первого раза”, итерации неизбежны.

  • Ограничения по тексту, мелким деталям и точным техническим чертежам.

  • Консистентность персонажей/объектов ограничена: похожесть достижима, точность — не всегда.

  • Для стабильного рабочего процесса почти всегда требуется подписка и понимание режимов GPU.

  • Финальный продакшн-результат часто требует постобработки (цвет, резкость, композиционная чистка).


15) FAQ

Нужен ли Discord, чтобы пользоваться Midjourney?

Не обязательно: есть веб-интерфейс, где можно генерировать через Imagine bar и управлять настройками. Discord остаётся удобным, если привычен командный формат и нужно работать в каналах.

Как получить нужный размер изображения?

Использовать --ar (соотношение сторон) под целевую площадку. Абсолютные пиксельные размеры обычно получаются через upscale и последующую подготовку под публикацию.

Как сделать “без текста”?

Использовать --no text и в промпте явно не просить надписи. Если текст нужен, лучше добавить его после генерации в редакторе.

Что делать, если Midjourney “не слушается” и уводит в другой стиль?

Снижать --s, включать --raw, уменьшать --c, убирать лишние стилистические слова из промпта и задавать более конкретные требования по сцене/камере/свету.

Как повторять удачный стиль и персонажа?

  • Стиль: --sref + настройка --sw и --sv.

  • Персонаж/объект: --oref и аккуратная итерация вокруг удачных вариантов, часто вместе с фиксированным --seed.