О Midjourney за последние дни не слышал наверно только ленивый. Нейросеть, генерирующая потрясающие не всегда по своей красоте арты заинтересовала очень многих. И так как в комментах к постам с ней люди часто спрашивают о том, как оно вообще что и где, то я решил запилить короткий как оказалось нет и понятный надеюсь гайд на эту тему.
Для начала, коротко о том, какие есть версии на данный момент:
1) Бесплатная пробная версия - вам доступно 25 условных gpu-минут работы нейросети, что по сути есть примерно 25 картинок на стандартном для нее качестве.
2) Платная подписка Basic Membership - 10$ в месяц, 200 минут gpu в месяц, что приблизительно равняется 200 картинкам, и доступ к пользовательским галереям + Бот в личных сообщениях, позволяющий работать с нейросетью не в публичных каналах
3) Платная подписка Standard Membership - 30$ в месяц, неограниченное личное использование, что по факту равно примерно 15 gpu-часам, после использования которых вам включат slow-мод, но не отберут возможность делать картинки. + тот же доступ к галереям и бот в личных сообщениях дискорда.
4) Коммерческая платная подписка Corporate Membership - 600$ в месяц. Я думаю, дальше продолжать нет смысла.
Для начала работы с нейросетью вам понадобятся:
Дискорд - нейросеть работает только через него. Качаем-регистрируемся если вы еще не: discord.com
Авторизация и инвайт на сервер в дискорде через сайт www.midjourney.com
Гугл/Яндекс переводчик или знание английского на уровне, достаточном для вас самих, дабы можно было писать осмысленные запросы того, что вы хотите увидеть.
Главная страница сайта состоит ровно из двух кнопок.
Кнопка Sign In with Discord связывает ваш дискорд аккаунт с личной страницей на сайте, где вы можете посмотреть все ваши работы, а так же получить доступ к публичной галерее с работами других людей.
Кнопка Join the Beta дает вам инвайт на дискорд сервер Midjourney, где и происходит вся нейромагия.
Итак, вы скачали дискорд, зарегистрировались на сайте и получили доступ к серверу Midjourney.
Теперь вам необходимо пробиться в один из каналов newbies# (иногда они не прогружаются из за нереальной нагрузки на них, все что можно сделать- просто подождать или попытаться перезапустить сам дискорд).
Генерация изображений происходит через команду /imagine которую вы выбираете во всплывающем меню чата, когда начинаете набирать /
Поле prompt стандартное и обязательно должно присутствовать в запросе, так что если вы случайно удалили его- пересоздайте запрос через / и всплывающее меню с командами чата.
В это поле и вводятся все параметры и описания генерируемого изображения.
Простой пример: /imagine prompt:Pikabu , где единственным описанием, которое мы дали нейросети является слово Pikabu.
После ввода описания вы отправляете это сообщение в чат, и ждете первый вариант результатов.
Начальных результатов генерации всегда 4. Они низкого качества и сгенерированы очень условно, для того что бы показать, какого результата стоит ожидать.
Под картинкой с результатами есть поле с кнопками.
Кнопки U 1-4 отвечают за выбор варианта картинки, который вы хотели бы улучшать дальше.
Кнопки V 1-4 отвечают за выбор варианта картинки, на основе которого вы хотели бы сгенерировать следующие 4 варианта.
Кнопка со значком обновления заставит нейросеть перегенерировать картинки с нуля, используя этот же запрос.
Кнопка Web отправляет изображение в вашу галерею на сайте.
Выбрав понравившийся вариант (к примеру U2) мы получаем улучшенное по качеству генерации и апскейленное изображение.
На выбор после этого нам даются три кнопки:
Make Variations - использовать это изображение как основу для генерации четырех новых вариантов
Upscale to Max - улучшить изображение до максимального качества
Light Upscale Redo - легкая перерисовка конкретно этого варианта.
В конечном итоге нам выдают готовую картинку, которую мы опять же можем слегка переделать с помощью команды Light upscale Redo или использовать как основу для следующих итераций через Make Variations.
Итоговый результат нашего Pikabu:
Небольшое дополнение: эмодзи-реакцией X (большой красный крест) можно удалить свою работу из чата и галереи.
По сути это все, что вам нужно знать для простого использования Midjourney.
Дальше немного сложнее.
Поле prompt условно делится на три части: [url - текст - настройки].
Про то, как работать с готовыми картинками, заставляя нейросеть опираться на них или перерисовывать- я углубляться не стану, лучше разберемся с базовыми настройками генерации.
Настройки добавляются после текстового описания и содержат в начале "--".
Короткий список для базового использования:
--w - Ширина изображения. Работает лучше, если число кратно 64 (или 128 для --hd)
--h - Высота изображения. Работает лучше, если число кратно 64 (или 128 для --hd)
--ar -Задает желаемое соотношение сторон вместо ручной настройки высоты и ширины с помощью --h и --w. Например, --ar 16:9, чтобы включить соотношение сторон 16:9
--no - Исключение чего-то. Например -no plants - будет пытаться нарисовать картинку без растений.
--q <number> - "качество" изображения в плане генерации. От 0.25 до 5. Базовое значение стоит на 1, а на 5 он будет делать каждую картинку минут 5.
--hd - Использует другой алгоритм, который потенциально лучше подходит для больших изображений, но с менее согласованной композицией. Лучше всего подходит для абстрактных и пейзажных запросов.
--stop Остановить генерацию раньше. Значения от 10 до 100
/settings - Открывает поле с упрощенными настройками генерации, качества, приватности и т.д
/prefer option set <name> <value> - создание личной настройки. Например "/prefer option set mine --hd --w 512" - сделает настройку --mine с опциями "высота картинки 512 и высокое разрешение". Т.е можно вбивать вместо кучи опций только название своей настройки.
Пример: /imagine prompt: Sea of darkness --ar 16:9 --hd
Формат картинки 16:9, высокое качество.
Результат:
Больше настроек, а так же о работе с url и балансировкой между генерацией по картинке и описанию, можно найти в гайде на сайте нейросети: midjourney.gitbook.io/docs/user-manual
Дополнение о платной подписке:
Все мы знаем, что оплатить подписку просто так на данный момент невозможно.
Но есть довольно простой способ, который я использовал потому что эта хрень реально наркоманская, не оторваться очень хотелось иметь побольше часов работы. На сайте платиру (не реклама, ищите где хотите на самом деле) я купил предоплаченную американскую карту с 30 баксами на счету (ищется по запросу Visa 30). Она подошла, подписка активировалась, я доволен и могу генерировать дичь столько, сколько захочу. Всем добра и КиберЛенина.