"С точки зрения современной науки, мозг представляет собой сложнейшую нейронную сеть, производящую и обрабатывающую огромное количество логически связанных электрохимических импульсов, а внутренний мир человека, в том числе его разум, является продуктом этой работы." Википедия
Если нейросеть, это всего лишь компьютерная программа, а ИИ - это условное обозначение, и она на самом деле не обладает разумом, и сама она говорит, что не имеет самосознания (парадокс?), то как ей удается создавать прекрасные произведения искусства? Как она вообще что-то может создавать?
Нейросети не смогли нарисовать Карлсона. Навыки распознавания и генерирования нейросетей не смогли осилить задачу по рисовке персонажа детской сказки Астрид Линдгрен Карлсона. Вместо привычного глазу "мужчины в самом расцвете сил" с пропеллером за спиной нейросети выдали серию абсурдных вариаций... Эксперты объясняют этот конфуз тем, что искусственному интеллекту неочевидна концепция мужчины с прикрепленным к спине пропеллером. Т.е. такого персонажа нейросеть не знает, а потому генерирует как бог на душу положит.
"Карлсон, который живет на крыше", от нейросети SDXL
Сгенерировать Карлсона было сложно. Его нейросети вообще плохо понимают. А со стимпанком - вообще не срастается. Либо Карлсон без стимпанка, либо стимпанк, но на Карлсона вообще не похоже. Впрочем, кое-что интересное, всё же получилось.
Сперва попробовала сгенерировать его в Midjourney. Запрос, как обычно в Midjourney, простой: «Карлсон, который живет на крыше, в стиле стимпанк» «Carlson Who Lives on the Roof, steampunk style»
"Карлсон, который живет на крыше" от Midjourney
Результат довольно странный, и не соответствующий замыслу. Похоже, персонаж Карлсон нейросети не знаком. Добавила более подробное описание:
"Карлсон, который живет на крыше, низенький толстяк с рыжими короткими волосами, штаны на лямках и пропеллер за спиной, как у маленького вертолета, дизайн персонажа в стиле стимпанк"
"Carlson who lives on the roof, a low fat man with red short hair, strappy pants and a propeller behind his back like a small helicopter, steampunk style character design"
Получилось такое:
"Карлсон, который живет на крыше - забавный летающий толстяк" от Midjourney
Чтобы добиться большего сходства, промпт пришлось немного усложнить, добавить уточнений:
«Карлсон, который живет на крыше, низенький забавный толстяк с рыжими короткими волосами, штаны на лямках и пропеллер за спиной, как у маленького вертолета, дизайн персонажа в стиле стимпанк --нет бороды, усов»
"Carlson Who Lives on the Roof, a low, funny fat guy with red short hair, strappy pants and a propeller behind his back like a small helicopter, steampunk style character design --no beard, mustache"
... а заодно, «познакомить» нейросеть с Карлсоном с помощью референса, найдя в сети подходящую картинку. Результаты уже ближе к замыслу. Заметьте, нейросеть не копирует ни стиль, ни композицию, ни внешность персонажа из референса, просто заимствует какие-то отдельные моменты, общее настроение, видимо.
Уже почти Карлсон. Пропеллер зачехлен.
Карлсон с маленьким пропеллером и большим мотором.
Карлсон с непонятным летательным ранцем вместо пропеллера
---
Несмотря на определенную изюминку полученных результатов, они меня не удовлетворили, так как я не вижу в них запрошенного стиля стимпанк. Я решила попробовать другую нейросеть – Stable Diffusion. Модель SDXL. Промпт пришлось соответственно переработать:
«a funny, jolly, young, fat, short man named Carlson, red hair, plaid shirt, strappy pants, who lives on the roof, flying through the air with a propeller attached to his back, steampunk style»
"смешной, веселый, молодой, толстый, невысокий человек по имени Карлсон, рыжие волосы, клетчатая рубашка, брюки на бретельках, который живет на крыше и летает по воздуху с пропеллером, прикрепленным к его спине, в стиле стимпанк".
Карлсон - отдельно, пропеллер - отдельно. Зато с настроением!
Результаты оказались гораздо интереснее! Некоторые вполне соответствуют характеру персонажа, как я его себе представляю, вспоминая книгу Астрид Линдгрен. И, хотя на рисунках по-прежнему отсутствует пропеллер, полученный персонаж похож на прототип и внешне, и по характеру, и уверенно держится в воздухе.
Результаты стали радовать! Теперь и Карлсон вполне симпатичный, и стиль стимпанк просматривается, как в аксессуарах персонажа, так и в окружении. Только пропеллер всё же пришлось генерировать отдельно и совмещать с основным изображением, применяя нейросетевые инструменты и фотошоп.
Карлсон в стиле стимпанк от Stable Diffusion - SDXL
Летящий Карлсон от Stable Diffusion - SDXL
---
Продолжила «прокручивать» генерации в SDXL, чтобы добиться большего соответствия замыслу. После нескольких "круток генерации" наконец-то появился настоящий Карлсон с пропеллером и в заданном стиле! Без референсов и фотошопа!
Летящий Карлсон от Stable Diffusion - SDXL
Теперь я вполне довольна результатом и считаю задачу выполненной.
Это было сложно, но интересно и весело!
Итоговый промпт: «a funny, jolly, young, fat, short man named Carlson, red hair, plaid shirt, strappy pants, who lives on the roof, flying through the air with a propeller attached to his back, frameless fan, rotating fan blades, against the sky, steampunk style / смешной, веселый, молодой, полный, невысокий человек по имени Карлсон, рыжие волосы, клетчатая рубашка, брюки на бретельках, который живет на крыше, летает по воздуху с пропеллером, прикрепленным к его спине, бескаркасный вентилятор, вращающиеся лопасти вентилятора, на фоне неба, в стиле стимпанк»
После серии американских мульт-персонажей "отрисованных" нейросетью в стиле стимпанк, захотелось проделать то же самое с отечественными мультами.
Чебурашка в стиле стимпанк
Крокодил Гена в стиле стимпанк
Старушка Шапокляк в стиле стимпанк
Картинки сгенерированы нейросетью Midjourney. Стиль, цвет и расположение надписи - от нейросети. Я только подобрала похожий шрифт, и воспроизвела надписи в более читабельном виде с помощью традиционных графических программ. Промпты простые, без подробных описаний. Видимо, "импортная" нейросеть немного знакома с "отечественными" персонажами мультфильма и/или книги Эдуарада Успенского.
Воспроизводить и тиражировать известных персонажей "как есть" - не интересно, всегда хочется сделать что-то новое, необычное. Поэтому, применила к Чебурашке и крокодилу Гене мой любимый стиль стимпанк. А заодно, и старушку Шапокляк "обновила".
Из множества предложенных нейросетью вариантов генераций, выбрала те, которые, на мой взгляд, наиболее соответствуют как исходным персонажам, так и запрошенному стилю. Не идеально конечно, но это лучшее, что мне удалось получить от Midjourney. Референсы не использовала.
Примерный промпт: "crocodile Gena in steampunk style"
Если кто-то думает, что можно лучше - я не спорю, пробуйте, генерируйте, и если у вас получится лучше, или интереснее, чем у меня - буду рада увидеть результат )