Красивая мраморная розетка в шапке статьи, правда? Конечно, можно заметить некоторые странности с лепестками розы, но в целом-то смотрится эффектно. Проблема одна — нейросеть уверяет, что это, якобы, хохлома.
Что, не похоже?
Вот и мне кажется, что не похоже.
Уже не первый месяц интернет-сообщество радуется или страдает (кто как), что вскоре компьютерные технологии смогут заменить художников. Те, кто радуются, уверяют, будто теперь легко смогут иллюстрировать любимые книжки, в том числе свои. Те, кто печалятся, говорят: "А как же душа?!"
Кто прав?
Никто. Пока что нет оснований ни для радости, ни для печали.
Почему?
Сначала давайте ответим на простой вопрос — может ли нейросеть (любая) творить?
Нет. Она может лишь по вашему запросу в разных пропорциях монтировать то, что уже существует. Собственно, именно поэтому в портретах, созданных нейросетями, вы так часто видите одни и те же лица.
Между прочим, ниже роза, которая, как уверяет нейросеть, выполнена в стиле иконописи.
Что — опять не похоже? Вот и я думаю, что это называется "резьбой по дереву".
Что нужно, чтобы нейросеть (любая) могла хотя бы адекватно монтировать изображение по вашим запросам?
Прежде всего, требуется загрузить в программу обширный толковый словарь — как специальные термины, так и обычные слова. Дальше необходима огромная база изображений: данные по анатомии (не только человека) и вообще по естествознанию, данные по истории (в том числе науки и искусства), данные практически по всем сферам жизни человека, в том числе образцы эмоций.
Возможно?
Теоретически.
Но что говорят два изображения розы, приведенные мною выше?
Что по крайней мере два понятия — хохлома и иконопись — даны в программе неверно.
На днях я протестировала крайне популярную сейчас нейросеть Кандинский 2.1, разработанную Сбером. На чем экспериментировала? Да на своих произведениях. Это называлось: "Создай иллюстрацию к собственной книжке".
Между прочим, нейросеть Кандинский предлагает множество стилей изображений:
-без стиля
-аниме
-детальное фото
-киберпанк
-Кандинский
-Айвазовский
-Малевич
-Пикассо
-Гончарова
-Классицизм
-Ренессанс
-Картина маслом
-Рисунок карандашом
-Цифровая живопись
-Средневековый стиль
-Советский мультфильм
-3D рендер
-Мультфильм
-Студийное фото
-Портретное фото
-Мозаика
-Иконопись
-Хохлома
-Новый год
Скажете: "Есть где разгуляться!".
Не обольщайтесь. Во-первых, не все стили соответствуют заявленному. Про хохлому я уже говорила. А во-вторых, далеко не всегда можно сделать серию изображений в одном стиле. Не все стили в равной степени понимают ваши запросы. Оказалось, что у нейросети крайне бедный словарный запас и очень низкий культурный уровень. Да-да, нейросеть не опознает то, что знает любой человек с 3 классами образования. С базами изображений тоже беда. Попробуйте сделать запросы на темы "Три мушкетера", "Одиссея капитана Блада", да хотя бы просто Московский Кремль... Результаты вас удивят.
А еще у Кандинского есть "стоп-слова", при использовании которых вы никогда не получите ничего похожего на свой запрос. Кстати, если вы используете в запросе слово "граф", то обязательно получите Дракулу, а не что-то иное.
Легче всего с помощью нейросети сделать портрет персонажа, хотя и тут возникают проблемы. Вот пожалуйста, сенатор Данкан, к которому угодил главный герой моего романа "Этот прекрасный свободный мир...".
Не правда ли, вы его уже видели?
И его внучка — замечательная Элизабет, она же Бетси — получилась очень и очень милой. Вот только с ее портретом возникли первые проблемы — оказалось, нейросеть очень плохо представляет, как выглядят женские шляпки. Да и нитка жемчуга на шее стала для Кандинского 2.1 очень сложным запросом. Видимо, данные по одежде и украшениям в программу тоже не загрузили.
Но представьте, какие проблемы возникают, если вы решите не ограничиться портретом, а показать персонажа в действии?
К примеру, сенатор Ричард Томпсон, родной племянник главного героя Роберта Шеннона, произносит речь с трибуны сената. Тут пришлось менять стиль изображения — потому что большинство стилей просто не понимало запроса, даже если я принималась писать объяснения в стиле общения с трехлетним ребенком. И вообще — не надейтесь, что вы можете получить одно и то же изображение в разных стилях. При абсолютно одинаковом запросе в разных стилях получаются разные картинки.
Труднее всего оказалось с главным героем — Робертом.
Мало того, что я решила сделать не просто портрет, программу вывело из равновесия пожелание, чтобы у персонажа была выбрита голова (такое требование в романе было в отношении питомцев).
Отсутствие волос программа принялась компенсировать деформацией черепа персонажа. К тому же по ходу дела у него периодически появлялись дополнительные пальцы и руки — да-да, в какой-то миг у него стало четыре руки. Что делать — данных по анатомии у Кандинского явно не хватает. Я стирала лишние руки и пальцы пять раз, пока программа не смирилась с нормальным количеством конечностей у Роберта Шеннона.
Точно так же для программы очень сложно было изобразить мольберт — это слово пришлось разъяснять, как разъясняют маленькому ребенку. Но программа все равно напортачила.
А вот изображение одной из картин персонажа, как ни странно, получилось почти сразу. Конечно, не совсем так, но близко:
цитата Художник решительно вытащил недавно купленный картон, поставил на стол — устанавливать мольберт не было времени — разложил кисти и краски, вытащил пару тряпок. Как там говорил дед? «Забудь эти безумные цвета»?
Сейчас он знал, что именно цвета и были его спасением — чистые, без полутонов, как ему хотелось писать еще в школе. Почему бы не попробовать прямо сейчас?
Роберт хотел сделать предварительный набросок углем, но вместо этого взялся за кисть. Он и так видел всю картину, словно бы стоял посреди главной улицы столицы Свободного мира: великолепие города, когда закатное солнце расцвечивает его самыми безумными красками, а в витрине магазина отражение родного лица в ореоле светлых волос…
Спросите: "И какой же вывод?!"
А вывод такой, что художником опасаться нечего. Тем же, кто хочет лично иллюстрировать любимые книжки, могу сказать, что им проще пойти и нарисовать все самостоятельно. По крайней мере, они не будут путаться с количеством пальцев, рук, ног, а временами и голов у персонажей.
Да, бывает, программа рисует по две головы на одном теле, а бывает и ни одной. И как-то ходят эти несчастные.
А еще программа не опознает известных людей. Если вы напишите в запросе "Президент Джон Кеннеди", вы не получите его изображение. Вы получите монтаж из всех изображений различных Кеннеди, а также актеров, которые их играли. Чуть ли не единственная знаменитость, которую Кандинский 2.1 опознал — это Наполеон, но и он получился карикатурным.
Зато как игрушка нейросеть Кандинский вполне себе на высоте.
Наслаждайтесь!
PS А вот так Кандинский ответил на запрос изобразить обычный огурец в средневековом стиле.