Я решил выложить в блог кусочек текста своего сценария (фантастической комедии "Марсианская проблема: жуши-муши бублик"). Он связан с инопланетянами и я захотел подобрать подходящую картинку.
Для начала я попробовал поисковые системы. Для этого я использовал запрос:
зелёнокожий учитель с булавой убивает зеленокожего тинейджера в марсианском классе.
Это действительно хорошо описывает сцену, но я не получил ни одной толковой картинки. Яндекс честно показывал зеленокожих людей, но сценку изобразить не смог.
Гугл вообще предложил заменить зеленокожих на чернокожих, а когда я настоял на своей версии, сказал, что у него нет вариантов.
Тогда я воспользовался нейросетями (Dall-E и Davinci). Запрос:
old man with green skin with mace beats teenager with green skin in the martian classroom.
Но и искусственный интеллект не помог. Всё сгенерированное отличалось от запрошенного, да ещё и имело артефакты.
И это при том, что сделать программу генерации картинок совсем просто, нужно только отказаться от нейросетей и просто честно накладывать объекты на окружение (лучше 3d, но и вариант с 2d тоже неплох).