Отправляет email-рассылки с помощью сервиса Sendsay

Юмор, кино и компьютеры

  Все выпуски  

Юмор, кино и компьютеры


Ужас нейросетей генерации картинок

Я решил выложить в блог кусочек текста своего сценария (фантастической комедии "Марсианская проблема: жуши-муши бублик"). Он связан с инопланетянами и я захотел подобрать подходящую картинку. Для начала я попробовал поисковые системы. Для этого я использовал запрос: зелёнокожий учитель с булавой убивает зеленокожего тинейджера в марсианском классе.

Это действительно хорошо описывает сцену, но я не получил ни одной толковой картинки. Яндекс честно показывал зеленокожих людей, но сценку изобразить не смог.  Гугл вообще предложил заменить зеленокожих на чернокожих, а когда я настоял на своей версии, сказал, что у него нет вариантов. Тогда я воспользовался нейросетями (Dall-E и Davinci). Запрос: old man with green skin with mace beats teenager with green skin in the martian classroom.

Но и искусственный интеллект не помог. Всё сгенерированное отличалось от запрошенного, да ещё и имело артефакты. И это при том, что сделать программу генерации картинок совсем просто, нужно только отказаться от нейросетей и просто честно накладывать объекты на окружение (лучше 3d, но и вариант с 2d тоже неплох).


В избранное