В последнее время появилось множество нейросетей, например, для генерации картинок. Однако даже беглый просмотр показывает, что это совсем не то, что нужно человечеству.
Нейросети пока неспособны сгенерировать сложную сцену, не позволяют сделать серию изображений про одного персонажа.
Что самое смешное, сделать всё это без использования нейронных сетей совсем несложно.
В простейшем варианте нужно просто накладывать двухмерных персонажей из запроса на двухмерный сгенерированный фон. Это не идеальное решение (например, не будет теней от людей, поворот персонажей невозможно изменить), но оно позволяет создать программу очень быстро и она не требует сложного программирования.
Но более разумный вариант - 3d-графика. То есть берём трёхмерную сцену (достаточно небольшого количества вариантов, так как положение, угол и освещение можно менять) и добавляем туда 3d-персонажей. Так как стандартный вариант из 3d-редакторов уже умеет стоять, сидеть и лежать, а также брать в руки любое оружие, надевать броню и одежду, то число комбинаций почти безгранично.
Однако это решение требует полноценного игрового движка. Его написать совсем не так просто, как манипулировать 2d-объектами, но реально. В крайнем случае, программу можно создать в качестве плагина для игрового движка, например, Unreal Engine. Но это потребует договора с этой компанией, а так же возникнет сильная зависимость от Unreal.
Однако все эти вопросы вполне решаемы.
Почему вместо простейшего и универсального решения используются нейросети мне не совсем понятно.