[svoboda] Алгоритм компании DeepMind превзошел почти всех игроков в StarCraft II

Здравствуйте, свобода.
Разработчики из компании DeepMind (входит в состав владеющего Google
холдинга Alphabet) сообщили, что их алгоритм AlphaStar, разработанный для
игры в StarCraft II, вошел в число грандмастеров, поскольку занял место
среди 0,15% лучших игроков на европейских серверах. Статья об этом
достижении была опубликована в журнале Nature.
Как пишет N+1, алгоритму удалось обыграть свыше 99,8% геймеров из почти 90
тыс. официально зарегистрированных на европейских серверах, причем побед
алгоритм добивался в играх против всех трех рас. И хотя самых сильных
игроков программа одолеть не смогла, ее результаты позволяют присвоить
AlphaStar звание грандмастера.
"Меня очень впечатлил стиль игры AlphaStar. Она очень умело оценивает свою
стратегическую позицию и точно знает, когда должна вступить в сражение с
соперником, а когда стоит отступить. При этом я не чувствовал, что играл со
сверхчеловеком, которого в принципе нельзя превзойти. Мне казалось, что мне
противостоит реальный человек", - приводит ТАСС комментарий одного из
ведущих игроков в Starcraft II Дарио Вюнша.
Для обеих частей StarCraft уже давно разрабатываются боты, но до появления
AlphaStar таким алгоритмам не удавалось победить человека. Основная
сложность обучения программ для этих игр заключается в том, что они
представляют собой стратегии в реальном времени, в которых часть информации
закрыта, а игрокам нужно решать большое количество задач одновременно.
Ранее в DeepMind уже пытались создать алгоритм для игры в StarCraft II, но
те попытки не увенчались успехом. В процессе разработки AlphaStar в DeepMind
использовали метод глубокого обучения с подкреплением, а также обучение с
учителем. В качестве тренировочного датасета разработчики использовали
предоставленные компанией Blizzard анонимизированные записи игр настоящих
людей. Когда обученная на этих играх нейросеть научилась побеждать
встроенные алгоритмы StarCraft II на самой высокой сложности в 95% случаев,
создатели заставили программу играть с самой собой в течение двух недель.
При этом разработчики ограничили скорость реакции AlphaStar таким образом,
что скорость его управления была сравнима с реальными игроками.
В январе этого года стало известно, что AlphaStar смогла всухую обыграть
двух профессиональных игроков в StarCraft II в сериях из пяти матчей. На
организованном в Лондоне турнире AlphaStar сперва выиграла пять матчей из
пяти против геймера под ником TLO (Дарио Вунш, Германия), а затем другая
версия нейросети пять раз подряд победила игрока MaNa (Гжегож Коминч,
Польша).
Напомним, в июле прошлого года в DeepMind смогли обучить программу под
названием For The Win играть в Quake III Arena не хуже настоящих геймеров