Алготрейдинг: Компьютер обыграет вас в покер (economics.fin.algotrading) : Рассылка : Subscribe.Ru

Подписаться Бесплатная новостная рассылка Подписчиков 1 RSS

Январь 2015 →
	1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

За последние 60 дней ни разу не выходила

Сайт рассылки: http://r-trader.ru
Открыта: 12-01-2015

Автор

Андрей Антонов

Статистика

1 подписчиков
0 за неделю

← Все выпуски →

Алготрейдинг: Компьютер обыграет вас в покер

Непревзойденная компьютерная программа, наконец, выиграла в покерную игру – лимитированный техасский холдем с двумя игроками. Ученые разработали компьютерную стратегию, названную Цефей, для игры, которая так близка к совершенству, что статистический анализ показывает, что человек не может ее обыграть ни при каких обстоятельствах, даже если он будет играть против компьютера на протяжении всей своей жизни. Это означает, что независимо от того, как начинается игра, компьютер все равно выиграет в долгосрочной перспективе, и это делает его непобедимым.

“Мы не говорим, что гарантирован выигрыш на каждой руке, – говорит Майкл Боулинг, ученый из Университета Альберты и соавтор исследования. – Мы хотим сказать, что в долгосрочной перспективе, при игре на все руки, компьютер должен сыграть либо без убытка, либо выиграть”.

Решение для игры в покер является огромным достижением в области разработки алгоритмов. Простые игры, такие как tic-tac-toe, легко решить. Большинство людей понимает как выиграть в эту игру, сыграв пару раз. Но есть и более сложные игры. Например, шахматы и шашки являются достаточно трудными и предлагают тысячи возможных сценариев того, как компьютеры должны реагировать. Тем не менее, даже для этих игр не так сложно найти решение, как для игры в покер, потому что в покере у вас нет полной информации – вы не знаете, какие карты держит ваш оппонент.

“Совершенные информационные игры, такие как шахматы или шашки, являются играми, где вся информация, которая вам необходима для принятия решений, хранится на виду, – говорит Боулинг. – Но в покере все не так, это несовершенная информационная игра, и этот факт делает разработку стратегии намного сложнее”.

Метод работы программы, на самом деле, довольно прост: все, что делается во время игры – это создается собственная база данных, предварительно вычисленных игровых ситуаций для нахождения наиболее оптимального хода в любой момент игры. Создание этой базы данных было далеко не тривиальной задачей. “У нас была фаза обучения, где программа начала играть против самой себя, это означает, что она не имела ни малейшего представления, что делает, кроме соблюдения правил игры”, – говорит Майкл Йохансон, ученый из Университета Альберты и один из разработчиков. Но по мере игры, программа работала все лучше и лучше и обновляла свою стратегию.

“Это означает, что нужно думать о всех возможных точках принятия решений и принимать всевозможные меры,- объясняет Боулинг.- Например, программа может подумать: что, если я подниму здесь, вместо того, чтобы играть в случайном порядке, больше или меньше денег я смогу выиграть?” Если она решает играть в случайном порядке и теряет деньги, то она возвращается и вычисляет, сколько денег она могла бы заработать, если бы все-таки подняла. Эта сумма затем хранится в виде значения сожаления. Так, программа вычисляет количество сожалений для каждого действия, чтобы затем принять решение. Таким образом, каждый раз, когда она играет руку, программа корректирует свою стратегию и начинает выполнять действия, о которых она пожалела, что не предприняла их в предыдущих играх. И так себя обновляя, программа приблизилась к тому, что по словам Боулинга является “совершенной стратегией”.

Период обучения составлял 70 дней на 200 компьютерах, каждый из которых был оснащен 32 Гб оперативной памяти и 24-мя ядрами. По прошествии этих 70-ти дней программа играла практически идеально. “Мы могли бы продолжить обучение, и программа могла бы стать еще лучше,- говорит Боулинг.- Но мы остановились на этом этапе, потому что мы все равно не сможем сделать ее совершенной. И даже если программа будет обучаться всю жизнь, становясь все более и более совершенной, это все равно не будет иметь большого значения, кроме научной новизны”. Короче говоря, дальнейшее обучение Цефей не приведет к каким-либо существенным изменениям.

Программа также продемонстрировала, что игрок, который раздает карты, и следовательно, играет вторым имеет крошечное преимущество над другим игроком. “На самом деле, мы можем доказать, что дилер имеет преимущество, которое мы называем 88 милиблайндов за игру, – говорит Йохансон.- Это 0,88 большого блайнда в игре”.

Это крупнейшая несовершенная информационная игра, которая решена на сегодняшний день.

11 лет покера

Майкл Боулинг входит в группу исследователей, которые приступили к созданию программы в 2003 году. Тогда они были далеки от понимания, и вряд ли кто-то действительно верил в то, что удастся решить эту проблему. Они работали над разработкой программы, которая смогла бы обыграть лучших игроков в heads-up лимитированном покере, самой простой игре в покер один на один. И в 2008 году они ее реализовали. Эта программа называется Polaris, ее улучшенная версия выиграла три из шести игр. Она пыталась воспользоваться преимуществом человеческих слабостей. Цефей этого не делает, новая программа пытается играть совершенно и не адаптироваться к своим противникам.

После Polaris Боулингу и его команде пришлось принять решение о том, что делать дальше. Они решили создать программу для более сложной покерной игры – лимитированного техасского холдема. После предварительных расчетов выяснилось, что нужно около 4-х петабайт дискового пространства (1 млн. гигабайт) просто для того, чтобы записать решение. Майкл Боулинг колебался, но другие исследователи настаивали, в конце концов, покупка петабайта дискового пространства была возможна. Но столько не понадобилось, и они обошлись 520 терабайтами. Они научились сжимать данные, и программа стала работать намного быстрее.

Теперь, когда решение для лимитированного техасского холдема в версии с двумя игроками найдено, разработчиков интересуют другие виды покера, в частности, безлимитный heads-up. Они, вероятно, не смогут решить проблему целиком, но смогут написать программу, которая сможет обыграть лучших в мире игроков. То же самое касается игры лимитированного техасского холдема с тремя игроками. Там нет никакой конкретной стратегии, так как нет гарантий избежать потерь, потому что два игрока могут объединиться против третьего. Сговор является незаконным, но это трудно определить. Некоторые люди могут делать это, даже не осознавая. Тем не менее, когда испытывали Цефей против двух других компьютеров, программа выдала неплохие стратегии. Но пока рано говорить, насколько они оптимальны.

В конечном счете, Цефей может быть использован не только для игры в покер. Программа может помочь правительству или компаниям оптимизировать свои стратегии для служб безопасности, создать график для патрульного катера или оптимизировать работу контрольно-пропускных пунктов, чтобы сбить с толку противника, который попытается использовать стратегию защиты. Программа также может быть использована для назначения лечения для больных сахарным диабетом. Если их рацион или уровень активности изменяется, то программа может найти оптимальное решение с учетом любого количества неопределенностей.

“Я заинтригован всем этим, – говорит Боулинг. – И очень хочу увидеть применение этой программы за пределами покерного пространства. У меня не хватает терпения, чтобы играть в покер. Я нахожу это занятие скучным”. Ученый только один раз играл в покер за последний год. “Единственный раз, когда я играл в покер в течение последних 12 месяцев, это когда я проверял интерфейс текущей версии программы. Я играл около 100 рук”.

Попробовать свои силы в игре в покер против Цефей можно на сайте Университета Альберты

В избранное

{#template MAIN} <div id="loginForm" style="display:none;" class="subscriberu_popup"> <div class="popup_register"> {#include js_tmpl_auth_reg_tab} {#if $P.login_register_tab == 1} <form class="authentication-form" method="post" action="/MEMBERLOGIN_authen_cred"> <dl class="rg_block_options"> <dt id="js_tap_panel_auth"> <h1>Войти на сайт</h1> {* {#include js_tmpl_auth_reg_button} *} {#include js_tmpl_auth_reg_action} <hr class="logreg_line noPhones"> <div class="logreg_descr noPhones"><p>{#include js_tmpl_auth_reg_descr} </p></div> <div class="logreg_advice noPhones"> Если вы еще не с нами, то начните с <a href="#" onclick="rgNav('js_tab_reg');return false;" class="dashed" data-func="registr">регистрации</a> </div> <br><br> <a class="dashed auth-enter" href="/manage/author/"><b>Вход для авторов</b></a> </dt> </dl> </form> {#/if} {#if $P.login_register_tab == 2} <div class="rg_block_options"> <div id="js_tap_panel_auth"> <h1>Регистрация</h1> <div class="social_reg"> {* <div class="rg_description">{#include js_tmpl_soc_auth_reg_descr}</div> *} {#include js_tmpl_auth_reg_soc} <div class="rg_soc_auth_agree">{#include js_tmpl_auth_reg_agree}</div> </div> <div class="subscribe_reg"> {* <div class="rg_description"> #include js_tmpl_auth_reg_descr </div> *} {#include js_tmpl_auth_reg_action} </div> {* {#include js_tmpl_auth_reg_button} *} <div class="clr"> </div> <hr class="logreg_line noPhones"> <div class="logreg_descr noPhones">{#include js_tmpl_auth_reg_descr} {#include js_tmpl_soc_auth_reg_descr} </div> </div> </div> {#/if} </div> {* <div class="gray_bg register_shadow"></div> *} </div> {#/template MAIN} {#template js_tmpl_auth_reg_tab} <ul class="rg_nav"> <li id="js_tab_auth" class="{#if $P.login_register_tab == 1} rg_active_nav {#/if} rg_first_nav"><a onclick="rgNav('js_tab_auth');return false;" href="">Вход на сайт</a></li> <li id="js_tab_reg" class="{#if $P.login_register_tab == 2} rg_active_nav {#/if}"><a onclick="rgNav('js_tab_reg');return false;" href="">Регистрация </a></li> </ul> <span onclick="hidebo();" class="rg_closed"> </span> {#/template js_tmpl_auth_reg_tab} {#template js_tmpl_auth_reg_action} {#if $P.login_register_tab == 1} {#include js_tmpl_auth_reg_soc} {#/if} <div class="rg_forms"> <input type="hidden" id="login_register_destination" value="{$P.login_register_destination}"/> {#if $P.login_register_tab == 1} <div class="rg_for_input"> <span class="rg_text_inner">E-mail или код подписчика</span> <input id="credential_0" class="js_keydown_selector rg_input_text" data-js_submit="no" data-js_next_input_name="credential_1" name="" type="text" /> </div> <div class="rg_for_input"> <span class="rg_text_inner">Пароль</span> <input id="credential_1" class="js_keydown_selector rg_input_text" data-js_submit="yes" data-js_action="js_loginFormBut" name="" type="password" onkeyup="showAttention(this,!!window.event.shiftKey)" /> <span class="pswd_attention" id="attention_pswd"> <span class="icon_attention"></span> <span class="pswd_attention-text" id="attention-text_pswd1">Русская раскладка клавиатуры!</span> <span class="pswd_attention-text" id="attention-text_pswd2">У вас включен Caps Lock!</span> <span class="pswd_attention-text" id="attention-text_pswd3">У вас включен Caps Lock и русская раскладка клавиатуры!</span> </span> </div> <div class="rg_for_input input-alien"> <span class="chk noPhones"><input id="chk_alien" name="" type="checkbox" /></span><label for="chk_alien" class="noPhones"> Чужой компьютер</label> <a class="forgot_pass" href="/member/totalrecall">Забыли пароль?</a> </div> <div class="rg_for_input"> <em id="auth_msg" class="reg_error"></em> <input id="lf_typeauthid" value="email" type="hidden"> <input type="submit" class="button button-red logreg_submit" id="js_loginFormBut" value="Войти">  <div class="loading loading-cover" style="display: none;"><div class="loader"></div></div> </div> {#/if} {#if $P.login_register_tab == 2} <div class="rg_for_input"> <span class="rg_text_inner">E-mail</span> <input id="arfemail" class="js_keydown_selector rg_input_text" name="" type="text" data-js_submit="yes" data-js_action="js_regFormBut"/> </div> <div class="rg_for_input rg_set_lineh rg_for_input_wide"> <label class="js_tap_panel_checkbox"> <span class="chk"><input name="" id='js_tap_panel_checkbox_terms' type="checkbox" data-js_submit="yes" /></span> Я ознакомился и согласен с <a class="link_txd logreg_accLink" href="/faq/vereinbarung.html">условиями сервиса Subscribe.ru</a> </label> <br /> <label class="js_tap_panel_checkbox"> <span class="chk"><input name="" id='js_tap_panel_checkbox_personal' type="checkbox" data-js_submit="yes" /></span> Нажимая на кнопку "Готово!", я даю <a class="link_txd logreg_accLink" href="/faq/persverordnung.html">согласие на обработку персональных данных</a> </label> </div> {* <div style="float: left;position: absolute;left: 11em;"> <img src="http://www.kupivip.ru/images/vip/logo.png?1604" style="width: 86px; vertical-align: middle;display: block;"> </div> <div class="rg_for_input rg_set_lineh"> <label class="js_tap_panel_checkbox"><input name="" id="js_tap_panel_checkbox_kupivip" type="checkbox" data-js_submit="yes"> Я хочу получать новости о скидках на одежду</label> </div> *} <div class="rg_for_input"> <em id="reg_msg" class="reg_error rg_for_input_wide"></em> <em id="reg_msg2" class="reg_error rg_for_input_wide"></em> <input id="rf_typeauthid" value="email" type="hidden"> <a class="button button-red logreg_submit" id="js_regFormBut" href="#">Готово!</a> <div class="loading loading-cover" style="display: none;"><div class="loader"></div></div> </div> {#/if} </div> {#/template js_tmpl_auth_reg_action} {#template js_tmpl_auth_reg_agree} <div class="rg_for_input rg_set_lineh rg_for_input_wide"> <label class="js_tap_panel_checkbox"> <span class="chk"><input name="" id='js_tap_panel_checkbox_terms_reg' type="checkbox" data-js_submit="yes" /></span> Я ознакомился и согласен с <a class="link_txd logreg_accLink" href="/faq/vereinbarung.html">условиями сервиса Subscribe.ru</a></label> <em id="reg_msg_soc" class="reg_error rg_for_input_wide"></em> </div> {#/template js_tmpl_auth_reg_agree} {#template js_tmpl_auth_reg_button} <div class="rg_butons_socials"> {#if $P.login_register_tab == 1} <a class="rg_btn_soc rg_bs_01 js_tap_panel_selector" action="auth_email" href="#"><span><i></i>Email</span></a> <a class="rg_btn_soc rg_bs_01 js_tap_panel_selector" action="auth_openid" href="#"><span><i></i>OpenID</span></a> <a class="rg_btn_soc rg_bs_02 js_tap_panel_selector" action="auth_vkontakte" href="#"><span><i></i>Вконтакте</span></a> <a class="rg_btn_soc rg_bs_02 js_tap_panel_selector" action="auth_mailru" href="#"><span><i></i>Mail.Ru</span></a> {#/if} {#if $P.login_register_tab == 2} <a class="rg_btn_soc rg_bs_01 js_tap_panel_selector" action="reg_email" href="#"><span><i></i>Email</span></a> <a class="rg_btn_soc rg_bs_01 js_tap_panel_selector" action="reg_openid" href="#"><span><i></i>OpenID</span></a> <a class="rg_btn_soc rg_bs_02 js_tap_panel_selector" action="reg_vkontakte" href="#"><span><i></i>Вконтакте</span></a> <a class="rg_btn_soc rg_bs_02 js_tap_panel_selector" action="reg_mailru" href="#"><span><i></i>Mail.Ru</span></a> {#/if} </div> {#/template js_tmpl_auth_reg_button} {#template js_tmpl_auth_reg_descr} {#if $P.login_register_tab == 1} Для оформления подписки на выбранную рассылку, работы с интересующей вас группой или доступа в нужный вам раздел, просим авторизоваться на Subscribe.ru {#/if} {#if $P.login_register_tab == 2} Для регистрации укажите ваш e-mail адрес. Адрес должен быть действующим, на него сразу после регистрации будет отправлено письмо с инструкциями и кодом подтверждения. {#/if} {#/template js_tmpl_auth_reg_descr} {#template js_tmpl_soc_auth_reg_descr} Или зарегистрируйтесь через социальную сеть. {#/template js_tmpl_soc_auth_reg_descr} {#template js_tmpl_auth_reg_soc} <div class="rg_soc"> {#if $P.login_register_tab == 1} <a onclick="return _checkSocConfirm(event)" href="https://oauth.vk.com/authorize?client_id=3954260&scope=wall,offline,photos,groups,video,audio,email&redirect_uri={location.protocol+'//'+location.host}/member/login/vk/&response_type=code&v=5.15" class="login_register_vk_button"> <span class="login_register_vk_icon"></span> </a> {#/if} {#if $P.login_register_tab == 2} <a onclick="return _checkSocConfirm(event)" href="https://oauth.vk.com/authorize?client_id=3954260&scope=wall,offline,photos,groups,video,audio,email&redirect_uri={location.protocol+'//'+location.host}/member/join/vk&response_type=code&v=5.15" class="login_register_vk_button"> <span class="login_register_vk_icon"></span> </a> {#/if} </div> {#/template js_tmpl_auth_reg_soc}

{#template MAIN} <div id="loginForm" style="display:none;" class="subscriberu_popup"> <div class="popup_register"> {#include js_tmpl_auth_reg_tab} <dl class="rg_block_options"> <dt id="js_tap_panel_auth"> <p class="rg_description">{#include js_tmpl_auth_reg_descr}</p> <div class="clr"> </div> {#include js_tmpl_auth_reg_action} <div class="clr"> </div> </dt> </dl> </div>  </div> {#/template MAIN} {#template js_tmpl_auth_reg_tab} <ul class="rg_nav"> <li id="js_tab_reg" class="rg_active_nav rg_first_nav"><a href="" onclick="return false;" >Регистрация</a></li> </ul> <span onclick="hidebo();" class="rg_closed"> </span> {#/template js_tmpl_auth_reg_tab} {#template js_tmpl_auth_reg_descr} <strong>Пожалуйста, подтвердите ваш адрес.</strong><br><br>Вам отправлено письмо для подтверждения вашего адреса {$P.register_confirm_mail}.<br>Для подтверждения адреса перейдите по ссылке из этого письма. {#/template js_tmpl_auth_reg_descr} {#template js_tmpl_auth_reg_action} <div class="rg_forms confirm_code_from_letter"> <div class="rg_for_input"> <span class="rg_inp_descr" style="width:15em;">Или введите код из письма:</span> <input type="text" value="" id="confirm_code" name="" data-js_submit="yes" data-js_action="js_confirmFormBut" class="js_keydown_selector rg_input_text_conf" > </div> <div class="rg_for_input"><label>Не пришло письмо? <b>Пожалуйста, проверьте папку Спам</b><br /> (папку для нежелательной почты).</label><br /> <a href="" onclick="ajax_recall_code();return false" >Вышлите мне письмо еще раз!</a></div> <div class="rg_for_input"> <em class="reg_error" id="confirm_msg"></em> <a href="#" class="button button-red" id="js_confirmFormBut">Готово</a> <div class="loading loading-cover" style="display: none;"><div class="loader"></div></div> <br> </div> </div> {#/template js_tmpl_auth_reg_action}