Машинное обучение на практике (пишем обучающиеся алгормы) (comp.soft.machine2learn) : Рассылка : Subscribe.Ru

Подписаться Бесплатная новостная рассылка Подписчиков 3 RSS

Декабрь 2011 →
	1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

За последние 60 дней ни разу не выходила

Сайт рассылки: http://thiord.com/notes/index.php?show=541
Открыта: 31-12-2011

Автор

Леонид

Статистика

3 подписчиков
0 за неделю

← Все выпуски →

Машинное обучение на практике (пишем обучающиеся алгормы)

Добрый день!

В первом выпуске хочется подробнее рассказать про конкретные примеры машинного обучения.

Начну с наиболее простых и понятных примеров.

Пример 1. Предположим у нас есть данные о росте и весе большого числа различных людей. Исходя из этого можно построить модель: какой вес обычно соответствует данному росту.

Пример 2. Предположим у нас есть база данных о продажах квартир: число комнат, площадь, район города, цена. Исходя из этих данных можно построить модель для предсказания средней цены на квартиру.

Пример 2б. У этой задачи интересное продолжение. Можно посмотреть на то, какие квартиры сильно выбиваются из нашей модели, и понять, какие ещё есть важные факторы: например, близость от метро, тип строения, этаж и т.д. и т.п.. Другими словами, можно выделить важные факторы, влияющие на цену квартиры.

Пример 2в. Ещё одно продолжение. Когда мы построили точную модель "средней цены", можно посмотреть на то, сколько времени уходит на продажу квартиры. Возможно оно зависит от завышенной/заниженной цены. Возможно у разных типов квартир в целом разный срок продажи. Как повлияет повышение цены на срок продажи? Поможет ли быстро продать квартиру, если сбросить 5%? На все эти вопросы можно ответить с помощью машинного обучения.

Пример 3. Пусть у вас есть данные о большом числе поступающих в ВУЗ, и результат: поступил ли человек или нет. Можно построить модель, которая оценит вероятность поступления в ВУЗ для нового абитуриента.

Пример 4. У крупного интернет-магазина есть данные о поведении его покупателей. Можно выделить группы покупателей с разными типами поведения, и постраться лучше понять их потребности. После чего предлагать каждой группе более подходящий для неё товар.

Пример 5. Рекомендательная система. Если у вас есть база данных пользователей и их предпочтений среди ряда товаров (или фильмов, или книг, или сайтов, или музыки), то можно построить систему, которая будет предугадывать его интерес к ещё не оценённым им товарам. На этом принципе построен, например сайт http://imhonet.ru

Пример 6. Анти-спам. Все мы знаем, что в почту нередко попадают нежелательные рассылки с предложением что-нибудь купить, так называемый спам. Имея набор "хороших" писем, и "спам" писем можно обучить систему отличать одни от других. Такая же задача актуальна и для форумов, да и для любых сайтов с возможностью размещать комментарии пользователей. А может вы пишите приложения для мобильных? Можно ведь сделать и анти-спам для СМС (такие приложения уже появляются).

Все вышеперечисленные задачи мы изучим в ходе рассылки, и сможем реализовать их в коде. Но хочется рассказать и сложных примерах, что называется state-of-the-art алгоритмы, т.е. на переднем краю современной науки и техники (мы до таких высот, конечно не дойдём, но понять, куда движемся, будет полезно и интересно).

Пример 7. Все мы пользуемся поисковиками: Яндекс, Гугл, Мэйл, Рамблер, но не все мы знаем, что они основаны на машинном обучении. Давайте разберёмся. Поисковик находит миллионы документов по запросу "яблоко". Их просто нужно было отобрать по наличию слова. Здесь всё просто, но на этом работа поисковой системы только начинается, ведь нужно выбрать, какой документ будет на первом месте, какой на втором и т.д... И эта задача очень сложна, т.к. поисковик должен понять, какая страница "полезнее", "лучше" и вывести именно её на первую строчку. И здесь не придумывается какой-то простой однозначный алгоритм, позволяющий принять это решение. Именно в таких случаях на помощь приходит машинное обучение. Выбираются исходные предположения о том, какие параметры могут определять полезность страницы, после чего предположительно хорошие страницы дают оценить человеку. Специальный человек отмечает, какие страницы на самом деле удачны, а какие совсем не информативны для данного запроса. После этого и начинает работать машинное обучение: зная примеры качественных страниц, алгоритм пытается понять, какие параметры им соответствуют. Далее обученная система уже по незнакомым запросам определяет, какие страницы следует показывать. Именно такая система работает во всех современных поисковиках по всему миру.

Пример 8. Машинное зрение.
Пример 8а. Распознавание текста. С виду задача кажется простой, даже элементарной. Все мы уже давно читаем текст и даже не задумываемся об этом. А вот как создать алгоритм, который бы глядя на напечатанный текст, смог бы разобрать, что там написано? Навскидку придумать такой алгоритм не так-то просто. И снова здесь на помощь приходит машинное обучение. Мы предлагаем системе большое число примеров того, как выглядит каждая буква, обучающаяся система вычисляет закономерности. После этого алгоритм готов к распознаванию новых символов.
Пример 8б. Более общие задачи машинного зрения. Например, в данный момент активно развивается следующая практическая задача. На автомобиль устанавливается камера, и алгоритм должен в реальном времени распознавать дорогу, знаки, другие машины, пешеходов, и все возможные подвижные и неподвижные препятствия. Таким образом, "видя" окружающую реальность, алгоритм способен экстренно затормозить, в неожиданно опасной ситуации (пешеход выбегает на дорогу), либо наоборот самостоятельно трогаться со светофора (когда загорелся зелёный свет и поехали впереди стоящие машины), или даже самостоятельно перемещаться в потоке машин. И это уже не фантастика -- такие алгоритмы активно разрабатываются, и даже тестируются на реальных дорогах!

Надеюсь, приведённые примеры позволили понять, что такое машинное обучение. И может быть у вас уже стали зарождаться идеи, какие задачи вы сможете решить.

На этом наш первый выпуск завершается. И что символично, на пороге Новый год. Поэтому очень кстати будет пожелать всем нам новых открытий, новых знаний и достижений в Новом году!

В добрый путь!

В избранное

{#template MAIN} <div id="loginForm" style="display:none;" class="subscriberu_popup"> <div class="popup_register"> {#include js_tmpl_auth_reg_tab} {#if $P.login_register_tab == 1} <form class="authentication-form" method="post" action="/MEMBERLOGIN_authen_cred"> <dl class="rg_block_options"> <dt id="js_tap_panel_auth"> <h1>Войти на сайт</h1> {* {#include js_tmpl_auth_reg_button} *} {#include js_tmpl_auth_reg_action} <hr class="logreg_line noPhones"> <div class="logreg_descr noPhones"><p>{#include js_tmpl_auth_reg_descr} </p></div> <div class="logreg_advice noPhones"> Если вы еще не с нами, то начните с <a href="#" onclick="rgNav('js_tab_reg');return false;" class="dashed" data-func="registr">регистрации</a> </div> <br><br> <a class="dashed auth-enter" href="/manage/author/"><b>Вход для авторов</b></a> </dt> </dl> </form> {#/if} {#if $P.login_register_tab == 2} <div class="rg_block_options"> <div id="js_tap_panel_auth"> <h1>Регистрация</h1> <div class="social_reg"> {* <div class="rg_description">{#include js_tmpl_soc_auth_reg_descr}</div> *} {#include js_tmpl_auth_reg_soc} <div class="rg_soc_auth_agree">{#include js_tmpl_auth_reg_agree}</div> </div> <div class="subscribe_reg"> {* <div class="rg_description"> #include js_tmpl_auth_reg_descr </div> *} {#include js_tmpl_auth_reg_action} </div> {* {#include js_tmpl_auth_reg_button} *} <div class="clr"> </div> <hr class="logreg_line noPhones"> <div class="logreg_descr noPhones">{#include js_tmpl_auth_reg_descr} {#include js_tmpl_soc_auth_reg_descr} </div> </div> </div> {#/if} </div> {* <div class="gray_bg register_shadow"></div> *} </div> {#/template MAIN} {#template js_tmpl_auth_reg_tab} <ul class="rg_nav"> <li id="js_tab_auth" class="{#if $P.login_register_tab == 1} rg_active_nav {#/if} rg_first_nav"><a onclick="rgNav('js_tab_auth');return false;" href="">Вход на сайт</a></li> <li id="js_tab_reg" class="{#if $P.login_register_tab == 2} rg_active_nav {#/if}"><a onclick="rgNav('js_tab_reg');return false;" href="">Регистрация </a></li> </ul> <span onclick="hidebo();" class="rg_closed"> </span> {#/template js_tmpl_auth_reg_tab} {#template js_tmpl_auth_reg_action} {#if $P.login_register_tab == 1} {#include js_tmpl_auth_reg_soc} {#/if} <div class="rg_forms"> <input type="hidden" id="login_register_destination" value="{$P.login_register_destination}"/> {#if $P.login_register_tab == 1} <div class="rg_for_input"> <span class="rg_text_inner">E-mail или код подписчика</span> <input id="credential_0" class="js_keydown_selector rg_input_text" data-js_submit="no" data-js_next_input_name="credential_1" name="" type="text" /> </div> <div class="rg_for_input"> <span class="rg_text_inner">Пароль</span> <input id="credential_1" class="js_keydown_selector rg_input_text" data-js_submit="yes" data-js_action="js_loginFormBut" name="" type="password" onkeyup="showAttention(this,!!window.event.shiftKey)" /> <span class="pswd_attention" id="attention_pswd"> <span class="icon_attention"></span> <span class="pswd_attention-text" id="attention-text_pswd1">Русская раскладка клавиатуры!</span> <span class="pswd_attention-text" id="attention-text_pswd2">У вас включен Caps Lock!</span> <span class="pswd_attention-text" id="attention-text_pswd3">У вас включен Caps Lock и русская раскладка клавиатуры!</span> </span> </div> <div class="rg_for_input input-alien"> <span class="chk noPhones"><input id="chk_alien" name="" type="checkbox" /></span><label for="chk_alien" class="noPhones"> Чужой компьютер</label> <a class="forgot_pass" href="/member/totalrecall">Забыли пароль?</a> </div> <div class="rg_for_input"> <em id="auth_msg" class="reg_error"></em> <input id="lf_typeauthid" value="email" type="hidden"> <input type="submit" class="button button-red logreg_submit" id="js_loginFormBut" value="Войти">  <div class="loading loading-cover" style="display: none;"><div class="loader"></div></div> </div> {#/if} {#if $P.login_register_tab == 2} <div class="rg_for_input"> <span class="rg_text_inner">E-mail</span> <input id="arfemail" class="js_keydown_selector rg_input_text" name="" type="text" data-js_submit="yes" data-js_action="js_regFormBut"/> </div> <div class="rg_for_input rg_set_lineh rg_for_input_wide"> <label class="js_tap_panel_checkbox"> <span class="chk"><input name="" id='js_tap_panel_checkbox_terms' type="checkbox" data-js_submit="yes" /></span> Я ознакомился и согласен с <a class="link_txd logreg_accLink" href="/faq/vereinbarung.html">условиями сервиса Subscribe.ru</a> </label> <br /> <label class="js_tap_panel_checkbox"> <span class="chk"><input name="" id='js_tap_panel_checkbox_personal' type="checkbox" data-js_submit="yes" /></span> Нажимая на кнопку "Готово!", я даю <a class="link_txd logreg_accLink" href="/faq/persverordnung.html">согласие на обработку персональных данных</a> </label> </div> {* <div style="float: left;position: absolute;left: 11em;"> <img src="http://www.kupivip.ru/images/vip/logo.png?1604" style="width: 86px; vertical-align: middle;display: block;"> </div> <div class="rg_for_input rg_set_lineh"> <label class="js_tap_panel_checkbox"><input name="" id="js_tap_panel_checkbox_kupivip" type="checkbox" data-js_submit="yes"> Я хочу получать новости о скидках на одежду</label> </div> *} <div class="rg_for_input"> <em id="reg_msg" class="reg_error rg_for_input_wide"></em> <em id="reg_msg2" class="reg_error rg_for_input_wide"></em> <input id="rf_typeauthid" value="email" type="hidden"> <a class="button button-red logreg_submit" id="js_regFormBut" href="#">Готово!</a> <div class="loading loading-cover" style="display: none;"><div class="loader"></div></div> </div> {#/if} </div> {#/template js_tmpl_auth_reg_action} {#template js_tmpl_auth_reg_agree} <div class="rg_for_input rg_set_lineh rg_for_input_wide"> <label class="js_tap_panel_checkbox"> <span class="chk"><input name="" id='js_tap_panel_checkbox_terms_reg' type="checkbox" data-js_submit="yes" /></span> Я ознакомился и согласен с <a class="link_txd logreg_accLink" href="/faq/vereinbarung.html">условиями сервиса Subscribe.ru</a></label> <em id="reg_msg_soc" class="reg_error rg_for_input_wide"></em> </div> {#/template js_tmpl_auth_reg_agree} {#template js_tmpl_auth_reg_button} <div class="rg_butons_socials"> {#if $P.login_register_tab == 1} <a class="rg_btn_soc rg_bs_01 js_tap_panel_selector" action="auth_email" href="#"><span><i></i>Email</span></a> <a class="rg_btn_soc rg_bs_01 js_tap_panel_selector" action="auth_openid" href="#"><span><i></i>OpenID</span></a> <a class="rg_btn_soc rg_bs_02 js_tap_panel_selector" action="auth_vkontakte" href="#"><span><i></i>Вконтакте</span></a> <a class="rg_btn_soc rg_bs_02 js_tap_panel_selector" action="auth_mailru" href="#"><span><i></i>Mail.Ru</span></a> {#/if} {#if $P.login_register_tab == 2} <a class="rg_btn_soc rg_bs_01 js_tap_panel_selector" action="reg_email" href="#"><span><i></i>Email</span></a> <a class="rg_btn_soc rg_bs_01 js_tap_panel_selector" action="reg_openid" href="#"><span><i></i>OpenID</span></a> <a class="rg_btn_soc rg_bs_02 js_tap_panel_selector" action="reg_vkontakte" href="#"><span><i></i>Вконтакте</span></a> <a class="rg_btn_soc rg_bs_02 js_tap_panel_selector" action="reg_mailru" href="#"><span><i></i>Mail.Ru</span></a> {#/if} </div> {#/template js_tmpl_auth_reg_button} {#template js_tmpl_auth_reg_descr} {#if $P.login_register_tab == 1} Для оформления подписки на выбранную рассылку, работы с интересующей вас группой или доступа в нужный вам раздел, просим авторизоваться на Subscribe.ru {#/if} {#if $P.login_register_tab == 2} Для регистрации укажите ваш e-mail адрес. Адрес должен быть действующим, на него сразу после регистрации будет отправлено письмо с инструкциями и кодом подтверждения. {#/if} {#/template js_tmpl_auth_reg_descr} {#template js_tmpl_soc_auth_reg_descr} Или зарегистрируйтесь через социальную сеть. {#/template js_tmpl_soc_auth_reg_descr} {#template js_tmpl_auth_reg_soc} <div class="rg_soc"> {#if $P.login_register_tab == 1} <a onclick="return _checkSocConfirm(event)" href="https://oauth.vk.com/authorize?client_id=3954260&scope=wall,offline,photos,groups,video,audio,email&redirect_uri={location.protocol+'//'+location.host}/member/login/vk/&response_type=code&v=5.15" class="login_register_vk_button"> <span class="login_register_vk_icon"></span> </a> {#/if} {#if $P.login_register_tab == 2} <a onclick="return _checkSocConfirm(event)" href="https://oauth.vk.com/authorize?client_id=3954260&scope=wall,offline,photos,groups,video,audio,email&redirect_uri={location.protocol+'//'+location.host}/member/join/vk&response_type=code&v=5.15" class="login_register_vk_button"> <span class="login_register_vk_icon"></span> </a> {#/if} </div> {#/template js_tmpl_auth_reg_soc}

{#template MAIN} <div id="loginForm" style="display:none;" class="subscriberu_popup"> <div class="popup_register"> {#include js_tmpl_auth_reg_tab} <dl class="rg_block_options"> <dt id="js_tap_panel_auth"> <p class="rg_description">{#include js_tmpl_auth_reg_descr}</p> <div class="clr"> </div> {#include js_tmpl_auth_reg_action} <div class="clr"> </div> </dt> </dl> </div>  </div> {#/template MAIN} {#template js_tmpl_auth_reg_tab} <ul class="rg_nav"> <li id="js_tab_reg" class="rg_active_nav rg_first_nav"><a href="" onclick="return false;" >Регистрация</a></li> </ul> <span onclick="hidebo();" class="rg_closed"> </span> {#/template js_tmpl_auth_reg_tab} {#template js_tmpl_auth_reg_descr} <strong>Пожалуйста, подтвердите ваш адрес.</strong><br><br>Вам отправлено письмо для подтверждения вашего адреса {$P.register_confirm_mail}.<br>Для подтверждения адреса перейдите по ссылке из этого письма. {#/template js_tmpl_auth_reg_descr} {#template js_tmpl_auth_reg_action} <div class="rg_forms confirm_code_from_letter"> <div class="rg_for_input"> <span class="rg_inp_descr" style="width:15em;">Или введите код из письма:</span> <input type="text" value="" id="confirm_code" name="" data-js_submit="yes" data-js_action="js_confirmFormBut" class="js_keydown_selector rg_input_text_conf" > </div> <div class="rg_for_input"><label>Не пришло письмо? <b>Пожалуйста, проверьте папку Спам</b><br /> (папку для нежелательной почты).</label><br /> <a href="" onclick="ajax_recall_code();return false" >Вышлите мне письмо еще раз!</a></div> <div class="rg_for_input"> <em class="reg_error" id="confirm_msg"></em> <a href="#" class="button button-red" id="js_confirmFormBut">Готово</a> <div class="loading loading-cover" style="display: none;"><div class="loader"></div></div> <br> </div> </div> {#/template js_tmpl_auth_reg_action}