Илья Сегалович: "Добавлено более 10 новых факторов ранжирования"
Мы побеседовали с техническим директором компании "Яндекс" Ильей Сегаловичем.
- Давайте для начала определимся - новый алгоритм ранжирования действительно абсолютно новый или на имеющийся алгоритм наложены новые факторы?
- Алгоритмы новые, и хотя при этом используется часть применявшихся ранее факторов, добавлено более 10 новых факторов ранжирования.
- В дискуссиях последних дней не раз звучала мысль, что ссылочного ранжирования больше не будет, или наоборот - только оно и будет...
- Поиск с использованием ссылок доказал свою эффективность еще в 1999-2001 годах, и ни одна поисковая система не может от него отказаться.
- Введение механизмов пользовательской оценки - т.е. асессоров - особо не афишировалось Яндексом, хотя оптимизаторы еще осенью отследили их активность. Их деятельность и раньше влияла на ранжирование или до сих пор шла обкатка этого механизма?
- С осени прошлого года велись активные работы по построению новых алгоритмов с использованием оценок асессоров. Эти работы продолжаются и интенсифицируются.
- А хватает ли мощностей асессорского отдела для обработки необходимого количества результатов поиска - ведь, по всей видимости, именно их дело оценить, насколько хорошо документы могут удовлетворить потребность пользователей?
- Мощность отдела асессоров уже позволили нам глубоко оценить сотни запросов. Тем не менее, пока мы только расширяем этот отдел.
- А как определяется эта потребность - по цепочкам запросов?
- Связанные запросы - один из важных источников информации, который позволяет лучше понять информационную потребность пользователя. Мы используем эти данные для анализа и построения алгоритмов, но не при выполнении запросов.
- Можно ли провести такое сравнение - асессоры обучают алгоритм поиска также, как пользователи обучают антиспамовые фильтры?
- Да, можно. Более того, вы угадали, в экспериментах мы использовали один и тот же алгоритм для подбора коэффициентов и в поиске, и в "Спамообороне".
- Раз зашла речь о спаме - насколько связаны новые технологии в поиске - скажем, упомянутое в пресс-релизе распознавание вспомогательной, технической и рекламной информации с разработками Яндекса в области борьбы со спамом и, в частности, новой версией "Спамообороны", недавно запущенной?
- Поисковый и почтовый спам совершенно различны по технической природе. Тем не менее, в обоих случаях стоит задача отличить нечто "рукотворное" от автоматически созданного продукта.
- Многие поисковые системы давно пытались так или иначе использовать человека для оценки релевантности результатов поиска - и понижая некликабельные позиции, я помню разработку NBCi, которые подсчитывали интервал между кликами одного и того же юзера на разных позициях. Яндекс тоже фиксирует клики пользователей и довольно давно, но вместе с тем и работают асессоры. Подсчет кликов не удовлетворил или он изначально не для этого делался?
- Анализ кликов используется для разных целей, в том числе для интегральной оценки качества поиска. Однако, непосредственно для настройки качества поиска эти данные не годятся, ведь пользователи делают выбор только по цитатам из документов и адресам страниц. Асессоры же работают по заданной методике, мы выработали критерии, по которым должно измеряться качество страницы, и достоверность результатов их работы легко проверяется.
- Методика, о которой идет речь - она останется закрытой или Яндекс планирует обнародовать ее?
- Яндекс давно участвует в научной деятельности в области информационного поиска, является соучредителем конференции "Диалог", соорганизатором семинара "РОМИП". Тем не менее, мы не собираемся опубликовать эту методику, в том числе потому что она тесно связана с поисковыми алгоритмами, которые мы обязаны хранить в тайне.
- А не может ли получиться так - качество страниц будет очень высоким по вашей методике, а пользователи будут недовольны выдачей?
- Такая ситуация маловероятна. Как я говорил раньше, оценки асессоров -- важный, но не единственный источник информации о качестве поиска. Мы используем для дополнительного контроля как автоматические, так и ручные методы оценки.
- Поиск в регионе - вещь принципиально новая. Каким образом Яндекс будет определять регион сайта или отдельной страницы?
- При реализации функция поиска в регионе мы предпочли точность полноте. То есть сейчас после уточнения региона поиск идет по страницам сайтов, которые зарегистрированы в каталоге Яндекса и у которых регион соответствует региону пользователя.
Информационно-аналитический портал «Сотовик», аудитория которого превышает 50 тыс. посетителей в сутки, нашел надежный источник дохода. Заключено соглашение с каталогом PlayMobile, который продает Java-игры для мобильных телефонов.
Компании PlayMobile и «Сотовик» объявили о запуске совместного проекта. Теперь прямо на «Сотовике» можно заказать любую игру, нужно лишь указать модель и номер своего телефона. После этого на аппарат поступит SMS-сообщение с WAP-ссылкой, по которой можно закачать файл. Сервис работает почти со всеми мобильными операторами России (заключены контракты с более чем 50-ми операторами), хотя раньше подобные услуги предоставлялись только для абонентов московского «БиЛайна». В настоящий момент покупателям доступно около 500 самых интересных игр всех жанров — аркады, стратегии, RPG, спортивные симуляторы и многое другое. Стоимость игры обычно составляет два-три доллара, а каталог обновляется каждую неделю. Судя по всему, «Сотовик» будет получать от PlayMobile стандартное вознаграждение агента-посредника
в пределах около 10% от суммы заказов.
Совместный проект PlayMobile и «Сотовика» — это только первый шаг в сотрудничестве ведущего информационно-аналитического портала и крупнейшего поставщика игрового контента Можно предположить, что сотрудничество будет продолжаться и дальше.
«Мы всегда работаем с лучшими компаниями в своем секторе рынка, — прокомментировал Дмитрий Сергеев, управляющий директор Shamrock Games (один из учредителей PlayMobile). — И наше сотрудничество с ИАА „Сотовик“, как с ведущим информационным масс-медиа в сфере телекоммуникаций, логичный шаг в развитии российской игровой мобильной индустрии и важный этап в жизни PlayMobile».
25 марта поисковая система Alltheweb переключилась на выдачу результатов поиска Yahoo! Search, отключив результаты поиска собственной системы. Лежавший прежде в основе Alltheweb алгоритм поиска FAST изначально и по настоящее время считался одним лучших в мире. Однако в России большой популярности не получил, включая поисковое решение на портале Lycos.ru.