Отправляет email-рассылки с помощью сервиса Sendsay
  Все выпуски  

Продвижение сайтов. Алгоритм HITS и определение платных ссылок в Яндекс


Уважаемые подписчики, коллеги, соратники и замечательные люди!

От всей души поздравляем всех с наступающим Новым Годом, и желаем в новом году исключительно ТОПовых позиций и безоговорочной победы над Яндексом.

 А теперь традиционный выпуск рассылки.

В нашей статье мы исследуем алгоритм HITS, как один из полезных показателей для ранжирования.
В основу определения платных ссылок лег модифицированный алгоритм HITS. Многим интересно, как именно Яндекс отличает покупные ссылки.
Попробуем разобраться в данном вопросе.
Алгоритм HITS (Hyperlink Induced Topic Distillation) или Алгоритм Клейнберга используется поисковыми системами уже достаточно давно в разных разрезах. Например, с помощью алгоритма HITS можно выявлять спам.
Для определения покупной ссылки суть алгоритма сводится к следующему: в общем пуле страниц ищутся страницы определенные, как первоисточник (authorities) и страницы определенные, как посредник (hubs) текстов, но именно в плане ссылочного. Очевидно, что если страница является первоисточником, то ее часто цитируют посредники. Ну и наоборот, если страница является хорошим посредником, то она содержит ссылки на первоисточники.

По поводу того, что алгоритм определения продажности ссылки определяется на основе самообучающейся выборки а-ля Матрикснет очень достоверно, т.к. применение модифицированного алгоритма HITS является лишь частью инструментария.
В упрощенном варианте, если сам алгоритм HITS подразумевает расчет показателей «первоисточников» и «посредников» на основе матрицы (матрицы инциденций – элемент матрицы =1, если документ содержит ссылку, и =0, если не содержит). То модифицированные алгоритм HITS позволяет получать двухсторонние графы.
 Кстати и сам Яндекс сознается, что использует модифицированный алгоритм HITS для определения платных ссылок (но не сайтов их продающих, или покупающих).
В процессе работы используются различные классификаторы (SEO-link, SEO-out, SEO-in), но, надо полагать, что в процессе эволюции самообучающегося алгоритма эти классификаторы видоизменились, поэтому актуальности информации весьма сомнительна.

В результате мы получаем вероятность того, является ли ссылка продажной, или нет.

Дополнительные идентификаторы продажности ссылки, которые используются в алгоритме:
1. Страница, указывающая на целевые страницы сайтов разной тематики.
2. Участие страницы в ссылочном взрыве.
3. Ссылки не перемещаются вместе  с контентом.
4. Излишнее количество исходящих ссылок (не обязательно покупных).
5. Мигание ссылок, история ссылок.
6. Посещаемость сайта, как сводный параметр.
7. Плохое местоположение ссылки.
8. Кучность ссылок.
9. Ссылки появляется в индексе после текста, размещенного на странице.
10. Переходы по ссылке (как косвенный показатель ее естественности).
11. Срок жизни ссылки (для покупных ссылок возраст ссылки достаточно мал).
12. Не тематичность ссылки текстовому кластеру страницы на который она ссылается.
13. Не тематичность ссылки текстовому кластеру сайта на который она ссылается.
14. И другие сводные параметры.

Т.е. на выходе мы получаем уже не модифицированный алгоритм HITS, а усложненную структуру принятия решения о продажности ссылки. При этом окончательный вердикт платности ссылки принимается на основе ряда факторов, что снижает вероятность погрешности при определении продажности ссылки. 

 Источник: http://www.apollo-8.ru/algoritm-hits

--

С уважением, компания по продвижению сайтов www.apollo-8.ru


В избранное