Наращивание Page Rank
2009-10-14 14:00 melnikoff_kc@list.ru (Bormaley)
Это руководство, состоящее из двух частей, познакомит Вас с Page Rank (PR) и его наращиванием с помощью внутренней структуры ссылок. В первой части этой статьи мы объясним, что же такое PR, как он работает и насколько он распространен, а вторая часть статьи будет сосредоточена на наращивании PR.
Google и Page Rank
Page Rank был изобретен соучредителем Google Лари Пейджем (отсюда и название Page Rank), как способ определения важности веб-страниц. До того как был изобретен PR, поисковые системы опирались на анализ текста, мета-тэгов и внутреннюю оптимизацию страницы. Всем этим было легко манипулировать. Ранее SEO компании нанимали программистов, которые изучали алгоритмы работы поисковых систем с целью получить страницы с высоким PR по собственному усмотрению. PR позволял рассчитать значение каждой отдельной страницы в Интернете, делая многие внутренние SEO технологии бесполезными.
Для получения дополнительной информации о PR воспользуйтесь следующими источниками: • http://infolab.stanford.edu/~backrub/google.html • http://en.wikipedia.org/wiki/PageRank
Релевантность и Важность
Важно понимать, что PR не рассчитывает релевантность, только важность каждой страницы. Когда пользователь делает запрос, совершенно иной алгоритм высчитывает релевантность страницы, в то время как PR просто выбирает наиболее важный результат.
Пользователь делает запрос в поисковике
Google выбирает результаты, содержащие в себе искомое слово (т.е ключевое слово)
Отобранные результаты сортируются относительно PR, начиная от наиболее важных и заканчивая наименее важными
Пользователь имеет возможность видеть все результаты поиска
Различные алгоритмы отвечают за вычисление релевантности. С точки зрения SEO, ключевые слова в тексте ссылки, заголовки и контент – вот некоторые из показателей релевантности.
Как рассчитать Page Rank?
Важно понимать разницу между реальным PR и тем, что отображается в тулбаре.
• Тулбарное значение PR (TBPR) можно отслеживать с помощью панели инструментов Google. Это значение показывает результаты за последние несколько месяцев. Значения TBPR (от 1 до 10) сильно завышены, поскольку реальные значения PR не являются линейными. Например, логичнее было бы, что страницы с PR 8 должны иметь рейтинг вдвое больше, чем транцы с PR 4. На самом же деле, этот рейтинг, как правило, в несколько раз выше. • О реальном значении PR мы можем только догадываться, поскольку, когда дело доходит до раскрытия некоторой информации, Google подобен «черному ящику». Представьте себе логарифмическую кривую, которая стремится к вертикальному положению.
Тулбарое значение рассчитывается на основе реального PR. Например, предположим, что максимальное значение Google PR равно 1000000. Тулбарное значение PR 1 составляет от 1 до 10, PR 2 – от 10 до 50, PR 3 – от 50 до 1000, PR 4 – от 1000 до 10000 и так далее пока, наконец, PR 9 не будет составлять 600000 – 1000000.
Как видно, гораздо легче достичь значения PR от 1 до 2, нежели от 6 до 7, так как их фактические численные значения в 100 раз выше. Если Вы когда-либо играли в игры типа World of Warcraft, то наверняка будете знать, что самые первые уровни достичь легче всего. По мере продвижения на уровни выше, достигать их становится все сложнее, поскольку требования возрастают.
Уровень
Требования необходимые для достижения уровня
01-10
500
11-20
1,000
21-30
2,500
31-40
4,000
41-50
6,000
51-60
9,000
61-70
13,000
71-80
23,000
81-90
43,000
91-99
83,000
Также можно отследить это и на примере Армии США, когда требования к служащему увеличиваются с каждым повышением его в ранге. Подобным образом и TBPR связан с реальным PR. На панели инструментов, две страницы могут иметь PR 8, но их реальные PR отличается; страница с более высоким реальным PR будет иметь преимущество в результатах поиска.
Кроме того, имейте в виду, что значения тулбарного PR обновляются каждые несколько месяцев, в то время как реальный PR постоянно обновляется и пересчитывается, что делает тулбарный PR своего рода «моментальным снимком».
Дополнительные алгоритмы
Имейте в виду, что PR был изобретен более чем 10 лет назад; с тех пор Google внес ряд изменений. Также Google выпустил Trust Rank, Topic Sensitive Page Rank (TSPR) и МНОГО других алгоритмов. Можно предположить, что Page Rank по-прежнему является одним из наиболее важных факторов ранжирования, но не стоит строить свою компанию полностью опираясь лишь на один этот показатель.
Коэффициент затухания
PR основан на принципе перехода по ссылкам, подобно случайному интернет-пользователю, который кликает по всем ссылкам находящимся в поле его зрения. Чем больше ссылок на страницу Х, тем выше вероятность того, что случайный пользователь найдет эту страницу Х, нажимая на все ссылки, которые он видит (следовательно, ссылки обеспечивают важность каждой страницы).
Но что если пользователю больше неинтересно кликать по ссылкам и он закрывает окно? Для этого и существует коэффициента демпфирования в алгоритме PR. Он нужен именно тогда, когда пользователь «устал» и прекращает нажимать на ссылки (или натыкается на страницы, которые не имеют никаких ссылок на другие страницы).
Согласно Википедии, если страница не имеет ссылок на другие страницы, она превращается в «яму» и, следовательно, завершается вероятностный процесс перехода от одного сайта к другому (интернет-серфинг). Тем не менее, решение очень простое. Если случайный интернет-серфер попадает на подобную страницу, то он выбирает другой случайный URL и вновь продолжает процесс серфинга. Рассчитывая PR, предполагается, что страницы, не содержащие исходящих ссылок, в совокупности связаны со всем остальными страницами. Поэтому критерии их PR равномерно разделены между всеми другими страницами. Иными словами, чтобы быть «справедливыми» по отношению к страницам, которые не являются так называемыми «ямами», эти случайные переходы добавлены ко всем интернет-узлам, с коэффициентом затухания, как правило, d=0,85; оценивается исходя из частоты использования средним серфером закладок в браузере.
Страницы, ссылающиеся сами за себя
Нет никаких фактических доказательств относительно того, есть ли смысл странице ссылаться на саму себя (т.е. URL site.com/page.html имеет ссылку на site.com/page.html). Единственное, что мы можем сделать, это предположить, что подобная ссылка является непрактичной и Google не принимает ее в расчет.
Передача PR
Если страница с PR 4 содержит ссылки на 8 страниц, получается, что на каждую из этих страниц, которые получили ссылку, начисляется по 0,5 PR. Если та же страница дает ссылки всего лишь на 4 страницы, то каждая страница получает по 1 PR. Модель распределения одинакова, что означает, что PR распределяется поровну между страницами. Чем меньше ссылок содержит страница, тем больше веса PR передается и наоборот, чем больше ссылок, тем меньше PR веса получают страницы. Не то чтобы страницы НЕ теряют PR, когда дают ссылки. Они просто распределяют значение PR. Например, когда страница с PR 5 содержит ссылки на 10 сайтов, она не теряет свой PR, а всего лишь распределяет его, сохраняя при этом свое фактическое значение.
Больше одной ссылки со страницы
Можно предположить, что Google учитывает только одну ссылку с одной уникальной страницы и игнорирует двойные или тройные ссылки. Например, если страница Х с PR 4 содержит 2 ссылки на сайт А и одну на сайт В, то PR распределится таким образом, что каждый сайт получит по 2 PR, а дублированная ссылка не будет учитываться.
Это лишь предположение. Для дополнительной проверки Вы можете провести собственное «расследование».
Как увеличивается PR?
PR увеличивается за счет внешних ссылок и распределяется вместе с исходящими ссылками. Чем больше входящих ссылок содержит страница (внутренних и внешних), тем выше PR такой страницы при условии, что присутствуют и все остальные показатели качества ссылки (такие как качество ссылающегося веб-сайта и уровень его траста).
Первоначальное значение страницы
Каждой странице присваивается первоначальное значение, равное постоянному числу. В рамках данного примера давайте использовать это число в качестве значения присваиваемого страницам по умолчанию. Благодаря коэффициенту затухания это значение снижается на 0,15 и в конечном итоге составляет 0,85, поэтому по умолчанию Page Rank каждой новой страницы (или страницы без каких-либо внешних ссылок) равен 0,85. Это означает, что новые страницы (или страницы без ссылок) могут передать 0.85 PR от общего PR другим страницам, а также то, что, увеличивая число внутренних страниц и направляя их ссылки на самые важные страницы, Вы можете увеличить свой PR. Для того чтобы новым страницам было присвоено первоначальное значение, они должны отвечать определенным требованиям с точки зрения контента, формата, ключевых слов и т.д. Другими словами, вы не можете создать кучу шаблонных/пустых страниц и этим поднять свой PR.
Формула PR
Лично на меня всякого рода уравнения из формул действуют усыпляюще, но если физика и математика – Ваши сильные стороны, то Вы можете проверить формулу PR, которая расположена ниже.
PR (A) = (1-D) + D (PR (T1) / C (T1) + ... + PR (Tn) / C (TN))
Где:
• PR - page rank. • A - страница A • (1-d) – коэффициент затухания.
Заключение Некоторые важные пункты, которые следует запомнить:
• PR – единица важности, а не релевантности. • Тулбарный PR не дает точного представления о Page Rank. • Каждой странице присваивается по умолчанию первоначальное значение равное 1 (или то, которое использует только Google).