Logical-Portal — молодежный портал со своей изюминкой, каждый сможет найти что-то интересное и полезное для себя, например наш форум общения с которым вам обязательно нужно ознакомиться.
Этот документ изначально был подготовлен, написан и обоснован Крисом Райдинсом (Chris Ridings). В исходном материале использовалась модель, названная "MiniRank". "MiniRank" была очень похожа на "PageRank". Использование модели "MiniRank" было осознанным, и позволило автору вывести и описать принципы функционирования системы. Однако, с течением времени, понимание людьми метода PageRank улучшилось, и возникла необходимость более точного описания механизмов его функционирования. Обновлением этого документа занялась группа Black Box Group. Мы внесли в документ незначительные изменения, чтобы обеспечить большую точность, но, необходимо отметить, что ВСЕ изначальные принципы и идеи остались нетронутыми.
Довольно вступлений... пора приступить к предмету, рассматриваемому в данной статье - методу PageRank.
Что такое PageRank?
PageRank — это метод поисковой системы Google, определяющий "важность" страницы. Когда учтены все другие факторы, такие как тэг заголовка (Title tag) и ключевые слова (keywords), Google использует PageRank, чтобы распределить результаты запроса. Более "важные" сайты занимают более высокую позицию в результате запроса пользователя.
Таким образом, порядок работы системы классификации Google следующий:
1. Найти все страницы, соответствующие ключевым словам поиска.
2. Расположить их соответствующим образом, используя "страничные факторы" - ключевые слова.
3. Учесть содержащийся на странице текст ссылок.
4. Привести результаты в соответствие с коэффициентами PageRank.
Как определяется PageRank?
Теория Google гласит: если страница А ссылается на страницу В, то страница А говорит, что страница В — важная страница. Фактический текст гиперссылки для PageRank не имеет значения. PageRank учитывает, также, важность ссылок на страницу. Если на страницу ведут более важные ссылки, то ее ссылки на другие страницы также становятся более важными.
Насколько значителен PageRank?
Значительность каждого составляющего фактора в алгоритмах поисковой системы зависит от качества поставляемой им информации. Поэтому имеет смысл рассмотреть вначале это качество информации.
Когда Google был еще Гугленышем в пеленках, вероятно, было справедливо утверждать, что гиперссылка являлась точным индикатором рекомендации. Однако, сейчас подобное заявление уже не совсем верно, в силу двух причин:
1. Интернет значительно изменился. Гиперссылка сегодня может вести как на родственный по тематике сайт, так и на лицензионные требования, или быть простым жестом вежливости (как в случае с обменом гиперссылками), но никак не настоящей рекомендацией.
2. Коль скоро вы сделали поисковую систему, рассматривающую ссылки как рекомендации, люди станут пытаться воздействовать на эти ссылки. Если на ссылки оказывается воздействие — они не являются более рекомендациями.
Таким образом, надежность информации, предоставляемой ссылками, не обязательно высока, причем эта надежность постоянно уменьшается. Это отражается в низкой (с тенденцией к снижению) важности PageRank в алгоритме классификации Google. (Примечание Black Box Group — влияние PageRank на классификацию сейчас самое низкое - май 2002 г.). Однако, у PageRank есть один оправдательный фоктор. На него сложнее повлиять, чем на любой другой метод классификации. Это означает, что в нем заложен потенциал, дающий вам преимущество перед конкурентами, при использовании совместно с другими способами позиционирования в поисковой системе. Однако, хочу сразу вас предупредить: в решении данного вопроса не существует коротких путей. Чтобы использовать PageRank эффективно, нужно до конца понять его принципы, иначе вы, скорее всего, потратите свое время не лучшим образом.
Несколько основных фактов относительно PageRank
Для понимания остальной части этого документа, необходимо рассмотреть некоторые факты, касающиеся PageRank.
1. PageRank — это число, которое оценивает только удельный вес "голосов" для всех гиперссылок, ведущих на страницу, и насколько высоко они рекомендуют эту страницу.
2. каждая уникальная страница, индексируемая в Google, имеет свой коэффициент PageRank. Зачастую люди, ошибочно, принимают PageRank главной страницы за PageRank всего сайта.
3. Ссылки внутри сайта учитываются при расчете PageRank для других страниц сайта.
4. PageRank рассчитывается отдельно. Он не связан с текстом (названиями) ссылок, и т.п. Конечно, они взаимосвязаны, но утверждать, что это одно и то же, все равно, что сказать: "Тэги заголовка — то же самое, что ключевые слова в тексте".
Как можно определить, какой у страницы PageRank?
Вы можете скачать навигационную панель для браузера Internet Explorer по адресу http://toolbar.google.com . После установки, графическая панель в верхней части браузера будет показывать значение PageRank для просматриваемой страницы. Если вы наведете курсор мыши на панель, вы увидите число от нуля до десяти. (Если вы не видите число, у вас установлена старая версия навигационной панели. Полностью удалите ее, перезагрузите компьютер, установите последнюю версию, и тогда у вас появится возможность видеть число PageRank.)
Навигационная панель Google не очень точно показывает вам коэффициент PageRank сайта, но, на настощий момент, это единственный инструмент, который может хоть как-нибудь вас сориентировать. Коль скоро вам известны ограничения навигационной панели, то вы, по крайней мере, знаете, что за число вам показывают. Существует два ограничения для навигационной панели Google:
1. Панель иногда "угадывает". Если вы загружаете страницу, которая не проиндексирована системой Google, но существует страница, очень близко к ней расположенная в индексе Google, то вам будет показано угаданное значение PageRank. Это угаданное значение нас совершенно не интересует, потому что оно не используется в расчетах PageRank. Есть только один способ определить угаданное значение —набрать URL страницы в поисковой форме Google и посмотреть, будет ли найдена эта страница. Если нет, то значение было угадано!
2. Навигационная панель — это просто демонстрация фактического PageRank. В то время, как PageRank — нелинейная функция, для ее демонстрации был выбран линейный график. На навигационной панели, для перемещения от значения PageRank 2 к значению 3, требуется меньший подъем, чем для перемещения от 3 к 4. Лучше всего это иллюстрирует сравнительная таблица. Поскольку настоящие значения хранятся в секрете, мы используем для демонстрации условные значения.
Если фактический PageRank находится между Навигационная панель показывает 0.00000001 и 5 —1 6 и 25 — 2 25 и 125 — 3 126 и 625 — 4 626 и 3125 — 5 3126 и 15625 — 6 15626 и 78125 — 7 78126 и 390625 — 8 390626 и 1953125 — 9 1953126 и бесконечность — 10
Хочется верить, что вы поняли, насколько ограничена информация, получаемая из навигационной панели.
(Примечание Black Box Group — со времени написания статьи ситуация изменилась. Вполне вероятно, что сейчас на точность показаний навигационной панели влияют другие факторы, не имеющие ничего общего с методом PageRank).
Далее я буду использовать термин "Фактический PR" для ссылки на настоящее значение PageRank, хранимое в Google, и "Навигационный PR", при упоминании довольно ограниченного представления значения PageRank, которое нам позволяет увидеть навигационная панель Google.
Расчет PageRank
Объяснив, что такое PageRank, т.е., что вы видите, когда получаете о нем информацию, и насколько он важен, в этом разделе я расскажу вам, как он рассчитывается. Знать это не обязательно; однако, если вы поймете механизм, вам будет проще разобраться, как нужно применять коэффициент PageRank.
Когда Google еще находился на стадии испытания, была опубликована формула, присваивающая странице коэффициент PageRank. Возможно, сейчас используется не именно эта формула, но она выглядит вполне достоверной. Вот она...(*1)
PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))
Где PR(A) — PageRank страницы А (значение, которое мы хотим вывести).
D — понижающий коэффициент. Обычно он имеет значение 0.85 .
PR(T1) — PageRank сайта, ссылающегося на страницу А.
C(T1) — количество ссылок, ведущих с этой страницы.
PR(Tn)/C(Tn) означает, что мы делаем это для всех страниц, ссылающихся на страницу А.
(*1)1 Source: The Anatomy of a Large-Scale Hypertextual Web Search Engine, Sergey Brin and Lawrence Page, http://www-db.stanford.edu/~backrub/google.html
М-да! Для тех, кто далек от математики, в этой формуле скрыт подвох — вы не сможете взять и сразу рассчитать PageRank. Чтобы рассчитать PageRank страницы А, нужно знать PageRank всех страниц, ссылающихся на нее. Их значение PageRank, в свою очередь, будет частично зависеть от страницы А, указывающей на них, или каких-то других сайтов! Какая глупая формула. Но что она сообщает нам, так это одну очень важную вещь, касающуюся значения PageRank для любой страницы...
Значение PageRank, присваиваемое странице А страницей В, ссылающейся на нее, уменьшается с каждой ссылкой, существующей на странице В. Это значит, что PageRank страницы — это, по сути, измерение ее "избирательного голоса": этот голос может быть отдан одной ссылке, или двум, или многим, но его суммарное значение останется неизменным.
Сейчас давайте на время забудем об этой формуле, потому что намного нагляднее рассмотреть пример ее применения, который очень похож на метод PageRank. Это поможет нам лучше понять весь процесс.
Для этого примера, у нас есть четыре страницы —условно озаглавленные Страница А, Страница В, Страница С и Страница D. Они связаны друг с другом, как показано на следующей диаграмме.
Для начала, мы не знаем, какое значение PageRank у страниц, поэтому мы просто его присвоим. Для простоты, выберем номер один. И диаграмма с графиком PageRank приобретет вид...
Пока все просто! Сейчас нужно запомнить правила передачи коэффициента. Сначала, мы применяем понижающий коэффициент. (Понижающий коэффициент, в основном, сообщает, что страница не может голосовать за другую страницу, определяя ее важность, равную своей собственной важности. Это значит, что страницы, до которых сложнее добраться в сети, имеют меньшую важность). Затем мы делим оставшееся значение на количество ссылок. Мы распределяем ту часть коэффициента, которую нужно передать всем и каждой ссылающейся странице, прежде чем, в конечном счете, прибавить к 0.15, которое на передавалось.
Итак, посмотрим сначала на Страницу А. Значение PageRank, доступное для передачи другим страницам, после понижения составит 1 * 0.85 = 0.85. На этой странице две гиперссылки, поэтому, в конечном счете, мы прибавим 0.425 к значению PageRank страницы В и 0.425 — к значению PageRank страницы С. Сделать это мы сможем, лишь после подсчета ссылок на всех страницах, в противном случае мы получим искаженные результаты.
Далее, Страница В. На ней всего одна гиперссылка. Поэтому она передает 1 * 0.85 Странице С, после подсчета значений для всех ссылок.
Страница С также содержит только одну гиперссылку. Поэтому она передает 1 * 0.85 = 0.85 Странице А.
На странице D одна гиперссылка, и она передает 0.85 Странице С.
Каждая страница не передает 0.15, поэтому общая сумма включает и эту составляющую. Итак, мы получаем:
Страница А - 0.85 (от Страницы С) + 0.15 (не передаваемое) = 1
Страница В - 0.425 (от Страницы А) + 0.15 (не передаваемое) = 0.575
Страница С - 0.85 (от Страницы D) + 0.85 (от Страницы В) + 0.425 (от Страницы А) + 0.15 (не передаваемое) = 2.275
Страница D - не получает ничего, но сохраняет непередаваемое значение 0.15 = 0.15
Графически:
Новые суммы PageRank показывают, насколько важна Страница С. Но мы еще не закончили. Поскольку все страницы стартовали с одинаковыми значениями, мы, фактически, подсчитали только популярность ссылок (link popularity). Суть PageRank состоит в том, что лучше "связанные" страницы должны получить большее число голосов; поэтому мы должны снова повторить расчеты. На этот раз Страница С имеет большее влияние, потому что ее текущий PageRank выше. Итак, давайте посмотрим сначала на Страницу А. Ее текущий PageRank равен 1. Сумма MiniRank, доступная к передаче, после понижения, составит 1 * 0.85 = 0.85. Так как имеется две гиперссылки, в конце процесса мы должны передать 0.425 Странице В и 0.425 Странице С. Страница В. Одна гиперссылка — передается 0.575 * 0.85 = 0.48875 Странице С, по завершении всех расчетов, связанных со ссылками. На Странице С тоже только одна ссылка, но убойный PageRank 2.275. Поэтому она передает 2.275 * 0.85 = 1.93375 Странице А. Страница D содержит одну ссылку, и передает 1 * 0.85 = 0.85 Странице С. В результате имеем: Страница А — 1.93375 (от Страницы С) + 0.15 (не передаваемое) = 2.08375 Страница В — 0.425 (от Страницы А) + 0.15 (не передаваемое) = 0.575 Страница С — 0.1275 (от Страницы D) + 0.48875 (от Страницы В) + 0.425 (от Страницы А) + 0.15 (не передаваемое) = 1.1925 Страница D — не получает ничего, но сохраняет непередаваемое значение 0.15 = 0.15 Графически:
Но ведь это не может быть правильно!? Страница А сейчас самая важная. Повторим цикл расчетов снова и снова. В конечном счете, значения стабилизируются, и после 20 повторений мы получаем:
У-ух! Наконец мы получили то, что ожидали. Страница С имеет самый высокий PageRank, а Страница А — следующий. Мы продолжаем повторять вычисления, пока числа не будут изменяться слишком значительно. На практике, нужно сделать порядка 50 — 100 циклов расчетов, чтобы сгладить и минимизировать большую погрешность первых вычислений.
Все просто!
Обратная связь PageRank
Но подождите минутку! Что-то происходит между страницами А и С, поэтому давайте посмотрим повнимательнее.
После одного цикла расчетов, Страница С дает Странице А значительное улучшение коэффициента PageRank. В следующем цикле, она получает увеличение своего показателя PageRank, за счет части улучшенного показателя PageRank Страницы А (она получает свою часть обратной связи PageRank). (Примечание Black Box Group — это не создание коэффициента PageRank, Страница А просто получает большую часть от общего количества, потому что она таким образом связана с другими страницами. Когда система ссылается на внешние страницы, а они, в ответ, ссылаются на нее, это может дать некоторое преимущество).
Это и есть обратная связь PageRank. Можно предположить что Google должен не принимать в расчет подобные связи, особенно, если Страница А и Страница С расположены на одном сайте. Фактически, некоторые люди даже высказывали свое мнение, свидетельствующее о том, что все должно быть именно так. На самом деле, Google не может сделать этого. Представьте себе расчеты, учитывающие миллионы страниц, а не четыре... Как вы определите, когда обратная связь имеет место, и как вы избавитесь от нее? И даже если вам это удастся, как вы сможете не учитывать влияние этого фактора на всю систему? Обратная связь PageRank — неотъемлемая и важнейшая черта PageRank. Фактически, без нее PageRank не будет работать должным образом.
Влияя на результаты
Зная принципы работы, и имея в виду, что Google, в некоторых случаях, влияет на результаты PageRank, мы в состоянии точно определить, что может сделать Google:
Перед началом расчета PageRank, давайте допустим, что ссылки сайта особенно хорошие. Пусть Страница В значится в Yahoo или DMOZ (обе директории оказывают подобный эффект), вместо того, чтобы назначить начальный PageRank равным 1, установим его в значение 100, или еще большее число. Посредством этого мы сообщаем, что Google может незначительно изменять результаты PageRank, рассчитанные с участием этой страницы.
Мы можем сделать обратное, но с меньшей эффективностью. Пусть Страница В — определенный спам. Если мы установим ее начальный коэффициент PageRank равным нулю, то она сначала не будет влиять на результаты расчетов. Но, вскоре, она приобретет влияние, коль скоро другие страницы будут ссылаться на нее.
Возьмите на заметку: С помощью PageRank мы можем легко изменять важность ссылок на странице на любую величину, однако, обратное недействительно — PageRank строго препятствует способности изменять важность ссылок на странице.
Именно это, определенно, происходит с сайтами, прописанными в Yahoo и DMOZ. Каждая страница внутри Yahoo или DMOZ, похоже, немного изменяется, в результате чего сайты, прописанные в этих двух директориях, получают небольшое, но заметное, увеличение коэффициента PageRank.
Далее, могут ли они изменять значение PageRank для Страницы В после каждого цикла вычислений? Конечно, могут, но Google обрабатывает миллионы страниц, и должен будет изменять значение каждой такой страницы после каждого цикла. Процесс станет оооооооочень оооооооочень медленным.
Хорошо, а как насчет того, чтобы установить PageRank страницы после того, как расчеты закончены и получены финальные значения PageRank? Действительно, они это могут сделать, и они это делают. Это связано больше с индивидуальными результатами, чем со ссылками. Пусть, к примеру, домашняя страница Google получила невысокое значение PageRank, с точки зрения Google. Они могут запросто изменить это значение. Или, если страница Google с результатами запроса получила значение PageRank, они могут убрать его. Это послеоперационный шаг.
Следует заметить, однако, что немного смысла для Google применять подобную практику, с целью удалить спаммеров из индекса. Пожалуйста, не думайте, что, если ваш PageRank внезапно стал равен нулю, то Google применил подобный метод. Для них намного проще просто полностью запретить страницу. Запрет, также, более логичен, поскольку он удаляет влияние, оказываемое вашей страницей на расчет PageRank. Нулевое значение PageRank, скорее всего, назначается вследствие каких-то других причин, например, временных результатов расчетов.
(Примечание Black Box Group — сказанное выше не является более 100% истиной. Google проявил пренебрежение к точным правилам PageRank, сейчас известны случаи, когда они устанавливали PageRank страницы в ноль, и спокойно жили с этим).
Что все это значит?
PageRank сложнее всего поддается манипулированию при оптимизации ваших страниц. Хотя его значение не настолько велико, как думают многие, если вам удалось получить его должным образом, вы приобретаете существенное преимущество перед вашими конкурентами. Коэффициент PageRank тяжело приобрести, и еще сложнее повысить. Информация, излагаемая ниже, рассматривает идеализированный подход к решению этой задачи. На практике, вы можете использовать методики полностью или частично, в зависимости от того, насколько вы конкурентоспособны, и насколько сильны ваши соперники в рыночной борьбе.
Существует три основные области, на которые нужно обратить внимание, и, возможно, изменить, пытаясь оптимизировать ваш PageRank.
1. Сайты, которые вы выберете для ссылок на вас, т.е., с какими сайтами вы будете вести переговоры, и сколько усилий вы на это потратите.
2. Кого вы выберете для размещения ссылки на вашем сайте, и на какой странице сайта вы разместите ссылку.
3. Внутренняя навигационная структура и гиперсвязи ваших страниц, для создания максимальной обратной связи PageRank.
Ссылки на ваш сайт
В поисках места для размещения ссылок на ваш сайт, оптимальных с точки зрения PageRank, кто-то может подумать, что нужно просто искать страницы с самым высоким коэффициентом PageRank. (Учитывая, при этом, что каждая страница сайта имеет свой собственный PageRank, рассматривать нужно PageRank страницы "Ссылки", или любой другой страницы, на которой будет размещена ссылка). Однако, подобный ход мыслей ошибочен. Если вы не пропустили изложенный выше материал, вы, возможно, уже разобрались, почему это так. Значение PageRank, передаваемое ссылкой, составляется намного сложнее, чем при таком упрощенном подходе. Наверное, было время, когда это приближение работало... но не сейчас. Чем больше людей просят и получают ссылки с сайтов с высоким PageRank, тем менее выгодно это становится делать.
Фактическое количество PageRank с отдельной страницы делится между гиперссылками, размещенными на этой странице (помните расчеты MiniRank?). Поэтому, ссылки со страниц, имеющих одинаковый коэффициент PageRank, не всегда равнозначны. Все зависит от того, сколько других ссылок находится вместе с вашей ссылкой на странице. Например, ссылка со страницы с PageRank 4, может быть лучше, чем ссылка со страницы с PageRank 6, если общее количество ссылок меньше на странице с PR 4. Возможно, что страница с PR 2 окажется предпочтительнее для размещения ссылки, чем страница с PR 7. Сейчас доступно недостаточно информации, чтобы позволить нам понять, до какого предела все это распространяется. Однако, достоверно можно утверждать, что бесполезно делать упор на выбор сайтов с высоким PageRank. Есть еще один, более очевидный аргумент не в пользу подобной стратегии: сайты с высоким PageRank могут быть слишком разборчивыми в вопросе размещения ссылок на другие сайты, что делает получение подобной ссылки более сложной задачей, чем на сайтах с более низким PageRank. При этом сайты, борющиеся за более высокие номера PageRank, должны быть более восприимчивы к обмену ссылками с другими сайтами, ставящими перед собой подобную задачу.
Сейчас давайте учтем эффект обратной связи. Пусть, к примеру, есть две отдельные страницы на чужих сайтах, которые имеют PageRank 4. Обе имеют по десять ссылок на другие страницы. Но ваша страница, на которую вы хотите, чтобы они ссылались, уже имеет ссылку на страницу, принадлежащую второму сайту. Получив ссылку со второго сайта, вы возбуждаете обратную связь, и получаете более высокий PageRank, чем если бы вы получили ссылку с первого сайта! Это чрезмерное упрощение; на самом деле, петли обратной связи могут быть еще более запутанными. Нужно учитывать, что количество ссылок на странице, ссылающейся на вас, изменит величину обратной связи, и т.п.
Можете ли вы разобраться в ситуации с предложенными страницами? Нет — и я тоже не могу. Мой совет, поэтому, следующий: запрашивайте ссылки у сайтов, которые кажутся подходящими и имеют хорошее качество, независимо от их текущего PageRank. Если они сходной с вашим сайтом тематики, и обладают высоким качеством, они либо улучшат ваш Pagerank сейчас, либо сделают это в будущем. А чтобы действительно заставить ваш PageRank бурлить, пропишитесь в DMOZ или Yahoo, чтобы порадоваться искуственно поднятому, с их помощью, коэффициенту PageRank.
Внешние ссылки с вашего сайта
Прежде чем рассмотреть лучшую стратегию внешних ссылок, сначала нужно разобраться со ссылками, ведущими на ваш сайт. Под чем я подразумеваю, что у вас есть несколько ссылок, ведущих на ваш сайт, с таких директорий, как DMOZ и Yahoo, и дающих чувствительный прирост PageRank. Используя внутренние страницы вашего сайта, вы можете контролировать обратную связь намного лучше, чем в случае со ссылками на внешние страницы. Отсюда вытекает правило...
Главным образом, ваша задача — удерживать PageRank в пределах вашего собственного сайта.
Это значит, что вашей целью будет размещение внешних ссылок на странице, у которой низкий PageRank, и которая содержит также значительное количество внутренних ссылок (т.е. ссылок, ведущих на другие страницы вашего сайта).
Правильно используя обратную связь внутри вашего сайта, вы изменяете распределение Pagerank между страницами.
Затем, когда вы создаете ссылки, нужно отдавать предпочтение тем страницам, которые либо ссылаются на вашу страницу с PageRank, большим чем страница ссылок, либо которая связана со страницей, связанной, в свою очередь, со страницей с PageRank большим, чем у страницы ссылок (т.е., вы получите больший прирост PageRank, если ссылки с других сайтов не будут указывать на вашу страницу ссылок).
Как это можно осуществить? Один способ - написать обзоры сайтов, на которые ведут гиперссылки, на отдельной странице вашего сайта, и предоставить ссылки на эти обзоры, вместе с каждой гиперссылкой на внешний сайт. Как вариант, эти страницы могут открываться в новом окне, но НЕ делайте этого при помощи Javascript, потому что поисковые пауки не могут следовать по Javascript-ссылкам.
Удостоверьтесь, что страница с обзором ссылается на страницу вашего сайта с высоким PageRank (Лучше всего, если это ваша главная страница, но подойдет и любая другая). Посредством этого, мы значительно уменьшаем количество PageRank, отдаваемого с вашего сайта! Мы направляем обратную связь на главную страницу, чтобы обеспечить меньший отток через страницу ссылок и максимальное использование возможностей, перенаправленных в какой-нибудь раздел вашего сайта. Ваша страница ссылок, также, должна ссылаться на главную страницу и другие основные страницы вашего сайта. Однако, не размещайте других ссылок на странице обзоров, кроме ссылки на главную страницу. Очень хорошо, если кто-нибудь сделает ссылку на вашу страницу обзоров, поэтому, в дополнение ко всему, вы можете известить другой сайт, что вы написали о нем обзор — весьма вероятно, что вы получите две ссылки на ваш сайт (одну на главную страницу, и другую на обзор их сайта). Все это очень запутано в словесном выражении, поэтому давайте сделаем упрощенный пример, чтобы продемонстрировать принцип и показать его эффект.
Наша простая структура, с начальными знчениями MiniRank, следующая...
После первого цикла расчетов мы получаем...
В конце второго цикла расчетов получаем...
После 20 циклов, мы получаем...
Общий PageRank на сайте 2.1471564527
Теперь, если мы разместим ссылки на страницах с обзорами, ведущие на главную страницу, мы получаем...
И после первого цикла расчетов ...
После двадцати циклов...
Общий MiniRank сайта 5.9025468707 (но мы начали с большим количеством! Вычтем страницы обзоров, и получим 4.9831564267). Что-то дают дополнительные страницы, а что-то — обратная связь. Но в сумме...
Главная страница в 2.67 раза более важна, при использовании второго метода.
Основные страницы "О нас", "Товары" и "Ссылки" в 1.17 раза важнее, при использовании второго метода.
Это хорошо демонстрирует силу обратной связи. Мы направляем часть голосов наших страниц со ссылками обратно на наш сайт, вместо того, чтобы передавать их внешним сайтам вместе со ссылками на них. Вот почему большие сайты, в целом, имеют лучший PageRank, чем меньшие сайты. Так почему же вы этого еще не делаете????!!!! Начинайте писать обзоры сайтов, размещенных на вашей странице ссылок, прямо сейчас! (Заметьте, числа взяты в демонстрационных целях, как основной показатель эффективности данной методики, — фактические показатели могут быть другими).
(Примечание Black Box Group — тем, кто критически относится к рассматриваемой системе MiniRank, полезно узнать, что вышеприведенные результаты будут еще более ярко выражены при использовании настоящей формулы PageRank).
Внутренняя структура и гиперссылки
Поговорив о внешних гиперссылках, имеет смысл рассказать о том, как влияет на PageRank внутренняя структура ссылок вашего сайта. Давайте оживим в памяти несколько фактов:
Чем больше страниц имеет отдельный сайт в индексе Google, тем выше общий стартовый PageRank сайта, и тем большее количество PageRank для распределения. Из-за того, что каждая страница наделяется одинаковым начальным значением, перед началом расчета PageRank, чем больше страниц, тем лучше. Рассуждая логически, если у нас большее количество PageRank в начале, то и эффект обратной связи будет более значительным. Обращали внимание, что большие сайты обычно имеют лучший PageRank? Эффект обратной связи поможет объяснить, почему. Естественно, ваши страницы должны быть осмысленными и содержательными, чтобы для начала попасть в индекс. (Обзоры в последнем разделе служат хорошим примером подобных страниц).
Обратная связь — естественный эффект процесса расчета PageRank. Она происходит при анализе ссылок внутри сайта, и является определяющей при оценке Google, какие страницы сайта являются самыми важными. Если у сайта нет входящих или исходящих гиперссылок, структура сайта все равно создаст такое же количество обратной связи. Если же учитывать входящие и исходящие ссылки, внутренняя организация сайта имеет большое значение. Например, если у сайта есть исходящие ссылки на странице, мы попытаемся сохранить минимальным PageRank этой страницы.
Существует три разных способа взаимосвязи страниц внутри сайта. На практике, веб-сайты могут использовать их различные комбинации. Комбинирование вполне хорошо и нормально, если вы понимаете разницу между ссылками, и каким образом они воздействуют на ваш PageRank. В данном документе, мы рассмотрим разные способы гиперсвязей как отдельные объекты. Мы имеем:
Иерархические
Циклические
Избыточные взаимосвязи
Имейте в виду, что мы не обязательно хотим, чтобы PageRank равномерно распределялся по всему сайту. Мы хотим получить максимальную обратную связь в системе (коль скоро на сайте существуют внутренние и внешние ссылки), и нам это нужно, чтобы сконцентрироваться на отдельных страницах (т.е., на оптимизированных по ключевым словам, и т.п.). Так как я уже подробно показывал вам расчет PageRank, я просто продемонстрирую результаты каждого вида гиперссылок после 20 циклов расчетов.
Иерархические
Циклические
Избыточные взаимосвязи
Заметьте, что общее количество PageRank в пределах сайта остается неизменным (4). Это происходит потому, что пока отсутствуют входящие и исходящие ссылки. Что имеет значение — это распределение. Иерархическая структура перемещает большее количество PageRank в сторону главной страницы (другие сайты, скорее всего, будут ссылаться на главную страницу, которая имеет тенденцию содержать меньше исходящих ссылок). Пока нет очевидной разницы между циклическими и избыточными взаимосвязями. Давайте посмотрим, что произойдет, если мы усложним структуру и добавим внешние входящие и исходящие ссылки...
Иерархические
Циклические
Избыточные взаимосвязи
Хотя эти примеры учитывают только несколько циклов расчетной формулы, они уже показывают правила взаимных ссылок внутри сайта:
Избыточные взаимосвязи создают гранично лучшую обратную связь PageRank, чем иерархические ссылки, и оба вида создают гранично лучшую обратную связь PageRank, чем Циклические ссылки. С большим количеством иерархических ссылок, более высоким страницам в структуре назначается более высокий уровень PageRank. Это означает, что мы отдаем внешним ссылкам меньшее количество PageRank.
На практике это означает, что вы должны сочетать рассмотренные методы гиперссылок. Правила следующие...
1. Там, где группа страниц должна содержать исходящие ссылки, используйте иерархическую структуру.
2. Там, где группа страниц не должна содержать исходящие ссылки, используйте структуру избыточных ссылок, но распространяйте ее включением ссылок на главную страницу.
3. Если отдельная страница очень важна, поместите ее выше в иерархической структуре.
Как использовать карту вашего сайта в целях улучшения Pagerank.
Многие люди верят, что карта сайта помогает поисковым паукам находить страницы. Я в этом не уверен, но, в силу их популярности и учитывая тот факт, что они задействуют некоторые очень хорошие ссылки посредством текстов ссылок, давайте посмотрим, как их лучше создавать, с точки зрения PageRank.
Главное, сделайте ссылку на карту сайта со своей главной страницы, как обычно. Помните, что наличие карты сайта существенно снижает PageRank ваших других страниц (особенно, если на нее ссылается страница вашего сайта с самым высоким знаачением PageRank. Поэтому мы хотим убедиться, что страница карты сайта делает следующие две вещи:
1. Увеличивает ваше общее стартовое количество PageRank.
2. Обеспечивает максимально возможную обратную связь PageRank.
Первое условие слегка противоречиво. Чтобы заставить карту сайта увеличивать начальное значение PageRank вашего сайта, нужно разбить ее на несколько страниц. Вы можете возразить: "Но это усложнит работу поискового паука, не так ли?" Ответ будет "И да, и нет". Иногда для паука сложнее проследить сотни ссылок, ведущие с одной страницы. Однако, любой современный паук, который "не даром ест свой хлеб", индексирует страницы достаточно глубоко, чтобы справиться с картой сайта, распределенной между несколькими страницами.
Сейчас давайте разберемся с максимизацией обратной связи PageRank. Каждая страница карты сайта должна иметь ссылку на вашу главную страницу и на другие значимые страницы на вашем сайте. Если страница карты сайта ссылается на вашу страницу, которая, в свою очередь, содержит ссылки на внешние сайты, то вы должны особенно внимательно минимизировать количество PageRank, которое через эти страницы "просочится" с вашего сайта.
Итак, вот что вы может сделать...
Разбейте карту вашего сайта на категории, и назначьте каждой категории собственную страницу. Ваша карта сайта становится индексом этих страниц-категорий (вместо того, чтобы быть картой всего сайта). В каждой категории вы можете разместить до 30 ссылок. Вы должны, также, вместе со ссылкой дать описание содержимого каждой страницы. Если вы прописываете страницу, содержащую внешние ссылки, в одну из категорий вашей карты сайта, выбирайте категорию, которая содержит наибольшее количество ссылок.
Далее, вы должны взаимно связать все страницы-категории, наряду с индексом категорий (вашей изначальной картой сайта). Для этого, просто поместите на каждой странице навигационное меню, ведущее на индексную страницу категорий, и на другие страницы-категории. Не забудьте включить, также, ссылки на главную и основные страницы.
Это позволит максимизировать обратную связь и сохраняет низкое значение PageRank для страниц карты сайта. Основная идея — добиться минимальной утечки PageRank сайта через карту сайта в целом.
Заключительное слово
PageRank — слишком сложный вопрос, который часто понимается неправильно. Я думаю, полезно еще раз повторить некоторые особенности этого документа и метода PageRank. Этот документ находится в развитии и останется в таком состоянии, похоже, еще длительное время. На сегодняшний день, у нас недостаточно информации, чтобы на 100% быть уверенным в чем-либо. Я только излагаю теории, основанные на лучшей доступной информации, и в большинстве подтверждающиеся практикой. Google позволяет нам получать информацию о PageRank посредством навигационной панели Google. Когда вы будете смотреть на эту панель, я надеюсь, вы будете помнить, по крайней мере, одну вещь из сказанного выше — "Панель Google не совсем точно сообщает вам значение PageRank сайта, но сейчас это единственный инструмент, который может дать вам хоть какую-то информацию."
У метода PageRank есть свое место в процессе ранжирования. Это место не такое высокое, как некоторые могут вообразить. Его значение в алгоритме рейтинга меньше, чем многих других факторов, таких, как тэги заголовков (Title tags) и тексты ссылок (anchor text). Оптимизация сайта для одного PageRank не даст вам хороших позиций. В основе PageRank лежит то, что им очень трудно манипулировать. Так что, если вы получите хороший коэффициент PageRank, вашим конкурентам придется потрудиться, чтобы уравняться с вами. Стоит ли тратить ваше время на детальную оптимизацию PageRank, решайте сами, в зависимости от уровня ваших конкурентов. Я полагаю, что как минимум, не помешает понять, как работает PageRank, и постоянно помнить о нем при внесении изменений или создании новых сайтов, подобно тому, как мы помним о других факторах (ключевые слова, тексты ссылок и т.п.).
Этот документ изначально был подготовлен, написан и обоснован Крисом Райдинсом (Chris Ridings). В исходном материале использовалась модель, названная "MiniRank". "MiniRank" была очень похожа на "PageRank". Использование модели "MiniRank" было осознанным, и позволило автору вывести и описать принципы функционирования системы. Однако, с течением времени, понимание людьми метода PageRank улучшилось, и возникла необходимость более точного описания механизмов его функционирования. Обновлением этого документа занялась группа Black Box Group. Мы внесли в документ незначительные изменения, чтобы обеспечить большую точность, но, необходимо отметить, что ВСЕ изначальные принципы и идеи остались нетронутыми.
Довольно вступлений... пора приступить к предмету, рассматриваемому в данной статье - методу PageRank.
Что такое PageRank?
PageRank — это метод поисковой системы Google, определяющий "важность" страницы. Когда учтены все другие факторы, такие как тэг заголовка (Title tag) и ключевые слова (keywords), Google использует PageRank, чтобы распределить результаты запроса. Более "важные" сайты занимают более высокую позицию в результате запроса пользователя.
Таким образом, порядок работы системы классификации Google следующий:
1. Найти все страницы, соответствующие ключевым словам поиска.
2. Расположить их соответствующим образом, используя "страничные факторы" - ключевые слова.
3. Учесть содержащийся на странице текст ссылок.
4. Привести результаты в соответствие с коэффициентами PageRank.
Как определяется PageRank?
Теория Google гласит: если страница А ссылается на страницу В, то страница А говорит, что страница В — важная страница. Фактический текст гиперссылки для PageRank не имеет значения. PageRank учитывает, также, важность ссылок на страницу. Если на страницу ведут более важные ссылки, то ее ссылки на другие страницы также становятся более важными.
Насколько значителен PageRank?
Значительность каждого составляющего фактора в алгоритмах поисковой системы зависит от качества поставляемой им информации. Поэтому имеет смысл рассмотреть вначале это качество информации.
Когда Google был еще Гугленышем в пеленках, вероятно, было справедливо утверждать, что гиперссылка являлась точным индикатором рекомендации. Однако, сейчас подобное заявление уже не совсем верно, в силу двух причин:
1. Интернет значительно изменился. Гиперссылка сегодня может вести как на родственный по тематике сайт, так и на лицензионные требования, или быть простым жестом вежливости (как в случае с обменом гиперссылками), но никак не настоящей рекомендацией.
2. Коль скоро вы сделали поисковую систему, рассматривающую ссылки как рекомендации, люди станут пытаться воздействовать на эти ссылки. Если на ссылки оказывается воздействие — они не являются более рекомендациями.
Таким образом, надежность информации, предоставляемой ссылками, не обязательно высока, причем эта надежность постоянно уменьшается. Это отражается в низкой (с тенденцией к снижению) важности PageRank в алгоритме классификации Google. (Примечание Black Box Group — влияние PageRank на классификацию сейчас самое низкое - май 2002 г.). Однако, у PageRank есть один оправдательный фоктор. На него сложнее повлиять, чем на любой другой метод классификации. Это означает, что в нем заложен потенциал, дающий вам преимущество перед конкурентами, при использовании совместно с другими способами позиционирования в поисковой системе. Однако, хочу сразу вас предупредить: в решении данного вопроса не существует коротких путей. Чтобы использовать PageRank эффективно, нужно до конца понять его принципы, иначе вы, скорее всего, потратите свое время не лучшим образом.
Несколько основных фактов относительно PageRank
Для понимания остальной части этого документа, необходимо рассмотреть некоторые факты, касающиеся PageRank.
1. PageRank — это число, которое оценивает только удельный вес "голосов" для всех гиперссылок, ведущих на страницу, и насколько высоко они рекомендуют эту страницу.
2. каждая уникальная страница, индексируемая в Google, имеет свой коэффициент PageRank. Зачастую люди, ошибочно, принимают PageRank главной страницы за PageRank всего сайта.
3. Ссылки внутри сайта учитываются при расчете PageRank для других страниц сайта.
4. PageRank рассчитывается отдельно. Он не связан с текстом (названиями) ссылок, и т.п. Конечно, они взаимосвязаны, но утверждать, что это одно и то же, все равно, что сказать: "Тэги заголовка — то же самое, что ключевые слова в тексте".
Как можно определить, какой у страницы PageRank?
Вы можете скачать навигационную панель для браузера Internet Explorer по адресу http://toolbar.google.com . После установки, графическая панель в верхней части браузера будет показывать значение PageRank для просматриваемой страницы. Если вы наведете курсор мыши на панель, вы увидите число от нуля до десяти. (Если вы не видите число, у вас установлена старая версия навигационной панели. Полностью удалите ее, перезагрузите компьютер, установите последнюю версию, и тогда у вас появится возможность видеть число PageRank.)
Навигационная панель Google не очень точно показывает вам коэффициент PageRank сайта, но, на настощий момент, это единственный инструмент, который может хоть как-нибудь вас сориентировать. Коль скоро вам известны ограничения навигационной панели, то вы, по крайней мере, знаете, что за число вам показывают. Существует два ограничения для навигационной панели Google:
1. Панель иногда "угадывает". Если вы загружаете страницу, которая не проиндексирована системой Google, но существует страница, очень близко к ней расположенная в индексе Google, то вам будет показано угаданное значение PageRank. Это угаданное значение нас совершенно не интересует, потому что оно не используется в расчетах PageRank. Есть только один способ определить угаданное значение —набрать URL страницы в поисковой форме Google и посмотреть, будет ли найдена эта страница. Если нет, то значение было угадано!
2. Навигационная панель — это просто демонстрация фактического PageRank. В то время, как PageRank — нелинейная функция, для ее демонстрации был выбран линейный график. На навигационной панели, для перемещения от значения PageRank 2 к значению 3, требуется меньший подъем, чем для перемещения от 3 к 4. Лучше всего это иллюстрирует сравнительная таблица. Поскольку настоящие значения хранятся в секрете, мы используем для демонстрации условные значения.
Если фактический PageRank находится между Навигационная панель показывает 0.00000001 и 5 —1 6 и 25 — 2 25 и 125 — 3 126 и 625 — 4 626 и 3125 — 5 3126 и 15625 — 6 15626 и 78125 — 7 78126 и 390625 — 8 390626 и 1953125 — 9 1953126 и бесконечность — 10
Хочется верить, что вы поняли, насколько ограничена информация, получаемая из навигационной панели.
(Примечание Black Box Group — со времени написания статьи ситуация изменилась. Вполне вероятно, что сейчас на точность показаний навигационной панели влияют другие факторы, не имеющие ничего общего с методом PageRank).
Далее я буду использовать термин "Фактический PR" для ссылки на настоящее значение PageRank, хранимое в Google, и "Навигационный PR", при упоминании довольно ограниченного представления значения PageRank, которое нам позволяет увидеть навигационная панель Google.
Расчет PageRank
Объяснив, что такое PageRank, т.е., что вы видите, когда получаете о нем информацию, и насколько он важен, в этом разделе я расскажу вам, как он рассчитывается. Знать это не обязательно; однако, если вы поймете механизм, вам будет проще разобраться, как нужно применять коэффициент PageRank.
Когда Google еще находился на стадии испытания, была опубликована формула, присваивающая странице коэффициент PageRank. Возможно, сейчас используется не именно эта формула, но она выглядит вполне достоверной. Вот она...(*1)
PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))
Где PR(A) — PageRank страницы А (значение, которое мы хотим вывести).
D — понижающий коэффициент. Обычно он имеет значение 0.85 .
PR(T1) — PageRank сайта, ссылающегося на страницу А.
C(T1) — количество ссылок, ведущих с этой страницы.
PR(Tn)/C(Tn) означает, что мы делаем это для всех страниц, ссылающихся на страницу А.
(*1)1 Source: The Anatomy of a Large-Scale Hypertextual Web Search Engine, Sergey Brin and Lawrence Page, http://www-db.stanford.edu/~backrub/google.html
М-да! Для тех, кто далек от математики, в этой формуле скрыт подвох — вы не сможете взять и сразу рассчитать PageRank. Чтобы рассчитать PageRank страницы А, нужно знать PageRank всех страниц, ссылающихся на нее. Их значение PageRank, в свою очередь, будет частично зависеть от страницы А, указывающей на них, или каких-то других сайтов! Какая глупая формула. Но что она сообщает нам, так это одну очень важную вещь, касающуюся значения PageRank для любой страницы...
Значение PageRank, присваиваемое странице А страницей В, ссылающейся на нее, уменьшается с каждой ссылкой, существующей на странице В. Это значит, что PageRank страницы — это, по сути, измерение ее "избирательного голоса": этот голос может быть отдан одной ссылке, или двум, или многим, но его суммарное значение останется неизменным.
Сейчас давайте на время забудем об этой формуле, потому что намного нагляднее рассмотреть пример ее применения, который очень похож на метод PageRank. Это поможет нам лучше понять весь процесс.
Для этого примера, у нас есть четыре страницы —условно озаглавленные Страница А, Страница В, Страница С и Страница D. Они связаны друг с другом, как показано на следующей диаграмме.
Для начала, мы не знаем, какое значение PageRank у страниц, поэтому мы просто его присвоим. Для простоты, выберем номер один. И диаграмма с графиком PageRank приобретет вид...
Пока все просто! Сейчас нужно запомнить правила передачи коэффициента. Сначала, мы применяем понижающий коэффициент. (Понижающий коэффициент, в основном, сообщает, что страница не может голосовать за другую страницу, определяя ее важность, равную своей собственной важности. Это значит, что страницы, до которых сложнее добраться в сети, имеют меньшую важность). Затем мы делим оставшееся значение на количество ссылок. Мы распределяем ту часть коэффициента, которую нужно передать всем и каждой ссылающейся странице, прежде чем, в конечном счете, прибавить к 0.15, которое на передавалось.
Итак, посмотрим сначала на Страницу А. Значение PageRank, доступное для передачи другим страницам, после понижения составит 1 * 0.85 = 0.85. На этой странице две гиперссылки, поэтому, в конечном счете, мы прибавим 0.425 к значению PageRank страницы В и 0.425 — к значению PageRank страницы С. Сделать это мы сможем, лишь после подсчета ссылок на всех страницах, в противном случае мы получим искаженные результаты.
Далее, Страница В. На ней всего одна гиперссылка. Поэтому она передает 1 * 0.85 Странице С, после подсчета значений для всех ссылок.
Страница С также содержит только одну гиперссылку. Поэтому она передает 1 * 0.85 = 0.85 Странице А.
На странице D одна гиперссылка, и она передает 0.85 Странице С.
Каждая страница не передает 0.15, поэтому общая сумма включает и эту составляющую. Итак, мы получаем:
Страница А - 0.85 (от Страницы С) + 0.15 (не передаваемое) = 1
Страница В - 0.425 (от Страницы А) + 0.15 (не передаваемое) = 0.575
Страница С - 0.85 (от Страницы D) + 0.85 (от Страницы В) + 0.425 (от Страницы А) + 0.15 (не передаваемое) = 2.275
Страница D - не получает ничего, но сохраняет непередаваемое значение 0.15 = 0.15
Графически:
Новые суммы PageRank показывают, насколько важна Страница С. Но мы еще не закончили. Поскольку все страницы стартовали с одинаковыми значениями, мы, фактически, подсчитали только популярность ссылок (link popularity). Суть PageRank состоит в том, что лучше "связанные" страницы должны получить большее число голосов; поэтому мы должны снова повторить расчеты. На этот раз Страница С имеет большее влияние, потому что ее текущий PageRank выше. Итак, давайте посмотрим сначала на Страницу А. Ее текущий PageRank равен 1. Сумма MiniRank, доступная к передаче, после понижения, составит 1 * 0.85 = 0.85. Так как имеется две гиперссылки, в конце процесса мы должны передать 0.425 Странице В и 0.425 Странице С. Страница В. Одна гиперссылка — передается 0.575 * 0.85 = 0.48875 Странице С, по завершении всех расчетов, связанных со ссылками. На Странице С тоже только одна ссылка, но убойный PageRank 2.275. Поэтому она передает 2.275 * 0.85 = 1.93375 Странице А. Страница D содержит одну ссылку, и передает 1 * 0.85 = 0.85 Странице С. В результате имеем: Страница А — 1.93375 (от Страницы С) + 0.15 (не передаваемое) = 2.08375 Страница В — 0.425 (от Страницы А) + 0.15 (не передаваемое) = 0.575 Страница С — 0.1275 (от Страницы D) + 0.48875 (от Страницы В) + 0.425 (от Страницы А) + 0.15 (не передаваемое) = 1.1925 Страница D — не получает ничего, но сохраняет непередаваемое значение 0.15 = 0.15 Графически:
Но ведь это не может быть правильно!? Страница А сейчас самая важная. Повторим цикл расчетов снова и снова. В конечном счете, значения стабилизируются, и после 20 повторений мы получаем:
У-ух! Наконец мы получили то, что ожидали. Страница С имеет самый высокий PageRank, а Страница А — следующий. Мы продолжаем повторять вычисления, пока числа не будут изменяться слишком значительно. На практике, нужно сделать порядка 50 — 100 циклов расчетов, чтобы сгладить и минимизировать большую погрешность первых вычислений.
Все просто!
Обратная связь PageRank
Но подождите минутку! Что-то происходит между страницами А и С, поэтому давайте посмотрим повнимательнее.
После одного цикла расчетов, Страница С дает Странице А значительное улучшение коэффициента PageRank. В следующем цикле, она получает увеличение своего показателя PageRank, за счет части улучшенного показателя PageRank Страницы А (она получает свою часть обратной связи PageRank). (Примечание Black Box Group — это не создание коэффициента PageRank, Страница А просто получает большую часть от общего количества, потому что она таким образом связана с другими страницами. Когда система ссылается на внешние страницы, а они, в ответ, ссылаются на нее, это может дать некоторое преимущество).
Это и есть обратная связь PageRank. Можно предположить что Google должен не принимать в расчет подобные связи, особенно, если Страница А и Страница С расположены на одном сайте. Фактически, некоторые люди даже высказывали свое мнение, свидетельствующее о том, что все должно быть именно так. На самом деле, Google не может сделать этого. Представьте себе расчеты, учитывающие миллионы страниц, а не четыре... Как вы определите, когда обратная связь имеет место, и как вы избавитесь от нее? И даже если вам это удастся, как вы сможете не учитывать влияние этого фактора на всю систему? Обратная связь PageRank — неотъемлемая и важнейшая черта PageRank. Фактически, без нее PageRank не будет работать должным образом.
Влияя на результаты
Зная принципы работы, и имея в виду, что Google, в некоторых случаях, влияет на результаты PageRank, мы в состоянии точно определить, что может сделать Google:
Перед началом расчета PageRank, давайте допустим, что ссылки сайта особенно хорошие. Пусть Страница В значится в Yahoo или DMOZ (обе директории оказывают подобный эффект), вместо того, чтобы назначить начальный PageRank равным 1, установим его в значение 100, или еще большее число. Посредством этого мы сообщаем, что Google может незначительно изменять результаты PageRank, рассчитанные с участием этой страницы.
Мы можем сделать обратное, но с меньшей эффективностью. Пусть Страница В — определенный спам. Если мы установим ее начальный коэффициент PageRank равным нулю, то она сначала не будет влиять на результаты расчетов. Но, вскоре, она приобретет влияние, коль скоро другие страницы будут ссылаться на нее.
Возьмите на заметку: С помощью PageRank мы можем легко изменять важность ссылок на странице на любую величину, однако, обратное недействительно — PageRank строго препятствует способности изменять важность ссылок на странице.
Именно это, определенно, происходит с сайтами, прописанными в Yahoo и DMOZ. Каждая страница внутри Yahoo или DMOZ, похоже, немного изменяется, в результате чего сайты, прописанные в этих двух директориях, получают небольшое, но заметное, увеличение коэффициента PageRank.
Далее, могут ли они изменять значение PageRank для Страницы В после каждого цикла вычислений? Конечно, могут, но Google обрабатывает миллионы страниц, и должен будет изменять значение каждой такой страницы после каждого цикла. Процесс станет оооооооочень оооооооочень медленным.
Хорошо, а как насчет того, чтобы установить PageRank страницы после того, как расчеты закончены и получены финальные значения PageRank? Действительно, они это могут сделать, и они это делают. Это связано больше с индивидуальными результатами, чем со ссылками. Пусть, к примеру, домашняя страница Google получила невысокое значение PageRank, с точки зрения Google. Они могут запросто изменить это значение. Или, если страница Google с результатами запроса получила значение PageRank, они могут убрать его. Это послеоперационный шаг.
Следует заметить, однако, что немного смысла для Google применять подобную практику, с целью удалить спаммеров из индекса. Пожалуйста, не думайте, что, если ваш PageRank внезапно стал равен нулю, то Google применил подобный метод. Для них намного проще просто полностью запретить страницу. Запрет, также, более логичен, поскольку он удаляет влияние, оказываемое вашей страницей на расчет PageRank. Нулевое значение PageRank, скорее всего, назначается вследствие каких-то других причин, например, временных результатов расчетов.
(Примечание Black Box Group — сказанное выше не является более 100% истиной. Google проявил пренебрежение к точным правилам PageRank, сейчас известны случаи, когда они устанавливали PageRank страницы в ноль, и спокойно жили с этим).
Что все это значит?
PageRank сложнее всего поддается манипулированию при оптимизации ваших страниц. Хотя его значение не настолько велико, как думают многие, если вам удалось получить его должным образом, вы приобретаете существенное преимущество перед вашими конкурентами. Коэффициент PageRank тяжело приобрести, и еще сложнее повысить. Информация, излагаемая ниже, рассматривает идеализированный подход к решению этой задачи. На практике, вы можете использовать методики полностью или частично, в зависимости от того, насколько вы конкурентоспособны, и насколько сильны ваши соперники в рыночной борьбе.
Существует три основные области, на которые нужно обратить внимание, и, возможно, изменить, пытаясь оптимизировать ваш PageRank.
1. Сайты, которые вы выберете для ссылок на вас, т.е., с какими сайтами вы будете вести переговоры, и сколько усилий вы на это потратите.
2. Кого вы выберете для размещения ссылки на вашем сайте, и на какой странице сайта вы разместите ссылку.
3. Внутренняя навигационная структура и гиперсвязи ваших страниц, для создания максимальной обратной связи PageRank.
Ссылки на ваш сайт
В поисках места для размещения ссылок на ваш сайт, оптимальных с точки зрения PageRank, кто-то может подумать, что нужно просто искать страницы с самым высоким коэффициентом PageRank. (Учитывая, при этом, что каждая страница сайта имеет свой собственный PageRank, рассматривать нужно PageRank страницы "Ссылки", или любой другой страницы, на которой будет размещена ссылка). Однако, подобный ход мыслей ошибочен. Если вы не пропустили изложенный выше материал, вы, возможно, уже разобрались, почему это так. Значение PageRank, передаваемое ссылкой, составляется намного сложнее, чем при таком упрощенном подходе. Наверное, было время, когда это приближение работало... но не сейчас. Чем больше людей просят и получают ссылки с сайтов с высоким PageRank, тем менее выгодно это становится делать.
Фактическое количество PageRank с отдельной страницы делится между гиперссылками, размещенными на этой странице (помните расчеты MiniRank?). Поэтому, ссылки со страниц, имеющих одинаковый коэффициент PageRank, не всегда равнозначны. Все зависит от того, сколько других ссылок находится вместе с вашей ссылкой на странице. Например, ссылка со страницы с PageRank 4, может быть лучше, чем ссылка со страницы с PageRank 6, если общее количество ссылок меньше на странице с PR 4. Возможно, что страница с PR 2 окажется предпочтительнее для размещения ссылки, чем страница с PR 7. Сейчас доступно недостаточно информации, чтобы позволить нам понять, до какого предела все это распространяется. Однако, достоверно можно утверждать, что бесполезно делать упор на выбор сайтов с высоким PageRank. Есть еще один, более очевидный аргумент не в пользу подобной стратегии: сайты с высоким PageRank могут быть слишком разборчивыми в вопросе размещения ссылок на другие сайты, что делает получение подобной ссылки более сложной задачей, чем на сайтах с более низким PageRank. При этом сайты, борющиеся за более высокие номера PageRank, должны быть более восприимчивы к обмену ссылками с другими сайтами, ставящими перед собой подобную задачу.
Сейчас давайте учтем эффект обратной связи. Пусть, к примеру, есть две отдельные страницы на чужих сайтах, которые имеют PageRank 4. Обе имеют по десять ссылок на другие страницы. Но ваша страница, на которую вы хотите, чтобы они ссылались, уже имеет ссылку на страницу, принадлежащую второму сайту. Получив ссылку со второго сайта, вы возбуждаете обратную связь, и получаете более высокий PageRank, чем если бы вы получили ссылку с первого сайта! Это чрезмерное упрощение; на самом деле, петли обратной связи могут быть еще более запутанными. Нужно учитывать, что количество ссылок на странице, ссылающейся на вас, изменит величину обратной связи, и т.п.
Можете ли вы разобраться в ситуации с предложенными страницами? Нет — и я тоже не могу. Мой совет, поэтому, следующий: запрашивайте ссылки у сайтов, которые кажутся подходящими и имеют хорошее качество, независимо от их текущего PageRank. Если они сходной с вашим сайтом тематики, и обладают высоким качеством, они либо улучшат ваш Pagerank сейчас, либо сделают это в будущем. А чтобы действительно заставить ваш PageRank бурлить, пропишитесь в DMOZ или Yahoo, чтобы порадоваться искуственно поднятому, с их помощью, коэффициенту PageRank.
Внешние ссылки с вашего сайта
Прежде чем рассмотреть лучшую стратегию внешних ссылок, сначала нужно разобраться со ссылками, ведущими на ваш сайт. Под чем я подразумеваю, что у вас есть несколько ссылок, ведущих на ваш сайт, с таких директорий, как DMOZ и Yahoo, и дающих чувствительный прирост PageRank. Используя внутренние страницы вашего сайта, вы можете контролировать обратную связь намного лучше, чем в случае со ссылками на внешние страницы. Отсюда вытекает правило...
Главным образом, ваша задача — удерживать PageRank в пределах вашего собственного сайта.
Это значит, что вашей целью будет размещение внешних ссылок на странице, у которой низкий PageRank, и которая содержит также значительное количество внутренних ссылок (т.е. ссылок, ведущих на другие страницы вашего сайта).
Правильно используя обратную связь внутри вашего сайта, вы изменяете распределение Pagerank между страницами.
Затем, когда вы создаете ссылки, нужно отдавать предпочтение тем страницам, которые либо ссылаются на вашу страницу с PageRank, большим чем страница ссылок, либо которая связана со страницей, связанной, в свою очередь, со страницей с PageRank большим, чем у страницы ссылок (т.е., вы получите больший прирост PageRank, если ссылки с других сайтов не будут указывать на вашу страницу ссылок).
Как это можно осуществить? Один способ - написать обзоры сайтов, на которые ведут гиперссылки, на отдельной странице вашего сайта, и предоставить ссылки на эти обзоры, вместе с каждой гиперссылкой на внешний сайт. Как вариант, эти страницы могут открываться в новом окне, но НЕ делайте этого при помощи Javascript, потому что поисковые пауки не могут следовать по Javascript-ссылкам.
Удостоверьтесь, что страница с обзором ссылается на страницу вашего сайта с высоким PageRank (Лучше всего, если это ваша главная страница, но подойдет и любая другая). Посредством этого, мы значительно уменьшаем количество PageRank, отдаваемого с вашего сайта! Мы направляем обратную связь на главную страницу, чтобы обеспечить меньший отток через страницу ссылок и максимальное использование возможностей, перенаправленных в какой-нибудь раздел вашего сайта. Ваша страница ссылок, также, должна ссылаться на главную страницу и другие основные страницы вашего сайта. Однако, не размещайте других ссылок на странице обзоров, кроме ссылки на главную страницу. Очень хорошо, если кто-нибудь сделает ссылку на вашу страницу обзоров, поэтому, в дополнение ко всему, вы можете известить другой сайт, что вы написали о нем обзор — весьма вероятно, что вы получите две ссылки на ваш сайт (одну на главную страницу, и другую на обзор их сайта). Все это очень запутано в словесном выражении, поэтому давайте сделаем упрощенный пример, чтобы продемонстрировать принцип и показать его эффект.
Наша простая структура, с начальными знчениями MiniRank, следующая...
После первого цикла расчетов мы получаем...
В конце второго цикла расчетов получаем...
После 20 циклов, мы получаем...
Общий PageRank на сайте 2.1471564527
Теперь, если мы разместим ссылки на страницах с обзорами, ведущие на главную страницу, мы получаем...
И после первого цикла расчетов ...
После двадцати циклов...
Общий MiniRank сайта 5.9025468707 (но мы начали с большим количеством! Вычтем страницы обзоров, и получим 4.9831564267). Что-то дают дополнительные страницы, а что-то — обратная связь. Но в сумме...
Главная страница в 2.67 раза более важна, при использовании второго метода.
Основные страницы "О нас", "Товары" и "Ссылки" в 1.17 раза важнее, при использовании второго метода.
Это хорошо демонстрирует силу обратной связи. Мы направляем часть голосов наших страниц со ссылками обратно на наш сайт, вместо того, чтобы передавать их внешним сайтам вместе со ссылками на них. Вот почему большие сайты, в целом, имеют лучший PageRank, чем меньшие сайты. Так почему же вы этого еще не делаете????!!!! Начинайте писать обзоры сайтов, размещенных на вашей странице ссылок, прямо сейчас! (Заметьте, числа взяты в демонстрационных целях, как основной показатель эффективности данной методики, — фактические показатели могут быть другими).
(Примечание Black Box Group — тем, кто критически относится к рассматриваемой системе MiniRank, полезно узнать, что вышеприведенные результаты будут еще более ярко выражены при использовании настоящей формулы PageRank).
Внутренняя структура и гиперссылки
Поговорив о внешних гиперссылках, имеет смысл рассказать о том, как влияет на PageRank внутренняя структура ссылок вашего сайта. Давайте оживим в памяти несколько фактов:
Чем больше страниц имеет отдельный сайт в индексе Google, тем выше общий стартовый PageRank сайта, и тем большее количество PageRank для распределения. Из-за того, что каждая страница наделяется одинаковым начальным значением, перед началом расчета PageRank, чем больше страниц, тем лучше. Рассуждая логически, если у нас большее количество PageRank в начале, то и эффект обратной связи будет более значительным. Обращали внимание, что большие сайты обычно имеют лучший PageRank? Эффект обратной связи поможет объяснить, почему. Естественно, ваши страницы должны быть осмысленными и содержательными, чтобы для начала попасть в индекс. (Обзоры в последнем разделе служат хорошим примером подобных страниц).
Обратная связь — естественный эффект процесса расчета PageRank. Она происходит при анализе ссылок внутри сайта, и является определяющей при оценке Google, какие страницы сайта являются самыми важными. Если у сайта нет входящих или исходящих гиперссылок, структура сайта все равно создаст такое же количество обратной связи. Если же учитывать входящие и исходящие ссылки, внутренняя организация сайта имеет большое значение. Например, если у сайта есть исходящие ссылки на странице, мы попытаемся сохранить минимальным PageRank этой страницы.
Существует три разных способа взаимосвязи страниц внутри сайта. На практике, веб-сайты могут использовать их различные комбинации. Комбинирование вполне хорошо и нормально, если вы понимаете разницу между ссылками, и каким образом они воздействуют на ваш PageRank. В данном документе, мы рассмотрим разные способы гиперсвязей как отдельные объекты. Мы имеем:
Иерархические
Циклические
Избыточные взаимосвязи
Имейте в виду, что мы не обязательно хотим, чтобы PageRank равномерно распределялся по всему сайту. Мы хотим получить максимальную обратную связь в системе (коль скоро на сайте существуют внутренние и внешние ссылки), и нам это нужно, чтобы сконцентрироваться на отдельных страницах (т.е., на оптимизированных по ключевым словам, и т.п.). Так как я уже подробно показывал вам расчет PageRank, я просто продемонстрирую результаты каждого вида гиперссылок после 20 циклов расчетов.
Иерархические
Циклические
Избыточные взаимосвязи
Заметьте, что общее количество PageRank в пределах сайта остается неизменным (4). Это происходит потому, что пока отсутствуют входящие и исходящие ссылки. Что имеет значение — это распределение. Иерархическая структура перемещает большее количество PageRank в сторону главной страницы (другие сайты, скорее всего, будут ссылаться на главную страницу, которая имеет тенденцию содержать меньше исходящих ссылок). Пока нет очевидной разницы между циклическими и избыточными взаимосвязями. Давайте посмотрим, что произойдет, если мы усложним структуру и добавим внешние входящие и исходящие ссылки...
Иерархические
Циклические
Избыточные взаимосвязи
Хотя эти примеры учитывают только несколько циклов расчетной формулы, они уже показывают правила взаимных ссылок внутри сайта:
Избыточные взаимосвязи создают гранично лучшую обратную связь PageRank, чем иерархические ссылки, и оба вида создают гранично лучшую обратную связь PageRank, чем Циклические ссылки. С большим количеством иерархических ссылок, более высоким страницам в структуре назначается более высокий уровень PageRank. Это означает, что мы отдаем внешним ссылкам меньшее количество PageRank.
На практике это означает, что вы должны сочетать рассмотренные методы гиперссылок. Правила следующие...
1. Там, где группа страниц должна содержать исходящие ссылки, используйте иерархическую структуру.
2. Там, где группа страниц не должна содержать исходящие ссылки, используйте структуру избыточных ссылок, но распространяйте ее включением ссылок на главную страницу.
3. Если отдельная страница очень важна, поместите ее выше в иерархической структуре.
Как использовать карту вашего сайта в целях улучшения Pagerank.
Многие люди верят, что карта сайта помогает поисковым паукам находить страницы. Я в этом не уверен, но, в силу их популярности и учитывая тот факт, что они задействуют некоторые очень хорошие ссылки посредством текстов ссылок, давайте посмотрим, как их лучше создавать, с точки зрения PageRank.
Главное, сделайте ссылку на карту сайта со своей главной страницы, как обычно. Помните, что наличие карты сайта существенно снижает PageRank ваших других страниц (особенно, если на нее ссылается страница вашего сайта с самым высоким знаачением PageRank. Поэтому мы хотим убедиться, что страница карты сайта делает следующие две вещи:
1. Увеличивает ваше общее стартовое количество PageRank.
2. Обеспечивает максимально возможную обратную связь PageRank.
Первое условие слегка противоречиво. Чтобы заставить карту сайта увеличивать начальное значение PageRank вашего сайта, нужно разбить ее на несколько страниц. Вы можете возразить: "Но это усложнит работу поискового паука, не так ли?" Ответ будет "И да, и нет". Иногда для паука сложнее проследить сотни ссылок, ведущие с одной страницы. Однако, любой современный паук, который "не даром ест свой хлеб", индексирует страницы достаточно глубоко, чтобы справиться с картой сайта, распределенной между несколькими страницами.
Сейчас давайте разберемся с максимизацией обратной связи PageRank. Каждая страница карты сайта должна иметь ссылку на вашу главную страницу и на другие значимые страницы на вашем сайте. Если страница карты сайта ссылается на вашу страницу, которая, в свою очередь, содержит ссылки на внешние сайты, то вы должны особенно внимательно минимизировать количество PageRank, которое через эти страницы "просочится" с вашего сайта.
Итак, вот что вы может сделать...
Разбейте карту вашего сайта на категории, и назначьте каждой категории собственную страницу. Ваша карта сайта становится индексом этих страниц-категорий (вместо того, чтобы быть картой всего сайта). В каждой категории вы можете разместить до 30 ссылок. Вы должны, также, вместе со ссылкой дать описание содержимого каждой страницы. Если вы прописываете страницу, содержащую внешние ссылки, в одну из категорий вашей карты сайта, выбирайте категорию, которая содержит наибольшее количество ссылок.
Далее, вы должны взаимно связать все страницы-категории, наряду с индексом категорий (вашей изначальной картой сайта). Для этого, просто поместите на каждой странице навигационное меню, ведущее на индексную страницу категорий, и на другие страницы-категории. Не забудьте включить, также, ссылки на главную и основные страницы.
Это позволит максимизировать обратную связь и сохраняет низкое значение PageRank для страниц карты сайта. Основная идея — добиться минимальной утечки PageRank сайта через карту сайта в целом.
Заключительное слово
PageRank — слишком сложный вопрос, который часто понимается неправильно. Я думаю, полезно еще раз повторить некоторые особенности этого документа и метода PageRank. Этот документ находится в развитии и останется в таком состоянии, похоже, еще длительное время. На сегодняшний день, у нас недостаточно информации, чтобы на 100% быть уверенным в чем-либо. Я только излагаю теории, основанные на лучшей доступной информации, и в большинстве подтверждающиеся практикой. Google позволяет нам получать информацию о PageRank посредством навигационной панели Google. Когда вы будете смотреть на эту панель, я надеюсь, вы будете помнить, по крайней мере, одну вещь из сказанного выше — "Панель Google не совсем точно сообщает вам значение PageRank сайта, но сейчас это единственный инструмент, который может дать вам хоть какую-то информацию."
У метода PageRank есть свое место в процессе ранжирования. Это место не такое высокое, как некоторые могут вообразить. Его значение в алгоритме рейтинга меньше, чем многих других факторов, таких, как тэги заголовков (Title tags) и тексты ссылок (anchor text). Оптимизация сайта для одного PageRank не даст вам хороших позиций. В основе PageRank лежит то, что им очень трудно манипулировать. Так что, если вы получите хороший коэффициент PageRank, вашим конкурентам придется потрудиться, чтобы уравняться с вами. Стоит ли тратить ваше время на детальную оптимизацию PageRank, решайте сами, в зависимости от уровня ваших конкурентов. Я полагаю, что как минимум, не помешает понять, как работает PageRank, и постоянно помнить о нем при внесении изменений или создании новых сайтов, подобно тому, как мы помним о других факторах (ключевые слова, тексты ссылок и т.п.).