20 методов сортировки результатов поиска
Задача поисковика - при выдаче результатов поиска обеспечить
максимальное совпадение слов в поисковом запросе со словами,
найденными на той или иной веб-странице или в тексте ссылок, ведущих
на неё.
Ранжирование в результатах поиска по большей части зависит от
индексирования текста на страницах сайтов, текста ссылок, ведущих на
эти страницы, а также от степени важности сайта, вычисленной на основе
количества ссылающихся страниц.
Однако перед тем, как быть показанными в результатах поиска, сайты
могут быть переставлены в зависимости от того или иного фактора. Вот
некоторые из них:
1. Фильтрация дублирующегося (или близкого к этому) контента
Поисковики не любят, чтобы страницы с одинаковым контентом переполняли
результаты поиска, поэтому похожие страницы могут быть отфильтрованы.
2. Удаление из результатов поиска нескольких релевантных страниц с
одного и того же сайта
Не так уж редко случается так, что релевантными поисковому запросу
оказываются сразу несколько страниц одного сайта. В таком случае
поисковик может показать ссылку на другую страницу с того же сайта
сразу после ссылки на самую релевантную страницу либо просто выдаст
дополнительно ссылку "Ещё результаты с этого сайта". Бывает, что
дополнительные результаты вообще не отображаются.
3. Персональные интересы пользователя
Поисковик может перестраивать результаты поиска в зависимости от
прошлых результатов и другой активности в интернете того или иного
пользователя. Этот вид изменения ранжирования используется в так
называемом "персонализированном поиске".
4. Взаимосвязанность сайтов
Поисковик может перестраивать сайты в зависимости от количества и
качества ссылок между ними.
5. Сортировка в зависимости от дислокации пользователя
Вполне возможно, что пользователь предпочтёт увидеть в результатах
поиска те сайты, которые расположены в его регионе проживания. Иногда
пользователи сами включают опцию поиска сайтов только из определённой
страны, иногда поисковик пытается самостоятельно определить дислокацию
пользователя на основе его IP.
6. Язык запроса
Опции ограничения по языкам могут быть установлены пользователем в
браузере либо через настройки поисковика; иногда поисковик сам
выбирает язык результатов поиска в зависимости от поискового запроса,
настроек либо характеристик результатов поиска.
7. Демографические характеристики
При использовании этого метода для ранжирования результатов поисковик
может учитывать такие параметры, как дислокация, демографическая
информация, информация о группах, к которым относится пользователь.
8. Хронологические данные
Сайты могут быть рассортированы в зависимости от времени создания и
изменения страниц, возраста ссылок на них и многих других временнЫх
параметров.
9. Тематическая схожесть
Учитываются заголовки, стоп-слова и другие связанные с текстом
параметры.
10. Заинтересованность пользователя в коммерческой информации
К примеру, Yahoo! Mindset (http://mindset.research.yahoo.com/)
позволяет пользователю самостоятельно отсортировать результаты поиска
в зависимости от того, хочет он видеть информацию коммерческого или
более информативного, некоммерческого характера.
11. Наличие у сайта версии для мобильных устройств
Поиск от Microsoft может отфильтровать те сайты, которые не могут быть
отображены на мобильных устройствах (например, КПК).
12. Доступность людям с ограниченными возможностями
Google не так давно запустил специализированный поиск
(http://labs.google.com/accessible/), который ранжирует сайты в
зависимости от их доступности людям с ограниченными возможностями.
13. Отношение пользователей
Google умеет сортировать страницы в зависимости от того, нравятся они
пользователям или нет.
14. Дополнительные параметры поиска и схожесть текста
Google умеет ранжировать результаты поиска по новостям, основываясь на
обработке и автоматическом добавлении дополнительных параметров к
поисковому запросу, а также на схожести документов.
15. Поведение пользователя
16. Одобрение сообществом
Метод основывается на мнении социальных групп, пользователей
социальных сетей и т.п.
17. Избыток информации
Отфильтровывается избыточная информация, засоряющая результаты поиска.
18. Новостные сюжеты
Методика от IBM позволяет преобразовывать результаты поиска в сюжеты
новостей, которые будут раскрываться на сайтах, выдаваемых в
результатах поиска.
19. Оценка актуальности на основе сообщений в блогах, новостях и т.п.
Результат поиска ставится в зависимость от того, куда именно ссылаются
блоги и форумы в данный период времени. Приоритет получает сайт,
имеющий наиболее актуальную на данный момент информацию.
20. Актуальность (временнОй фактор) и использование
Этот метод близок к сочетанию двух предыдущих. Он предполагает
группировку понятий с учётом того, как они развивались во времени и
как люди влияли на эти изменения.
Вывод
Помните, что результаты поиска, которые видите Вы, не всегда
аналогичны тем, которые видят другие пользователи.
Конечно же, это не полный список методов изменения ранжирования сайтов
в результатах поиска, но автор старался сделать его максимально
представительным. Некоторые методы уже используются, некоторые
находятся в стадии разработки, некоторые будут использованы в будущем,
некоторые - никогда не будут реализованы.
Есть ли возможности убедиться, что Ваш сайт удерживает хорошие
позиции, даже когда пользователям выдаются по-разному отсортированные
результаты поиска? Сможете ли Вы проверить свои позиции при
использовании поисковиками всех методов?!