Что такое "релевантность"

10.07.2007 19586   Комментарии (7)

Когда говорят о поисковых системах, очень часто упоминают загадочно звучащее слово "релевантность". "Да ну его, у него поиск нерелевантный!" - говорят об одной поисковой системе. "Отлично ищет, классная релевантность!" - говорят о другой. Таким образом, можно догадаться, что релевантность - это хорошо, а отсутствие релевантности - плохо. Да, именно так и есть! Релевантность - это степень соответствия документа запросу.

Что значит "степень соответствия"? Вот смотрите. Например, вы студент (школьник, аспирант, кандидат, профессор) и вам нужно написать какой-то реферат. Как продвинутое дитя интернетовского века вы не собираетесь его писать самостоятельно, а надеетесь найти соответствующий текст в Интернете и выдать его за свой. Не берясь оценивать подобное действо с точки зрения морали, будем рассматривать это просто как пример.

Итак, прежде всего вам нужно найти сайт с рефератами. Вы заходите на поисковую систему и вводите слово для поиска "рефераты". Поисковая система заглядывает в свою индексную базу и видит там ссылки примерно на 8 миллионах страниц, на которых это слово встречается 30 миллионов раз. Причем это слово присутствует как на страницах сайта "Банк рефератов", так и на страницах дневника блондинки Леночки, где дословно написано следующее: "Сегодня пыталась писать реферат. Шесть ногтей покрасила, но так ничего и не написала. Какой-то сегодня прям нерефератный день, дивчонки, да?"

Так какую ссылку пользователь хочет получить первой: на банк рефератов или на страничку блондинки Леночки, где просто употребляется слово "реферат"? Разумеется, на банк рефератов! Вот это и называется - релевантность, то есть степень соответствия запросу.

Каким образом поисковая система может определить эту релевантность, то есть какие из страничек, где встречается заданная поисковая строка, наиболее интересны и полезны пользователю? В этом как раз и заключается ноу-хау различных поисковиков, однако общий принцип у них достаточно похож: проверяется, сколько раз заданное словосочетание встречается на отобранных страничках; проверяется расстояние между словами; анализируется количество ссылок на данную страницу; смотрится, каким шрифтом (стилем) набрана на странице искомая фраза; ну и оценивается возраст сайта.

Вот что такое релевантность.

P. S. Подробно о том, как правильно искать в Интернете, читайте здесь.

© 1998–2024 Alex Exler
10.07.2007

Комментарии 7

Когда в конце декабря 2006 произошел «технический сбой» в работе Яндекса, выдача результатов поиска выглядела, по меньшей мере, странно. Алекс Экслер назвал их «чушью какой-то несусветной» и предложил сменить слоган Яндекса «Найдется все» на «Не найдешь ничего».[][ru.wikipedia.org
10.07.07 17:27
0 0


Квадратные скобки, гы-гы 😄.
13.07.07 06:32
0 0

Не очень понятно, с какого бодуна в Wiki влепили подобную запись - она совершенно некорректна и попросту лжива. Я ее оттуда убрал.
10.07.07 17:44
0 0

Alex Exler: Не очень понятно, с какого бодуна в Wiki влепили подобную запись - она совершенно некорректна и попросту лжива. Я ее оттуда убрал.


Алекс (можно Вас так называть?), по поводу этой записи шли дебаты о том кто такой "Экслер", и достаточно ли его авторитета для критики Яндекса 😄
11.07.07 16:00
0 0

очень доступно объяснено (впрочем как и всегда у Алекса) 😄 спасибо за статью
10.07.07 21:01
0 0

Стоило бы добавить, что иногда релевантность называют ревалентностью, что не есть правильно.
11.07.07 00:54
0 0