Современные сказки о возможности создания поисковых машин со 100% релевантностью поисковой выдачи

Разработчики крупнейших поисковых систем сети интернет включились в гонку за «релевантностью поисковой выдачи информации», которую современные исследователи считают основным параметром оценки качества их работы.

Релева́нтность (лат. relevo — поднимать, облегчать) в информационном поиске — семантическое соответствие поискового запроса полученному документу. В более общем смысле, одно из наиболее близких понятию качества «релевантности» — «адекватность», то есть не только оценка степени соответствия, но и степени практической применимости результата.

Постараемся посмотреть на ситуацию немного с другой «точки зрения», вспомнив работу Константина Циолковского «Условная истина», написанную им в 1932 году, в которой он писал:

«Настоящей (абсолютной) истины нет, потому что она основывается на полном познании космоса. Но такого полного познания нет и никогда не будет. Наука, которая даёт знание, непрерывно идёт вперёд, отвергает или утверждает старое и находит новое. Каждое столетие меняет науку. Не отвергает, а именно изменяет более или менее её содержание, вычёркивая одно и прибавляя другое. Конца этому не будет, как нет конца векам и развитию мозга.

Значит, истина может быть только условная, временная и переменная.

Религиозные веры называют свои догматы истиной. Но может ли какая-либо вера быть истиной? Число вер выражается тысячами. Они противоречат друг другу, опровергаются часто наукой и потому не могут быть приняты даже за условную истину. Политические убеждения также более или менее несогласны. Поэтому и про них мы скажем то же. Философские размышления создавали мировоззрения. Несогласие их также заставляет смотреть на них как на личное мнение. Некоторые философы не принимали ничего для своих выводов, кроме точного научного знания. Но и их выводы недостойны названия условной истины, так как не были согласны между собой. Наконец, нет человека, который бы не понимал истину по-своему. Сколько людей, столько и истин. Какая же это истина!

Однако мы должны сначала условиться о том, что мы хотим подразумевать под условной истиной.

Философы, мудрецы и учёные, конечно, способствуют распространению познаний о Вселенной и потому совершенствуют представление людей об условной истине.

Условная истина может быть земная, народная, городская, волостная, сельская, деревенская, семейная и личная.

Личная — это та, которую приобретает человек разными путями и считает за самое лучшее, самое верное и самое справедливое. В среднем, это есть наиболее низший сорт условной истины. Она изменяется с возрастом и познанием человека.»

Информационный поиск, осуществляемый поисковой машиной, производится по массиву систематизированной ею информации, представляющей собой мысли ЛИЧНОСТЕЙ человеческих существ, зафиксированные на различных носителях информации в сети интернет.

Получается, что поисковые машины ведут поиск исключительно в массиве ЛИЧНОЙ информации человеческих существ, которая субъективна изначально, т.е. не имеет никакого отношения к такому понятию, как ИСТИНА!

Тогда о какой релевантности (соответствии) системы «запрос-ответ» может идти речь?

Где тот критерий, по которому поисковая машина будет определять 100% релевантность ответа?

То, что 100% релевантности ответа на многие вопросы быть не может, должно быть понятно каждому разработчику подобных систем. Но разработчики алгоритмов поисковых систем упорно стремятся к 100% релевантности. Как пример они готовы утверждать, что вопрос «Сколько будет дважды два?» имеет один единственный 100% релевантный ответ, который выглядит вот так — «Четыре». Смею их разочаровать. Даже на всемирно известном базаре «Привоз» в г.Одесса все знают, что «единственно правильный» ответ на этот вопрос очень сильно зависит от того, покупает или продаёт что-либо спрашивающий. В одном случае релевантный ответ будет немного больше четырёх, в другом случае немного меньше четырёх.  Да, это шутка, но она показывает реальную, довольно непростую ситуацию с «релевантностью поисковой выдачи» от Google, Yandex, Bing, Yahoo и им подобных систем.

Именно поэтому многие исследователи знают, что линк на запрашиваемую ими у поисковых машин информацию может быть на 100+ странице, где они обнаружат значимую для них информацию, а первые страницы «релевантной выдачи»  будут наполнены ссылками, не представляющими для них практической ценности и не имеющие для них потенциальной практической применимости.

Мысленный эксперимент №1. Представим себе, что создатели поисковой машины (её Творцы, разработчики) сотворили единую общепланетарную поисковую машину со 100% релевантностью поисковой выдачи с их субъективной «точки зрения». Получается, что и выдача будет субъективна, ведь они разрабатывали алгоритмы этой выдачи…

Задаем тестовый вопрос поисковой машине — «Как правильно завязать галстук?» и получаем множество «релевантных» ответов с различными видами узлов. Но ведь в Ливии времён правления Муаммара Каддафи ношение галстуков было вообще запрещено, поэтому правильный ответ для граждан Ливии того времени звучал бы так — «Галстук не то, что завязывать, его вообще носить нельзя!» Вот и получается, что единого 100% релевантного ответа на поисковый запрос не бывает. Релевантный ответ для каждого жителя нашей планеты свой и зависит от страны его проживания, вероисповедания, возраста, образования, семейного положения, здоровья, половой ориентации и множества иных подобных параметров.

Мысленный эксперимент №2. Если учёные всего мира подтвердят теорию о том, что все умершие от рака больные при своей жизни всегда ели огурцы, и назначат огурцы основным виновником (причиной) этого заболевания, написав при этом миллионы страниц своих исследований, которые заполнят собою пространство интернета, то и «релевантная выдача» будет соответствующая. Спрогнозируйте для такого случая релевантную выдачу на вопрос типа  «Как вылечиться от рака…?»

Мысленный эксперимент №3. Самый страшный вариант 100% релевантности звучит примерно так: На один вопрос — один ответ! Такая релевантность приведет человечество к вырождению.

Краткие выводы: Необходимо срочно измененить философию развития алгоритмов, отвечающих за формирование «релевантной поисковой выдачи» результатов поиска информации. И чем быстрее это произойдет, тем будет лучше…

  • Философски, 100% релевантная поисковая выдача должна представлять все «точки зрения», т.е. представлять собою перечисление мыслей всех людей, обитающих на планете Земля сегодня или обитавших на ней ранее, если ранее они размышляли о контексте запроса.
  • Попытки сформировать поисковую выдачу по форме «один вопрос — один ответ»  способны уничтожить человечество, так как они способны отнять у людей возможность мыслить и развиваться, т.е. то, ради чего «Я» человеческих существ и приходят на эту планету.
  • Ввиду большого объёма 100% релевантной поисковой выдачи, результат поиска должен группироваться по параметрам людей, чьи зафиксированные в виде информации мысли были проиндексированы поисковой машиной, а именно: по позрасту, по вероисповеданию, по семейному положению, по стране проживания и т.д.