Разное

Проверка релевантности: Проверка релевантности текста: как проверить, исправить

17.06.2023

Как проверить релевантность страницы поисковому запросу

#Оптимизация сайта #Продвижение в Яндексе

#16

Ноябрь’17

2

Ноябрь’17

2

Релевантность страницы определяют поисковые роботы. Вы сами выбирайте какая страница должна быть релевантна определенному вопросу. Но её отдача может быть настроена неправильно. Как определить уровень релевантности страницы по отношению к поисковому запросу — в новой заметке.

Уровень релевантности страницы по отношению к поисковому запросу зависит от большого количества показателей. Чтобы процент соответствия оказался высоким, необходимо чтобы запрос упоминался на странице в:

  • теге title;
  • заголовке h2;
  • мета-тегах description и keywords;
  • самом контенте.

Это лишь часть факторов, которая учитывается при определении релевантности страницы поисковыми роботами.

Чтобы определить, какая страница сайта наиболее релевантна конкретному ключевому слову, необходимо воспользоваться следующим запросом: «ключевое слово site:%domain-name%».

Если первое место в выдаче занимает правильная целевая страница, то значит оптимизация проведена верно. И скорее всего именно она будет показываться в выдаче при ранжировании сайтов по данному запросу.

Если отображается другая страница, то вам необходимо провести детальный аудит целевой страницы и внести на нее правки. Или перенести ключевые запросы на ту страницу, которая сейчас появляется в выдаче, предварительно доработав ее.

Похожее

Контент Параметры

Использование скрытого контента на сайте

Факторы ранжирования Поведенческие

Правильное оформление форм на сайте

Контент Параметры

#140

Использование скрытого контента на сайте

Август’19

1686

1

Факторы ранжирования Поведенческие

#139

Правильное оформление форм на сайте

Август’19

3297

1

Факторы ранжирования Поведенческие

#138

Оформление 404 страницы

Август’19

1800

2

Общие вопросы Продвижение сайта

#137

Как продвигать сайт визитку?

Август’19

1929

3

Оптимизация сайта Внутренняя перелинковка

#136

Поиск 404 ошибок на сайте

Август’19

1985

2

Общие вопросы Продвижение сайта

#135

Почему у сайта разные позиции?

Июль’19

2677

Оптимизация сайта Внутренняя перелинковка

#134

Циклические ссылки на сайте

Июль’19

9770

Оптимизация сайта Индексация

#133

Атрибут rel=canonical

Май’23

13115

23

Факторы ранжирования Коммерческие

#132

Как правильно оформить страницу «Контакты»

Июль’19

2919

10

Общие вопросы Продвижение сайта

#131

Поиск поддоменов сайта

Июль’19

2676

10

Общие вопросы Продвижение сайта

#130

Как вирусы влияют на позиции сайта

Июль’19

2942

11

Ключевые запросы Виды запросов

#129

Каннибализация запросов

Июль’19

8792

10

Системы аналитики Яндекс Метрика

#128

Фильтрация визитов роботов на сайт

Июль’19

9694

13

Общие вопросы Продвижение сайта

#127

Неактуальные страницы товаров на сайте – что делать

Июль’19

2840

12

Системы аналитики Google Analytics

#126

(not set) и (not provided) в отчетах Google Analytics

Июль’19

4313

11

Проверка релевантности страницы поисковому запросу

Время прочтения: 9 минут

Тэги: SEO

О чем статья:

  • Что такое релевантность страницы поисковому запросу;

  • Как поисковые системы оценивают релевантность;

  • Как определить релевантность страницы;

  • Как можно повысить релевантность сайта.

Для кого полезна статья:

Релевантность в SEO— это соответствие результата поиска ожиданиям пользователя. Она отражает, насколько точный и развернутый ответ пользователь получил на свой запрос. В результатах поиска наиболее релевантные страницы расположены наверху. Чем лучше, по мнению поисковой системы, ресурс отвечает запросу пользователя — тем более высокую позицию он занимает.

Что такое «релевантность поискового запроса»

Релевантными запросами считаются те, на которые контент страницы отвечает наиболее полно. Причем когда содержание соответствует запросу не только формально по присутствию ключевых слов, но и по смыслу.

Приведем пример простыми словами. Допустим, есть сайт, на котором можно купить ноутбук. Для него будут релевантными следующие запросы:

Это наиболее релевантные запросы для проекта по продаже ноутбуков, потому что именно их вводит целевая аудитория — люди, которым нужно купить данный товар. Сайт заработает на том, что предложит им подходящие ноутбуки.

Однако в ходе сбора семантики оптимизатор наверняка обнаружит и сходные запросы: 

  • отремонтировать ноутбук;

  • что должно быть в игровом ноутбуке;

  • сколько стоит ноутбук.

Вроде бы эти запросы близки к задачам сайта и, возможно, задавшие их люди после сбора информации задумаются о покупке нового товара. Тем не менее, такие запросы менее релевантны для страниц, задача которых — привлечь людей, уже осознавших потребность в покупке и ищущих магазин.

В перспективе под некоторые из таких запросов можно создать информационные страницы. Например, написать обзор «что должно быть в игровом ноутбуке» и дать ссылки на соответствующие модели в каталоге. Это работа на верхних уровнях воронки. В приоритете все-таки должна быть SEO-оптимизация основных страниц под релевантные бизнесу – в данном случае коммерческие — запросы.

Таким образом, при подборе и кластеризации ключевых фраз оптимизатор должен ориентироваться на цели бизнеса. Качество и задачи бизнеса все чаще преобладают над качеством сайта, сделанного ради сайта. Запросы должны быть прежде всего релевантными бизнесу, а не вести на сайт нецелевой трафик ради трафика.

Что значит «релевантность страницы и сайта»

Это опять-таки соответствие результатов выдачи смыслу запроса пользователя. Именно смыслу, а не формальному наличию сходных ключевиков. Что такое релевантность запроса и страницы в современном SEO — прежде всего удовлетворение ожиданий клиента.

Релевантность запросам поисковые системы оценивают технически: то есть по количеству и пропорции ключевых запросов, которые размещены в тексте. Однако нейросети все больше и больше внимания уделяют и тому, насколько в итоге страница/сайт оказались полезными для пользователей, задавших тот или иной запрос. Они учитывают процент отказов, дальнейшие переходы (нашел пользователь информацию, пошел оформлять заказ — или вернулся в поиск и начал смотреть другие страницы), юзабилити.

Потому одним грамотным размещением ключевых слов на сайте теперь не обойтись. Чтобы поисковик посчитал, что информация релевантна запросу, она должна не только содержать соответствующие ключевики, но и быть полезной, уникальной и адекватной ожиданиям читателя. И пользоваться этой страницей должно быть удобно, иначе пользователь уйдет, а поисковик сочтет страницу менее релевантной.

Как оценивают релевантность Яндекс и Google

Хотя работа поисковых алгоритмов обеих систем не раскрывается, общие принципы изучены поисковым маркетингом и довольно схожи. Оба используют сходные факторы ранжирования сайтов, хотя придают им разный вес. Например, Яндекс в 2020-21 гг. предпочитал крупные сайты с большим ассортиментом. Соответственно, у релевантной посадочной страницы такого сайта позиция в поиске будет выше. Google же сосредоточился на качестве контента, авторитетности и экспертности сайта. Соответственно, для высокой позиции следует сделать страницу релевантной не только запросу, но и критериям качества Google.

Так же принципиальное отличие — то, что у Яндекса есть собственные сервисы (Яндекс.Кью, Яндекс.Дзен, Яндекс. Маркет, Яндекс.Карты и т.п.), где по многим запросам имеются релевантные странички. У собственных сервисов поисковой системы, конечно же, приоритет в выдаче. В то время как у Google таких сервисов нет, поэтому его выдача более независима. Яндекс же вынуждает работать со всем поисковым пространством.

Пример:

Посмотрим поисковую выдачу Google по запросу: «Как написать текст».

Рассмотрим первые три позиции: 

  • На первом месте — маркетинговый блог. По ссылке открывается объемный структурированный текст со множеством иллюстраций и ссылок на экспертов и исследователей, построенный по принципу практических советов из собственного опыта. Текст обладает экспертностью, написан качественно, полностью раскрывает суть вопроса.
  • Второе место занимает блог издательского дома с советами по организации труда райтера, написанными в модном инфостиле. Универсальная экспертиза, которая подойдет и копирайтеру, и студенту, пишущему курсовик, и журналисту, и писателю.
  • На третьем месте — блог популярного конструктора сайтов Тильда. Статья рассказывает, как написать текст для сайта про бизнес. То есть релевантность запросу присутствует, но поворот темы более узкий. Зато солидный ресурс, которому можно доверять.

Далее блок «Похожие запросы», который поможет пользователю сузить поиск.

А что в Яндексе?

Здесь выдача ожидаемо отличается.

  • На первом месте — блог издательского дома, который занимал второе место в Google.

  • Второе место занял авторитетный профессиональный ресурс в сфере диджитал маркетинга с переводной статьей — советы американского писателя. Речь идет о написании цепляющих текстов, то есть полезна райтеру любой сферы. Так что страница полностью релевантна и запросу, и его смысловому содержанию.

  • Третий в выдаче – канал Яндекс Дзен, посвященный созданию контента. Статья представляет собой инструкцию для начинающих авторов. Хотя авторитетность ресурсу, безусловно, придает его родство с поисковиком, несомненна релевантность запроса и страницы.

Что интересно, Яндекс не предлагает блок с похожими запросами или быстрыми ответами, хотя они есть в этом поисковике.

Таким образом, при релевантности страниц поисковому запросу они имеют шанс высоко ранжироваться в том или ином поисковике. Рейтинг значимости параметров для Яндекса и Google можно посмотреть здесь.

4. Как проверить релевантность страницы/контента

На релевантность влияет множество параметром: расположение ключевых слов, мета-тэги, юзабилити, поведенческие факторы и др. Установить релевантность раз и навсегда невозможно, потому что алгоритмы работы поисковых систем постоянно развиваются. Значение тех или иных параметров релевантности меняются, причем изменения не раскрываются поисковиками.

Поэтому оптимизатор может получить лишь приблизительное понимание, насколько та или иная страница релевантна запросу. Сделать это можно как в самой поисковой системе, так и при помощи специализированных инструментов.

В поисковик надо просто ввести запросы, которым должна отвечать анализируемая страница, и оценить, попадает ли она в выдачу и на какой позиции.

Специализированные инструменты представляют собой онлайн-сервисы, которые программными методами проводят анализ релевантности контента по заданным запросам. Подобные инструменты есть у Megaindex, Majento, PR-CY, SEOlib и др. Важно осознавать, что сервисы не учитывают внешние факторы: поведение пользователей, авторитетность сайта и пр. Они оценивают только текст и дают рекомендации по улучшению только контента. Поэтому инструментальная проверка не гарантирует, что поисковик сочтет страницу достаточно релевантной, чтобы вывести ее в топе.

5. Как повысить релевантность страниц

Главное, что зависит в данном случае от вас — качество контента. Важно, как долго пользователь остается на странице сайта: чем больше времени он тратит на изучение раздела, в который перешел со своим запросом — тем больше, по мнению поисковой системы, информация соответствует его ожиданиям. Потому постарайтесь, чтобы подготовленный материал развернуто раскрывал заданную тему, дополните текст уникальными тематическими изображениями, видео.

Внутренние факторы, улучшающие релевантность:

  • Оптимизация тэгов Title и h2. Это базовые элементы для поисковика, по которым тот оценивает релевантность страницы поисковому запросу. Тем не менее до сих пор масса страниц имеют неправильно заполненные тэги! Наиболее высокочастотный запрос страницы должен находиться в начале тега Title. Другие ключи должны входить в видимую часть Title.
  • Порядок слов важен в первую очередь для Яндекса. Не разбивайте ключевые фразы дополнительными словами и знаками препинания.
  • h2 должен быть один на странице и содержать основную ключевую фразу. При этом он должен емко описывать содержание страницы (иначе Google, например, может заменить его в выдаче).
  • Сделайте описание на странице максимально полезным. Это значит, что на информационных сайтах и сайтах услуг оно должно быть содержательным. А, например, на листингах интернет-магазинов текст описания должен быть минимальным — просто указывать, что это каталог. Иначе поисковики сочтут его спамным.
  • Избегайте переспама текста на странице поисковыми запросами — теперь поисковики за это нещадно карают.
  • Контент на странице должен быть уникальным, по смыслу соответствовать запросу пользователя, содержать высоко-, средне- и низкочастотные ключи, синонимы и словоформы.
  • Фото, видео и графические изображения так же должны соответствовать задаче пользователя.
  • Тэги Alt картинок — один из основных элементов, по которым Google оценивает релевантность страниц. Их также необходимо оптимизировать.
  • Сделайте внутреннюю перелинковку. Она улучшает поведенческие факторы, так как пользователям легче перемещаться по сайту плюс у них возникает интерес перейти по внутренней ссылке. Также внутренняя перелинковка показывает нейросетям, какие страницы важны и актуальны для пользователей.
  • Сниппет (тэг Description) — краткая цитата о содержании страницы, которая отображается ы поисковой выдаче. Он должен полностью отражать то, о чем эта страница, какую информацию она сообщит пользователю при переходе на нее.
  • Адрес страницы (URL) лучше всего делать человекоподобным, то есть транскрибировать h2.

Основные моменты, которые учитываю поисковики — количество и качество использованных ключевых слов на странице в соотношении с общим объемом текста, грамотностью распределения, информативностью, тематикой ресурса, репутацией и посещаемостью сайта.

В отношении ключевых слов значение имеет: 

  • Плотность. Не используйте много ключей, главное — равномерно распределите их по тексту, обеспечьте естественное вхождение, включайте словоформы и синонимы. Избыток ключевых слов поисковик может посчитать спамом и наложить фильтр. Особенно с учетом последних разработок Яндекса и Google: алгоритмы поиска поощряют развернутый, полноценный ответ на вопрос. И это — самое главное. Потому если даже в тексте — всего один ключ, который встречается 1-2 раза в длинном руководстве, попасть в топ выдачи вполне реально. 
  • Расположение. Размещайте ключевики ближе к началу страницы. Вставляйте не только в сам текст, но также в теги и мета-теги: title, description, h2-h6, keywords, атрибут img. Опять же — заботясь о читабельности, логичности и не особо увлекаясь. Хорошо, если основной ключ входит в адрес ссылки на раздел. 

И еще несколько внутренних моментов:

  • Технические составляющие: скорость загрузки страниц, доступность ресурса, грамотность кодировки, настройка редиректов, отсутствие страниц с ошибками, битых ссылок и дублей, файлы robots. txt и sitemap.xml — все это влияет на скорость и качество анализа релевантности поисковиком.
  • Обновления: помимо качества контента для релевантности роль играет периодичность его добавления. Регулярно размещая на сайте информативные уникальные материалы, можете рассчитывать на то, что поисковый робот будет заходить к вам чаще и со временем проникнется доверием.

  • Удобство навигации: от этого напрямую зависит время пребывания на сайте, глубина просмотров, конверсия. Потому еще на этапе создания сайта важный момент — работа над юзабилити, т.е. удобством пользования ресурсом. К этому пункту относится и внутренняя перелинковка, которая позволяет организовать взаимосвязь между тематическими материалами на сайте, создав из них подробную информационную подборку. И внешний вид документа. Плохо сверстанный, неструктурированный материал не способствует повышению релевантности. Статья должен быть структурирован: состоять из коротких абзацев, иметь маркированные списки, подзаголовки.

Внешние факторы

На них оптимизатору или владельцу сайта повлиять сложнее всего, тем более что алгоритм определения релевантности сайта поиском не является прозрачным. В целом нужно повышать востребованность ресурса, размещая ценную информацию, которая действительно полезна и необходима.

Раньше высокое значение для ранжирования имели внешние ссылки на сайт. Их массово закупали для повышения позиций. Постепенно поисковики перестали придавать такое высокое значение внешним ссылкам, перемещая акцент значимости на поведенческие факторы и отзывы. Яндекс отказался от индекса цитирования тИЦ, а Google навсегда закрыл показатель Pagerank.

Сейчас Яндекс использует алгоритм ИКС — индекс качества сайта. Он отражает то, насколько ресурс полезен для пользователей по мнению поисковой системы. ИКС по-прежнему учитывает наличие внешних ссылок. Но к ним присоединяются аудитория сайта, рейтинг сайта по отзывам, процент отказов и другие критерии. Алгоритм расчета ИКС не обнародован, для него используют данные сервисов Яндекса. Вот здесь можно бесплатно скачать чек-лист на соответствие новым метрикам качества, не так давно введенным Яндексом.

В свою очередь Google ввел рейтинг Page Quality (также PQ или «качество страницы»). Страница может получить максимально низкую или высокую оценку, или же одну из семи промежуточных оценок. Вот как это выглядит.


Таким образом, для повышения релевантности и выхода страницы в топ эффективный способ — изучать известные факторы ранжирования поисковиков и повышать качество контента в соответствии с ними.

Выводы

  • Релевантность сайта определяется тем, насколько он удовлетворил задачи пользователя.
  • Формального размещения ключевых слов недостаточно, чтобы повысить релевантность сайта.

  • Даже релевантные ресурсы будут занимать разные места в выдаче разных поисковых систем.

  • Повысить релевантность сайта можно, работая над контентом, оптимизацией и улучшая поведенческие факторы.

проверка релевантности

Суть в этом…

Цель состоит в том, чтобы отфильтровать ваш корпус, проверяя, какие из определенных слов или фраз встречаются или не встречаются в каждом тексте. Работает система подсчета очков. Вы указываете слова или фразы, которые, по вашему мнению, типичны для области, которую вы исследуете, и можете указать некоторые из них, которые вы считаете нежелательными отвлекающими факторами. Текстовые файлы с высокой оценкой могут быть скопированы или перемещены в место по вашему выбору.

 

Настройки

Выберите список строк фильтра, минимальное количество слов и предпочтительный минимальный балл.

покрытие: вы можете выбрать количество равных по размеру сегментов каждого текста, в которых должны быть найдены все хиты. Здесь настройки означают, что тексты будут сегментированы на 5 сегментов (первые 20%, вторые 20% и так далее), и любые три из них должны иметь хотя бы одно попадание.

 

       Синтаксис строк фильтра

 

Какие тексты учитывать?

Когда вы нажмете кнопку, вы получите выбор между всеми текстовыми файлами в папке и подпапках или предварительно составленным списком, например, созданным в процедуре Corpus Sampler.

 

 

       повторяющиеся фрагменты

 

Дисплей

 

9000 3

На дисплее отображаются баллы, количество слов и количество найденных совпадений различных типов. В строке состояния внизу вы видите, что этот поиск отфильтровал чуть более половины из 35 676 текстовых файлов. Оценка — это просто число. Он будет варьироваться в зависимости от того, насколько ценным вы придаете поисковому запросу, количеству поисковых запросов, которые вы ищете. При поиске выше значения в среднем составляли около 20; было 91 условия поиска.

 

Пример

Я изучал аскетизм в тексте новостей. Во многих статьях упоминается аскетизм, иногда вскользь. И я хотел изучить аскетизм в Британии, но много статей касалось Греции. Таким образом, в моих фильтрах были такие термины, как сокращение затрат, Великобритания и т. д., а в мои негативные фильтры входили греческий, греческий и т. д. Чтобы получить подходящий корпус, мне нужно было довольно много положительных терминов, которые я предпочитал, и несколько отрицательных. После проверки релевантности я смог отфильтровать большую часть текстов, оставив только те, которые имели гораздо большее отношение к моему запросу.

 

Кнопка фильтра релевантных текстов

 

Кнопка RTF Sample

 

См. текст Покажите этот текст). Когда он появится, вы снова сможете щелкнуть правой кнопкой мыши, чтобы сохранить его в формате RTF, выделить серым цветом любые разделы < >, выделить положительные фильтры и т. д. После выделения всего мы получим

 

термины окрашены, а справа график дисперсии, показывающий, где они появляются в тексте.

Ограничение

Процедура использует условия поиска. На самом деле он не понимает текст. Все, что он может сделать, это дать более высокую оценку присутствию положительных терминов и уменьшить оценку, если будут найдены отрицательные. Тексты об окружающей среде не обязательно содержат слово окружающая среда!

 

Выбор фильтров релевантности

Полезно сначала вычислить ключевые слова и ключевые кластеры несовершенного корпуса. Это поможет вам найти слова и фразы, которые характеризуют ваш корпус. Используйте некоторые из них, а также любые другие, которые, по вашему мнению, будут правдоподобными. Кроме того, внимательно прочитайте образцы текстов, чтобы проверить, какой корпус вы действительно получили.

 

Наконец, попробуйте фильтр релевантности. Вы можете попробовать тексты, чтобы увидеть, насколько хорошо вы делаете. Отредактируйте фильтры релевантности, чтобы уточнить их.

 

См. также: Образец RTF, семплер корпуса, который помогает выделить нужный образец.

Что такое релевантность поиска? | Algolia

Релевантность поиска — это мера точности взаимосвязи между поисковым запросом и результатами поиска.

Онлайн-пользователи возлагают большие надежды. Благодаря высокой планке, установленной такими сайтами, как Google, Amazon и Netflix, они ожидают точных, актуальных и быстрых результатов. Однако реальность такова, что многие сайты не имеют оптимизированных страниц результатов, которые понимают намерения пользователя и легко приводят их в соответствие с их потребностями.

Если вы когда-либо искали веб-сайт только для того, чтобы увидеть кучу бесполезных, несвязанных между собой результатов, то вы знаете, что могут чувствовать ваши пользователи: разочарование и стремление перейти на сайт конкурента, чтобы найти результаты. Релевантность поиска является неотъемлемой частью пользовательского опыта.

Владельцы веб-сайтов могут точно настроить свою релевантность для поиска, чтобы упорядочить результаты поиска наиболее полезным для пользователей способом. Это может быть основано на ряде факторов, таких как цель поиска, бизнес-приоритеты, релевантность текста, точность правописания, геолокация пользователя или близость ключевых слов в искомом контенте.

Тонкая настройка релевантности поиска для обеспечения точности 

Релевантность может быть трудно установить правильно, поскольку она сильно зависит от контекста и ряда изменяющихся переменных. Например, тип сайта имеет значение: то, как вещи должны ранжироваться на веб-сайте электронной коммерции по сравнению с академическим сайтом, не будет одинаковым. Тип искателя также имеет значение. Коллекционер и новичок будут иметь разные намерения и навыки поиска. Наконец, у разных людей будут разные слова для выражения того, что они ищут, даже для одного и того же запроса. Формула ранжирования результатов должна работать с этими различными потребностями.

Когда пользователь вводит запрос типа «скидка» на сайте электронной коммерции, он хочет, чтобы было возвращено определенное подмножество записей, соответствующих критериям запроса.

Когда пользователь вводит запрос типа «скидка» на сайте электронной коммерции, он хочет, чтобы было возвращено определенное подмножество записей, соответствующих критериям запроса.

Почему важна релевантность поиска?

Оптимизация релевантности поиска является чрезвычайно важным, но часто упускаемым из виду аспектом дизайна взаимодействия с пользователем. Исследования показывают, что 43% посетителей веб-сайта сразу же переходят к строке поиска, и эти пользователи в 2-3 раза чаще конвертируются. Когда пользователям предоставляются результаты, соответствующие их запросам и интересам, они будут более удовлетворены, вовлечены и с большей вероятностью совершат конверсию. Таким образом, хороший дизайн UX должен побуждать пользователей начинать с панели поиска и перемещаться по результатам поиска.

Кроме того, современные онлайн-пользователи возлагают большие надежды на удобство использования веб-сайта, поэтому скорость, простота использования и простота дизайна являются важными факторами восприятия торговой марки клиентами.

Краткая история релевантности поиска

История релевантности поиска восходит к самым ранним дням Интернета, когда исследователи пытались найти методы поиска информации, чтобы управлять быстрым ростом контента, создаваемого каждый день. Это быстро привело к изобретению поисковой системы.

Поисковые системы

Ранние поисковые системы и протоколы, такие как Archie, созданный в 1990 году аспирантом Университета Макгилла, и Gopher, созданный в 1991 году исследователями из Миннесотского университета, стали важными вехами в развитии актуальности современного поиска. системы. Они позволили ученым использовать условия поиска для поиска в файловых системах других учреждений, к которым они подключались через Интернет.

Тем не менее, эти ранние поисковые системы все еще были очень техническими, требуя от пользователей глубоких знаний о компьютерах и низкоуровневых концепциях Интернета. Между тем, всего пару лет спустя в 19В 93 году Всемирная паутина начала процветать, когда сотни веб-сайтов начали выходить в сеть, что положило начало целой новой волне поисковых систем.

Ранние веб-поисковики

Вскоре появились поисковые роботы, которые автоматически загружали и обновляли веб-страницы в индексах поисковых систем, позволяя искать больше контента.

Поисковые системы, такие как Excite в 1993 г. и Yahoo в 1994 г., быстро завоевали популярность благодаря простоте использования. Они даже включали некоторые базовые статистические модели, направленные на понимание запросов пользователей и их связи с контентом.

Эти новые ранние системы использовали работоспособный, но ограниченный метод ранжирования наиболее релевантных результатов поиска для пользователей. Они основывали свой рейтинг релевантности на количестве раз, когда ключевые слова появлялись на веб-страницах, однако они не учитывали никаких других критериев для оценки качества веб-страниц.

Затем на сцену вышла революционная поисковая система Google. Компания Google, основанная 4 сентября 1998 года в Менло-Парке, штат Калифорния, значительно повысила релевантность поиска, создав свою передовую технологию поиска. В 2000-х Google усовершенствовал свои поисковые алгоритмы, используя новые и более мощные модели машинного обучения, которые предлагали еще более релевантные и прогнозирующие функции поиска, такие как автозаполнение и мгновенный поиск.

Измерение релевантного поиска документов   

По мере увеличения количества сайтов росла и потребность в поиске релевантных документов на определенных сайтах и ​​в базах данных. Поиск документов был важным предшественником того, как мы сегодня ищем на сайтах.

Традиционные системы ранжирования часто рассматривают частоту ключевых слов в документах, чтобы предсказать их релевантность. Например, классический алгоритм, известный как TF-IDF, будет проверять, сколько раз ключевые слова появлялись в соответствующих документах (частота терминов) и сколько раз ключевые слова появлялись во всех других документах в репозитории (обратная частота документов). Последний анализ помогает отфильтровать общие слова, которые обычно являются шумом, такие как предлоги.

Хотя TF-IDF и другие подобные ранние подходы к релевантности были хороши для поиска документов общего назначения, они не смогли воспользоваться преимуществами дополнительной структуры и метаданных, которые содержит большинство веб-сайтов. Современный контент имеет заголовки, описания, категории, теги и другую информацию на основе ключевых слов, которую можно использовать для интерпретации контента сайта и повышения релевантности поиска.

Со временем поисковые компании разработали альтернативы TF-IDF, например, больше полагаясь на алгоритмы ключевых слов, чем на статистику. Для нашей собственной поисковой системы мы разработали настраиваемую систему ранжирования, позволяющую компаниям лучше видеть, что происходит «под капотом», и настраивать релевантность в соответствии со своими потребностями.

С появлением новых возможностей семантического поиска появились более сложные модели качества ранжирования для оценки релевантности поиска, включая nDCG, нормализованный дисконтированный кумулятивный выигрыш, который может определять сходство между тем, насколько хорошо набор результатов запроса упорядочен для конкретного запрос. Чем выше балл, тем выше релевантность. Мы добавили оценку с помощью нейронной технологии и векторного поиска, чтобы расширить релевантность нашего поиска по ключевым словам для большего количества вариантов использования. Существуют и другие методы, такие как MRR (средний обратный ранг) и MAP (средняя средняя точность), каждый из которых имеет свои плюсы и минусы.

Для большей релевантности важно качество записей в поисковом индексе. Качество поиска по ключевым словам и семантике зависит от качества ваших данных, поэтому очистка данных для обработки отсутствующих значений или зашумленных данных, структурирование наборов данных из разных источников для лучшего анализа и улучшение контента, такого как заголовки, описания, теги , заголовки и метаданные могут сильно повлиять на показатель качества поиска.

Внедрение повышения и оптимизации результатов поиска

Сегодня, когда веб-сайты расширили свой контент и предлагаемые продукты, оптимизация релевантности поиска является основным фактором для поисковых систем отдельных сайтов. Компании, производящие собственную релевантность, должны учитывать свои конкретные бизнес-потребности, чтобы сделать поиск полезным.

Например, бренд электронной коммерции может иметь тысячи разнообразных продуктов и клиентов с очень разными демографическими данными. Таким образом, когда клиент ищет продукт, внутренняя поисковая система должна иметь возможность предоставлять результаты, которые не только связаны с запросом, но и контекстуально релевантны конкретному пользователю.

Современные поисковые системы также должны уметь обрабатывать синонимы, опечатки, многословные запросы и даже вопросы. Обработка естественного языка (NLP) используется поисковыми системами, чтобы помочь читать, понимать и понимать человеческий язык.

Кроме того, маркетологи могут захотеть продвигать сезонные товары, аналогичные мерчандайзингу в магазине, или бизнес-операторы могут захотеть продвигать товары с более высокой маржой. Следовательно, релевантная поисковая система также должна учитывать эти факторы и предоставлять настраиваемый рейтинг, который можно со временем корректировать в соответствии с этими потребностями.

Однако многие из этих алгоритмов все еще неуклюжи. Чтобы улучшить это, некоторые алгоритмы учитывают важность атрибута соответствия и близости ключевых слов. Таким образом, результаты поиска с гораздо большей вероятностью будут релевантны пользователям, чем алгоритмы поиска общего назначения.

В последнее время, чтобы повысить релевантность, дизайнеры поисковых систем работают над созданием большей персонализации и контекстуализации. Сюда входят такие технологии, как машинное обучение и обработка естественного языка, обеспечивающие более разговорный поиск, отслеживание пользовательского поиска и истории посещенных страниц для обеспечения индивидуальной интерпретации запросов, а также автоматическая маркировка и категоризация веб-страниц для понимания содержимого на более высоком уровне, чем просто текстовые ключевые слова.

Точная настройка релевантности поиска с помощью Algolia 

Оптимизация релевантности веб-сайта для поиска — сложный и непрерывный процесс.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *