Google получил патент на поведенческие факторы ранжирования

Изменение ранжирования результатов поиска на основе неявной обратной связи с пользователем.
Ссылка на патент от 12 марта 2019

В патенте описывается процесс сбора и анализа поведенческих факторов. Наиболее интересным элементом является так называемый Rank Modifier Engine, то есть система корректировки ранжирования.
Что такое Rank Modifier Engine?

Итак, исходя и описанной в патенте технологии существует две системы ранжирования сайтов:
Корневая система ранжирования страниц сайтов;
Система корректировки ранжирования (Rank Modifier Engine).
Система корректировки ранжирования работает отдельно и автономно от основной системы ранжирования.
Процесс выглядит следующим образом:

Title

Скрин

[свернуть]

Основная система ранжирования получает так называемую меру релевантности страницы из системы корректировки ранжирования. В результате позиции в поисковой выдаче изменяются.
В патенте описываются сигналы, которые поисковая система может использовать при ранжировании сайтов.
В патенте речь идет про следующие сигналы ранжирования:

Кликовые поведенческие факторы. Речь про факторы, связанные с поведением пользователя на странице поисковой выдачи. В патенте описывается анализ кликстрима, расчет CTR документа по запросу и прочее;
Фактор длины клика. Согласно патенту, анализируется время, проведенное пользователем на выбранной странице сайта (a time the user spent on the document). В среде поисковых оптимизаторов метрика именуется как dwell time. Под временем, потраченным пользователем на странице сайта, подразумевается время, прошедшее от клика на ссылку в органических результатах до возвращения к поисковой выдаче и выбора нового документа.
Язык и страна пользователя. Использование данного фактора указывает на дифференцирование результатов выдачи в зависимости от языка и предполагаемой страны. К примеру, результаты выдачи для запросов на русском языке и на украинском языке могут отличаться по причине использования разного языка в интерфейсе. Значит, от правильной настройки мультиязычности на сайте зависят позиции в поисковой выдаче. Если перелинковка настроена не верно, то по запросам с одинаковым интентом могут быть потеряны позиции. Если на сайте используется множество языков и перелинковка настроена правильно, то по схожим запросам будет выводиться один и тот же сайт, но ссылки будут разными.

Кликовые факторы ранжирования в патенте расписаны подробно. Срезы по длине клика следующие:

Запрос-документ;
Запрос-документ-язык;
Запрос-документ-язык-страна.

По длине клики разбиваются на такие группы:

Короткие;
Средние;
Длинные;
Последний клик.

Итак, определено понятие последнего клика.

Последним кликом называется клик, после которого пользователь не возвращается на страницу с результатами выдачи.

Что можно считать коротким, что средним и что длинным кликом? Значение для каждой из групп зависит от запроса. Итак, для каждого запроса есть свои значения, и конкретные цифры определяются исходя из поведения пользователей на практике.

Как результат, исходя из данных о длине клике поисковым алгоритмом оценивается то, насколько хорошо страница отвечает на поисковый запрос.

В патенте приводится следующий пример:

Короткий клик может считаться плохим показателем для страницы. Страница плохо отвечает на поисковый запрос. Пример значения — 0,1;
Средний клик характеризует страницу как потенциально полезную. Пример значения — 0,5;
Длинный клик характеризует страницу как хорошую. Пример значения — 1,0;
Последний клик характеризует страницу как вероятно хорошую. Пример значения — 0,9.

При анализе кликов меньший вес назначается кликам тех пользователей, которые чаще остальных выбирают высоко ранжируемые страницы. Иными словами, если пользователь постоянно выбирает результаты из топ-3, то значимость клика снижается.

Помимо оценки поведения на выдаче, пользователей также разделяют на обычных и опытных. Как результат, при учете кликов определенного пользователя используется весовой коэффициент. Значение зависит от индивидуального поведения в интернете.

Пользователь может быть классифицирован на основе запросов, которые отправляют в поисковую систему. В частности, предполагается, что пользователь является опытным в нише, если вводит множество запросов по определенной нише.

Какой вывод можно сделать? Значит, использование мотивированного трафика из специальных сервисов заведомо ниже по эффективности, нежели привлечение целевой аудитории в выдачу из социальных сетей или оптимизация сниппетов и прочее.

Какие еще нюансы по анализу выдачи известны из патента? На основе полученных данных поисковой системе требуется получить информацию о том, какие страницы лучше отвечают на запрос, и какие хуже. Но если использовать данные напрямую, то ввиду естественного распределения страницы из топ-3 будут получать больше переходов из поисковой выдачи, и, как следствие, выдача не будет изменяться.

Как тогда решить вопрос определения релевантных страниц, исходя из полученных данных? Решение заключается в следующем. При расчете значения релевантности используются составные показатели.

Примеры составных показателей:

Отношение числа длинных кликов к коротким;
Отношение числа длинных кликов ко всем кликам для конкретного документа по конкретному запросу (доля длинных кликов).

В качестве защиты от шума к подобным отношениям может быть добавлен параметр сглаживания.

Параметр сглаживания обладает следующим свойством — если общее количество кликов невелико, то результат будет стремиться к нулю.

Как результат, благодаря составным показателям, страницы получающие относительно небольшое количество кликов, но длинных в итоге могут получить больший вес меры релевантности, нежели страницы, находящиеся в топ-3 и получающие относительно большое количество кликов, но коротких.

Параметры сглаживания могут варьироваться в зависимости от языка или страны.
Исходя из патента, вычисленные значения меры релевантности (в явном или преобразованном виде) предлагается применять в качестве повышающего коэффициента к значениям релевантности, вычисленным алгоритмом ранжирования.

Значит, поведенческие факторы влияют на результаты ранжирования страниц в органической выдаче поисковой системы.

Источник.

Метки: нет меток

Add a Comment

Your email address will not be published. Required fields are marked *

Этот сайт использует Akismet для борьбы со спамом. Узнайте, как обрабатываются ваши данные комментариев.