Способ и система для ранжирования веб-ресурса

Изобретение относится к области вычислительной техники. Технический результат заключается в повышении точности ранжирования веб-ресурса. Технический результат достигается за счет приема набора признаков, связанных с веб-ресурсом; генерирования необработанной оценки качества на основе набора признаков, сравнения необработанной оценки качества с эталонной оценкой, причем эталонная оценка связана со схожим уровнем пользовательского трафика, как у данного веб-ресурса; применения формулы корректировки смещения к необработанной оценке качества в ответ на смещение между необработанной оценкой качества и эталонной оценкой для получения скорректированной оценки качества; в ответ на прием запроса генерирование страницы результатов поисковой машины (SERP), включающей в себя указание веб-ресурса в ранжированной позиции на основе скорректированной оценки качества, причем скорректированная оценка качества приводит к тому, что будущая необработанная оценка качества приближается к будущей эталонной оценке, связанной с будущим уровнем пользовательского трафика. 2 н. и 16 з.п. ф-лы, 7 ил.

 

Область техники

[0001] Настоящая технология в целом относится к способам и системам для ранжирования веб-ресурса, в частности к системе и способу для ранжирования веб-ресурса с помощью поисковой машины.

Уровень техники

[2] Различные глобальные или локальные сети связи (Интернет, Всемирная паутина, локальные сети и т.п.) предлагают пользователю огромное количество информации. Информация включает в себя множество контекстных тем, таких как, но не ограничиваясь ими, новости и текущие события, карты, информация о компании, финансовая информация и ресурсы, информация о трафике, информация об играх и развлечениях. Пользователи используют различные клиентские устройства (настольный компьютер, лэптоп, ноутбук, смартфон, планшеты и т.д.) для доступа к рич-контенту (rich content) (например, изображениям, аудио, видео, анимации и другому мультимедийному содержимому из таких сетей).

[3] Объем доступной через различные Интернет-ресурсы информации вырос за последние пару лет экспоненциально. Было разработано несколько решений, чтобы позволить обычному пользователю находить информацию, которую этот пользователь ищет.Одним примером такого решения является поисковая машина. Примерами поисковых машин являются поисковая машина GOOGLE™, поисковая машина ЯНДЕКС™, поисковая машина YAHOO!™ и подобные. Пользователь может осуществить доступ к интерфейсу поисковой машины и отправить поисковый запрос, связанный с информацией, местоположение которой в Интернете этот пользователь желает определить. В ответ на поисковый запрос поисковая машина предоставляет ранжированный список результатов поиска. Ранжированный список результатов поиска генерируется на основе различных алгоритмов ранжирования, используемых конкретной поисковой машиной, которая используется пользователем, выполняющим поиск. Общая цель таких алгоритмов ранжирования состоит в том, чтобы представить наиболее релевантные результаты поиска в верхней части ранжированного списка, в то время как менее релевантные результаты поиска располагаются в менее заметных положениях в ранжированном списке результатов поиска (с наименее релевантными результатами поиска, располагаемыми ближе к нижней части ранжированного списка результатов поиска).

[4] Публикация патентной заявки США №2018/373723 A1, озаглавленной «Method and System for Applying a Machine Learning Approach to Ranking webpages’ performance relative to their nearby peers», опубликованной 27 декабря 2018 г.и принадлежащей Unbounce Marketing Solutions Inc., раскрывает способ и систему облачного машинного обучения для сравнения, ранжирования и/или предсказания производительности примерной веб-страницы (например, коэффициента конверсии для веб-страниц в онлайн-маркетинговой кампании) по сравнению с ее ближайшими аналогами. Ближайшие аналоги выбираются из выборочного набора веб-страниц, для которых известна производительность. Тематическая модель строится из модельного набора веб-страниц на основе их содержания. Вектор темы для примера веб-страницы и для каждой веб-страницы в наборе примеров определяется на основе построенной тематической модели. Ближайшие узлы веб-страницы из примера определяются с помощью меры расстояния/сходства между тематическим вектором примерной веб-страницы и каждой веб-страницей из набора образцов. Способ и система могут быть применены к одной или множеству примеров веб-страниц, чтобы оценить веб-страницы, которые неэффективны по сравнению с их ближайшими аналогами.

[5] Публикация патентной заявки США №2017/185602 A1, озаглавленной «System and Method for Ranking Search Engine Results», опубликованной 5 мая 2017 г.и принадлежащей Yandex Europe AG, раскрывает способы и системы для генерирования страницы результатов поисковой машины (SERP). Способ выполняется на сервере, на котором выполняется поисковая машина, при этом доступ к серверу через сеть связи осуществляется по меньшей мере одним электронным устройством. Способ содержит, в качестве части генерирования списка результатов поиска, список результатов поиска, содержащий первый результат поиска и второй результат поиска, предсказание первого интересующего параметра для первого результата поиска; предсказание второго интересующего параметра для второго результата поиска; предсказание параметра полезности для первого результата поиска, при этом предсказание, по меньшей мере частично, основано на первом интересующем параметре и втором интересующем параметре; корректировку позиции первого результата поиска в ранжированном списке результатов поиска на основе предсказанного параметра полезности, при этом корректировка приводит к тому, что первый результат поиска находится в скорректированной позиции в ранжированном списке результатов поиска.

Сущность изобретения

[6] Целью настоящей технологии является обеспечение улучшенного способа и систем ранжирования веб-ресурса.

[7] Новые веб-ресурсы генерируются постоянно, что затрудняет правильную оценку поисковой машиной их релевантности заданному запросу.

[8] Например, довольно новый веб-ресурс редко будет занимать высокие позиции на странице результатов поисковой машины (SERP), поскольку приложению поисковой машины не хватает истории (например, частоты кликов) веб-ресурса. Это может произойти, даже если веб-ресурс очень релевантен поисковому запросу. Другими словами, разработчики настоящей технологии выявили, что существует потребность в способе и системе, которые предоставляют решения по мониторингу трафика для надлежащего определения ранга веб-ресурса.

[9] В соответствии с первым широким аспектом настоящей технологии предоставляется компьютерно-реализуемый способ ранжирования веб-ресурса, причем способ исполняется сервером поисковой машины, причем способ содержит, в фазе использования: прием от сервера набора признаков, включающего в себя статистические признаки, связанные с веб-ресурсом; генерирование сервером необработанной оценки качества на основе набора признаков, причем необработанная оценка качества указывает на воспринимаемое качество веб-ресурса одним или более пользователями; сравнение необработанной оценки качества с эталонной оценкой, причем эталонная оценка связана со схожим уровнем пользовательского трафика, как у данного веб-ресурса, причем эталонная оценка определяется на основе необработанных оценок качества множества обучающих веб-ресурсов; применение сервером формулы корректировки смещения к необработанной оценке качества в ответ на смещение между необработанной оценкой качества и эталонной оценкой для получения скорректированной оценки качества; в ответ на прием запроса, генерирование сервером страницы результатов поисковой машины (SERP), включающей в себя указание веб-ресурса в ранжированной позиции на основе скорректированной оценки качества, причем скорректированная оценка качества приводит к тому, что будущая необработанная оценка качества приближается к будущей эталонной оценке, связанной с будущим уровнем пользовательского трафика для данного веб-ресурса.

[10] В некоторых неограничивающих вариантах осуществления способа генерирование необработанной оценки качества включает в себя: выполнение сервером набора алгоритмов предсказания, причем каждый алгоритм предсказания сконфигурирован для генерирования значения предсказанного признака для данного признака из набора признаков на основе остальных признаков; определение сервером весового значения для каждого алгоритма предсказания, причем весовое значение указывает, насколько хорошо данное значение признака коррелирует с остальными признаками из набора признаков; вычисление сервером необработанных оценок качества на основе набора признаков и соответствующего весового значения.

[11] В некоторых неограничивающих вариантах осуществления способа определение эталонной оценки содержит: нанесение необработанных оценок качества множества обучающих веб-ресурсов на график, связанный с соответствующим уровнем трафика; генерирование кривой тренда, подгоняющей набор необработанных оценок качества к графику, причем кривая тренда проходит через набор эталонных оценок, причем набор эталонных оценок включает в себя эталонные оценки на каждом уровне трафика.

[12] В некоторых неограничивающих вариантах осуществления способа кривая тренда основана на формуле f(x)=a * np.log (b * x+c), где: a - параметр вертикального смещения; b - параметр резкости кривой тренда; c - параметр горизонтального смещения.

[13] В некоторых неограничивающих вариантах реализации способа формула корректировки смещения имеет вид: raw_score - (1 - a) * (f(visitors) - raw_score) * b / std(raw_score) * (visitors*c) / (d * 10), где: raw_score соответствует необработанной оценке качества; visitors соответствует коэффициенту ежемесячного возврата пользователей; a, b, c и d - предварительно определенные значения.

[14] В некоторых неограничивающих вариантах осуществления способа набор признаков содержит по меньшей мере одно из следующего: качество веб-ресурса; коэффициент ежемесячного возврата пользователей; длительная привязанность пользователей к веб-ресурсу; процент обращений с длительностью клика более 120 секунд; количество пользователей в месяц; процент уникальных прямых обращений с мобильных устройств; процент уникальных прямых обращений с настольных компьютеров; логарифм абсолютного количества прямых сеансов с настольных компьютеров; среднее качество пользователей на хосте; и доля исходящего трафика от хоста к рекламе.

[15] В некоторых неограничивающих вариантах осуществления способа способ дополнительно включает нормализацию каждого признака в наборе признаков между значением от 0 до 1.

[16] В некоторых неограничивающих вариантах осуществления способа уровень пользовательского трафика измеряется одним из следующих параметров: ежемесячные активные пользователи (MAU); еженедельные активные пользователи (WAU); и ежедневные активные пользователи (DAU).

[17] В некоторых неограничивающих вариантах осуществления способа приведение будущей необработанной оценки качества к будущей эталонной оценке содержит: в ответ на то, что необработанная оценка качества выше эталонной оценки, скорректированная оценка качества приводит к тому, что ранжированная позиция оказывается ниже ранжированной позиции, связанной с необработанной оценкой качества; и в ответ на то, что необработанная оценка качества ниже эталонной оценки, скорректированная оценка качества приводит к тому, что ранжированная позиция оказывается выше ранжированной позиции, связанной с необработанной оценкой качества.

[18] В соответствии с другим широким аспектом настоящей технологии раскрывается сервер для ранжирования веб-ресурса, причем сервер содержит процессор, сконфигурированный с возможностью, в фазе использования, принимать набор признаков, включающий в себя статистические признаки, связанные с веб-ресурсом; генерировать необработанную оценку качества на основе набора признаков, причем необработанная оценка качества указывает на воспринимаемое качество веб-ресурса одним или более пользователями; сравнивать необработанную оценку качества с эталонной оценкой, причем эталонная оценка связана со схожим уровнем пользовательского трафика, как у данного веб-ресурса, причем эталонная оценка определяется на основе необработанных оценок качества множества обучающих веб-ресурсов; применять формулу корректировки смещения к необработанной оценке качества в ответ на смещение между необработанной оценкой качества и эталонной оценкой для получения скорректированной оценки качества; в ответ на прием запроса генерировать страницу результатов поисковой машины (SERP), включающую в себя указание веб-ресурса в ранжированной позиции на основе скорректированной оценки качества, причем скорректированная оценка качества приводит к тому, что будущая необработанная оценка качества приближается к будущей эталонной оценке, связанной с будущим уровнем пользовательского трафика для данного веб-ресурса.

[19] В некоторых неограничивающих вариантах осуществления сервера для генерирования необработанной оценки качества процессор сконфигурирован с возможностью: выполнять набор алгоритмов предсказания, причем каждый алгоритм предсказания сконфигурирован для генерирования значения предсказанного признака для данного признака из набора признаков на основе остальных признаков; определять весовое значение для каждого алгоритма предсказания, причем весовое значение указывает, насколько хорошо данное значение признака коррелирует с остальными признаками из набора признаков; вычислять необработанные оценки качества на основе набора признаков и соответствующего весового значения.

[20] В некоторых неограничивающих вариантах осуществления сервера для определения эталонной оценки процессор сконфигурирован с возможностью: наносить необработанные оценки качества множества обучающих веб-ресурсов на график, связанный с соответствующим уровнем трафика; генерировать кривую тренда, подгоняющую набор необработанных оценок качества к графику, причем кривая тренда проходит через набор эталонных оценок, причем набор эталонных оценок включает в себя эталонные оценки на каждом уровне трафика.

[21] В некоторых неограничивающих вариантах реализации сервера кривая тренда основана на формуле f(x)=a * np.log (b * x+c), где: a - параметр вертикального смещения; b - параметр резкости кривой тренда; c - параметр горизонтального смещения.

[22] В некоторых неограничивающих вариантах реализации сервера формула корректировки смещения имеет вид: raw_score - (1 - a) * (f(visitors) - raw_score) * b / std(raw_score) * (visitors*c) / (d * 10), где: raw_score соответствует необработанной оценке качества; visitors соответствует коэффициенту ежемесячного возврата пользователей; a, b, c и d - предварительно определенные значения.

[23] В некоторых неограничивающих вариантах осуществления сервера набор признаков содержит по меньшей мере одно из следующего: качество веб-ресурса; коэффициент ежемесячного возврата пользователей; длительная привязанность пользователей к веб-ресурсу; процент обращений с длительностью клика более 120 секунд; количество пользователей в месяц; процент уникальных прямых обращений с мобильных устройств; процент уникальных прямых обращений с настольных компьютеров; логарифм абсолютного количества прямых сеансов с настольных компьютеров; среднее качество пользователей на хосте; и доля исходящего трафика от хоста к рекламе.

[24] В некоторых неограничивающих вариантах осуществления сервера процессор дополнительно конфигурируется для нормализации каждого признака в наборе признаков между значением от 0 до 1.

[25] В некоторых неограничивающих вариантах осуществления сервера уровень пользовательского трафика измеряется одним из следующих параметров: ежемесячные активные пользователи (MAU); еженедельные активные пользователи (WAU); и ежедневные активные пользователи (DAU).

[26] В некоторых неограничивающих вариантах осуществления сервера для приближения будущей необработанной оценки качества к будущей эталонной оценке, процессор сконфигурирован для следующего: в ответ на то, что необработанная оценка качества выше эталонной оценки, скорректированная оценка качества приводит к тому, что ранжированная позиция оказывается ниже ранжированной позиции, связанной с необработанной оценкой качества; и в ответ на то, что необработанная оценка качества ниже эталонной оценки, скорректированная оценка качества приводит к тому, что ранжированная позиция оказывается выше ранжированной позиции, связанной с необработанной оценкой качества.

[27] В контексте настоящего описания «сервер» - это компьютерная программа, которая работает на соответствующем аппаратном обеспечении и способна принимать запросы (например, от электронных устройств) по сети и выполнять эти запросы или вызывать выполнение этих запросов. Аппаратное обеспечение может представлять собой один физический компьютер или одну физическую компьютерную систему, но ни то, ни другое не обязательно требуется в отношении настоящей технологии. В настоящем контексте использование выражения «по меньшей мере один сервер» не предназначено для обозначения того, что каждая задача (например, принимаемые инструкции или запросы) или какая-либо конкретная задача будет принята, выполнена или будет вызвана для выполнения одним и тем же сервером (т.е. одним и тем же программным и/или аппаратным обеспечением); подразумевается, что любое количество программных элементов или аппаратных устройств может быть вовлечено в прием/отправку, выполнение или вызов для выполнения любой задачи или запроса, или последствий любой задачи или запроса; и все это программное и аппаратное обеспечение может быть одним сервером или несколькими серверами, при этом оба этих случая включены в выражение «по меньшей мере один сервер».

[28] В контексте настоящего описания, если специально не предусмотрено иное, слова «первый», «второй», «третий» и т.д. Использовались в качестве прилагательных только с целью обеспечения различия между существительными, которые они изменяют, от одного к другому, и не с целью описания каких-либо конкретных отношений между этими существительными. Таким образом, например, следует понимать, что использование понятий "первый сервер" и "третий сервер" не подразумевает какого-либо конкретного порядка, типа, хронологии, иерархии или ранжирования (например) таких/между такими серверами, равно как и их использование (само по себе) не означает, что какой-либо "второй сервер" должен обязательно существовать в любой определенной ситуации. Кроме того, как обсуждается в других контекстах данного документа, ссылка на "первый" элемент и "второй" элемент не исключает того, что эти два элемента фактически являются одним и тем же элементом реального мира. Таким образом, например, в некоторых случаях "первый" сервер и "второй" сервер могут быть одним и тем же программным обеспечением и/или аппаратным обеспечением, в других случаях они могут представлять собой разное программное обеспечение и/или аппаратное обеспечение.

[29] В контексте настоящего описания, если специально не указано иное, "база данных" представляет собой любую структурированную совокупность данных, независимо от ее конкретной структуры, программное обеспечение для администрирования базы данных, или компьютерное аппаратное обеспечение, на котором данные хранятся, реализуются или их делают доступными для использования иным образом. База данных может находиться на том же аппаратном обеспечении, что и процесс, который хранит или использует информацию, хранящуюся в базе данных, или она может находиться на отдельном аппаратном обеспечении, например на выделенном сервере или множестве серверов.

Краткое описание чертежей

[30] Для лучшего понимания настоящей технологии, а также других аспектов и ее дополнительных признаков, производится обращение к нижеследующему описанию, которое должно использоваться в сочетании с сопроводительными чертежами, на которых:

[31] Фиг.1 иллюстрирует схематичное представление системы, реализуемой в соответствии с неограничивающими вариантами осуществления настоящей технологии.

[32] Фиг.2 - схематическая иллюстрация страницы результатов поисковой машины (SERP) в соответствии с неограничивающими вариантами осуществления настоящей технологии.

[33] Фиг.3 - схематическая диаграмма процесса приложения, выполняемого в системе, показанной на Фиг.1.

[34] Фиг.4 - схематическая иллюстрация функций алгоритмов предсказания, выполняемых в соответствии с неограничивающими вариантами осуществления настоящей технологии.

[35] Фиг.5 - схематический график, который генерируется в соответствии с первым неограничивающим вариантом осуществления настоящей технологии.

[36] Фиг.6 - схематический график, который генерируется в соответствии со вторым неограничивающим вариантом осуществления настоящей технологии.

[37] На Фиг.7 изображена блок-схема блок-схемы способа ранжирования веб-ресурса.

Подробное описание

[38] Со ссылкой на Фиг.1 проиллюстрировано схематичное представление системы 100, причем система 100 подходит для реализации неограничивающих вариантов осуществления настоящей технологии. Следует четко понимать, что система 100 проиллюстрирована лишь как иллюстративная реализация настоящей технологии. Таким образом, нижеследующее описание предназначено лишь для того, чтобы использоваться в качестве описания иллюстративных примеров настоящей технологии. Это описание не предназначено для определения объема или ограничения настоящей технологии. В некоторых случаях то, что считается полезными примерами модификаций системы 100, также может быть изложено ниже. Это делается лишь для содействия пониманию и, опять же, не для строгого определения объема или очерчивания границ настоящей технологии. Эти модификации не являются исчерпывающим списком и, как будет понятно специалисту в данной области техники, вероятно возможны другие модификации. Кроме того, если это не было сделано (то есть, когда примеры модификаций не были приведены), это не следует интерпретировать так, что никакие модификации не возможны и/или что описанное является единственным способом реализации этого элемента настоящей технологии. Специалисту в данной области будет понятно, что это, вероятно, не так. Кроме того, следует понимать, что в некоторых случаях система 100 может предоставлять простые реализации настоящей технологии, и что в таких случаях они представлены для помощи в понимании. Специалисты в данной области поймут, что различные реализации настоящей технологии могут иметь большую сложность.

[39] Приведенные в данном документе примеры и условные формулировки призваны главным образом помочь читателю понять принципы настоящей технологии, а не ограничить ее объем такими конкретно приведенными примерами и условиями. Следует понимать, что специалисты в данной области смогут разработать различные механизмы, которые, хоть и не описаны в данном документе явным образом, тем не менее воплощают принципы настоящей технологии и включаются в ее сущность и объем. Кроме того, нижеследующее описание может описывать реализации настоящей технологии в относительно упрощенном виде для целей упрощения понимания. Специалисты в данной области техники поймут, что различные реализации настоящей технологии могут иметь и большую сложность.

[40] Кроме того, все содержащиеся в данном документе утверждения, в которых указываются принципы, аспекты и реализации настоящей технологии, а также их конкретные примеры, призваны охватить как структурные, так и функциональные эквиваленты, вне зависимости от того, известны ли они в настоящее время или будут разработаны в будущем. Таким образом, например, специалисты в данной области должны понимать, что любые блок-схемы в данном документе представляют концептуальные виды иллюстративной схемы, воплощающей принципы настоящей технологии. Аналогичным образом, следует понимать, что любые блок-схемы, схемы последовательности операций, схемы изменения состояний, псевдо-коды и подобное представляют различные процессы, которые могут быть по сути представлены на компьютерно-читаемых носителях и исполнены компьютером или процессором вне зависимости от того, показан такой компьютер или процессор явным образом или нет.

[41] Функции различных элементов, показанных на фигурах, в том числе любого функционального блока, помеченного как "процессор", могут быть обеспечены с помощью специализированного аппаратного обеспечения, а также аппаратного обеспечения, способного исполнять программное обеспечение и связанного с надлежащим программным обеспечением. При обеспечении процессором функции могут быть обеспечены одним выделенным процессором, одним совместно используемым процессором или множеством отдельных процессоров, некоторые из которых могут быть совместно используемыми. В некоторых вариантах осуществления настоящей технологии процессор может быть процессором общего назначения, таким как центральный процессор (CPU) или процессор, выделенный для конкретной цели, например графический процессор (GPU). Кроме того, явное использование понятия "процессор" или "контроллер" не должно истолковываться как относящееся исключительно к аппаратному обеспечению, способному исполнять программное обеспечение, и может в неявной форме включать в себя, без ограничений, аппаратное обеспечение цифрового сигнального процессора (DSP), сетевой процессор, интегральную схему специального назначения (ASIC), программируемую пользователем вентильную матрицу (FPGA), постоянную память (ROM) для хранения программного обеспечения, оперативную память (RAM) и энергонезависимое хранилище. Другое аппаратное обеспечение, традиционное и/или специализированное, также может быть включено в состав.

[42] Учитывая эти основополагающие вещи, рассмотрим некоторые неограничивающие примеры, чтобы проиллюстрировать различные реализации аспектов настоящей технологии.

[43] Система 100 содержит электронное устройство 102. Электронное устройство 102 обычно связано с пользователем (не изображен) и, как таковое, иногда может упоминаться как "клиентское устройство". Следует отметить, что тот факт, что электронное устройство 102 связано с пользователем, не означает, что он предполагает или подразумевает какой-либо режим работы - такой как необходимость входа в систему, необходимость регистрации или тому подобное.

[44] В контексте настоящего описания, если не указано иное, "электронное устройство" представляет собой любое компьютерное аппаратное обеспечение, которое способно выполнять программное обеспечение, подходящее для соответствующей рассматриваемой задачи. Таким образом, некоторые (не ограничивающие) примеры электронных устройств включают в себя персональные компьютеры (настольные, ноутбуки, нетбуки и т.д.), смартфоны и планшеты, а также сетевое оборудование, такое как маршрутизаторы, коммутаторы и шлюзы. Следует отметить, что устройство, выступающее в качестве электронного устройства в данном контексте, не исключается из возможности выступать в качестве сервера для других электронных устройств. Использование выражения "электронное устройство" не исключает использования многочисленных клиентских устройств при приеме/отправке, выполнении или вызове для выполнения какой-либо задачи или запроса, или последствий любой задачи или запроса, или этапов любого описанного в данном документе способа.

[45] Электронное устройство 102 содержит постоянное хранилище 104. Постоянное хранилище 104 может включать в себя один или более запоминающих носителей и, как правило, обеспечивает место для хранения компьютерно-исполняемых инструкций, исполняемых процессором 106. В качестве примера, постоянное хранилище 104 может быть реализовано как компьютерно-читаемый носитель, включающий в себя постоянное запоминающее устройство (ROM), жесткие диски (HDD), твердотельные накопители (SSD) и карты флэш-памяти.

[46] Электронное устройство 102 включает в себя аппаратное обеспечение, и/или программное обеспечение, и/или микропрограммное обеспечение (или их комбинацию) для выполнения приложения 108 браузера. В общем случае, цель приложения 108 браузера состоит в том, чтобы дать пользователю возможность перемещаться по Интернету. Способ реализации приложения 108 браузера известен в данной области техники и здесь не описывается. Достаточно сказать, что приложение 108 браузера может быть реализовано как приложение браузера Яндекс™. Следует четко понимать, что любое другое коммерчески доступное или проприетарное приложение браузера может использоваться для реализации неограничивающих вариантов осуществления настоящей технологии.

[47] В общем случае, электронное устройство 102 содержит интерфейс пользовательского ввода (не показан) (такой как клавиатура) для приема пользовательского ввода, например, в интерфейс запроса (не показан). То, как реализован интерфейс пользовательского ввода, особо не ограничивается и будет зависеть от того, как реализовано электронное устройство 102. Просто в качестве примера, а не ограничения, в тех вариантах осуществления настоящей технологии, где электронное устройство 102 реализовано как устройство беспроводной связи (например, смартфон iPhone™), интерфейс пользовательского ввода может быть реализован как софт-клавиатура (также называется экранной клавиатурой или программной клавиатурой). С другой стороны, если электронное устройство 102 реализовано как персональный компьютер, интерфейс пользовательского ввода может быть реализован как аппаратная клавиатура.

[48] Электронное устройство 102 подключено к сети 116 связи через канал 114 связи. В некоторых неограничивающих вариантах осуществления настоящей технологии сеть 116 связи может быть реализована как Интернет.В других вариантах осуществления настоящей технологии сеть 116 связи может быть реализована иначе, например как какая-либо глобальная сеть связи, локальная сеть связи, частная сеть связи и тому подобное.

[49] То, как реализована линия 114 связи, особо не ограничивается и будет зависеть от того, как реализовано электронное устройство 102. Просто в качестве примера, а не ограничения, в тех вариантах осуществления настоящей технологии, где электронное устройство 102 реализовано как устройство беспроводной связи (например, смартфон), канал связи (не показан) может быть реализован как канал беспроводной связи (например, помимо прочего, канал связи 3G, канал связи 4G, Wireless Fidelity или сокращенно WiFi®, Bluetooth® и т.п.). В этих примерах, где электронное устройство 102 реализовано как портативный компьютер, канал связи может быть либо беспроводным (например, Wireless Fidelity, или WiFi® для краткости, Bluetooth® и т.п.), либо проводным (например, соединением на основе Ethernet).

[50] Следует четко понимать, что реализации для электронного устройства 102, линии 114 связи и сети 116 связи предоставлены лишь в иллюстративных целях. Таким образом, специалисты в данной области техники легко поймут другие конкретные детали реализации электронного устройства 102, линии 114 связи и сети 116 связи. По существу, приведенные выше примеры никоим образом не предназначены для ограничения объема настоящей технологии.

[51] Система 100 дополнительно включает в себя сервер 118, подключенный к сети 116 связи. Сервер 118 может быть реализован как традиционный компьютерный сервер. В примере варианта осуществления настоящей технологии сервер 118 может быть реализован как сервер Dell™ PowerEdge™, работающий под управлением операционной системы Microsoft™ Windows Server™. Само собой разумеется, сервер 118 может быть реализован в любом другом подходящем аппаратном и/или программном и/или программно-аппаратном обеспечении или их комбинации. В проиллюстрированном неограничивающем варианте осуществления настоящей технологии сервер 118 является единственным сервером. В альтернативных неограничивающих вариантах осуществления настоящей технологии функциональные возможности сервера 118 могут быть распределены и могут быть реализованы посредством многочисленных серверов.

[52] Реализация сервера 118 хорошо известна. Однако, вкратце, сервер 118 содержит интерфейс связи (не показан), структурированный и сконфигурированный для связи с различными объектами (такими как электронное устройство 102 и другие устройства, потенциально подключенные к сети 116 связи) через сеть 116 связи.

[53] Сервер 118 содержит память 120 сервера, имеющую один или более запоминающих носителей, которые обычно предоставляют место для хранения компьютерно-исполняемых программных инструкций, выполняемых процессором 122 сервера. В качестве примера, серверная память 120 может быть реализована как материальный компьютерно-читаемый запоминающий носитель, включающий в себя постоянную память (ROM) и/или оперативную память (RAM). Серверная память 120 также может включать в себя одно или более стационарных запоминающих устройств в виде, например, жестких дисков (HDD), твердотельных накопителей (SSD) и карт флэш-памяти.

[54] В некоторых неограничивающих вариантах осуществления сервер 118 может управляться тем же объектом, который предоставил вышеописанное приложение 108 браузера. Например, если браузерное приложение 108 является приложением Яндекс. Браузер™, сервером 118 может управлять ООО «Яндекс» по адресу Россия, 119021, Москва, ул. Льва Толстого, д. 16. В альтернативных вариантах осуществления сервер 118 может управляться объектом, отличным от того, который предоставил вышеупомянутое приложение 108 браузера.

[55] В некоторых неограничивающих вариантах осуществления настоящей технологии сервер 118 предоставляет приложение 124 поисковой машины, которое доступно для приложения 108 браузера через сеть 116 связи. Способ реализации приложения 134 поисковой машины известен в данной области техники и поэтому не будет описываться здесь подробно.

[56] Кроме того, предусмотрен веб-сервер 126, подключенный к сети 116 связи. Веб-сервер 126 может (но не обязательно) быть реализован аналогично серверу 118. В изображенных вариантах осуществления настоящей технологии веб-сервер 126 является одиночным сервером. В альтернативных неограничивающих вариантах осуществления настоящей технологии функциональные возможности веб-сервера 126 могут быть распределены и реализованы через множество серверов.

[57] В некоторых неограничивающих вариантах реализации технологии веб-сервер 126 функционирует как репозиторий для по меньшей мере одного веб-ресурса 128.

[58] В некоторых неограничивающих вариантах осуществления настоящей технологии веб-сервер 126 сконфигурирован для хранения набора признаков (обсуждаемых ниже), связанных с веб-ресурсом 128.

[59] В общем случае, пользователь электронного устройства 102 может осуществить доступ к веб-ресурсу 128 через сеть 116 связи двумя основными способами. Данный пользователь может осуществить доступ напрямую, либо введя адрес веб-ресурса 128 (обычно URL или универсальный указатель ресурса, например www.example.com) в командный интерфейс приложения 108 браузера, либо щелкнув ссылку в по электронной почте или на другом веб-ресурсе (это действие будет в некотором смысле «копировать» и «вставлять» URL-адрес, связанный со ссылкой, в командный интерфейс).

[60] В качестве альтернативы, данный пользователь может проводить поиск с использованием приложения 124 поисковой машины, выполняемого сервером 118, для определения местоположения интересующего ресурса на основе поискового намерения пользователя. Последнее особенно подходит в тех случаях, когда данный пользователь знает интересующую тему, но не знает URL интересующего его веб-ресурса. Приложение 124 поисковой машины обычно возвращает страницу результатов поисковой машины (SERP), содержащую ссылки на один или более веб-ресурсов, которые отвечают на запрос пользователя. Опять же, когда пользователь щелкает одну или более ссылок, представленных в SERP, пользователь может открыть требуемый веб-ресурс.

[61] Со ссылкой на Фиг.2 изображена неограничивающая схематическая иллюстрация страницы 200 результатов поисковой машины (SERP), к которой обращается приложение 108 браузера.

[62] SERP 200 генерируется в ответ на приложение 108 браузера, отправляющее запрос 204 («как приготовить веганский крем») в приложение 124 поисковой машины. SERP 200 содержит множество результатов поиска, а именно первый результат 206 поиска, второй результат 208 поиска и третий результат 210 поиска, ранжированные в порядке релевантности запросу 204. Другими словами, приложение 124 поисковой машины определило, что первый результат 206 поиска является наиболее релевантным веб-ресурсом для запроса 204, за ним следуют второй результат 208 поиска и третий результат 210 поиска. Хотя в SERP 200 отображаются только три результата поиска, это сделано для простоты иллюстрации, и следует понимать, что обычно SERP будет содержать более трех результатов поиска для данного запроса.

[63] Как приложение 124 поисковой машины определяет релевантность результатов поиска, известно в данной области техники и поэтому не будет подробно описываться здесь. Достаточно сказать, что приложение 124 поисковой машины использует, среди прочего, частоту термов из запроса (то есть количество раз, когда слово появляется в каждом веб-ресурсе, деленное на количество слов в веб-ресурсе) и обратную частоту документа (т.е. логарифм количества документов, деленный на количество документов, содержащих это слово).

[64] Поскольку ранжирование веб-ресурса определяется (по меньшей мере частично) приложением 124 поисковой машины, принимая во внимание частоту термов и обратную частоту документа, общеизвестно, что некоторые издатели, злонамеренно или нет, искусственно раздувают веб-ресурс (например, с использованием ключевых термов), чтобы повысить его ранжирование приложением 124 поисковой машины, чтобы получить больше посетителей.

[65] Функции и операции различных компонентов приложения 124 поисковой машины теперь будут описаны более подробно. На Фиг.3 схематично показано приложение 124 поисковой машины для ранжирования веб-ресурса 128. Приложение 124 поисковой машины выполняет (или иным образом имеет доступ к): процедуру 302 определения оценки, процедуру 304 отображения и процедуру 306 корректировки.

[66] В контексте настоящего описания понятие «процедура» (routine, подпрограмма) относится к подмножеству компьютерно-исполняемых программных инструкций приложения 124 поисковой машины, которые выполняются серверным процессором 122 для выполнения функций, описанных ниже. Во избежание каких-либо сомнений следует четко понимать, что процедура 302 определения оценки, процедура 304 отображения и процедура 306 корректировки схематично проиллюстрированы здесь в отдельном и распределенном виде для простоты объяснения процессов, выполняемых приложением 124 поисковой машины. Предполагается, что часть или все из процедуры 302 определения оценки, процедуры 304 отображения и процедуры 306 корректировки могут быть реализованы как одна или более комбинированных процедур.

[67] Для простоты понимания настоящей технологии функциональные возможности каждой из процедуры 302 определения оценки, процедуры 304 отображения и процедуры 306 корректировки, а также данных и/или информации, обработанных или сохраненных в них во время фазы перед использованием приложения 124 поисковой машины описано ниже. Далее следует описание фазы использования приложения 124 поисковой машины.

Процедура 302 определения оценки

[68] Процедура 302 определения оценки сконфигурирована для приема пакета 308 данных от веб-сервера 126. Пакет 308 данных содержит набор признаков, связанных с веб-ресурсом 128.

[69] В некоторых неограничивающих вариантах осуществления настоящей технологии набор признаков, связанных с веб-ресурсом 128, включает в себя одно или более из следующего:

качество веб-ресурса 128;

коэффициент ежемесячного возврата пользователей;

длительная привязанность пользователей к веб-ресурсу;

процент обращений с длительностью клика более 120 секунд;

количество пользователей в месяц;

процент уникальных прямых обращений с мобильных устройств;

процент уникальных прямых обращений с настольных компьютеров;

логарифм абсолютного количества прямых сеансов с настольных компьютеров;

среднее качество пользователей веб-ресурса 128; и

доля исходящего трафика с веб-ресурса 128 на рекламный веб-ресурс.

[70] Для простоты понимания ниже представлено объяснение каждого признака.

[71] Качество веб-ресурса 128

[72] Качество ссылок веб-ресурса 128 указывает на параметр доверия, который назначается веб-ресурсу 128. То, как параметр доверия назначается веб-ресурсу 128, не ограничивается. В некоторых неограничивающих вариантах осуществления настоящей технологии параметр доверия определяется на основе белого списка веб-ресурсов, составленного одним или более операторами приложения 124 поисковой машины.

[73] Коэффициент ежемесячного возврата пользователей

[74] Коэффициент ежемесячного возврата пользователей соответствует соотношению количества пользователей, которые обращаются к веб-ресурсу 128 несколько раз в течение месяца, по отношению к общему количеству посещений пользователей.

[75] Длительная привязанность пользователей к веб-ресурсу 128

[76] Длительная привязанность пользователей к веб-ресурсу 128 указывает на количество пользователей, которые осуществляют доступ к веб-ресурсу 128 в течение предварительно определенного периода (например, трех месяцев). Длительная привязанность пользователей к веб-ресурсу 128 может соответствовать соотношению между общим количеством пользователей и повторно посещающих пользователей в течение предварительно определенного периода.

[77] Процент обращений с длительностью клика более 120 секунд

[78] Процент обращений с длительностью клика более 120 секунд соответствует проценту от общего числа пользовательских кликов продолжительностью более 120 секунд по отношению к общему количеству пользовательских кликов.

[79] Количество пользователей в месяц

[80] Количество пользователей в месяц соответствует общему количеству пользователей, осуществивших доступ к веб-ресурсу 128 в течение месяца.

[81] Процент уникальных прямых обращений с мобильных устройств

[82] Процент уникальных прямых обращений с мобильных устройств соответствует проценту прямых обращений (т.е. путем ввода URL-адреса веб-ресурса 128 в командный интерфейс веб-браузера 108, выполняемого на мобильном устройстве) по отношению к общему количеству доступов с мобильных устройств.

[83] Процент уникальных прямых обращений с настольных компьютеров

[84] Процент уникальных прямых обращений с настольных компьютеров соответствует проценту прямых обращений (т.е. путем ввода URL-адреса веб-ресурса 128 в командный интерфейс веб-браузера 108, выполняемого на настольном устройстве) по отношению к общему количеству доступов с настольных компьютеров.

[85] Логарифм абсолютного количества прямых сеансов с настольных компьютеров

[86] Логарифм абсолютного количества прямых сеансов с настольных компьютеров соответствует логарифмическому значению уникальных пользователей (определяемых, например, IP-адресом), которые обращаются к веб-ресурсу 128 с настольного компьютера.

[87] Среднее качество пользователей веб-ресурса 128

[88] Среднее качество пользователей веб-ресурса 128 соответствует соотношению реальных пользователей (людей) по сравнению с другими пользователями, посещающими веб-ресурс 128 (такими как боты).

[89] Доля исходящего трафика с веб-ресурса 128 на рекламный веб-ресурс

[90] Доля исходящего трафика от веб-ресурса 128 к рекламному веб-ресурсу соответствует проценту пользователей, выбирающих одно или более объявлений, включенных в веб-ресурс 128.

[91] В некоторых неограничивающих вариантах осуществления настоящей технологии, в ответ на прием набора признаков, процедура 302 определения оценки конфигурируется для нормализации каждого признака, так что каждый признак имеет значение от 0 до 1. Как каждый признак можно нормализовать до значения от 0 до 1, известно в данной области техники и поэтому здесь не описывается.

[92] В некоторых неограничивающих вариантах осуществления настоящей технологии процедура 302 определения оценки сконфигурирована для выполнения набора алгоритмов 310 предсказания.

[93] Ссылаясь на Фиг.4, поясняется функция набора алгоритмов 310 предсказания.

[94] Предположим, например, что пакет 308 данных включает в себя набор признаков 400 из 5 признаков (каждый из которых обозначен одной буквой A, B, C, D и E только для простоты иллюстрации, но то, какие признаки могут быть выбраны из списка, описывается выше). Соответственно, набор алгоритмов 310 предсказания включает в себя 5 алгоритмов предсказания, а именно первый алгоритм 402 предсказания, второй алгоритм 404 предсказания, третий алгоритм 406 предсказания, четвертый алгоритм 408 предсказания и пятый алгоритм 410 предсказания.

[95] Каждый алгоритм предсказания набора алгоритмов 310 предсказания сконфигурирован так, чтобы генерировать предсказанное значение признака для данного признака из набора признаков на основе остальных признаков набора признаков.

[96] Например, первый алгоритм 402 предсказания сконфигурирован для предсказания значения признака E (обозначенного как E*) на основе признаков A, B, C и D. Второй алгоритм 404 предсказания сконфигурирован для предсказания значения признака A (обозначается как A*) на основе признаков B, C, D и E и т.д.

[97] После того, как предсказанные значения признаков (т.е. E*, A*, B*, C* и D*) вычисляются, процедура 302 определения оценки сконфигурирована так, чтобы сравнивать предсказанные значения признаков с фактическими значениями признаков. Например, предсказанное значение признака E* сравнивается с фактическим значением признака E.

[98] В некоторых неограничивающих вариантах осуществления настоящей технологии процедура 302 определения оценки сконфигурирована так, чтобы назначать весовое значение для каждого из алгоритмов предсказания на основе разницы в значении между заданным предсказанным значением признака и его фактическим значением признака. Например, процедура 302 определения оценки сконфигурирована для вычисления первого весового значения 412, которое указывает, насколько хорошо значение признака E коррелирует с остальными признаками набора признаков (т.е. признаками A, B, C и D). Аналогичным образом, процедура 302 определения оценки сконфигурирована для вычисления второго весового значения 413, которое указывает, насколько хорошо значение A коррелирует с остальными признаками набора признаков (т.е. B, C, D и E) и так далее.

[99] В некоторых неограничивающих вариантах осуществления настоящей технологии, если заданное значение признака хорошо коррелирует с остальными признаками, то назначенный вес выше, чем если данное значение признака не коррелирует хорошо с остальными признаками. Например, предположим, что значение признака E хорошо коррелирует с остальными признаками набора признаков, но значение признака A плохо коррелирует с остальными признаками. В таком случае первое весовое значение 412 будет выше (т.е. иметь больший вес), чем второе весовое значение 414.

[100] Способ реализации весового значения не ограничен. Предполагается, что весовое значение соответствует разнице в значении между заданным предсказанным значением признака и его фактическим значением признака (или его нормализованным значением).

[101] В некоторых неограничивающих вариантах осуществления настоящей технологии процедура 302 определения оценки затем конфигурируется для вычисления необработанной оценки 414 качества на основе связанных весовых значений. В некоторых неограничивающих вариантах осуществления настоящей технологии необработанная оценка 414 качества соответствует, например, сумме весовых значений. Необработанная оценка 414 качества представляет воспринимаемое качество веб-ресурса 128 множеством пользователей на основе статистической информации о взаимодействиях множества пользователей с веб-ресурсом 128.

[102] Излишне говорить, что хотя набор признаков 400 проиллюстрирован как включающий только 5 признаков, это сделано для простоты понимания. Следует понимать, что набор признаков 400 может включать в себя больше или меньше 5 признаков.

[103] Возвращаясь к Фиг.3, процедура 302 определения оценки сконфигурирована для передачи пакета 312 данных процедуре 304 отображения. Пакет данных 312 содержит необработанную оценку 414 качества.

[104] Ссылаясь на Фиг.5, в ответ на прием пакета 312 данных процедура 304 отображения сконфигурирована так, чтобы отображать необработанную оценку 414 качества на график 500.

[105] График 500 иллюстрирует функцию зависимости необработанной оценки качества (ось y) от уровня пользовательского трафика (ось x). Уровень пользовательского трафика может соответствовать, например, ежемесячным активным пользователям (MAU), еженедельным активным пользователям (WAU); и ежедневным активным пользователям (DAU).

[106] График 500 включает в себя кривую 502 тренда. То, как генерируется кривая 502 тренда, не ограничено. В некоторых неограничивающих вариантах осуществления настоящей технологии один или более операторов приложения 124 поисковой машины выбирают множество обучающих веб-ресурсов, которые имеют необработанную оценку качества (как определено процедурой 302 определения оценки), которая близка или соответствует объективной оценке качества (определяемой операторами) связанного веб-ресурса.

[107] После того, как множество необработанных оценок качества обучающих веб-ресурсов (показано точками) нанесено на график 500, процедура 304 отображения конфигурируется для генерирования кривой 502 тренда. В некоторых вариантах осуществления настоящей технологии кривая 502 тренда представляет собой логарифмическую кривую тренда, имеющую формулу:

f(x)=a * np.log (b * x+c) (Функция 1),

[108] где:

а - параметр вертикального смещения;

b - параметр резкости кривой тренда; и

c - параметр горизонтального смещения.

[109] Кривая 502 тренда также может упоминаться как эталонная кривая, что означает, что кривая 502 тренда проходит через соответствующую эталонную оценку при заданном уровне пользовательского трафика. Например, на первом уровне 503 трафика эталонная оценка соответствует первой эталонной оценке 508, показанной черным кружком на кривой 502 тренда. Точно так же на втором уровне трафика 504 эталонная оценка соответствует второй эталонной оценке 510 на кривой 502 тренда. Наконец, на третьем уровне трафика 506 эталонная оценка соответствует третьей эталонной оценке 512 на кривой 502 тренда.

[110] Процедура 304 отображения сконфигурирована для отображения необработанной оценки 414 качества на график 500 в зависимости от уровня пользовательского трафика, связанного с веб-ресурсом 128.

[111] Затем процедура 304 отображения конфигурируется для передачи пакета 314 данных процедуре 306 корректировки (см. Фиг.3). Пакет 314 данных содержит график 500 с отображенной необработанной оценкой 414 качества.

[112] После приема пакета 314 данных процедура 306 корректировки конфигурируется для определения наличия смещения между необработанной оценкой 414 качества и эталонной оценкой кривой 502 тренда.

[113] Например, предположим, что необработанная оценка 414 качества отображается на график 500 в первой точке 514 (показанной как треугольник), которая смещена в вертикальном направлении от точки на кривой 502 тренда, которая соответствует эталонной оценке 516 (показана квадратом). Другими словами, существует смещение между воспринимаемым качеством веб-ресурса 128 (т.е. необработанной оценкой 414 качества) и объективной оценкой качества для веб-ресурса, который имеет схожий уровень пользовательского трафика, что свидетельствует о том, что воспринимаемое качество веб-ресурса 128 выше объективной оценки качества для веб-ресурса со схожим уровнем пользовательского трафика.

[114] В ответ на определение того, что существует смещение между необработанной оценкой 414 качества и эталонной оценкой 516, процедура 306 корректировки конфигурируется для применения формулы корректировки смещения к необработанной оценке 414 качества для получения скорректированной оценки качества. В некоторых неограничивающих вариантах осуществления настоящей технологии формула корректировки смещения имеет следующий вид:

raw_score - (1 - a) * (f(visitors) - raw_score) * b / std(raw_score) * (visitors*c) / (d * 10) (Функция 2),

где:

raw_score соответствует необработанной оценке 414 качества;

visitors соответствует уровню пользовательского трафика;

a, b, c и d - предварительно определенные значения

[115] Способ определения значений a, b, c и d не ограничен. В некоторых неограничивающих вариантах осуществления настоящей технологии значения могут быть определены одним или более экспертами-людьми, которые ранее скорректировали обучающие необработанные оценки качества, которые были смещены относительно их соответствующей эталонной оценки.

[116] В некоторых неограничивающих вариантах осуществления настоящей технологии значения a, b, c и d могут быть эмпирически выбраны экспертами-людьми на основе предварительно определенного пула веб-ресурсов, например 100 веб-ресурсов, 200 веб-ресурсов, или тому подобное. В некоторых вариантах осуществления настоящей технологии эксперты-люди определяют значения a, b, c и d, например, функция 2 наилучшим образом предсказывает скорректированное смещение между необработанными оценками для каждого из предварительно определенного пула веб-ресурсов и эталонной оценки. Далее следует отметить, что в некоторых неограничивающих вариантах осуществления настоящей технологии значения a, b, c и d не «изучаются» на основе необработанных оценок или других признаков веб-ресурсов из предварительно определенного пула веб-ресурсов. В этих неограничивающих вариантах осуществления настоящей технологии достигается технический результат, благодаря которому значения a, b, c и d излишне не подгоняются (или, другими словами, не смещаются) в сторону других показателей качества веб-ресурсов из предварительно определенного пула веб-ресурсов. В некотором смысле выходной сигнал функции 2 становится ортогональным сигналом качества для функций, на которых основана необработанная оценка качества.

[117] Теперь давайте предположим, например, что скорректированная оценка качества для необработанной оценки 414 качества соответствует второй точке 518 на кривой 502 тренда (обозначенной звездочкой). Другими словами, процедура 306 корректировки определяет, что объективная оценка качества веб-ресурса 128 должна быть близка к четвертому уровню трафика 520, связанному со второй точкой 518.

[118] Соответственно, процедура 306 корректировки сконфигурирована так, чтобы заставлять приложение 124 поисковой машины повышать ранжирование веб-ресурса 128 в результатах поиска, которые будут сгенерированы в будущих запросах, так что уровень трафика приближается к четвертому уровню трафика 520. Таким образом, можно сказать, что скорректированная оценка качества (то есть вторая точка 518) заставляет будущую необработанную оценку качества быть ближе к будущей контрольной оценке (соответствующей скорректированной оценке качества), связанной с будущим уровнем пользовательского трафика (т.е. четвертый уровень трафика 520).

[119] Действительно, при повышении ранжирования веб-ресурса 128 в SERP предполагается, что большее количество пользователей осуществит доступ к веб-ресурсу 128, следовательно, увеличится уровень пользовательского трафика.

[120] Хотя на иллюстрации на Фиг.5 объяснение было сделано со ссылкой на то, что необработанная оценка 414 качества смещена выше кривой 502 тренда, понятно, что это не ограничивается таким образом.

[121] Например, со ссылкой на Фиг.6 проиллюстрирована необработанная оценка 414 качества, отображенная на график 500 в первой точке 601 (изображенной в виде треугольника). Первая точка 601 смещена по вертикали от эталонной оценки кривой 502 тренда на том же уровне пользовательского трафика. Более конкретно, первая точка 601, находящаяся ниже кривой 502 тренда, указывает на то, что воспринимаемое качество веб-ресурса (то есть необработанная оценка 414 качества) ниже, чем объективная оценка качества веб-ресурса со схожим уровнем пользовательского трафика.

[122] Затем процедура 306 корректировки конфигурируется для вычисления скорректированной оценки качества для необработанной оценки 414 качества. Предположим, например, что скорректированная оценка качества соответствует второй точке 602 на кривой 502 тренда (показано звездочкой). Другими словами, процедура 306 корректировки определяет, что объективная оценка качества веб-ресурса 128 должна быть близка к уровню 604 трафика, связанному со второй точкой 602.

[123] Соответственно, приложение 124 поисковой машины сконфигурировано для уменьшения ранжирования данного веб-ресурса 128 в SERP, которые будут генерироваться в будущих запросах, так что уровень трафика приближается к уровню 604 трафика. Действительно, при понижении ранжирования веб-ресурса 128 в SERP предполагается, что меньше пользователей будет осуществлять доступ к веб-ресурсу 128 и, следовательно, снизится уровень пользовательского трафика.

[124] Учитывая архитектуру и примеры, приведенные выше, можно выполнить компьютерно-реализуемый способ ранжирования веб-ресурсов. Со ссылкой на Фиг.7 проиллюстрирована блок-схема последовательности операций способа 700, причем способ 700 может быть исполнен в соответствии с неограничивающими вариантами осуществления настоящей технологии. Способ 700 может быть исполнен сервером 118.

[125] Этап 702: прием сервером набора признаков, включающего в себя статистические признаки, связанные с веб-ресурсом;

[126] Способ 700 начинается с этапа 702, когда процедура 302 определения оценки принимает пакет 308 данных от веб-сервера 126. Пакет 308 данных содержит набор признаков, связанных с веб-ресурсом 128.

[127] В некоторых неограничивающих вариантах осуществления настоящей технологии набор признаков, связанных с веб-ресурсом 128, включает в себя одно или более из следующего:

качество веб-ресурса 128;

коэффициент ежемесячного возврата пользователей;

длительная привязанность пользователей к веб-ресурсу;

процент обращений с длительностью клика более 120 секунд;

количество пользователей в месяц;

процент уникальных прямых обращений с мобильных устройств;

процент уникальных прямых обращений с настольных компьютеров;

логарифм абсолютного количества прямых сеансов с настольных компьютеров;

среднее качество пользователей веб-ресурса 128; и

доля исходящего трафика с веб-ресурса 128 на рекламный веб-ресурс.

[128] Этап 704: генерирование сервером необработанной оценки качества на основе набора признаков, причем необработанная оценка качества указывает на воспринимаемое качество веб-ресурса одним или более пользователями;

[129] На этапе 704, в ответ на прием пакета 308 данных, процедура 302 определения оценки конфигурируется для выполнения набора алгоритмов 310 предсказания.

[130] Предположим, например, что пакет 308 данных включает в себя набор признаков 400 из 5 признаков (каждый из которых обозначен одной буквой A, B, C, D и E только для простоты иллюстрации, но то, какие признаки могут быть выбраны из списка, описывается выше). Соответственно, набор алгоритмов 310 предсказания включает в себя 5 алгоритмов предсказания, а именно первый алгоритм 402 предсказания, второй алгоритм 404 предсказания, третий алгоритм 406 предсказания, четвертый алгоритм 408 предсказания и пятый алгоритм 410 предсказания.

[131] Каждый алгоритм предсказания из набора алгоритмов 310 предсказания сконфигурирован так, чтобы генерировать предсказанное значение признака для данного признака из набора признаков на основе остальных признаков из набора признаков.

[132] Например, первый алгоритм 402 предсказания сконфигурирован для предсказания значения признака E (обозначенного как E*) на основе признаков A, B, C и D. Второй алгоритм 404 предсказания сконфигурирован для предсказания значения признака A (обозначается как A*) на основе признаков B, C, D и E и т.д.

[133] После того, как предсказанные значения признаков (т.е. E*, A*, B*, C* и D*) вычисляются, процедура 302 определения оценки сконфигурирована так, чтобы сравнивать предсказанные значения признаков с фактическими значениями признаков. Например, предсказанное значение признака E* сравнивается с фактическим значением признака E.

[134] В некоторых неограничивающих вариантах осуществления настоящей технологии процедура 302 определения оценки сконфигурирована так, чтобы назначать весовое значение для каждого из алгоритмов предсказания на основе разницы в значении между заданным предсказанным значением признака и его фактическим значением признака. Например, процедура 302 определения оценки сконфигурирована для вычисления первого весового значения 412, которое указывает, насколько хорошо значение признака E коррелирует с остальными признаками набора признаков (т.е. A, B, C и D). Аналогичным образом, процедура 302 определения оценки сконфигурирована для вычисления второго весового значения 413, которое указывает, насколько хорошо значение A коррелирует с остальными признаками набора признаков (т.е. B, C, D и E) и так далее.

[135] В некоторых неограничивающих вариантах осуществления настоящей технологии процедура 302 определения оценки затем конфигурируется для вычисления необработанной оценки 414 качества на основе связанных весовых значений. В некоторых неограничивающих вариантах осуществления настоящей технологии необработанная оценка 414 качества соответствует, например, сумме весовых значений. Необработанная оценка 414 качества представляет воспринимаемое качество веб-ресурса 128 множеством пользователей на основе статистической информации о взаимодействиях множества пользователей с веб-ресурсом 128.

[136] Этап 706: сравнение необработанной оценки качества с эталонной оценкой, причем эталонная оценка связана со схожим уровнем пользовательского трафика, как у данного веб-ресурса, причем эталонная оценка определяется на основе необработанных оценок качества множества обучающих веб-ресурсов;

[137] На этапе 706 процедура 304 отображения конфигурируется для отображения необработанной оценки 414 качества на график 500 в зависимости от уровня пользовательского трафика, связанного с веб-ресурсом 128.

[138] Например, предположим, что необработанная оценка 414 качества отображается на график 500 в первой точке 514 (показанной как треугольник), которая смещена в вертикальном направлении от точки на кривой 502 тренда, которая соответствует эталонной оценке 516 (показана квадратом). Другими словами, существует смещение между воспринимаемым качеством веб-ресурса 128 (т.е. необработанной оценкой 414 качества) и объективной оценкой качества для веб-ресурса, который имеет схожий уровень пользовательского трафика, что свидетельствует о том, что воспринимаемое качество веб-ресурса 128 выше объективной оценки качества для веб-ресурса со схожим уровнем пользовательского трафика.

[139] Этап 708: применение сервером формулы корректировки смещения к необработанной оценке качества в ответ на смещение между необработанной оценкой качества и эталонной оценкой для получения скорректированной оценки качества;

[140] На этапе 708, в ответ на определение того, что существует смещение между необработанной оценкой 414 качества и эталонной оценкой 516, процедура 306 корректировки конфигурируется для применения формулы корректировки смещения к необработанной оценке 414 качества для получения скорректированной оценки качества. В некоторых неограничивающих вариантах осуществления настоящей технологии формула корректировки смещения имеет следующий вид:

raw_score - (1 - a) * (f(visitors) - raw_score) * b / std(raw_score) * (visitors*c) / (d * 10) (Функция 2),

где:

raw_score соответствует необработанной оценке 414 качества;

visitors соответствует уровню пользовательского трафика; и

a, b, c и d - предварительно определенные значения.

[141] Теперь давайте предположим, например, что скорректированная оценка качества необработанной оценки 414 качества соответствует второй точке 518 на кривой 502 тренда (обозначенной звездочкой). Другими словами, процедура 306 корректировки определяет, что объективная оценка качества веб-ресурса 128 должна быть близка к четвертому уровню трафика 520, связанному со второй точкой 518.

[142] Этап 710: в ответ на прием запроса, генерирование сервером страницы результатов поисковой машины (SERP), включающей в себя указание веб-ресурса в ранжированной позиции на основе скорректированной оценки качества, причем скорректированная оценка качества приводит к тому, что будущая необработанная оценка качества приближается к будущей эталонной оценке, связанной с будущим уровнем пользовательского трафика для данного веб-ресурса

[143] На этапе 710 процедура 306 корректировки конфигурируется, чтобы заставить приложение 124 поисковой машины повышать ранжирование веб-ресурса 128 в SERP, которые будут генерироваться в будущих запросах, так что уровень трафика приближается к четвертому уровню трафика 520. Таким образом, можно сказать, что скорректированная оценка качества (то есть вторая точка 518) заставляет будущую необработанную оценку качества быть ближе к будущей эталонной оценке (соответствующей скорректированной оценке качества), связанной с будущим уровнем пользовательского трафика (т.е. четвертый уровень трафика 520).

[144] Действительно, при повышении ранжирования веб-ресурса 128 в SERP предполагается, что большее количество пользователей осуществит доступ к веб-ресурсу 128, следовательно, увеличится уровень пользовательского трафика.

[145] Для специалистов в данной области техники должно быть очевидно, что по меньшей мере некоторые варианты осуществления настоящей технологии направлены на расширение арсенала технических средств для решения конкретной технической проблемы, а именно на ранжирование веб-ресурса в SERP.

[146] Следует четко понимать, что не все технические эффекты, упомянутые в данном документе, обязательно будут достигаться в каждом и каждом варианте осуществления настоящей технологии. Например, варианты осуществления настоящей технологии могут быть реализованы без достижения некоторых из этих технических эффектов, в то время как другие варианты осуществления могут быть реализованы с достижением других технических эффектов или вообще без них.

[147] Модификации и улучшения вышеописанных реализаций настоящей технологии могут стать понятными для специалистов в данной области техники. Предшествующее описание предназначено для того, чтобы быть примерным, а не ограничивающим. Поэтому подразумевается, что объем настоящей технологии ограничен только объемом прилагаемой формулы изобретения.

[148] Хотя вышеописанные реализации были описаны и показаны со ссылкой на конкретные этапы, выполняемые в конкретном порядке, следует понимать, что эти этапы могут быть объединены, подразделены или переупорядочены без отклонения от идей настоящей технологии. Соответственно порядок и группировка упомянутых этапов ограничениями настоящей технологии не являются.

1. Компьютерно-реализуемый способ ранжирования веб-ресурса, причем способ исполняется сервером поисковой машины, причем способ содержит, в фазе использования:

прием сервером набора признаков, включающего в себя статистические признаки, связанные с веб-ресурсом;

генерирование сервером необработанной оценки качества на основе набора признаков, причем необработанная оценка качества указывает на воспринимаемое качество веб-ресурса одним или более пользователями;

сравнение необработанной оценки качества с эталонной оценкой, причем эталонная оценка связана со схожим уровнем пользовательского трафика, как у данного веб-ресурса, причем эталонная оценка определяется на основе необработанных оценок качества множества обучающих веб-ресурсов;

применение сервером формулы корректировки смещения к необработанной оценке качества в ответ на смещение между необработанной оценкой качества и эталонной оценкой для получения скорректированной оценки качества;

в ответ на прием запроса генерирование сервером страницы результатов поисковой машины (SERP), включающей в себя указание веб-ресурса в ранжированной позиции на основе скорректированной оценки качества, причем скорректированная оценка качества приводит к тому, что будущая необработанная оценка качества приближается к будущей эталонной оценке, связанной с будущим уровнем пользовательского трафика для данного веб-ресурса.

2. Способ по п.1, в котором генерирование необработанной оценки качества содержит:

выполнение сервером набора алгоритмов предсказания, причем каждый алгоритм предсказания сконфигурирован для генерирования значения предсказанного признака для данного признака из набора признаков на основе остальных признаков;

определение сервером весового значения для каждого алгоритма предсказания, причем весовое значение указывает, насколько хорошо данное значение признака коррелирует с остальными признаками из набора признаков;

вычисление сервером необработанных оценок качества на основе набора признаков и соответствующего весового значения.

3. Способ по п.2, в котором определение эталонной оценки содержит:

нанесение необработанных оценок качества множества обучающих веб-ресурсов на график, связанный с соответствующим уровнем трафика;

генерирование кривой тренда, подгоняющей набор необработанных оценок качества к графику, причем кривая тренда проходит через набор эталонных оценок, причем набор эталонных оценок включает в себя эталонные оценки на каждом уровне трафика.

4. Способ по п.3, в котором кривая тренда основана на формуле f(x)=a * np.log (b * x+c), где

а - параметр вертикального смещения;

b - параметр резкости кривой тренда; и

c - параметр горизонтального смещения.

5. Способ по п.1, в котором формула корректировки смещения имеет следующий вид:

raw_score - (1 - a) * (f(visitors) - raw_score) * b / std(raw_score) * (visitors*c) / (d * 10), где

raw_score соответствует необработанной оценке качества;

visitors соответствует коэффициенту ежемесячного возврата пользователей;

a, b, c и d - предварительно определенные значения.

6. Способ по п.1, в котором набор признаков содержит по меньшей мере одно из следующего:

качество веб-ресурса;

коэффициент ежемесячного возврата пользователей;

длительная привязанность пользователей к веб-ресурсу;

процент обращений с длительностью клика более 120 с;

количество пользователей в месяц;

процент уникальных прямых обращений с мобильных устройств;

процент уникальных прямых обращений с настольных компьютеров;

логарифм абсолютного количества прямых сеансов с настольных компьютеров;

среднее качество пользователей на хосте; и

доля исходящего трафика от хоста к рекламе.

7. Способ по п.6, дополнительно содержащий нормализацию каждого признака в наборе признаков между значением от 0 до 1.

8. Способ по п.1, в котором уровень пользовательского трафика измеряется одним из следующих параметров:

ежемесячные активные пользователи (MAU);

еженедельные активные пользователи (WAU); и

ежедневные активные пользователи (DAU).

9. Способ по п.1, в котором приближение будущей необработанной оценки качества к будущей эталонной оценке содержит следующее:

в ответ на то, что необработанная оценка качества выше эталонной оценки, скорректированная оценка качества приводит к тому, что ранжированная позиция оказывается ниже ранжированной позиции, связанной с необработанной оценкой качества; и

в ответ на то, что необработанная оценка качества ниже эталонной оценки, скорректированная оценка качества приводит к тому, что ранжированная позиция оказывается выше ранжированной позиции, связанной с необработанной оценкой качества.

10. Сервер для ранжирования веб-ресурса, причем сервер содержит процессор, сконфигурированный с возможностью, в фазе использования:

принимать набор признаков, включающий в себя статистические признаки, связанные с веб-ресурсом;

генерировать необработанную оценку качества на основе набора признаков, причем необработанная оценка качества указывает на воспринимаемое качество веб-ресурса одним или более пользователями;

сравнивать необработанную оценку качества с эталонной оценкой, причем эталонная оценка связана со схожим уровнем пользовательского трафика, как у данного веб-ресурса, причем эталонная оценка определяется на основе необработанных оценок качества множества обучающих веб-ресурсов;

применять формулу корректировки смещения к необработанной оценке качества в ответ на смещение между необработанной оценкой качества и эталонной оценкой для получения скорректированной оценки качества;

в ответ на прием запроса генерировать страницу результатов поисковой машины (SERP), включающую в себя указание веб-ресурса в ранжированной позиции на основе скорректированной оценки качества, причем скорректированная оценка качества приводит к тому, что будущая необработанная оценка качества приближается к будущей эталонной оценке, связанной с будущим уровнем пользовательского трафика для данного веб-ресурса.

11. Сервер по п.10, в котором для генерирования необработанной оценки качества процессор сконфигурирован с возможностью:

выполнять набор алгоритмов предсказания, причем каждый алгоритм предсказания сконфигурирован для генерирования значения предсказанного признака для данного признака из набора признаков на основе остальных признаков;

определять весовое значение для каждого алгоритма предсказания, причем весовое значение указывает, насколько хорошо данное значение признака коррелирует с остальными признаками из набора признаков;

вычислять необработанные оценки качества на основе набора признаков и соответствующего весового значения.

12. Сервер по п.11, в котором для определения эталонной оценки процессор сконфигурирован с возможностью:

наносить необработанные оценки качества множества обучающих веб-ресурсов на график, связанный с соответствующим уровнем трафика;

генерировать кривую тренда, подгоняющую набор необработанных оценок качества к графику, причем кривая тренда проходит через набор эталонных оценок, причем набор эталонных оценок включает в себя эталонные оценки на каждом уровне трафика.

13. Сервер по п.12, в котором кривая тренда основана на формуле f(x)=a * np.log (b * x+c), где

а - параметр вертикального смещения;

b - параметр резкости кривой тренда; и

c - параметр горизонтального смещения.

14. Сервер по п.10, в котором формула корректировки смещения имеет следующий вид:

raw_score - (1 - a) * (f(visitors) - raw_score) * b / std(raw_score) * (visitors*c) / (d * 10), где

raw_score соответствует необработанной оценке качества;

visitors соответствует коэффициенту ежемесячного возврата пользователей;

a, b, c и d - предварительно определенные значения.

15. Сервер по п.10, в котором набор признаков содержит по меньшей мере одно из следующего:

качество веб-ресурса;

коэффициент ежемесячного возврата пользователей;

длительная привязанность пользователей к веб-ресурсу;

процент обращений с длительностью клика более 120 с;

количество пользователей в месяц;

процент уникальных прямых обращений с мобильных устройств;

процент уникальных прямых обращений с настольных компьютеров;

логарифм абсолютного количества прямых сеансов с настольных компьютеров;

среднее качество пользователей на хосте; и

доля исходящего трафика от хоста к рекламе.

16. Сервер по п.15, в котором процессор дополнительно сконфигурирован с возможностью нормализации каждого признака в наборе признаков между значением от 0 до 1.

17. Сервер по п.10, в котором уровень пользовательского трафика измеряется одним из следующих параметров:

ежемесячные активные пользователи (MAU);

еженедельные активные пользователи (WAU); и

ежедневные активные пользователи (DAU).

18. Сервер по п.10, в котором для приближения будущей необработанной оценки качества к будущей эталонной оценке процессор сконфигурирован для следующего:

в ответ на то, что необработанная оценка качества выше эталонной оценки, скорректированная оценка качества приводит к тому, что ранжированная позиция оказывается ниже ранжированной позиции, связанной с необработанной оценкой качества; и

в ответ на то, что необработанная оценка качества ниже эталонной оценки, скорректированная оценка качества приводит к тому, что ранжированная позиция оказывается выше ранжированной позиции, связанной с необработанной оценкой качества.



 

Похожие патенты:

Изобретение относится к области алгоритмов машинного обучения. Техническим результатом является обеспечение формирования обучающих наборов для обучения алгоритмов машинного обучения, реализуемых в системе поиска информации.

Изобретение относится к области вычислительной техники. Техническим результатом является обеспечение реализации обучения алгоритма машинного обучения (MLA) формированию прогнозируемого совместного векторного представления для цифрового элемента, представляющего собой потенциальный рекомендуемый элемент в системе рекомендации контента, способной рекомендовать элементы пользователям системы рекомендации контента и размещенной на сервере.

Изобретение относится к области защиты информации. Техническим результатом является повышение достоверности обработки информации при ее защите от утечки по каналам ПЭМИН.

Изобретение относится к области геофизики и может быть использовано для оценивания запасов углеводородов в неоднородном пласте. Предложен способ оценивания флюидов в плотном углеводородном коллекторе внутри неоднородного геологического пласта или его участка, причем способ включает: а) получение физических параметров флюидов и пласта; b) построение по меньшей мере одной трехмерной (3D) модели плотного углеводородного коллектора с применением физических параметров, причем такая трехмерная модель содержит имитацию структуры пор и минералогического состава; c) вычисление количества углеводорода для каждой указанной трехмерной модели на этапе b); d) вычисление общего количества запасов углеводородов; и e) создание плана разработки, основанного на расчетных общих запасах углеводородов.

Изобретение относится к области вычислительной техники для аутентификации пользователя, защиты данных пользователя и сброса кода безопасности. Технический результат заключается в обеспечении защиты данных при передаче для обеспечения безопасной аутентификации пользователя и защиты данных пользователя как при передаче, так и в состоянии покоя.

Изобретение относится к средствам обновления программного обеспечения. Технический результат - обеспечение возможности непрерывного обновления программного обеспечения.

Изобретение относится к области вычислительной техники. Технический результат заключается в снижении вычислительной нагрузки с одновременным повышением производительности вычислительного устройства.

Изобретение относится к информационным системам, а именно к распределенным базам данных. Устройство для реализации распределенной базы данных содержит: память, содержащую экземпляр распределенной базы данных на первом вычислительном устройстве, выполненном с возможностью включения во множество вычислительных устройств, которое реализует распределенную базу данных посредством сети, функционально соединенной с множеством вычислительных устройств, а также процессор, функционально соединенный с экземпляром распределенной базы данных, при этом процессор выполнен с возможностью определения в первый момент времени первого события, при этом процессор выполнен с возможностью приема во второй момент времени после первого момента времени и со второго вычислительного устройства из множества вычислительных устройств.

Изобретение относится к области вычислительной техники. Технический результат заключается в реализации автоматического формирования отчетов о совершенных транзакциях.

Изобретение относится к информационным вычислительным системам. Технический результатом является повышение надёжности системы в условиях преднамеренных и (или) непреднамеренных вредоносных воздействий на систему, а также повышение скорости принятия решения о наличии инцидентов информационной безопасности.

Изобретение относится к вычислительной технике. Технический результат заключается в повышении точности кластеризации фишинговых веб-ресурсов. Предложен способ кластеризации фишинговых веб-ресурсов на основе изображения визуального контента, выполняемый на компьютерном устройстве, содержащем по меньшей мере процессор и память, и содержащий этапы, на которых: получают указания на множество фишинговых веб-ресурсов; извлекают изображение визуального контента каждого из множества веб-ресурсов; обрабатывают содержимое каждого изображения визуального контента, связанного с одним из множества веб-ресурсов, при этом выделяют контуры элементов на каждом изображении визуального контента фишингового веб-ресурса; осуществляют фильтрацию выявленных контуров на каждом изображении визуального контента путем удаления одинаковых контуров; на основе попарного сравнения выявленных контуров и контуров кластеров производят объединение веб-ресурса, связанного со сравниваемыми контурами с кластером; сохраняют указания на веб-ресурсы, ассоциированные с соответствующими контурами содержимого из множества указанных кластеров, в базе данных. 2 н. и 17 з.п. ф-лы, 7 ил.
Наверх