Способ и система для рекомендации свежих саджестов поисковых запросов в поисковой системе

Изобретение относится к средствам для создания свежих саджестов запроса. Технический результат заключается в повышении точности и релевантности поиска. Получают указания по меньшей мере на часть данного поискового запроса. Выбирают, на основе указания, набор саджестов запроса, каждый из которых связан с частотой использования на первой шкале. Получают набор свежих саджестов запроса, каждый из которых связан с частотой использования на второй шкале. Масштабируют каждую частоту использования на второй шкале для получения частоты использования на первой шкале. Объединяют набор саджестов запроса и набор свежих саджестов запроса для создания объединенного набора саджестов. Создают подмножество ранжированных саджестов запроса для отображения на устройстве на основе объединенного набора саджестов, причем данный саджест запроса из подмножества является одним из: свежим саджестом запроса или саджестом запроса. 2 н. и 36 з.п. ф-лы, 10 ил.

 

ОБЛАСТЬ ТЕХНИКИ

[001] Настоящая технология относится к области поисковых систем в целом и конкретно к способу и системе для рекомендаций свежих саджестов поисковых запросов в поисковой системе.

УРОВЕНЬ ТЕХНИКИ

[002] Различные глобальные или локальные сети связи (интернет, всемирная паутина, локальные сети и подобные им) предлагают пользователю большой объем информации. Информация включает в себя контекстуальные разделы, такие как, среди прочего, новости и текущие события, карты, информацию о компаниях, финансовую информацию и ресурсы, информацию о трафике, игры и информацию развлекательного характера. Пользователи используют множество клиентских устройств (настольный компьютер, портативный компьютер, ноутбук, смартфон, планшеты и подобные им) для получения доступа к богатому информационному контенту (например, изображениям, аудио- и видеофайлам, анимированным изображениям и прочему мультимедийному контенту подобных сетей).

[003] В общем случае, пользователь может получить доступ к ресурсу сети передачи данных двумя основными способами. Данный пользователь может получить доступ к конкретному ресурсу напрямую, введя адрес ресурса (обычно URL или Единый указатель ресурса, например www.webpage.com), или же выбрав ссылку в электронном сообщении или на другом веб-ресурсе. В противном случае пользователь может выполнить поиск желаемого ресурса с помощью поисковой системы. Последнее особенно подходит для тех случаев, когда пользователю известна интересующая его тематика, но неизвестен конкретный адрес интересующего ресурса.

[004] Когда пользователь выполняет сетевой поиск с помощью поисковой системы, для пользователя важны два аспекта. Он(а) хочет найти наиболее релевантные результаты, и он(а) хочет найти их достаточно быстро. Чтобы по меньшей мере частично решить эти задачи, известно предоставление пользователю, использующему поисковую систему, поисковых предложений по завершению запроса, также известных как "саджесты". Например, в ответ на то, что пользователь вводит поисковый запрос "Молли" в поисковую систему Google™, пользователь получает список саджестов в выпадающем меню, а именно "Молли Рингуолд", "Молли Мэйд" и так далее. Основная задача этих саджестов - предоставлять более удобный для пользователя поиск и помогать пользователю изучать объект интереса. Например, пользователь может не знать, какой именно запрос предоставит ему или ей информацию, которую он(а) искал(а); поисковые саджесты могут помочь пользователю найти желаемую или связанную с желаемой информацию. Пользователь затем может просмотреть результаты поиска и выбрать ссылку, с которой он(а) желает ознакомиться.

[005] Таким образом, чтобы помочь пользователю проводить поиск, поисковые системы могут предлагать пользователю дополнительные запросы. Существует множество технологий, которые могут быть использованы поисковыми системами для идентификации дополнительных запросов, и каждая из этих технологий обычно приводит к созданию большого набора запросов, которые система может потенциально предложить. Тем не менее, поисковые системы могут не предлагать запросы о темах или событиях, которые стали популярными недавно и которые могут быть интересны пользователям поисковой системы.

[006] Америсканская патентная заявка No. 2015/0317317 А1, опубликованная 5 ноября, 2015 компанией Yahoo! Inc. и озаглавленная "Method and system for providing query suggestions including entities" ("Способ и система для предоставления саджестов запроса, включающих в себя объекты") описывает способы, системы и программы, предоставляющие саджесты запроса, включающие в себя объекты. В одном примере, сначала получают префикс поискового запроса. Далее множество саджестов запроса идентифицируется на основе префикса запроса. Множество саджестов запроса включает в себя по меньшей мере один объект. Оценки каждого из множества саджестов запроса вычисляются с помощью первой модели. Первая модель включает в себя уточняемый параметр для вычисления оценки по меньшей мере одного объекта. Множество саджестов запроса ранжируется на основе, по меньшей мере частично, оценок.

[007] Американская патентная заявка No. 2015/0154197 А1, опубликованная 4 июня, 2015 компанией Qbase LLC и озаглавленная "Method for obtaining search suggestions from fuzzy score matching and population frequencies" ("Способ получения поисковых саджестов из нечетких соответствий оценок и частоты заполнения") описывает способ получения и предоставления поисковых саджестов с помощью совместного вхождения объектов. Способ может применяться в любой поисковой системе, которая может включать в себя по меньшей мере одну поисковую систему, одну или несколько баз данных, содержащих данные о совместном вхождении объектов и совместном вхождении трендов. Способ может извлекать и устранять неоднозначность объектов из поисковых запросов путем использования данных о совместном вхождении объектов и трендов в одной или нескольких базах данных. Последовательно, список поисковых саджестов может предоставляться каждой базой данных, далее путем сравнения оценки каждого поискового саджеста может создаваться новый список саджестов на основе индивидуальной и/или общей оценки каждого поискового саджеста. На основе пользовательского выбора саджестов, база совместных вхождений трендов может обновляться, предоставляя средства обучения на ходу, что улучшает поисковую релевантность и точность.

РАСКРЫТИЕ ТЕХНОЛОГИИ

[008] Разработчики настоящего технического решения рассматривали по меньшей мере одну проблему, соответствующую известному уровню техники.

[009] Конкретнее, разработчик(и) настоящей технологии предположили, что некоторые присущие известному уровню техники подходы рекомендуют саджесты, основанные на статистических данных запросов, введенных пользователям, но могут не рекомендовать - в режиме реального времени или почти реального времени - свежие запросы, которые стали популярными в недавний период времени, и которые могут искать пользователи поисковой системы. Это может быть связано с тем, как, например, алгоритмы саджестов запросов ранжируют саджесты. Обычно эти алгоритмы используют предыдущие данные о кликабельности, и подобные данные могут отсутствовать или быть только частично доступны для свежих саджестов. Таким образом, обычные системы для создания саджестов запроса могут ранжировать подобные свежие саджесты как нерелевантные или не достаточно релевантные и могут не использовать их в саджестах, представляемых пользователю.

[0010] В качестве неограничивающего примера, человек по имени John Doe ("Джон Доу") мог выиграть миллиард долларов в лотерею, что может быть упомянуто в заголовках новостей, поскольку это самый большой выигрыш в лотерею за всю историю. Пользователи могут желать получить информацию о Джоне Доу, но со ссылкой на Фиг. 1, пользователь, который вводит часть запроса "John Doe" в омнибокс 35 поисковой системы 235 в веб-браузере 30 на клиентском устройстве может получать различные саджесты, например, "John Doe mayor of New York City" ("Джон Доу, мэр Нью-Йорка"), "John Douglas" ("Джон Доуглас"), "John does maths on monday wednesday thursday and friday" ("Джон должен заниматься математикой по понедельникам, средам четвергам и пятницам"), но может не получить саджесты, связанные с победителем лотереи и аналогичными поисковыми терминами, несмотря на их популярность, поскольку такие запросы как "Джон Доу, мэр Нью-Йорка", "Джон Доуглас", "Джон должен заниматься математикой по понедельникам, средам четвергам и пятницам" были ранжированы поисковой системой 235 как исторически более популярные поисковые термины за более длительный период времени на основе таких факторов, как число вводов, число выборов, и большее число пользовательских взаимодействий с поисковыми результатами, предоставляемыми в ответ на эти запросы, по сравнению с более недавним запросом "John Doe lottery winner" ("Джон Доу победитель лотереи") или его аналогами или по меньшей мере частичными аналогами.

[0011] Следовательно, разработчики настоящей технологии сосредоточены на решении подобных проблем.

[0012] Таким образом, варианты осуществления настоящей технологии направлены на способ и систему для рекомендаций свежих саджестов поискового запроса для поисковой системы.

[0013] Первым объектом настоящей технологии является исполняемый на компьютере способ рекомендаций новых саджестов поискового запроса в режиме реального время с помощью поисковой системы, которая выполняется сервером, соединенным с базой данных поискового журнала, причем способ выполняется сервером и включает в себя: получение сервером указания по меньшей мере на часть данного поискового запроса от пользователя электронного устройства, соединенного с сервером, причем указание по меньшей мере на часть данного поискового запроса обладает по меньшей мере частью по меньшей мере одного поискового термина; выбор сервером из базы данных поискового журнала, на основе указания, набора саджестов запроса в виде рекомендаций по завершению поискового запроса, которые связаны по меньшей мере с одним поисковым термином, причем каждый соответствующий саджест запроса из набора саджестов запроса связан с соответствующей частотой предыдущего использования, причем соответствующая частота находится на первой шкале; получение сервером из базы данных поискового журнала набора свежих кандидатов-саджестов поискового запроса, причем каждый соответствующий свежий кандидат-саджест поискового запроса представляет собой соответствующий недавний поисковый запрос, введенный соответствующим множеством пользователей в поисковую систему, причем соответствующий свежий кандидат-саджест поискового запроса связан с соответствующей частотой предыдущего использования, которая находится на второй шкале; масштабирование сервером каждой соответствующей частоты запроса на второй шкале для получения соответствующей связанной частоты запроса на первой шкале; выбор сервером набора свежих саджестов запросов из свежих кандидатов-саджестов поискового запроса в качестве рекомендаций по завершению поискового запроса на основе указания по меньшей мере на часть данного поискового запроса; объединение сервером набора саджестов запроса и набора свежих саджестов запроса для создания объединенного набора саджестов запроса; и создание сервером по меньшей мере подмножества ранжированных саджестов запроса на основе объединенного набора саджестов запроса, причем данный саджест запроса из подмножества ранжированных саджестов запроса является одним из: свежим саджестом запроса или саджестом запроса, и подмножество ранжированных саджестов запроса предназначено для отображения на электронном устройстве.

[0014] В некоторых вариантах осуществления технологии, по меньшей мере подмножество ранжированных саджестов запроса было создано из набора ранжированных саджестов запроса, и, до этапа создания, способ далее включает в себя: ранжирование сервером объединенного набора саджестов запроса на основе соответствующей связанной частоты на первой шкале для получения набора ранжированных саджестов запроса.

[0015] В некоторых вариантах осуществления технологии, база данных поискового журнала обладает множеством соответствующих недавних поисковых запросов; и, до этапа получения, способ далее включает в себя: выбор сервером каждого соответствующего свежего саджеста-кандидата запроса из набора свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов на основе соответствующей связанной частоты на второй шкале, которая находится выше заранее определенного порога частоты.

[0016] В некоторых вариантах осуществления технологии, выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее включает в себя: вычисление сервером для каждого из соответствующих свежих саджестов-кандидатов запроса, обладающего связанной соответствующей частотой на второй шкале выше заранее определенного порога частоты, соответствующего параметра пользовательского взаимодействия, который указывает на предыдущие пользовательские взаимодействия по меньшей мере с одним недавним поисковым результатом, полученным в ответ на соответствующий недавний поисковый запрос; и выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее основан на соответствующем параметре пользовательского взаимодействия, находящегося выше заранее определенного порога пользовательского взаимодействия.

[0017] В некоторых вариантах осуществления технологии, выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее включает в себя: вычисление сервером для каждого из соответствующих свежих саджестов-кандидатов запроса, обладающего связанной соответствующей частотой на второй шкале выше заранее определенного порога частоты, соответствующего параметра пользовательского намерения, который указывает на вероятность того, что соответствующий недавний поисковый запрос является частью заранее определенной области поиска; и выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее основан на соответствующем параметре пользовательского намерения, находящегося выше заранее определенного порога параметра пользовательского намерения.

[0018] В некоторых вариантах осуществления технологии, масштабирование каждой соответствующей частоты запроса на второй шкале для получения соответствующей связанной частоты запроса на первой шкале основано на: средней частоте поисковых запросов, введенных пользователями в поисковую систему на текущий день; средней частоте поисковых запросов, введенных пользователями в поисковую систему за данный период; и количестве дней в текущем месяце.

[0019] В некоторых вариантах осуществления технологии, выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее основан на доменном имени, связанном с каждым из множества недавних запросов в базе данных поискового журнала.

[0020] В некоторых вариантах осуществления технологии, выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее основан на поисковых терминах соответствующего недавнего поискового запроса, не являющегося частью неуместного списка поисковых терминов.

[0021] В некоторых вариантах осуществления технологии, соответствующий параметр пользовательских взаимодействий представляет собой кликабельность (CTR).

[0022] В некоторых вариантах осуществления технологии, CTR вычисляется только на основе свежих результатов.

[0023] В некоторых вариантах осуществления технологии, данный свежий саджест-кандидат выбирается только в ответ на то, что показатель CTR, который основан на свежих результатах, находится выше заранее определенного порога.

[0024] В некоторых вариантах осуществления технологии, заранее определенная область поиска является доменом вертикального поиска.

[0025] В некоторых вариантах осуществления технологии, способ дополнительно включает в себя, до этапа масштабирования: получение сервером из базы данных поискового журнала указания на свежий документ, причем получение основано на: ресурсе, связанном с указанием на свежий документ, и временной отметке, связанной с указанием на свежий документ; парсинг (анализ) сервером указания на свежий документ для получения заголовка свежего документа; получение сервером набора поисковых результатов, связанного с заголовком свежего документа; получение сервером из базы данных поискового журнала, для каждого соответствующего поискового результата из набора поисковых результатов, связанных с заголовком свежего документа, по меньшей мере одного соответствующего поискового запроса, который был использован по меньшей мере одним пользователем для получения доступа к соответствующему поисковому результату, причем по меньшей мере один соответствующий поисковый запрос связан с соответствующим поисковым результатом; определение сервером для каждого из по меньшей мере одного соответствующего поискового запроса, связанного с каждым из соответствующих поисковых результатов, соответствующей оценки релевантности, которая основана на указании на свежий документ; и добавление сервером по меньшей мере одного соответствующего поискового запроса к набору свежих саджестов-кандидатов поискового запроса на основе оценки релевантности.

[0026] В некоторых вариантах осуществления технологии, получение далее основано на: ресурсе, связанном с указанием на свежий документ, который является заранее определенным ресурсом из списка заранее определенных ресурсов.

[0027] В некоторых вариантах осуществления технологии, получение далее основано на: временной отметке, связанной с указанием на свежий документ, который находится в заранее определенном временном интервале.

[0028] В некоторых вариантах осуществления технологии, добавление по меньшей мере одного соответствующего поискового запроса к набору свежих саджестов-кандидатов поискового запроса далее основано на: соответствующей оценке релевантности, которая находится выше заранее определенного порога оценки.

[0029] В некоторых вариантах осуществления технологии, по меньшей мере один соответствующий поисковый запрос включает в себя по меньшей мере один соответствующий поисковый термин; и определение соответствующей оценки релевантности далее основано по меньшей мере на одном соответствующем поисковом термине.

[0030] В некоторых вариантах осуществления технологии, набор поисковых результатов, который связан с заголовком свежего документа, обладает заранее определенным числом поисковых результатов.

[0031] В некоторых вариантах осуществления технологии, соответствующая оценка релевантности вычисляется алгоритмом ранжирования поисковой системы.

[0032] Вторым объектом настоящей технологии является система для рекомендации свежих саджестов-кандидатов поискового запроса в реальном времени, которая исполняет поисковую систему, причем система соединена с базой данных поискового журнала и включает в себя: процессор; постоянный машиночитаемый носитель компьютерной информации, содержащий инструкции, процессор; при выполнении инструкций, выполнен с возможностью осуществлять: получение указания по меньшей мере на часть данного поискового запроса от пользователя электронного устройства, соединенного с системой, причем указание по меньшей мере на часть данного поискового запроса обладает по меньшей мере частью по меньшей мере одного поискового термина; выбор из базы данных поискового журнала, на основе указания, набора саджестов запроса в виде рекомендаций по завершению поискового запроса, которые связаны по меньшей мере с одним поисковым термином, причем каждый соответствующий саджест запроса из набора саджестов запроса связан с соответствующей частотой предыдущего использования, причем соответствующая частота находится на первой шкале; получение из базы данных поискового журнала набора свежих кандидатов-саджестов поискового запроса, причем каждый соответствующий свежий кандидат-саджест поискового запроса представляет собой соответствующий недавний поисковый запрос, введенный соответствующим множеством пользователей в поисковую систему, причем соответствующий свежий кандидат-саджест поискового запроса связан с соответствующей частотой предыдущего использования, которая находится на второй шкале; масштабирование каждой соответствующей частоты запроса на второй шкале для получения соответствующей связанной частоты запроса на первой шкале; выбор набора свежих саджестов запросов из свежих кандидатов-саджестов поискового запроса в качестве рекомендаций по завершению поискового запроса на основе указания по меньшей мере на часть данного поискового запроса; объединение набора саджестов запроса и набора свежих саджестов запроса для создания объединенного набора саджестов запроса; и создание по меньшей мере подмножества ранжированных саджестов запроса на основе объединенного набора саджестов запроса, причем данный саджест запроса из подмножества ранжированных саджестов запроса является одним из: свежим саджестом запроса или саджестом запроса и подмножество ранжированных саджестов запроса предназначено для отображения на электронном устройстве.

[0033] В некоторых вариантах осуществления технологии, по меньшей мере подмножество ранжированных саджестов запроса было создано из набора ранжированных саджестов запроса, и, до этапа создания, процессор выполнен с возможностью осуществлять: ранжирование объединенного набора саджестов запроса на основе соответствующей связанной частоты на первой шкале для получения набора ранжированных саджестов запроса.

[0034] В некоторых вариантах осуществления технологии, база данных поискового журнала обладает множеством соответствующих недавних поисковых запросов; и, до этапа получения, процессор выполнен с возможностью осуществлять: выбор каждого соответствующего свежего саджеста-кандидата запроса из набора свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов на основе соответствующей связанной частоты на второй шкале, которая находится выше заранее определенного порога частоты.

[0035] В некоторых вариантах осуществления технологии, выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее включает в себя: вычисление для каждого из соответствующих свежих саджестов-кандидатов запроса, обладающего связанной соответствующей частотой на второй шкале выше заранее определенного порога частоты, соответствующего параметра пользовательского взаимодействия, который указывает на предыдущие пользовательские взаимодействия по меньшей мере с одним недавним поисковым результатом, полученным в ответ на соответствующий недавний поисковый запрос; и выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее основан на соответствующем параметре пользовательского взаимодействия, находящегося выше заранее определенного порога пользовательского взаимодействия.

[0036] В некоторых вариантах осуществления технологии, выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее включает в себя: вычисление для каждого из соответствующих свежих саджестов-кандидатов запроса, обладающего связанной соответствующей частотой на второй шкале выше заранее определенного порога частоты, соответствующего параметра пользовательского намерения, который указывает на вероятность того, что соответствующий недавний поисковый запрос является частью заранее определенной области поиска; и выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее основан на соответствующем параметре пользовательского намерения, находящегося выше заранее определенного порога параметра пользовательского намерения.

[0037] В некоторых вариантах осуществления технологии, масштабирование каждой соответствующей частоты запроса на второй шкале для получения соответствующей связанной частоты запроса на первой шкале основано на: средней частоте поисковых запросов, введенных пользователями в поисковую систему на текущий день; средней частоте поисковых запросов, введенных пользователями в поисковую систему за данный период; и количестве дней в текущем месяце.

[0038] В некоторых вариантах осуществления технологии, выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее основан на доменном имени, связанном с каждым из множества недавних запросов в базе данных поискового журнала.

[0039] В некоторых вариантах осуществления технологии, выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее основан на поисковых терминах соответствующего недавнего поискового запроса, не являющегося частью неуместного списка поисковых терминов.

[0040] В некоторых вариантах осуществления технологии, соответствующий параметр пользовательских взаимодействий представляет собой кликабельность (CTR).

[0041] В некоторых вариантах осуществления технологии, CTR вычисляется только на основе свежих результатов.

[0042] В некоторых вариантах осуществления технологии, данный свежий саджест-кандидат выбирается только в ответ на то, что показатель CTR, который основан на свежих результатах, находится выше заранее определенного порога.

[0043] В некоторых вариантах осуществления технологии, заранее определенная область поиска является доменом вертикального поиска.

[0044] В некоторых вариантах осуществления технологии, процессор выполнен с возможностью осуществлять, до этапа масштабирования: получение из базы данных поискового журнала указания на свежий документ, причем получение основано на: ресурсе, связанном с указанием на свежий документ, и временной отметке, связанной с указанием на свежий документ; парсинг (анализ) указания на свежий документ для получения заголовка свежего документа; извлечение набора поисковых результатов, связанного с заголовком свежего документа; получение из базы данных поискового журнала, для каждого соответствующего поискового результата из набора поисковых результатов, связанных с заголовком свежего документа, по меньшей мере одного соответствующего поискового запроса, который был использован по меньшей мере одним пользователем для получения доступа к соответствующему поисковому результату, причем по меньшей мере один соответствующий поисковый запрос связан с соответствующим поисковым результатом; определение для каждого из по меньшей мере одного соответствующего поискового запроса, связанного с каждым из соответствующих поисковых результатов, соответствующей оценки релевантности, которая основана на указании на свежий документ; и добавление по меньшей мере одного соответствующего поискового запроса к набору свежих саджестов-кандидатов поискового запроса на основе оценки релевантности.

[0045] В некоторых вариантах осуществления технологии, получение далее основано на: ресурсе, связанном с указанием на свежий документ, который является заранее определенным ресурсом из списка заранее определенных ресурсов.

[0046] В некоторых вариантах осуществления технологии, получение далее основано на: временной отметке, связанной с указанием на свежий документ, который находится в заранее определенном временном интервале.

[0047] В некоторых вариантах осуществления технологии, добавление по меньшей мере одного соответствующего поискового запроса к набору свежих саджестов-кандидатов поискового запроса далее основано на: соответствующей оценке релевантности, которая находится выше заранее определенного порога оценки.

[0048] В некоторых вариантах осуществления технологии, по меньшей мере один соответствующий поисковый запрос включает в себя по меньшей мере один соответствующий поисковый термин; и определение соответствующей оценки релевантности далее основано по меньшей мере на одном соответствующем поисковом термине.

[0049] В некоторых вариантах осуществления технологии, набор поисковых результатов, который связан с заголовком свежего документа, обладает заранее определенным числом поисковых результатов.

[0050] В некоторых вариантах осуществления технологии, соответствующая оценка релевантности вычисляется алгоритмом ранжирования поисковой системы.

[0051] В контексте настоящего описания "сервер" подразумевает под собой компьютерную программу, работающую на соответствующем оборудовании, которая способна получать запросы (например, от клиентских устройств) по сети и выполнять эти запросы или инициировать выполнение этих запросов. Оборудование может представлять собой один физический компьютер или одну физическую компьютерную систему, но ни то, ни другое не является обязательным для данной технологии. В контексте настоящей технологии, использование выражения «сервер» не означает, что каждая задача (например, полученные команды или запросы) или какая-либо конкретная задача будет получена, выполнена или инициирована к выполнению одним и тем же сервером (то есть одним и тем же программным обеспечением и/или аппаратным обеспечением); это означает, что любое количество элементов программного обеспечения или аппаратных устройств может быть вовлечено в прием/передачу, выполнение или инициирование выполнения любого запроса или последствия любого запроса, связанного с клиентским устройством, и все это программное и аппаратное обеспечение может быть одним сервером или несколькими серверами, оба варианта включены в выражение «по меньшей мере один сервер».

[0052] В контексте настоящего описания «клиентское устройство» подразумевает под собой аппаратное устройство, способное работать с программным обеспечением, подходящим к решению соответствующей задачи. Таким образом, примерами электронных устройств (среди прочего) могут служить персональные компьютеры (настольные компьютеры, ноутбуки, нетбуки и т.п.) смартфоны, планшеты, а также сетевое оборудование, такое как маршрутизаторы, коммутаторы и шлюзы. Следует иметь в виду, что устройство, ведущее себя как электронное устройство в настоящем контексте, может вести себя как сервер по отношению к другим электронным устройствам. Использование выражения «электронное устройство» не исключает возможности использования множества электронных устройств для получения/отправки, выполнения или инициирования выполнения любой задачи или запроса, или же последствий любой задачи или запроса, или же этапов любого вышеописанного метода.

[0053] В контексте настоящего описания «база данных» подразумевает под собой любой структурированный набор данных, не зависящий от конкретной структуры, программного обеспечения по управлению базой данных, аппаратного обеспечения компьютера, на котором данные хранятся, используются или иным образом оказываются доступны для использования. В контексте настоящего описания слова «первый», «второй», «третий» и и т.д. используются в виде прилагательных исключительно для того, чтобы отличать существительные, к которым они относятся, друг от друга, а не для целей описания какой-либо конкретной взаимосвязи между этими существительными.

[0054] В контексте настоящего описания «информация» включает в себя информацию любую информацию, которая может храниться в базе данных. Таким образом, информация включает в себя, среди прочего, аудиовизуальные произведения (изображения, видео, звукозаписи, презентации и т.д.), данные (данные о местоположении, цифровые данные и т.д.), текст (мнения, комментарии, вопросы, сообщения и т.д.), документы, таблицы и т.д.

[0055] В контексте настоящего описания «используемый компьютером носитель компьютерной информации» подразумевает под собой носитель абсолютно любого типа и характера, включая ОЗУ, ПЗУ, диски (компакт диски, DVD-диски, дискеты, жесткие диски и т.д.), USB флеш-накопители, твердотельные накопители, накопители на магнитной ленте и т.д.

[0056] В контексте настоящего описания, если четко не указано иное, «указание» информационного элемента может представлять собой сам информационный элемент или указатель, отсылку, ссылку или другой косвенный способ, позволяющий получателю указания найти сеть, память, базу данных или другой машиночитаемый носитель, из которого может быть извлечен информационный элемент. Например, указание на документ может включать в себя сам документ (т.е. его содержимое), или же оно может являться уникальным дескриптором документа, идентифицирующим файл по отношению к конкретной файловой системе, или каким-то другими средствами передавать получателю указание на сетевую папку, адрес памяти, таблицу в базе данных или другое место, в котором можно получить доступ к файлу. Как будет понятно специалистам в данной области техники, степень точности, необходимая для такого указания, зависит от степени первичного понимания того, как должна быть интерпретирована информация, которой обмениваются получатель и отправитель указателя. Например, если до установления связи между отправителем и получателем понятно, что признак информационного элемента принимает вид ключа базы данных для записи в конкретной таблице заранее установленной базы данных, содержащей информационный элемент, то передача ключа базы данных - это все, что необходимо для эффективной передачи информационного элемента получателю, несмотря на то, что сам по себе информационный элемент не передавался между отправителем и получателем указания.

[0057] В контексте настоящего описания слова "первый", "второй", "третий" и и т.д. используются в виде прилагательных исключительно для того, чтобы отличать существительные, к которым они относятся, друг от друга, а не для целей описания какой-либо конкретной взаимосвязи между этими существительными. Так, например, следует иметь в виду, что использование терминов "первый сервер" и "третий сервер" не подразумевает какого-либо порядка, отнесения к определенному типу, хронологии, иерархии или ранжирования (например) серверов/между серверами, равно как и их использование (само по себе) не предполагает, что некий "второй сервер" обязательно должен существовать в той или иной ситуации. В дальнейшем, как указано здесь в других контекстах, упоминание «первого» элемента и «второго» элемента не исключает возможности того, что это один и тот же фактический реальный элемент. Так, например, в некоторых случаях, "первый" сервер и "второй" сервер могут являться одним и тем же программным и/или аппаратным обеспечением, а в других случаях они могут являться разным программным и/или аппаратным обеспечением.

[0058] В контексте настоящей технологии, поисковый запрос Qi может включать в себя один или более поисковых терминов t1, t2, …, tn, где каждый поисковый термин является индивидуальным словом. Таким образом "часть поискового запроса" может относиться к части по меньшей мере одного из поисковых терминов t1, t2, …, tn, содержащихся в поисковом запросе Qi(t1, t2, …, tn). В неограничивающем примере, запрос "Брэд Питт фильмы" включает в себя поисковые термины "Брэд", "Питт", и "фильмы", и часть запроса "Брэд Питт фильмы" может относиться к "Брэ", "Брэд Пи", "Брэд Питт фи" и т.д.

[0059] В контексте настоящей технологии, "недавний" запрос или документ может относиться к запросу или документу, который был введен в сервер поисковой системы за заранее определенный период времени, который может представлять собой, в качестве неограничивающего примера: последний час, последние четыре часа, предыдущий день, предыдущую неделю или предыдущий месяц.

[0060] В контексте настоящей технологии, "свежий" запрос или документ может относиться к недавнему запросу или недавнему документу, которые удовлетворяют конкретным условиям, которые будут описаны подробно далее.

[0061] В контексте настоящего описания выражение «множество результатов поиска» подразумевает под собой набор из более чем одного результата поиска, причем результаты общего (например, сетевого) поиска и/или результаты вертикального поиска собраны вместе в наборе результатов поиска или на странице результатов поиска. Например, результаты вертикального поиска могут быть интегрированы с результатами общего (например, сетевого) поиска на странице результатов поиска, или наоборот, т.е. результаты общего поиска могут быть интегрированы с результатами вертикального поиска на странице результатов поиска. Таким образом, в некоторых вариантах осуществления настоящей технологии результаты общего поиска и результаты вертикального поиска могут быть агрегированы и ранжированы относительно друг друга. В альтернативных вариантах осуществления технологии множество результатов поиска может включать в себя только результаты общего поиска или результаты только вертикального поиска, например, результаты поиска из конкретного интересующего вертикального домена.

[0062] Каждый вариант осуществления настоящей технологии преследует по меньшей мере одну из вышеупомянутых целей и/или объектов, но наличие всех не является обязательным. Следует иметь в виду, что некоторые объекты данной технологии, полученные в результате попыток достичь вышеупомянутой цели, могут не удовлетворять этой цели и/или могут удовлетворять другим целям, отдельно не указанным здесь.

[0063] Дополнительные и/или альтернативные характеристики, аспекты и преимущества вариантов осуществления настоящей технологии станут очевидными из последующего описания, прилагаемых чертежей и прилагаемой формулы изобретения.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

[0064] Для лучшего понимания настоящей технологии, а также других ее аспектов и характерных черт сделана ссылка на следующее описание, которое должно использоваться в сочетании с прилагаемыми чертежами, где:

[0065] На Фиг. 1 описан интерфейс поисковой системы, предоставляющий саджесты поисковых запросов в соответствии с вариантами осуществления известных систем.

[0066] На Фиг. 2 представлена принципиальная схема системы, выполненной в соответствии с неограничивающими вариантами осуществления настоящего технического решения.

[0067] На Фиг. 3 представлена принципиальная схема системы саджестов поисковых запросов, выполненной в соответствии с неограничивающими вариантами осуществления настоящей технологии;

[0068] На Фиг. 4 представлена принципиальная схема первого агрегатора кандидатов свежего запроса системы саджестов запроса, показанной на Фиг. 3, выполненной в соответствии с неограничивающими вариантами осуществления настоящей технологии.

[0069] На Фиг. 5 представлена принципиальная схема второго агрегатора кандидатов свежего запроса системы саджестов поисковой системы, показанной на Фиг. 3, выполненной в соответствии с неограничивающими вариантами осуществления настоящей технологии.

[0070] На Фиг. 6 и 7 представлена блок-схема первого способа рекомендации свежих саджестов-кандидатов поискового запроса, который выполняется в системе, показанной на Фиг. 1, в соответствии с вариантами осуществления настоящей технологии.

[0071] На Фиг. 8 и 9 представлена блок-схема второго способа рекомендации свежих саджестов-кандидатов поискового запроса, который выполняется в системе, показанной на Фиг. 1, в соответствии с вариантами осуществления настоящей технологии.

[0072] На Фиг. 10 представлен интерфейс поисковой системы, предоставляемой саджесты поискового запроса, включающие в себя свежие саджесты запроса.

ОСУЩЕСТВЛЕНИЕ

[0073] Все примеры и используемые здесь условные конструкции предназначены, главным образом, для того, чтобы помочь читателю понять принципы настоящей технологии, а не для установления границ ее объема. Следует также отметить, что специалисты в данной области техники могут разработать различные схемы, отдельно не описанные и не показанные здесь, но которые, тем не менее, воплощают собой принципы настоящей технологии и находятся в границах ее объема.

[0074] Кроме того, для ясности в понимании, следующее описание касается достаточно упрощенных вариантов осуществления настоящей технологии. Как будет понятно специалисту в данной области техники, многие варианты осуществления настоящей технологии будут обладать гораздо большей сложностью.

[0075] Некоторые полезные примеры модификаций настоящей технологии также могут быть охвачены нижеследующим описанием. Целью этого является также исключительно помощь в понимании, а не определение объема и границ настоящей технологии. Эти модификации не представляют собой исчерпывающего списка, и специалисты в данной области техники могут создавать другие модификации, остающиеся в границах объема настоящей технологии. Кроме того, те случаи, где не были представлены примеры модификаций, не должны интерпретироваться как то, что никакие модификации невозможны, и/или что то, что было описано, является единственным вариантом осуществления этого элемента настоящей технологии.

[0076] Более того, все заявленные здесь принципы, аспекты и варианты осуществления настоящей технологии, равно как и конкретные их примеры, предназначены для обозначения их структурных и функциональных основ, вне зависимости от того, известны ли они на данный момент или будут разработаны в будущем. Таким образом, например, специалистами в данной области техники будет очевидно, что представленные здесь блок-схемы представляют собой концептуальные иллюстративные схемы, отражающие принципы настоящей технологии. Аналогично, любые блок-схемы, диаграммы, псевдокоды и т.п. представляют собой различные процессы, которые могут быть представлены на машиночитаемом носителе и, таким образом, использоваться компьютером или процессором, вне зависимости от того, показан явно подобный компьютер или процессор, или нет.

[0077] Функции различных элементов, показанных на фигурах, включая функциональный блок, обозначенный как «процессор» или «графический процессор», могут быть обеспечены с помощью специализированного аппаратного обеспечения или же аппаратного обеспечения, способного использовать подходящее программное обеспечение. Когда речь идет о процессоре, функции могут обеспечиваться одним специализированным процессором, одним общим процессором или множеством индивидуальных процессоров, причем некоторые из них могут являться общими. В некоторых вариантах осуществления настоящей технологии, процессор может являться универсальным процессором, например, центральным процессором (CPU) или специализированным для конкретной цели процессором, например, графическим процессором (GPU). Более того, использование термина «процессор» или «контроллер» не должно подразумевать исключительно аппаратное обеспечение, способное поддерживать работу программного обеспечения, и может включать в себя, без установления ограничений, цифровой сигнальный процессор (DSP), сетевой процессор, интегральную схему специального назначения (ASIC), программируемую пользователем вентильную матрицу (FPGA), постоянное запоминающее устройство (ПЗУ) для хранения программного обеспечения, оперативное запоминающее устройство (ОЗУ) и энергонезависимое запоминающее устройство. Также в это может быть включено другое аппаратное обеспечение, обычное и/или специальное.

[0078] Программные модули или простые модули, представляющие собой программное обеспечение, могут быть использованы здесь в комбинации с элементами блок-схемы или другими элементами, которые указывают на выполнение этапов процесса и/или текстовое описание. Подобные модели могут быть выполнены на аппаратном обеспечении, показанном напрямую или косвенно.

[0079] С учетом этих примечаний, далее будут рассмотрены некоторые не ограничивающие варианты осуществления аспектов настоящей технологии.

[0080] На Фиг. 2 представлена система 200, реализованная в соответствии с неограничивающими вариантами осуществления настоящей технологии. Система 200 включает в себя первое клиентское устройство 202, второе клиентское устройство 204, третье клиентское устройство 206 и четвертое клиентское устройство 208, соединенные с сетью 220 передачи данных через соответствующую линию 215 передачи данных (пронумеровано только на Фиг. 1). Система 200 включает в себя сервер 230 поисковой системы, аналитический сервер 250 и сервер 260 саджестов, соединенные с сетью 220 передачи данных с помощью их соответствующей линии 215 передачи данных. В некоторых вариантах осуществления настоящей технологии, сервер 250 поисковой системы, сервер 250 аналитики и сервер 260 саджестов могут быть выполнены как единый сервер.

[0081] Только в качестве примера, первое клиентское устройство 202 может быть выполнено как смартфон, второе клиентское устройство 204 может быть выполнено как ноутбук, третье клиентское устройство 206 может быть выполнено как смартфон и четвертое клиентское устройство 208 может быть выполнено как планшет. В некоторых вариантах осуществления настоящей технологии, не ограничивающих ее объем, сеть 220 передачи данных может представлять собой Интернет. В других вариантах осуществления настоящей технологии сеть 220 передачи данных может быть реализована иначе - в виде глобальной сети передачи данных, локальной сети передачи данных, частной сети передачи данных и т.п.

[0082] То, как именно реализована данная линия 215 передачи данных, никак конкретно не ограничено, и будет зависеть только от того, как именно реализовано соответствующее одно из: первое клиентское устройство 202, второе клиентское устройство 204, третье клиентское устройство 206 и четвертое клиентское устройство 208. В качестве примера, но не ограничения, в данных вариантах осуществления настоящей технологии в случаях, когда по меньшей мере одно из первого клиентского устройства 202, второго клиентского устройства 204, третьего клиентского устройства 206 и четвертого клиентского устройства 208, реализовано как беспроводное устройство связи (например, смартфон), соответствующая одна из: линия 215 передачи данных может представлять собой беспроводную сеть передачи данных (например, среди прочего, линию передачи данных 3G, линию передачи данных 4G, беспроводной интернет Wireless Fidelity или коротко WiFi®, Bluetooth® и т.п.). В тех примерах, где по меньшей мере одно из первого клиентского устройства 202, второго клиентского устройства 204, третьего клиентского устройства 206 и четвертого клиентского устройства 208 реализованы соответственно как портативный компьютер, смартфон, планшет, соответствующая линия 215 передачи данных может быть как беспроводной (беспроводной интернет Wireless Fidelity или коротко WiFi®, Bluetooth® и т.п) так и проводной (соединение на основе сети Ethernet).

[0083] Важно иметь в виду, что варианты осуществления воплощения первого клиентского устройства 202, второго клиентского устройства 204, третьего клиентского устройства 206, четвертого клиентского устройства 208, линии 215 передачи данных и сети 220 передачи данных представлены исключительно в иллюстрационных целях. Таким образом, специалисты в данной области техники смогут понять подробности других конкретных вариантов осуществления первого клиентского устройства 202, второго клиентского устройства 204, третьего клиентского устройства 206, четвертого клиентского устройства 208 и линии 215 передачи данных и сети 220 передачи данных. То есть, представленные здесь примеры не ограничивают объем настоящей технологии.

[0084] Несмотря на то, что представлено только четыре клиентских устройства 202, 204, 206 и 208 (все показаны на Фиг. 2), подразумевается, что любое число клиентских устройств 202, 204, 206 и 208 может быть соединено с системой 200. Далее подразумевается, что в некоторых вариантах осуществления технологии, число клиентских устройств 202, 204, 206 и 208, которые включены в систему 200, может достигать десятков или сотен тысяч.

[0085] С сетью 220 передачи данных также соединен вышеупомянутый сервер 230 поисковой системы. Сервер 230 поисковой системы может представлять собой обычный компьютерный сервер. В примере варианта осуществления настоящего технического решения, сервер 230 поисковой системы может представлять собой сервер Dell™ PowerEdge™, на котором используется операционная система Microsoft™ Windows Server™. Излишне говорить, что сервер 230 поисковой системы может представлять собой любое другое подходящее аппаратное и/или прикладное программное, и/или системное программное обеспечение или их комбинацию. В представленном варианте осуществления настоящего технического решения, не ограничивающем его объем, сервер 230 поисковой системы является одиночным сервером. В других вариантах осуществления настоящего технического решения, не ограничивающих ее объем, функциональность сервера 230 хостинга содержимого может быть разделена, и может выполняться с помощью нескольких серверов. В некоторых вариантах осуществления настоящей технологии, сервер 230 поисковой системы находится под контролем и/или управлением поставщика поисковой систем, такого, например, как оператор поисковой системы Yandex. Как вариант, сервер 230 поисковой системы может находиться под контролем и/или управлением поставщика сервиса.

[0086] В общем случае, целью сервера 230 поисковой системы является (i) выполнение поисков; (ii) предоставление саджестов поискового запроса пользователям (например, пользователям первого клиентского устройства 202, второго клиентского устройства 204, третьего клиентского устройства 206 и четвертого клиентского устройства 208); (iii) выполнение анализа поисковых результатов и выполнение ранжирование поисковых результатов в ответ на поисковый запрос; (iv) группировка результатов и компиляция страницы результатов поиска, которая будет выводиться на электронном устройстве (например, одном из первого клиентского устройства 202, второго клиентского устройства 204, третьего клиентского устройства 206 и четвертого клиентского устройства 208), использованном для ввода поискового запроса, который привел к созданию SERP.

[0087] Конфигурация сервера 230 поисковой системы для выполнения поиска конкретно ничем не ограничена. Специалистам в данной области техники будут понятны некоторые способы и средства для выполнения поиска с помощью сервера 230 поисковой системы и, соответственно, некоторые структурные компоненты сервера 230 поисковой системы будут описаны только на поверхностном уровне. Сервер 230 поисковой системы может содержать базу 240 данных поискового журнала.

[0088] В некоторых вариантах осуществления настоящей технологии, сервер 230 поисковой системы может выполнять несколько типом поисков с помощью поисковой системы 235, включая, среди прочего, общий доменный поиск и вертикальный доменный поиск.

[0089] Поисковая система 235 сервера 230 поисковой системы выполнена с возможностью осуществлять общие доменные поиски, как известно в данной области техники. Например, общий доменный поиск не ограничивается поиском конкретной категории результатов, а способен предоставить все результаты, которые наилучшим образом подходят к поисковому запросу. Такой общий (независимый от категории) поиск с помощью поисковой системы 235 может возвращать результаты поиска, которые включают в себя неспецифичный для категорий цифровой контент, а также специфичный для категорий цифровой контент, например, изображение, видео, новости, товары, блоги, книги, места, дискуссии, рецепты, билеты, биографическую информацию, патенты, акции, расписания и так далее, а также другой цифровой контент, который тесно связан и адресован конкретному типу цифрового контента. Например, общий доменный поиск может быть WWW-поиском. Поиск, произведенный в общем домене, создает «результат общего поиска». Такие результаты общего поиска также упоминаются здесь как «сетевые результаты». Обычно сетевой результат включает в себя ссылку на веб-сайт и фрагмент информации (сниппет), который дает краткое описание содержимого веб-сайта. Пользователь может выбрать ссылку на веб-сайт, включенную в состав сетевого результата, для перехода на веб-страницу, относящуюся к поисковому запросу пользователя. Термины «результат общего поиска» и «элемент результата общего поиска» используются здесь взаимозаменяемо, как и «результат поиска» и «элемент результата поиска».

[0090] Поисковая система 235 сервера 230 поисковой системы также выполнена с возможностью осуществлять вертикальные доменные поиски. Например, "вертикальный домен" может представлять собой информационный домен, включающий в себя специализированный контент, например, контент одного типа (например, типа медиа, жанра контента, актуальности и т.д.) Вертикальный домен, таким образом, включает в себя конкретную подгруппу данных, например, конкретную подгруппу сетевых данных. Например, вертикальный домен может включать в себя конкретную информацию, такую как изображения, видео, новости, товары, блоги, книги, места, обсуждения, рецепты, билеты, биографическую информацию, патенты, акции, расписания и так далее. Поиск, осуществленный в вертикальном домене, создает "результат вертикального поиска" или "элемент результата вертикального поиска". Такие результаты вертикального поиска также упоминаются здесь как «вертикали» и «вертикальные результаты». Термины «результат вертикального поиска» и «элемент результата вертикального поиска» используются здесь взаимозаменяемо.

[0091] В некоторых вариантах осуществления настоящей технологии, поисковая система 235 может также включать "свежий" вертикальный домен. Свежий вертикальный домен может включать в себя недавние документы (т.е. которые были обновлены или индексированы сервером 230 поисковой системы за заранее определенный период времени от текущего часа, дня, недели или месяца) из других вертикальных доменов и/или из общего домена. В других вариантах осуществления настоящей технологии, свежий вертикальный домен может только включать в себя выбранное подмножество недавних документов из других вертикальных доменов. В альтернативных вариантах осуществления технологии, свежий вертикальный домен может содержать недавние документы, которые могут быть не включены в другие вертикальные домены. Несмотря на то, что свежий вертикальный домен может являться отдельным доменом, в альтернативных неограничивающих вариантах осуществления технологии, информация о свежих документах может храниться в соответствующей базы данных вертикального домена или в базе данных общего домена, в зависимости от обстоятельств.

[0092] Сервер 230 поисковой системы также выполнен с возможностью осуществлять, как известно специалистам в данной области техники, алгоритм поискового робота - причем алгоритм инициирует сервер 230 поисковой системы "просматривать" Интернет и индексировать посещенные веб-сайты в одну или несколько индексных базы данных, например, базу 240 данных поискового журнала.

[0093] Поисковая система 235 сервера 230 поисковой системы выполнена с возможностью создавать ранжированный список результатов поиска, включая, результаты из общего доменного поиска и вертикального доменного поиска. Множество алгоритмов для ранжирования поисковых результатов известно и может быть использовано поисковой системой 235.

[0094] В качестве примера, не ограничивающего объем технологии, некоторые способы ранжирования результатов в соответствии с их релевантностью для введенного пользователем поискового запроса основаны на всех или некоторых из следующих критериев: (i) популярность данного поискового запроса в поисках; (ii) число выведенных результатов; (iii) включает ли в себя поисковый запрос какие-либо ключевые термины (например, «изображения», «видео», «погода» или т.п.), (iv) насколько часто конкретный поисковый запрос включает в себя ключевые термины при вводе его другими пользователями; (v) насколько часто другие пользователи при выполнении аналогичного поиска выбирали конкретный ресурс или конкретные результаты вертикального поиска, когда результаты были представлены на SERP. Север 230 поисковой системы может вычислять и назначать оценку релевантности (на основе другого представленного выше критерия) для каждого поискового результата, полученного в ответ на введенный пользователем поисковый запрос, и создавать SERP, причем поисковые результаты ранжированы в соответствии с их соответствующими оценками релевантности. В настоящем варианте осуществления технологии, сервер 230 поисковой системы может выполнять множество алгоритмов машинного обучения для ранжирования документов и/или создавать свойства для ранжирования документов.

[0095] Сервер 230 поисковой системы обычно содержит вышеупомянутую базу 240 данных поискового журнала.

[0096] В общем случае, база 240 данных поискового журнала может содержать индекс 244, журнал 246 поисковых запросов и журнал 248 пользовательских взаимодействий.

[0097] Задачей индекса 244 является индексирование документов (или указание на документы), такие как, без установления ограничений, веб-страницы, изображения, PDF, документы Word™, документы PowerPoint™, которые были просмотрены (или открыты) поисковым роботом сервера 230 поисковой системы. В некоторых вариантах осуществления настоящей технологии, индекс 244 ведется в форме списков словопозиций. Таким образом, когда пользователь одного из первого клиентского устройства 202, второго клиентского устройства 204, третьего клиентского устройства 206 и четвертого клиентского устройства 208 вводит поисковый запрос и выполняет поиск на сервере 230 поисковой системы, сервер 230 поисковой системы анализирует индекса 244 и извлекает документы, которые содержат термины запроса, и ранжирует их в соответствии с алгоритмом ранжирования.

[0098] Целью журнала 246 поисковых запросов является ведение журнала поисков, введенных в поисковую систему 235. Конкретнее, журнал 246 поисковых запросов может содержать список запросов, каждый соответствующий запрос из списка обладает соответствующими поисковыми терминами, связанные документы были перечислены сервером 230 поисковой системы в ответ на соответствующий поисковый запрос, число введений соответствующего запроса в течение периода времени (упоминается далее как частоты предыдущего использования), и может также содержать список пользователей (или группу пользователей), идентифицированных с помощью анонимного ID (или совсем без ID), и соответствующие документы, на которые они нажали после ввода соответствующего поискового запроса. В некоторых вариантах осуществления технологии, журнал 246 поисковых запросов может обновляться каждый раз, когда выполняется новый запрос на сервере 230 поисковой системы. В других вариантах осуществления технологии, журнал 246 поисковых запросов может обновляться в заранее определенные моменты. В некоторых вариантах осуществления технологии, может быть множество копий журнала 246 поисковых запросов, и каждая соответствует журналу 246 поисковых запросов в различные моменты времени.

[0099] Способ, в соответствии с которым создается журнал 248 пользовательских взаимодействий, никак конкретно не ограничен. Журнал 248 пользовательских взаимодействий может быть связан с журналом 246 поисковых запросов, и списком параметров пользовательских взаимодействий, которые отслеживались сервером 250 аналитики, после того как пользователь ввел поисковый запрос и кликнул на один или несколько документов на SERP в поисковой системе 235. В качестве неограничивающего примера, журнал 248 пользовательских взаимодействий может содержать: (i) ссылку на соответствующий документ или указание на него, который может быть идентифицирован, в качестве неограничивающего примера, с помощью ID или URL; (ii) соответствующий список запросов, где каждый соответствующий запрос из списка соответствующих запросов связан с соответствующим документов, и где каждый из соответствующих запросов был использован одним или несколькими пользователями для доступа к соответствующему документу; и (iii) соответствующее множество параметров пользовательских взаимодействий для каждого запроса (если с документом было взаимодействие), которые указывают на пользовательское взаимодействие с соответствующим документом пользователями, которые ввели соответствующий запрос из списка запросов. Журнал 248 пользовательских взаимодействий может далее включать в себя соответствующие временные отметки, связанные с соответствующими пользовательскими взаимодействиями, и другие статистические данные. В некоторых вариантах осуществления настоящей технологии, журнал 246 поисковых запросов и журнал 248 пользовательских взаимодействий могут быть реализованы как единый журнал.

[00100] В общем случае, данные из базы 240 данных поискового журнала (включая данные из журнала 248 пользовательских взаимодействий) могут быть получены или извлечены по меньшей мере одним из сервера 230 поисковой системы, сервера 250 аналитика и сервера 260 саджестов одновременно (т.е. в заранее определенные временные интервалы) или не одновременно (например, при получении указания).

[00101] В настоящем варианте осуществления технологии, параметры пользовательского взаимодействия из журнала 248 пользовательских взаимодействий могут в общем случае отслеживаться и компилироваться сервером 250 аналитики.

[00102] С сетью 220 передачи данных также соединен вышеупомянутый сервер 250 аналитики. Сервер 250 аналитики может представлять собой обычный компьютерный сервер. В примере варианта осуществления настоящей технологии сервер 250 аналитики может представлять собой сервер Dell™ PowerEdge™, на котором используется операционная система Microsoft™ Windows Server™. Излишне говорить, что сервер 250 аналитики может представлять собой любое другое подходящее аппаратное и/или прикладное программное, и/или системное программное обеспечение или их комбинацию. В представленном варианте осуществления настоящей технологии, не ограничивающем ее объем, сервер 250 аналитики является одиночным сервером. В других неограничивающих вариантах осуществления настоящей технологии, функциональность сервера 250 аналитики может быть разделена, и может выполняться с помощью нескольких серверов. В других вариантах осуществления технологии, функции сервера 250 аналитики могут быть реализованы полностью или частично сервером 230 поисковой системы. В некоторых вариантах осуществления настоящей технологии, сервер 250 аналитики находится под контролем и/или управлением оператора поисковой системы. Как вариант, сервер 250 аналитики может находиться под контролем и/или управлением другого поставщика сервиса.

[00103] В общем случае, целью сервера 250 аналитики является отслеживание пользовательских взаимодействий с поисковой системой 235 сервера 230 поисковой системы, такого как поисковые запросы и термины, введенные пользователями, а также документы, к которым последовательно обращались пользователи. Сервер 250 аналитики может отслеживать пользовательские взаимодействия (например, данные о кликах), когда пользователи выполняют общие доменные поиски и вертикальные доменные поиски в поисковой системе 235 сервера 230 поисковой системы. Пользовательские взаимодействия могут отслеживаться сервером 250 аналитики в форме параметров пользовательских взаимодействий.

[00104] Неограничивающие примеры параметров пользовательских взаимодействий, которые отслеживаются или вычисляются сервером 250 аналитики, включают в себя:

- Loss/Win: был ли совершен клик по документу в ответ на поисковый запрос или нет.

- Время пребывания: время, которое пользователь проводит на документе до возвращения на SERP,

- Длинное/короткое нажатие: было ли пользовательское взаимодействие с документом длинным или коротким по сравнению с пользовательским взаимодействием с другими документами на SERP.

- Показатель кликабельности (CTR): Число кликов на элемент, деленное на число раз, когда элемент был показан (показы).

[00105] Естественно, вышепредставленный список не является исчерпывающим и может включать в себя другие типы параметров пользовательского взаимодействия, не выходя за границы настоящей технологии.

[00106] Сервер 250 аналитика может передавать отслеживаемые параметры пользовательских взаимодействий серверу 230 поисковой системы таким образом, что они могут сохраняться в журнале 246 поисковых запросов и журнале 248 пользовательских взаимодействий базы 240 данных поискового журнала. В некоторых вариантах осуществления технологии, сервер 250 аналитики может сохранять параметры пользовательских взаимодействий и соответствующие поисковые результаты локально в журнале пользовательских взаимодействий (не показан). В других вариантах осуществления настоящей технологии, не ограничивающих ее объем, функциональность сервера 250 аналитики и сервера 230 поисковой системы может быть разделена, и может выполняться с помощью одного сервера.

[00107] К сети передачи данных также присоединен вышеупомянутый сервер 260 саджестов. Сервер 260 саджестов может представлять собой обычный компьютерный сервер. В примере варианта осуществления настоящей технологии сервер 260 саджестов может представлять собой сервер Dell™ PowerEdge™, на котором используется операционная система Microsoft™ Windows Server™. Излишне говорить, что сервер 260 саджестов может представлять собой любое другое подходящее аппаратное и/или прикладное программное, и/или системное программное обеспечение или их комбинацию. В представленном варианте осуществления настоящей технологии, не ограничивающем ее объем, сервер 260 саджестов является одиночным сервером. В других неограничивающих вариантах осуществления настоящей технологии, функциональность сервера 260 саджестов может быть разделена, и может выполняться с помощью нескольких серверов. В контексте настоящей технологии, сервер 260 саджестов может осуществлять часть описанных способов и систем. В некоторых вариантах осуществления настоящей технологии, сервер 260 саджестов находится под контролем и/или управлением оператора поисковой системы. Как вариант, сервер 260 саджестов может находиться под контролем и/или управлением другого поставщика сервиса. Функциональность сервера 260 саджестов может также быть реализована сервером 230 поисковой системы.

[00108] В общем случае, целью сервера 260 саджестов является создание саджестов поисковых запросов, связанных с частью поискового запроса, который введен пользователем в интерфейс поисковой системы 235 (и у пользователя нет необходимости вводить поисковый запрос для обработки поисковой системы 235). Сервер 260 саджестов может перенаправлять саджесты поискового запроса на сервер 230 поисковой системы, и поисковая система 235 может ранжировать и рекомендовать саджесты поисковой системы в качестве завершения поискового запроса пользователю. В альтернативном варианте осуществления технологии, сервер 260 саджестов может ранжировать саджесты поискового запроса до перенаправления их серверу 230 поискового запроса. В некоторых вариантах осуществления настоящей технологии, функциональность сервера 230 поисковой системы и сервера 260 саджестов может быть выполнена как единый сервер.

[00109] Для целей настоящей технологии саджесты поисковых запросов могут быть разделены на две отдельных категории: (i) "старые" саджесты поисковых запросов, и (ii) "свежие" саджесты поисковых запросов. Старые саджесты поисковых запросов могут считаться "классическими" саджестами поисковых запросов, которые рекомендуются пользователям на основе факторов, таких как, среди прочего, общее или абсолютное число вводов поисковых запросов в течение долгого времени, и взаимодействия пользователей с SERP, предоставляемой в ответ на эти запросы, и так далее. Свежие саджесты запроса или свежие документа могут относиться соответственно к поисковым запросам или документам, которые были недавно введены в базу 240 данных поискового журнала сервера 230 поисковой системы, т.е. во время заранее определенного периода времени до текущего часа, дня, недели или месяца, что удовлетворяет конкретным условиям, которые будут подробно описаны далее. В контексте настоящей технологии, свежие саджесты поисковых запросов могут создаваться путем: (i) получения недавних поисковых запросов, которые соответствуют конкретным условиям; и (ii) получения свежего документа, который соответствует недавним поисковым запросам с заранее определенного ресурса. То, как создаются свежие саджесты поискового запроса, будет описано далее более подробно.

[00110] Сервер 260 саджестов может также управлять базой 262 данных саджестов.

[00111] База 262 данных саджестов может содержать один или несколько старых саджестов поисковых запросов и соответствующих параметров, свежие саджесты-кандидаты запросов и. соответствующие параметры, свежие саджесты запросов и соответствующие параметры, и свежие документы и соответствующие параметры, которые будут подробно описаны далее. Следует иметь в виду, что в некоторых вариантах осуществления технологии, база 262 данных саджестов является опциональной, и ее функциональность может быть реализована с помощью базы 240 данных поискового журнала сервера 230 поисковой системы или с помощью другой базы данных (не показано) на других серверах (не показано).

[00112] В общем случае, старые саджесты поисковых запросов и свежие саджесты поисковых запросов могут сочетаться для получения общего или объединенного набора саджестов поискового запроса, который может быть ранжирован для получения ранжированного набора, и, по меньшей мере часть ранжированного набора может предоставляться последовательно как саджесты по завершению запроса пользователям, которые вводят часть поискового запроса в поисковую систему 235 сервера 230 поисковой системы. В некоторых вариантах осуществления настоящей технологии, по меньшей мере часть объединенного набора саджестов поискового запроса может предоставляться пользователю после ввода поискового запроса, в качестве неограничивающего примера в области под поисковой строкой на SERP.

[00113] Специалистам в данной области техники будет понятно, что существуют различные способы ранжирования и/или персонализации поисковых саджестов. В качестве примера, не ограничивающего объем технологии, некоторые способы ранжирования поисковых саджестов в соответствии с их релевантностью основаны на всех или некоторых из следующих критериев: (i) популярность данного поискового саджеста; (ii) число результатов, возвращенных для поискового саджеста; (iii) включает ли в себя поисковый саджест какие-либо ключевые термины (например, "изображения", "видео", "погода", "YouTube™" и т.п.), (iv) насколько часто конкретный поисковый саджест включает в себя ключевые термины при вводе его другими пользователями; (v) насколько часто были представлены другие пользователи при выполнении аналогичного поиска выбирали конкретный ресурс или конкретные результаты поиска, когда результаты конкретного поискового саджеста. Такие ранжирования могут быть персонализированы, а могут и не быть, т.е. они могут основываться, а могут и не основываться на специфичных для пользователя признаках ранжирования. В некоторых вариантах осуществления настоящей технологии, такие ранжирования поисковых саджестов основываются на известных способах общего ранжирования и не являются специфичными для пользователя. В других вариантах осуществления настоящей технологии ранжирования поисковых саджестов являются специфичными для пользователя, т.е. основаны на специфичных для пользователя общих или вертикальных признаках ранжирования. Специфичные для пользователя признаки ранжирования основаны на пользовательской персональной информации, например, характеристиках пользовательской истории поиска. Следует понимать, что могут использоваться любые способы ранжирования и/или персонализации.

[00114] Исключительно с целью иллюстрации, в описанных здесь примерах поисковые саджесты относятся к текстовым строкам, фразам или словам, однако следует понимать, что тип созданного поискового саджеста никак конкретно не ограничен. Например, завершение поискового саджеста может быть изображением, аудиозаписью, текстом и т.д.

[00115] Несмотря на то, что представленные неограничивающие варианты осуществления технологии относятся к пользователям, вводящим поисковые запросы в интерфейс поисковой системы 235, выполняемой сервером 230 поисковой системой, следует иметь в виду, что настоящая технология может быть реализована на других типах ресурсов, приложений и/или интерфейсов, используемых для извлечения информации.

[00116] На Фиг. 3 представлена принципиальная схема системы 300 саджестов поискового запроса, выполненной в соответствии с неограничивающими вариантами осуществления настоящей технологии.

[00117] Система 500 саджестов поисковых запросов может выполняться сервером 260 саджестов и сервером 230 поисковой системы. В альтернативных вариантах осуществления настоящей технологии, система 300 саджестов поисковых запросов может выполняться только сервером 260 саджестов. В других вариантах осуществления настоящей технологии, где функциональность сервера 260 саджестов выполняется сервером 230 поисковой системы, система 300 саджестов поисковых запросов может выполняться сервером 260 поисковой системы.

[00118] В общем случае, целью системы 300 саджестов поисковых запросов является предоставление саджестов по завершению поискового запроса или рекомендаций, которые включают в себя по меньшей мере один свежий саджест поискового запроса, связанный по меньшей мере с частью поискового запроса, который вводится пользователем (например, пользователем одного из первого клиентского устройства 202, второго клиентского устройства 204, третьего клиентского устройства 206 и четвертого клиентского устройства 208) в поисковую систему 235, но может не предоставляться в качестве саджестов по завершению некоторыми системами из существующего уровня техники, как было описано выше.

[00119] Система 300 саджестов поисковых запросов включает в себя агрегатор 310, преобразователь 240 масштаба и устройство 360 ранжирования. Как было упомянуто ранее, устройство 360 ранжирования может выполняться сервером 230 поисковой системы.

[00120] В общем случае, целью агрегатора 310 является запрос базы 240 данных поискового журнала на получение и вывод (i) набора старых саджестов 322 запроса; (ii) первого набора свежих саджестов-кандидатов 332 поискового запроса; и (iii) второго набора свежих саджестов-кандидатов 342 поискового запроса. В представленном здесь варианте осуществления технологии, агрегатор 310 выполняет агрегатор 320 старых запросов для создания набора старых саджестов 322 запроса, первый агрегатор свежих саджестов-кандидатов 400 для создания первого набора свежих саджестов-кандидатов 332 поискового запроса, и второй агрегатор свежих саджестов-кандидатов 500 для создания второго набора свежих саджестов-кандидатов 342 поискового запроса. Таким образом, первый набор свежих саджестов-кандидатов 332 поискового запроса, созданный первым агрегатором 400 свежих кандидатов запроса, может считаться первым подходом к созданию свежих кандидатов поискового запроса, и второй набор свежих саджестов-кандидатов 342 поискового запроса, созданный вторым агрегатором 500 свежих кандидатов запроса, может считаться дополнительным подходом к полировке или уточнению саджестов-кандидатов поискового запроса в первом наборе свежих саджестов-кандидатов 332 поискового запроса. Таким образом, в некоторых вариантах осуществления настоящей технологии, первый агрегатор 400 свежих кандидатов запроса и второй агрегатор 500 свежих кандидатов запроса могут быть единым агрегатором свежих кандидатов запроса, и первый набор свежих саджестов-кандидатов 332 поискового запроса и второй набор свежих саджестов-кандидатов 342 поискового запроса могут быть единым набором свежих саджестов-кандидатов поискового запроса. В альтернативных вариантах осуществления технологии, второй набор свежих саджестов-кандидатов 342 поискового запроса может быть создан независимо от второго набора свежих саджестов-кандидатов 342 поискового запроса вторым агрегатором 500 свежих кандидатов запроса.

[00121] Агрегатор 310 может в общем случае получать каждый из набора старых саджестов 322 запроса, первого набора свежих саджестов-кандидатов 332 поискового запроса, и второго набора свежих саджестов-кандидатов 342 поискового запроса не одновременно, при получении указания от поисковой системы 235 сервера 230 поисковой системы. В альтернативных вариантах осуществления настоящей технологии, по меньшей мере один из набора старых саджестов 322 запроса, первого набора свежих саджестов-кандидатов 332 поискового запроса, и второго набора свежих саджестов-кандидатов 342 поискового запроса может быть получен через заранее определенные интервалы времени и сохранен в базе 262 данных саджестов.

[00122] Целью агрегатора 320 старых запросов является получения, из базы 240 данных поискового журнала, саджестов поискового запроса, связанных с частью поискового запроса, который вводится пользователем в интерфейс поисковой системы 235 для вывода набора старых саджестов 322 запроса.

[00123] Как было описано выше, способ, в соответствии с которым агрегатор 320 старых запросов получает набор старых саджестов 322 запроса, никак конкретно не ограничен и может быть основан на одном или более из: (i) частота предыдущего использования или статистической популярности данного саджеста поискового запроса, основанная по меньшей мере частично на предыдущих связанных запросах в журнале 246 поисковых запросов и журнале 248 пользовательских взаимодействий; (ii) связанной с пользователем популярности данного саджеста поискового запроса в журнале 248 пользовательских взаимодействий; (iii) как часто конкретный саджест поискового запроса обычно ищется вместе с поисковым запросом; и (iv) другой вспомогательной информации, связанной с предыдущими поисками, проведенными другим (или тем же) пользователем, которая может быть получена из базы 240 данных поискового журнала.

[00124] Агрегатор 320 старых запросов может далее выводить набора старых саджестов 322 запроса, где каждый соответствующий старый саджест 325 запроса связан с соответствующей частотой предыдущего использования на первой шкале 327. В данном случае, шкала, связанная с частотой предыдущего использования, указывает или относится к заранее определенному интервалу во времени, связанному с частотой предыдущего использования, за которое вычисляется распределение числа вводов. В качестве неограничивающего примера, частота предыдущего использования первой шкалы (например, частота предыдущего использования на первой шкале 327, связанной с соответствующих старым саджестом 325 запроса) может относиться к числу вводов соответствующего запроса за интервал времени, представляющий собой один месяц.

[00125] На Фиг. 4, где первый агрегатор 400 свежих кандидатов запроса агрегатора 310 будет описан в соответствии с неограничивающими вариантами осуществления настоящей технологии.

[00126] Первый агрегатор 400 свежих кандидатов запроса включает в себя получатель 420, генератор 450 параметра и множество фильтров 480.

[00127] В общем случае, задачей первого агрегатора 400 свежих кандидатов запроса является вывод первого набора свежих саджестов-кандидатов 332 поискового запроса, что включает в себя недавние поисковые запросы, которые стали более популярными или обрели популярность среди пользователей поисковой системы 235 в достаточно недавний период времени до текущего часа, дня, недели, и которые прошли множество фильтров 480. Таким образом, запросы в первом наборе свежих саджестов-кандидатов 332 поискового запроса обычно не включены в набор старых саджестов 322 запроса из-за различиях в шкалах, связанных с запросами в первом наборе свежих саджестов-кандидатов 332 поискового запроса, как будет более подробно описано далее.

[00128] Получатель 420 недавних запросов может запрашивать журнал 246 поисковых запросов из базы 240 данных поискового журнала для вывода множества недавних запросов 422. В некоторых вариантах осуществления настоящей технологии, получатель 420 недавних запросов может выводить множество недавних запросов 422 при получении указания по меньшей мере на часть поискового запроса (который может быть частью поискового термина из поискового запроса), который введен пользователем в интерфейс поисковой системы 235, и где множество недавних запросов 422 относится к части введенного поискового запроса. В других вариантах осуществления технологии, получатель 420 запросов может выводить множество недавних запросов 422 через заранее определенные интервалы времени без получения указания на завершение по меньшей мере часть поискового запроса, и соответствующий недавний запрос 424, включенный во множество недавних запросов 422 может быть получен путем отслеживания всех недавних поисковых запросов, которые могут быть взаимосвязаны или не взаимосвязаны.

[00129] Соответствующий недавний запрос 424 из множества недавних запросов 422 может представлять собой поисковый запрос, который был введен по меньшей мере одним пользователем в поисковую систему 235 сервера 230 поисковой системы во время заранее определенного периода времени до текущего часа, дня, недели или месяца, и который был записан в журнал 236 поисковых запросов. Таким образом, соответствующий недавний запрос 424 не обязательно является популярным запросом, который был введен большое число раз, и обладает большим количеством пользовательских взаимодействий с документами на SERP, предоставляемыми в ответ на запрос, а просто поисковым запросом, который был введен в поисковую систему 235 по меньшей мере одним пользователем за заранее определенный период времени. В некоторых вариантах осуществления технологии, для индексации в журнале 246 поисковых запросов базы 240 данных поискового журнала, поисковому запросу может потребоваться общее число вводов выше заранее определенного порога.

[00130] В общем случае, получатель 420 недавних запросов может получать недавние запросы на основе языка части запроса, введенного пользователем в интерфейс поисковой системы 235, и доменное имя поисковой системы 235, в которую введена часть запроса, например, без установления ограничений, .com, .ru, .kz, .com.tr, и так далее. В тех вариантах осуществления технологии, где множество недавних запросов 422 получают через заранее определенные интервалы времени, множество недавних запросов 422 может быть получено на основе по меньшей мере языка каждого из соответствующих недавних запросов 425 и доменного имени поисковой системы 235, в которую вводится каждый из соответствующих недавних запросов 425.

[00131] Дополнительно или опционально, получатель 420 недавних запросов может применять фильтр некорректных терминов (не показано) для проверки того, что один или несколько терминов каждого соответствующего недавнего запроса 424 из множества недавних запросов 422, не являются частью списка некорректных или запрещенных слов, который может включать в себя слова, относящиеся к деликатным темам, насилию, наркотикам, наготе, порнографии и т.д. Фильтры могут быть установлены заранее оператором поисковой системы.

[00132] Каждый соответствующий недавний запрос 424 из множества недавних запросов 422 может далее быть получен генератором 450 параметров.

[00133] В общем случае, задачей генератора 450 параметров является создание, для соответствующего недавнего запроса 424 из множества недавних запросов 422, соответствующего множества параметров 452. Соответствующее множество параметров 452 может далее использоваться для определения, с помощью множества фильтров 480, является ли соответствующий недавний запрос 424 частью первого набора свежих саджестов-кандидатов 332 поискового запроса.

[00134] Соответствующее множество параметров 452 включает в себя соответствующую частоту предыдущего использования на второй шкале 426, соответствующий параметр 454 пользовательского намерения, и соответствующий параметр 456 пользовательского взаимодействия.

Частота предыдущего использования

[00135] Соответствующая частота предыдущего использования на второй шкале 426, связанная с соответствующим недавним запросом 424 может представлять собой соответствующее распределение числа вводов соответствующего недавнего запроса 424 в поисковую систему 235 за заранее определенный интервал времени. Заранее определенный интервал времени, за который вычисляется частоты предыдущего использования соответствующего недавнего поискового запроса 424, упоминается как находящийся на второй шкале, поскольку информация, связанная с соответствующим недавним поисковым запросом 424 (т.е. число вводов и пользовательские взаимодействия с SERP в ответ на соответствующий недавний запрос 424), может быть доступна только в заранее определенный период времени, в который вычислялась соответствующая частота предыдущего использования на предыдущей шкале 327, связанной с соответствующим старым саджестом 325 запроса. В качестве неограничивающего примера, соответствующая частота предыдущего использования на второй шкале 426 может представлять собой число вводов соответствующего недавнего поискового запроса 424 за интервал времени 4 часа, например, между 16:00 и 20:00 в конкретный день, и тем самым, первая шкала соответствующей частоты предыдущего использования на первой шкале 327, связанная с соответствующим старым саджестом 325 запроса, может представлять собой месяц, а вторая шкала соответствующей частоты предыдущего использования на второй шкале 426, связанная с соответствующим недавним запросом 424, может представлять собой четыре часа. Способ, в соответствии с которым представлено число вводов недавнего поискового запроса за заранее определенный интервал времени в журнале 246 поисковых запросов, никак не ограничено: например, ввод может быть введен в журнал 246 поисковых запросов в конкретное время, когда он был получен поисковой системой 235, или вводы могут быть добавлены в журнал 246 поисковых запросов для конкретных суб-интервалов, например, журнал 246 поисковых запросов может сохранять информацию о числе вводов за каждые 10 минут, и генератор 450 параметров может агрегировать число вводов за заранее определенный интервал в 4 часа из журнала 246 поисковых запросов для получения соответствующей частоты предыдущего использования на второй шкале 426. В некоторых вариантах осуществления технологии, соответствующая частота предыдущего использования на второй шкале 426 может вычисляться и/или обновляться сервером 250 аналитики в режиме реального времени, сохраняться в журнале 246 поискового запроса и быть получена генератором 450 параметра.

[00136] Генератор 450 параметра может, тем самым, выводить, для каждого соответствующего недавнего запроса 424 из множества недавних запросов 422, соответствующую частоту предыдущего использования на второй шкале 426.

Параметр пользовательского намерения

[00137] Генератор 450 параметра может создавать соответствующий параметр 545 пользовательского намерения, связанный с соответствующим недавним запросом 424. Целью соответствующего параметра 545 пользовательского намерения является измерение намерения пользователя, вводящего соответствующий недавний запрос 424, использующий интерфейс поисковой системы 235, и, конкретнее, в контексте настоящей технологии, прогнозирование того, заинтересован ли пользователь в изучении недавних документов в SERP, предоставленных в ответ на недавний запрос 424 в конкретный момент времени. Таким образом, соответствующий параметр 454 пользовательского намерения может быть интерпретирован как вероятность того, что пользователь желает взаимодействовать с недавним документом в свежем вертикальном домене на SERP, предоставленной в ответ на соответствующий недавний запрос 424.

[00138] Соответствующий параметр 454 пользовательского намерения может вычисляться на основе соответствующей частоты предыдущего использования на второй шкале 426, и из информации, полученной из журнала 246 поисковых запросов, журнала 248 пользовательских взаимодействий базы 240 данных поискового журнала.

[00139] В одном варианте осуществления настоящей технологии, соответствующий параметр 454 пользовательского намерения может вычисляться с помощью модели кликов, созданной алгоритмом машинного обучения (MLA). В общем случае, сервер 230 поисковой системы может использовать модель кликов для моделирования одного или нескольких из: пользовательское поведение, понимание степени удовлетворенности пользователя, прогноз вероятности клика и релевантность документа. Модель кликов в общем случае использует набор переменных для описания пользовательского поведения во время одной или нескольких сессий, например, позиции документов на SERP, полученные в ответ на запрос, был ли изучен документ или нет, было ли совершено нажатие на документ или нет, релевантность документа, расстояние между документами на SERP, переходы между документами и так далее. Модель кликов может обучаться на данных из журнала 248 пользовательских взаимодействий и журнала 246 поисковой системы, и далее может оцениваться с помощью использования различных метрик оценки, которые хорошо известны в данной области техники. Таким образом, на основе данных из журнала 248 пользовательских взаимодействий и журнала 246 поисковых запросов, таких каких пользовательские взаимодействия с недавними документами из свежего вертикального документа, полученного в ответ на соответствующий недавний запрос 424 или связанные запросы, отслеживаемые сервером 250 аналитики за заранее определенный период времени, и различные перечисленные выше переменные, генератор 450 параметров может вычислять соответствующий параметр 454 пользовательского намерения с помощью модели кликов, реализуемой сервером 230 поисковой системы.

[00140] В качестве неограничивающего примера, во время фазы обучения модели кликов, соответствующему параметру 454 пользовательского намерения может быть присвоено случайное число из диапазона, и соответствующий недавний запрос 424, связанный с соответствующим параметром 454 пользовательского намерения, может быть предложен выборке пользователей поисковой системы 235, и соответствующий параметр 454 пользовательского намерения может далее уточняться итеративно на основе полученной статистики (например, числа пользователей, которые выбрали соответствующий недавний запрос 424 и последующее пользовательское взаимодействие с SERP, предоставляемое в ответ на соответствующий недавний запрос 424).

[00141] В некоторых вариантах осуществления настоящей технологии, в качестве примера, когда запрос обладает множеством намерений, генератор 450 параметров может определять множество параметров пользовательского намерения, каждый из которых связан с соответствующим вертикальным доменом, и назначать соответствующий весовой коэффициент каждому из множества параметров пользовательского намерения, что позволяет сравнивать и/или выбирать параметры пользовательского намерения для определения соответствующего параметра 454 пользовательского намерения. Дополнительно или альтернативно, генератор 450 параметра может вычислять взвешенную сумму множества параметров пользовательского намерения для получения соответствующего параметра 454 пользовательского намерения.

[00142] В общем случае, соответствующий параметр 454 пользовательского намерения для соответствующего недавнего запроса 424 может быть вычислен в режиме реального времени, т.е. при получении указания на завершение саджеста запроса. В некоторых вариантах осуществления настоящей технологии, соответствующий параметр 454 пользовательского намерения может вычисляться через заранее определенные интервалы времени, например, каждые 30 минут, сохраняться в базе 262 данных саджестов, и наиболее свежая версия может быть извлечена при получении указания на завершение саджеста запроса. Следует иметь в виду, что соответствующий параметр 454 пользовательского намерения может изменяться во времени на основе различных факторов, например, типа запроса, общей активности в поисковой системе 235, свежести недавних документов, полученных в ответ на соответствующий недавний запрос 424, числа пользовательских взаимодействий с поисковыми результатами в ответ на запрос, и так далее.

[00143] Далее, соответствующий параметр 454 пользовательского намерения может уточняться или настраиваться с помощью обратной связи (например, пользовательских взаимодействий с SERP в ответ на саджест соответствующего недавнего запроса 424) на основе одного или нескольких предыдущих параметров пользовательского намерения, вычисленного для того же самого соответствующего недавнего поискового запроса 424.

[00144] В некоторых вариантах осуществления настоящей технологии, соответствующий параметр 454 пользовательского намерения может быть далее основан на зависящих от пользователя признаков пользователя(ей), вводящего(их) часть запроса, связанного с соответствующим недавним поисковым запросом 424. Зависящие от пользователя признаки могут, например, учитывать ранее описанную модель кликов. В качестве неограничивающего примера, на основе истории поиска пользователя или группы пользователей, которые искали и получали доступ к ряду документов, связанных с конкретным вертикальным доменом, например, фильмами, и генератор 450 параметров может присваивать весовой коэффициент вертикальному домену фильмов при определении соответствующего параметра 454 пользовательского намерения, для учета общего интереса пользователя или группы пользователей в кинематографе.

[00145] В некоторых вариантах осуществления настоящей технологии, анализ может не ограничиваться базой 240 данных поискового журнала сервера 230 поисковой системы, и соответствующий параметр 454 пользовательского намерения может вычисляться, по меньшей мере частично, на основе информации, полученной из других источников. В качестве неограничивающего примера, информация для определения соответствующего параметра 454 пользовательского намерения может быть получена через интерфейс программирования приложений (API) социальных сетей, например, Facebook™, Twitter™ или VKontakte™ или с других источников, на которых может быть доступна статистическая информация о публичном содержимом.

[00146] Генератор 450 параметра может, тем самым, выводить, для каждого соответствующего недавнего запроса 424 из множества недавних запросов 422, соответствующий параметр 454 пользовательского взаимодействия.

Параметр пользовательского взаимодействия

[00147] Генератор 450 параметров может создавать соответствующий параметр 456 пользовательского взаимодействия, связанный с соответствующим недавним запросом 424, причем соответствующий параметр 456 пользовательского взаимодействия указывает на пользовательские взаимодействия по меньшей мере с одним недавним поисковым результатом, полученным в ответ на соответствующий недавний поисковый запрос 424.

[00148] То как именно вычисляется соответствующий параметр 456 пользовательского взаимодействия, никак конкретно не ограничено, и соответствующий параметр пользовательского взаимодействия может представлять собой, в качестве неограничивающего примера, параметр кликабельности (CTR), который является соотношением числа пользователей, которые взаимодействовали с одним или несколькими недавними документами на SERP, предоставляемой в ответ на соответствующий недавний поисковый запрос 424, к общему числу раз, когда недавний документ был показан (без пользовательского взаимодействия) на SERP (которая представляет собой SERP вертикального домена, например, свежий вертикальный домен или SERP общего домена) за заранее определенные интервалы времени. В качестве неограничивающего примера, если SERP, которая получена в ответ на соответствующий недавний запрос 424 обладает в общей сложности десятью документами, два из которых являются недавними документами (т.е. временными отметками, находящимися в пределах заранее определенного интервала времени), и SERP была показана 5000 раз, но только 1000 пользователей нажали на первый недавний документ, и только 600 пользователей нажали на второй недавний документ, и CTR для первого недавнего документ может определяться как: 1000/5000=0,20, и CTR для второго недавнего документа может определяться как 600/5000=0,12, и общий CTR, связанный с соответствующим недавним запросом 424, может определяться как 0,12+0,20=0,32. Следует иметь в виду, что другие типы параметров пользовательского взаимодействия, подсчитывающие пользовательские взаимодействия с недавними документами связанными с соответствующим недавним поисковым запросом 424 могу использоваться или вычисляться. В альтернативном варианте осуществления технологии, CTR, который связан с соответствующим недавним запросом 424, может вычисляться только для свежего документа (т.е. недавнего документа, обладающего временной меткой в рамках заранее определенного периода времени, и полученного с заранее определенного ресурса, включенного в список заранее определенных ресурсов), полученного вторым агрегатором 500 свежих кандидатов запроса, как будет более подробно описана далее.

[00149] Каждый соответствующий недавний поисковый запрос 424, следовательно, может быть связан с соответствующим множеством параметров 452, и соответствующее множество параметров 452 включает в себя соответствующую частоту предыдущего использования второй шкалы 426, соответствующий параметр 454 пользовательского намерения, и соответствующий параметр 456 пользовательского взаимодействия.

[00150] Каждый соответствующий недавний поисковый запрос 424 и соответствующее связанное множество параметров 452 может быть получено на множестве фильтров 480.

[00151] В общем случае, целью множества фильтров 480 является фильтрация каждого соответствующего недавнего запроса 424 на основе соответствующей связанной частоты предыдущего использования на второй шкале 426, соответствующих параметров 454 пользовательского намерения, и соответствующего параметра 456 пользовательского взаимодействия, для вывода первого набора свежих саджестов-кандидатов 332 поискового запроса.

[00152] Сначала каждый соответствующий недавний запрос 424 может фильтроваться на основе соответствующей связанной частоты предыдущего использования на второй шкале 426. Соответствующая частоты предыдущего использования на второй шкале 426 может позволить определить, что соответствующий недавний поисковый запрос 424 попадает в тренды, т.е. соответствующий недавний поисковый запрос 424 вводится большое число раз в поисковую систему 235 за заранее определенный интервал времени, и может считаться потенциально соответствующим первым свежим саджестом-кандидатом 335 запроса, поскольку он набирает популярность и попадает в тренды среди пользователей поисковой системы 235 в этот временной интервал.

[00153] Таким образом, для того, чтобы считаться потенциальным соответствующим первым свежим саджестом-кандидатом 335 запроса, соответствующая частота предыдущего использования на второй шкале 426 конкретный шкалы, связанной с соответствующим недавним поисковым запросом 422, должна быть выше заранее определенного порога частоты, что может указывать на то, что соответствующий недавний поисковый запрос 424 удовлетворяет фильтру "популярность", и обладает достаточным количеством вводов за заранее определенный период времени, чтобы быть потенциально рекомендованной пользователю, который вводит часть соответствующего недавнего поискового запроса 424 (или соответствующий связанный с ним запрос). В других вариантах осуществления технологии, другие способы могут использоваться для оценки роста соответствующей частоты предыдущего использования на второй шкале 426, например, вычисление скорости изменения числа вводов за заранее определенный временной интервал, которая должна быть выше заранее определенного порога.

[00154] Далее, соответствующий недавний запрос 424 может отфильтровываться на основе соответствующего связанного параметра 454 пользовательского намерения. Как указывалось выше, соответствующий параметр 454 пользовательского намерения указывает на вероятность того, что намерением пользователя, который вводит соответствующий недавний запрос 424, является взаимодействие со свежим результатом и/или свежими результатами вертикального домена.

[00155] Таким образом, чтобы считаться потенциальным соответствующим первым свежим саджестом-кандидатом 335 запроса, соответствующий параметр 454 пользовательского намерения, связанный с соответствующим недавним поисковым запросом 424, должен быть выше заранее определенного порога пользовательского намерения. Соответствующий недавний поисковый запрос 424, обладающий соответствующим параметром 454 пользовательского намерения за заранее определенный порог пользовательского намерения, может указывать на то, что, на основе исторических данных и модели кликов, пользователь, который вводит часть соответствующего недавнего поискового запроса 424 (или связанные с ним запросы), может захотеть изучить недавний документ, и что соответствующий недавний поисковый запрос 424 следует рекомендовать будущим пользователям, вводящим по меньшей мере части соответствующего недавнего поискового запроса 424 в поисковой системе 235. Соответствующий параметр 454 пользовательского намерения, таким образом, является дополнительным индикатором того, что соответствующий недавний поисковый запрос 424 является соответствующим первым свежим саджестом-кандидатом 335 запроса, предназначенным для рекомендации в виде саджеста завершения для пользователей, вводящих часть соответствующего недавнего поискового запроса 424 (или соответствующего связанного с ним запроса) в поисковую систему 235.

[00156] Далее, соответствующий недавний поисковый запрос 424 может фильтроваться на основе соответствующего параметра 456 пользовательского взаимодействия, который находится выше заранее определенного порога пользовательского взаимодействия.

[00157] Соответствующий параметр 456 пользовательского взаимодействия, таким образом, может быть другим механизмом подтверждения того, что соответствующий недавний поисковый запрос 424 является соответствующим первым свежим саджестом-кандидатом 335 запроса, поскольку отношение пользователей, которые выбрали или ввели соответствующий недавний поисковый запрос 424, и взаимодействовали с недавними документами на SERP из всех пользователей, которые просмотрели SERP, предоставленную в ответ на недавний поисковый запрос 424.

[00158] Коротко говоря, чтобы считаться соответствующим первым свежим саджестом-кандидатом 335 запроса, соответствующий недавний запрос 424 должен удовлетворять следующим условиям: обладать соответствующей частотой прошлого взаимодействия на второй шкале 426 выше заранее определенного порога частоты, обладать соответствующим параметром 454 пользовательского намерения, связанным с заранее определенной категорией, выше заранее определенного порога параметра пользовательского намерения, и обладать соответствующим параметром 456 пользовательского взаимодействия выше заранее определенного порога пользовательского взаимодействия. В общем случае, каждый из порогов может применяться последовательно множеством фильтров 480, начиная от соответствующей частоты предыдущего использования на второй шкале 426, и могут проходить через порог соответствующего параметра 454 пользовательского намерения, если они удовлетворяют порогам.

[00159] В некоторых вариантах осуществления настоящей технологии, чтобы считаться соответствующим первым свежим саджестом-кандидатом 335 запроса, соответствующий недавний запрос 424 должен удовлетворять по меньшей мере одному из по меньшей мере двух вышеперечисленных условий. Альтернативно или дополнительно, каждый из множества параметров 452 (т.е. соответствующие частоты предыдущего использования на второй шкале 426, соответствующие параметры 454 пользовательского намерения и соответствующего параметра 456 пользовательского взаимодействия) может взвешиваться, и общая оценка множества параметром 452 должна быть выше общего порога (без необходимости или с необходимостью создания индивидуальных порогов для каждого из множества параметров 452).

[00160] Как может быть понятно специалистам в данной области техники, каждый из множества параметров 452, включающих в себя соответствующую частоту предыдущего использование на второй шкале 426, соответствующие параметры 452 пользовательского намерения и соответствующие параметра 456 пользовательского взаимодействия, связанные с соответствующим недавним запросом 424, могут вычисляться сервером 260 саджеста и сохраняться в базе 262 данных саджестов, например, множеством фильтров 480 применяется во время получения первого набора свежих саджестов-кадидатов 332 поискового запроса сервера 260 саджестов, в качестве примера базы 262 данных саджеста и указания условий получения (т.е. пороги множества параметров 452) для каждого из соответствующих параметров.

[00161] Далее, каждый из порогов для соответствующей частоты предыдущего использования на второй шкале 426, соответствующие параметры 454 пользовательского намерения и соответствующий параметр 456 пользовательского взаимодействия могут динамически уточняться на основе обратной связи (т.е. пользовательских взаимодействий), полученной после саджеста соответствующего недавнего поискового запроса 424.

[00162] На Фиг. 5, второй агрегатор 500 свежих кандидатов запроса будет описан в соответствии с неограничивающими вариантами осуществления настоящей технологии.

[00163] В общем случае, целью второго агрегатора 500 свежих кандидатов запроса является вывод второго набора свежих саджестов-кандидатов 342 поискового запроса на основе указания на свежий документ.

[00164] Для целей упрощения настоящего описания, будет сделана ссылка на указание на единый свежий документ 502, из которого создается соответствующий третий набор свежих саджестов-кандидатов 586 запроса, тем не менее, как может быть понятно специалистам в данной области техники, процесс, описанный далее, может выполняться одновременно и/или последовательно для множества свежих документов (не показано), для создания второго набора свежих саджестов-кандидатов 342 поискового запроса, который может включать в себя соответствующий третий набор свежих саджестов-кандидатов 586 запроса и один или несколько соответствующих наборов свежих саджестов-кандидатов запроса (не показано), которые были созданы на основе одного или нескольких соответствующих свежих документов (не показано). В одном варианте осуществления настоящей технологии, второй набор свежих саджестов-кандидатов 342 поискового запроса, созданных вторым свежим агрегатором 500 свежих кандидатов запроса, может считаться дополнительным подходом к "полировке" саджестов-кандидатов поискового запроса в первом набора свежих саджестов-кандидатов 332 поискового запроса путем обогащения саджестов-кандидатов поискового запроса с помощью саджестов-кандидатов поискового запроса, извлеченных из указания на свежий документ 502 и другие свежие документов, которые могут представлять собой свежие документы, которые могут представлять собой свежие документы на SERP в ответ на саджесты-кандидаты запроса из первого набор свежих саджестов-кандидатов 332 поисковых запросов.

[00165] Второй агрегатор 500 свежих поисковых запросов включает в себя анализатор (парсер) 520, устройство получения 520 документа, устройство получения 560 запроса и калькулятор 580 оценки релевантности.

[00166] Указание на свежий документ 520 может быть получено из индекса 244 базы 240 данных поискового журнала или другой базы данных или ресурса (не показано). В общем случае, для получения и рассматривания "свежего" документа, данный документ должен удовлетворять двум условиям: (i) обладать соответствующей временной отметкой (которая может представлять точное время и дату, когда он был опубликован в сети или найден поисковой системой 235) в заранее определенном интервале времени до текущего времени, дня или недели (который может представлять собой тот же самый или другой заранее определенный интервал времени, связанный с соответствующей частотой предыдущего использования на второй шкале 426 соответствующего недавнего запроса 424) и (ii) быть опубликован частью ресурса из списка заранее определенных ресурсов (не показано). Список заранее определенных ресурсов, который может вестись сервером 260 саджестов или другим источником, может включать в себя список ресурсов, которые считаются надежными и/или популярными среди пользователей Интернета операторами сервера 230 поисковой системы. Такие заранее определенные ресурсы могут включать в себя, в качестве неограничивающего примера, новостные веб-сайты, официальные веб-сайты, академические публикации, правительственные веб-сайты и так далее.

[00167] Таким образом, два условия могут быть нацелены на выбор данного документа в качестве свежего документа в ответ на то, что данный документ является недавним документом и находится на надежном и/или популярном источнике, с которого создается второй набор свежих саджестов-кандидатов 342 поискового запроса.

[00168] Указание на свежий документ 502 может быть далее получено анализатором 520.

[00169] Целью анализатора 520 является парсинг указания на свежий документ 502 для получения заголовка 530 свежего документа 502, который может указывать на поисковые термины, которые могут вводиться пользователями в поисковую систему 235 для получения доступа к свежему документу 502. Альтернативно или дополнительно, в качестве примера, когда ресурс может быть частью списка заранее определенных ресурсов, но заголовки его не всегда указывают на содержимое документов, связанных с ресурсом, анализатор 520 может парсить (анализировать) по меньшей мере часть документа для извлечения заголовка 530, который может отличаться от заголовка свежего документа 502, определенного ресурсом. В качестве неограничивающего примера, парсинг для отвлечения заголовка 530 может быть основан на мере TF-IDF (частота термина-обратная частота документа) свежего документа 502 или других подходах к машинному обучению.

[00170] Заголовок 530 свежего документа 502 может быть далее получен устройством получения 540 документа. В настоящем варианте осуществления настоящей технологии, устройство получения 540 документа выполняется поисковой системой 235, тем не менее, следует иметь в виду, что может использоваться и другой тип приложения по получению информации. Заголовок 530 свежего документа 502 может вводиться в виде запроса в поисковую систему 235, и может быть получен набор документов 550. Число документов в наборе документов 550 может представлять собой заранее определенное число документов, например, топ 10 ранжированных документов на основе оценки релевантности документов, или может представлять собой документы, которые удовлетворяют порогу оценки релевантности.

[00171] Набор документов 550 может быть далее получен устройством получения 540 запроса. Устройство получения 560 запроса может далее получать, из журнала 246 поисковых запросов, для каждого соответствующего документа 552 из набора документов 550, соответствующий набор запросов 570, и каждый соответствующий запрос 572 из соответствующего набора запросов 570 был использован для получения доступа к соответствующему документу 552. В некоторых вариантах осуществления настоящей технологии, каждый соответствующий набор запросов 570 может быть получен устройством получения 560 запроса на основе факторов, например, частоты предыдущего использования соответствующего запроса 572 в наборе запросов. Дополнительно или альтернативно, число запросов в наборе запросов 570 может представлять собой заранее определенное число запросов.

[00172] Указание на свежий документ 502 и каждый набор запросов 570, связанных с каждым соответствующим документом 552, может быть получено калькулятором 580 оценки релевантности.

[00173] В общем случае, целью калькулятора 580 оценки релевантности является определения соответствующей оценки релевантности между свежим документом 502 и каждым соответствующим запросом 572 каждого соответствующего набора запросов 570. Способ, которым определяется оценка релевантности, никак не ограничен и может вычисляться обычным алгоритмом ранжирования поисковой системы 235, другим алгоритмом ранжирования или MLA или любым другим образом. В качестве неограничивающего примера, соответствующая оценка релевантности может определяться калькулятором 580 оценки релевантности на основе совпадающих свойств свежего документа 502 и соответствующего запроса 572.

[00174] Калькулятор 580 оценки релевантности может далее ранжировать соответствующие запросы 572 в соответствии с их соответствующими оценками релевантности, и выбирать заранее определенное число соответствующих запросов 572 для вывода второго набора свежих саджестов-кандидатов 342 поискового запроса.

[00175] Дополнительно или альтернативно, калькулятор 580 оценки релевантности может только выбирать соответствующие запросы 572, обладающие соответствующей оценкой релевантности выше заранее определенного порога релевантности, и выводить второй набор свежих саджестов-кандидатов 342 поискового запроса.

[00176] В общем случае, второй агрегатор 500 свежих кандидатов запроса может выводить третий набор свежих саджестов-кандидатов 586 поискового запроса на основе предположения о том, что пользователи поисковой системы 235 могут быть заинтересованы в просмотре свежего документа 502 и/или аналогичных свежих документов, и, следовательно, может создавать третий набор свежих саджестов-кандидатов 586 поискового запроса, который содержит релевантные запросы в отношении свежего документа 502, и который может предлагаться в качестве завершения саджеста запроса пользователю, который вводит часть запроса, включенную во второй набор свежих саджестов-кандидатов 342 поискового запроса. Таким образом, пользователь, выбирающий соответствующий третий свежий саджест-кандидат 588 поискового запроса из третьего набора свежих саджестов-кандидатов 586 поискового запроса при вводе части данного поискового запроса, может привести к SERP, на которой присутствуют свежий документ 502 и/или аналогичные документы. В альтернативных вариантах осуществления технологии, пользователь, выбирающий саджест запроса из второго набора свежих саджестов-кандидатов 342 поискового запроса в поисковой системе 235, может привести напрямую к свежему документу 502.

[00177] Как было описано ранее, второй агрегатор 500 свежих кандидатов запроса может повторять процесс для множества свежих документов для вывода второго набора свежих саджестов-кандидатов 342 поискового запроса, который включает в себя третий набор свежих саджестов-кандидатов 586 поискового запроса и один или более соответствующих наборов свежих саджестов поискового запроса (не показано), извлеченный из одного или нескольких свежих документов (не показано). В некоторых вариантах осуществления настоящей технологии, один или несколько свежих документов могут представлять собой недавние документы, которые предоставлялись на SERP и с которыми происходили взаимодействия в ответ на соответствующий первый саджест-кандидат 335 поискового запроса из первого набора свежих саджестов-кандидатов 332 поискового запроса.

[00178] На Фиг. 4 и Фиг. 5 представлены некоторые неограничивающие варианты осуществления того, как создаются первый набор свежих саджестов-кандидатов 332 поискового запроса и второй набор свежих саджестов-кандидатов 342 поискового запроса, далее будет описано то, как предоставляются свежие поисковые запросы и старые поисковые запросы в виде саджестов запроса со ссылкой на Фиг. 3.

[00179] Набора старых саджестов 322 запроса, первого набора свежих саджестов-кандидатов 332 поискового запроса, и второго набора свежих саджестов-кандидатов 342 поискового запроса может быть получен устройством 340 масштабирования. В некоторых вариантах осуществления технологии, второй набор свежих саджестов-кандидатов 342 поискового запроса может обходить устройство 340 масштабирования, и набор старых саджестов 322 запроса, и первый набор свежих саджестов-кандидатов 332 поискового запроса может быть получен устройством 340 масштабирования.

[00180] В общем случае, целью устройства 340 масштабирования является нормализация (т.е. чтобы все частоты предыдущего использования находились на одинаковой шкале, которая может отличаться от первой или второй шкалы) или уточнение (т.е. перевод частот предыдущего использования из одной шкалы в другую, например, перевод частот предыдущего использования с первой шкалы во вторую шкалу) соответствующих частот предыдущего использования на других шкалах, связанных с запросами по меньшей мере в одном из: наборе старых саджестов 322 запроса, первом наборе свежих саджестов-кандидатов 332 поискового запроса. Уточнение частот предыдущего использования на общую шкалу может позволить последовательно выбрать, сравнить и ранжировать с помощью устройства 360 ранжирования для рекомендации старых и новых запросов в качестве завершения саджестов пользователю, который вводит часть соответствующего запроса в поисковую систему 235.

[00181] В одном варианте осуществления настоящей технологии, устройство 340 масштабирования может приблизительно вычислять значения соответствующей частоты предыдущего использования на второй шкале 426 на первую шкалу. В качестве неограничивающего примера, если первая шкала, которая связана с частотами предыдущего использования из набора старых саджестов 322 запроса, составляет один месяц, и вторая шкала, которая связана с частотами предыдущего использования первого набора свежих саджестов-кандидатов 332 поискового запроса, составляет 4 (четыре) часа, устройство 340 масштабирования может приблизительно вычислять значения частот предыдущего использования первого набора свежих саджестов-кандидатов 332 поискового запроса для одного месяца, что позволяет последовательно сравнивать и ранжировать на основе частот предыдущего использования. Таким образом, различные факторы и статистические данные поисковой системы 235 могут использоваться для масштабирования: среднее число введенных запросов в день, неделю и/или месяц в поисковую систему 235, момент во времени, период активности в поисковой системе 235, персонализированные параметры (включая среднее число введенных запросов в день, неделю и/или месяц в поисковую систему 235 пользователем или группой пользователей, период активности пользователя в поисковой системе 235).

[00182] Одна возможная формула для уточнения частот предыдущего использования на общей шкале выглядит следующим образом:

[00183] Где F(query) - частота предыдущего использования соответствующего недавнего запроса, - среднее число запросов за день в поисковом запросе 235, F(period) - оценка популярности, связанная с периодом времени в поисковом запросе 235, и nb of days - число дней (т.е. шкала), для которой мы хотим уточнить соответствующие частоты.

[00184] Как может быть понятно специалистам в данной области техники, другие формулы или методы могут использоваться для масштабирования значений частоты предыдущего использования на различных шкалах, связанных с запросам по меньшей мере одном из: наборе старых саджестов 322 запроса, первом наборе свежих саджестов-кандидатов 332 поискового запроса, и втором наборе свежих саджестов-кандидатов 342 поискового запроса.

[00185] В некоторых вариантах осуществления настоящей технологии, второй набор свежих саджестов-кандидатов 342 поискового запроса может проходить через или пропускать устройство 340 масштабирования, поскольку соответствующая частота предыдущего использования не обязательно могла вычисляться для каждого соответствующего второго свежего саджеста-кандидата 345 поискового запроса из второго набора свежих саджестов-кандидатов 342 поисковой системы. В других вариантах осуществления настоящей технологии, может вычисляться соответствующая частота предыдущего использования, связанная с каждым соответствующим вторым свежим саджестом-кандидатом 345 запроса из второго набора свежих саджестов-кандидатов 342 поискового запроса и уточняться с помощью устройства 340 масштабирования, в зависимости от того как реализован второй агрегатор 500 свежих кандидатов запроса.

[00186] Устройство 340 масштабирования может далее объединять набор старых саджестов 322 запроса, первый набор свежих саджестов-кандидатов 332 поискового запроса, и второй набор свежих саджестов-кандидатов 342 поискового запроса для вывода объединенного или комбинированного набора 350 саджестов запроса.

[00187] Объединенный набор 350 саджестов запроса может включать в себя по меньшей мере одно из: соответствующий старый саджест-кандидат 325 запроса, соответствующий первый свежий саджест-кандидат 335 запроса и соответствующий второй свежий саджест-кандидат 345 запроса, причем каждый соответствующий старый саджест-кандидат 325 запроса, соответствующий первый свежий саджест-кандидат 335 запроса и соответствующий второй свежий саджест-кандидат 345 запроса связаны с соответствующей частотой предыдущего использования на идентичной шкале 358. В некоторых вариантах осуществления настоящей технологии, соответствующая частота предыдущего использования на идентичной шкале 358 может быть частотой предыдущего использования на первой шкале.

[00188] Объединенный набор 350 саджестов запроса может быть далее получен устройством 360 ранжирования.

[00189] В общем случае, задачей устройства 360 ранжирования является ранжирование каждого саджеста-кандидата 325, 335, 345 поискового запроса в объединенном наборе 350 саджестов запроса на основе соответствующей частоты предыдущего использования на идентичной шкале 358 для получения ранжированного набора саджестов 385 запроса.

[00190] Каждый саджест 387 запроса в ранжированном наборе саджестов 385 запроса может быть ранжирован в убывающем порядке соответствующей частоты предыдущего использования идентичной шкалы 358. В некоторых вариантах осуществления настоящей технологии, устройство 360 ранжирования может выбирать подмножества саджестов запроса из объединенного набора 350 саджестов запроса для включения в ранжированный список саджестов 385 запроса на основе соответствующей частоты предыдущего использования на идентичной шкале 358, например, могут выбираться только топ 5 верхних оценок частоты. Дополнительно или альтернативно, устройство 360 ранжирования может выбирать саджесты запроса для включения в ранжированный набор саджестов 385 запроса на основе их соответствующей частоты предыдущего использования на идентичной шкале 358, находящейся выше заранее определенного порога частоты. В некоторых вариантах осуществления настоящей технологии, по меньшей мере некоторые свежие саджесты запроса (т.е. полученные из первого агрегатора 400 свежих кандидатов запроса и/или второго агрегатора 500 свежих кандидатов запроса) могут взвешиваться для ранжирования выше в списке саджестов по завершению.

[00191] Ранжированный набор саджестов 385 запроса может далее передаваться клиентскому устройству (например, одному из первого клиентского устройства 202, второго клиентского устройства 204, третьего клиентского устройства 206 и четвертого клиентского устройства 208) с помощью поисковой системы 235 сервер 230 поисковой системы, предназначенной для рекомендации в качестве саджестов поискового запроса для пользователя, который вводит по меньшей мере часть данного поискового запроса.

[00192] Как было ранее описано, пользовательские взаимодействия с саджестами запроса и документами, которые предоставляются в ответ на них, могут отслеживаться сервером 250 аналитики, и другие параметры (например, соответствующая частоты предыдущего использования на второй шкале 426, соответствующие параметры 454 пользовательского намерения и соответствующий параметр 456 пользовательского взаимодействия) и/или соответствующие пороги могут уточняться соответствующим образом на основе обратной связи от пользователей.

[00193] На Фиг. 3 - Фиг. 5 описаны система 300 саджестов поискового запроса, первый агрегатор 400 свежих кандидатов запроса и второй агрегатор 500 свежих кандидатов запроса в соответствии с неограничивающими вариантами осуществления настоящей технологии, далее будет описано то, как свежие поисковые запросы и старые поисковые запросы могут предоставляться в качестве саджестов запроса со ссылками на Фиг. 6 - Фиг. 9.

[00194] На Фиг. 6 и Фиг. 7 представлена блок-схема первого способа 600 создания ранжированного набора саджестов запроса, причем данный саджест запроса из ранжированного набора саджестов запроса является одним из свежим саджестом запроса или старым саджестом запроса в соответствии с неограничивающими вариантами осуществления настоящей технологии.

[00195] Способ 600 может начинаться на этапе 602.

[00196] ЭТАП 602: получение указания по меньшей мере на часть данного поискового запроса от пользователя электронного устройства, соединенного с сервером

[00197] На этапе 602 сервер 230 поисковой системы может получать указание по меньшей мере на часть данного поискового запроса на поисковой системе 235 от пользователя одного из первого клиентского устройства 202, второго клиентского устройства 204, третьего клиентского устройства 206 и четвертого клиентского устройства 208, причем данный поисковый запрос обладает по меньшей мере одним поисковым термином. Указание по меньшей мере на часть данного поискового запроса может передаваться серверу 260 саджеста.

[00198] Способ 600 далее может перейти к выполнению этапа 604.

[00199] ЭТАП 604: выбор, из базы данных поискового журнала, на основе по меньшей мере части по меньшей мере одного поискового термина, набора саджестов запроса в виде рекомендаций по завершению поискового запроса, которые связаны по меньшей мере с одним поисковым термином, причем каждый соответствующий саджест запроса из набора саджестов запроса связан с соответствующей частотой предыдущего использования, причем соответствующая частота находится на первой шкале.

[00200] На этапе 604, агрегатор 310 сервера 260 саджестов может выбирать, из базы 240 данных поискового журнала набора старых саджестов 322 запроса в виде рекомендации по завершению поискового запроса, которые связаны по меньшей мере с одним поисковым термином, и каждый соответствующий старый саджест 325 запроса из набора старых саджестов 322 запроса связан с соответствующей частотой предыдущего использования на первой шкале 327.

[00201] Способ 600 далее может перейти к выполнению этапа 606.

[00202] ЭТАП 606: вычисление, для каждого соответствующего недавнего поискового запроса из множества соответствующих недавних поисковых запросов в базе данных поискового журнала:

соответствующая частота предыдущего использования на второй шкале,

соответствующий параметр пользовательского намерения, и

соответствующий параметр пользовательского взаимодействия.

[00203] На этапе 606, генератор 450 параметров первого агрегатора 400 свежих кандидатов запроса сервера 260 саджестов может вычислять, для каждого соответствующего недавнего поискового запроса 424 из множества соответствующих недавних поисковых запросов 422 в базе 240 данных поискового журнала, по меньшей мере одно из соответствующего множества параметров 452, соответствующего множества параметров 452, включая соответствующую частоту предыдущего использования на второй шкале 426, соответствующего параметра 454 пользовательского намерения, и соответствующего параметра 456 пользовательского взаимодействия. В некоторых вариантах осуществления технологии, соответствующий параметр 456 пользовательских взаимодействий может представлять собой собой кликабельность (CTR).

[00204] Способ 600 далее может перейти к выполнению этапа 608.

[00205] ЭТАП 608: выбор каждого соответствующего свежего саджеста-кандидата запроса из набора свежих саджестов-кандидатов поискового запроса из множества соответствующих недавних поисковых запросов на основе:

соответствующей связанной частоты на второй шкале, которая находится выше заранее определенного порога частоты,

соответствующего параметра пользовательского взаимодействия, который находится выше заранее определенного порога пользовательского взаимодействия, и

соответствующего параметра пользовательского намерения, который находится выше заранее определенного порога параметра пользовательского намерения.

[00206] На этапе 608, множество фильтров 480 первого свежего агрегатора 400 свежих кандидатов запроса сервера 260 саджестов может выбирать каждый соответствующий первый свежий саджест-кандидат 335 запроса первого набора свежих саджестов-кандидатов 332 поискового запроса из множества соответствующих недавних поисковых запросов 422 на основе: соответствующей связанной частоты на второй шкале 426, которая находится выше заранее определенного порога частоты, соответствующего параметра 456 пользовательского взаимодействия, который находится выше заранее определенного порога пользовательского взаимодействия, и соответствующего параметра 454 пользовательского намерения, который находится выше заранее определенного порога параметра пользовательского намерения.

[00207] Способ 600 далее может перейти к выполнению этапа 610.

[00208] ЭТАП 610: масштабирование каждой соответствующей частоты запроса на второй шкале для получения соответствующей связанной частоты запроса на первой шкале.

[00209] На этапе 610, устройство масштабирования 340 сервера 260 саджеста может масштабировать каждую соответствующую частоту предыдущего использования на второй шкале 337, связанную с соответствующим первым саджестом-кандидатом 335 запроса из первого набора свежих саджестов-кандидатов 332 поискового запроса для получения соответствующей частоты предыдущего использования на идентичной шкале 358. В некоторых вариантах осуществления технологии, масштабирование может быть основано на средней частоте поисковых запросов, введенных пользователями в поисковую систему на текущий день; средней частоте поисковых запросов, введенных пользователями в поисковую систему за данный период; и количестве дней в текущем месяце.

[00210] Способ 600 далее может перейти к выполнению этапа 612.

[00211] ЭТАП 612: выбор набора свежих саджестов запросов из свежих саджестов-кандидатов поискового запроса в качестве рекомендаций по завершению поискового запроса на основе по меньшей мере одного поискового термина данного поискового запроса;

[00212] На этапе 612, устройство 340 масштабирования выбирает набор свежих саджестов запросов из первого набора свежих саджестов-кандидатов 332 поискового запроса в качестве рекомендаций по завершению поискового запроса на основе по меньшей мере одного поискового термина данного поискового запроса.

[00213] Способ 600 далее может перейти к выполнению этапа 614.

[00214] ЭТАП 614: объединение набора саджестов запроса и набора свежих саджестов запроса для создания объединенного набора саджестов запроса.

[00215] Этап 614, устройство 340 масштабирования может объединять набор старых саджестов 332 запросов и первый набор саджестов-кандидатов 332 поискового запроса для получения объединенного набора 350 поискового запроса.

[00216] Способ 600 далее может перейти к выполнению этапа 616.

[00217] ЭТАП 616: ранжирование объединенного набора саджестов запроса на основе соответствующей связанной частоты на первой шкале для получения набора ранжированных саджестов запроса.

[00218] ЭТАП 616: устройство 360 ранжирования может ранжировать объединенный набор 350 саджестов запроса на основе соответствующей частоты на идентичной шкале для получения набора ранжированных саджестов 385 запроса.

[00219] Способ 600 далее может перейти к выполнению этапа 618.

[00220] ЭТАП 618: создание по меньшей мере подмножества ранжированного набора саджестов запроса, данный саджест запроса из подмножества ранжированного набора саджестов запроса относится к одному из: свежему саджесту запроса и саджесту запроса, и подмножество ранжированного набора саджестов запроса предназначено для отображения на электронном устройстве.

[00221] На этапе 618, устройство 360 ранжирования может создавать по меньшей мере подмножество из набора ранжированных саджестов 385 запроса, который может содержать запросы из набора старых саджестов 322 запроса и первого набора свежих саджестов-кандидатов 332 поискового запроса. Подмножество ранжированного набора саджестов 385 запроса может далее передаваться поисковой системе 235 поисковой системы 235, которое, в свою очередь, может отображаться пользователю одного из первого клиентского устройства 202, второго клиентского устройства 204, третьего клиентского устройства 206 и четвертого клиентского устройства 208.

[00222] Далее способ 600 завершается.

[00223] На Фиг. 8 и Фиг. 9 представлена блок-схема второго способа 700 создания ранжированного набора саджестов запроса, причем данный саджест запроса из ранжированного набора саджестов запроса является одним из вторым свежим саджестом запроса или старым саджестом запроса в соответствии с неограничивающими вариантами осуществления настоящей технологии.

[00224] Способ 700 может начинаться на этапе 702.

[00225] ЭТАП 702: получение по меньшей мере части данного поискового запроса от пользователя электронного устройства, соединенного с сервером, причем данный поисковый запрос обладает по меньшей мере одним поисковым термином.

[00226] На этапе 702 сервер 230 поисковой системы может получать указание по меньшей мере на часть данного поискового запроса на поисковой системе 235 от пользователя одного из первого клиентского устройства 202, второго клиентского устройства 204, третьего клиентского устройства 206 и четвертого клиентского устройства 208, причем данный поисковый запрос обладает по меньшей мере одним поисковым термином. Указание по меньшей мере на часть данного поискового запроса может передаваться серверу 260 саджеста.

[00227] Способ 700 далее может перейти к выполнению этапа 704.

[00228] ЭТАП 704: выбор сервером из базы данных поискового журнала, на основе по меньшей мере одного поискового термина, набора саджестов запроса в виде рекомендаций по завершению поискового запроса, которые связаны по меньшей мере с одним поисковым термином, причем каждый соответствующий саджест запроса из набора саджестов запроса связан с соответствующей частотой предыдущего использования, причем соответствующая частота находится на первой шкале.

[00229] На этапе 704, агрегатор 310 сервера 260 саджестов может выбирать, из базы 240 данных поискового журнала набора старых саджестов 322 запроса в виде рекомендации по завершению поискового запроса, которые связаны по меньшей мере с одним поисковым термином, и каждый соответствующий старый саджест 325 запроса из набора старых саджестов 322 запроса связан с соответствующей частотой предыдущего использования на первой шкале 327.

[00230] Способ 700 далее может перейти к выполнению этапа 706.

[00231] ЭТАП 706: получение из базы данных поискового журнала указания на свежий документ, причем получение основано на:

ресурсе, связанном с указанием на свежий документ, и

временной отметке, связанной с указанием на свежий документ;

[00232] На этапе 706, указание на свежий документ 502 может быть получено из индекса 244 базы 240 данных поискового журнала на основе ресурса, связанного со свежим документом, поступившем из списка заранее определенных ресурсов, и временной отметкой, связанной с указанием на свежий документ, находящийся в пределах заранее определенного интервала времени.

[00233] Способ 700 далее может перейти к выполнению этапа 708.

[00234] ЭТАП 708: парсинг (анализ) указания на свежий документ для получения заголовка свежего документа.

[00235] На этапе 708, анализатор 520 может подвергать парсингу указание на свежий документ для получения заголовка 530 указания свежего документа 502.

[00236] Способ 700 далее может перейти к выполнению этапа 710.

[00237] ЭТАП 710: получение набора поисковых результатов, связанного с заголовком свежего документа;

[00238] На этапе 710, устройство 540 получения документа может получать, из журнала 246 поискового журнала, набор документов 550, связанных с заголовком 530 указания на свежий документ 502. В некоторых вариантах осуществления технологии, набор документов 550 может находиться наверху ранжированного набора документов, полученных путем ввода заголовка 530 в поисковую систему 235 сервера 230 поисковой системы.

[00239] Способ 700 далее может перейти к выполнению этапа 712.

[00240] ЭТАП 712: получение из базы данных поискового журнала, для каждого соответствующего поискового результата из набора поисковых результатов, связанных с заголовком свежего документа, по меньшей мере одного соответствующего поискового запроса, который был использован по меньшей мере одним пользователем для получения доступа к соответствующему поисковому результату, причем по меньшей мере один соответствующий поисковый запрос связан с соответствующим поисковым результатом.

[00241] На этапе 712, устройство 560 получения запроса может получать, из журнала 246 поисковых запросов, для каждого соответствующего документа 552 из набора документов 550, соответствующий набор запросов 570, и каждый соответствующий запрос 572 из соответствующего набора запросов 570 был использован для получения доступа к соответствующему документу 552.

[00242] Способ 700 далее может перейти к выполнению этапа 716.

[00243] ЭТАП 716: определение для каждого из по меньшей мере одного соответствующего поискового запроса, связанного с каждым из соответствующих поисковых результатов, соответствующей оценки релевантности, которая основана на указании на свежий документ.

[00244] На этапе 716, целью калькулятора 580 оценки релевантности может являться определение соответствующей оценки релевантности между свежим документом 502 и каждым соответствующим запросом 572 каждого соответствующего набора запросов 570.

[00245] Способ 700 далее может перейти к выполнению этапа 718.

[00246] ЭТАП 718: добавление по меньшей мере одного соответствующего поискового запроса к набору свежих саджестов-кандидатов поискового запроса на основе оценки релевантности.

[00247] На этапе 718, калькулятор 580 оценки релевантности может ранжировать соответствующие запросы 572 в соответствии с их соответствующими оценками релевантности, и выбирать заранее определенное число соответствующих запросов 572 для вывода третьего набора свежих саджестов-кандидатов 586 запроса.

[00248] Способ 700 далее может перейти к выполнению этапа 720 или этапа 722.

[00249] ЭТАП 720: масштабирование каждой соответствующей частоты запроса на второй шкале для получения соответствующей связанной частоты запроса на первой шкале.

[00250] Опционально, на этапе 720, в вариантах осуществления технологии, где соответствующая частота предыдущего использования на данной шкале связана с каждым вторым соответствующим свежим саджестом-кандидатов запроса из второго набора свежих саджестов-кандидатов 342 поисковых запросов, устройство 340 масштабирования может масштабировать каждую соответствующую частоту предыдущего использования на данной шкале для получения соответствующей частоты на первой шкале. В некоторых вариантах осуществления технологии, масштабирование может быть основано на средней частоте поисковых запросов, введенных пользователями в поисковую систему на текущий день; средней частоте поисковых запросов, введенных пользователями в поисковую систему за данный период; и количестве дней в текущем месяце.

[00251] Способ 700 далее может перейти к выполнению этапа 722.

[00252] ЭТАП 722: выбор набора свежих саджестов запросов из свежих саджестов-кандидатов поискового запроса в качестве рекомендаций по завершению поискового запроса на основе по меньшей мере одного поискового термина данного поискового запроса;

[00253] На этапе 722, устройство 340 масштабирования выбирает набор свежих саджестов запросов из второго набора свежих саджестов-кандидатов 342 поискового запроса в качестве рекомендаций по завершению поискового запроса на основе по меньшей мере одного поискового термина данного поискового запроса.

[00254] Способ 700 далее может перейти к выполнению этапа 724.

[00255] ЭТАП 724: объединение набора саджестов запроса и набора свежих саджестов запроса для создания объединенного набора саджестов запроса.

[00256] Этап 724, устройство 340 масштабирования может объединять набор старых саджестов 342 запросов и второй набор саджестов-кандидатов 332 поискового запроса для создания объединенного набора 350 поискового запроса.

[00257] Способ 700 далее может перейти к выполнению этапа 726.

[00258] ЭТАП 726: создание по меньшей мере подмножества ранжированных саджестов запроса, причем данный саджест запроса из подмножества является свежим саджестом запроса и саджестом запроса, и подмножество ранжированных саджестов запроса предназначено для отображения на электронном устройстве.

[00259] На этапе 726, устройство 360 ранжирования может создавать по меньшей мере подмножество ранжированного набора саджестов 385 запроса, который может содержать запросы из каждого из набора старых саджестов 322 запроса и второго набора свежих саджестов-кандидатов 342 поискового запроса. Подмножество ранжированного набора саджестов 385 запроса может далее передаваться поисковой системе 235 поисковой системы 235, которое, в свою очередь, может отображаться пользователю одного из первого клиентского устройства 202, второго клиентского устройства 204, третьего клиентского устройства 206 и четвертого клиентского устройства 208.

[00260] Далее способ 700 завершается.

[00261] Как следует иметь в виду, способ 600 и способ 700 могут выполняться параллельно, последовательно или в сочетании в едином способе.

[00262] На Фиг. 10, в одном варианте осуществления настоящей технологии, пользователь, который вводит часть запроса "Джон Доу" в омнибокс 35 поисковой системы 235 в веб-браузере 30 на клиентском устройстве (который может быть одним из: первым клиентским устройством 202, вторым клиентским устройством 204, третьим клиентским устройством 206 и четвертым клиентским устройством 208), может получать множество саджестов 800, например "John Doe mayor of New York City", "John Doe Lottery Winner","John Douglas", "John Doe billion", "John does maths on monday Wednesday thursday and friday", которое включает в себя первый свежий саджест 820 запроса "John Doe Lottery Winner" и второй свежий саджест 830 запроса "John Doe billion", которые могут удовлетворить намерения пользователя, который ищет информацию о Джоне Доу, который выиграл 1 миллиард долларов. Первый свежий саджест 820 запроса мог быть получен с помощью способа 600, второй свежий саджест 830 запроса мог быть получен с помощью способа 700.

[00263] Специалистам в данной области техники будет понятно, что по меньшей мере некоторые варианты осуществления настоящей технологии нацелены на расширение диапазона технических решений для конкретной технической проблемы, а именно рекомендаций свежих саджестов запросов для пользователей в поисковой системы, которая может сохранять пропускную способность канала и вычислительные ресурсы с помощью представления поискового запроса и соответствующих результатов, которые ищет пользователь, не пролистывая страницы на SERP, на основе прогнозированного пользовательского взаимодействия со свежими саджестами запроса и соответствующими поисковыми результатами.

[00264] Важно иметь в виду, что не все упомянутые здесь технические результаты могут проявляться в каждом варианте осуществления настоящей технологии. Например, варианты осуществления настоящей технологии могут быть реализованы без проявления некоторых технических результатов, а другие варианты могут быть реализованы с проявлением других технических результатов или вовсе без них.

[00265] Некоторые из этих этапов, а также процессы передачи-получения сигнала являются хорошо известными в данной области техники и поэтому для упрощения были опущены в некоторых частях данного описания. Сигналы могут быть переданы-получены с помощью оптических средств (например, опто-волоконного соединения), электронных средств (например, проводного или беспроводного соединения) и механических средств (например, на основе давления, температуры или другого подходящего параметра).

[00266] Модификации и улучшения вышеописанных вариантов осуществления настоящей технологии будут ясны специалистам в данной области техники. Предшествующее описание представлено только в качестве примера и не устанавливает никаких ограничений. Таким образом, объем настоящей технологии ограничен только объемом прилагаемой формулы изобретения.

1. Исполняемый на компьютере способ рекомендаций новых саджестов поискового запроса в режиме реального времени с помощью поисковой системы, которая выполняется сервером, соединенным с базой данных поискового журнала, причем способ выполняется сервером и включает в себя:

получение сервером указания по меньшей мере на часть данного поискового запроса от пользователя электронного устройства, соединенного с сервером, причем указание по меньшей мере на часть данного поискового запроса обладает по меньшей мере частью по меньшей мере одного поискового термина;

выбор сервером из базы данных поискового журнала, на основе указания, набора саджестов запроса в виде рекомендаций по завершению поискового запроса, которые связаны по меньшей мере с одним поисковым термином, причем каждый соответствующий саджест запроса из набора саджестов запроса связан с соответствующей частотой предыдущего использования, причем соответствующая частота находится на первой шкале;

получение сервером из базы данных поискового журнала набора свежих кандидатов-саджестов поискового запроса, причем каждый соответствующий свежий кандидат-саджест поискового запроса представляет собой соответствующий недавний поисковый запрос, введенный соответствующим множеством пользователей в поисковую систему, причем соответствующий свежий кандидат-саджест поискового запроса связан с соответствующей частотой предыдущего использования, которая находится на второй шкале;

масштабирование сервером каждой соответствующей частоты запроса на второй шкале для получения соответствующей связанной частоты запроса на первой шкале;

выбор сервером набора свежих саджестов запросов из свежих кандидатов-саджестов поискового запроса в качестве рекомендаций по завершению поискового запроса на основе указания по меньшей мере на часть данного поискового запроса;

объединение сервером набора саджестов запроса и набора свежих саджестов запроса для создания объединенного набора саджестов запроса и

создание сервером по меньшей мере подмножества ранжированных саджестов запроса на основе объединенного набора саджестов запроса, причем данный саджест запроса из подмножества ранжированных саджестов запроса является одним из: свежим саджестом запроса или саджестом запроса, и подмножество ранжированных саджестов запроса предназначено для отображения на электронном устройстве.

2. Способ по п. 1, в котором:

по меньшей мере подмножество ранжированных саджестов запроса было создано из набора ранжированных саджестов запроса и

до этапа создания способ далее включает в себя

ранжирование сервером объединенного набора саджестов запроса на основе соответствующей связанной частоты на первой шкале для получения набора ранжированных саджестов запроса.

3. Способ по п. 2, в котором:

база данных поискового журнала обладает множеством соответствующих недавних поисковых запросов и

до этапа получения способ далее включает в себя

выбор сервером каждого соответствующего свежего саджеста-кандидата запроса из набора свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов на основе соответствующей связанной частоты на второй шкале, которая находится выше заранее определенного порога частоты.

4. Способ по п. 3, в котором:

выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее включает в себя:

вычисление сервером для каждого из соответствующих свежих саджестов-кандидатов запроса, обладающего связанной соответствующей частотой на второй шкале выше заранее определенного порога частоты, соответствующего параметра пользовательского взаимодействия, который указывает на предыдущие пользовательские взаимодействия по меньшей мере с одним недавним поисковым результатом, полученным в ответ на соответствующий недавний поисковый запрос; и

выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее основан на соответствующем параметре пользовательского взаимодействия, находящегося выше заранее определенного порога пользовательского взаимодействия.

5. Способ по п. 4, в котором:

выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее включает в себя:

вычисление сервером для каждого из соответствующих свежих саджестов-кандидатов запроса, обладающего связанной соответствующей частотой на второй шкале выше заранее определенного порога частоты, соответствующего параметра пользовательского намерения, который указывает на вероятность того, что соответствующий недавний поисковый запрос является частью заранее определенной области поиска; и

выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее основан на соответствующем параметре пользовательского намерения, находящегося выше заранее определенного порога параметра пользовательского намерения.

6. Способ по п. 5, в котором масштабирование каждой соответствующей частоты запроса на второй шкале для получения соответствующей связанной частоты запроса на первой шкале основано на:

средней частоте поисковых запросов, введенных пользователями в поисковую систему на текущий день;

средней частоте поисковых запросов, введенных пользователями в поисковую систему за данный период; и

количестве дней в текущем месяце.

7. Способ по п. 6, в котором выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее основан на доменном имени, связанном с каждым из множества недавних запросов в базе данных поискового журнала.

8. Способ по п. 7, в котором выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее основан на поисковых терминах соответствующего недавнего поискового запроса, не являющегося частью недопустимого списка поисковых терминов.

9. Способ по п. 8, в котором соответствующий параметр пользовательских взаимодействий представляет собой кликабельность (CTR).

10. Способ по п. 9, в котором показатель CTR вычисляется на основе только свежих результатов.

11. Способ по п. 10, в котором данный свежий саджест-кандидат выбирается только в ответ на то, что показатель CTR, который основан на свежих результатах, находится выше заранее определенного порога.

12. Способ п. 11, в котором заранее определенная область поиска является доменом вертикального поиска.

13. Способ по п. 1, в котором способ дополнительно включает в себя, до этапа масштабирования:

получение сервером из базы данных поискового журнала указания на свежий документ, причем получение основано на:

ресурсе, связанном с указанием на свежий документ, и

временной отметке, связанной с указанием на свежий документ;

парсинг сервером указания на свежий документ для получения заголовка свежего документа;

извлечение сервером набора поисковых результатов, связанного с заголовком свежего документа;

получение сервером из базы данных поискового журнала для каждого соответствующего поискового результата из набора поисковых результатов, связанных с заголовком свежего документа, по меньшей мере одного соответствующего поискового запроса, который был использован по меньшей мере одним пользователем для получения доступа к соответствующему поисковому результату, причем по меньшей мере один соответствующий поисковый запрос связан с соответствующим поисковым результатом;

определение сервером для каждого из по меньшей мере одного соответствующего поискового запроса, связанного с каждым из соответствующих поисковых результатов, соответствующей оценки релевантности, которая основана на указании на свежий документ; и

добавление сервером по меньшей мере одного соответствующего поискового запроса к набору свежих саджестов-кандидатов поискового запроса на основе оценки релевантности.

14. Способ по п. 13, в котором результат проверки вычисляется на основе:

ресурса, связанного с указанием на свежий документ, который является заранее определенным ресурсом из списка заранее определенных ресурсов.

15. Способ по п. 14, в котором результат проверки вычисляется на основе:

временной отметки, связанной с указанием на свежий документ, который находится в заранее определенном временном интервале.

16. Способ по п. 15, в котором добавление по меньшей мере одного соответствующего поискового запроса к набору свежих саджестов-кандидатов поискового запроса далее основано на

соответствующей оценке релевантности, которая находится выше заранее определенного порога оценки.

17. Способ по п. 16, в котором:

по меньшей мере один соответствующий поисковый запрос включает в себя по меньшей мере один соответствующий поисковый термин и

определение соответствующей оценки релевантности далее основано по меньшей мере на одном соответствующем поисковом термине.

18. Способ по п. 17, в котором набор поисковых результатов, который связан с заголовком свежего документа, обладает заранее определенным числом поисковых результатов.

19. Способ по п. 18, в котором соответствующая оценка релевантности вычисляется алгоритмом ранжирования поисковой системы.

20. Система для рекомендации свежих саджестов-кандидатов поискового запроса в реальном времени, которая исполняет поисковую систему, причем система соединена с базой данных поискового журнала и включает в себя:

процессор;

постоянный машиночитаемый носитель компьютерной информации, содержащий инструкции, процессор

при выполнении инструкций выполнен с возможностью осуществлять:

получение указания по меньшей мере на часть данного поискового запроса от пользователя электронного устройства, соединенного с системой, причем указание по меньшей мере на часть данного поискового запроса обладает по меньшей мере частью по меньшей мере одного поискового термина;

выбор из базы данных поискового журнала, на основе указания, набора саджестов запроса в виде рекомендаций по завершению поискового запроса, которые связаны по меньшей мере с одним поисковым термином, причем каждый соответствующий саджест запроса из набора саджестов запроса связан с соответствующей частотой предыдущего использования, причем соответствующая частота находится на первой шкале;

получение из базы данных поискового журнала набора свежих кандидатов-саджестов поискового запроса, причем каждый соответствующий свежий кандидат-саджест поискового запроса представляет собой соответствующий недавний поисковый запрос, введенный соответствующим множеством пользователей в поисковую систему, причем соответствующий свежий кандидат-саджест поискового запроса связан с соответствующей частотой предыдущего использования, которая находится на второй шкале;

масштабирование каждой соответствующей частоты запроса на второй шкале для получения соответствующей связанной частоты запроса на первой шкале;

выбор набора свежих саджестов запросов из свежих кандидатов-саджестов поискового запроса в качестве рекомендаций по завершению поискового запроса на основе указания по меньшей мере на часть данного поискового запроса;

объединение набора саджестов запроса и набора свежих саджестов запроса для создания объединенного набора саджестов запроса и

создание по меньшей мере подмножества ранжированных саджестов запроса на основе объединенного набора саджестов запроса, причем данный саджест запроса из подмножества ранжированных саджестов запроса является одним из: свежим саджестом запроса или саджестом запроса и подмножество ранжированных саджестов запроса предназначено для отображения на электронном устройстве.

21. Система по п. 20, в которой:

по меньшей мере подмножество ранжированных саджестов запроса было создано из набора ранжированных саджестов запроса и

до этапа создания процессор также выполнен с возможностью осуществлять

ранжирование объединенного набора саджестов запроса на основе соответствующей связанной частоты на первой шкале для получения набора ранжированных саджестов запроса.

22. Система по п. 21, в которой:

база данных поискового журнала обладает множеством соответствующих недавних поисковых запросов и

до этапа получения процессор также выполнен с возможностью осуществлять

выбор каждого соответствующего свежего саджеста-кандидата запроса из набора свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов на основе соответствующей связанной частоты на второй шкале, которая находится выше заранее определенного порога частоты.

23. Система по п. 22, в которой:

выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее включает в себя:

вычисление для каждого из соответствующих свежих саджестов-кандидатов запроса, обладающего связанной соответствующей частотой на второй шкале выше заранее определенного порога частоты, соответствующего параметра пользовательского взаимодействия, который указывает на предыдущие пользовательские взаимодействия по меньшей мере с одним недавним поисковым результатом, полученным в ответ на соответствующий недавний поисковый запрос; и

выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее основан на соответствующем параметре пользовательского взаимодействия, находящегося выше заранее определенного порога пользовательского взаимодействия.

24. Система по п. 23, в которой:

выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее включает в себя:

вычисление для каждого из соответствующих свежих саджестов-кандидатов запроса, обладающего связанной соответствующей частотой на второй шкале выше заранее определенного порога частоты, соответствующего параметра пользовательского намерения, который указывает на вероятность того, что соответствующий недавний поисковый запрос является частью заранее определенной области поиска; и

выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее основан на соответствующем параметре пользовательского намерения, находящегося выше заранее определенного порога параметра пользовательского намерения.

25. Система по п. 24, в которой масштабирование каждой соответствующей частоты запроса на второй шкале для получения соответствующей связанной частоты запроса на первой шкале основано на:

средней частоте поисковых запросов, введенных пользователями в поисковую систему на текущий день;

средней частоте поисковых запросов, введенных пользователями в поисковую систему за данный период; и

количестве дней в текущем месяце.

26. Система по п. 25, в которой выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее основан на доменном имени, связанном с каждым из множества недавних запросов в базе данных поискового журнала.

27. Система по п. 25, в которой выбор каждого из соответствующих свежих саджестов-кандидатов запроса из множества соответствующих недавних поисковых запросов далее основан на поисковых терминах соответствующего недавнего поискового запроса, не являющегося частью недопустимого списка поисковых терминов.

28. Система по п. 27, в которой соответствующий параметр пользовательских взаимодействий представляет собой кликабельность (CTR).

29. Система по п. 28, в которой показатель CTR вычисляется на основе только свежих результатов.

30. Система по п. 29, в которой данный свежий саджест-кандидат выбирается только в ответ на то, что показатель CTR, который основан на свежих результатах, находится выше заранее определенного порога.

31. Система по п. 30, в которой заранее определенная область поиска является доменом вертикального поиска.

32. Система по п. 20, в которой процессор далее выполнен с возможностью, до этапа масштабирования, осуществлять:

получение из базы данных поискового журнала указания на свежий документ, причем получение основано на:

ресурсе, связанном с указанием на свежий документ, и

временной отметке, связанной с указанием на свежий документ;

парсинг указания на свежий документ для получения заголовка свежего документа;

извлечение набора поисковых результатов, связанного с заголовком свежего документа;

получение из базы данных поискового журнала, для каждого соответствующего поискового результата из набора поисковых результатов, связанных с заголовком свежего документа, по меньшей мере одного соответствующего поискового запроса, который был использован по меньшей мере одним пользователем для получения доступа к соответствующему поисковому результату, причем по меньшей мере один соответствующий поисковый запрос связан с соответствующим поисковым результатом;

определение для каждого из по меньшей мере одного соответствующего поискового запроса, связанного с каждым из соответствующих поисковых результатов, соответствующей оценки релевантности, которая основана на указании на свежий документ; и

добавление по меньшей мере одного соответствующего поискового запроса к набору свежих саджестов-кандидатов поискового запроса на основе оценки релевантности.

33. Система по п. 32, в которой результат проверки вычисляется на основе

ресурса, связанного с указанием на свежий документ, который является заранее определенным ресурсом из списка заранее определенных ресурсов.

34. Система по п. 33, в которой результат проверки вычисляется на основе:

временной отметки, связанной с указанием на свежий документ, который находится в заранее определенном временном интервале.

35. Система по п. 34, в которой добавление по меньшей мере одного соответствующего поискового запроса к набору свежих саджестов-кандидатов поискового запроса далее основано на

соответствующей оценке релевантности, которая находится выше заранее определенного порога оценки.

36. Система по п. 35, в которой:

по меньшей мере один соответствующий поисковый запрос включает в себя по меньшей мере один соответствующий поисковый термин и

определение соответствующей оценки релевантности далее основано по меньшей мере на одном соответствующем поисковом термине.

37. Система по п. 36, в которой набор поисковых результатов, который связан с заголовком свежего документа, обладает заранее определенным числом поисковых результатов.

38. Система по п. 37, в которой соответствующая оценка релевантности вычисляется алгоритмом ранжирования поисковой системы.



 

Похожие патенты:

Изобретение относится к цифровой схемотехнике, автоматике и промышленной электронике. Технический результат: упрощение триггерного синхронного R-S триггера.

Изобретение относится к медицине, а именно к прогнозированию степени тяжести ишемического процесса сердца, головного мозга и нижних конечностей на основании оценки центральной и регионарной гемодинамики органов.

Группа изобретений относится к медицине, а именно к рентенологическим процедурам, и может быть использована для предупреждения медицинского специалиста об отсутствии информации в медицинском отчете.

Изобретение относится к системе и способам извлечения информации из текстов на естественном языке. Техническим результатом является повышение эффективности и качества извлечения информации из текстов на естественном языке.

Изобретение относится к средствам выборки и представления запросов. Технический результат заключается в уменьшении времени выполнения запроса.

Изобретение относится к области обработки структурированных массивов данных (СМД), содержащих текст на естественном языке. Техническим результатом является повышение точности поиска в структурированном массиве данных.

Изобретение относится к устройству автоматизированной оценки реализуемости боевой задачи группировки ракетных комплексов. Технический результат заключается в повышении точности результата оценки реализуемой боевой задачи группировки ракетных комплексов.

Изобретение относится к области вычислительной техники. Технический результат заключается в обеспечении конфиденциальности профиля пользователя.

Группа изобретений раскрывает средства для обмена информацией между мобильным терминалом и внутренними серверами. Технический результат - создание средств использования штрих-кода и предоставления услуг, соответствующих двумерным кодам.

Изобретение относится к области вычислительной техники для управления большими объемами данных. Технический результат заключается в повышении эффективности хранения больших объемов данных за счет применения распределенной архитектуры хранения с обеспечением обработки входных данных с целью их унификации.

Изобретение относится к вычислительной технике. Технический результат – обеспечение автоматической классификации формализованных текстовых документов и авторизованных пользователей системы электронного документооборота по меткам конфиденциальности.

Изобретение относится к области вычислительной техники. Техническим результатом является обеспечение защиты информации в облачных вычислениях.

Изобретение относится к способу распараллеливания программ в среде логического программирования. Технический результат заключается в обеспечении распараллеливания задач (алгоритмов) логического программирования, которые не обладают списочным гомоморфизмом.

Изобретение относится к средствам выборки и представления запросов. Технический результат заключается в уменьшении времени выполнения запроса.

Изобретение относится к фильтрам поискового запроса. Технический результат – повышение эффективности предоставления фильтров поискового запроса.

Изобретение относится к увеличению скорости загрузки страницы. Технический результат – увеличение скорости загрузки страницы.

Изобретение относится к области обработки структурированных массивов данных (СМД), содержащих текст на естественном языке. Техническим результатом является повышение точности поиска в структурированном массиве данных.

Изобретение относится к способам управления данными веб-сайта. Технический результат - скорость повышения обработки и управления данными веб-сайта.

Изобретение относится к аутентификации спутниковых радионавигационных сигналов. Технический результат – обеспечение возможности аутентификации радионавигационных сигналов с оптимальным уровнем устойчивости и доступности.

Изобретение относится к технологиям работы кредитных бюро, а именно к проверке данных онлайн пользователей на корректность. Технический результат – повышение эффективности проверки прав онлайн пользователей на доступ к ресурсам.

Изобретение относится к области вычислительной техники. Техническим результатом является формирование алгоритма машинного обучения, использующего модель дерева решений и предназначенного для классификации объектов, обладающих значением категориального фактора, которое преобразуется в его числовое представление. Раскрыт способ преобразования в числовое представление значения категориального фактора, который связан с обучающим объектом для обучения алгоритма машинного обучения (MLA), причем MLA использует модель, основанную на дереве решений, обладающую деревом решений, причем обучающий объект обрабатывается на узле данного уровня дерева решений, причем дерево решений обладает по меньшей мере одним предыдущим уровнем дерева решений, причем на по меньшей мере одном предыдущем уровне значение по меньшей мере одного категориального фактора преобразовано в свое предыдущее числовое представление для по меньшей мере одного предыдущего уровня дерева решений, причем алгоритм машинного обучения выполняется электронным устройством для прогнозирования объекта фазы использования, способ включает в себя: получение доступа со стороны постоянного машиночитаемого носителя системы машинного обучения к набору обучающих объектов, причем каждый обучающий объект из набора обучающих объектов содержит документ и индикатор события, связанный с документом, причем каждый документ связан с категориальным фактором; создание числового представления для значения категориального фактора путем извлечения предыдущего числового представления по меньшей мере одного значения категориального фактора для данного объекта из набора обучающих объектов на по меньшей мере одном предыдущем уровне дерева решений; создания, для каждой комбинации из по меньшей мере одного предыдущего значения категориального фактора на по меньшей мере одном предыдущем уровне дерева решений и по меньшей мере некоторых значений категориальных факторов из набора обучающих объектов, текущего числового представления для данного уровня дерева решений, создание осуществляется в процессе создания дерева решений. 4 н. и 38 з.п. ф-лы, 14 ил.
Наверх