Способ и устройство для сохранения данных

Изобретение относится к области сохранения данных. Техническим результатом является уменьшение требуемого пространства для хранения данных за счет предотвращения избыточности сохранения данных. В способе сохранения данных данные, относящиеся к объекту и ассоциированные с объектами, получают из веб-страницы. Данные, относящиеся к объекту, содержат данные объекта, данные атрибутов объекта и данные взаимосвязей между объектами. Данные объекта и соответствующие данные атрибутов объекта сохраняются в базу данных объектов ассоциированным образом. Данные взаимосвязей между объектами сохраняются в базу данных взаимосвязей. Данные объекта, ассоциированные с одиночным объектом, и данные его атрибутов совместно сохраняются в базе данных объектов, и данные взаимосвязей между объектами, используемые двумя объектами, сохраняются раздельно в базе данных взаимосвязей. 4 н. и 11 з.п. ф-лы, 11 ил.

 

Испрашивает право по приоритету патентной заявки Китая, озаглавленной "Method and Device for Storing Data", поданной Патентным ведомством Китая 13 февраля, 2015, с заявкой № 201510083879.5, которая включена в настоящий документ посредством ссылки в полном объеме.

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Настоящее изобретение относится к области Интернета, и особенно к способу и устройству для сохранения данных.

УРОВЕНЬ ТЕХНИКИ

В настоящее время, при веб-поиске и запросе, слова запроса от пользователя могут затронуть большое количество уточняющих намерений, что не может быть удовлетворено посредством гранулярности веб-страницы, но ответ должен быть возвращен непосредственно в поиске. Например, если ищут "Рост Dehua Liu", ожидается, что вернется "174 см"; если ищут "звезды, чей рост более, чем 180 см", ожидаемым результатом, который должен быть возвращен, является список звезд, чей рост находится в пределах точно определенного диапазона, как например "Juji Gu, Shaoqiu Zheng"; и если ищут "Восемь великих писателей династий Тан и Сун", ожидается, что вернется "Zongyuan Liu" и другие.

Однако, в обыкновенных поисковых продуктах, в качестве результатов поиска возвращаются ссылки веб-страниц посредством сравнения степени совпадения текста между словами запроса от пользователя и включенными в веб-страницы, и для гарантирования того, что возвращенные результаты удовлетворяют поисковое намерение пользователя, используется алгоритм корреляции. Однако, пользователь может получить желаемый ответ только посредством соединения с найденными веб-страницами и их прочтения.

Вследствие этого, есть необходимость в способе и устройстве для сохранения данных, которые не только сберегают пространство сохранения, но также являются подходящими для запроса.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

Техническая проблема, которая должна быть решена настоящим изобретением, состоит в предоставлении способа и устройства для сохранения данных, которые не только сберегают пространство сохранения, но также являются подходящими для запроса.

Согласно одному аспекту настоящего изобретения, предусматривается способ сохранения данных, содержащий этапы:

получения, из веб-страницы, данных, относящихся к объекту, ассоциированных с объектами, причем данные, относящиеся к объекту, содержат данные объекта, представляющие объекты, данные атрибутов объекта, описывающие атрибуты объектов, и данные взаимосвязей между объектами, описывающие взаимосвязь между двумя объектами;

сохранение данных объекта и соответствующих данных атрибутов объекта в базу данных объектов ассоциированным образом; и

сохранение данных взаимосвязей между объектами в базу данных взаимосвязей.

Соответственно, данные объекта и данные атрибутов объекта сохраняются совместно в базе данных объектов, и данные взаимосвязей между объектами сохраняются раздельно в базе данных взаимосвязей. Этот способ сохранения данных предотвращает избыточность сохранения данных и агрегацию запросов, сберегает пространство хранения и является удобным для запроса. Более того, поле данных объекта может соответствовать одному или более объектам с полями переменных атрибутов, так что информация данных атрибутов об одном и том же объекте объединяется и сохраняется, таким образом предотвращая проблему, что большое количество информации атрибутов должно быть агрегировано во время онлайн-запроса, также не требуя большого количества операций фильтрации и комбинации и нарезки данных для возвращенных результатов запроса, тем самым значительно сберегая время запроса, и дополнительно улучшая пользовательское восприятие.

Предпочтительно, запись для одного объекта в базе данных объектов может содержать поле данных объекта и одно или более полей переменных атрибутов, ассоциированных с полем данных объекта, при этом данные объекта сохраняются в поле данных объекта, и данные атрибутов объекта сохраняются в поле переменного атрибута.

Предпочтительно, каждая запись в базе данных взаимосвязей может содержать два узла и дополнительную информацию, при этом две порции данных объекта, соответственно представляющие два объекта, соответственно сохраняются в двух узлах, и данные взаимосвязей между объектами, представляющие взаимосвязь между двумя объектами, сохраняются в дополнительной информации.

Предпочтительно, запись для одного объекта в базе данных объектов может дополнительно содержать поле метаинформации.

Данные, относящиеся к объекту, могут дополнительно содержать метаинформацию, релевантную для объекта, и метаинформация является информацией, которая отличает объект от других.

Способ может дополнительно содержать этап: сохранения метаинформации в поле метаинформации в записи для объекта в базе данных объектов.

Таким образом, в качестве базовых данных информации в данных объекта, метаинформация различает разные объекты и данные объекта, особенно разные объекты с одинаковым именем объекта, так что информация, относящаяся к объекту, может быть точно получена при последующем поиске для объекта.

Предпочтительно, данные, относящиеся к объекту, могут дополнительно содержать данные категории объекта, описывающие категорию объекта. Способ может дополнительно содержать этап: сохранения метки категории, соответствующей данным категории объекта, в поле метаинформации в записи для объекта в базе данных объектов, как части контента, хранящегося в поле метаинформации.

Многочисленные порции данных категории объекта и многочисленные метки категорий соответственно сохраняются в базе данных категорий, многочисленные порции данных категории объекта разделяются на множество уровней, и данные категории объекта с более низким уровнем подчиняются данным категории объекта с более высоким уровнем, ассоциированным с ними.

Таким образом, данные категории объекта сохраняются на разных уровнях, так что данные, относящиеся к объекту, имеют гибкую структуру сохранения и четкую классификацию.

Предпочтительно, в базе данных категорий, атрибут, относящийся к категории объекта, заданный для категории объекта, представленной данными категории каждого объекта, может быть сохранен ассоциированным образом с данными категории объекта.

Этап получения данных атрибутов объекта может содержать:

получение из базы данных категорий атрибута, относящегося к категории объекта, заданного для категории объекта, к которому принадлежит объект; и

получение из веб-страницы данных атрибутов объекта, описывающих атрибут, относящийся к категории объекта.

Таким образом, данные атрибутов объекта могут быть получены адресно, согласно категории объекта, способствуя ответу на последующую адресную операцию запроса. При получении данных атрибутов объекта, для конкретного объекта, данные атрибутов объекта могут быть получены адресно, согласно категории, к которой принадлежит объект, без необходимости рассматривания несвязанных данных атрибутов объекта. Например, национально-территориальная зона не будет получена для актера.

Предпочтительно, данные, относящиеся к объекту, для одного и того же объекта, полученные из множества веб-страниц, могут быть объединены вместе; и/или

полученные данные, относящиеся к объекту, могут быть преобразованы в данные, относящиеся к объекту, представленные в стандартной форме.

Таким образом, полученные данные, релевантные одному и тому же объекту, сортируются, и данные, относящиеся к объекту, представленные в разных формах, нормализуются, предотвращая проблему избыточности сохранения.

Предпочтительно, когда множество порций данных атрибутов объекта, полученных для одного и того же атрибута объекта для одного и того же объекта, отличаются, данные атрибутов объекта с более высокой достоверностью могут быть удержаны, и данные атрибутов объекта с более низкой достоверностью могут быть удалены.

Таким образом, может быть гарантирована надежность и точность сохраненных данных атрибутов объекта.

Согласно другому аспекту настоящего изобретения, предусматривается устройство для сохранения данных, содержащее:

средство получения данных, выполненное с возможностью получения, из веб-страницы, данных, относящихся к объекту, ассоциированных с объектами, причем средство получения данных содержит:

средство получения данных объекта, выполненное с возможностью получения данных объекта, представляющих объекты из веб-страницы;

средство получения данных атрибутов, выполненное с возможностью получения данных атрибутов объекта, описывающих объекты из веб-страницы; и

средство получения данных взаимосвязей, выполненное с возможностью получения, из веб-страницы, данных взаимосвязей между объектами, описывающих взаимосвязь между двумя объектами;

средство сохранения базы данных объектов, выполненное с возможностью сохранения данных объекта и соответствующих данных атрибутов объекта в базу данных объектов ассоциированным образом; и

средство сохранения базы данных взаимосвязей, выполненное с возможностью сохранения данных взаимосвязей между объектами в базу данных взаимосвязей.

Предпочтительно, запись для одного объекта в базе данных объектов может содержать поле данных объекта и одно или более полей переменных атрибутов, ассоциированных с полем данных объекта, и средство сохранения базы данных объектов может содержать:

средство сохранения данных объекта, выполненное с возможностью сохранения данных объекта в поле данных объекта; и

средство сохранения данных атрибутов, выполненное с возможностью сохранения данных атрибутов объекта в поле переменного атрибута.

Предпочтительно, каждая запись в базе данных взаимосвязей может содержать два узла и дополнительную информацию, при этом две порции данных объекта, соответственно представляющие два объекта, соответственно сохраняются в двух узлах, и данные взаимосвязей между объектами, представляющие взаимосвязь между двумя объектами, сохраняются в дополнительной информации.

Предпочтительно, запись для одного объекта в базе данных объектов может дополнительно содержать поле метаинформации.

Средство получения данных может дополнительно содержать средство получения метаинформации, выполненное с возможностью получения, из веб-страницы, метаинформации, релевантной объекту, и метаинформация является информацией, которая отличает объект от других; и

средство сохранения базы данных объектов может дополнительно содержать средство сохранения метаинформации, выполненное с возможностью сохранения метаинформации в поле метаинформации в записи для объекта в базе данных объектов.

Предпочтительно, средство получения данных может дополнительно содержать средство получения данных категории, выполненное с возможностью получения данных категории объекта, описывающих категорию объекта из веб-страницы.

Средство сохранения метаинформации может содержать средство сохранения данных категории, выполненное с возможностью сохранения метки категории, соответствующей данным категории объекта, в поле метаинформации в записи для объекта в базе данных объектов, как части контента, сохраненной в поле метаинформации.

Многочисленные порции данных категории объекта и многочисленные метки категорий могут быть соответственно сохранены в базе данных категорий, многочисленные порции данных категории объекта разделяются на множество уровней, и данные категории объекта с более низким уровнем подчиняются данным категории объекта с более высоким уровнем, ассоциированным с ними.

Предпочтительно, в базе данных категорий, атрибут, относящийся к категории объекта, заданный для категории объекта, представленной данными категории каждого объекта, может быть сохранен ассоциированным образом с данными категории объекта.

Средство получения данных атрибутов может содержать:

средство выборки атрибутов объекта, выполненное с возможностью получения из базы данных категорий атрибута, относящегося к категории объекта, заданного для категории объекта, к которому принадлежит объект; и

средство получения данных атрибутов объекта, выполненное с возможностью получения, из веб-страницы, данных атрибутов объекта, описывающих атрибут, относящийся к категории объекта.

Таким образом, при получении данных атрибутов объекта, для конкретного объекта, данные атрибутов объекта могут быть получены адресно, согласно категории, к которой принадлежит объект, без необходимости рассматривания несвязанных данных атрибутов объекта. Например, национально-территориальная зона не будет получена указывающей на актера.

Посредством способа и устройства согласно настоящему изобретению, данные объекта и данные атрибутов объекта сохраняются совместно в базе данных объектов, и данные взаимосвязей между объектами сохраняются раздельно в базе данных взаимосвязей. Этот способ сохранения данных предотвращает избыточность сохранения данных и агрегацию запросов, сберегает пространство хранения и является удобным для запроса.

Более того, поле данных объекта может соответствовать одному или более объектам с полями переменных атрибутов, так что информация данных атрибутов об одном и том же объекте объединяется, таким образом предотвращая проблему, что большое количество информации атрибутов должно быть агрегировано во время онлайн-запроса, также не требуя большого количества операций фильтрации и комбинации и нарезки данных для возвращенных результатов запроса, тем самым значительно сберегая время запроса, и дополнительно улучшая пользовательское восприятие.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Примерные варианты осуществления настоящего раскрытия описаны более подробно совместно с приложенными чертежами, и вышеупомянутые и другие цели, признаки и преимущества настоящего раскрытия станут более понятными. В примерных вариантах осуществления настоящего раскрытия, одинаковые ссылочные номера представляют одинаковые компоненты.

Фигура 1 является принципиальной схемой последовательности операций способа сохранения данных согласно варианту осуществления настоящего изобретения.

Фигура 2 является принципиальной схемой последовательности операций способа сохранения данных согласно улучшенному варианту осуществления настоящего изобретения.

Фигура 3 является принципиальной схемой последовательности операций способа сохранения данных согласно другому улучшенному варианту осуществления настоящего изобретения.

Фигура 4 является принципиальной схемой последовательности операций примерного способа получения данных атрибутов объекта, который может быть использован в настоящем изобретении.

Фигура 5 является подэтапом, который может быть включен в этап S100 по Фигуре 1.

Фигура 6 является принципиальной блок-схемой устройства для сохранения данных согласно варианту осуществления настоящего изобретения.

Фигура 7 является принципиальной блок-схемой средства получения данных устройства для сохранения данных согласно улучшенному варианту осуществления настоящего изобретения.

Фигура 8 является принципиальной блок-схемой средства сохранения базы данных устройства для сохранения данных согласно улучшенному варианту осуществления настоящего изобретения.

Фигура 9 является принципиальной блок-схемой средства получения данных устройства для сохранения данных согласно другому улучшенному варианту осуществления настоящего изобретения.

Фигура 10 является принципиальной блок-схемой средства сохранения базы данных устройства для сохранения данных согласно другому улучшенному варианту осуществления настоящего изобретения.

Фигура 11 является принципиальной блок-схемой средства получения данных атрибутов устройства для сохранения данных на Фигуре 1.

ПОДРОБНОЕ ОПИСАНИЕ

Предпочтительные варианты осуществления настоящего раскрытия описываются более подробно ниже со ссылкой на прилагаемые чертежи. Хотя предпочтительные варианты осуществления настоящего раскрытия представлены на чертежах, следует понимать, что настоящее раскрытие может быть реализовано в различных формах и не должно ограничиваться вариантами осуществления, изложенными в настоящем документе. И наоборот, эти варианты осуществления предусмотрены для того, чтобы сделать настоящее раскрытие более исчерпывающим и завершенным, и чтобы полностью передать объем настоящего раскрытия специалисту в данной области техники.

Фигура 1 является принципиальной схемой последовательности операций способа сохранения данных согласно варианту осуществления настоящего изобретения.

Сначала, на этапе S100, из веб-страницы получают данные, относящиеся к объекту, ассоциированные с объектами, при этом данные, относящиеся к объекту, могут содержать по меньшей мере данные объекта, представляющие объекты, данные атрибутов объекта, описывающие атрибуты объектов, и данные взаимосвязей между объектами, описывающие взаимосвязь между двумя объектами.

Данные объекта и данные атрибутов объекта могут быть получены посредством извлечения согласно шаблону веб-страницы, и данные взаимосвязей между объектами могут быть получены посредством добычи ссылок между страницами.

На этапе S200, сохраняются данные объекта и соответствующие данные атрибутов объекта, полученные на этапе S100. Данные объекта и соответствующие данные атрибутов объекта сохраняются в базу данных объектов ассоциированным образом; и запись для одного объекта в базе данных объектов содержит поле данных объекта и одно или более полей переменных атрибутов, ассоциированных с полем данных объекта, при этом данные объекта сохраняются в поле данных объекта, и данные атрибутов объекта сохраняются в поле переменного атрибута.

Таким образом, поле данных объекта сохраняется в отношении одного или более полей переменных атрибутов, ассоциированных с вышеупомянутым полем данных объекта, так что информация данных атрибутов об одном и том же объекте объединяется и сохраняется, таким образом предотвращая проблему, что большое количество информации атрибутов должно быть агрегировано во время онлайн-запроса, также не требуя большого количества операций фильтрации и комбинации и нарезки данных для возвращенных результатов запроса, тем самым значительно сберегая время запроса, и дополнительно улучшая пользовательское восприятие.

Например, Dehua Liu является одной порцией данных объекта, тогда и рост Dehua Liu, и возраст Dehua Liu являются данными атрибутов объекта, ассоциированными с этим объектом; и таким образом данные атрибутов объекта, ассоциированные с одним и тем же объектом, могут быть скомбинированы, объединены и сохранены.

На этапе S300, данные взаимосвязей между объектами, полученные на этапе S100, сохраняются в базу данных взаимосвязей. Каждая запись в базе данных взаимосвязей содержит два узла и дополнительную информацию, при этом две порции данных объекта, соответственно представляющие два объекта, соответственно сохраняются в двух узлах, и данные взаимосвязей между объектами, представляющие взаимосвязь между двумя объектами, сохраняются в дополнительной информации. В некоторых вариантах осуществления, два узла могут быть разделены на узел входа и узел выхода, в которых сохраняются объект A и объект B соответственно. В этот раз, данные направленных взаимосвязей сохраняются в дополнительной информации.

Таким образом, данные взаимосвязей между объектами сохраняются в базе данных взаимосвязей, отличной от базы данных объектов для хранения данных объекта и данных, относящихся к объекту. Этот способ сохранения данных предотвращает избыточность сохранения данных и агрегацию запросов и сберегает пространство хранения.

Кроме того, база данных взаимосвязей может состоять из двух узлов и дополнительной информации, и может дополнительно создавать индексы для двух узлов и дополнительной информации соответственно, для того, чтобы улучшить эффективность запроса.

Например, материалы о Dehua Liu и Liqian Zhu получают из веб-страницы, и по внешней ссылке извлекается, что они находятся в брачных отношениях, при этом данные роста и веса извлечены из материала Dehua Liu, и данные о дате рождения и национальности извлечены из материала Liqian Zhu, теперь способ сохранения данных, относящихся к объекту, ассоциированных с двумя объектами, является таким как следует ниже:

Прежде всего, объект Dehua Liu и данные роста и веса сохраняются в базе данных объектов, и данные объекта Dehua Liu сохраняются в поле данных объекта, и информация роста "174 см" и веса "68 кг" для Dehua Liu соответственно сохраняется в поле 1 переменного атрибута и поле 2 переменного атрибута, ассоциированных с вышеупомянутым полем данных объекта.

Во-вторых, объект Liqian Zhu и дата рождения и данные национальности сохраняются в базе данных объектов, и данные объекта Liqian Zhu сохраняются в поле данных объекта, и дата рождения "6 апреля 1966" и национальность "малазиец" для Liqian Zhu соответственно сохраняются в поле 1 переменного атрибута и поле 2 переменного атрибута, ассоциированных с полем данных объекта.

Более того, взаимосвязь между Dehua Liu и Liqian Zhu сохраняется в базе данных взаимосвязей; если Dehua Liu и Liqian Zhu находятся в брачных отношениях, то данные объекта Dehua Liu сохраняются в узле 1 базы данных взаимосвязей, и данные объекта Liqian Zhu сохраняются в узле 2 базы данных взаимосвязей; и "брачные" отношения между этими двумя сохраняются в дополнительной информации о двух объектах.

Соответственно, посредством этапов S100 - S300, данные объекта и данные атрибутов объекта сохраняются совместно в базе данных объектов, и данные взаимосвязей между объектами сохраняются раздельно в базе данных взаимосвязей. Этот способ сохранения данных предотвращает избыточность сохранения данных и агрегацию запросов, сберегает пространство хранения и является удобным для запроса.

Фигура 2 является принципиальной схемой последовательности операций, показывающей способ сохранения данных по улучшенному варианту осуществления.

До этапа S200, способ сохранения данных может дополнительно содержать этап S001; при этом

на этапе S001, запись для одного объекта в базе данных объектов может дополнительно содержать поле метаинформации.

Данные, относящиеся к объекту, могут дополнительно содержать метаинформацию, релевантную для объекта, и метаинформация является информацией, которая отличает объект от других.

Таким образом, способ может дополнительно содержать этап:

сохранения метаинформации в поле метаинформации в записи для объекта в базе данных объектов.

Здесь, полученные разные объекты можно различить посредством метаинформации. Например, многие порции информации, относящейся к объекту, об объектах с именем "Dehua Liu" могут быть получены из веб-страниц в одно время; однако, включаются разные объекты, кто-то является актером Dehua Liu, и также есть доктор или учитель с именем Dehua Liu, и т.д. Из этого может видно, что объекты с одинаковым именем объекта могут иметь разные данные объекта. Разные объекты можно различить посредством содержащегося поля метаинформации.

Фигура 3 является принципиальной схемой последовательности операций, показывающей способ сохранения данных по другому улучшенному варианту осуществления.

Данные, относящиеся к объекту, могут дополнительно содержать данные категории объекта, описывающие категорию объекта.

Таким образом, способ может дополнительно содержать этап:

сохранения метки категории, соответствующей данным категории объекта, в поле метаинформации в записи для объекта в базе данных объектов, как части контента, хранящегося в поле метаинформации.

Многочисленные порции данных категории объекта и многочисленные метки категорий соответственно сохраняются в базе данных категорий, многочисленные порции данных категории объекта разделяются на множество уровней, и данные категории объекта с более низким уровнем подчиняются данным категории объекта с более высоким уровнем, ассоциированным с ними.

Здесь, метка категории, соответствующая данным, представляющим категорию объекта, сохраняется в поле метаинформации; и данные категории объекта могут быть определены посредством разных меток категорий в разных полях метаинформации. В дополнение, с помощью данных категории объекта, классифицирующих объекты, достигаются гибкая структура сохранения и четкая классификация, таким образом способствуя последующему поиску по квалификациям.

К тому же, данные категории объекта разделяются на множество уровней, и данные категории объекта с более низким уровнем подчиняются данным категории объекта с более высоким уровнем, ассоциированным с ними. Например, когда категорией объекта является актер, то ее гиперонимом, а именно категорией более высокого уровня, является артист, и гипонимом, а именно категорией более низкого уровня, может быть киноактер, актер оперы, и т.д. Подробная многоуровневая классификация делает формат сохранения данных более четким, и разделение структуры сохранения более детализировано, так что последующий точный поиск является более удобным.

Вышеупомянутые этапы S200, S300, S001 и S002 не должны иметь конкретный порядок; и следует понимать, что эти этапы могут быть осуществлены одновременно, и могут также выборочно проводиться без последовательного порядка.

Фигура 4 является принципиальной схемой последовательности операций, показывающей примерный способ для получения данных атрибутов объекта, который может быть использован в настоящем изобретении.

В базе данных категорий, атрибут, относящийся к категории объекта, заданный для категории объекта, представленной данными категории каждого объекта, сохраняется ассоциированным образом с данными категории объекта.

Данные атрибутов объекта могут быть получены посредством нижеследующих этапов.

Сначала, на этапе S410, из базы данных категорий получают атрибут, относящийся к категории объекта, заданный для категории объекта, к которому принадлежит объект.

Далее, на этапе S420, из веб-страницы получают данные атрибутов объекта, описывающие атрибут, относящийся к категории объекта.

Таким образом, атрибут, относящийся к категории объекта, ассоциированный с категорией объекта, к которому принадлежит объект, может быть сначала определен из базы данных категорий, и затем из веб-страницы получают данные атрибутов объекта, описывающие атрибут, относящийся к категории объекта. Посредством получения разных данных атрибутов объекта согласно разным категориям объектов, a могут быть осуществлены дискриминантное получение и сохранение, способствуя последующему целевому избирательному поиску.

Например, категорией объекта, представленной одной порцией данных категории объекта в базе данных категорий, может быть актер, и несколько атрибутов, относящихся к типу объекта, ассоциированных с актером заданы для актера, такие как тип актера (телевизионный актер, киноактер, драматический актер и т.д.), пол, национальность и т.д. Соответственно, для объекта "актер", данные атрибутов объекта, такие как тип актера, пол и его национальность, могут быть получены из веб-страницы и сохранены.

В качестве другого примера, для категории объекта звезд спорта могут быть заданы атрибуты, относящиеся к категории объекта, такие как связанные виды спорта, пол и национальность. Соответственно, для объекта "звезды спорта", данные атрибутов объекта, относящиеся к связанным видам спорта, полу и национальности, могут быть получены из веб-страницы и сохранены.

В качестве другого примера, для категории объекта для стран могут быть заданы атрибуты, относящиеся к категории объекта, такие как континент (Азия, Европа, Америка, Африка, Океания), население и территориальная зона. Для объекта "страна", данные атрибутов объекта, относящиеся к континенту, населению и территориальной зоне, могут быть получены из веб-страницы и сохранены.

Таким образом, при получении данных атрибутов объекта, для конкретного объекта, данные атрибутов объекта могут быть получены адресно, согласно категории, к которой принадлежит объект, без необходимости рассматривания несвязанных данных атрибутов объекта. Например, национально-территориальная зона не будет получена указывающей на актера.

Фигура 5 показывает этапы, которые могут быть дополнительно могут быть включены в способ согласно настоящему изобретению.

Как показано на Фигуре 5, после получения, из веб-страницы, данных, относящихся к объекту, на этапе S100, могут быть выполнены этап S110 и/или этап S120 ниже.

На этапе S110, данные, относящиеся к объекту, для одного и того же объекта, полученные из множества веб-страниц, могут быть объединены вместе.

Здесь, данные, относящиеся к объекту, ассоциированные с одним и тем же объектом, полученные из нескольких веб-страниц, могут быть отсортированы и объединены в связанные данные того же объекта.

Во время конкретной реализации, данные, относящиеся к объекту, для одного и того же объекта, полученные из веб-страниц могут быть объединены; и посредством объединения данных, относящихся к объекту, полученных из разных веб-страниц в разное время, данные атрибутов объекта, соответствующие данным объекта, могут постоянно увеличиваться, это обычно называется "совмещение" в данной области техники. Например, данные атрибутов объекта для одного и того же объекта и сохраненные данные атрибутов объекта, соответствующие одному и тому же объекту, объединяются, и конкретный подход объединения может состоять в добавлении данных атрибутов объекта в поле переменного атрибута для сохранения данных атрибутов объекта, соответствующих данным объекта, или их комбинировании с данными атрибутов объекта в некотором поле переменного атрибута, соответствующем данным объекта, и их сохранении. Есть много конкретных подходов объединения, которые описаны один за одним в вариантах осуществления настоящего изобретения.

На этапе S120, полученные данные, относящиеся к объекту, могут быть преобразованы в данные, относящиеся к объекту, представленные в стандартной форме.

Например, данные, относящиеся к объекту, равным образом представлены на китайском и на английском или стандартизированы в единицах для унифицированной обработки. Таким образом, предотвращается проблема избыточности сохранения, вызванная одними и теми же данными, относящимися к объекту, для одного и того же объекта, занимающими пространства хранения; между тем, проблема нечеткой структуры сохранения, вызванная разными режимами выражения данных, относящихся к объекту, также предотвращается.

Предпочтительно, на этапах S110 и S120, когда многочисленные порции данных атрибутов объекта, полученных для одного и того же атрибута объекта одного и того же объекта, являются разными, удерживаются данные атрибутов объекта с более высокой достоверностью, и данные атрибутов объекта с более низкой достоверностью удаляются.

После этапов S110 и S120, могут быть осуществлены этап S001, S002, S200 или S300.

Таким образом, может быть гарантирована надежность и точность сохраненных данных атрибутов объекта.

Способ сохранения данных описан более подробно выше со ссылкой на Фигуры 1-5. Устройство для сохранения данных описано ниже со ссылкой на прилагаемые чертежи.

Число функциональных анализов устройства, описанного ниже, является таким же как число функциональных анализов соответствующих этапов способа, описанных выше со ссылкой на Фигуры 1-5. Чтобы избежать повторения, описание здесь фокусируется на структуре устройства, которой обеспечено устройство, и некоторые подробности могут больше не описываться, для чего может быть сделана ссылка на релевантное описание выше.

Фигура 6 является принципиальной блок-схемой устройства для сохранения данных согласно варианту осуществления настоящего изобретения.

Устройство для сохранения данных согласно настоящему изобретению содержит средство 100 получения данных, средство 200 сохранения базы данных объектов и средство 300 сохранения базы данных взаимосвязей.

Средство 100 получения, из веб-страницы, данных выполнено с возможностью получения, из веб-страницы, данных, относящихся к объекту, ассоциированных с объектами. Средство получения данных может содержать:

средство 101 получения данных объекта, выполненное с возможностью получения данных объекта, представляющих объекты из веб-страницы;

средство 102 получения данных атрибутов, выполненное с возможностью получения данных атрибутов объекта, описывающих объекты из веб-страницы; и

средство 103 получения данных взаимосвязей, выполненное с возможностью получения, из веб-страницы, данных взаимосвязей между объектами, описывающих взаимосвязь между двумя объектами.

Средство 200 сохранения базы данных объектов выполнено с возможностью сохранения данных объекта и соответствующих данных атрибутов объекта в базу данных объектов ассоциированным образом; и запись для одного объекта в базе данных объектов содержит поле данных объекта и одно или более полей переменных атрибутов, ассоциированных с полем данных объекта. Средство 200 сохранения базы данных объектов может содержать:

средство 201 сохранения данных объекта, выполненное с возможностью сохранения данных объекта в поле данных объекта; и

средство 202 сохранения данных атрибутов, выполненное с возможностью сохранения данных атрибутов объекта в поле переменного атрибута; и

Средство 300 сохранения базы данных взаимосвязей выполнено с возможностью сохранения взаимосвязи между объектами в базу данных взаимосвязей, при этом каждая запись в базе данных взаимосвязей содержит два узла и дополнительную информацию, две порции данных объекта, соответственно представляющие два объекта, соответственно сохраняются в двух узлах, и данные взаимосвязей между объектами, представляющие взаимосвязь между двумя объектами, сохраняются в дополнительной информации.

Таким образом, устройство может получить данные объекта из веб-страниц средством 101 получения данных объекта, получает данные атрибутов объекта из веб-страниц средством 102 получения данных атрибутов и получает данные взаимосвязей между объектами из веб-страниц средством 103 получения данных взаимосвязей; и затем сохраняет данные объекта в средство 201 сохранения данных объекта, сохраняет данные атрибутов в средство 202 сохранения данных атрибутов и раздельно сохраняет данные взаимосвязей между объектами в средство 300 сохранения базы данных взаимосвязей. Этот способ сохранения данных предотвращает избыточность сохранения данных и агрегацию запросов, сберегает пространство хранения и является удобным для запроса.

Фигуры 7 и 8 показывают принципиальные блок-схемы устройства получения базы данных и средства сохранения базы данных устройства для сохранения данных по улучшенному варианту осуществления.

Запись для одного объекта в базе данных объектов может дополнительно содержать поле метаинформации.

Средство 100 получения данных может дополнительно содержать средство 104 получения метаинформации, выполненное с возможностью получения, из веб-страницы, метаинформации, релевантной объекту, и метаинформация является информацией, которая отличает объект от других.

Средство 200 сохранения базы данных объектов может дополнительно содержать средство 203 сохранения метаинформации, выполненное с возможностью сохранения метаинформации в поле метаинформации в записи для объекта в базе данных объектов.

Таким образом, средство 104 получения метаинформации может различить разные данные объекта с одним и тем же именем объекта, и разные данные объекта с одним и тем же именем объекта могут быть сохранены дискриминантно посредством средства 203 сохранения метаинформации.

Фигуры 9 и 10 показывают принципиальные блок-схемы устройства получения базы данных и средства сохранения базы данных устройства для сохранения данных по другому улучшенному варианту осуществления.

Средство 100 получения данных может дополнительно содержать средство 105 получения данных категории, выполненное с возможностью получения данных категории объекта, описывающих категорию объекта из веб-страницы.

Средство 203 сохранения метаинформации может содержать средство сохранения данных категории для сохранения метки категории, соответствующей данным категории объекта, в поле метаинформации в записи для объекта в базе данных объектов, как части контента, сохраненной в поле метаинформации.

Многочисленные порции данных категории объекта и многочисленные метки категорий соответственно сохраняются в базе данных категорий, многочисленные порции данных категории объекта разделяются на множество уровней, и данные категории объекта с более низким уровнем подчиняются данным категории объекта с более высоким уровнем, ассоциированным с ними.

Таким образом, данные категории объекта для некоторой категории различают и получают на веб-страницах средством 105 получения данных категории, и затем соответствующие метки категорий с возможностью различения сохраняются в поле метаинформации посредством средства 204 сохранения данных категории, как часть контента, сохраненного в поле метаинформации.

Фигура 11 показывает принципиальную блок-схему средства получения данных атрибутов.

В базе данных категорий, атрибут объекта, заданный для категории объекта, представленной данными категории каждого объекта, может быть сохранен ассоциированным образом с данными категории объекта.

Средство 102 получения данных атрибутов может содержать:

средство 1021 выборки атрибутов объекта, выполненное с возможностью получения из базы данных категорий атрибута, относящегося к категории объекта, заданного для данных категории объекта, которым подчиняется объект; и

средство 1022 получения данных атрибутов объекта, выполненное с возможностью получения, из веб-страницы, данных атрибутов объекта, описывающих атрибут, относящийся к категории объекта.

Таким образом, атрибут, относящийся к категории объекта, ассоциированный с категорией объекта некоторого объекта, может быть определен из базы данных категорий средством 1021 выборки атрибутов объекта, и затем данные атрибутов объекта, описывающие атрибут, относящийся к категории объекта, получают из веб-страницы средством 1022 получения данных атрибутов объекта. Таким образом, при получении данных атрибутов объекта, для конкретного объекта, данные атрибутов объекта могут быть получены адресно, согласно категории, к которой принадлежит объект, без необходимости рассматривания несвязанных данных атрибутов объекта.

Способ и устройство для сохранения данных согласно настоящему изобретению теперь были описаны подробно.

Кроме того, способ согласно настоящему изобретению может также быть реализован как компьютерный программный продукт, который содержит компьютерно-читаемый носитель, на котором хранится компьютерная программа для выполнения вышеупомянутых функций, заданных в способе настоящего изобретения. Специалистам в данной области техники также следует понимать, что различные иллюстративные логические блоки, модули, схемы, и этапы алгоритмов, описанные применительно к настоящему изобретению в настоящем документе, могут быть реализованы в виде электронных аппаратных средств, компьютерного программного обеспечения или их комбинации.

Схемы последовательностей операций и блок-схемы на прилагаемых чертежах показали архитектуры, функции и операции, которые могут быть реализованы с помощью системы и способа согласно вариантам осуществления настоящего изобретения. На данный момент, каждый блок в схеме последовательности операций или блок-схемах может представлять модуль, сегмент программы или участок кода, и модуль, сегмент программы или участок кода содержит одну или более исполняемых инструкций для реализации точно определенных логических функций. Также следует отметить, что в некоторых альтернативных вариантах осуществления, функции, приведенные в блоках, могут также занимать место в порядке, отличном от порядка, приведенного на чертежах. Например, два последовательных блока на практике могут по существу выполняться параллельно, и они могут также быть выполнены в противоположном порядке, что зависит от используемых функций. Также следует отметить, что каждый блок в блок-схеме и/или схеме последовательности операций и комбинация блоков в блок-схеме и/или схеме последовательности операций, могут быть реализованы с помощью выделенной аппаратной системы для выполнения точно определенных функций или операций, или могут быть реализованы с помощью комбинации инструкций выделенных аппаратных средств и компьютера.

Выше были описаны различные варианты осуществления настоящего изобретения, и разъяснения являются примерными и неисчерпывающими, и настоящее изобретение не ограничивается различными раскрытыми вариантами осуществления. Многие изменения и модификации будут понятны специалисту в данной области техники без отступления от объема и сущности различных разъясненных вариантов осуществления. Выбор терминов, использованных в настоящем документе, предназначен для наилучшего разъяснения принципов различных вариантов осуществления, практических применений или улучшений способов на рынке, или для обеспечения специалисту в данной области техники возможности понимания различных вариантов осуществления, раскрытых в настоящем документе.

1. Способ сохранения данных, отличающийся применением к поиску в сети, содержащий этапы, на которых:

получают из веб-страницы данные, относящиеся к объекту, ассоциированные с объектами, причем данные, относящиеся к объекту, содержат данные объекта, представляющие объекты, данные атрибутов объекта, описывающие атрибуты объектов, и данные взаимосвязей между объектами, описывающие взаимосвязь между двумя объектами;

сохраняют данные объекта и соответствующие данные атрибутов объекта в базу данных объектов ассоциированным образом; и

сохраняют данные взаимосвязей между объектами в базу данных взаимосвязей;

при этом запись для одного объекта в базе данных объектов содержит поле данных объекта и множество полей переменных атрибутов, ассоциированных с полем данных объекта, данные объекта сохраняются в поле данных объекта, и данные атрибутов объекта сохраняются в поля переменных атрибутов.

2. Способ по п. 1, отличающийся тем, что

запись для одного объекта в базе данных объектов дополнительно содержит поле метаинформации;

данные, относящиеся к объекту, дополнительно содержат метаинформацию, релевантную для объекта, и метаинформация является информацией, которая отличает объект от других; и

способ дополнительно содержит этап, на котором:

сохраняют метаинформацию в поле метаинформации в записи для объекта в базе данных объектов.

3. Способ по п. 2, отличающийся тем, что

данные, относящиеся к объекту, дополнительно содержат данные категории объекта, описывающие категорию объекта;

способ дополнительно содержит этап, на котором:

сохраняют метку категории, соответствующую данным категории объекта, в поле метаинформации в записи для объекта в базе данных объектов, как часть контента, хранящегося в поле метаинформации;

при этом многочисленные порции данных категории объекта и многочисленные метки категорий соответственно сохраняются в базе данных категорий, многочисленные порции данных категории объекта разделяются на множество уровней, и данные категории объекта с более низким уровнем подчиняются данным категории объекта с более высоким уровнем, ассоциированным с ними.

4. Способ по п. 3, отличающийся тем, что

в базе данных категорий атрибут, относящийся к категории объекта, заданный для категории объекта, представленной данными категории каждого объекта, сохраняется ассоциированным образом с данными категории объекта;

этап, на котором получают данные атрибутов объекта, содержит:

получение из базы данных категорий атрибута, относящегося к категории объекта, заданного для категории объекта, к которому принадлежит объект; и

получение из веб-страницы данных атрибутов объекта, описывающих атрибут, относящийся к категории объекта.

5. Способ по п. 1, отличающийся дополнительным содержанием этапа, на котором объединяют вместе данные, относящиеся к объекту, для одного и того же объекта, полученные из множества веб-страниц.

6. Способ по п. 1, отличающийся дополнительным содержанием этапа, на котором преобразовывают полученные данные, относящиеся к объекту, в данные, относящиеся к объекту, представленные в стандартной форме.

7. Способ по п. 1, отличающийся дополнительным содержанием этапа, на котором удерживают данные атрибутов объекта с более высокой достоверностью и удаляют данные атрибутов объекта с более низкой достоверностью, когда многочисленные порции данных атрибутов объекта, полученные для одного и того же атрибута объекта одного и того же объекта, являются разными.

8. Способ по п. 1, отличающийся тем, что каждая запись в базе данных взаимосвязей содержит два узла и дополнительную информацию, при этом две порции данных объекта, соответственно представляющие два объекта, соответственно сохраняются в двух узлах, и данные взаимосвязей между объектами, представляющие взаимосвязь между двумя объектами, сохраняются в дополнительной информации.

9. Устройство для сохранения данных, отличающееся применением к поиску в сети, содержащее:

средство получения данных, выполненное с возможностью получения, из веб-страницы, данных, относящихся к объекту, ассоциированных с объектами, причем средство получения данных содержит:

средство получения данных объекта, выполненное с возможностью получения данных объекта, представляющих объекты из веб-страницы;

средство получения данных атрибутов, выполненное с возможностью получения данных атрибутов объекта, описывающих объекты из веб-страницы; и

средство получения данных взаимосвязей, выполненное с возможностью получения, из веб-страницы, данных взаимосвязей между объектами, описывающих взаимосвязь между двумя объектами;

средство сохранения базы данных объектов, выполненное с возможностью сохранения данных объекта и соответствующих данных атрибутов объекта в базу данных объектов ассоциированным образом; и

средство сохранения базы данных взаимосвязей, выполненное с возможностью сохранения данных взаимосвязей между объектами в базу данных взаимосвязей, при этом

запись для одного объекта в базе данных объектов содержит поле данных объекта и множество полей переменных атрибутов, ассоциированных с полем данных объекта, и средство сохранения базы данных объектов содержит средство сохранения данных объекта, выполненное с возможностью сохранения данных объекта в поле данных объекта, и средство сохранения данных атрибутов, выполненное с возможностью сохранения данных атрибутов объекта в поля переменных атрибутов.

10. Устройство по п. 9, отличающееся тем, что

запись для одного объекта в базе данных объектов дополнительно содержит поле метаинформации,

средство получения данных дополнительно содержит средство получения метаинформации, выполненное с возможностью получения, из веб-страницы, метаинформации, релевантной объекту, и метаинформация является информацией, которая отличает объект от других; и

средство сохранения базы данных объектов дополнительно содержит средство сохранения метаинформации, выполненное с возможностью сохранения метаинформации в поле метаинформации в записи для объекта в базе данных объектов.

11. Устройство по п. 10, отличающееся тем, что

средство получения данных дополнительно содержит средство получения данных категории, выполненное с возможностью получения данных категории объекта, описывающих категорию объекта из веб-страницы,

средство сохранения метаинформации содержит средство сохранения данных категории, выполненное с возможностью сохранения метки категории, соответствующей данным категории объекта, в поле метаинформации в записи для объекта в базе данных объектов, как части контента, сохраненной в поле метаинформации,

многочисленные порции данных категории объекта и многочисленные метки категорий соответственно сохраняются в базе данных категорий, многочисленные порции данных категории объекта разделяются на множество уровней, и данные категории объекта с более низким уровнем подчиняются данным категории объекта с более высоким уровнем, ассоциированным с ними.

12. Устройство по п. 11, отличающееся тем, что

в базе данных категорий атрибут, относящийся к категории объекта, заданный для категории объекта, представленной данными категории каждого объекта, сохраняется ассоциированным образом с данными категории объекта,

средство получения данных атрибутов содержит:

средство выборки атрибутов объекта, выполненное с возможностью получения из базы данных категорий атрибута, относящегося к категории объекта, заданного для категории объекта, к которому принадлежит объект; и

средство получения данных атрибутов объекта, выполненное с возможностью получения, из веб-страницы, данных атрибутов объекта, описывающих атрибут, относящийся к категории объекта.

13. Устройство по п. 9, отличающееся тем, что каждая запись в базе данных взаимосвязей содержит два узла и дополнительную информацию, при этом две порции данных объекта, соответственно представляющие два объекта, соответственно сохраняются в двух узлах, и данные взаимосвязей между объектами, представляющие взаимосвязь между двумя объектами, сохраняются в дополнительной информации.

14. Устройство хранения данных, отличающееся содержанием процессора, памяти, шины и интерфейса связи, при этом процессор, интерфейс связи и память соединены посредством шины;

память выполнена с возможностью сохранения программы; и

процессор выполнен с возможностью вызова программы, хранящейся в памяти, посредством шины, для того, чтобы выполнить способ, который заявлен в любом из пп. 1-8.

15. Компьютерно-читаемый носитель с энергонезависимым программным кодом, исполняемым процессором, отличающийся тем, что программный код предписывает процессору выполнить способ, который заявлен в любом из пп. 1-4.



 

Похожие патенты:

Изобретение относится к области информационных технологий, в частности к организации, хранению и извлечению данных из хранилищ данных, расположенных на носителях информации, которые предназначены для создания информационного обеспечения справочных, информационных и информационно-управляющих систем.
Изобретение относится к области хранения и обработки данных. Технический результат заключается в расширении функциональных возможностей хранения и обработки данных.
Изобретение относится к средствам получения панорамных изображений гистологических, цитологических и иммуноцитологических препаратов. Технический результат заключается в повышении качества цифровых снимков гистологических и цитологических препаратов.
Изобретение относится к способу и устройству для обработки данных действий пользователя. Технический результат заключается в автоматизации моделирования действий пользователя.

Изобретение относится к средствам обработки поискового запроса. Техническим результатом является персонализация агрегированных результатов поиска.

Изобретение относится к области видеонаблюдения, в частности к обработке видеоинформации с камер видеонаблюдения для отслеживания движущихся объектов в реальном времени или при просмотре архивного видео.

Группа изобретений относится к средствам моделирования. Технический результат – повышение качества и точности моделирования части неосесимметричной поверхности участка детали.

Изобретение относится к области связи, а именно к автоматической модерации сообщений. Технический результат – повышение эффективности автоматической модерации сообщений.

Изобретение относится к способу обучения определению области радиационной аварийной ситуации на основе смоделированной аварии. Технический результат – обеспечение способа обучения определению области радиационной аварии аналогично реальной радиационной аварийной ситуации.

Изобретение относится к средствам для визуализации и фильтрации больших объемов данных. Технический результат заключается в повышении эффективности анализа больших объемов данных и поиска объектов по критериям.

Изобретение относится к области информационных технологий, в частности к организации, хранению и извлечению данных из хранилищ данных, расположенных на носителях информации, которые предназначены для создания информационного обеспечения справочных, информационных и информационно-управляющих систем.

Изобретение относится к области информационных технологий, в частности к организации, хранению и извлечению данных из хранилищ данных, расположенных на носителях информации, которые предназначены для создания информационного обеспечения справочных, информационных и информационно-управляющих систем.
Изобретение относится к области хранения и обработки данных. Технический результат заключается в расширении функциональных возможностей хранения и обработки данных.
Изобретение относится к способу и устройству для обработки данных действий пользователя. Технический результат заключается в автоматизации моделирования действий пользователя.
Изобретение относится к способу и устройству для обработки данных действий пользователя. Технический результат заключается в автоматизации моделирования действий пользователя.

Изобретение относится к средствам обработки поискового запроса. Техническим результатом является персонализация агрегированных результатов поиска.

Изобретение относится к средствам обработки поискового запроса. Техническим результатом является персонализация агрегированных результатов поиска.

Изобретение относится к области видеонаблюдения, в частности к обработке видеоинформации с камер видеонаблюдения для отслеживания движущихся объектов в реальном времени или при просмотре архивного видео.

Изобретение относится к средствам для визуализации и фильтрации больших объемов данных. Технический результат заключается в повышении эффективности анализа больших объемов данных и поиска объектов по критериям.

Изобретение относится к средствам для визуализации и фильтрации больших объемов данных. Технический результат заключается в повышении эффективности анализа больших объемов данных и поиска объектов по критериям.

Изобретение относится к области вычислительной техники. Технический результат заключается в повышении эффективности детектирования одного или более предметных столбцов таблицы. Технический результат достигается за счет выбора заданного количества столбцов из таблицы в качестве предметных столбцов-кандидатов, причем каждый предметный столбец-кандидат является потенциально подходящим для правильного предметного столбца таблицы, при этом каждый предметный столбец-кандидат включает в себя множество значений; для каждого предметного столбца-кандидата: определения совместной встречаемости для значений в предметном столбце-кандидате, включая определение того, как часто значения в предметном столбце-кандидате также встречаются в правильных предметных столбцах в множестве других таблиц, вычисления оценки для предметного столбца-кандидата на основе упомянутой определенной совместной встречаемости, причем вычисленная оценка показывает правдоподобие того, что предметный столбец-кандидат является правильным предметным столбцом; и классификации предметного столбеца-кандидата в качестве одного из правильного предметного столбца таблицы и непредметного столбца таблицы на основе вычисленной оценки для предметного столбца-кандидата. 6 н. и 27 з.п. ф-лы, 11 ил.
Наверх