Способ унифицированной семантической обработки информации, обеспечивающий в рамках одной формальной модели представление, контроль семантической правильности, поиск и идентификацию описаний объектов

Авторы патента:

G06F17/30 - информационный поиск; структуры баз данных для этой цели

Владельцы патента RU 2393536:

Общество с ограниченной ответственностью "Передовые сервисы и технологии" (RU)

Изобретение относится к вычислительной технике и может использоваться для поиска и идентификации объектов по их описаниям и их пополнение. Техническим результатом является повышение быстродействия обработки информации. В способе совмещают несколько процессов обработки: поиск-идентификация описаний, пополнение описаний значениями признаков, расширение множества признаков, используемых для описания, изменение самих наборов описаний, обнаружение и диагностика ошибок ложной синонимии и омонимии и комбинации перечисленных выше действий. При этом используют данные в зависимости от текущего состояния и для поиска-идентификации, и для пополнения, и для обнаружения, и диагностики ошибок. Для обрабатываемых наборов описаний используют простые или составные ключи, предназначенные для повышения скорости сопоставления, динамически пополняют набор признаков, с помощью которых дается описание объектов и на основании которого осуществляют сопоставление. 2 з.п. ф-лы.

Изобретение относится к вычислительной технике и может использоваться как для поиска и идентификации объектов по их описаниям, так и для пополнения описаний отдельных объектов, а также для пополнения самого набора описаний объектов.

Способ обеспечивает сопоставление наборов описаний объектов или ситуаций, ориентированный на работу в многопользовательских и распределенных информационных системах. Одна из областей применения - системы мониторинга, характеризующиеся, с одной стороны, разнообразием технических устройств, обеспечивающих поступление входной информации и вывод результатов, а с другой, различными методами семантического агрегирования первичных данных, определяемых проблемной и предметной спецификой решаемых с помощью системы задач. В общем случае сопоставляются два набора описаний объектов, например хранящиеся в двух различных базах данных. В частных случаях сопоставление производится между набором описаний - база и отдельным (текущим) описанием, в качестве которого рассматривается, например, набор оцифрованных сигналов известных типов, поступающий от системы датчиков или отдельного устройства, или последовательность значений признаков, вводимая пользователем посредством устройства ввода. Сами сигналы или значения могут быть как числовыми (оцифрованными), так и символьными (слова текста, лексемы) или псевдочисловыми (шкалированными).

В настоящее время существуют различные способы поиска-идентификации объектов по их текстовым описаниям, которые заключаются в том, что тексты, написанные на естественных языках в определенных предметных и проблемных областях, преобразуются в сигналы, пригодные для машинной обработки. Они позволяют сравнивать выборки ключевых слов, полученные при формировании запроса с тезаурусами текстов, хранящихся в базе данных (см. патенты РФ №2107942, 2167450 (на момент подачи заявки прекратил действие), 2236699, 2305314, патент США №6460034).

В известных способах организации хранения, поиска и идентификации объектов и документов не учитываются следующие существенные особенности взаимодействия между набором описаний объектов, который можно назвать базой данных, и некоторым текущим описанием какого-то объекта, не обязательно зафиксированного в базе.

1. Априорная неопределенность относительно принадлежности любого фрагмента текущего описания к поисковому образу либо к пополняющей информации. Во всех аналогах явно декларируется либо неявно предполагается предварительное отнесение каждой вводимой (поступающей) порций данных к поисковому образу либо пополняющей информации. В рассматриваемых областях применения вся информация может оказаться пополняющей, если в рассмотрение вводится новый объект. Другим крайним случаем является повторение уже известной (например, введенной другим пользователем) информации, либо по незнанию, либо с целью дальнейшего использования найденного описания (актуализация или смена контекста). Типичным для непрерывного взаимодействия является текущее описание, часть значений признаков в котором (никак специально не выделяемая) содержит отсылку к ранее упоминавшемуся объекту, а другая часть сообщает (по крайней мере - потенциально) новую информацию. Причем для указания на объект используются значения как действительно уникальных дескрипторов - простых либо составных ключей, так и признаков, уникальных только в контексте реализуемого кванта взаимодействия.

Так как учет данной особенности представляется наиболее существенным, опишем еще ряд ситуаций, с неизбежностью возникающих при работе систем, относящихся к области применения заявляемого способа и требующих ее учета. При поступлении порции данных, сопоставляемой отдельному объекту (ситуации, явлению) в общем случае решается комплексная задача - найти описание этого объекта, а если такового нет, то создать его и пополнить значениями признаков. Решение задачи не может быть реализовано как последовательное решение двух отдельных задач: поиска-идентификации и пополнения найденного описания данными. Основная причина такой невозможности - система датчиков, выдавая сигнал; система технического зрения, передавая данные о выделенном объекте; пользователь многопользовательской системы, формируя запрос, принципиально не знает, что именно известно системе, так как она работает еще и с другими источниками данных и пользователями, а также, при использовании любого способа обработки данных, осуществляет по формальным правилам преобразования всего набора имеющихся описаний. Следовательно, значение любого признака в текущем описании может являться (относительно сформированного к моменту его поступления набора описаний) либо элементом поискового образа, либо пополняющей информацией, и эта «двойственность» принципиально неустранима.

В качестве примера опишем очевидный предельный случай - описание идентифицируемого объекта, ситуации, явления уже имеется в наборе, но в текущем описании не содержится значений ни для одного из признаков, означенных в описании, то есть все данные являются пополняющими. Если интерпретировать текущее описание как поисковый образ, то ни одного описания найдено не будет. Если, например, на основании результатов поиска, интерпретировать его как данные для пополнения, то будет сформировано новое описание якобы другого объекта. Последнее объясняет, в частности, неизбежность порождения ошибки ложной синонимии при отсутствии признаков, однозначно идентифицирующих объекты, ситуации, явления.

2. Необязательное, но возможное присутствие простых или составных дескрипторов, однозначно идентифицирующих объект и необязательность задания значений по ключевым признакам, даже если они есть, усугубляемые несовпадениями наборов дескрипторов и неоднозначностью используемых множеств их значений. Пример практической ситуации: необходимость идентификации семей - отсутствие однозначно понимаемых ключей; необходимость идентификации граждан при необязательном наличии паспортных данных - ключ есть, но значение отсутствует. Способ поиска-идентификации должен не только осуществлять поиск при отсутствии ключей, что свойственно, по крайней мере, некоторым системам обработки текстов, но и повышать эффективность поиска (сокращение времени, уменьшение выборки), если они есть.

3. Невозможность гарантировать семантическую целостность, понимаемую как непротиворечивость и полноту набора описаний объектов в любой момент его жизненного цикла, усугубляемая ошибками в поступающих данных. Наиболее значимыми в рассматриваемых областях применения представляются ошибки ложной синонимии (сопоставление двум и более описаниям из набора одного объекта) и омонимии (сопоставление одному описанию из набора двух и более объектов).

4. Ограниченная, с точки зрения рассматриваемых, в частности, самими аналогами, областей применения интерпретация понятия одинаковости (похожести). Во-первых, задача рассматривается как одноуровневая (за исключением патентов РФ №2107942, 2167450), то есть при определении одинаковости обязательно учитываются и являются единственно определяющими совпадения значений признаков. При этом связь признак-значение фиксируется явно либо опосредованно - иерархической системой тезаурусов. В то же время для ряда задач одинаковыми можно считать объекты, при описании которых используются совпадающие наборы признаков, вообще игнорируя сами значения признаков (этот крайний случай не соответствует способам, описанным в патентах РФ №2107942, 2167450). Во-вторых, одинаковыми объектами считаются объекты, для которых совпали значения всех признаков, либо в случае совпадения значений части признаков вводится некоторая, как правило, статистически определяемая количественная мера, величина которой относительно некоторого порога предопределяет вывод о соответствии либо несоответствии описания объекта поисковому образу. Использование такого способа исключает из дальнейшей обработки описания объектов, которые потенциально могут быть идентифицированы при поступлении новых данных, и снижает эффективность работы, так как процесс поиска с необходимостью повторяется по всей совокупности данных.

Наиболее близким аналогом, принятым за прототип, является способ поиска и выборки информации из различных баз данных, описанный в патенте RU 2305314, в соответствии с которым осуществляют: поиск и выборку информации из различных баз данных, включая формирование пользователем на пользовательском компьютере, по меньшей мере, одного поискового запроса, передачу сформированного пользователем запроса через телекоммуникационные средства связи в поисковую систему сервера, обработку поисковой системой сформированных пользователем поисковых запросов путем выбора документов из различных баз данных, дополнительно поисковая система объединяет все выбранные документы по тематикам, формирует папки, каждая из которых содержит упомянутые документы, отсортированные по одной тематике, для каждой папки определяет параметры оценки релевантности, для каждого отсортированного документа каждой папки, выделяет признаки, характеризующие каждый документ, внутри каждой папки определяет рейтинг каждого признака, содержащегося в каждом отсортированном документе, определяет окончательный рейтинг каждого выбранного документа с учетом рейтинга каждого признака документа и параметра оценки релевантности папки, снова сортирует упомянутые отсортированные документы с учетом окончательного рейтинга, осуществляет структурную обработку выбранного количества документов для подготовки итогового отчета, формирует график, показывающий зависимости количества отсортированных в соответствии с окончательным рейтингом документов от текущего времени, передает на пользовательский терминал через телекоммуникационные средства связи итоговый отчет и сформированный график.

Недостатком прототипа является ограничение функциональных возможностей только поиском информации. Кроме того, неявное определение набора признаков (формирование результатов поиска в виде структурированного набора папок, каждая из которых неявно соответствует определенному набору признаков), решающее в принципе проблему модификации наборов, не позволяет в полной мере реализовать различные интерпретации одинаковости, поскольку документы заносятся в папку (считаются найденными) при наличии в них значения каждого признака поискового образа (пересечение), а внутри папок ранжируются с помощью линейной свертки в соответствии с важностью отдельных признаков, задаваемой конкретным пользователем. Поэтому способ, описанный в прототипе, не учитывает в полной мере существенные особенности обработки входной информации, свойственные вышеперечисленным областям применения.

В заявленном изобретении предложен такой способ сопоставления описаний объектов, который свободен от указанных недостатков, дополнительно учитывает вышеперечисленные особенности задач, возникающие в рассматриваемых областях применения, и, тем самым, имеет более широкие возможности применения, чем рассматриваемые аналоги.

Поясним используемый нами термин «сопоставление». Способ совмещает несколько процессов, обеспечивающих решение задач, которые на настоящем уровне развития техники рассматриваются как автономные, а именно: поиска-идентификации описаний, пополнение описаний значениями признаков, расширение множества признаков, используемых для описания, изменения самих наборов описаний, обнаружение и диагностика ошибок ложной синонимии и омонимии и любой комбинации перечисленных выше действий. Данное совмещение может рассматриваться как основной признак изобретения. Термином «сопоставление» называется объединенное в рамках одного процесса решение всей совокупности вышеперечисленных задач.

Техническим результатом заявленного изобретения является обеспечение сопоставления наборов описаний объектов, ситуаций или явлений, то есть расширение функциональных возможностей путем совмещения в одном способе различных процессов обработки данных, рассматриваемых в аналогах и прототипе, как независимые; и проведения анализа получаемых результатов с расширенной относительно аналогов и прототипа интерпретацией одинаковости. Поясним последнее подробней - достижение технического результата обеспечивается совмещением двух стратегий, а именно: выбора похожих описаний и отсева заведомо неподходящих (обычно рассматриваемых как альтернативные), кроме того, в качестве сопоставляемых в каждый момент обработки рассматривают наборы описаний, в каждый момент времени их идентичность текущему описанию определяется количественной мерой оценки совпадающих значений всех, либо некоторых признаков текущего описания. Способ реализуется как циклическое выполнение в определенном порядке действий (операций) по обработке набора описаний объектов и поступающей по одному из каналов связи от одного из входных устройств последовательности сигналов текущего описания.

Особенностью данного способа является то, что любые данные из описания используются в зависимости от текущего состояния для поиска-идентификации, пополнения, обнаружения и диагностики ошибок, а также для всех других действий. Другой его особенностью является то, что в нем, с одной стороны, не предполагается наличие простых или составных ключей или необходимость задания их значений, с другой стороны, наличие ключей или их значений повышает эффективность согласования, в первую очередь, с точки зрения быстродействия системы. Поскольку значения простого (один признак) или составного (несколько признаков) ключа однозначно идентифицируют описания, наличие совпадающих значений ключа, во-первых, однозначно свидетельствуют об ошибке, и, во-вторых, наличие значений в ключевых признаках текущего описания сокращает количество циклов при обработке описания, так как обработка ключа на очередном цикле, по определению, обеспечивает сопоставление текущего описания - единственному (нужное описание найдено) либо однозначному выводу об отсутствии в наборе данных описания, которое может быть сопоставлено текущему. Обе эти ситуации обеспечивают выполнение условии окончания сопоставления, и процесс завершается, хотя ряд признаков описаний остаются необработанными. Третьей особенностью является динамическое пополнение набора признаков, с помощью которых дается описание объектов и на основании которого осуществляется сопоставление. Другими словами, отсутствует и, как следствие, не используется каким либо образом фиксируемый перечень признаков, которые должны иметь значения в любых описаниях.

Обозначим базовые операции D и K.

Результатом операции D является подмножество описаний из набора описаний, такое, что значение, по крайней мере, одного признака для любого вошедшего в результирующее подмножество описания совпадает со значением признака текущего описания. Другие признаки описаний могут содержать значения, не совпадающие с заданными в текущем описании.

Результатом операции K является подмножество описаний из набора описаний, такое, что для любого описания, вошедшего в него, значения всех имеющих значения признаков совпадают с заданными в текущем описании. В результирующее подмножество, в частности, входят все описания, для которых все признаки, имеющие значение в текущем описании, не имеют значений (но значение, по крайней мере, одного, не означенного в текущем описании признака определено).

Производные (реализуются на основе базовых операций) операции обозначим И, П и Н.

И - операция выделения идентифицируемых описаний. Результатом операции И является подмножество описаний из набора описаний, такое, что для любого вошедшего в него описания, значения некоторых (по крайней мере, одного) признаков, означенных в текущем описании, совпадают со значениями, заданными в текущем описании, а остальные не означены. Сформулированное для операции И условие осуществляет совмещение выбора похожих описаний (совпадают значения одноименных признаков) и отсева заведомо непохожих описаний (несовпадение значений одноименных признаков).

П - операция выделения подмножества описаний, противоречащих текущему. Результатом операции П является подмножество описаний из набора, такое, что для любого вошедшего в него описания значение по крайней мере одного признака, означенного в текущем описании, совпадает с заданным и, по крайней мере, одного не совпадает.

Н - операция выделения нейтрального подмножества. Результатом операции Н является подмножество описаний из набора описаний, такое, что для любого описания, вошедшего в него, все признаки, имеющие значение в текущем описании, не имеют значений, однако, по крайней мере, по одному признаку в каждом описании означено. Результаты действия Н могут быть интерпретированы как множество описаний, которые не противоречат текущему, но и не совпадают с любым поисковым образом, который может быть сформирован на его основе.

Последовательность выполнения операций определяется (тактируется) поступлением очередного фрагмента текущего описания (в предельном случае - одного значения одного признака).

На первом шаге выполняются операции К и И, операндами каждой из которых являются исходный набор описаний объектов и признаки первого фрагмента текущего описания.

После чего при обработке очередного фрагмента текущего описания:

а) выполняется операция К, операндами которой являются результат ее выполнения на предыдущем шаге и признаки очередного обрабатываемого фрагмента текущего описания;

б) выполняется операция И, операндами которой являются результат выполнения операции К на предыдущем шаге и признаки очередного обрабатываемого фрагмента текущего описания;

в) выполняется операция К, операндами которой являются объединенный набор описаний, полученный при обработке предыдущего фрагмента текущего описания (шаг г), и очередной фрагмент текущего описания;

г) выполняется объединение (слияние) наборов описаний, полученных на шагах б и в.

Обработка заканчивается, если в результате выполнения шага а не будет найдено ни одного описания объекта или закончится текущее описание. Необходимо отметить, что отсутствие описаний, выделяемых на шаге б, не может быть использовано в качестве условия окончания, поскольку в общем случае множество «кандидатов» на идентификацию может пополняться за счет описаний, выделяемых с помощью операции Н, автономное использование которой с точки зрения сути предлагаемого способа не является обязательным (входящие в выделяемый операцией Н описания не исключаются из процесса обработки при вышеописанной организации, а включаются в результат выполнения операции К).

Операция П выполняется однократно в момент окончания базового процесса. Если в результате ее выполнения не найдено ни одного описания, то процесс идентификации считается полностью завершенным. В противоположном случае оказывается нарушенным условие различимости, причиной чего может быть либо ошибка в значениях признаков (текущих или введенных ранее), либо ложное сопоставление одного описания различным объектам - ложная омонимия. Для устранения противоречия необходимо получение значений автоматически определяемых пар признаков. После их получения противоречие устраняется. В частности, вместо одного описания генерируются два, по которым разносятся имеющиеся значения признаков.

Приведем пример использования заявляемого способа для одного, достаточно часто встречающегося на практике, вида систем обработки данных, а именно - для систем, в которых используются априорно определенные ключи идентификации (набор переменных, совокупность значений которых точно идентифицирует объект), но не предполагается их обязательное использование.

Результатами реализации описанного способа для данных систем являются:

набор описаний объектов - результат финального выполнения шага г;

набор описаний объектов - результат выполнения операции П;

набор признаков, имеющих значения в текущем описании;

наборы признаков, имеющих значения в результирующих наборах описаний.

По окончании обработки текущего описания определяется одна из нижеперечисленных ситуаций.

1. Если набор описаний объектов - результат финального выполнения шага г содержит одно описание и совпадают значения ключей, то описание найдено точно. Значения признаков текущего описания, не имеющих значений в найденном описании, могут быть зафиксированы в нем. Признаки, содержащиеся в текущем описании, но не содержащиеся в найденном, пополняют набор признаков, входящих в описания всех объектов исходного набора, в найденное описание переносятся значения этих признаков из текущего описания.

2. Если набор описаний объектов - результат финального выполнения шага г содержит одно описание, но значения ключевых признаков в текущем описании отсутствуют, то описание найдено предположительно, то есть при поступлении новых текущих описаний возможно обнаружение ложной омонимии. Значения признаков текущего описания, не имеющих значений в найденном описании, могут быть зафиксированы в нем. Признаки, содержащиеся в текущем описании, но не содержащиеся в найденном, пополняют набор признаков, входящих в описания всех объектов исходного набора, в найденное описание переносятся значения этих признаков из текущего описания. Дополнительно можно отметить, что если в системе реализована обратная связь, например, система подразумевает диалог с пользователем, то может быть выдан запрос значений ключевых признаков конкретно для данного объекта, так как определены значения других его признаков. Последнее обеспечивает сведение ситуации 2 к ситуации 1.

3. Если набор описаний объектов - результат финального выполнения шага г не содержит ни одного описания и текущее описание содержит значения ключевых признаков, то введено описание нового объекта, в качестве такового оно и заносится, при этом, как и в п.1, может быть пополнен набор признаков.

4. Если набор описаний объектов - результат финального выполнения шага г не содержит ни одного описания, но текущее описание не содержит значения ключевых признаков, то предположительно введено описание нового объекта, в качестве такового оно и заносится, при этом, как и в п.1, может быть пополнен набор признаков. При обработке последующих текущих описаний возможно обнаружение ложной синонимии. Если в системе реализована обратная связь, то ситуация может быть сведена к п.3.

5. Если набор описаний объектов - результат финального выполнения шага г содержит несколько описаний и текущее описание содержит значения ключевых символов, то обнаружена ложная синонимия, описания объединяются, возможно, с пополнением набора переменных.

6. Если набор описаний объектов - результат финального выполнения шага г содержит несколько описаний и текущее описание не содержит значения ключевых символов, то предположительно обнаружена ложная синонимия, описания объединяются, возможно, с пополнением набора переменных. При поступлении новых текущих описаний возможно обнаружение ложной омонимии. Если в системе реализована обратная связь, то ситуация может быть сведена к п.5.

7. Если набор описаний объектов - результат выполнения операции П содержит одно описание (наличие не более одного описания обеспечивается при реализации способа автоматически), отсутствие ошибки в текущем описании исключено (например, техническое квитирование или повторный ввод), и описания содержат значения ключевых переменных, то имеет место ложная омонимия. Текущее описание пополняет набор описаний, одновременно, как и в п.1, может быть пополнен набор признаков.

8. Если набор описаний объектов - результат выполнения операции П содержит одно описание (наличие не более одного описания обеспечивается при реализации способа автоматически) и одно или оба описания не содержат значения ключевых переменных, то ложная омонимия имеет место предположительно. Осуществление тех же действий, что и в п.9, может повлечь за собой в дальнейшем обнаружение ложной синонимии. Наличие обратной связи сводит ситуацию к предыдущей.

Предложенный способ реализуется системой, которая может состоять из любого набора цифровых измерительных устройств или аналоговых измерительных устройств, снабженных аналого-цифровыми преобразователями, которые подключены к компьютеру, коммуникатору или мобильному телефону, В качестве входных и выходных могут быть использованы одни и те же устройства. Средством реализации предложенного способа является компьютер с Системой Управления Базой Данных (СУБД) или компьютер с программой, написанной на любом из языков программирования высокого уровня (например: Си, Java, Паскаль), которая реализует предложенный способ, или специализированное цифровое вычислительное устройство, которое реализует предложенный способ на аппаратном уровне. Методом реализации являются: в первом случае - написание на языке структурированных запросов (SQL) запросов, реализующих базовые и производные операции, обрабатываемых в вышеописанной последовательности; во втором случае - написание программы в виде оператора цикла по всем обрабатываемым описаниям и входящим в их состав признакам, тело которого содержит условные операторы, с условиями базовых и производных операций; в третьем случае - изготовление печатной платы в случае использования существующей микроэлементной базы, либо изготовление микросхемы, полностью реализующей способ на аппаратном уровне.

Поясним способы реализации, поскольку три вышеперечисленные средства используют для описания своего функционирования различную терминологию.

Обобщенная терминология - ОПИСАНИЕ состоит из набора ПРИЗНАКОВ, имеющих конкретные ЗНАЧЕНИЯ либо не имеющих значения. Сам признак - это его название, например признак описания человека - ПОЛ. Значением признака ПОЛ может быть: мужской, либо женский, либо пол может быть не указан.

ОПИСАНИЮ при использовании в качестве средства СУБД соответствует кортеж отношения (строка таблицы), ПРИЗНАКУ- атрибут отношения (название столбца). ЗНАЧЕНИЮ - значение данного атрибута (значение, записанное в клетку таблицы, клетка может быть не заполнена - отсутствие значения обозначается NUL).

ОПИСАНИЮ при использовании в качестве средства программы соответствует набор переменных, может быть структурированный (строка, столбец), ПРИЗНАКУ - идентификатор переменной, ЗНАЧЕНИЮ - значение, которое присваивается переменной (отсутствие значения обозначается NUL).

ОПИСАНИЮ при реализации на аппаратном уровне соответствует набор ячеек памяти (регистр), ПРИЗНАКУ- идентифицируемая, например, номером ячейка памяти, ЗНАЧЕНИЮ - то, что в данной ячейке записано.

Реализация способа заключается в повторном выполнении в вышеописанной последовательности ранее определенных операций, каждая из которых сравнивает между собой два описания, одно используется в качестве образца, второе извлекается из базы данных (в произвольном порядке, например по номеру). Каждая из операций выбирает в качестве результата либо отсеивает описание из базы данных, при выполнении либо нарушении условия, специфического для данной операции (формулировки на естественном языке приведены выше), и формирует перечни признаков, которые содержатся в одном описании и не содержатся в другом; значения которых совпали и значения которых не совпали; имеющих значения в одном описании и не имеющих значений в другом. Проверка условия предполагает наличие в средстве реализации возможности осуществления трех логических операций: конъюнкции, дизъюнкции и отрицания и проверки равенства значений атрибутов, переменных, содержимого ячеек памяти. Соответствующие возможности обеспечиваются как на аппаратном уровне, так и в любой среде программирования, а также в любой версии СУБД (Брукшир Дж. Информатика и вычислительная техника. 7-е изд. - СПб.: Питер, 2004. - 620 с.). Формирование набора описаний, отобранных в качестве результата всего процесса обработки, называется сопоставлением. Конкретный вид ранее определенных условий операций и выполнение их в вышеописанной последовательности обеспечивают совмещение в одном процессе сопоставления, решение задач поиска, идентификации, пополнения, обнаружения и диагностики ошибок. Каждая из этих задач в настоящее время традиционно рассматривается как самостоятельная и, в отличие от предлагаемого способа, решение любой из них предполагает использование своего, специфического способа решения.

Формируемые отдельными операциями наборы описаний и перечни, фиксирующие не совпадающие по различным (вышеописанным) основаниям признаки, используются соответственно для пополнения (добавления к ранее, до сопоставления сформированному) набора описаний, набора признаков и занесения в признаки их значений либо служат признаком наличия ошибки (обнаружение ошибок) и используются для их конкретизации (диагностика). Конкретизация действия: пополнения либо обнаружение и диагностика ошибки определятся, как это было описано ранее, наличием либо отсутствием требования уникальности значения конкретного признака в разных описаниях и отсутствием либо наличием этого признака в сформированных перечнях.

Пополнение осуществляется в вышеуказанных средах:

- для набора ОПИСАНИЙ, в СУБД добавлением кортежа в отношение, возможно с новыми атрибутами и их значениями, в программе - формированием нового набора переменных, возможно пополненного новыми переменными, с их значениями, на аппаратном уровне - подключением нового регистра, возможно с дополнительными ячейками памяти, и записью в них;

- для набора ПРИЗНАКОВ, в СУБД добавлением новых атрибутов, в программе - определением новых переменных, на аппаратном уровне - подключением к регистрам дополнительных ячеек памяти;

- для набора ЗНАЧЕНИЙ, в СУБД записью значений атрибутов кортежей, в программе - присваиванием значений переменным, на аппаратном уровне - записью в ячейки памяти.

Обнаружение ошибок осуществляется обнаружением частичного несовпадения значений некоторых одноименных признаков при совпадении других одноименных признаков в двух и более описаниях. Диагностика осуществляется точным определением описаний, признаков и значений признаков, в которых ошибка обнаружена, с выделением конкретных признаков с совпавшими и несовпавшими значениями.

Обнаружение и диагностика семантических ошибок ложной омонимии и синонимии (контроль семантической правильности) осуществляется использованием в определенном для способа порядке ранее описанных операций, средства и методы осуществления которых приведены выше, и не требуют реализации никаких дополнительных относительно способа операций обработки данных.

Расширяется относительно используемых в настоящее время интерпретация понятия одинаковости. Реализованный с помощью вышеописанных средств и методов способ, помимо используемых в настоящее время интерпретаций, связанных с полным (конъюнкция) либо частичным (дизъюнкция) равенством значений одноименных признаков различных описаний, фиксирует совпадение либо несовпадение самих признаков, используемых для описания объектов. Например, одинаковыми могут считаться объекты, в описаниях которых используются одни и те же признаки, даже если значения всех этих признаков не совпадают.

Результаты обработки с помощью заявленного способа могут быть выданы на экран компьютера, коммуникатора или мобильного телефона, распечатаны на бумаге с помощью принтера или факсимильного аппарата, отображены на бумаге с помощью графопостроителя, сохранены на магнитных носителях, CD- и DVD-дисках и электронных картах памяти.

Дополнительной особенностью данного способа является то, что сигналы из описанных выше устройств, а также сигналы преобразованных текстов, могут передаваться по электронным каналам связи. При этом электронные каналы связи выбирают из группы, состоящей, по меньшей мере, из телефонных, телетайпных, факсимильных, радио- и телевизионных, оптико-волоконных и электрических каналов связи.

Из существующего уровня техники не выявлены объекты, которые содержали бы совокупность указанных выше существенных признаков. Это позволяет считать заявленный способ новым.

Из существующего уровня техники не известна также совокупность признаков, отличных от признаков упомянутого выше наиболее близкого аналога. Это позволяет считать заявленный способ обладающим изобретательским уровнем.

Приведенные примеры реализации настоящего изобретения служат лишь в качестве иллюстраций и никоим образом не ограничивают объема патентных притязаний, определяемого формулой изобретения.

1. Способ унифицированной семантической обработки информации, обеспечивающий в рамках одной формальной модели представление, контроль семантической правильности, поиск и идентификацию описаний объектов, заключающийся в том, что преобразуют последовательности данных, чисел, в частности слов или лексем или, по меньшей мере, одну последовательность, представляющую собой описание некоторого объекта, ситуации, процесса или явления, в частности поисковый запрос, сформированный на пользовательском компьютере, коммуникаторе или мобильном телефоне, в сигналы, пригодные для машинной обработки, используют сигналы цифровых измерительных устройств или аналоговых измерительных устройств, снабженных аналого-цифровыми преобразователями, которые подключены к компьютеру, коммуникатору или мобильному телефону, формируют описание объекта, ситуации, процесса или явления для обращения к базе данных в системе хранения и обработки информации, производят сопоставление наборов описаний объектов или текущего описания с набором описаний, совмещающее различные процессы обработки данных: поиск, идентификация, пополнение, обнаружение и диагностика ошибок, проводят анализ получаемых результатов с расширенной интерпретацией одинаковости, производят поиск-идентификацию объектов путем совмещения выбора похожих описаний и отсева заведомо неподходящих, рассматривают наборы описаний, в каждый момент времени их идентичность текущему описанию определяется количественной мерой оценки совпадающих значений всех либо некоторых признаков текущего описания, реализуют поиск-идентификацию объектов, пополнение наборов их описаний, пополнение набора признаков, обнаружение и диагностику ошибок как циклическое выполнение в определенном порядке действий по обработке набора описаний объектов и поступающей по одному из каналов связи от одного из входных устройств последовательности сигналов - текущего описания, используют данные из описания в зависимости от текущего состояния для поиска-идентификации, пополнения, обнаружения и диагностики ошибок, используют для обрабатываемых наборов описаний простые или составные ключи, предназначенные для повышения скорости сопоставления, динамически пополняют набор признаков, с помощью которых дается описание объектов, и на основании которого осуществляют сопоставление.

2. Способ по п.1, отличающийся тем, что циклически выполняют операции, осуществляющие следующие действия: выделение подмножества описаний из набора описаний такое, что для любого описания, вошедшего в него, значения всех имеющих значения признаков совпадают с заданными в текущем описании; выделение подмножества описаний из набора описаний такое, что для любого вошедшего в него описания, значения некоторых (по крайней мере, одного) признаков, означенных в текущем описании, совпадают со значениями, заданными в текущем описании, а остальные значений не имеют; объединение результатов выполнения двух вышеописанных действий, с последующей передачей результата объединения для повторной обработки совместно со следующим фрагментом текущего описания.

3. Способ по пп.1 и 2, отличающийся тем, что после окончания циклической обработки набора описаний и текущего описания или в каждом цикле выполняют выделение подмножества описаний из набора такое, что для любого вошедшего в него описания значение, по крайней мере, одного признака, означенного в текущем описании, совпадает с заданным и, по крайней мере, одного не совпадает, результаты которого используют для обнаружения, диагностики и исправления ошибки ложной омонимии.

Изобретение относится к обработке естественно-языковых текстов и может быть использовано для автоматизации поиска необходимых документов в большой их коллекции. .

Способ и устройство для просмотра и взаимодействия с электронной таблицей из веб-браузера // 2390834

Изобретение относится к способу, системе и устройству, предназначенным для обеспечения возможности просмотра и изменения электронной таблицы в контексте прикладной программы веб-браузера.

Способ и система для идентификации связанности изображения, используя анализ ссылок и компоновки страницы // 2390833

Изобретение относится к поиску изображений на Web-страницах и к анализу связанности изображений Web-страниц. .

Способ, устройство и компьютерный программный продукт, обеспечивающие поисковое решение для мобильного устройства, интегрированное с приложениями и использующее контекстную информацию // 2390824

Изобретение относится к средствам поиска требуемой информации и контента, а именно к устройствам, в которых реализована функция поискового посредника между множеством приложений и множеством поисковых функций.

Способ, система и компьютерный программный продукт для поиска, навигации и ранжирования документов в персональной сети // 2388050

Изобретение относится к средствам поиска электронного материала, хранящегося в компьютерной среде. .

Способ и система для усовершенствованного электронного управления задачами и их маркировки // 2388049

Изобретение относится к области электронного управления задачами. .

Способ и система ранжирования объектов на основе отношений внутри типа и между типами // 2387005

Изобретение относится к области ранжирования объектов. .

Способ и система для вычисления значения важности блока в дисплейной странице // 2387004

Изобретение относится к идентификации важности информационных областей дисплейной страницы для главной темы дисплейной страницы. .

Способ, система и устройство для обнаружения источников данных и соединения с источниками данных // 2387003

Изобретение относится к способу и системе для обнаружения источников данных и соединения с источниками данных. .

Способ и система согласования схем баз данных web // 2386997

Изобретение относится к идентификации атрибутов схем баз данных web. .

Способ поиска web-страниц по комбинированному запросу // 2393537

Изобретение относится к контентно-ориентированному поиску Интернет-ресурсов

Система и способ распространения видеоданных // 2394269

Изобретение относится к системе распространения видеоданных и способу упреждения запросов рабочей станции пользователя на получение изображения и обнаружения, преобразования и при необходимости перемещения ожидаемых представлений файлов видеоданных в область локальной памяти для доступа к ним

Конфигурируемые пользователем библиотеки программного обеспечения // 2395836

Изобретение относится к конфигурируемым пользователем библиотекам программного обеспечения

Способ и система для индексирования и поиска в базах данных // 2398272

Объединение многомерных выражений и расширений глубинного анализа данных для извлечения информации из кубов olap // 2398273

Изобретение относится к способам поиска в базах данных и анализа баз данных

Хранилище данных для документов программного приложения // 2398274

Изобретение относится к средствам управления данными, ассоциированными с генерируемыми компьютером документами

Файловая система, представленная внутри базы данных // 2398275

Изобретение относится к средствам обработки и адаптации файловых систем

Система и способ для интернет-поиска мультимедийного контента реального времени // 2399090

Изобретение относится к средствам поиска мультимедийного (AV) контента реального времени

Долговременное хранилище типов и экземпляров данных .net // 2400803

Изобретение относится к компьютерным системам, а именно к способам, системам и компьютерным программным продуктам для создания структур баз данных и для сохранения данных в ответ на атрибуты

Система и способ определения взаимосвязей между пользователями сетевой системы // 2400810

Изобретение относится к сетевым системам и, в частности, к определению, созданию или поддержанию взаимосвязей между пользователями сетевых систем