Способ проверки данных базы данных, относящейся к лицам

Изобретение относится к технологиям автоматизированной проверки биометрических данных пользователя. Техническим результатом является повышение эффективности проверки биометрических данных пользователя. Предложен выполняемый компьютерной системой способ для автоматизированной проверки данных из базы данных, относящейся к совокупности лиц. База данных содержит для каждого лица несколько данных, такие как возраст, имя, пол, их изображения. Согласно способ, определяют для каждого лица несколько корреляций, связывающих друг с другом часть упомянутых нескольких данных этого лица. Далее согласно способу вычисляют для каждого элемента данных в процессе проверки доверительные оценки. Далее сравнивают упомянутые оценки с пороговым значением для определения, является ли элемент данных в процессе проверки действительным или нет. 3 з.п. ф-лы, 5 ил.

 

Изобретение относится к проверке содержимого базы данных, в которой хранятся данные, относящиеся к лицам, такие как их имя, их возраст, их дата рождения, их пол, их изображение, их цифровые отпечатки пальцев и/или другие биометрические данные, с целью выявления ошибок при вводе данных и/или попыток мошенничества с этими данными, хранящимися в этой базе.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

С этой целью изобретение предлагает способ для автоматизированной проверки определенных данных базы данных, относящейся к совокупности лиц и содержащей для каждого лица несколько данных, такие как возраст, имя, пол, этот способ включает в себя:

- определение для каждого лица нескольких корреляций, связывающих друг с другом определенные данные этого лица;

- вычисление, для каждого проверяемого элемента данных, доверительной оценки, зависящей от, по меньшей мере, первой корреляции проверяемого элемента данных с первым другим элементом данных этого же лица и второй корреляции проверяемого элемента данных со вторым другим элементом данных того же лица;

- этап сравнения оценки с пороговым значением для определения, является ли проверяемый элемент данных действительным или нет.

Изобретение также относится к способу, такому, что определен выше, в котором данные, сохраненные для каждого лица, содержат с одной стороны пол и дату рождения, а с другой стороны изображение и цифровой отпечаток пальцев и в котором способ осуществляет, для каждого лица, корреляции пола и возраста с изображением и цифровым отпечатком пальцев.

Изобретение также относится к способу, такому, что определен выше, в котором данные, сохраненные для каждого лица, содержат имя, и в котором этот способ осуществляет, для каждого лица, корреляцию, соответствующую статистике, полученной из национальных репрезентативных данных частоты имени этого лица для года, когда он родился.

Изобретение также относится к способу, такому, как определен выше, использующему значение корреляции, соответствующее статистике, полученной из национальных репрезентативных данных частоты имени рассматриваемого лица для года, когда он родился и для пола этого лица.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Фиг. 1 представляет собой график, состоящий из облака точек, представляющих собой популяцию мужчин, представленных треугольниками, и женщин, представленных кругами, которая показывает для каждого индивидуума его возраст в годах по оси абсцисс и ширину бороздок цифрового отпечатка пальцев в миллиметрах по оси ординат;

Фиг. 2 представляет собой график Фиг. 1, на котором показана средняя область и нижняя область, которые, соответственно, составляют зону доверия и зону недоверия для мужского пола;

Фиг. 3 представляет собой график Фиг. 1, на котором показана верхняя область и средняя область, которые, соответственно, составляют зону недоверия и зону доверия для женского пола;

Фиг. 4 представляет собой график Фиг. 1, на котором показана средняя область, образующая зону доверия для возраста, тогда как верхняя и нижняя зоны образуют зоны недоверия для возраста;

Фиг. 5 представляет собой репрезентативный график частоты использования имени Якоб в год, для мальчиков, родившихся в Соединенных Штатах, в котором года рождения представлены на оси абсцисс, в котором частота на тысячу индивидуумов показана на оси ординат.

ПОДРОБНОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Идея, лежащая в основе изобретения, заключается в определении для каждого человека множества корреляций, связывающих некоторые данные этого лица, и объединения этих корреляций, чтобы индивидуально и непосредственно идентифицировать любые данные, кажущиеся несочетаемыми, вместо того, чтобы просто идентифицировать каждого человека, данные которого имеют противоречивый вид.

Это достигается путем оценки для каждого проверяемого элемента данных (имя, дата рождения или пол), их согласованности с как минимум двумя другими отдельными элементами данных, относящимися к одному человеку. Доверительная оценка данных таким образом, определяется с помощью вычисления, сочетающего значение корреляции этого элемента данных с первым другим элементом данных, и значением корреляции этого элемента данных со вторым другим элементом данных.

Оценка каждого проверяемого элемента данных затем сравнивается с пороговым значением для определения, должен ли проверяемый элемент данных считаться действительным или сомнительным, для отправки предупреждающего сообщения, в случае сомнительных данных.

В приведенном ниже примере, изобретение реализовано, чтобы проверить пол, возраст и имя совокупности лиц или индивидов, хранящихся в базе данных с дополнительными данными, включая, в частности, цифровой отпечаток пальцев и изображение для каждого из этих лиц.

В частности, существует корреляция между шириной борозд цифрового отпечатка пальцев индивида и его полом, и другая корреляции между шириной этих борозд и возрастом рассматриваемого индивида. Это подробно описано в статье, озаглавленной "Epidermal Ridge Breadth, an indicator of âge and sex in paleodermatoglyphics" (“Ширина эпидермальной борозды, индикатор возраста и пола в палеодерматоглифике”) авторства Мирослава Кралика и Владимира Новотного, которая доступна по адресу: http://www.staff.amu.edu.pl/~anthro/pdf/ve/vol011/01kralik.pdf.

Аналогичным образом, корреляция связывает изображение индивида с его полом, а другая корреляция связывает изображение индивида с его возрастом. Это подробно описано, в частности, в статье «Estimating Age, Gender and Identity using First Name Priors» («Оценка возраста, пола, и личности используя имя») Эндрю Галлахера и Тсухан Чен, доступной по следующему адресу: http://chenlab.ece.cornell.edu/people/Andy/projectpage_names.html.

Как показано на Фиг. 1, ширина бороздок цифровых отпечатков пальцев населения, как правило, крупнее среди мужчин, чем среди женщин, а также увеличивается с возрастом индивидов этого населения.

Таким образом, можно определить на этом графике среднюю область, которая соответствует зоне доверия для мужского пола, и нижнюю область, которая соответствует зоне недоверия для мужского пола.

Как показано на Фиг. 2, зона доверия для мужского пола соответствует полосе, охватывающей большинство мужчин (представленных треугольниками), а зоной недоверия для мужского пола является область, расположенная под зоной доверия мужского пола и почти не включающая ни одного индивида мужского пола.

Зона доверия для мужского пола, которая указана на Фиг. 2 в виде обведенного символа мужского пола, может быть ограничена определением вначале средней кривой значений для мужского пола, соответствующей высокой кривой на Фиг. 1, и определением затем по обе стороны от этой средней кривой двух огибающих кривых, позволяющих охватить, к примеру, 95% мужского населения.

Аналогично, зона недоверия для мужского пола, которая указана на Фиг. 2 перечеркнутым символом мужского пола, может быть разграничена путем определения высокой кривой, расположенной под средней кривой мужского пола, но выше всего лишь 2% индивидов мужского пола. Тогда, зона недоверия для мужского пола состоит из области, расположенной под определенной таким образом кривой.

Таким образом, можно определять корреляцию, обозначаемую Cge, между полом лица записанного в базе данных как мужчина и его цифровым отпечатком пальцев: возможность заключается в определении, расположена ли точка, определенная с помощью возраста этого лица и толщины борозд его цифрового отпечатка пальцев, в зоне доверия для мужского пола или, напротив, в зоне недоверия.

Значение 1 может быть присвоено Cge, если эта точка попадает в зону доверия для мужского пола, и значение 0 может быть присвоено этой корреляции, если точка лежит в зоне недоверия. Промежуточное значение, например, равное 0,5, присваивается, если точка находится вне зоны доверия и вне зоны недоверия.

Другое решение может состоять в расчете расстояния, которое разделяет точку, определенную с помощью возраста и толщины борозд отпечатка пальцев, от средней кривой для мужского пола (верхняя кривая Фиг. 1), и в присвоении Cge значения между 0 и 1, которое тем выше, чем меньше эта дистанция.

Мы можем аналогично определить зону доверия и зону недоверия для женского пола.

Как схематично показано на Фиг. 3, зона доверия для женского пола, которая отмечается обведенным символом женского пола, соответствует полосе, расположенной в центральной позиции графика, и которая окружает среднюю кривую для женщин, а именно нижнюю кривую на Фиг. 1, охватывая значительную долю, такую как 95%, индивидов женского пола.

Зона недоверия для женского пола, которая отмечается перечеркнутым символом женского пола, является верхней областью, расположенной над зоной доверия, охватывая крайне малую долю женских индивидов, такую как, например, 2%.

Как и в случае мужского пола, можно присвоить 1 как значение Cge для всех индивидов, объявленных женщинами, которые попадают в зону доверия для женского пола, и значение 0, для индивидов, записанных как женщины, но которые попадают в зону недоверия для женского пола. Среднее значение, например 0.5, присваивается Cge, если точка лежит вне зоны доверия и зоны недоверия.

Здесь также другая возможность может заключаться в определении, для данного индивида, записанного как женщина, расстояния между точкой, соответствующей возрасту и ширине борозд цифровых отпечатков пальцев, и средней кривой для женщин, которая является нижней кривой на Фиг. 1. Значение Cge, заключенное между 0 и 1, тем выше, чем рассматриваемая дистанция меньше.

Как уже упоминалось выше, существует также корреляция, обозначаемая Сae, между толщиной борозд цифровых отпечатков пальцев и возрастом рассматриваемых лиц. Эта корреляция позволяет разграничить на графике Фиг. 1, зону доверия и две зоны недоверия относительно возраста.

Зона доверия по возрасту, которая обозначается обведенной буквой А на Фиг. 4, соответствует средней полосе, которая охватывает большинство индивидов (мужчин и женщин) рассматриваемого населения. Эта средняя полоса может быть определена путем вычисления, в первую очередь, средней кривой для всех лиц, что соответствует среднему между верхней и нижней кривыми Фиг. 1, и затем определением двух огибающих кривых, расположенных выше и ниже этой средней кривой, для охвата, например, 95% индивидов.

Две зоны недоверия, относящиеся к возрасту, которые обозначаются перечеркнутой буквой А на Фиг. 4, соответствуют двум областям, соответственно расположенным выше и ниже медианной зоны доверия по возрасту, эти две зоны недоверия охватывают крайне малую долю индивидов населения, соответствующую, например, 2% населения.

Определение значения корреляции Cae возраста с отпечатком пальцев данного индивида также может быть обеспечено определением, попадает ли точка, соответствующая рассматриваемому индивиду, в зону доверия или в зону недоверия по возрасту, с целью присвоения Cae значения 1 или 0. Другим решением является также определение расстояния, разделяющего точку, представляющую рассматриваемого индивида, от средней кривой всех индивидов, для присвоения значения корреляции Cae, заключенного между 0 и 1, которое тем выше, чем меньше это расстояние.

Как понятно, график Фиг. 1-4, данные которого происходят из статистики, выполненной по данной выборке населения, позволяет определить, для каждого записанного в базе данных лица, корреляцию Cge его пола с цифровым отпечатком пальцев и корреляцию Cae его возраста с его цифровым отпечатком пальцев.

Изображение каждого лица, зарегистрированного в базе данных, позволяет осуществить две другие корреляции, касающиеся его возраста и пола.

Корреляция возраста с изображением, обозначается Cap, может быть установлена путем предоставления системе, в первую очередь, серии изображений с реальным возрастом, для каждого из них. Затем, когда системе предоставляют неизвестное изображение, она сравнивает его с серией изображений, которой она располагает и которая составляет ее эталонное пространство, для определения наиболее похожих изображений, при необходимости вычисляя степень сходства. Затем возраст определяется путем расчета среднего, взвешенного с помощью степени сходства, возрастов сходных изображений. Корреляция, обозначаемая Cgp, пола с изображением устанавливается аналогично.

Кроме того, внешние статистические данные могут быть использованы для установления одной или более корреляций для каждого лица, хранящегося в базе данных.

В частности, как правило, существуют национальные статистические данные, которые позволяют определить, какая доля рождений приходится на данное имя, год за годом, для данного пола.

Такие статистические данные позволяют создать такой график, как, например, на Фиг. 5, который представляет долю рождений, что приходится на имя Якоб, для мальчиков, родившихся в Соединенных Штатах с 1830 года, из года в год.

Этот график позволяет осуществить корреляцию, обозначаемую Cpa, связывающую имя и возраст данного индивида. Значение рассматриваемой корреляции может быть определено с учетом того, что оно мало, и равно, к примеру, 0, если доля рождаемости для рассматриваемого имени и рассматриваемый год рождения ниже порогового значения, это пороговое значение является 1 или 2 на 1000 рождений.

В этом случае, корреляция Cpa имени с возрастом низкая для лица, названного Якоб, который в 1956 году в Соединенных Штатах, что позволяет предположить, что существует ошибка ввода, к примеру, года рождения, поскольку такое имя, а именно Якоб, для мальчиков, родившихся в 1976 году в Соединенных Штатах, составляет более 1 или 2 для тысячных рождений мальчиков.

Другой вариант определения значения корреляции Cpa может заключаться в определении путем вычисления числового значения, тем меньшего, чем более рассматриваемое имя является редким в рассматриваемом году.

Аналогичным образом, как можно понять, эти статистические данные по именам, также позволяют определить значение корреляции между именем и полом, обозначаемой Cpg, из-за того, что эти статистические данные, как правило, доступны для мальчиков и девочек по году рождения.

Наконец, для каждого лица, появляющегося в базе данных, устанавливают шесть следующих корреляций: Cap = возраст - изображение; Cae = возраст - отпечаток пальцев; Cgp = пол- изображение; Cge = пол - отпечаток пальцев; Cpa = имя - возраст; Cpg = имя - пол, которые все содержатся между 0 и 1.

Эти корреляции затем объединяются, чтобы определить для каждого лица оценку, связанную с его полом, оценку, связанную с его возрастом, и оценку, связанную с его именем.

Эти корреляции могут быть объединены непосредственно для определения каждой оценки, на основании которой затем определяют для каждой оценки порог доверия и порог недоверия. Затем элемент данных считается действительным, если их оценка превышает порог доверия, и не действительным, если их оценка ниже порога недоверия, что затем приводит к отправке сигнала тревоги. Можно решить, что данные, имеющие оценку в диапазоне между этими двумя порогами, либо действительные, либо сомнительные.

Оценка, связанная с элементом данных может быть просто суммой корреляций, связанных с этим элементом данных, при необходимости, дополнительно деленная на число корреляций для приведения результата к значению, непременно заключенному между 0 и 1. Порог недоверия и порог доверия могут быть определены эмпирически.

Другая возможность может состоять в расчете оценки каждого элемента данных после преобразования каждого значения корреляции в значение недоверия, которое может быть либо 0, либо 1, либо 2, согласно чему рассматриваемая корреляция имеет оценку, соответственно, более высокую, чем порог доверия, заключающуюся между порогом доверия и порогом недоверия, или ниже порога недоверия.

Это решение позволяет определить пороги не относительно оценок, которые сами вытекают из объединения нескольких корреляций, но непосредственно относительно корреляций, чей уровень производительности и/или надежности, как правило, известен, что непременно облегчает определение этих порогов.

В этом случае, оценка элемента данных возраста будет 1 - (Sap + Saf + Sna)/3, оценка элемента данных пола тогда будет 1 - (SSgp + SSgf + SSng)/3, и оценка элемента данных имени будет 1 - (SSng + SSna)/2.

Можно решить, установить оповещение для каждого элемента данных, имеющего отрицательную оценку, и считать, что элемент данных действителен, если их оценка равна 1. И можно считать, что данные с оценкой между 0 и 1 либо сомнительны, либо действительны, или еще, что они дают повод к маловажному оповещению.

Как будет понятно, изобретение применяется в компьютерной системе, включающей средства наподобие процессора, памяти и других, для работы компьютерной программы для обработки содержимого базы данных. Программа анализирует содержимое базы данных, переданной ей, для возврата, после обработки этой базы данных, списка данных, которые кажутся подозрительными. После того как получены статистические данные корреляции на основе репрезентативной выборки, изобретение позволяет также оценить на лету достоверность ручного ввода данных личности.

Кроме того, относительно вопроса о возрасте индивидов в базе данных, он, как правило, определяется на основании даты рождения, хранящейся для каждого индивида. Преимущественно, база данных содержит дату получения изображения и/или цифрового отпечатка пальцев каждого лица, и возраст, который принимается во внимание, является возрастом лица, на момент получения его изображения и/или его цифрового отпечатка пальцев.

1. Выполняемый компьютерной системой способ для автоматизированной проверки данных из базы данных, относящейся к совокупности лиц и содержащей для каждого лица несколько данных, такие как возраст, имя, пол, их изображение, их отпечатки пальцев или другие биометрические данные, этот способ включает в себя:
определение для каждого лица нескольких корреляций, связывающих друг с другом часть упомянутых нескольких данных этого лица;
вычисление, для каждого элемента данных в процессе проверки, доверительной оценки, зависящей от по меньшей мере первой корреляции элемента данных в процессе проверки с первым другим элементом из упомянутых нескольких данных этого же лица и второй корреляции элемента данных в процессе проверки со вторым другим элементом из упомянутых нескольких данных того же лица;
этап сравнения оценки с пороговым значением для определения, является ли элемент данных в процессе проверки действительным или нет.

2. Способ по п. 1, в котором данные, сохраненные для каждого лица, содержат с одной стороны пол и дату рождения, а с другой стороны изображение и отпечаток пальцев и в котором способ осуществляет, для каждого лица, корреляции пола и возраста с изображением и отпечатком пальцев.

3. Способ по п. 2, в котором данные, сохраненные для каждого лица, содержат имя и в котором этот способ осуществляет, для каждого лица, корреляцию, соответствующую статистике, полученной из национальных репрезентативных данных частоты имени этого лица для года, когда он родился.

4. Способ по п. 3, использующий значение корреляции, соответствующее статистике, полученной из национальных репрезентативных данных частоты имени рассматриваемого лица для года, когда он родился и для пола этого лица.



 

Похожие патенты:

Изобретение относится к технологиям обработки электронных документов. Техническим результатом является обеспечение классификации изображений документов на основе функции классификации.

Изобретение относится к компьютерной технике, а именно к системам для просмотра видеопоследовательностей. Техническим результатом является обеспечение автоматизированного выбора ключевого кадра в видеопоследовательности.

Изобретение относится к вычислительной технике, а именно к устройствам захвата изображений, имеющих функцию отслеживания объекта и функцию непрерывной съемки. Техническим результатом является повышение точности функции отслеживания объекта устройства регистрации изображения в ходе непрерывной съемки, за счет устранения задержки по времени между обнаружением объекта и получением информации фокуса в позиции объекта.

Изобретение относится к обработке изображений и распознаванию заранее заданных признаков в изображении. Технический результат заключается в повышении быстродействия и точности идентификации признаков.

Изобретение относится к способу бесконтактного обнаружения и отслеживания положений глаз или зрачков нескольких наблюдателей в режиме реального времени. .

Изобретение относится к системам для идентификации местоположения меток на документе путем захвата изображения документа. .

Изобретение относится к вычислительным устройствам для обработки информации (изображений) и может быть использовано при зондировании различных поверхностей и сред в радиолокации, оптике и медицине.

Изобретение относится к области вычислительной техники и может быть использовано для автоматического обнаружения и распознавания изображений и объектов в робототехнике, геологии, биологии, физике, медицине и т.

Изобретение относится к корреляционной обработке изображений. .

Изобретение относится к области обработки цифровых изображений. Техническим результатом является улучшение качества преобразованных изображений за счет использования расширенной локальной гистограммы распределения яркостей.

Изобретение относится к вычислительной технике. Технический результат заключается в обеспечении возможности выявлять на изображении документа многоугольный объект, относящийся к снимку экрана.

Изобретение относится к системам с использованием отражения или вторичного излучения электромагнитных волн, иных, чем радиоволны, и может быть использовано для определения местоположения объекта наблюдения в автоматизированных системах транспортных средств для предупреждения столкновения.
Изобретение относится к области обработки данных, а в частности к способам распознавания данных, в том числе считывания знаков, изображений, образов. Техническим результатом является повышение быстродействия при выявлении в любом документе заранее заданной эталонной круглой печати.

Изобретение относится к области цифровой обработки изображений, связанной с выделением и анализом сегментов. Техническим результатом является повышение точности определения толщины слоя за счет автоматизированного выявления нечеткой границы.

Изобретение относится к средствам компенсации дефектов цвета глаз на изображении. Техническим результатом является повышение эффективности обнаружения эффекта красных глаз на изображении.

Изобретение относится к устройствам формирования изображений с функцией аутентификации личности. Техническим результатом является повышение точности аутентификации объекта за счет выбора новых данных о характерных признаках.

Изобретение относится к области распознавания образов и может быть использовано при решении задач предварительной обработки изображения с целью определения контуров объектов, которые характеризуются монотонностью изменения интенсивности цвета.

Изобретение относится к средствам обработки цифровых изображений. Техническим результатом является повышение точности выделения границ сложноструктурируемых изображений за счет формирования множества фильтрованных по направлению изображений из исходного полутонового изображения путем локальной обработки составным морфологическим оператором.

Изобретение относится к сегментации изображений и, в частности, к определению контуров анатомической структуры в изображении, вычисленном по слою данных изображения, и дополнительно к определению контуров анатомической структуры в данных изображения.

Изобретение относится к технологиям обработки электронных документов. Техническим результатом является обеспечение классификации изображений документов на основе функции классификации.
Наверх