Способ распознавания изображений лиц и система для его осуществления

Авторы патента:

Щеголева Надежда Львовна (RU)

Кухарев Георгий Александрович (RU)

G06K9/68 - с помощью последовательных сравнений сигналов изображения с множеством эталонов, например адресной памятью

G06K9/52 - путем получения математических или геометрических характеристик изображения в целом

Владельцы патента RU 2490710:

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Санкт-Петербургский государственный электротехнический университет "ЛЭТИ" им. В.И. Ульянова (Ленина)" (RU)

Способ распознавания изображений лиц и система для его осуществления могут быть использованы для распознавания изображений лиц в системах машинного зрения, биометрических системах контроля доступа и видеонаблюдений, интерактивных системах человек-компьютер и других системах. Техническим результатом является повышение быстродействия распознавания изображений лиц и повышение его универсальности. Способ распознавания изображений лиц заключается в регистрации и распознавании, использовании гамма-коррекции и логарифмирования изображений, преобразовании их в спектры с помощью двумерного косинус-преобразования и удалении высокочастотных спектральных компонент, при распознавании тестовых изображений сравнение полученных тестовых спектров со спектрами, хранящимися в базе эталонов, происходит на основе среднего значения яркости тестового изображения, выполняется классификация преобразованных тестовых спектров по критерию минимума расстояния, принимается решение о распознавании. Система для осуществления способа содержит устройство регистрации и устройство распознавания, устройство регистрации содержит блок гамма-коррекции, сумматор, блок логарифмирования, два блока двумерного косинус-преобразования, блок базы эталонов, а устройство распознавания содержит сумматор, блок логарифмирования, блок гамма-коррекции, два блока двумерного косинус-преобразования, блок формирования спектров, классификатор. 2 н.п. ф-лы, 6 ил.

Изобретение относится к автоматике и вычислительной технике и может быть использовано для распознавания изображений лиц в системах машинного зрения, биометрических системах контроля доступа и видеонаблюдений, интерактивных системах человек-компьютер и других системах. Техническим результатом является повышение быстродействия распознавания изображений лиц и повышение его универсальности.

Динамика освещенности сцены остается одной из нерешенных сегодня проблем в практике распознавания изображений с лицами. В этих условиях на области лица появляются изменения трех типов. Первые можно отнести к «локальным ярко выраженным теням», а вторые - к «глобальным теням». Третьи - к бликам. Локальные тени изменяют форму отдельных частей лиц (носа, рта и глаз) и искажают границы области лица, а также границы «волосы/лоб» и «шея/подбородок». Глобальные тени существенно снижают различимость области лиц на общем фоне и/или полностью «закрывают» их. Блики на лицах представляются как «не ярко выраженные, но быстро изменяющиеся пятна яркости и распределенных теней» 00000000, которые возникают, например, при наблюдениях за быстрым перемещением людей в пространстве с различным освещением и/или временными помехами в освещении.

Нестабильность яркости исходной сцены приводит к непредсказуемой динамике значений исходных признаков, представляющих область лица. Очевидно также, что эта нестабильность приводит, в свою очередь, к ухудшению результативности работы систем распознавания лиц (Face Recognition System - FaReS). Именно поэтому интерес к проблеме распознавания изображений лиц с проблемами освещения не ослабевает последние несколько лет.

Известен способ распознавания изображений лиц с проблемами освещения (Wang Ying-Hui et all. A method of illumination compensation for human face image based on quotient image - Information Sciences, 2008, Vol.178), основанный на дополнении базы эталонами, имеющими практически все возможные типы теней с включением их в соответствующие классы базы эталонов, использовании вейвлет-преобразования и анализа главных компонент (РСА - principal component analysis). Недостатком способа являются практическая сложность создания изображений лиц, имеющих все возможные типы теней для всех классов, составляющих базу эталонов и, как следствие этого, - невозможность обеспечения высокого и стабильного качества распознавания в условиях динамики изменения состава баз.

Известен способ (Zhanga et all. Multiscale facial structure representation for face recognition under varying illumination - Pattern Recognition, 42, 2009), основанный на инвариантном (относительно яркости) представлении изображений лиц с использованием локальных бинарных эталонов, использовании вейвлет-преобразования и процедур РСА. Недостатком способа являются большие вычислительные затраты, связанные с получением локальных бинарных эталонов исходных изображений, их вейвлет-преобразованием и последующим выполнением анализа главных компонент и связанного с ним ортогонального преобразования в собственном базисе.

Известен «Способ и система для распознавания лица с учетом списка людей, не подлежащих проверке» (патент RU №2381553 опубликованный 10.02.2010) распознавания изображений лиц с проблемами освещения, основанный на дополнении базы эталонов изображениями лиц незарегистрированных людей и выполнении верификации, основанной не только на мере схожести тестового и зарегистрированного лица, но и на множестве незарегистрированных лиц. Недостатком способа являются сложность выбора изображений лиц «не зарегистрированных людей» для обеспечения репрезентативности такой базы и, как следствие, - невозможность обеспечения высокого качества распознавания, а также сложность реализации используемого в заявленном способе классификатора.

Наиболее близким является способ - «Обработка и распознавание изображений лиц с проблемами освещения» (Известия СПбГЭТУ «ЛЭТИ» /2012/ №5, с.59-67), который заключается в разделении на регистрацию и распознавание, при которых в регистрации вводятся исходные изображения лиц, не содержащие локальных или глобальных теней и бликов на области лица, выполняется для всех изображений одномерный РСА по строкам, выполняется для всех изображений одномерный РСА по столбцам, выполняются для каждого изображения отдельно гамма-коррекция и логарифмирование значений их яркости, преобразуются полученные при этом два новых изображения в спектры с помощью двумерного преобразования Карунена-Лоэва (2DKLT), удаляются высокочастотные спектральные компоненты, близкие по значениям к нулю, и записывается полученная пара спектров в базу эталонов, а в распознавании вводятся тестовые изображения лиц с проблемами освещения (бликами, локальными или глобальными тенями и очень низким уровнем яркости), вычисляется среднее значение яркости каждого тестового изображения, выполняются отдельно гамма-коррекция и логарифмирование значений яркости, преобразуются полученные при этом два новых изображения в спектры с помощью 2DKLT, удаляются высокочастотные спектральные компоненты, близкие по значениям к нулю, сравниваются полученные тестовые спектры со спектрами, хранящимися в базе эталонов, на основе среднего значения яркости тестового изображения: если среднее значение яркости тестового изображения больше некоторого порога, то выполняется сравнение тестового спектра, полученного на основе гамма-коррекции, со спектрами, хранящимися в базе эталонов, полученными на основе гамма-коррекции; если среднее значение яркости тестового изображения меньше порога, то в полученных тестовых спектрах дополнительно удаляются низкочастотные составляющие, выполняется объединение спектров, хранящихся в базе эталонов, выполняется объединение тестовых спектров, не содержащих низкочастотные составляющие, выполняется сравнение полученных объединенных тестовых спектров с объединенными спектрами, хранящимися в базе эталонов, принимается решение о распознавании.

Система для осуществления способа состоит из последовательно соединенных устройства регистрации и устройства распознавания, при этом первый вход системы является входом устройства регистрации, а второй вход системы является входом устройства распознавания, выходом системы является выход устройства распознавания, причем устройство регистрации содержит последовательно соединенные два блока одномерного РСА, блок гамма-коррекции, блок 2DKLT, соединенный с первым входом блока базы эталонов, а также последовательно соединенные первый вход системы, информационный вход сумматора, блок логарифмирования, последовательно соединенные два блока одномерного РСА, блок гамма-коррекции, блок 2DKLT, соединенный со вторым входом блока базы эталонов, два выхода которого соединены с первым и вторым информационными входами классификатора, а устройство распознавания содержит последовательно соединенные второй вход системы, информационный вход сумматора, блок логарифмирования, блок 2DKLT, соединенный с третьим входом классификатора, а также последовательно соединенные второй вход системы, вход блока гамма-коррекции, блок 2DKLT, соединенный с четвертым входом классификатора, а также последовательно соединенные второй вход системы, блок вычисления среднего значения, блок определения способа формирования спектров для сравнения, первый вход которого соединен с выходом блока вычисления среднего значения, управляющий вход является входом установки порога, а управляющий выход которого соединен с управляющим входом блока классификатора, выход которого является выходом системы.

Недостатком решения является его низкая универсальность, связанная с невозможностью его применения в условиях динамики изменения баз эталонов, поскольку дополнение баз новыми эталонами или исключение из баз неактуальных эталонов потребует повторной трансформации исходных изображений в новое пространство признаков на основе метода 2DPCA\2DKLT, что прервет работу системы распознавания. Кроме того, использование методов двумерной проекции на основе 2DPCA, принятое в прототипе, требует выполнения условий равенства размеров всех изображений лиц (как эталонных, так и тестовых), использования трудоемких методов решения задач на собственные значения и соответствующих им процедур регуляризации. Наконец, в данном решении, этап 2DKLT не может быть выполнен по схеме «быстрых алгоритмов», что вместе с затратами на этапе 2DPCA приводит к существенным вычислительным затратам, снижающим уровень быстродействия устройства.

Техническим результатом, на которое направлено изобретение, является повышение быстродействия распознавания изображений лиц (с бликами, локальными и глобальными тенями на лицах и очень низким уровнем яркости изображений лиц) и повышение его универсальности за счет исключения процедур 2DPCA\2DKLT и использования вместо них процедур двумерного косинус-преобразования (2DDCT).

Указанный технический результат достигается за счет того, что распознавание изображений лиц, разбивается на регистрацию и распознавание, причем при регистрации вводятся исходные изображения лиц, не содержащие локальных или глобальных теней и бликов на области лица, выполняются для каждого изображения отдельно гамма-коррекция и логарифмирование значений яркости изображений, преобразуются полученные при этом два новых изображения в спектры, удаляются высокочастотные спектральные компоненты, близкие по значениям к нулю, и записывается полученная пара спектров в базу эталонов, а в распознавании вводятся тестовые изображения лиц с проблемами освещения (бликами, локальными или глобальными тенями и очень низким уровнем яркости), вычисляется среднее значение яркости каждого тестового изображения, выполняются отдельно гамма-коррекция и логарифмирование значений яркости, преобразуются полученные при этом два новых изображения в спектры, удаляются высокочастотные спектральные компоненты, близкие по значениям к нулю, сравниваются полученные тестовые спектры со спектрами, хранящимися в базе эталонов, два новых изображения преобразуются в спектры с помощью двумерного косинус-преобразования, а сравнение полученных тестовых спектров со спектрами, хранящимися в базе эталонов, происходит на основе среднего значения яркости тестового изображения: если среднее значение яркости тестового изображения принадлежит диапазону, ограниченному разностью между средним значением и среднеквадратическим отклонением и суммой среднего значения и среднеквадратического отклонения всех исходных изображений, то выполняется сравнение тестового спектра, полученного на основе гамма-коррекции, со спектрами, хранящимися в базе эталонов, полученными на основе гамма-коррекции; если среднее значение яркости тестового изображения меньше, чем разность между средним значением и среднеквадратическим отклонение всех исходных изображений, то в полученных на основе гамма-коррекции и логарифмирования тестовых спектрах дополнительно удаляются низкочастотные составляющие, в противном случае спектры не меняются, выполняется объединение полученных тестовых спектров, выполняется объединение спектров, хранящихся в базе эталонов, полученных на основе гамма-коррекции и логарифмирования, выполняется классификация преобразованных тестовых спектров по критерию минимума расстояния, принимается решение о распознавании, а система для осуществления способа состоит из последовательно соединенных устройства регистрации и устройства распознавания, при этом первый вход системы является входом устройства регистрации, а второй вход системы является входом устройства распознавания, выходом системы является выход устройства распознавания, причем устройство регистрации содержит последовательно соединенные блок гамма-коррекции, вход которого является входом устройства регистрации, соединенный с первым входом блока базы эталонов, а также последовательно соединенные первый вход системы, информационный вход сумматора, блок логарифмирования, второй вход блока базы эталонов, два выхода которого соединены с первым и вторым информационными входами классификатора, а устройство распознавания содержит последовательно соединенные второй вход системы, информационный вход сумматора, блок логарифмирования, третий вход классификатора, а также последовательно соединенные второй вход системы, вход блока гамма-коррекции, четвертый вход классификатора, а также последовательно соединенные второй вход системы, блок вычисления среднего значения, блок классификатора, выход которого является выходом системы, устройство регистрации дополнительно содержит первый и второй блоки двумерного косинус-преобразования, входы которых соединены с выходом блока гамма-коррекции и выходом блока логарифмирования соответственно, а выходы блоков двумерного косинус-преобразования соединены с входами блока базы эталонов, устройство распознавания дополнительно содержит третий и четвертый блоки косинус-преобразования, входы которых соединены с выходом блока гамма-коррекции и выходом блока логарифмирования соответственно, а выходы блоков двумерного косинус-преобразования соединены с входами блока классификации, а также блок формирования спектров, первый вход которого соединен с выходом блока вычисления среднего значения, управляющий вход является входом установки диапазона, а управляющий выход которого соединен с управляющим входом блока классификатора, выход которого является выходом системы.

Указанный результат достигается за счет того, что процедуры 2DDCT, как единственный инструмент трансформации исходных данных в спектральное пространство признаков, не требуют проведения предварительного анализа исходных данных, реализуются на основе быстрых алгоритмов и адаптированы к переменному размеру исходных изображений.

Сущность изобретения поясняется на фиг.1 - где изображена функциональная схема системы, фиг.2 - где представлен пример исходных цифровых изображений, определяющих эталоны, фиг.3 - где представлен пример цифровых тестовых изображений одного и того же человека, предназначенных для распознавания (эти изображения могут содержать на области лиц глобальные и локальные тени, блики и могут иметь очень низкий уровень яркости), фиг.4 - где представлены результаты уменьшения градиентов яркости для лиц, имеющих все виды теней, фиг.5 - где представлена динамика процесса и результат классификации тестовых изображений в рамках предложенного способа, фиг.6 - где представлены результаты классификации тестовых изображений внутри каждого состава базы данных «Yale В».

Способ осуществляется с помощью системы, функциональная схема которой изображена на фиг.1, состоящей из последовательно соединенных устройства регистрации 1 и устройства распознавания 2, при этом первый вход системы является входом устройства регистрации 1, а второй вход системы является входом устройства распознавания 2, выходом системы является выход устройства распознавания 2, причем устройство регистрации 1 содержит последовательно соединенные блок 3 гамма-коррекции, вход которого является входом устройства регистрации, блок 4 двумерного косинус-преобразования, соединенный с первым входом блока 5 базы эталонов, а также последовательно соединенные первый вход системы, информационный вход блока 6 сумматора, блок 7 логарифмирования, блок 8 двумерного косинус-преобразования, второй вход блока 5 базы эталонов, два выхода которого соединены с первым и вторым информационными входами блока 12 классификатора, а устройство распознавания 2 содержит последовательно соединенные второй вход системы, информационный вход блока 9 сумматора, блок 10 логарифмирования, блок 11 двумерного косинус-преобразования, соединенный с третьим входом блока 12 классификатора, а также последовательно соединенные второй вход системы, вход блока 13 гамма-коррекции, блок 14 двумерного косинус-преобразования, соединенный с четвертым входом блока 12 классификатора, а также последовательно соединенные второй вход системы, блок 15 вычисления среднего значения, блок 16 формирования спектров для сравнения, управляющий вход которого является входом установки значений Р1 и Р2, а управляющий выход которого соединен с управляющим входом блока 12 классификатора, выход которого является выходом системы.

Способ осуществляется следующим образом. На вход 1 системы устройства регистрации 1 подаются исходные цифровые изображения, определяющие эталоны. При этом эти изображения не содержат на области лиц каких-либо теней, бликов и имеют нормальное освещение и, таким образом, не имеют проблем с освещением. Пример изображений представлен на фиг.2 для 24 лиц различных людей. Число исходных изображений для формирования базы эталонов определяется параметром K>>1.

В блоке 3 для каждого исходного изображения выполняется гамма-коррекция значений его яркости и сохранение полученного изображения-результата: если I - изображение размера M×N, то гамма-коррекция изображения с целью повышения его яркости, реализуется следующим образом:

$i_{G} (m, n) = i {(m, n)}^{γ}, \forall m = 1, 2, \dots, M и n = 1, 2, \dots, N, (1)$

где i_G(m,n) - пиксель откорректированного изображения;

γ - коэффициент степенного преобразования, причем здесь γ<<1.

В блоке 6 для каждого исходного изображения все пиксели, имеющие нулевые значения яркости, заменяются на значения «1» так, что:

$i (m, n) = i (m, n) + 1, \forall i (m, n) \equiv 0 . (2 a)$

В блоке 7 для каждого изображения полученного в блоке 6 выполняется логарифмирование значений яркости и сохранение полученного изображения-результата

$i_{l} (m, n) = l o g (i (m, n)), \forall m = 1, 2, \dots, M и n = 1, 2, \dots, N . (2 b)$

В блоках 4 и 8 - выполняется двумерное дискретное косинус-преобразование, преобразующее изображения, полученные в блоках 3 и 7 соответственно в спектр. Здесь же выполняется селекция спектральных компонент с тем, чтобы удалить высокочастотные составляющие, близкие по значениям к нулю. При выполнении селекции учитывается следующий факт: косинус-преобразование достаточно точно представляет исходные изображения с лицами малым числом признаков - спектральных компонент DCT. Это основано на том, что энергетически значимые спектральные компоненты DCT концентрируются в левом верхнем углу матрицы - результата DCT. При этом для относительно точной реконструкции области лица достаточно не более 20 пространственных спектральных компонент, выбранных из верхнего левого угла спектра, если исходные изображения не имеют проблем с освещением.

Определим 2D DCT в следующей матричной форме:

$Y = F_{1} I F_{2}, (3)$

где I - исходное изображение размера M×N; Y - результат преобразования; F1 и F2 - матрицы проекции размером d₁×M и N×d₂, причем:

$F_{1} = [f (d_{1}, m)]$ , $f (d_{1}, m) = {\begin{cases} 1 / \sqrt{M} \\ \sqrt{\frac{2}{M}} \cos \frac{π (2 m + 1) d_{1}}{2 M} \end{cases},$ $\begin{matrix} i f d_{1} = 0, \\ i f d_{1} = 1, \dots, D_{1} - 1, \\ \forall m = 0,1, \dots, M - 1. \end{matrix}$

$F_{2} = [f (n, d_{2})]$ , $f (n, d_{2}) = {\begin{cases} 1 / \sqrt{N} \\ \sqrt{\frac{2}{N}} \cos \frac{π (2 n + 1) d_{2}}{2 N} \end{cases},$ $\begin{matrix} i f d_{2} = 0, \\ i f d_{2} = 1, \dots, D_{2}, \\ \forall n = 0,1, \dots, N - 1 \end{matrix}$

Блок 5 сохраняет спектральные признаки в базе эталонов в форме векторов отдельно для каждой пары изображений: как обработанных в канале гамма-коррекции, так и в канале логарифмирования.

На вход 2 системы устройства распознавания 2 подаются цифровые тестовые изображения, предназначенные для распознавания. Эти изображения могут содержать на области лиц глобальные и локальные тени, блики и могут иметь очень низкий уровень яркости. Пример 36 изображений лица одного и того же человека, имеющих разное освещение, представлен на фиг.3.

В блоке 9 для каждого тестового изображения все пиксели, имеющие нулевые значения яркости, заменяются на значения «1» в соответствии с выражением (2а).

В блоке 10 выполняется логарифмирование значений яркости изображений, полученных в блоке 9 в соответствии с выражением (2b).

В блоке 13 для каждого тестового изображения, предназначенного для распознавания, выполняется гамма-коррекция значений его яркости в соответствии с выражением (1)

В блоках 11 и 14 выполняется двумерное дискретное косинус-преобразование, преобразующее каждое изображение, полученное в блоках 10 и 13 соответственно в спектр по формуле (3). Здесь же выполняется селекция спектральных компонент с тем, чтобы удалить высокочастотные составляющие, близкие по значениям к нулю.

В блоке 15 вычисляется среднее значение J яркости тестового изображения.

В блоке 16 определяется способ формирования спектра для классификации - для каждого тестового изображения среднее значение J яркости сравнивается с заданными пороговыми значениями яркости $P 1 = \bar{X} - | σ |$ и $P 2 = \bar{X} + | σ |$ ,

где $\bar{X} = \frac{\sum_{i = 1}^{M} \sum_{j = 1}^{N} I_{i j}}{M \times N}$ - среднее значение исходных изображений,

$σ = \sqrt{\frac{\sum_{i = 1}^{M} \sum_{j = 1}^{N} (I_{i j} - \bar{X})}{M \times N}}$ - среднеквадратическое отклонение.

Если среднее значение яркости тестового изображения P1<J<P2, то распознавание изображений будет выполняться на основе спектров, полученных в блоках 4 и 14, в противном случае будет выполняться объединение спектров, полученных в блоках 8 и 11, 4 и 14. Если J<P1, то это свидетельствует о том, что распознаваемое изображение имеет очень низкий уровень яркости, поэтому в спектрах, полученных в блоках 11 и 14, перед объединением дополнительно удаляются низкочастотные составляющие.

Это решение позволяет элиминировать все признаки, составляющие информацию о локальных и глобальных тенях на лицах. Таким образом, в дальнейшем распознавании участвуют только составляющие спектра, соответствующие чертам лица человека без теней.

Блок 12 решает задачу классификации распознаваемых изображений (задачу их принадлежности к заданным эталонам) по критерию минимума расстояний. Конкретно, здесь вычисляются расстояния между вектором признаков распознаваемого изображения и всеми K векторами признаков из базы эталонов. Индекс k∈K, соответствующий минимуму расстояния, будет означать соответствие распознаваемого изображения эталону с порядковым номером k.

Основными отличительными признаками заявляемого способа являются:

- использование изображений базы эталонов при условии, что она не содержит изображений с локальными и/или глобальными тенями или бликами;

- использование простой предобработки исходных изображений с целью уменьшения градиента изменений яркости (гамма-коррекция с фиксированным параметром и логарифмирование);

- использование метода двумерного дискретного косинус-преобразования как единственного инструмента трансформации исходных данных в спектральное пространство признаков;

- исключение из состава спектральных признаков тех составляющих, которые связаны с тенями и бликами, а также тех составляющих, которые связаны с шумами на распознаваемых изображениях;

- использование механизма совмещения (фузии) спектральных признаков изображений на этапе их классификации, в случаях низкого уровня яркости распознаваемых изображений.

Результативность распознавания изображений с проблемами освещения по предлагаемому способу доказана компьютерным моделированием и экспериментами, выполненными на базе изображений лиц «Yale В», специально предназначенной для тестирования методов распознавания лиц со всеми типами теней.

Модель экспериментов имеет следующий вид:

$Y a l e B (38 / 1 / 2414) {G & L o g / 2 D D C T : 192 \times 168 \to d \times d} [Ф + К М Р / L 1 / r a n k = 1] (4)$

Здесь приняты следующие обозначения:

Yale(38/l/2414) - использована база изображений, состоящая из 38 эталонов (по одному на класс), а число тестовых образов составило 2414.

G&Log/2DDCT - реализована гамма-коррекция/логарифмирование эталонных данных и двумерное косинус-преобразование (то есть преобразования выполнены только на этапе проекции эталонных и тестовых данных);

192×168→d×d - представлены размеры исходных изображений и размерность матриц-результатов проекции после редукции размерности пространства признаков;

Ф+КМР/L1/rank=1 - использована процедура объединения признаков (фузия) и классификатор по минимуму расстояния с метрикой L1, а результат оценивается по первому месту (rank=1).

На фиг.4 представлены результаты уменьшения градиентов яркости для лиц, имеющих все виды теней. Видно, что уже на этом этапе хорошо выявляются основные черты лиц, что создает предпосылки для распознавания лиц с проблемами освещения.

Динамика процесса и результат классификации тестовых изображений в рамках предложенного способа показан на фиг.5. В эксперименте использована база исходных изображений, состоящая из 38 эталонов (по одному на класс), а число тестовых образов составило 2414. Здесь 130 изображений из 2414 были классифицированы неверно, поэтому результат составил около 94.6%. Вертикальные сплошные линии определяют границы составов данных, соответствующих каждому типу теней.

В таблице 1 на фиг.6 приведены результаты классификации тестовых изображений внутри каждого состава. «Начальная компонента» (НК) определяет номер, с которого начинается отсчет элементов из левого верхнего угла спектральной матрицы. Для параметра НК=14 это соответствует «обнулению» первых 13-ти (низкочастотных) компонент спектра. Значения параметров «d» (d1=d2=d) и НК получены при моделировании и исследовании алгоритма классификации в рамках решения соответствующей вариационной задачи.

Предпочтительным вариантом реализации устройства является его использование для повышения эффективности существующих систем видеонаблюдения и создания нового класса интеллектуальных систем, рассчитанных на следующие типы приложений: интеллектуальное видеонаблюдение, биометрическая идентификация личности. При этом прибор реализуется в виде платы устройств, в состав которой входит, по крайней мере, один сигнальный процессор.

Таким образом, предложенный способ распознавания изображений лиц обеспечивает приемлемый для практики результат в условиях возникновения проблем с их освещением и появлением бликов, локальных и глобальных теней на лицах и очень низким уровнем их яркости при низких вычислительных затратах и возможной динамике базы эталонов.

1. Способ распознавания изображений лиц, состоящий из регистрации и распознавания, при которых в регистрации вводятся исходные изображения лиц, не содержащие локальных или глобальных теней и бликов на области лица, выполняются для каждого изображения отдельно гамма-коррекция и логарифмирование значений их яркости, преобразуются полученные при этом два новых изображения в спектры, удаляются высокочастотные спектральные компоненты, близкие по значениям к нулю, и записывается полученная пара спектров в базу эталонов, а в распознавании вводятся тестовые изображения лиц с проблемами освещения (бликами, локальными или глобальными тенями и очень низким уровнем яркости), вычисляется среднее значение яркости каждого тестового изображения, выполняются отдельно гамма-коррекция и логарифмирование значений яркости тестовых изображений, преобразуются полученные при этом два новых изображения в спектры, удаляются высокочастотные спектральные компоненты, близкие по значениям к нулю, сравниваются полученные тестовые спектры со спектрами, хранящимися в базе эталонов, отличающийся тем, что изображения, полученные после гамма-коррекции и логарифмирования, преобразуются в спектры с помощью двумерного косинус-преобразования, а сравнение полученных тестовых спектров со спектрами, хранящимися в базе эталонов, происходит на основе среднего значения яркости тестового изображения: если среднее значение яркости тестового изображения принадлежит диапазону, ограниченному разностью между средним значением и среднеквадратическим отклонением и суммой среднего значения и среднеквадратического отклонения всех исходных изображений, то выполняется сравнение тестового спектра, полученного на основе гамма-коррекции, со спектрами, хранящимися в базе эталонов, полученными на основе гамма-коррекции; если среднее значение яркости тестового изображения меньше, чем разность между средним значением и среднеквадратическим отклонением всех изображений, то в полученных на основе гамма-коррекции и логарифмирования тестовых спектрах дополнительно удаляются низкочастотные составляющие, в противном случае спектры не меняются, выполняется объединение тестовых спектров, выполняется объединение спектров, полученных на основе гамма-коррекции и логарифмирования, хранящихся в базе эталонов, выполняется классификация преобразованных тестовых спектров по критерию минимума расстояния, принимается решение о распознавании.

2. Система для осуществления способа по п.1, состоящая из последовательно соединенных устройства регистрации и устройства распознавания, при этом первый вход системы является входом устройства регистрации, а второй вход системы является входом устройства распознавания, выходом системы является выход устройства распознавания, причем устройство регистрации содержит последовательно соединенные блок гамма-коррекции, вход которого является входом устройства регистрации, соединенный с первым входом блока базы эталонов, а также последовательно соединенные первый вход системы, информационный вход сумматора, блок логарифмирования, второй вход блока базы эталонов, два выхода которого соединены с первым и вторым информационными входами классификатора, а устройство распознавания содержит последовательно соединенные второй вход системы, информационный вход сумматора, блок логарифмирования, третий вход классификатора, а также последовательно соединенные второй вход системы, вход блока гамма-коррекции, четвертый вход классификатора, а также последовательно соединенные второй вход системы, блок вычисления среднего значения, блок классификатора, выход которого является выходом системы, отличающаяся тем, что устройство регистрации дополнительно содержит первый и второй блоки двумерного косинус-преобразования, входы которых соединены с выходом блока гамма-коррекции и выходом блока логарифмирования соответственно, а выходы блоков двумерного косинус-преобразования соединены с входами блока базы эталонов, а устройство распознавания дополнительно содержит третий и четвертый блоки двумерного косинус-преобразования, входы которых соединены с выходом блока гамма-коррекции и выходом блока логарифмирования соответственно, а выходы блоков двумерного косинус-преобразования соединены с входами блока классификации, а также блок формирования спектров, первый вход которого соединен с выходом блока вычисления среднего значения, управляющий вход является входом установки диапазона, а управляющий выход которого соединен с управляющим входом блока классификатора, выход которого является выходом распознавания.

Изобретение относится к вычислительной технике и может быть применено в автоматических дактилоскопических идентификационных системах на базе специализированных электронных вычислительных машин.

Способ обработки выходных данных оптического распознавания символов (ocr), где выходные данные содержат изображения дважды отпечатанных символов // 2439700

Изобретение относится к способам оптического распознавания символов и может быть использовано для обработки выходных данных из системы оптического распознавания изображений (OCR), где выходные данные включают изображения дважды отпечатанных символов.

Способ распознавания объектов // 2438174

Изобретение относится к способам распознавания объектов в системах машинного зрения, телевизионных системах наблюдения, информационно-управляющих системах робототехнических комплексов.

Способ анонимной биометрической регистрации человека // 2371765

Изобретение относится к технике защиты врачебной тайны при ведении обезличенных электронных историй болезни. .

Способ определения толщины льда замерзающих акваторий // 2319205

Изобретение относится к области гидрологии и связано с определением толщины ледяного покрова замерзающих акваторий по данным дистанционных средств измерений, устанавливаемых на метеорологических искусственных спутниках Земли.

Система мгновенного компьютерного распознавания объектов и способ распознавания // 2308081

Система идентификации изображений // 2302656

Устройство для распознавания печатных и рукопечатных изображений символов // 2285952

Изобретение относится к автоматике и цифровой вычислительной технике. .

Способ приведения в соответствие заполненной машиночитаемой формы и ее шаблона при наличии искажений (варианты) // 2251738

Изобретение относится к оптическому распознаванию символов. .

Способ автоматического определения языка распознаваемого текста при многоязычном распознавании // 2251737

Изобретение относится к области оптического распознавания символов, а именно к способам распознавания текстовых документов, содержащих фрагменты, написанные на разных языках, из растрового изображения.

Способ гребневого счета на основе топологии дактилоскопического узора // 2444058

Изобретение относится к области криминалистики и предназначено для кодирования отпечатков пальцев, ладоней и ступней ног. .

Способ определения количества объектов на плоской поверхности // 2420801

Изобретение относится к области распознавания данных. .

Способ кодирования папиллярного узора // 2413300

Изобретение относится к области криминалистики и предназначено для кодирования отпечатков папиллярных узоров. .

Способ кодирования дактилоскопического узора // 2381554

Изобретение относится к кодированию дактилоскопических узоров и позволяет получить технический результат в виде повышения надежности идентификации отпечатков. .

Способ кодирования отпечатка папиллярного узора // 2321057

Изобретение относится к кодированию отпечатков папиллярных узоров и позволяет получить технический результат в виде повышения устойчивости описания системы признаков отпечатков.

Способ кодирования отпечатка папиллярного узора // 2298828

Изобретение относится к кодированию папиллярного узора и позволяет получить технический результат в виде уменьшения вероятности ошибки при идентификации человека по отпечаткам пальцев и ладоней.

Способ определения степени покрытия поверхности рабочей жидкостью // 2290693

Изобретение относится к определению степени покрытия поверхности рабочей жидкостью. .

Способ обнаружения изменяющихся объектов // 2246760

Изобретение относится к экспериментальной астрофизике. .

Устройство и способ для описания, кодирования, хранения и поиска изображений по их геометрии // 2238586

Изобретение относится к области распознавания и сравнения изображений. .

Компьютеризированная система для поиска и классификации микрообъектов // 2237923

Изобретение относится к автоматике и вычислительной технике. .

Способ идентификации печатной формы документа и устройство для этой цели // 2511616

Изобретение относится к средствам идентификации печатной формы документа. Технический результат заключается в повышении защищенности и быстродействия идентификации. В способе осуществляют: этап печати по меньшей мере одного документа упомянутой печатной формой; этап захвата с высоким разрешением по меньшей мере одного изображения по меньшей мере одной части указанного документа; этап извлечения геометрической характеристики по меньшей мере из одного захваченного изображения; этап сохранения извлеченной геометрической характеристики. В процессе идентификации определяют, использовалась ли упомянутая печатная форма для печати документа-кандидата, при этом осуществляют этап захвата с высоким разрешением изображения части упомянутого документа-кандидата, соответствующей части документа, геометрическая характеристика которой была сохранена. Затем осуществляют этап извлечения из изображения упомянутого документа-кандидата геометрической характеристики, соответствующей сохраненной геометрической характеристике, и этап определения того, превосходит ли мера корреляции геометрической характеристики упомянутого документа-кандидата и сохраненной геометрической характеристики заранее заданного предельного значения. 2 н. и 8 з.п. ф-лы, 37 ил., 1 табл.