Способ формирования штрихкода по изображениям лиц и устройство для его осуществления

Изобретение относится способу формирования штрихкода по изображениям лиц и устройству для его осуществления. Техническим результатом является повышение стабильности кодирования изображений лиц в условиях динамики их параметров и повышение его универсальности за счет формирования стандартных штрихкодов. Способ формирования штрихкода по изображениям лиц заключается в выполнении корректировки изображения по размеру и повороту, вычислении расстояния между двумя зеркально расположенными окнами, имеющими одинаковую ширину и длину, равную ширине исходного изображения, синхронно перемещающимися по изображению лица в вертикальном направлении сверху вниз с шагом ≥1 от границы «волосы/лоб» до нижней границы области носа, нахождении из полученных разностных градиентов яркости максимального значения, делении разностных градиентов яркости на максимальное значение, выполнении дискретизации с усреднением полученных значений, квантовании дискретизированных значений в диапазоне десятичных цифр от 0 до 9, формировании из полученного десятичного кода стандартного штрихкод изображения. 2 н.п. ф-лы, 8 ил.

 

Изобретение относится к автоматике и вычислительной технике и может быть использовано для кодирования изображений лиц в форме штрихкодов, которые применяются в биометрических системах контроля доступа («Acess Control») и интерактивных системах человек-компьютер для идентификации пользователя, для распознавания изображений лиц в системах видеонаблюдений и других системах. Техническим результатом является повышение стабильности кодирования изображений лиц в условиях динамики их параметров (яркости изображений, локальных размеров и наклона области лиц на изображениях, а также мимики лиц) и повышение его универсальности за счет формирования стандартных штрихкодов.

Динамика изменения параметров изображений лиц (яркости изображений, локальных размеров и наклона области лиц на изображениях, а также мимики лиц) в реальных условиях остается одной из нерешенных сегодня проблем в практике представления изображений лиц в форме штрихкодов. В основе этой проблемы лежит невозможность представления изображений лиц в форме инвариантных признаков, не зависящих от динамики параметров исходных изображений в самом общем случае. В свою очередь, неивариантность признаков приводит к нестабильности формируемых штрихкодов, какую бы форму эти коды не принимали. Использование таких нестабильных кодов становится невозможным, например, в системах класса «Acess Control». И хотя в таких системах изменения параметров исходных изображений с лицами не так значительны, поскольку здесь применяется стабилизация параметров изображений (освещение лиц перед камерами, контроль поворота, мимики и т.д.), но даже и в этих случаях получение стабильных штрихкодов остается под вопросом. Решение этой проблемы позволило бы упростить идентификацию лиц, повысить быстродействие соответствующих систем распознавания и повысить их надежность, поскольку устройства считывания штрихкодов и их декодирование давно и эффективно применяется в различных практических приложениях. Именно поэтому, интерес к проблеме стабильного представления изображений лиц в форме штрихкодов не ослабевает, по сути, с момента появления первых компьютерных систем распознавания.

Известен способ идентификации людей по штрихкоду «Method for verifying human identity during electronic sale transactions» (патент US 005878155A опубликованный 02.03.99), в котором идентификация человека осуществляется в момент реализации им электронных платежей. При этом уникальный штрихкод нанесен на руку человека и считывается специальным устройством. Недостатком этого решения является чрезвычайно малый объем информации о характеристиках субъекта, содержащейся в штрихкоде, что не позволяет сформировать уникальный штрихкод и выполнить точную биометрическую идентификацию конкретного человека.

Известен способ представления изображения лица в виде «биологического штрихкода» (Dakin S.С., Watt R.J. Biological ″bar codes″ in human faces. - Journal of Vision, 2009, vol.9, №.4, pp.1-10), в котором вся информация о человеческом лице содержится в совокупности горизонтальных линий, таких как линия бровей, линия глаз и линия губ. При этом указанную информацию можно с успехом представить в виде набора черных и белых линий в виде некоторого штрихкода. Недостатком этого способа является отсутствие стабильности кодирования изображений лиц в условиях заметной динамики изменений их параметров (яркости изображений, локальных размеров и наклона области лиц на изображениях, а также мимики лиц).

Известен способ формирования штрихкода для изображений лиц (Querini М., Italiano G.F. Facial recognition with 2D color barcodes. - International Journal of Computer Science and Application, 2013, vol.10, №.1, pp.78-97), в основе которого лежит поиск на области лица особых (ключевых) точек, описании их окрестностей с помощью дескрипторов и формировании двумерного цветного штрихкода HCC2D. Код HCC2D сочетает в себе достоинства двумерного кода НССВ (High Capacity Color Barcode) и двумерного кода QR, но отличается от них высокой плотностью упаковки информации. Первым существенным недостатком способа является слишком сложные методы поиска особых (ключевых) точек на изображении лица и описания их окрестностей, основанные на использовании SIFT (Scale Invariant Feature Transform) и SURF (Speeded Up Robust Features). Кроме того, результат поиска особых (ключевых) точек на основе SURF не инвариантен к масштабу, что требует декомпозиции исходного изображения с лицом на пирамиду разномасштабных областей и многократного применения метода SURF для каждой области пирамиды. Это еще больше усложняет поиск ключевых точек. Вторым существенным недостатком является то, что формируемый код HCC2D чувствителен к геометрическим искажениям, поэтому для его нанесения и правильного определения требуется плоская поверхность, что связано с необходимостью считывания кода HCC2D строго параллельно по заданным осям, так как на точность его распознавания влияет угол, под которым код виден считывающим устройством.

Наиболее близким является способ (формирование бинарных кодов для изображений лиц, представленный на стр.170 и стр.213-214 монографии «Методы обработки и распознавания изображений лиц в задачах биометрии». - Под ред. М.В. Хитрова. - СПб: Политехника, 2013), который заключается в выполнении корректировки изображения по повороту, вычислении расстояния между двумя зеркально расположенными окнами, имеющими одинаковую ширину и длину, равную ширине исходного изображения, синхронно перемещающимися по изображению лица сверху вниз и слева на право с шагом ≥1 по всему изображению, вычислении среднего значения полученных разностных градиентов яркости, вычислении разности между полученными значениями градиентов и их средним значением, выполнении кодирования полученных разностей - если значение меньше нуля, то оно записывается как «0», если больше или равно нулю, то оно записывается как «1», полученный бинарный код представляет исходное изображение.

Устройство для осуществления способа состоит из блока анализа входного изображения, блока вычисления разностных градиентов в окнах и блока выбора параметров кодирования, выход которого соединен с первым входом блока вычисления разностных градиентов в окнах, при этом вход блока анализа входного изображения является первым входом устройства, а вход блока выбора параметров кодирования является вторым входом устройства, блок коррекции изображения по повороту, первый вход которого соединен с выходом блока анализа входного изображения, второй вход соединен с вторым входом устройства, а выход соединен со вторым входом блока вычисления разностных градиентов в окнах, блок генерации бинарного кода, вход которого соединен с выходом блока вычисления разностных градиентов в окнах, а выход является выходом устройства.

Недостатком способа является нестабильность результата, а именно - невозможность получения одинакового бинарного кода для изображений лиц одного и того же человека, в случаях, когда области лиц на исходных изображениях отличаются своими параметрами - незначительными изменениями размеров, наклоном (в плоскости XY), мимикой лиц, а также изменениями их яркости. Этот недостаток не позволяет использовать указанный способ в условиях динамики изменений изображений лиц по перечисленным выше параметрам, а стало быть, не может быть применен в системах, требующих высокой точности преобразования изображений лиц в соответствующий код. Кроме того, указанный способ не позволяет непосредственно по бинарному коду сформировать соответствующий стандартный штрихкод изображения лица, что еще больше ограничивает возможность его применения.

Техническим результатом, на которое направлено изобретение, является повышение стабильности кодирования изображений лиц в условиях заметной динамики изменений их параметров (яркости изображений, локальных размеров и наклона области лиц на изображениях, а также мимики лиц) и повышение его универсальности за счет формирования стандартных штрихкодов.

Указанный технический результат достигается за счет того, что выполняется корректировка изображения по размеру и повороту, вычисляются расстояния между двумя зеркально расположенными окнами, имеющими одинаковую ширину и длину, равную ширине исходного изображения, синхронно перемещающимися по изображению лица в вертикальном направлении сверху вниз с шагом ≥1 от границы «волосы/лоб» до нижней границы области носа, из полученных разностных градиентов яркости находится максимальное значение, разностные градиенты яркости делятся на максимальное значение, выполняется дискретизация с усреднением полученных значений, выполняется квантование дискретизированных значений в диапазоне десятичных цифр от 0 до 9, из полученного десятичного кода формируется стандартный штрихкод изображения, а устройство для осуществления способа состоит из блока анализа входного изображения, блока вычисления разностных градиентов в окнах и блока выбора параметров кодирования, первый выход которого соединен с первым входом блока вычисления разностных градиентов в окнах, при этом вход блока анализа входного изображения является первым входом устройства, а вход блока выбора параметров кодирования является вторым входом устройства, дополнительно введены блок коррекции изображения по размеру и повороту, первый вход которого соединен с выходом блока анализа входного изображения, второй вход соединен с вторым входом устройства, а выход соединен со вторым входом блока вычисления разностных градиентов в окнах, блок нормирования и кодирования градиентов, блок генерации штрихкода, выход которого является выходом устройства, первый вход соединен с выходом блока нормирования и кодирования градиентов, а второй вход соединен с третьим выходом блока выбора параметров кодирования, второй выход которого соединен с первым входом блока нормирования и кодирования градиентов, второй вход которого соединен с выходом блока вычисления разностных градиентов в окнах.

Указанный результат достигается за счет изменения способа вычисления градиентов яркости, изменения способа их кодирования и введения дополнительной процедуры формирования стандартного штрихкода.

При этом градиенты яркости вычисляются в скользящих окнах как разностные градиенты, по которым далее вычисляются расстояния между соответствующими областями изображений, «накрываемых окнами». Скольжение окон начинается практически на границе «волосы/лоб», а заканчивается на нижней границе области носа. Разностные градиенты в окнах, преобразованные в расстояния, подчеркивают перепады значений яркости на границе волосы/лоб, границах линии бровей, линии глаз и лини нос/губы - то есть именно по линиям «биологического кода лица». Вычисленные значения расстояний представляют, таким образом, интегральную характеристику наименее изменяемой части лица в условиях заметной динамики изменений параметров изображений с лицами. И, именно, использование этой характеристики является гарантией стабильности вычисляемых далее кодов.

Кодирование, состоящее из нормирования всех значений расстояний по максимуму, усреднения значений на заданном числе одинаковых временных интервалов и квантования усредненных значений в диапазоне десятичных цифр от 0 до 9, делает возможным представление исходного изображения в форме десятичного кода заданной длины.

Дополнительное введение формирования стандартного штрихкода позволяет представлять исходное изображение в графической форме штрихкода стандартного вида.

Предлагаемый в изобретении способ позволяет формировать линейные штриховые коды по изображениям лиц в формате EAN-8 и может быть применен для формирования линейных кодов в формате EAN-13 и UPS-A, поскольку эти форматы отличаются от формата EAN-8 только наличием цифровой преамбулы, характеризующей территориальную, социальную или ассортиментную принадлежность. При этом способ кодирования в формате EAN-13 и UPS-A аналогичен кодированию штрихкода в формате EAN-8, за исключением того, что здесь используется дополнительная таблица кодировки десятичных знаков в соответствующие штрихи.

Сущность изобретения поясняется на Фиг.1 - где представлена функциональная схема системы, Фиг.2 - где представлены примеры исходных изображений с изменениями их параметров (размеров и наклона области лиц на изображениях, а также мимики лиц и изменениями области глаз - открыты или закрыты), Фиг.3 - где представлено описание способа вычисления разностных градиентов яркости в скользящих окнах, Фиг.4 - где представлен способ нормирования и кодирования расстояний между разностными градиентами яркости и их представление в форме штрихкода по стандарту EAN-8, Фиг.5 - где показан пример работы системы, Фиг.6 - где показан результат формирования штрихкода для изображений разных классов, Фиг.7 - где показаны результаты формирования штрихкода для изображений мужчины, отличающихся мимикой, и штрихкода для зеркального поворота изображения, Фиг.8 - где показаны результаты формирования штрихкода для изображений женщины, отличающихся мимикой, и штрихкода для зеркального поворота изображения.

Способ осуществляется с помощью устройства, функциональная схема которого изображена на Фиг.1, состоящего из блока 1 анализа входного изображения, блока 3 вычисления разностных градиентов в окнах и блока 5 выбора параметров кодирования, первый выход которого соединен с первым входом блока 3 вычисления разностных градиентов в окнах, при этом вход блока 1 анализа входного изображения является первым входом устройства, а вход блока 5 выбора параметров кодирования является вторым входом устройства, дополнительно введены блок 2 коррекции изображения по размеру и повороту, первый вход которого соединен с выходом блока 1 анализа входного изображения, второй вход соединен с вторым входом устройства, а выход соединен со вторым входом блока 3 вычисления разностных градиентов в окнах, блок 4 нормирования и кодирования градиентов, блок 6 генерации штрихкода, выход которого является выходом устройства, первый вход соединен с выходом блока 4 нормирования и кодирования градиентов, а второй вход соединен с третьим выходом блока 5 выбора параметров кодирования, второй выход которого соединен с первым входом блока 4 нормирования и кодирования градиентов, второй вход которого соединен с выходом блока 3 вычисления разностных градиентов в окнах.

На первый вход устройства подаются исходные цифровые изображения с лицами в условиях возможной динамики изменений их параметров (яркости изображений, локальных размеров и наклона области лиц на изображениях, а также мимики лиц). Примеры таких изображений показаны на Фиг.2. [http://cswww.essex.ac.uk/mv/allfaces/index.html].

В блоке 1 выполняется анализ входного изображения: определяются размеры и шкала цветности изображения, определяется необходимость его поворота в плоскости XY, что возникает в случаях, когда линия глаз на изображении имеет наклон более чем 3 градуса. На этом этапе реализуются способы, представленные в монографии «Методы обработки и распознавания изображений лиц в задачах биометрии». - Под ред. М.В. Хитрова - СПб: Политехника, 2013.

В блоке 2 реализуется коррекция изображения по повороту в соответствии с информацией, поступающей из блока 1 (способами, представленными в монографии «Методы обработки и распознавания изображений лиц в задачах биометрии». - Под ред. М.В. Хитрова - СПб: Политехника, 2013) и по размеру в соответствии с поступающим на первый вход системы параметрами кодирования из блока 5.

При формировании штрихкода в формате EAN-8, длина кода L=7, параметр дискретизации mod≥8, который в общем случае выбирается из условия не пересечения границы

где М - количество строк пикселей исходного изображения, W - ширина полос.

При этом значение Т должно примерно приходиться на нижнюю границу носа на области лица (или, в крайнем случае, между носом и губами), что позволит исключить из рассмотрения нижнюю часть лица и, таким образом, элиминировать влияние эмоций на стабильность формирования штрихкода.

С другой стороны, если расчетное значение

то необходимо увеличивать размер исходного изображения, до выполнения условия (1).

В случае, показанном на Фиг.5, имеем: L=7, mod=8, и поэтому Т=56 и нижняя граница Т не доходит до нижней границы носа: в этом случае необходимо либо уменьшать размер исходного изображения, либо увеличивать ширину W полос.

Например, в формате EAN-8 код состоит из 8 цифр (из которых последняя цифра - это контрольная сумма), т.е. длина кода L=7, а параметр дискретизации mod≈(3N/4-W)1(L-1) с округлением до ближайшего целого. Ширина полос не должна превосходить 1/4 высоты исходного изображения (или числа строк) исходя из условия, что область лица практически точно вписана в прямоугольник исходного изображения, а размер изображения лица не должен быть меньше 112 пикселей по высоте.

В блоке 3 выполняется вычисление разностных градиентов яркости в окнах и формирование вектора расстояний. Пусть исходное изображение имеет размер 112×92 пикселя, начальное значение ширины окна W=10.

Преобразование изображения в штрихкод EAN-8 выполняется следующим образом.

1. В исходном положении два окна U и D, состоящие из W строк каждое, расположены зеркально относительно текущего значения t по оси Y.

Для t=1 ось симметрии этих полос определяется как х1=W. Всего выполняется Т=L×mod шагов скольжения, причем L - длина кода, a mod - интервал дискретизации.

Каждое последующее (текущее для t=2, 3, …Т) положение оси между окнами выбирается из условия:

где W - ширина полос; М - высота изображения; S - шаг скольжения.

При этом в верхнее и нижнее окно войдут строки исходного изображения соответственно с номерами:

2. Определяется расстояние d{t) между этими окнами:

Формирование разностных градиентов в скользящем окне подробно поясняется на Фиг.3: а - изображение с первоначальным положением двух прямоугольных окон (W - ширина окна); b - то же изображение с конечным положением двух прямоугольных окон; с - график, представляющий значения расстояний d(f) между соответствующими областями изображений, «накрываемых окнами», в зависимости от числа шагов t=1, 2, …, T скольжения. Полученный по (6) результат показан на Фиг.3с, который передается на вход блока 4.

Экстракция признаков из исходного изображения основана на процедуре вычисления разностных градиентов яркости двух зеркально расположенных окон шириной W≥1 пикселей и длиной, равной ширине исходного изображения. Окна синхронно перемещаются (скользят) по изображению лица с шагом S≥1 только в вертикальном направлении сверху вниз от границы «волосы/лоб» до нижней границы области носа и, на каждом шаге вычисляются расстояния между соответствующими областями изображений, «накрываемых окнами». Разностные градиенты в окнах, преобразованные в расстояния, подчеркивают перепады значений яркости на границе волосы/лоб, границах линии бровей, линии глаз и лини нос/губы - то есть именно по линиям «биологического кода лица». Вычисленные значения расстояний представляют, таким образом, интегральную характеристику наименее изменяемой части лица в условиях заметной динамики изменений параметров изображений с лицами.

В блоке 4 выполняется нормирование и кодирование градиентов, заключающееся в делении значений вектора расстояний d(t) на его элемент, имеющий максимальное значение, усреднении полученных значений на временном интервале mod и последующем их квантовании в диапазоне десятичных цифр от 0 до 9. Тем самым достигается представление вектора расстояний (а, следовательно, и исходного изображения) в форме десятичного кода заданной длины, что поясняется на Фиг.4а, b.

Эти операции можно записать следующим образом:

где f[·] - округление до целого с отбрасыванием дробной части; scale - масштабный множитель и 9<scale<10.

В результате выполнения (7) все значения вектора d будут находиться в диапазоне 0÷9.

Весь вектор d делится на L частей по mod значений в каждой и вычисляется их среднее значение так, что

для l=1, 2, …, L.

Результат (8) показан на Фиг.4b.

В блоке 5 выполняется выбор параметров: W - ширина полос сканировании исходного изображения, S - шаг скольжения, Т - длина вектора признаков, L - длина кода, представляющего вектор признаков, mod - интервал дискретизации, scale - масштабный множитель.

В блоке 6 на основе полученного результата блока 4 формируется стандартный штрихкод, тип которого определяется информацией, поступающей из блока 5. На Фиг.4с показан сформированный стандартный штрихкод EAN-8, который состоит из 8 цифр, причем 8-я цифра определяет контрольную сумму для первых 7 цифр, переданных из блока 4, его описание приведено в [http://www.cherry-notes.spb.ru/barcode_ean8.htm].

ПРИМЕРЫ РАБОТЫ СИСТЕМЫ

Работа системы формирования штрихкодов для изображений лиц проверялась на тестовой базе фотопортретов людей «Face 94», представленной на сайте [http://cswww.essex.ac.uk/mv/allfaces/index.html]. Использовались первые 100 классов изображений по 11 изображений в каждом классе этой базы, для которых определялся штрихкод EAN-8.

Исходные изображения были переведены в формат GRAY и приведены к размеру 112 на 92 пикселя. Никаких других операций анализа и поворота изображений для выравнивания уровня линии глаз не выполнялось.

Тест 1. Из каждого класса выбирался портрет под номером 1 и для него определялся штрихкод для следующих значений параметров управления процессом кодирования:

W=23 (ширина полос сканировании исходного изображения);

S=1 (шаг скольжения);

T=56 (длина вектора признаков);

L=7 (длина кода, представляющего вектор признаков);

mod=8 (интервал дискретизации);

scale=9.5 (масштабный множитель).

Затем для следующих десяти портретов каждого класса (с номера 2 до номера 11) также определялись штрихкоды и с теми же значениям параметров управления процессом кодирования.

В результате тестирования по всем 100 классам было получено более 700 связанных пар изображений, имеющих одинаковые коды. И эти связанные пары изображений принадлежали только своим классам. Это составило более 70% для 1000 тестовых изображений, не подвергнутых какой-либо предобработке с целью выравнивания позиций линии глаз и масштаба антропометрических характеристик лиц.

Пример результата работы системы для выполненного теста приведен на Фиг.5, где в нижней левой части рисунка показано число 775, соответствующее числу найденных пар.

Номера представленных изображений написаны над ними. В середине фигуры показаны bar-коды этих изображений и фазовая корреляция между соответствующими векторами расстояний (что говорит почти о 100% их подобии). Корреляция, как дополнительный инструмент проверки, специально была введена в тест 1. Несмотря на разную мимику лиц, bar-коды имеют одинаковые значения, что и привело к формированию одинаковых штрихкодов, показанных справа.

На Фиг.6 показан результат формирования штрихкода для изображений разных классов, отличающихся мимикой. Здесь приведены пары изображений лиц четырех классов и соответствующий им штрихкод в стандарте EAN-8, сформированный для этих изображений. При этом можно заметить следующее: система, реализующая предложенный способ, работает так, что изменения мимики лиц, изменение размера области лиц, а также и изменения в области глаз (открыты/закрыты) не влияет на сформированный штрихкод. Данные результаты также получены в рамках теста 1.

Тест 2. Целью проведения Теста 2 была проверка стабильности формирования штрихкода при зеркальном повороте исходного изображения и сохранение этой стабильности при дополнительной динамике изменений параметров изображений - локальных размеров лиц, наклона в плоскости XY, поворота лица по ракурсу, а также при изменениях мимики лица и наличии на нем теней от локального освещения.

В связи с этими целями, тест 2 включал в себя тест 1, и был дополнен тем, что изображения лиц каждого класса (от номера 2 до номера 11) зеркально поворачивались относительно вертикальной оси, и для них также определялись штрихкоды и по тем же значениям параметров управления процессом кодирования, что и в тесте 1. Полученные при этом результаты показаны на Фиг.7 и Фиг.8.

Здесь представлены примеры изображений лиц, из которых первое изображение слева является изображением №1 в классе, следующее изображение из группы номеров 2-11 и, наконец, третье изображение - это результат зеркального поворота второго изображения. На Фиг.7 также видно, что зеркальный поворот исходных изображений одного класса не изменяет штрихкода.

Предпочтительным вариантом реализации устройства является его использование для кодирования изображений лиц в форме штрихкодов, которые применяются в биометрических системах контроля доступа и интерактивных системах человек-компьютер для идентификации пользователя, для распознавания изображений лиц в системах видеонаблюдений и других системах технического зрения.

При этом прибор реализуется в виде платы устройств, в состав которой входит по крайней мере один сигнальный процессор.

Таким образом, предложенный способ формирования стандартного штрихкода по изображениям лиц основан на использовании инвариантных признаков, полученных непосредственно из исходного изображения лица, и, таким образом, содержит объективную информацию о конкретном лице человека, не зависящую от динамики параметров исходных изображений. Разностные градиенты в окнах, преобразованные в расстояния, подчеркивают перепады значений яркости на границе волосы/лоб, границах линии бровей, линии глаз и лини нос/губы - то есть именно по линиям «биологического кода лица». Вычисленные значения расстояний представляют, таким образом, интегральную характеристику наименее изменяемой части лица в условиях заметной динамики изменений параметров изображений с лицами. Это делает возможным повышение стабильности кодирования изображений лиц в условиях динамики их параметров (яркости изображений, локальных размеров и наклона области лиц на изображениях, зеркального поворота вокруг вертикальной оси, а также мимики лиц и наличии на нем теней от локального освещения) и повышение универсальности за счет формирования стандартных штрихкодов.

1. Способ формирования штрихкода по изображениям лиц, состоящий в выполнении корректировки изображения по повороту, вычислении расстояния между двумя зеркально расположенными окнами, имеющими одинаковую ширину и длину, равную ширине исходного изображения, синхронно перемещающимися по изображению лица с шагом ≥1, отличающийся тем, что выполняется корректировка изображения по размеру, перемещение окон осуществляется в вертикальном направлении сверху вниз от границы «волосы/лоб» до нижней границы области носа, из полученных разностных градиентов яркости находится максимальное значение, разностные градиенты яркости делятся на максимальное значение, выполняется дискретизация с усреднением полученных значений, выполняется квантование дискретизированных значений в диапазоне десятичных цифр от 0 до 9, из полученного десятичного кода формируется стандартный штрихкод изображения.

2. Устройство для осуществления способа по п.1, состоящее из блока анализа входного изображения, блока вычисления разностных градиентов в окнах и блока выбора параметров кодирования, первый выход которого соединен с первым входом блока вычисления разностных градиентов в окнах, при этом вход блока анализа входного изображения является первым входом устройства, а вход блока выбора параметров кодирования является вторым входом устройства, отличающееся тем, что дополнительно введены блок коррекции изображения по размеру и повороту, второй вход которого соединен с вторым входом устройства, первый вход соединен с выходом блока анализа входного изображения, а выход соединен со вторым входом блока вычисления разностных градиентов в окнах, блок нормирования и кодирования градиентов и блок генерации штрихкода, выход которого является выходом устройства, первый вход соединен с выходом блока нормирования и кодирования градиентов, а второй вход соединен с третьим выходом блока выбора параметров кодирования, второй выход которого соединен с первым входом блока нормирования и кодирования градиентов, второй вход которого соединен с выходом блока вычисления разностных градиентов в окнах.



 

Похожие патенты:

Изобретение относится к области распознавания образов и может быть использовано при решении задач предварительной обработки изображения с целью определения контуров объектов, которые характеризуются монотонностью изменения интенсивности цвета.

Изобретение относится к способу автоматической генерации скетчей и системе для его осуществления. Техническим результатом является повышение быстродействия формирования исходного скетча на основе исходного изображения и возможность автоматической генерации требуемой последовательности новых скетчей для готовых скетчей.

Изобретение относится к области изучения структуры пористых тел с использованием средств оптики и вычислительной техники. Техническим результатом является обеспечение высокого качества изображений границ объектов при низких ресурсо- и энергозатратах.

Изобретение относится к компьютерной технике, а именно к системам генерирования изображения с иллюзией. Техническим результатом является автоматическое генерирование иллюзии с изображением из произвольного изображения.

Изобретение относится к средствам обработки цифровых изображений. Техническим результатом является повышение скорости обработки изображений.

Изобретение относится к области вычислительной техники и может быть использовано для проверки топологии фотошаблонов, печатных плат, микросхем на наличие дефектов.

Изобретение относится к записывающему устройству, хранящему поток базового изображения и поток расширенного изображения, полученные с помощью кодирования видеоданных множества точек наблюдения.

Изобретение относится к средствам передачи потоком видео из сервера к клиенту. Техническим результатом является повышение быстродействия за счет стабилизации скорости передачи данных от сервера к клиенту.

Группа изобретений относится к обработке данных для выполнения сжатия видео. Технический результат заключается в улучшении способности манипулировать аудио- и видеоносителями, а также в сокращении времени загрузки.

Изобретение относится к средствам анализа и обработки динамических изображений. Техническим результатом является обеспечение фильтрации динамических цифровых изображений в условиях ограниченного объема априорных данных.

Изобретение относится к устройствам формирования цифрового изображения и, в частности, к системам и способу для обработки данных изображения, полученных с использованием датчика изображения устройства формирования цифрового изображения. Техническим результатом является улучшение внешнего вида изображения, достигаемое за счет повышения резкости изображения без появления шума или артефактов. Система обработки сигналов изображения включает блок окончательной обработки пикселей, блок предварительной обработки пикселей и конвейер обработки пикселей. Блок окончательной обработки принимает пиксельные данные яркости/цветности изображения после обработки посредством одного из блока предварительной обработки и конвейера обработки. Блок окончательной обработки выполнен с возможностью применять операции обнаружения лиц, локальную тональную компрессию, регулировки яркости, контрастности, цвета, а также масштабирование. Блок окончательной обработки также включает блок обработки окончательной статистики, который собирает частотную статистику. Частотная статистика предоставляется в кодер и используется для того, чтобы определять параметры квантования, которые должны применяться к кадру изображения. 4 н. и 16 з.п. ф-лы, 142 ил., 5 табл.

Изобретение относится к средствам для отслеживания человека с использованием видеоизображения, снятого камерой наблюдения. Техническим результатом является повышение точности отслеживания целевого человека даже тогда, когда отслеживаемый целевой человек имеет мало отличительных особенностей. Устройство для отслеживания человека содержит средство извлечения информации об области, занимаемой человеком; средство определения сопровождающего человека для идентификации по меньшей мере одного сопровождающего человека, сопровождающего отслеживаемого целевого человека, среди людей, включенных в информацию об области, занимаемой человеком; средство выбора характерного человека для выбора характерного человека, имеющего характерную особенность, и средство отслеживания человека для вычисления результата отслеживания характерного человека. 3 н. и 7 з.п. ф-лы, 9 ил.

Изобретение относится к области радиотехники, в частности к методам блочного кодирования видеоданных, используемым для сжатия видеоданных, и предназначено для сканирования, используемого для преобразования в последовательную форму данных видеоблока во время процесса кодирования. Технический результат - повышение точности кодирования видеоданных. Настоящее раскрытие описывает устройства и способы кодирования коэффициентов, связанных с блоком видеоданных. В одном из примеров способ может содержать этапы, на которых выбирают порядок сканирования для коэффициентов на основе режима внутрикадрового кодирования, используемого для предсказания блока видеоданных, и размера блока преобразования, используемого в преобразовании блока видеоданных, и генерируют синтаксический элемент, чтобы передать выбранный порядок сканирования для блока видеоданных. 8 н. и 31 з.п.ф-лы, 18 ил.

Изобретение относится к системам визуализации медицинских данных. Техническим результатом является повышение точности реконструкции изображения всего визуализируемого объекта, за счет осуществления реконструкции изображения объекта, полученного посредством сбора данных визуализации от детектора, смещенного от центра вращения. Предложен способ формирования медицинского изображения объекта с использованием медицинского устройства визуализации, содержащего детектор. Способ содержит этап, на котором сдвигают детектор в течение сбора данных визуализации, начиная от первого смещенного положения, в котором детектор смещен от центра вращения и охватывает приблизительно первую половину ширины объекта, так чтобы детектор находился во втором смещенном положении в заключение сбора данных, причем второе смещенное положение отличается от первого смещенного положения. Причем во втором смещенном положении детектор смещен от центра вращения и охватывает, в основном, оставшуюся половину ширины объекта, которая не была охвачена детектором в первом смещенном положении. Далее, согласно способу, собирают данные визуализации с помощью детектора и реконструируют их для получения реконструированного изображения объекта. 2 н. и 6 з.п. ф-лы, 22 ил.

Изобретение относится к области обработки данных, а именно к распознаванию текстовой информации. Техническим результатом является повышение производительности системы содержательной обработки электронных документов и увеличение числа анализируемых источников информации. В способе распознавания текстовой информации и оценки ее полноты в электронных документах сети Интернет электронный документ разбивают на области, предположительно содержащие абзацы и строки текста. Причем разбивку документа выполняют до получения областей, содержащих неразрывный логически связанный текст наибольшего размера. Осуществляют удаление избыточной и излишней информации. Анализируют корректность кодировки символов путем анализа текста на принадлежность букв к алфавиту и слов текста к словарю с учетом заданного языка. Вычисляют статистические характеристики частей речи и их форм. Из полученных значений статистических характеристик формируют вектор признаков рабочего словаря, который с помощью процедур компонентного анализа преобразуют в вектор главных компонент и классифицируют с помощью предварительно обученных классификаторов. Оценивают полноту текстовой информации на основе мажоритарного способа принятия решения. 5 ил.

Изобретение относится к кодированию и декодированию изображения посредством преобразования изображения в пиксельной области в коэффициенты в частотной области. Технический результат - повышение эффективности сжатия, кодирования и декодирования изображения. Способ декодирования изображения содержит этапы, на которых: определяют имеющие иерархическую структуру единицы кодирования для декодирования изображения, единицу предсказания и единицу преобразования; получают посредством анализа из битового потока коэффициенты преобразования и восстанавливают кодированные данные по меньшей мере одной единицы предсказания посредством выполнения энтропийного декодирования, обратного квантования и обратного преобразования над полученными посредством анализа коэффициентами преобразования; выполняют внутреннее предсказание или взаимное предсказание над восстановленными кодированными данными и восстанавливают кодированное видео. 3 з.п. ф-лы, 18 ил.

Изобретение относится к устройствам и системам для машинного зрения, обнаружения признаков изображения, а также к приложениям и методике распознавания изображения. Технический результат заключается в снижении потерь информации об изображении за счет использования данных спектра полного изображения путем преобразования изображения в одноканальное представление на промежуточной стадии. Технический результат достигается за счет способа, который включает выполнение локального поиска локального оптимального цвета в локальном окружении многоканального изображения, проецирование локальным окружением многоканального изображения на одноканальное основание и применение одноканального детектора к этому спроецированному локальному окружению. 4 н.п. ф-лы, 18 ил.

Изобретение относится к компьютерным системам визуализации пористых пород. Техническим результатом является повышение точности сегментации данных при построении модели образца пористой среды. Предложен способ построения модели образца пористой среды. Способ включает в себя этап приема данных изображения низкого разрешения, сгенерированных с использованием измерения с более низким разрешением, выполненного на первом образце пористой среды. Далее, согласно способу осуществляют прием данных изображения высокого разрешения, представляющих характеристики аспектов малого второго образца пористой среды, причем данные высокого разрешения сгенерированы с использованием измерения с более высоким разрешением, выполненного на малом втором образце. 3 н. и 29 з.п. ф-лы, 9 ил.

Изобретение относится к технологиям обработки данных изображений с расширенным динамическим диапазоном (HDR). Техническим результатом является повышение качества отображаемых HDR изображений. Предложен способ обработки HDR-изображения устройством на основе интегральной микросхемы (IC). Способ включает в себя этап, на котором осуществляют вычисление гистограммы значений логарифмической (log) освещенности пикселов на HDR-изображении. Далее согласно способу осуществляют генерирование тонально отображенной кривой на основе гистограммы. А также вычисляют изображения глобального тонального отображения логарифмических освещенностей на основе значений логарифмической освещенности пикселов на HDR-изображении и тонально отображенной кривой. 4 н. и 79 з.п. ф-лы, 15 ил.

Изобретение относится к технологиям обработки изображений. Техническим результатом является повышение эффективности сжатия изображений за счет независимого сжатия изображения материала и изображения освещенности. Предложен автоматизированный, компьютеризированный способ обработки изображения. Способ включает в себя этап, на котором осуществляют обеспечение файла изображения, представляющего изображение, в компьютерной памяти. Далее согласно способу генерируют набор внутренних изображений, соответствующих упомянутому изображению, при этом упомянутый набор внутренних изображений включает в себя изображение материала и изображение освещения. Каждое из изображения материала и изображения освещения выражается как отдельное многополосное представление для одного из материала или освещения независимо от другого из материала или освещения, каждая полоса соответствует сегменту электромагнитного спектра. 6 н. и 6 з.п. ф-лы, 19 ил.
Наверх