Устройство для обработки изображений

Авторы патента:

Анисимов Владимир Юрьевич (RU)

Борисов Эдуард Васильевич (RU)

Шанин Александр Викторович (RU)

Педящев Владимир Николаевич (RU)

H03M7/14 - преобразование в невзвешенные коды или из них

Владельцы патента RU 2321946:

Военная академия Ракетных войск стратегического назначения имени Петра Великого (RU)

Изобретение относится к области обработки данных для специальных применений, в частности для преобразования изображений, задаваемых невзвешенными цифровыми кодами во взвешенные коды. Технический результатом является расширение функциональных возможностей и повышение достоверности распознавания изображений. Технический результат достигается тем, что устройство содержит группу параллельных сумматоров, группу блоков умножения на весовые коэффициенты, группу параллельных перемножителей, блок формирования фрагментов изображения и группу пороговых блоков, группу блоков бинарной дизъюнкции векторов и блок формирования случайного бинарного разреженного вектора. 2 з.п. ф-лы, 2 ил.

Известно устройство, содержащее генераторы пилообразного напряжения, аналого-цифровые и цифроаналоговые преобразователи, элементы ИЛИ, блоки памяти функций принадлежности, блоки определения минимума, блоки сравнения, блоки вычитания из единицы, регистры, счетчик и элементы задержки с соответствующими связями [SU 1791815, G06F 7/58, 1990].

Недостатком устройства являются относительно узкие функциональные возможности.

Известно также устройство, содержащее n параллельных сумматоров, входы и выходы которых являются, соответственно, группой входов и группой выходов устройства, а также n блоков умножения на весовые коэффициенты, при этом вход i-ого блока умножения на весовые коэффициенты (i=1...N) соединен с выходом i-ого параллельного сумматора, а каждый из выходов j-ого блока умножения на весовые коэффициенты (j=1...N) соединен с соответствующим ему входом взвешенного сигнала i-ого сумматора (i не = j) [А.В.Назаров, А.И.Лоскутов. Нейросетевые алгоритмы прогнозирования и оптимизации систем. Санкт-Петербург: Наука и Техника, 2003 г., стр.231].

Недостатком устройства являются относительно узкие функциональные возможности.

Наиболее близким по технической сущности к предлагаемому является устройство, содержащее N параллельных сумматоров, входы которых являются группой входов устройства, а также N блоков умножения на весовые коэффициенты, при этом каждый из выходов j-ого блока умножения на весовые коэффициенты (j=1...N) соединен с соответствующим ему входом взвешенного сигнала i-ого параллельного сумматора (i=1...N, i не = j), а также N блоков сжатия отображения, причем входы i-ых блоков умножения на весовые коэффициенты (i=1...N) соединены с выходами одноименных блоков сжатия отображения, входы которых соединены с выходами одноименных параллельных сумматоров, а выходы являются группой выходов устройства [RU 45579, U1, H03М 7/14, 2005].

Кроме того, в наиболее близком техническом решении блоки сжатия отображения выполнены в виде функциональных преобразователей входного сигнала Х в выходной сигнал Y по закону Y=1/(1+exp(-X)).

Недостатком наиболее близкого технического решения являются относительно узкие функциональные возможности, обусловленные тем, что устройство позволяет формировать семантический кодовый вектор текстового документа, но не позволяет по исходной информации (искаженному двумерному сигналу о некотором объекте) сформировать выходной код, который может быть использован, в частности, для принятия решения о соответствии исходной информации одному из заданных эталонов (образцов). Кроме того, известное техническое решение является чувствительным к малым пространственным сдвигам эталонов.

Требуемый технический результат заключается в расширении функциональных возможностей путем обеспечения формирования выходного кода, который может быть использован, в частности, для принятия решения о соответствии исходной информации одному из заданных эталонов (образцов) с обеспечением инвариантности к малым пространственным сдвигам эталонов.

Требуемый технический результат достигается тем, что в устройство, содержащее группу из М параллельных сумматоров и N групп по М блоков умножения на весовые коэффициенты, при этом выход каждого из блоков умножения на весовые коэффициенты группы по М блоков умножения на весовые коэффициенты из N групп по М блоков умножения на весовые коэффициенты соединен со входом соответствующего параллельного сумматора группы из М параллельных сумматоров, введены блок формирования фрагментов изображения, группа из N пороговых блоков, каждый из которых содержит группу из Р пороговых элементов и группу из Q пороговых элементов, входы которых соединены с соответствующими выходами блока формирования фрагментов изображения, группа из N блоков бинарной дизъюнкции векторов, первые входы каждого из которых соединены с выходами соответствующего порогового блока группы из N пороговых блоков, блок формирования случайного бинарного разреженного вектора, выход которого соединен со вторыми входами каждого из блоков группы из N блоков бинарной дизъюнкции векторов, а также группа из N параллельных перемножителей, входы каждого из которых соединены с выходами соответствующего блока группы из N блоков бинарной дизъюнкции векторов, а выходы - соединены с входами блоков умножения на весовые коэффициенты соответствующей группы по М блоков умножения на весовые коэффициенты из N групп по М блоков умножения на весовые коэффициенты.

Кроме того, требуемый технический результат достигается тем, что параллельные перемножители выполнены в виде элементов И.

Кроме того, требуемый технический результат достигается тем, что выходы пороговых элементов группы из Р пороговых элементов являются выходами «Больше», а выходы пороговых элементов группу из Q пороговых элементов являются выходами «Меньше».

На чертежах представлены: на фиг.1 - электрическая структурная схема устройства для обработки изображений, на фиг.2 - схема блока формирования случайного бинарного разреженного вектора.

Устройство для обработки изображений (фиг.1) содержит группу 1 из М параллельных сумматоров 1-1...1-М и N групп 2-1...2-N по М блоков умножения на весовые коэффициенты 2-1-1...2-1-М - 2-N-1...2-N-M, при этом выход каждого из блоков умножения на весовые коэффициенты 2-1-1...2-1-М - 2-N-1...2-N-M из N групп 2-1...2-N по М блоков умножения на весовые коэффициенты соединен со входом соответствующего параллельного сумматора группы 1 из М параллельных сумматоров 1-1...1-М.

Кроме того, устройство для обработки изображений содержит блок 3 формирования фрагментов изображения, группу 4 из N пороговых блоков 4-1...4-N, каждый из которых содержит группу из Р пороговых элементов 5-1-1...5-N-Р и группу из Q пороговых элементов 6-1-1...6-N-Q, входы которых соединены с соответствующими выходами блока 3 формирования фрагментов изображения, группу 7 из N блоков 7-1...7-N бинарной дизъюнкции векторов, первые входы каждого из которых соединены с выходами первой группы из Р пороговых элементов 5-1-1...5-N-P и второй группы из Q пороговых элементов 6-1-1...6-N-Q соответствующего порогового блока из группы 4 из N пороговых блоков 4-1...4-N, блок 8 формирования случайного бинарного разреженного вектора, выход которого соединен со вторыми входами каждого из блоков 7-1...7-N группы 7 из N блоков бинарной дизъюнкции векторов, а также группа 9 из N параллельных перемножителей 9-1...9-N, входы каждого из которых соединены с выходами соответствующего блока 7-1...7-N группы из N блоков 7-1...7-N бинарной дизъюнкции векторов, а выходы соединены с входами блоков умножения на весовые коэффициенты 2-1-1...2-1-М - 2-N-1...2-N-M из N групп 2-1...2-N по М блоков умножения на весовые коэффициенты 2-1-1...2-1-М - 2-N-1...2-N-M.

Блок 8 формирования случайного бинарного разреженного вектора (фиг.2) содержит последовательно соединенные генератор 10 тактовых импульсов ГТИ), датчик 11 случайных чисел и блок 12 сравнения, а также и последовательно-параллельный регистр 13, информационный вход которого соединен с выходом блока 12 сравнения, а управляющий вход - с выходом ГТИ 10.

Блок 3 формирования фрагментов изображения может быть выполнен в виде устройств памяти цифровой видеокамеры, цифрового фотоаппарата или регистра памяти элементов входного изображения. Параллельные перемножители 9-1...9-N могут быть выполнены в виде элементов И. Остальные элементы устройства являются стандартными элементами цифровой техники.

Работает устройство для обработки изображений следующим образом.

Предварительно проведем теоретическое обоснование его работы.

Предлагаемое устройство может быть использовано, в частности, при распознавании зрительных образов слепыми по информации от носимых видеокамер. Это позволяет обнаруживать препятствия на пути слепого, измерять расстояния до препятствий, распознавать объекты и определять их расположение в пространстве и т.д. Оно может быть использовано как для распознавания черно-белых изображений, так и для распознавания изображений с градацией уровней серого цвета.

В теоретическом плане в устройстве реализуется четырехслойная нейронная сеть.

Первый, входной, S-слой соответствует входному изображению (изображению наблюдаемого объекта), поступающему, например, с цифровой видеокамеры и которое должно быть классифицировано. В этом слое каждый нейрон соответствует некоторому пикселю изображения. Нейроны этого слоя упорядочены в отдельных прямоугольных областях размерами w×h, принадлежащих прямоугольной области входного изображения с размерами W×H пикселей, где W - ширина, а Н - высота общей прямоугольной области классифицируемого входного изображения в пикселях. Выходное значение нейрона первого S-слоя рассматривается как яркость соответствующего пикселя и принадлежит интервалу [0, B], где 0 - нулевая яркость (черный). При B=1 получаем вариант для распознавания бинарных (черно-белых) изображений, а при В>1 - для изображений с уровнями серого цвета.

Второй G-слой состоит из групп нейронов Group₁, ..., Group_N, каждая из которых содержит р ON-нейронов и q OFF-нейронов (j-й ON-нейрон группы Group_i активен, если и только если входной сигнал где - случайный порог, a j-й OFF-нейрон группы Group_i активен, если и только если входной сигнал где - случайный порог). Случайные пороги выбираются из интервала [0, Bη], где коэффициент Bη∈(0, 1] подбирается экспериментально. Нейроны каждой группы Group, случайным образом соединяются связями с нейронами первого слоя, принадлежащими прямоугольникам размера w×h, где стороны прямоугольника 0<w≤W и 0<h≤H подбираются экспериментально, а положения прямоугольников в прямоугольной области изображения также выбирается случайным образом. Параметры и подбираются экспериментально.

Случайность может быть обеспечена рандомизацией за счет выбора соответствующего параметра путем умножения возможного значения случайного числа с равномерным распределением в интервале [0-1] на разность между максимальным и минимальным значением соответствующего параметра.

Веса связей между первым и вторым слоями полагаются равными 1 и не меняются в процессе настройки («обучения») и использования нейронной сети.

Аналогично, значения порогов и не модифицируются в процессе настройки («обучения») и использования нейронной сети.

Отдельная группа нейронов второго G-слоя вместе со связями с нейронами первого S-слоя и фиксированными порогами называется случайным локальным дескриптором (RLD), который выделяет некоторый признак во входном изображении.

Для обеспечения инвариантности к малым пространственным сдвигам входного изображения нейроны G-слоя рандомизируются, т.е. подвергаются малому случайному пространственному сдвигу.

Третий (ассоциативный) A-слой содержит N нейронов, каждый из которых имеет p+q входов соединенных с выходами нейронов соответствующей группы G-слоя. Нейрон А_i активен, если и только если все его входы активны. Выходное значение активного нейрона равно 1, а неактивного - 0. Веса связей между нейронами второго G-слоя и третьего А-слоя равны 1 и не модифицируются в процессе обучения. Второй G-слой вместе с третьим А-слоем представляют собой узел выделения признаков входного изображения.

Каждый нейрон третьего A-слоя соединен связью с каждым нейроном четвертого выходного R-слоя. Веса этих связей w_ij являются модифицируемыми в процессе настройки («обучения»).

Функция активации нейрона четвертого R-слоя является линейной

где a_j - выходное значение нейрона А_j третьего А-слоя, равное 0 или 1.

Четвертый выходной R-слой представляет собой классификатор, нейроны которого взаимно однозначно соответствуют классам классифицируемых изображений. Номер нейрона, имеющего наибольшее выходное значение, указывает на номер класса, которому принадлежит входное изображение.

Процесс модификации весов выходного R-слоя при настройке («обучении») полностью аналогичен процессу обучения однослойного персептрона с линейными функциями активации. Процесс обучения является итерационным и разбивается на последовательные циклы (эпохи). На каждом таком цикле прогоняются все образы из обучающей выборки. Процесс обучения останавливается после некоторого фиксированного числа таких циклов либо после того, когда средняя по циклу ошибка будет меньше, чем некоторое заданное допустимое значение ошибки.

Описанный алгоритм реализуется в устройстве для обработки изображений следующим образом.

Предварительно в блок 3 формирования фрагментов изображения (в частном случае, блок памяти цифровой видеокамеры) записывают в цифровом виде элементы входного изображения (изображения наблюдаемого объекта), например, уровни сигналов в заданных точках изображения, которые образуют массив элементов входного изображения.

Этот массив элементов, принадлежащих прямоугольной области входного изображения с размерами W×H пикселей, где W - ширина, а H - высота общей прямоугольной области входного изображения в пикселях, и соответствует первому слою нейронной сети.

Элементы этого слоя упорядочены в отдельных прямоугольных областях размерами w×h. Выходное значение элемента первого S-слоя рассматривается как яркость соответствующего пикселя и принадлежит интервалу [0,B], где 0 - нулевая яркость (черный). При B=1 получаем вариант для распознавания бинарных (черно-белых) изображений, а при В>1 - для изображений с уровнями серого цвета.

Каждая из случайных отдельных прямоугольных областей размерами w×h соединена поэлементно с пороговыми элементами соответствующего порогового блока группы 4 из N пороговых блоков 4-1...4-N, каждый из которых содержит группу из Р пороговых элементов 5-1-1...5-N-P и группу из Q пороговых элементов 6-1-1...6-N-Q, входы которых соединены с соответствующими выходами блока 3 формирования фрагментов изображения. Пороговые элементы первой группы из Р пороговых элементов 5-1-1...5-N-P формируют уровень логической единицы, если входной сигнал где - случайный порог, а пороговые элементы второй группы из Q пороговых элементов 6-1-1...6-N-Q вырабатывают уровень логической единицы, если входной сигнал где - случайный порог. Случайные пороги выбираются из интервала [0, Bη], где коэффициент Вη∈(0, 1] подбирается экспериментально.

Выходные сигналы каждого из порогового блока 4-1...4-N группы 4 из N пороговых блоков представляют собой бинарные векторы, относящиеся к соответствующим признакам во входном изображении.

Одновременно с этим по сигналам от ГТИ 10, который может быть синхронизирован с сигналом управления памятью видеокамеры, датчик 11 случайных чисел вырабатывает возможные значения случайных чисел с равномерным распределением в интервале 0...1. Эти числа сравниваются в блоке 12 сравнения с малым числом, например меньшим 0,1, в блоке 12 сравнения. Поэтому на выходе «Меньше» блока 12 в основном наблюдается уровень логического нуля и в редких случаях - уровень логической единицы. Эти уровни последовательно записываются в последовательно-параллельный регистр 13, в результате чего на его параллельном выходе наблюдается постоянно обновляющийся случайный бинарный разреженный вектор, компонентами которого являются нули и на редких случайных позициях - единицы.

На выходах блоков 7-1...7-N группы 7 из N блоков бинарной дизъюнкции векторов формируются векторы, как результат бинарной дизъюнкции входных векторов этих блоков (сложением по логическому правилу ИЛИ одноименных компонент векторов).

Выходные сигналы каждого из блоков 7-1...7-N группы 7 из N блоков бинарной дизъюнкции перемножаются в соответствующем параллельном перемножителе 9-1...9-N группы 9 из N параллельных перемножителей 9-1...9-N. Перемножение производится по логическому правилу И.

Выходные сигналы а_j каждого из параллельных перемножителей 9-1...9-N группы 9 из N параллельных перемножителей 9-1...9-N умножаются на весовые коэффициенты в соответствующих блоках 2-1-1...2-1-М - 2-N-1...2-N-M умножения на весовые коэффициенты группы 2 по М блоков умножения на весовые коэффициенты 2-1...2-N.

Значения весов w_ij являются модифицируемыми в процессе настройки («обучения») устройства для обработки изображения.

В результате в каждом из параллельных сумматоров группы 1 из М параллельных сумматоров 1-1...1-М формируется функция активации линейного вида

При работе устройства номер параллельного сумматора в группе 1 из М параллельных сумматоров 1-1...1-М, имеющего наибольшее выходное значение, указывает на номер класса, которому принадлежит входное изображение.

Перед работой устройства проводят процесс модификации («обучения») путем настройки значений весовых коэффициентов (значений коэффициентов умножения) в блоках 2-1-1...2-1-М - 2-N-1...2-N-M умножения на весовые коэффициенты N групп 2-1...2-N по М блоков умножения на весовые коэффициенты 2-1-1...2-1-М - 2-N-1...2-N-M. Процесс «обучения» является итерационным и разбивается на последовательные циклы (эпохи). На каждом таком цикле прогоняются все образы из обучающей выборки. Процесс обучения останавливается после некоторого фиксированного числа таких циклов либо после того, когда средняя по циклу ошибка будет меньше, чем некоторое заданное допустимое значение ошибки.

Таким образом, в предложенном устройстве достигается требуемый технический результат, заключающийся в расширении функциональных возможностей, поскольку формируемый на его выходе код может быть использован для принятия решения о соответствии исходной информации одному из заданных эталонов (образцов). Кроме того, поскольку как в процессе обучения, так и в процессе работы устройства обеспечивается малый сдвиг признаков изображения, то это снижает его чувствительность к малым сдвигам входного изображения и повышает достоверность распознавания.

1. Устройство для обработки изображений, содержащее группу из М параллельных сумматоров и N групп по М блоков умножения на весовые коэффициенты, при этом выход каждого из блоков умножения на весовые коэффициенты группы по М блоков умножения на весовые коэффициенты из N групп по М блоков умножения на весовые коэффициенты соединен со входом соответствующего параллельного сумматора группы из М параллельных сумматоров, отличающееся тем, что введены блок формирования фрагментов изображения, группа из N пороговых блоков, каждый из которых содержит группу из Р пороговых элементов и группу из Q пороговых элементов, входы которых соединены с соответствующими выходами блока формирования фрагментов изображения, группа из N блоков бинарной дизъюнкции векторов, первые входы каждого из которых соединены с выходами соответствующего порогового блока группы из N пороговых блоков, блок формирования случайного бинарного разреженного вектора, выход которого соединен со вторыми входами каждого из блоков группы из N блоков бинарной дизъюнкции векторов, а также группа из N параллельных перемножителей, входы каждого из которых соединены с выходами соответствующего блока группы из N блоков бинарной дизъюнкции векторов, а выходы соединены с входами блоков умножения на весовые коэффициенты соответствующей группы по М блоков умножения на весовые коэффициенты из N групп по М блоков умножения на весовые коэффициенты.

2. Устройство по п.1, отличающееся тем, что параллельные перемножители группы из N параллельных перемножителей выполнены в виде элементов И.

3. Устройство по п.1, отличающееся тем, что выходы пороговых элементов группы из Р пороговых элементов являются выходами «Больше», а выходы пороговых элементов группу из Q пороговых элементов являются выходами «Меньше».

Устройство для формирования маски // 1575314

Изобретение относится к вычислительной технике и может быть использовано для построения процессора. .

Преобразователь кодов // 1536509

Изобретение относится к автоматике и вычислительной технике. .

Устройство для кодирования телеметрической информации // 1496006

Изобретение относится к электросвязи и может использоваться в телеметрических системах. .

Преобразователь единичного кода // 1354422

Изобретение относится к лительной технике и может быть использовано в устройствах обработки дискретной информации. .

Преобразователь унитарного кода в двоичный позиционный код // 1325709

Изобретение относится к информационно-измерительной технике и предг назначено для преобразования унитарного кода в двоичный позиционный код. .

Преобразователь кода // 1300642

Изобретение относится к вычислительной технике. .

Преобразователь кодов // 1264346

Изобретение относится к вычислительной технике. .

Преобразователь кодов // 1261122

Способ преобразования числокомбинационных кодов в двоичный код и устройство для его осуществления // 134485

Устройство ассоциативного распознавания // 2485682

Изобретение относится к области преобразования сигналов и изображений, задаваемых невзвешенными цифровыми кодами, во взвешенные коды, и может быть использовано для обработки и распознавания сигналов и изображений

Устройство для классификации нечетких ситуаций // 2534487

Изобретение относится к автоматизированным системам и системам автоматического управления и может быть использовано при управлении сложными объектами, а также для решения задач распознавания и анализа данных объектов, ситуаций, процессов или явлений произвольной природы, описываемых слабоформализуемыми признаками (симптомами, факторами), которые могут быть представлены в виде нечетких множеств. Технический результат заключается в обеспечении возможности классификации ситуации по множеству признаков, задаваемых нечеткими высказываниями, а также вариативности множества известных классов. Технический результат достигается за счет устройства, содержащего датчик ситуации, блок ввода классов, блоки сравнения по нечеткому признаку, счетчик сравнений, блок обработки результатов сравнения, пороговый фильтр, блок ввода порогового значения и блок вывода результата классификации. 2 ил.