Способ распознавания объектов на изображении

Предлагаемое изобретение относится к способам обработки визуальной информации и может быть использовано в системах технического зрения при решении задач поиска, слежения, наведения, диагностирования, контроля и распознавания объектов на изображении. Технический результат заключается в повышении точности и достоверности распознавания объектов на изображении в условиях разной освещенности и изменении метеоусловий съемки. В способе осуществляют разделение изображения на зоны и выделение структурных элементов, при этом разделение изображения на зоны осуществляют путем фильтрации объектов на бинарном контурном изображении по принципу восьмисвязности. Последующее выделение структурных элементов осуществляют путем определения значимых точек для каждого выделенного объекта - концевых точек, точек пересечения и перегибов линий, после этого сохраняют информацию о параметрах первичных связей каждой пары выделенных значимых точек. А выделение на изображении объектов прямоугольной формы и простых замкнутых фигур осуществляют путем анализа сохраненной информации о параметрах первичных связей каждой пары выделенных значимых точек, запоминают полученную в результате анализа информацию о вторичных связях - соотношениях между каждой парой значимых точек выделенных объектов. 4 ил.

 

Предлагаемое изобретение относится к способам обработки визуальной информации и может быть использовано в системах технического зрения при решении задач поиска, слежения, наведения, диагностирования, контроля и распознавания объектов на изображении.

Известны способ и устройство распознавания реального изображения, основанный на распознавании пространственной структуры изображений (см. патент США изобретение US 2017193299, M.кл. G06K 9/00, G06K 9/62, G06T 7/00, опубл. 06.07.2017 г.). В данном способе для обеспечения реальности создаваемого изображения производят анализ местности, осуществляют сегментацию изображения, полученного с камеры наблюдения, после чего производят классификацию выделенных сегментов по нескольким зонам (фон, структурный элемент). Далее производят выбор зон интереса для дальнейшего извлечения 3D информации об объектах. Способ позволяет частично выделить объекты интереса на изображении и сократить объемы вычислений для последующей обработки.

Однако для выполнения операций сегментации и классификации на изображении случайным образом выделяются прямоугольные области, сегментация проводится путем вычисления разницы в яркостях и цветовых характеристиках соседних регионов, при этом классификация отдельных объектов может быть затруднена. Так, в случае попадания нескольких объектов в прямоугольную область, они могут быть оценены как один объект, и построенная по данному способу пространственная структура изображения окажется несоответствующей реальной картине. В результате точность и достоверность обнаружения объектов на изображении невысоки.

Известен способ обработки изображений (см. патент на изобретение РФ №2322694, M.кл. G06T 7/00, опубл. 20.04.2008 г.), включающий построение пирамиды описаний, деление изображений, выделение структурных элементов и связей, при этом деление (разбиение) исходного изображения производят на равные по площади области Gj, каждой из которых ставится в соответствие матрица ||mij|| "визуальных" масс, где μn, m - яркость изображения, индексы n, m, перебираемые по области Gj, в результате реализуют отображение исходного изображения в абсолютно гладкое многообразие, формируют слои описания изображения, как системного целого, первого пирамидального уровня многокомпонентным вектором градиентов над абсолютно гладким многообразием, выделяют структурные элементы и связи между компонентами упомянутого вектора с образованием первого уровня пирамиды описаний, затем выделяют информационные подобласти внимания на анализируемом изображении, с повторным описанием подобласти внимания с использованием перечисленных действий для образования следующего уровня иерархии описания.

В частности, в способе предусмотрено разбиение исходного изображения на шестнадцать равных по площади областей, формирование шестнадцати слоев описания изображения, как системного целого, пятнадцати компонентным вектором градиентов.

В качестве структурных элементов в данном способе предлагается использовать множество бинарных двумерных операторов, составленных из компонент вектора яркостей изображения, а также два типа алгебраических групп, выявляющих взаимные связи между тремя или четырьмя компонентами упомянутого вектора яркостей изображения.

Однако используемый в данном способе подход к описанию структуры изображения не включает описание геометрической формы объектов, что может усложнить дальнейшее их распознавание, особенно в условиях разной освещенности и при изменении метеоусловий съемки.

Кроме того, в данном способе параллельно осуществляется шестнадцать дифференциальных преобразований, что значительно усложняет его реализацию.

Данный способ выбран в качестве прототипа.

Техническим результатом предлагаемого изобретения является повышение точности и достоверности распознавания объектов на изображении в условиях разной освещенности и изменении метеоусловий съемки путем осуществления структурного описания геометрической формы объектов при одновременном упрощении реализации способа.

Достижение указанного результата обеспечивается в предлагаемом способе распознавания объектов на изображении, при котором полученное с камеры наблюдения изображение разделяют на зоны, производят выделение структурных элементов для каждой из выделенных зон, отличающемся тем, что разделение изображения на зоны осуществляют путем фильтрации объектов на бинарном контурном изображении по принципу восьмисвязности, представляющему собой последовательный анализ всех точек изображения, поиска связанных точек, принадлежащих к одному объекту изображения, среди 8-ми соседних точек и сохранение координат всех выделенных точек одного объекта, а последующее выделение структурных элементов осуществляют путем определения значимых точек для каждого выделенного объекта - концевых точек, точек пересечения и перегибов линий, причем для определения концевых точек вычисляют количество пикселей, принадлежащих объекту в апертуре 3×3 вокруг текущей точки, и отмечают те концевые точки, для которых количество точек объекта в апертуре 3×3 вокруг текущей точки не более трех, и при этом все точки являются соседними, для определения точек пересечения нескольких линий производят анализ зоны 5×5 вокруг каждой точки объекта с выделением пикселей, для которых количество линий, выходящих за пределы апертуры, более двух, для определения точек перегибов текущей линии определяют максимальное расстояние от одной из точек текущего отрезка до прямой, соединяющей границы этого отрезка и сравнивают это расстояние с заданным порогом, после этого сохраняют информацию о параметрах первичных связей каждой пары выделенных значимых точек - направлении, длине и угле наклона линии связи между точками и координатах точек, далее на выделенных объектах производят поиск окружностей методом Хафа, для чего для каждой точки объекта вычисляют возможные ее параметры (a, b, R) для разных значений радиуса R окружности в допустимом диапазоне, по вычисленным параметрам дополняют соответствующую ячейку в таблице ячеек накопления, после обработки каждой точки, принадлежащей объекту, производят анализ таблицы для поиска параметров, для которых значение в таблице выше заданного порога, а выделение на изображении объектов прямоугольной формы и простых замкнутых фигур осуществляют путем анализа сохраненной информации о параметрах первичных связей каждой пары выделенных значимых точек, запоминают полученную в результате анализа информацию о вторичных связях - соотношениях между каждой парой значимых точек выделенных объектов - расстояниях, углах наклона линии связи между точками, типах объектов, полученное описание сцены изображения в виде информации об объектах на изображении и связей между ними используют для распознавания зоны на изображении, соответствующей заданным параметрам эталонной сцены.

Достижение указанного технического результата предлагаемыми отличиями можно пояснить следующим образом.

Разделение изображения на зоны путем фильтрации объектов на бинарном контурном изображении по принципу восьмисвязности дает возможность выделять отдельные объекты изображения для последующего анализа, что позволяет повысить точность распознавания объектов.

Выделение структурных элементов путем определения значимых точек для каждого выделенного объекта - концевых точек, точек пересечения и перегибов линий, обеспечивает получение информации о первичных связях каждой пары выделенных значимых точек с последующим их сохранением в таблице первичных связей, что дает возможность сопоставления сцены с эталоном по расположению значимых точек независимо от ракурса и угла поворота текущей сцены относительно эталонной.

Поиск окружностей на изображении объекта путем преобразований Хафа и выделение на изображении объектов прямоугольной формы и простых замкнутых фигур путем анализа сохраненной информации о первичных связях дает возможность построения таблицы вторичных связей, включающей в себя информацию о типах объектов, а также расстояниях, углах между объектами. В результате исключаются все незначительные элементы сцены изображения, описание сцены представляется в сжатом виде, что повышает эффективность и достоверность распознавания изображения.

Кроме того, использование простых операций (анализ зоны внутри апертуры, использование таблиц ячеек накопления) позволяет достичь упрощения реализации предлагаемого способа.

Предлагаемый способ поясняется чертежами, где на фиг. 1 приведен пример структурной схемы устройства для реализации предлагаемого способа, на фиг. 2 приведена блок-схема алгоритма построения структурного описания изображения, на фиг. 3 приведена блок-схема алгоритма построения таблицы первичных связей, на фиг. 4 приведена блок-схема алгоритма построения таблицы вторичных связей.

В соответствии с фиг. 1 устройство для реализации предлагаемого способа содержит: 1 - камеру наблюдения, 2 - блок цифровой обработки изображения, 3 - блок фильтрации объектов, 4 - блок выделения значимых точек, 5 - блок выделения простых фигур, 6 - блок построения структурного описания, 7 - запоминающее устройство, 8 - устройство графического вывода информации, 9 - блок распознавания.

При этом выходная шина камеры 1 видеонаблюдения соединена со входной шиной блока 2 обработки изображения, которой является входная шина блока 3 фильтрации объектов, соответствующие выходные шины которого подключены к входным шинам блока 4 выделения значимых точек и блока 5 выделения простых фигур, выходные шины блоков 4 и 5 подключены к соответствующим входным шинам блока 6 построения структурного описания, выходные шины которого, являющиеся выходными шинами блока 2 цифровой обработки изображения, подключены соответственно к входным шинам запоминающего устройства 7 и устройства 8 графического вывода информации, выходная шина запоминающего устройства 7 соединена с входной шиной блока 9 распознавания, выходная шина которого соединена с соответствующей входной шиной устройства 8 графического вывода информации.

Осуществление предлагаемого способа поясним с помощью фиг. 1, 2, 3, 4.

Текущее изображение с камеры видеонаблюдения 1 поступает на блок 2 обработки изображения, в котором в блоке 3 осуществляется разделение на зоны путем фильтрации объектов по принципу восьмисвязности, информация о каждом выделенном объекте передается на блоки 4 и 5 для выделения структурных элементов изображения - значимых точек и простых фигур соответственно и построения таблицы первичных связей. По выделенным в блоках 4 и 5 данным производится построение структурного описания изображений в блоке 6: выделение простых фигур и построение таблицы вторичных связей. Полученное описание изображения сохраняется в памяти устройства 7, а также передается на устройство 8 графического вывода для вывода результата на экран. Для выполнения распознавания зоны на изображения, соответствующей заданным параметрам эталонной сцены, из запоминающего устройства 7 построенное структурное описание изображения передается на блок 9 распознавания, результат распознавания передается на устройство 8 графического вывода.

Предлагаемый способ распознавания изображений может быть реализован с использованием средств персонального компьютера с помощью блок-схем алгоритмов, приведенных на фиг. 2, 3, 4. Так, в качестве камеры видеонаблюдения 1 может быть использована камера типа BHV-1000. Блок 2 обработки изображения может быть реализован на основе цифровых сигнальных процессоров общего назначения. В качестве устройства 8 графического вывода может быть использован монитор персонального компьютера.

Способ распознавания объектов на изображении, при котором полученное с камеры наблюдения изображение разделяют на зоны, производят выделение структурных элементов для каждой из выделенных зон, отличающийся тем, что разделение изображения на зоны осуществляют путем фильтрации объектов на бинарном контурном изображении по принципу восьмисвязности, представляющему собой последовательный анализ всех точек изображения, поиска связанных точек, принадлежащих к одному объекту изображения, среди 8-ми соседних точек и сохранение координат всех выделенных точек одного объекта, а последующее выделение структурных элементов осуществляют путем определения значимых точек для каждого выделенного объекта - концевых точек, точек пересечения и перегибов линий, причем для определения концевых точек вычисляют количество пикселей, принадлежащих объекту в апертуре 3×3 вокруг текущей точки, и отмечают те концевые точки, для которых количество точек объекта в апертуре 3×3 вокруг текущей точки не более трех, и при этом все точки являются соседними, для определения точек пересечения нескольких линий производят анализ зоны 5×5 вокруг каждой точки объекта с выделением пикселей, для которых количество линий, выходящих за пределы апертуры, более двух, для определения точек перегибов текущей линии определяют максимальное расстояние от одной из точек текущего отрезка до прямой, соединяющей границы этого отрезка, и сравнивают это расстояние с заданным порогом, после этого сохраняют информацию о параметрах первичных связей каждой пары выделенных значимых точек - направлении, длине и угле наклона линии связи между точками и координатах точек, далее на выделенных объектах производят поиск окружностей методом Хафа, для чего для каждой точки объекта вычисляют возможные ее параметры (a, b, R) для разных значений радиуса R окружности в допустимом диапазоне, по вычисленным параметрам дополняют соответствующую ячейку в таблице ячеек накопления, после обработки каждой точки, принадлежащей объекту, производят анализ таблицы для поиска параметров, для которых значение в таблице выше заданного порога, а выделение на изображении объектов прямоугольной формы и простых замкнутых фигур осуществляют путем анализа сохраненной информации о параметрах первичных связей каждой пары выделенных значимых точек, запоминают полученную в результате анализа информацию о вторичных связях - соотношениях между каждой парой значимых точек выделенных объектов - расстояниях, углах наклона линии связи между точками, типах объектов, полученное описание сцены изображения в виде информации об объектах на изображении и связей между ними используют для распознавания зоны на изображении, соответствующей заданным параметрам эталонной сцены.



 

Похожие патенты:

Изобретение относится к области калибровки видеокамер, работающих в составе системы технического зрения. Технический результат − получение высококонтрастного изображения тестового шаблона, наблюдаемого камерами видимого и инфракрасного диапазона для осуществления калибровки видеодатчиков многоспектральной системы технического зрения.

Группа изобретений относится к области медицины и аналитической технике. Раскрыт способ изготовления цветового шаблона, представляющего собой плоскую бумажную или пластиковую карточку, на которой имеется область для размещения тест-полоски и набор калибровочных зон для идентификации цвета.

Изобретение относится к вычислительной технике. Технический результат – улучшенная визуализация представляющей интерес ткани в данных контрастированного изображения.

Группа изобретений относится к медицине. Способ для определения сигналов дыхания субъекта осуществляют с помощью приспособления для определения сигналов дыхания.

Группа изобретений относится к медицинской технике, а именно к средствам для оценки риска инсульта с использованием ультразвуковой визуализации. Диагностическая ультразвуковая система визуализации для оценки бляшки ультразвуком с контрастированием содержит датчик ультразвуковой визуализации с матричным преобразователем, выполненный с возможностью сбора последовательности ультразвуковых изображений области бляшки в сонной артерии во время подвода контрастного вещества, вычислитель кривых времени-интенсивности для каждого пикселя из пикселей в области бляшки на ультразвуковых изображениях последовательности, где присутствует контраст, компаратор, выполненный с возможностью определения каждого пикселя из пикселей в области бляшки, где происходит перфузия, при этом контраст в данном пикселе базируется на кривой времени-интенсивности для данного пикселя, и дисплей, выполненный с возможностью отображения степени перфузии в области бляшки.

Изобретение относится к обследующему устройству, способу и машиночитаемому носителю для обработки и анализа изображения биологического образца для цифровой патологии.

Изобретение относится к медицине, а именно к медицинской визуализации и лечению, и может быть использовано для автоматического построения контуров на медицинском изображении.

Изобретение относится к вычислительной технике. Технический результат − повышение скорости поиска необходимого события или объекта в импортированном видео, полученном от стороннего устройства.

Изобретение относится к анализу и обработке цифровых изображений, точнее видеоконтроля качества идентичных объектов. Технический результат заключается в улучшении качества контроля.

Группа изобретений относятся к медицинской технике, а именно к средствам медицинской диагностики, реализуемым с помощью компьютеров. Способ ранжирования случаев заболеваний пациентов в соответствии с уровнями сложности диагностирования содержит: извлечение из базы данных визуализирующего исследования пациента, установление патологии на изображении, анализ демографических и клинических данных, расчет показателя компьютерной стратификации для каждого случая заболевания в зависимости от установленной патологии и демографических и клинических данных и выдачу ранжированного списка случаев заболеваний пациентов согласно соответствующим оценкам стратификации, присвоенным каждому случаю заболевания, хранение ранее диагностированных случаев заболеваний в базе данных, оценку точности ранее установленного диагноза, выполнение классификатора, который генерирует показатель точности, указывающий на точность диагноза, прием информации о типе каждого случая заболевания и генерацию показателя стратификации.

Изобретение относится к области сельского хозяйства, в частности к методам рекогносцировочной диагностики состояния растений с применением беспилотных летательных аппаратов (БПЛА) для получения фотометрических данных.

Изобретение относится к области вычислительной техники для анализа и обработки данных изображений. Технический результат – уменьшение частоты пропуска кадра-вставки и частоты ложного обнаружения кадра-вставки в потоке мультимедийных данных при оценке классов кадров.

Изобретение относится к области цифровой обработки изображений. Технический результат – повышение скорости и точности распознавания графических образов при одновременном уменьшении количества ложных распознаваний.

Изобретение относится к области обработки изображений. Технический результат – повышение точности результатов сегментации за счет определения параметров расположения объекта, зафиксированного на изображении.

Изобретение относится к области вычисления дескрипторов изображения. Технический результат – обеспечение уменьшения размера дескриптора изображения посредством преобразования.

Изобретение относится к области анализа кадра, включающего данные изображения, для обнаружения дефектов в кадре. Технический результат – обнаружение бликов в кадре посредством использования вычисленного набора статистик для связных компонент.

Изобретение относится к области обработки изображений, а именно к распознаванию категории объекта изображения. Технический результат – повышение скорости и точности распознавания категории объекта изображения.

Изобретение относится к способу модификации копий документов и их идентификации для защиты документов от несанкционированного распространения. Техническим результатом является повышение защиты документа от несанкционированного распространения за счет обеспечения возможности идентификации пользователя, допустившего распространение документа.

Изобретение относится к вычислительной технике. Технический результат заключается в возможности исправления перспективных искажений изображения открытого разворота многостраничного документа.

Изобретение относится к способам для генерирования регистрационной записи событий, ассоциированных с участниками спортивного события, а именно к области автоматизированной обработки данных, полученных при помощи измерительных видеосистем.

Изобретение относится к вычислительной технике. Технический результат – повышение локального контраста результирующего изображения.

Предлагаемое изобретение относится к способам обработки визуальной информации и может быть использовано в системах технического зрения при решении задач поиска, слежения, наведения, диагностирования, контроля и распознавания объектов на изображении. Технический результат заключается в повышении точности и достоверности распознавания объектов на изображении в условиях разной освещенности и изменении метеоусловий съемки. В способе осуществляют разделение изображения на зоны и выделение структурных элементов, при этом разделение изображения на зоны осуществляют путем фильтрации объектов на бинарном контурном изображении по принципу восьмисвязности. Последующее выделение структурных элементов осуществляют путем определения значимых точек для каждого выделенного объекта - концевых точек, точек пересечения и перегибов линий, после этого сохраняют информацию о параметрах первичных связей каждой пары выделенных значимых точек. А выделение на изображении объектов прямоугольной формы и простых замкнутых фигур осуществляют путем анализа сохраненной информации о параметрах первичных связей каждой пары выделенных значимых точек, запоминают полученную в результате анализа информацию о вторичных связях - соотношениях между каждой парой значимых точек выделенных объектов. 4 ил.

Наверх