Способ распознавания кодированных изображений

 

Изобретение относится к автоматике и вычислительной технике. Его применение при распознавании и селекции заданных видов фрагментов кодированных документальных сообщений при обработке факсимильной информации позволяет получить технический результат в виде повышения точности распознавания заданных фрагментов в кодированном факсимильном изображении. Этот результат достигается благодаря тому, что в способ введены операции разделения интервала возможных значений числа бит в каждой кодированной строке развертки на "К" субинтервалов ak (k=1,2,...,К), представления на этапе обучения каждого "q"-го эталонного фрагмента цепочкой Aq номеров а(q)k субинтервалов, размещения полученных цепочек в банке эталонных цепочек, формирования на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущей цепочки Ах номеров а(x)k заданных субинтервалов, сравнения друг с другом элементов а(x)k и а(q)k с одинаковыми порядковыми номерами "k" и вынесения решения о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов. 2 з.п. ф-лы, 1 ил.

Изобретение относится к автоматике и вычислительной технике и может быть использовано для распознавания и селекции заданных видов фрагментов кодированных документальных сообщений при обработке факсимильной информации.

Известен способ распознавания фрагментов изображения [1], основанный на нахождении в памяти пиксельных данных, описывающих вставку размером n*n пикселов в первом изображении, производстве свертки величин интенсивности пикселов вставки с величинами ядра Лапласа с нулевым средним и получении лапласовой вставки, данные которой описывают координаты х, у и величины интенсивности пикселов со знаками, производстве свертки величин интенсивности лапласовой вставки с ядром Гаусса вдоль осей х и у и получении изображения, данные которого описывают положения и величины интенсивностей пикселов со знаками, упорядочивании чисел ядра Гаусса в гауссову последовательность и преобразовании пиксельных данных в бинарные, повторении преобразования над данными вставки размером m*m (m<n) пикселов из второго изображения, получении для каждого из возможных сдвигов величины корреляции пикселов, сравнивании величины корреляций и определении на основе максимальной величины корреляции сдвига.

Недостатком данного изобретения является существенная вычислительная сложность, обусловленная необходимостью обеспечения свертки величин интенсивностей матриц пикселов размера n*n и m*m с соответствующими величинами ядер Лапласа и Гаусса, а также вычисления соответствующих величин корреляций пикселов с последующим их сравнением.

Известен также способ распознавания текстовых изображений [2], основанный на определении прямоугольников, ограничивающих части изображения, потенциально содержащие текст, генерировании последовательности признаков для каждой части изображения, определении набора обученных скрытых марковских моделей (СММ) одиночных знаков с учетом структурных параметров каждого знака, объединении СММ, соответствующих знакам ключевого слова и имеющих один и тот же контекст, конструировании сети СММ, содержащей СММ ключевого слова, и определении с ее помощью наличия ключевого слова во входном изображении.

Как показано в [3], хранение факсимильных изображений в факсимильных банках данных наиболее целесообразно осуществлять в сжатой форме, что обеспечивается использованием специальных видов кодирования, таких как модифицированный код Хаффмана (код МН) или модифицированный код READ (код MR) [4], обеспечивающих меньший объем памяти, необходимой для хранения факсимильного изображения, чем в случае использования других графических форматов.

В этой связи недостатком приведенного выше способа является низкая точность распознавания фрагментов факсимильных изображений, представленных в кодированной форме (МН или MR), так как при этом биты знаков ключевых слов заменяются кодами длин серий двоичных нулей и единиц, что исключает возможность использования признаков, предложенных в указанном выше способе.

Наиболее близким по своей сущности к заявляемому изобретению является способ распознавания кодированных изображений [5], основанный на операции разделения изображения, представленного в форме кодированных электрических сигналов, на несколько участков и оценки размеров Ni этих участков, причем выделяют кодированные строчные участки электрических сигналов, заключенные между двумя соседними кодовыми словами конца строки развертки изображения, удаляют служебные биты заполнения в выделенных строчных участках, различают и выделяют r-е группы, состоящие из М последовательных участков соседних “белых” строк минимальной размерности, сравнивают числа этих групп с соответствующей пороговой величиной N0 и выделяют р-е группы, состоящие из L последовательных “небелых” кодированных строк, сравнивают числа данных групп с соответствующей пороговой величиной N1, оценивают наличие квазипериодичности следования участков, соответствующих кодированным “белым” строкам развертки изображения, определяют среднюю величину квазипериода Qr, оценивают абсолютные величины ip разностей размеров соседних кодированных “небелых” строк, вычисляют отношения dp максимальных и минимальных значений разностей ip, сравнивают полученные величины отношений dp с априорно заданной пороговой величиной D и выносят решение о принадлежности кодированного изображения или его фрагмента графической или текстовой форме.

Недостатком данного способа является низкая точность распознавания кодированных фрагментов факсимильных изображений, представленных в одинаковой форме (графической или текстовой), поскольку используемые в нем признаки предназначены исключительно для различения между собой двух разных форм кодированных фрагментов факсимильных изображений: текстовой и графической. Таким образом, данный способ не позволяет обеспечить достоверное распознавание априорно заданных кодированных текстовых фрагментов среди множества возможных кодированных текстовых фрагментов (так же, как и кодированных графических фрагментов заданного вида среди множества возможных кодированных графических фрагментов факсимильных изображений).

Целью изобретения является повышение точности распознавания фрагментов заданного вида в кодированном факсимильном изображении.

Цель достигается тем, что в известный способ, включающий выделение кодированных строчных участков электрических сигналов, удаление из них служебных битов и кодовых комбинаций, выделение групп соседних кодированных строк развертки, оценку числа бит в каждой кодированной строке, входящей в данную группу, согласно изобретению введены операции, при которых интервал возможных значений числа бит в каждой кодированной строке развертки разделяют на "К" субинтервалов ak (k=1, 2,... , К), нумерованных в порядке возрастания возможных значений длин этих строк, представляют на этапе обучения каждого "q"-ro (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонного фрагмента цепочкой Aq номеров а(q)k субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, размещают полученные цепочки в банке эталонных цепочек, формируют на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущую цепочку Ax номеров а(x)k заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, сравнивают друг с другом элементы а(x)k и а(q)k с одинаковыми порядковыми номерами "k", входящие в текущую цепочку Ах и в эталонные цепочки Aq, и выносят решение о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов.

Оценивают абсолютные величины разностей | a(x)k-a(x)k-1| и | a(x)k| -a(x)k+1 между значениями текущего элемента а(x)k цепочки Ах и значениями предыдущего a(x)k-1 и последующего a(x)k+1 элементов цепочки Ах и заменяют элемент а(x)k на среднее значение <ak>=(a(x)k-1-a(x)k+1)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины .

Выносят решение о принадлежности текущего фрагмента, заданного цепочкой Ax, "q"-мy эталонному фрагменту, заданному цепочкой Aq, если абсолютные величины разностей значений элементов а(x)k и а(q)k цепочек Ах и Aq с одинаковыми порядковыми номерами "k" не превышают заданных величин (q)k.

Сопоставительный анализ со способом, выбранным в качестве прототипа, показывает, что заявляемый способ отличается новыми операциями разделения интервала возможных значений числа бит в каждой кодированной строке развертки на "К" субинтервалов ak (k=1, 2,... , К), нумерованных в порядке возрастания значений длин этих строк, представления на этапе обучения каждого "q"-го (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонного фрагмента цепочкой Aq номеров а(q)k субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, размещения полученных цепочек в банке эталонных цепочек, формирования на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущей цепочки Ах номеров а(x)k заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, сравнения друг с другом элементов а(x)k и а(q)k с одинаковыми порядковыми номерами "k", входящими в текущую цепочку Ах и в эталонные цепочки Aq и вынесения решения о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов; а также введены операции оценки абсолютной величины разностей | a(x)k-a(x)k-1| и | a(x)k-a(x)k+1| между значениями текущего элемента а(x)k цепочки Ах и значениями предыдущего a(x)k-1 и последующего a(x)k+1 элементов цепочки Ах и замены элемента а(x)k на среднее значение <ak>=(a(x)k-1-a(x)k+1)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины ; а также введены операции вынесения решения о принадлежности текущего фрагмента, заданного цепочкой Ах, "q"-мy эталонному фрагменту, заданному цепочкой Aq, если разности значений элементов а(x)k и а(q)k цепочек Ах и Aq с одинаковыми порядковыми номерами "k" не превышают заданных величин (q)k.

Таким образом, заявляемый способ соответствует критерию изобретения "новизна".

Изобретение имеет "изобретательский уровень", т.к. оно для специалиста явным образом не следует из уровня техники.

Изобретение может быть использовано в различных областях промышленности, а именно связанных с техникой передачи и обработки изображений, с информационно-вычислительной техникой, а также в других областях народного хозяйства, и соответствует критерию "промышленная применимость".

На чертеже представлена блок-схема алгоритма распознавания кодированных изображений.

Предлагаемый способ реализуется следующим образом.

В последовательности двоичных кодированных электрических сигналов факсимильного изображения после удаления служебных битов и кодовых слов выделяются текущие группы соседних кодированных строк развертки и затем производится оценка числа бит в каждой кодированной строке, входящей в данную группу. Далее на этапе обучения интервал возможных значений числа бит в каждой кодированной строке развертки разделяется на "К" субинтервалов ak (k=1, 2,... , К), нумерованных в порядке возрастания значений длин этих строк, а каждый "q"-й (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонный фрагмент представляется цепочкой Aq номеров а(q)k субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, и полученные цепочки размещаются в банке эталонных цепочек. На этапе распознавания эталонных фрагментов в текущем факсимильном изображении формируется текущая цепочка Ах номеров а(x)k заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, производится оценка абсолютной величины разностей | a(x)k-a(x)k-1| и | a(x)k-a(x)k+1| между значениями текущего элемента а(х)k цепочки Ах и значениями предыдущего а(x)k-1 и последующего а(x)k+1 элементов цепочки Ах и замена элемента а(x)k на среднее значение <ak>=(a(x)k-1-a(x)k+1)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины ; элементы а(x)k и а(q) kс одинаковыми порядковыми номерами "k", входящими в текущую цепочку Ах и в эталонные цепочки Aq, сравниваются друг с другом и выносится решение о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов, если разности значений элементов а(x)k и а(q)k цепочек Ах и Aq с одинаковыми порядковыми номерами "k" не превышают заданных величин (q)k.

Способ реализуется на базе использования однокристальной микроЭВМ или ПЭВМ с процессором PENTIUM, обеспечивающих ввод данных кодированного факсимильного изображения объема 50-150 кбайт в память ОЭВМ/ПЭВМ и последующую арифметико-логическую обработку этих данных.

Способ позволяет на базе введенных операций использовать связь между структурой строчного фрагмента факсимильного изображения и структурой сформированных цепочек номеров интервалов величин размеров кодированных строк этого фрагмента и тем самым повысить точность распознавания заданных фрагментов в кодированном факсимильном изображении.

Источники информации

1. Патент США №5604819, МКИ G 06 K 9/00 от 15.03.93.

2. Патент США №5592568, МКИ G 06 K 9/68 от 13.02.93.

3. Введение к реализации системы поиска факсимильных изображений. Экспресс-информация, сер. Информатика, - 1993, №3, с.6.

4. Рекомендации МККТТ. Серия Т.4. Синяя книга. Т. VII, вып. VII.3, 1988, с.17.

5. Патент РФ №2126552, МКИ G 06 K 9/00.

Формула изобретения

1. Способ распознавания кодированных изображений, включающий выделение кодированных строчных участков электрических сигналов, удаление из них служебных битов и кодовых комбинаций, выделение групп соседних кодированных строк развертки, оценку числа бит в каждой кодированной строке, входящей в данную группу, отличающийся тем, что интервал возможных значений числа бит в каждой кодированной строке развертки разделяют на К субинтервалов ak (k=1,2,... ,К), нумерованных в порядке возрастания значений длин этих строк, представляют на этапе обучения каждый q-й (q=1,2,... ,Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонный фрагмент цепочкой Aq номеров а(q)k субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, размещают полученные цепочки в банке эталонных цепочек, формируют на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущей цепочки Ах номеров а(x)k заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, сравнивают друг с другом элементы а(x)k и а(q)k с одинаковыми порядковыми номерами k, входящими в текущую цепочку Ах и в эталонные цепочки Aq и выносят решение о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов.

2. Способ по п.1, отличающийся тем, что оценивают абсолютные величины разностей | а(x)k(x)k-1| и | а(x)k(x)k+1| между значениями текущего элемента а(x)k цепочки Ах и значениями предыдущего а(x)k-1 и последующего a(x)k+1 элементов цепочки Ах и заменяют элемент а(x)k на среднее значение <ak>=(a(x)k-1-a(x)k+1)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины д.

3. Способ по п.1, отличающийся тем, что выносят решение о принадлежности текущего фрагмента, заданного цепочкой Ах, q-му эталонному фрагменту, заданному цепочкой Aq, если абсолютные величины разностей значений элементов а(x)k и а(q)k цепочек Ах и Aq с одинаковыми порядковыми номерами k не превышают заданных величин (q)k.

РИСУНКИРисунок 1



 

Похожие патенты:

Изобретение относится к области вычислительной техники и может быть использовано для обработки изображений

Изобретение относится к области навигационной техники и может быть использовано для создания датчиков перемещения и скорости

Изобретение относится к системам маркировки изображений водяным знаком и, в частности, к обнаружению водяного знака в информационном сигнале

Изобретение относится к обнаружению водяного знака в информационном сигнале

Изобретение относится к обнаружению «водяных знаков» в информационных сигналах

Изобретение относится к области получения фото- и видеоизображений, в частности, с помощью мобильных устройств со встроенными фото- и видеокамерами и может быть использовано, например, для улучшения качества результирующего изображения, полученного из нескольких исходных снимков

Изобретение относится к средствам определения гряд и поясов торосов на ледяном покрове акваторий. Техническим результатом является обеспечение мониторинга состояния ледяного покрова акваторий за счет определения толщины ледяного покрова, осредненной на локальном элементе разрешения. В способе путем выделения на оригинальном ИК-изображении опорных точек, представляющих собой значения толщины льда и их яркости; с использованием значений яркости и рассчитанной функциональной зависимости между виртуальным рельефом и рельефом поля яркостей на ИК-изображении, полученного с искусственного спутника Земли, для оригинального ИК-изображения вычисляются яркости «теплой» и «холодной точек»; анализируемое изображение представляют в виде пространственного распределения элементов матрицы, соответствующих яркостям каждого пикселя изображения, выделяют упорядоченные структуры яркостного поля, и представляют их в виде цветовой раскраски. 2 з.п. ф-лы, 2 ил.

Изобретение относится к средствам анализа содержимого изображений. Техническим результатом является повышение эффективности оценки содержимого изображений. В способе просматривают объект оценки и выявляют признаки нежелательного изображения первой группы - динамические признаки и второй группы - статические признаки. В случае выявления признака из первой или второй группы, выявляют признаки третьей группы (негативных последствий для здоровья) и четвертой группы (условий съемки). Осуществляют формализованный анализ оценки объекта по указанным группам признаков, определяют количественное выражение выявленных признаков на базе факторного анализа с учетом коэффициента факторной нагрузки, суммируют количественные показатели выявленных групп признаков и делают вывод о наличии нежелательного изображения. 3 н. и 1 з.п. ф-лы.

Изобретение относится к области цифровой обработки изображений и может быть использовано в охранных системах, системах мониторинга и контроля воздушного движения, оптикоэлектронных системах сопровождения объектов. Техническим результатом является повышение точности измерения координат объектов. Способ обработки последовательности изображений для определения координат объектов на основе комплексирования базовых алгоритмов заключается в принятии и аналого-цифровом преобразовании сигнала изображения каждого кадра, в расчете критериев работоспособности алгоритмов измерения координат: на основе байесовской классификации, на основе корреляционного совмещения изображений со сглаживанием эталона, на основе пространственной и пространственно-временной фильтрации, в переходе от значений критериев работоспособности к характеристике работоспособности, в выборе алгоритма измерения координат согласно правилу принятия решения, в измерении координат выбранным алгоритмом.

Изобретение относится к обработке сигналов при считывании информации. Технический результат заключается в повышении точности распознавания данных. Блок (41) формирования значения оценки наличия/отсутствия структуры определяет наличие или отсутствие структуры путем сравнения данных (d3) распознавания и данных (d44) коррекции. Работая в соответствии со значением (d41) оценки наличия/отсутствия структуры, полученным от блока (41) формирования значения оценки наличия/отсутствия структуры, блок (42) обновления данных коррекции выдает данные (d42) коррекции, обновленные путем взвешенного сложения данных (d3) распознавания и данных (d44) коррекции, увеличивая вес данных (d44) коррекции, когда имеется структура изображения, и увеличивая вес данных (d3) распознавания, когда структура изображения отсутствует. Блок (43) вычитания данных коррекции вычитает данные (d42) коррекции из данных (d3) распознавания и выдает выходные данные (d4) распознавания. В результате становится возможным уменьшение эффекта изменений уровня сигнала распознавания для сигнала распознавания, формируемого в интервале считывания распознаваемого объекта, и точное считывание структуры. 7 н. и 4 з.п. ф-лы, 22 ил.

Изобретение относится к области обработки изображений, документов и текстов. Технический результат – обеспечение распознавания символов, не полностью представленных на изображении. Способ распознавания символов на изображении включает: получение изображения, содержащего символы для распознавания; анализ полученного изображения для обнаружения интересующей области; сравнение в обнаруженной интересующей области первой части полученного изображения с набором эталонов для установления первого значения, отображающего точность совпадения, для каждого эталона в наборе эталонов; создание первой серии гипотез по меньшей мере на основе установленных первых значений, отображающих точность совпадения; сравнение второй части полученного изображения с набором выбранных эталонов для установления второго значения, отображающего точность совпадения, для каждого эталона в наборе выбранных эталонов, причем набор выбранных эталонов формируется на основе первой серии гипотез; создание второй серии гипотез по меньшей мере на основе установленных вторых значений, отображающих точность совпадения; и распознавание символов в полученном изображении по меньшей мере на основе первой серии гипотез и второй серии гипотез. 3 н. и 24 з.п. ф-лы, 8 ил.
Наверх