Способ распознавания кодированных изображений

Авторы патента:

G06K9/70 - выбор следующего эталона в зависимости от результата предыдущего сравнения

Изобретение относится к автоматике и вычислительной технике. Его применение при распознавании и селекции заданных видов фрагментов кодированных документальных сообщений при обработке факсимильной информации позволяет получить технический результат в виде повышения точности распознавания заданных фрагментов в кодированном факсимильном изображении. Этот результат достигается благодаря тому, что в способ введены операции разделения интервала возможных значений числа бит в каждой кодированной строке развертки на "К" субинтервалов a_k (k=1,2,...,К), представления на этапе обучения каждого "q"-го эталонного фрагмента цепочкой A_q номеров а^(q)_k субинтервалов, размещения полученных цепочек в банке эталонных цепочек, формирования на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущей цепочки А_х номеров а^(x)_k заданных субинтервалов, сравнения друг с другом элементов а^(x)_k и а^(q)_k с одинаковыми порядковыми номерами "k" и вынесения решения о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов. 2 з.п. ф-лы, 1 ил.

Изобретение относится к автоматике и вычислительной технике и может быть использовано для распознавания и селекции заданных видов фрагментов кодированных документальных сообщений при обработке факсимильной информации.

Известен способ распознавания фрагментов изображения [1], основанный на нахождении в памяти пиксельных данных, описывающих вставку размером n*n пикселов в первом изображении, производстве свертки величин интенсивности пикселов вставки с величинами ядра Лапласа с нулевым средним и получении лапласовой вставки, данные которой описывают координаты х, у и величины интенсивности пикселов со знаками, производстве свертки величин интенсивности лапласовой вставки с ядром Гаусса вдоль осей х и у и получении изображения, данные которого описывают положения и величины интенсивностей пикселов со знаками, упорядочивании чисел ядра Гаусса в гауссову последовательность и преобразовании пиксельных данных в бинарные, повторении преобразования над данными вставки размером m*m (m<n) пикселов из второго изображения, получении для каждого из возможных сдвигов величины корреляции пикселов, сравнивании величины корреляций и определении на основе максимальной величины корреляции сдвига.

Недостатком данного изобретения является существенная вычислительная сложность, обусловленная необходимостью обеспечения свертки величин интенсивностей матриц пикселов размера n*n и m*m с соответствующими величинами ядер Лапласа и Гаусса, а также вычисления соответствующих величин корреляций пикселов с последующим их сравнением.

Известен также способ распознавания текстовых изображений [2], основанный на определении прямоугольников, ограничивающих части изображения, потенциально содержащие текст, генерировании последовательности признаков для каждой части изображения, определении набора обученных скрытых марковских моделей (СММ) одиночных знаков с учетом структурных параметров каждого знака, объединении СММ, соответствующих знакам ключевого слова и имеющих один и тот же контекст, конструировании сети СММ, содержащей СММ ключевого слова, и определении с ее помощью наличия ключевого слова во входном изображении.

Как показано в [3], хранение факсимильных изображений в факсимильных банках данных наиболее целесообразно осуществлять в сжатой форме, что обеспечивается использованием специальных видов кодирования, таких как модифицированный код Хаффмана (код МН) или модифицированный код READ (код MR) [4], обеспечивающих меньший объем памяти, необходимой для хранения факсимильного изображения, чем в случае использования других графических форматов.

В этой связи недостатком приведенного выше способа является низкая точность распознавания фрагментов факсимильных изображений, представленных в кодированной форме (МН или MR), так как при этом биты знаков ключевых слов заменяются кодами длин серий двоичных нулей и единиц, что исключает возможность использования признаков, предложенных в указанном выше способе.

Наиболее близким по своей сущности к заявляемому изобретению является способ распознавания кодированных изображений [5], основанный на операции разделения изображения, представленного в форме кодированных электрических сигналов, на несколько участков и оценки размеров N_i этих участков, причем выделяют кодированные строчные участки электрических сигналов, заключенные между двумя соседними кодовыми словами конца строки развертки изображения, удаляют служебные биты заполнения в выделенных строчных участках, различают и выделяют r-е группы, состоящие из М последовательных участков соседних “белых” строк минимальной размерности, сравнивают числа этих групп с соответствующей пороговой величиной N₀ и выделяют р-е группы, состоящие из L последовательных “небелых” кодированных строк, сравнивают числа данных групп с соответствующей пороговой величиной N₁, оценивают наличие квазипериодичности следования участков, соответствующих кодированным “белым” строкам развертки изображения, определяют среднюю величину квазипериода Q_r, оценивают абсолютные величины i_p разностей размеров соседних кодированных “небелых” строк, вычисляют отношения d_p максимальных и минимальных значений разностей i_p, сравнивают полученные величины отношений d_p с априорно заданной пороговой величиной D и выносят решение о принадлежности кодированного изображения или его фрагмента графической или текстовой форме.

Недостатком данного способа является низкая точность распознавания кодированных фрагментов факсимильных изображений, представленных в одинаковой форме (графической или текстовой), поскольку используемые в нем признаки предназначены исключительно для различения между собой двух разных форм кодированных фрагментов факсимильных изображений: текстовой и графической. Таким образом, данный способ не позволяет обеспечить достоверное распознавание априорно заданных кодированных текстовых фрагментов среди множества возможных кодированных текстовых фрагментов (так же, как и кодированных графических фрагментов заданного вида среди множества возможных кодированных графических фрагментов факсимильных изображений).

Целью изобретения является повышение точности распознавания фрагментов заданного вида в кодированном факсимильном изображении.

Цель достигается тем, что в известный способ, включающий выделение кодированных строчных участков электрических сигналов, удаление из них служебных битов и кодовых комбинаций, выделение групп соседних кодированных строк развертки, оценку числа бит в каждой кодированной строке, входящей в данную группу, согласно изобретению введены операции, при которых интервал возможных значений числа бит в каждой кодированной строке развертки разделяют на "К" субинтервалов a_k(k=1, 2,... , К), нумерованных в порядке возрастания возможных значений длин этих строк, представляют на этапе обучения каждого "q"-ro (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонного фрагмента цепочкой A_q номеров а^(q)_k субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, размещают полученные цепочки в банке эталонных цепочек, формируют на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущую цепочку A_x номеров а^(x)_k заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, сравнивают друг с другом элементы а^(x)_k и а^(q)_k с одинаковыми порядковыми номерами "k", входящие в текущую цепочку А_х и в эталонные цепочки A_q, и выносят решение о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов.

Оценивают абсолютные величины разностей | a^(x)_k-a^(x)_k-1|и | a^(x)_k|-a^(x)_k+1 между значениями текущего элемента а^(x)_k цепочки А_х и значениями предыдущего a^(x)_k-1 и последующего a^(x)_k+1 элементов цепочки А_хи заменяют элемент а^(x)_k на среднее значение <a_k>=(a^(x)_k-1-a^(x)_k+1)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины .

Выносят решение о принадлежности текущего фрагмента, заданного цепочкой A_x, "q"-мy эталонному фрагменту, заданному цепочкой A_q, если абсолютные величины разностей значений элементов а^(x)_k и а^(q)_k цепочек А_х и A_q с одинаковыми порядковыми номерами "k" не превышают заданных величин ^(q)_k.

Сопоставительный анализ со способом, выбранным в качестве прототипа, показывает, что заявляемый способ отличается новыми операциями разделения интервала возможных значений числа бит в каждой кодированной строке развертки на "К" субинтервалов a_k (k=1, 2,... , К), нумерованных в порядке возрастания значений длин этих строк, представления на этапе обучения каждого "q"-го (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонного фрагмента цепочкой A_q номеров а^(q)_k субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, размещения полученных цепочек в банке эталонных цепочек, формирования на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущей цепочки А_х номеров а^(x)_k заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, сравнения друг с другом элементов а^(x)_k и а^(q)_k с одинаковыми порядковыми номерами "k", входящими в текущую цепочку А_х и в эталонные цепочки A_q и вынесения решения о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов; а также введены операции оценки абсолютной величины разностей | a^(x)_k-a^(x)_k-1|и | a^(x)_k-a^(x)_k+1|между значениями текущего элемента а^(x)_k цепочки А_х и значениями предыдущего a^(x)_k-1 и последующего a^(x)_k+1 элементов цепочки А_х и замены элемента а^(x)_k на среднее значение <a_k>=(a^(x)_k-1-a^(x)_k+1)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины ; а также введены операции вынесения решения о принадлежности текущего фрагмента, заданного цепочкой А_х, "q"-мy эталонному фрагменту, заданному цепочкой A_q, если разности значений элементов а^(x)_k и а^(q)_k цепочек А_х и A_q с одинаковыми порядковыми номерами "k" не превышают заданных величин ^(q)_k.

Таким образом, заявляемый способ соответствует критерию изобретения "новизна".

Изобретение имеет "изобретательский уровень", т.к. оно для специалиста явным образом не следует из уровня техники.

Изобретение может быть использовано в различных областях промышленности, а именно связанных с техникой передачи и обработки изображений, с информационно-вычислительной техникой, а также в других областях народного хозяйства, и соответствует критерию "промышленная применимость".

На чертеже представлена блок-схема алгоритма распознавания кодированных изображений.

Предлагаемый способ реализуется следующим образом.

В последовательности двоичных кодированных электрических сигналов факсимильного изображения после удаления служебных битов и кодовых слов выделяются текущие группы соседних кодированных строк развертки и затем производится оценка числа бит в каждой кодированной строке, входящей в данную группу. Далее на этапе обучения интервал возможных значений числа бит в каждой кодированной строке развертки разделяется на "К" субинтервалов a_k (k=1, 2,... , К), нумерованных в порядке возрастания значений длин этих строк, а каждый "q"-й (q=1, 2,... , Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонный фрагмент представляется цепочкой A_q номеров а^(q)_k субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, и полученные цепочки размещаются в банке эталонных цепочек. На этапе распознавания эталонных фрагментов в текущем факсимильном изображении формируется текущая цепочка А_х номеров а^(x)_k заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, производится оценка абсолютной величины разностей | a^(x)_k-a^(x)_k-1|и | a^(x)_k-a^(x)_k+1|между значениями текущего элемента а^(х)_k цепочки А_х и значениями предыдущего а^(x)_k-1 и последующего а^(x)_k+1 элементов цепочки А_х и замена элемента а^(x)_k на среднее значение <a_k>=(a^(x)_k-1-a^(x)_k+1)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины ; элементы а^(x)_k и а^(q)_kс одинаковыми порядковыми номерами "k", входящими в текущую цепочку А_х и в эталонные цепочки A_q, сравниваются друг с другом и выносится решение о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов, если разности значений элементов а^(x)_k и а^(q)_k цепочек А_х и A_q с одинаковыми порядковыми номерами "k" не превышают заданных величин ^(q)_k.

Способ реализуется на базе использования однокристальной микроЭВМ или ПЭВМ с процессором PENTIUM, обеспечивающих ввод данных кодированного факсимильного изображения объема 50-150 кбайт в память ОЭВМ/ПЭВМ и последующую арифметико-логическую обработку этих данных.

Способ позволяет на базе введенных операций использовать связь между структурой строчного фрагмента факсимильного изображения и структурой сформированных цепочек номеров интервалов величин размеров кодированных строк этого фрагмента и тем самым повысить точность распознавания заданных фрагментов в кодированном факсимильном изображении.

Источники информации

1. Патент США №5604819, МКИ G 06 K 9/00 от 15.03.93.

2. Патент США №5592568, МКИ G 06 K 9/68 от 13.02.93.

3. Введение к реализации системы поиска факсимильных изображений. Экспресс-информация, сер. Информатика, - 1993, №3, с.6.

4. Рекомендации МККТТ. Серия Т.4. Синяя книга. Т. VII, вып. VII.3, 1988, с.17.

5. Патент РФ №2126552, МКИ G 06 K 9/00.

Формула изобретения

1. Способ распознавания кодированных изображений, включающий выделение кодированных строчных участков электрических сигналов, удаление из них служебных битов и кодовых комбинаций, выделение групп соседних кодированных строк развертки, оценку числа бит в каждой кодированной строке, входящей в данную группу, отличающийся тем, что интервал возможных значений числа бит в каждой кодированной строке развертки разделяют на К субинтервалов a_k (k=1,2,... ,К), нумерованных в порядке возрастания значений длин этих строк, представляют на этапе обучения каждый q-й (q=1,2,... ,Q, Q - число заданных эталонных фрагментов факсимильного изображения) эталонный фрагмент цепочкой A_q номеров а^(q)_k субинтервалов, следующих в порядке поступления соответствующих текущих кодированных строк эталонного фрагмента факсимильного изображения, размещают полученные цепочки в банке эталонных цепочек, формируют на этапе распознавания эталонных фрагментов в текущем факсимильном изображении текущей цепочки А_х номеров а^(x)_k заданных субинтервалов, в которые попадают значения размеров следующих друг за другом кодированных строк, сравнивают друг с другом элементы а^(x)_k и а^(q)_k с одинаковыми порядковыми номерами k, входящими в текущую цепочку А_х и в эталонные цепочки A_q и выносят решение о принадлежности текущего фрагмента факсимильного изображения одному из заданных эталонных фрагментов.

2. Способ по п.1, отличающийся тем, что оценивают абсолютные величины разностей | а^(x)_k-а^(x)_k-1|и | а^(x)_k-а^(x)_k+1|между значениями текущего элемента а^(x)_k цепочки А_х и значениями предыдущего а^(x)_k-1 и последующего a^(x)_k+1 элементов цепочки А_х и заменяют элемент а^(x)_k на среднее значение <a_k>=(a^(x)_k-1-a^(x)_k+1)/2 предыдущего и последующего элементов в случае превышения значений обеих разностей заданной величины д.

3. Способ по п.1, отличающийся тем, что выносят решение о принадлежности текущего фрагмента, заданного цепочкой А_х, q-му эталонному фрагменту, заданному цепочкой A_q, если абсолютные величины разностей значений элементов а^(x)_k и а^(q)_k цепочек А_х и A_q с одинаковыми порядковыми номерами k не превышают заданных величин ^(q)_k.

РИСУНКИРисунок 1

Изобретение относится к области вычислительной техники и может быть использовано для обработки изображений

Устройство для обнаружения признаков распознаваемых стилизованных цифр почтового индекса // 433513

Устройство для формирования мер сходства при распознавании образов // 430405

Устройство для формирования мер сходства при распознавании образов // 430404

Способ формирования мер сходства при распознавании образов // 363105

Устройство для распознавания конечного числасимволов // 217079

Патент 155670 // 155670

Способ вычисления сдвига в датчике перемещения с высокой разрешающей способностью // 2328768

Изобретение относится к области навигационной техники и может быть использовано для создания датчиков перемещения и скорости

Обнаружение водяного знака // 2351013

Изобретение относится к системам маркировки изображений водяным знаком и, в частности, к обнаружению водяного знака в информационном сигнале

Обнаружение водяного знака // 2352992

Изобретение относится к обнаружению водяного знака в информационном сигнале

Обнаружение водяных знаков путем корреляционного анализа формы // 2368009

Изобретение относится к обнаружению «водяных знаков» в информационных сигналах

Способ сегментации изображений // 2489752

Изобретение относится к области получения фото- и видеоизображений, в частности, с помощью мобильных устройств со встроенными фото- и видеокамерами и может быть использовано, например, для улучшения качества результирующего изображения, полученного из нескольких исходных снимков

Способ определения гряд и поясов торосов на ледяном покрове акваторий // 2500031

Изобретение относится к средствам определения гряд и поясов торосов на ледяном покрове акваторий. Техническим результатом является обеспечение мониторинга состояния ледяного покрова акваторий за счет определения толщины ледяного покрова, осредненной на локальном элементе разрешения. В способе путем выделения на оригинальном ИК-изображении опорных точек, представляющих собой значения толщины льда и их яркости; с использованием значений яркости и рассчитанной функциональной зависимости между виртуальным рельефом и рельефом поля яркостей на ИК-изображении, полученного с искусственного спутника Земли, для оригинального ИК-изображения вычисляются яркости «теплой» и «холодной точек»; анализируемое изображение представляют в виде пространственного распределения элементов матрицы, соответствующих яркостям каждого пикселя изображения, выделяют упорядоченные структуры яркостного поля, и представляют их в виде цветовой раскраски. 2 з.п. ф-лы, 2 ил.

Способ оценки фото-, кино- и видеоматериалов, содержащих нежелательное изображение (варианты) // 2510905

Изобретение относится к средствам анализа содержимого изображений. Техническим результатом является повышение эффективности оценки содержимого изображений. В способе просматривают объект оценки и выявляют признаки нежелательного изображения первой группы - динамические признаки и второй группы - статические признаки. В случае выявления признака из первой или второй группы, выявляют признаки третьей группы (негативных последствий для здоровья) и четвертой группы (условий съемки). Осуществляют формализованный анализ оценки объекта по указанным группам признаков, определяют количественное выражение выявленных признаков на базе факторного анализа с учетом коэффициента факторной нагрузки, суммируют количественные показатели выявленных групп признаков и делают вывод о наличии нежелательного изображения. 3 н. и 1 з.п. ф-лы.

Способ обработки последовательности изображении для определения координат объектов на основе комплексирования базовых алгоритмов // 2575401

Изобретение относится к области цифровой обработки изображений и может быть использовано в охранных системах, системах мониторинга и контроля воздушного движения, оптикоэлектронных системах сопровождения объектов. Техническим результатом является повышение точности измерения координат объектов. Способ обработки последовательности изображений для определения координат объектов на основе комплексирования базовых алгоритмов заключается в принятии и аналого-цифровом преобразовании сигнала изображения каждого кадра, в расчете критериев работоспособности алгоритмов измерения координат: на основе байесовской классификации, на основе корреляционного совмещения изображений со сглаживанием эталона, на основе пространственной и пространственно-временной фильтрации, в переходе от значений критериев работоспособности к характеристике работоспособности, в выборе алгоритма измерения координат согласно правилу принятия решения, в измерении координат выбранным алгоритмом.

Устройство обработки сигналов, способ обработки сигналов и устройство считывания информации // 2606548

Изобретение относится к обработке сигналов при считывании информации. Технический результат заключается в повышении точности распознавания данных. Блок (41) формирования значения оценки наличия/отсутствия структуры определяет наличие или отсутствие структуры путем сравнения данных (d3) распознавания и данных (d44) коррекции. Работая в соответствии со значением (d41) оценки наличия/отсутствия структуры, полученным от блока (41) формирования значения оценки наличия/отсутствия структуры, блок (42) обновления данных коррекции выдает данные (d42) коррекции, обновленные путем взвешенного сложения данных (d3) распознавания и данных (d44) коррекции, увеличивая вес данных (d44) коррекции, когда имеется структура изображения, и увеличивая вес данных (d3) распознавания, когда структура изображения отсутствует. Блок (43) вычитания данных коррекции вычитает данные (d42) коррекции из данных (d3) распознавания и выдает выходные данные (d4) распознавания. В результате становится возможным уменьшение эффекта изменений уровня сигнала распознавания для сигнала распознавания, формируемого в интервале считывания распознаваемого объекта, и точное считывание структуры. 7 н. и 4 з.п. ф-лы, 22 ил.

Неполные эталоны // 2641452

Изобретение относится к области обработки изображений, документов и текстов. Технический результат – обеспечение распознавания символов, не полностью представленных на изображении. Способ распознавания символов на изображении включает: получение изображения, содержащего символы для распознавания; анализ полученного изображения для обнаружения интересующей области; сравнение в обнаруженной интересующей области первой части полученного изображения с набором эталонов для установления первого значения, отображающего точность совпадения, для каждого эталона в наборе эталонов; создание первой серии гипотез по меньшей мере на основе установленных первых значений, отображающих точность совпадения; сравнение второй части полученного изображения с набором выбранных эталонов для установления второго значения, отображающего точность совпадения, для каждого эталона в наборе выбранных эталонов, причем набор выбранных эталонов формируется на основе первой серии гипотез; создание второй серии гипотез по меньшей мере на основе установленных вторых значений, отображающих точность совпадения; и распознавание символов в полученном изображении по меньшей мере на основе первой серии гипотез и второй серии гипотез. 3 н. и 24 з.п. ф-лы, 8 ил.