Способ распознавания кодированных изображений

Авторы патента:

H04N7/28 - с использованием векторного кодирования

H04N7/24 - системы для передачи телевизионных сигналов с использованием импульсно-кодовой модуляции

G06K9 - Способы и устройства для считывания и распознавания напечатанных или написанных знаков или распознавания образов, например отпечатков пальцев (обработка или анализ траекторий ядерных частиц G01T 5/02; проверка рисунков на бумажных деньгах или подобных ценных бумагах G07D 7/20; распознавание речи G10L 15/00)

Изобретение относится к автоматике и вычислительной технике и может быть использовано для обработки кодированных факсимильных изображений. Цель изобретения - повышение точности распознавания кодированных текстовых и графических факсимильных изображений. Способ основан на операции разделения изображения, представленного в форме электрических сигналов, на несколько участков и оценки размеров N_i этих участков. Новым является введение операций выделения кодированных строчных участков, выделения r-х групп последовательных участков соседних "белых строк" минимального размера, выделения р-х групп последовательных участков соседних "небелых" строк, оценки наличия квазипериодичности следования групп последовательных участков "белых" строк и величины квазипериода Q_r, вычисления отношений d_p максимальных _dip _макс и минимальных _ip _мин абсолютных значений разностей размеров соседних кодированных "небелых" строк, сравнения их с порогом D и вынесения соответствующего решения. Способ позволяет выделить признаки, обеспечивающие повышение точности распознавания кодированных факсимильных изображений. 1 ил.

Изобретение относится к автоматике и вычислительной технике и может быть использовано для распознавания и селекции кодированных документальных сообщений при обработке факсимальной информации.

Известен способ распознавания графической и текстовой информации [1], основанный на построчном сканировании изображения, преобразовании его в последовательность импульсов и формировании информационных импульсов и опорного временного интервала от окончания минимального временного интервала до окончания максимального временного интервала, преобразовании опорного временного интервала в последовательность зонных интервалов равной длительности, а затем в выделении в каждом зонном временном интервале группы импульсов с временными интервалами между соседними импульсами, меньшими или равными суммарной длительности строки и зонного интервала и вынесении решения по числу выделенных групп в каждом зонном интервале.

Существенным недостатком этого способа является низкая точность распознавания кодированных сигналов факсимильных изображений.

Известен способ распознавания факсимильных изображений [2], основанный на построчном сканировании изображения документа, последовательном выделении каждого локального графического образа в сканируемой строке изображения, определении координат и параметров выделенного локального образа, формировании набора пронумерованных эталонов образов в пределах сканируемой строки, формировании набора пронумерованных эталонов образов в пределах всего изображения, сравнении очередного выделенного образа с каждым из эталонов набора сканируемой строки, введении выделенного образа при несовпадении его ни с одним из эталонов в наборе сканируемой строки в этот набор с одновременным определением области несовпадения этого символа с каждым символом из набора эталонов всего изображения и последующем принятии решения путем поэлементной весовой оценки.

Недостатком этого способа является его большая вычислительная сложность и необходимость наличия большого объема памяти для хранения эталонных образцов кодированных символов факсимильных изображений.

Наиболее близким по своей сущности к заявляемому изобретению является способ распознавания факсимильных изображений [3], основанный на операции разделения изображения, представленного в форме электрических сигналов, на несколько участков и оценке размеров этих участков, кроме того, в способе производятся операции выделения участков, содержащих непрерывную информацию, по размеру которых определяют, какие участки содержат символьную информацию, а какие - линейную, в соответствии с чем выполняют отдельную обработку каждого участка.

Основным недостатком этого способа является низкая точность распознавания кодированных текстовых и графических факсимильных сообщений друг от друга.

Известно [4], что наиболее целесообразно осуществлять хранение факсимильных изображений в факсимильных базах данных в форме, использующей кодирование модифицированным кодом Хаффмана (МХ-код), так как это требует меньше места для размещения информации, чем использование других форматов (например, РСХ).

В этой связи распределения серий "нулей" и "единиц" в кодированном факсимильном изображении могут не соответствовать распределениям "нулей" и "единиц" (участков "белого" и "черного" соответственно) в некодированном факсимильном изображении, представленном в двоичной форме, что является причиной низкой точности распознавания кодированных МХ-кодом текстовых и графических изображений в способе-прототипа [3].

Целью изобретения является повышение точности распознавания кодированных текстовых и графических факсимильных изображений.

Указанная цель достигается тем, что в способ распознавания факсимильных изображений, основанный на операции разделения изображения, представленного в форме электрических сигналов, на несколько участков и оценки размеров N_i этих участков, введены операции выделения кодированных строчных участков электрических сигналов, заключенных между двумя соседними кодовыми словами конца строки развертки изображения, удаления служебных битов в выделенных строчных участках, различения и выделения r-х групп (r = 1,2,...,R) последовательных участков соседних "белых" строк минимальной размерности N_(i+1)r, N_(i+2)r, . . ., N_(i+m)r, ..., N_(i+M)r (M - априорно заданное число соседних белых строк в анализируемом фрагменте изображения) путем сравнения с соответствующей пороговой величиной N_o (N_(i+m)r

N_o), выделения p-х групп (p = 1, 2, . . . , P) последовательных "небелых" кодированных строк размерности N_(i+1)p, N_(i+2)p, . .., N_(i+l)p, ..., N_(i+L)p (L - априорно заданное число соседних "небелых" строк в анализируемом фрагменте изображения) путем сравнения с соответствующей пороговой величиной N₁ (N_(i+l)p

N₁, оценки наличия квазипериодичности следования участков, соответствующих кодированным "белым" строкам развертки изображения, оценки средней величины квазипериода

оценки абсолютных величин

_ip разностей размеров соседних кодированных "небелых" строк

вычисления отношений d_p=

_ip _макс/

_ip _мин максимальных и минимальных значений разностей

_ip, сравнения полученных значений d_p с априорно заданной пороговой величиной D и вынесения соответствующего решения о принадлежности кодированного факсимильного изображения или его фрагмента графической или текстовой форме.

Как известно [5] кодированная МХ-кодом строка развертки факсимильного изображения состоит из информационных битов, служебных битов заполнения (FILL) и следующего за ними кодового слова конца строки (EOL). Известно также [5], что наименьшее число информационных битов содержится в кодированной "белой" строке развертки факсимильного изображения и, кроме того, среднее число информационных бит, содержащихся в кодированной строке развертки графического изображения, существенно меньше (в 2 - 3 раза), чем среднее число бит в кодированной строке текстового изображения.

В этой связи признаками кодированного текстового сообщения (или его фрагмента) является наличие: 1) групп минимальных значений чисел, меньших порогового значения h_мин = N₀; 2) групп чисел максимального значения, превышающих пороговую величину h_макс = N₁; 3) квазипериодичности чередования групп минимальных и максимальных чисел.

Сопоставительный анализ со способом, выбранным в качестве прототипа, показывает, что заявляемый способ отличается использованием для распознавания кодированных факсимильных изображений принципиально новых операций: определения наличия групп "минимальных" и "максимальных" чисел битов в кодированных строках развертки, наличия квазипериодичности чередования групп минимальных чисел в кодированных строках развертки, вычисления отношения максимального значения разности соседних чисел к минимальному значению их разности в группе из максимальных чисел битов в кодированных строках развертки и сравнения величины этого отношения с заданной пороговой величиной.

Таким образом, заявляемый способ соответствует критерию изобретения "новизна".

Сравнение заявляемого способа с другими способами распознавания изображений показывает, что введение операций выделения групп минимальных, а также максимальных чисел битов в кодированных строках развертки, определения наличия квазипериодичности в порядке их чередования и сравнения величины квазипериода с заданной, вычисления отношения среднего числа битов в группах из максимального числа битов в кодированных строках развертки к среднему числу битов в группе из минимальных чисел битов позволяет выделить признаки для принятия решения о структуре факсимильного изображения по его кодированным сигналам, что обеспечивает (в сравнении с другими способами) повышение точности распознавания текстовых и графических факсимильных изображений.

Таким образом, предлагаемый способ распознавания кодированных изображений для специалиста явным образом не следует из уровня техники и соответствует критерию "изобретательский уровень".

Изобретение может быть использовано в различных областях промышленности, а именно, связанных с техникой передачи и обработки изображений, с вычислительной техникой, а также в других областях народного хозяйства, поэтому соответствует критерию "промышленная применимость".

На чертеже представлена блок-схема алгоритма распознавания кодированных изображений.

Способ осуществления следующим образом.

Последовательность двоичных кодированных электрических сигналов факсимильного изображения объема J (бит) после удаления служебных битов (битов-вставок, битов заполнения типа "FILL", а также кодовых слов (EOL) конца строки развертки [5], разделяется на i-е участки, состоящие из битов кодированных строк развертки изображения. Затем производится оценка размеров N_i (где N_i - случайные величины, определяемые структурой изображения) выделенных i-х участков двоичной последовательности, выделение r-х групп (r = 1, 2, ..., R) последовательных минимальных значений размеров кодированных участков соседних строк N_(i+1)r, ..., N_(i+m)r, ..., N_(i+M)r, где M

M_o - минимально возможное число "белых" строк в промежутках между соседними текстовыми строками - в случае текстовых изображений, N_(i+m)r

N_o, N_o - максимально допустимый размер кодированной "белой" строки развертки).

В случае отсутствия (необнаружения) участков с такими значениями их размеров выносится решение о принадлежности данной последовательности кодированных сигналов графическому изображению.

При обнаружении r-х групп, соответствующих "кодированным" белым строкам развертки изображения, производится выделение p-х групп "небелых" кодированных строк размера N_(i+1)p, ..., N_(i+l)p, ..., N_(i+L)p (p=1,2,..., P) путем сравнения с соответствующей пороговой величиной N_(i+l)p

N₁ (при этом N₁ выбирается таким образом, чтобы разность N₁ - N₀ =

N превышала величину погрешности

h, обусловленной наличием "точечных" дефектов на "белых" участках некодированного изображения

h, величина L

L₀, где L₀ - максимальное число строк развертки, содержащихся в строке печатного текста с заданной гарнитурой).

После выполнения указанных выше операций производится обнаружение начала квазипериодичности следования участков, соответствующих кодированным белым строкам, и оценка соответствия величины Q_r квазипериода (в случае его обнаружения) заданным нижней q_мин и верхней q_макс границам интервала значений Q_r. При этом значения q_мин, q_макс определяются возможными типами используемых шрифтов в текстовом изображении, а также разрешающей способностью по вертикали конкретной системы развертки изображения.

В случае обнаружения квазипериодичности групп участков, соответствующих "белым" строкам и соответствия величины квазипериода Q_r заданному интервалу значений производится принятие решения о принадлежности кодированных сигналов текстовому изображению. В противном случае производится оценка абсолютных величин

_ip разностей значений размеров соседних кодированных "небелых" строк

и вычисление отношений d_p=

_ip _макс/

_ip _мин максимальных и минимальных значений указанных выше разностей для каждой p-й группы "небелых" строк, которое затем сравнивается с априорно выбранным порогом D, при превышении которого выносится решение о принадлежности данной p-й группы "небелых" строк графическому изображению, а иначе - текстовому (при этом величина порога D выбирается порядка D = 40 - 60).

Способ реализуется на базе использования однокристальной микро-ЭВМ или ПЭВМ типа IBM РС 386/386 (обеспечивающих ввод данных кодированного факсимального изображения объема 0,5 - 1 кбайт в память ОЭВМ/ПЭВМ и последующую соответствующую арифметико-логическую обработку этих данных).

Таким образом, введение операций выделения r-х групп последовательных минимальных значений размеров кодированных "белых" участков соседних строк развертки изображения, оценки квазипериодичности следования этих r-х групп, выделения p-х групп последовательных значений размеров кодированных "небелых" участков соседних строк, оценки абсолютного значения разностей размеров кодированных "небелых" участков соседних строк внутри каждой p-й группы, вычисления отношения максимальных и минимальных значений этих разностей для каждой p-й группы и сравнения с априорно заданным пороговым значением D обеспечивает повышение точности распознавания кодированных графических и текстовых изображений между собой.

Источники информации: 1. Авторское свидетельство СССР N 1348870, G06K 9/00, 30.10.87.

2. Авторское свидетельство СССР N 1809449, G06K 9/62, H03M 7/42.

3. Патент Японии МКИ по заявке N 61-56554 G06K 9/00, 03.12.86.

4. Введение к реализации системы поиска факсимильных изображений. Экспресс-информация, Сер.Информатика. - 1993, N 3, с.6.

5. Рекомендации МККТТ. Серия Т.4. Синяя книга. Т.VII, вып.VII.3. - 1988, с.17.

Формула изобретения

Способ разпознавания кодированных изображений, основанный на операции разделения изображения, представленного в форме кодированных электрических сигналов, на несколько участков и оценки размеров N_i этих участков, отличающийся тем, что выделяют кодированные строчные участки электрических сигналов, заключенные между двумя соседними кодовыми словами конца строки развертки изображения, удаляют служебные биты заполнения в выделенных строчных участках, различают и выделяют r-е группы, состоящие из M последовательных участков соседних "белых" строк минимальной размерности, сравнивают числа этих групп с соответствующей пороговой величиной N₀ и выделяют p-е группы, состоящие из L последовательных "небелых" кодированных строк, сравнивают числа данных групп с соответствующей пороговой величиной N₁, оценивают наличие квазипериодичности следования участков, соответствующих кодированным "белым" строкам развертки изображения, определяют среднюю величину квазипериода Q_r, оценивают абсолютные величины

_ip разностей размеров соседних кодированных "небелых" строк, вычисляют отношения d_p максимальных и минимальных значений разностей

_ip, сравнивают полученные величины отношений d_p с априорно заданной пороговой величиной D и выносят решение о принадлежности кодированного изображения или его фрагмента графической или текстовой форме.

РИСУНКИ

Рисунок 1

Изобретение относится к телевизионной технике, в частности к передаче видеосигналов по узкополосным каналам, и касается кодирования широкополосных сигналов с для сужения их полосы частот при потерях информации, не искажающих ее общего восприятия

Способ кодирования и декодирования телевизионного сигнала // 1359914

Устройство для оценки контура изображения // 1076002

Способ декодирования одного полученного текущего сигнала из серии двухканальных кодированных видеосигналов и устройство для его осуществления // 2120702

Устройство для уплотнения видеосигнала и устройство для синхронизации // 2117411

Изобретение относится к способу и устройству для получения сигнала синхронизации в аппаратуре декомпрессии сигнала, синхроимпульсы которой захвачены частотой сигнала синхронизации блока кодирования

Устройство для выдачи сжатого видеосигнала (варианты) // 2115261

Устройство для сжатия видеосигнала (варианты), устройство для приема сжатого видеосигнала и устройство для обработки видеосигнала // 2115258

Способ и устройство сжатия информации для декодирования, совместимого с семейством телевизионных сигналов с возрастающими разрешающими способностями // 2107406

Устройство цифрового кодирования и декодирования телевизионного сигнала // 2042282

Изобретение относится к технике цифрового телевидения, в частности к блочному кодированию сигналов изображения, и может быть использовано для сжатия цифрового потока при передаче видеоинформации