Способ распознавания текста с применением настраиваемого классификатора

 

Изобретение относится к способам распознавания печатного текста из растрового изображения. Его применение позволяет получить технический результат в виде повышения качества распознавания текста, увеличения быстродействия и снижения требований к системным ресурсам. Этот результат достигается благодаря тому, что способ включает в себя, в частности, следующие этапы: изображение поступает в настраиваемый классификатор; в случае, если настраиваемый классификатор не может распознать символ, для распознавания используют предварительно настроенный классификатор; после обработки классификатором результаты распознавания направляют на контекстный анализ; результаты контекстного анализа направляют для настройки настраиваемого классификатора. При этом ненастраиваемый классификатор совместно с алгоритмом контекстного анализа применяют для настройки настраиваемого классификатора, который, вместе с алгоритмом для контекстного анализа, применяют как основной инструмент распознавания, а ненастраиваемый классификатор применяют как вспомогательный инструмент распознавания. 9 з.п. ф-лы, 1 ил.

Изобретение относится к области оптического распознавания символов и, в частности, к методам распознавания печатного текста из растрового изображения, полученного любым способом.

Известен способ распознавания текстовой информации, при котором растровое изображение разбивается на области (блоки), предположительно содержащие изображения печатных символов текста, с последующим сопоставлением изображения в блоках с эталонным описанием изображения, содержащимся в одном или нескольких специальных признаковых (или растровых) классификаторах.

Такой способ реализуется в способе распознавания информации по патенту США №5680479, 21.10.1997.

Известен способ распознавания текстовой информации, при котором набор изображений символов, составляющих слово, прошедших через классификатор, вместе с набором возможных вариантов символов направляются на анализ в алгоритм контекстного анализа. В результате контекстного анализа число возможных вариантов букв снижается до одного варианта.

Такой способ реализуется в способе распознавания информации по патенту США №5933531, 03.08.1999.

Техническим результатом изобретения является повышение качества распознавания текста, увеличение быстродействия, снижение требований к компьютерным ресурсам.

Это достигается тем, что в системе организуют растровый классификатор, настраиваемый в процессе распознавания и, следовательно, более приспособленный к параметрам текущего текста и имеющий меньшее время обращения. Настройка растрового классификатора осуществляют по результатам обработки в предварительно настроенном признаковом классификаторе и в алгоритме контекстного анализа.

Реализация этого способа позволяет существенно повысить качество распознавания текста, быстродействие распознавания, уменьшить чувствительность к ошибкам омнифонтового классификатора, снизить требований к компьютерным ресурсам.

Известны способы распознавания символов печатного текста, использующие для увеличения быстродействия классификаторы с ограниченным набором шрифтов (напр., патент США №5509092, 16.04.1996).

Недостатком этих способов является ограниченность разновидностей текста имеющимся набором шрифтов, что сильно сужает область применения способа.

Известен способ распознавания символов печатного текста, использующий многошрифтовой (омнифонтовый) классификатор (патент США №5805747, 08.09.1998).

Недостатком способа является значительное время обращения к омнифонтовому классификатору, а также значительные требуемые компьютерные ресурсы.

Известен способ, использующий для распознавания динамически настраиваемый растровый классификатор как основной инструмент для распознавания, и омнифонтовый предварительно настроенный классификатор для настройки (патент США №6038342, 14.03.2000).

Недостатком способа является чувствительность к ошибкам омнифонтового классификатора.

Известен способ, использующий для распознавания вместе с омнифонтовым классификатором алгоритм контекстного анализа (патент США №6028970, 22.02.2000)

Недостатком способа является снижение быстродействия работы.

Известны способы настройки классификаторов на работу с разными типами и размерами шрифтов (напр., патенты США №5675710, 07.10.1997; №5818963, 06.10.1998; Японии JP 2001215987, 10.08.2001).

Недостатком способов является низкое быстродействие и недостаточная надежность распознавания.

Указанные недостатки значительно ограничивают возможности использования известных способов для распознавания текстовой информации.

Известные методы непригодны для достижения заявленного технического результата.

Предлагаемый способ отличается тем, что для распознавания символов печатного текста из растрового изображения используется настраиваемый растровый классификатор совместно с алгоритмом контекстного анализа как основной инструмент для распознавания, и омнифонтовый предварительно настроенный классификатор совместно с алгоритмом контекстного анализа - как вспомогательный инструмент распознавания, а также для настройки растрового классификатора.

Растровый классификатор сравнивает распознаваемое изображение с хранящимися эталонными изображениями.

Эталонное изображение получают усреднением изображений, используемых при настройке - каждый элемент усредненного изображения хранит среднюю интенсивность элементов изображений, используемых при настройке.

В качестве меры совпадения используют взвешенную сумму разностей интенсивности пикселей сравниваемых изображений. С каждым эталонным изображением связывают уровень его надежности, корректируемый в процессе настройки.

Уровень надежности может быть выражен через число сеансов настройки изображения.

Эталонные изображения с надежностью ниже предварительно установленного уровня не участвуют в распознавании.

Результатом распознавания растрового изображения в классификаторах является одна или несколько пар значений символов вместе с соответствующей вероятностью правильного распознавания.

В случае, если вероятность правильного распознавания слова ниже предварительно заданного уровня, слово помечается для повторного распознавания. Процесс настройки включает следующие шаги.

Для каждого распознанного символа проверяется наличие похожих среди эталонных изображений.

Если такого изображения нет, создается новое эталонное изображение.

Если среди эталонных изображений есть похожее, эталонное изображение дополнительно настраивают. При этом корректируют усредненное изображение и степень надежности. Величина, на которую увеличивается надежность, зависит от оценки, которое слово получило в процессе контекстного анализа, и может составлять 25-50%.

Поэтому, чтобы эталонное изображение достигло достаточно высокого уровня надежности распознавания, оно должно пройти 2-4 сеанса настройки.

Если изображение было распознано настраиваемым классификатором, но контекстный анализ отверг этот вариант, степень надежности эталонного изображения уменьшают. При уменьшении надежности до предварительно заданного минимального уровня эталонное изображение удаляют из классификатора.

Сущность предложения иллюстрируется чертежом.

Группа графических блоков 1 с изображениями букв, предположительно составляющих слово, последовательно направляется в настраиваемый классификатор 2 для распознавания. Нераспознанные символы 4 или символы с надежностью точного распознавания ниже предварительно заданного уровня, направляются в предварительно настроенный омнифонтовый классификатор 3, результат работы которого - распознанный символ 5. Результатом работы классификатора являются один или несколько возможных вариантов символов для каждого блока с изображением буквы 6.

После обработки в классификаторе (классификаторах) набор вариантов символов 6, предположительно составляющий слово, направляется на обработку алгоритмом контекстного анализа 7. Результатом контекстной обработки является значительно суженный - обычно до 1 варианта - набор возможных вариантов слова 9. Результаты контекстной обработки в виде набора распознанных символов вместе с уровнями надежности каждого символа 8 направляются в настраиваемый классификатор 2 для пополнения и корректировки его информации.

Формула изобретения

1. Способ распознавания символов по информации растрового изображения, характеризующийся совместным применением настраиваемого классификатора, ненастраиваемого классификатора и алгоритма для контекстного анализа, отличающийся тем, что настраиваемый классификатор вместе с алгоритмом для контекстного анализа применяют как основной инструмент распознавания, ненастраиваемый классификатор применяют как вспомогательный инструмент распознавания, ненастраиваемый классификатор совместно с алгоритмом контекстного анализа применяют для настройки настраиваемого классификатора, причем распознавание включает следующие этапы: изображение поступает в настраиваемый классификатор; в случае, если настраиваемый классификатор не может распознать символ, для распознавания используют предварительно настроенный классификатор; после обработки классификатором результаты распознавания направляют на контекстный анализ; результаты контекстного анализа направляют для настройки настраиваемого классификатора.

2. Способ по п.1, отличающийся тем, что настройка настраиваемого классификатора включает следующие этапы: распознанное другими средствами изображение направляют в настраиваемый классификатор; изображение сравнивают с уже имеющимися эталонными на сходство, если сходство не находят, создают новое эталонное изображение; если сходство находят, информацию эталонного изображения пополняют следующим путем: корректируют усредненное изображение эталона вновь поступившим изображением; изменяют значение уровня надежности распознавания эталона; если уровень надежности эталонного изображения ниже предварительно установленного порога, процесс настройки продолжают; если уровень надежности эталонного изображения равен или превышает предварительно установленный порог, процесс настройки данного эталона заканчивают.

3. Способ по п.1, отличающийся тем, что в случае, если надежность правильного распознавания по крайней мере одного символа в слове ниже предварительно заданного уровня, слово помечают для повторного распознавания.

4. Способ по п.3, отличающийся тем, что по окончании распознавания документа, делают повторное распознавание по помеченным словам.

5. Способ по п.1, отличающийся тем, что нераспознанные и распознанные с недостаточной надежностью символы восстанавливают по словарю.

6. Способ по п.2, отличающийся тем, что новое эталонное изображение создают путем усреднения изображений, используемых для настройки.

7. Способ по п.2, отличающийся тем, что в качестве меры сходства используют взвешенную сумму разностей интенсивности элементов сравниваемых изображений.

8. Способ по п.1, отличающийся тем, что значение уровня надежности эталонного изображения, распознанного настраиваемым классификатором, но отвергнутого контекстным анализом, уменьшают.

9. Способ по п.8, отличающийся тем, что при уменьшении надежности до предварительно заданного минимального уровня эталонное изображение удаляют из классификатора.

10. Способ по п.2, отличающийся тем, что уровень надежности может быть выражен через число сеансов настройки изображения символа.

РИСУНКИ

Рисунок 1

NF4A Восстановление действия патента Российской Федерации на изобретение

Извещение опубликовано: 27.11.2006        БИ: 33/2006




 

Похожие патенты:

Изобретение относится к технической кибернетике, а именно к устройствам распознавания символов текстовых документов

Изобретение относится к области технической кибернетики и может быть использовано для определения состояний объектов

Изобретение относится к вычислительной технике и информатике

Изобретение относится к биометрической идентификации и аутентификации человека и может быть использовано в электронных паспортах и удостоверениях личности, в системах электронного документооборота, в системах ограничения доступа на охраняемые объекты

Изобретение относится к области стеганографии, а именно к способам идентификации цифровых изображений (ЦИ), содержащих цифровой водяной знак (ЦВЗ)

Изобретение относится к биометрической идентификации человека и может быть использовано в системах ограничения доступа к защищенным от посторонних лиц услугам, ресурсам и объектам

Изобретение относится к средствам анализа цифровых изображений. Техническим результатом является обеспечение классификации объектов по геометрическим признакам в лабиринтных структурах. В способе определяют количество объектов на изображении структуры, в качестве морфологических признаков используют коэффициенты округлости и заполнения для каждого из объектов, формируют нечеткую базу знаний для разделения объектов на круглые, эллиптические и гантелеобразные с использованием треугольной функции принадлежности, а для некруглых полосовых и ветвистых объектов - с использованием трапециевидной функции принадлежности на основе экспериментальных данных значений указанных коэффициентов округлости и заполнения, проводят распознавание доменов, формируют нечеткий классификатор разделения объектов по форме на круглые, эллиптические, гантелеобразные, полосовые и ветвистые объекты на основе соотношения коэффициента округлости и коэффициента заполнения объекта, проводят классификацию формы объектов. 1 з.п. ф-лы, 6 ил, 2 табл., 1 пр.
Изобретение относится к области обработки данных, а в частности к способам распознавания данных, в том числе считывания знаков, изображений, образов. Техническим результатом является повышение быстродействия при выявлении в любом документе заранее заданной эталонной круглой печати. Предложен способ автоматизированного поиска заранее заданных эталонных круглых печатей. Способ включает в себя этап, на котором осуществляют сбор коллекции различных заранее заданных изображений как содержащих круглые печати, так и не содержащих круглые печати. Далее согласно способу осуществляют обучение каскадных классификаторов на собранных коллекциях изображений и преобразование в заранее заданный формат всех изображений эталонных печатей, заданных пользователем. А также выявляют области в электронном файле анализируемого документа, где предположительно может располагаться печать, и осуществляют сравнение найденных областей с заранее заданными эталонами.

Изобретение относится к технологиям обработки и генерации данных изображения, визуализации трехмерного (3D) изображения. Техническим результатом является обеспечение возможности отображать на видимом изображении реальную текстуру фото или видеоизображения объекта. Предложен способ отображения объекта. Согласно способу формируют 3D модель, получают фотоизображения или видеоизображения объекта, визуализируют 3D модель. Сохраняют в памяти устройства отображения 3D модель вместе с эталонным образом, а также координаты участков текстурирования, соответствующие полигонам 3D модели. Получают, по меньшей мере, один кадр фотоизображения или видеоизображения объекта, на основе эталонного образа осуществляют распознавание объекта на кадре. При наличии более одного кадра осуществляют выбор из них с точки зрения качества изображения, формируют матрицу преобразования координат фотоизображения в собственные координаты, окрашивают элементы 3D модели в цвета соответствующих элементов фотоизображения путем формирования текстуры области считывания изображения с использованием матрицы преобразования координат и интерполяции данных с последующим назначением текстуры 3D модели. 2 н. и 14 з.п. ф-лы, 4 ил.

Изобретение относится к технологиям аутентификации на основе биологических характеристик. Техническим результатом является снижение сложности клиентского устройства, за счет реализации выделения характерных признаков биометрического изображения на облачном сервере. Предложен способ биометрической аутентификации. Способ включает в себя этап, на котором принимают облачным сервером подлежащее регистрации биометрическое изображение, идентификатор (ID) клиентского устройства и первый пользовательский ID, переданные от клиентского устройства. Далее, посредством облачного сервера, осуществляют выделение характерных признаков на подлежащем регистрации биометрическом изображении для получения биометрического шаблона. Сохраняют облачным сервером взаимосвязь, ассоциированную с биометрическим шаблоном ID клиентского устройства и первым пользовательским ID для завершения регистрации пользователя. 5 н. и 6 з.п. ф-лы, 18 ил.
Наверх