Способ и средство для мобильного захвата, обработки, хранения и передачи текста и смешанной информации, содержащей знаки и изображения

Авторы патента:

G06K9/78 - комбинация получения изображения и операции распознавания

G06K9/60 - комбинация получения изображения и предшествующих этому операций

Владельцы патента RU 2287183:

ВЕЙТМАН Якоб (SE)

Изобретение относится к средствам обработки, захвата и передачи текста и смешанной информации, содержащей знаки и изображения. Техническим результатом является обеспечение возможности захвата, распознавания и сохранения текстовой и другой информации. Результат достигается тем, что изображение сначала анализируют по отношению к его текстовой информации, после чего первоначальное изображение сегментируют на блок текста и блок изображения, при этом текст интерпретируют посредством методов оптического распознавания символов, преобразуют и сжимают в код. При этом код дополняют графической информацией, позволяющей создавать синтезированное изображение блока текста. 2 н. и 10 з.п. ф-лы.

Существует множество различных ситуаций, в которых возникает реальная потребность в захвате ("вводе") быстрым, эффективным и простым способом большого количества информации в виде текста или текста+изображения при отсутствии доступа к техническим ресурсам, таким как копировальные машины, сканеры, факсы и компьютеры, которые в настоящее время часто используются в офисах. Примером такой ситуации, где настоящее изобретение было бы наиболее полезным, может служить перелет на самолете, в котором пассажир читает интересную статью с иллюстрациями и диаграммами, например, в газете "Файнэншнл таймс" (Financial Times), и где пассажиру необходимо, по возможности быстро, передать соответствующую информацию коллеге или сохранить статью в качестве ссылки для себя и других. В настоящее время у такого читателя есть выбор, либо вырвать интересные страницы, либо взять с собой целиком всю газету. Во время поездки на конференцию или во время другой более продолжительной поездки ситуация может снова повториться, в результате чего на практике возникает проблема обработки документов с большим объемом информации.

Существует множество подобных ситуаций, где имеется потребность в сборе и/или передаче полученной печатной информации без ограничения или зависимости от офисного оборудования с помощью современных средств, например в случаях, когда читать или работать приходится в постели из-за болезни или лени.

Цель настоящего изобретения состоит в том, чтобы решить эффективным, практическим и гибким способом обозначенную таким образом проблему. Решение основано на комбинации и дальнейшем развитии имеющихся технологий, прежде всего цифровой фотографии, интеллектуальной обработки изображений, включая оптическое распознавание символов (ОРС (OCR)), векторную графику, сжатие данных, широкополосную передачу данных и обработку базы данных.

Основанием для изобретения является использование компактной цифровой камеры ("фотоаппарата"), предпочтительно имеющей широкоугольную оптику, большую апертуру и большую глубину резкости изображения, в том числе и на малых расстояниях, где интеллектуальные возможности основаны на программном обеспечении для обработки и интерпретации полного изображения таким способом, что те части, которые содержат текст, распознаются, преобразовываются и сохраняются в виде, например, ASCII- или EBCDIC-кода, тогда как оставшиеся части сохраняются в виде изображения с требуемым разрешением.

Кроме того, особым признаком способа согласно изобретению является то, что программное обеспечение имеет средства искусственного интеллекта (логические возможности) для интерпретации характеристик качества изображения, таких как шрифт и компоновка, и возможность использования интерпретации для восстановления/синтеза изображения, которое сравнивают с (накладывают на) первоначальным текстом. В случае приемлемого результата сравнения, те части первоначального изображения, которые содержат блоки текста, удаляют, после чего сохраненная информация состоит из кодированного текста, информации о расположении и неинтерпретированных частей изображения.

В тех случаях, где не было достигнуто приемлемого совпадения оригинала с восстановленными/синтезированными изображениями блоков текста, необработанное изображение сохраняется в своем первоначальном формате. Результатом сравнения может быть, например, число совпавших точек, выраженное в процентах. Кроме того, в случае очень хорошего совпадения в процентном отношении могут быть одиночные знаки, слова или фразы, которые интерпретированы неправильно. Такая неинтерпретированная или неправильно интерпретированная первоначальная информация не удаляется из текстового блока, а вместо этого отображается в виде отмеченного соответствующим образом изображения, вставленного в интерпретированный текст. Таким образом, после этого пользователь имеет возможность вмешаться и помочь программе интерпретировать отмеченные таким образом секции.

Другая особенность способа согласно изобретению заключается в том, что программные средства интерпретации, которые в предпочтительном варианте осуществления изобретения установлены непосредственно в камере, но которые можно также выполнить в виде внешнего модуля, включают в себя алгоритмы, основанные на способах векторной графики для анализа и хранения информации относительно расположения первоначального изображения, и эта информация используется в контексте с процедурой сравнения оригинала и синтезируемых изображений и, при необходимости, при последующей распечатке синтезированного изображения для того, чтобы восстановить расположение, которое адаптировано к печати в выбранном формате (например, A4), и по возможности воспроизводит первоначальное расположение. Это важно, так как компоновка (включающая в себя аспекты, такие как подчеркивание, курсив, разбиение на более мелкие части и т.д.) может иметь большое значение для понимания содержания и контекста.

Камера может дополнительно выполнять функции кадрирования с тем, чтобы только определенные выбранные части изображения сохранялись и обрабатывались, посредством чего информация о тексте или изображении, которая считается необязательной (например, картина с синим небом и кукурузным полем в статье о нашей окружающей природе или картина соблазнительной женщины в статье о роли секса), устраняется уже в первоисточнике.

Согласно изобретению информацию можно пометить уже с помощью программных средств интеллектуальной (обладающей логическими возможностями) камеры с тем, чтобы в дальнейшем облегчить обработку информации в базах данных. Это достигается с помощью свойственных функциональных возможностей для автоматического распознавания таких характеристик, как заголовки и имена авторов, а также автоматического выбора ключевых слов из заголовков.

Для получения более высокой гибкости программные средства интеллектуальной камеры можно расширить с помощью опций для перевода на различные языки, и/или для интерпретации математических символов и формул, и/или распознавания одного или нескольких почерков. Распознавание почерка может быть, предпочтительно, основано на алгоритмах самообучения в нейронных системах.

В зависимости от уровня разработки, касающейся емкости памяти и мощности процессора, средства искусственного интеллекта, по возможности, располагают непосредственно внутри камеры. Однако функции и опции, которые на данном уровне разработки рассматриваются как слишком зависящие с точки зрения емкости памяти или мощности процессора и производительности, можно реализовать и выполнить внешним образом, в результате чего могут оказаться очень полезными высокоскоростные протоколы связи (такие как стандарт высокопроизводительной последовательной шины IEEE 1394 (FIRE WIRE 1394)).

Соединение интеллектуальной мобильной цифровой камеры с мобильным телефоном с широкой полосой пропускания позволяет осуществить передачу интерпретированных и сжатых данных в свою собственную базу данных или третьим сторонам. Передачу можно выполнить в режиме реального времени или с задержкой на основании сохраненных данных.

С практической точки зрения важной характеристикой средства согласно изобретению является то, что камера может быть оборудована для получения сверхширокоугольной фотографии для того, чтобы, например, целую страницу вышеупомянутой газетной публикации можно было записать при одной экспозиции на обычном расстоянии наблюдения (от 0,3 до 0,5 м). Это можно достигнуть посредством специальных широкоугольных линз ("объективов"), посредством чего искажения корректируют цифровым способом или фасетными линзами согласно принципу наложения или суперпозиции, посредством чего полное изображение синтезируют с помощью вычислительных средств или с помощью оптики со сканирующим устройством, таким как подвижное зеркало, в случае которого полную картину также составляют с помощью программных средств.

В объеме изобретения, конечно, допускается, что интеллектуальную камеру можно использовать так же, как и известную цифровую камеру.

1. Способ мобильного захвата, обработки и сохранения информации, такой, как текст, содержащейся в изображениях, снимаемых цифровой камерой с микропроцессором, памятью и программными средствами, отличающийся тем, что пользователь имеет возможность выбрать, использовать ли камеру в интеллектуальном режиме или как обычную камеру, и если камеру используют как интеллектуальную камеру, то указанную информацию анализируют на наличие текстовой информации, распознают и интерпретируют, например, посредством техники оптического распознавания символов (OCR) и сохраняют в сжатом виде для дальнейшей обработки.

2. Способ по п.1, отличающийся тем, что свойства текста, такие, как шрифт, подчеркивание, жирное начертание и т.п., распознают и добавляют к интерпретированному тексту.

3. Способ по п.1 или 2, отличающийся тем, что полную собранную информацию об интерпретированном изображении используют для создания синтезированного изображения, которое сравнивают с первоначальным изображением, и последнее удаляют из памяти камеры при достаточно хорошем совпадении между синтезированным и первоначальным изображениями.

4. Способ по п.1 или 2, отличающийся тем, что первоначальное изображение сегментируют на два блока, один из которых содержит интерпретированную информацию, а другой - остальную релевантную информацию первоначального изображения, и эти блоки помечают так, чтобы их можно было обрабатывать и передавать по отдельности и, при необходимости, повторно объединить для воспроизведения первоначального изображения.

5. Способ по п.1 или 2, отличающийся тем, что при воспроизведении повторно объединенного изображения в формате, который отличается от формата первоначального изображения, указанное воспроизведение выполняют так, чтобы компоновка воспроизведенного изображения совпадала, насколько возможно, с компоновкой первоначального изображения.

6. Способ по п.1 или 2, отличающийся тем, что текстовую информацию автоматически анализируют в отношении таких характеристик, как имя автора, название публикации и ключевые слова заголовка, и помечают информацию с помощью таких характеристик для облегчения систематизированного хранения информации в базах данных и извлечения ее из баз данных.

7. Средство мобильного захвата, обработки и сохранения информации, такой, как текст, содержащейся в изображениях, согласно способу по любому из пп.1-6, содержащее цифровую камеру с микропроцессором, память и программные средства, отличающееся тем, что указанная камера выполнена с возможностью переключения между двумя режимами использования, а именно использованием в качестве обычной цифровой камеры и в качестве интеллектуальной цифровой камеры, причем в интеллектуальном режиме указанная камера способна распознавать информацию, например, посредством техники оптического распознавания символов (OCR), интерпретировать информацию, такую, как штриховой код, и сохранять информацию в сжатом виде для последующей обработки.

8. Средство по п.7, отличающееся тем, что искажения, вносимые объективом, корректируются цифровым способом, чтобы восстановить неискаженное изображение.

9. Средство по п.8, отличающееся тем, что объектив камеры выполнен сверхширокоугольным.

10. Средство по п.8, отличающееся тем, что указанный объектив выполнен в виде фасеточного объектива по принципу наложения частичных изображений, между которыми имеется некоторое перекрытие, а непрерывное полное изображение формируется с помощью программных средств.

11. Средство по п.8, отличающееся тем, что указанный объектив выполнен в виде фасеточного объектива по принципу суперпозиции и, при необходимости, искажения корректируются с помощью программных средств.

12. Средство по любому из пп.7-11, отличающееся тем, что указанная камера снабжена функциями кадрирования для сохранения и обработки только отдельных выбранных частей изображения, для устранения необязательной информации уже в первоисточнике.

Изобретение относится к металлургии. .

Способ обнаружения, распознавания и определения координат объекта и устройство для его выполнения // 2260847

Изобретение относится к обработке изображений и может быть применено в системах, например, охраны, наведения, ориентации летательных аппаратов относительно местности и др.

Система распознавания объектов и слежения за ними // 2251739

Изобретение относится к системам распознавания объектов и слежения за ними. .

Способ выявления дефектов, возникающих у предметов в процессе их хранения (варианты) // 2227288

Изобретение относится к способу выявления дефектов, возникающих у предметов в процессе их хранения. .

Устройство считывания изображений ценных бумаг // 2172982

Изобретение относится к устройствам контроля подлинности ценных бумаг (банкнот), их изношенности и загрязненности, анализа изображения банкнот в различных частях спектра при сортировке банкнот на автоматических сортирующих машинах.

Способ определения информационного образа аномалий функциональной организации физической системы (варианты) // 2172519

Изобретение относится к информационной технологии. .

Способ определения информационного образа функциональной организации физической системы (варианты) // 2172518

Изобретение относится к информационной технологии. .

Устройство для регистрации восстановленной заводской маркировки // 2082089

Изобретение относится к контрольно-измерительной технике и может быть использовано в области криминалистики для выявления и регистрации удаленной заводской маркировки на металлических изделиях в процессе ее восстановления химическим травлением.

Съемник координат // 951310

Устройство для обнаружения заданного графического образа // 310273

Устройство для регистрации папиллярного узора // 2231119

Изобретение относится к области оптического формирования изображения, в частности к устройствам снятия отпечатков пальцев. .

Устройство однократного формирования сигнала изображения // 2205521

Изобретение относится к области телевизионной техники и может быть использовано для телевизионного фотографирования. .

Способ получения изображения развертки поверхности деформированных цилиндрических объектов // 2155378

Изобретение относится к телевизионной микроскопии и может быть использовано в промышленности при автоматизации контроля качества и, особенно, криминалистике для проведения баллистических экспертиз пуль стрелкового оружия, а также создания и хранения банка данных пулетек для последующей идентификации оружия по следам на пулях.

Устройство для распознавания видов передач // 2099786

Изобретение относится к автоматике, в частности к устройству для распознания видов передач, и может быть использовано при построении распознающих автоматов для комплексов технического анализа сигналов.

Устройство для коррекции изображений // 1725239

Изобретение относится к автоматике и вычислительной технике и предназначено для использования в автоматических распознающих системах. .

Устройство для преобразования локально // 307595

Способ сканирования изображений микрорельефа боковых поверхностей стреляных пуль и гильз и устройство сканирования изображений стреляных пуль и гильз автоматизированного баллистического идентификационного комплекса // 2315353

Изобретение относится к области оптико-электронного приборостроения и может быть использовано в сканирующих устройствах современных автоматизированных баллистических идентификационных комплексах для записи и ввода в систему изображений микрорельефа боковых поверхностей стреляных пуль и дна стреляных гильз

Способ получения изображения развертки боковой поверхности деформированного объекта, имеющего форму, близкую к цилиндрической // 2317583

Изобретение относится к области цифровой телевизионной микроскопии и может быть использовано при автоматизации процессов детального обследования объектов

Способ когнитивного восприятия плоских изображений // 2500004

Изобретение относится к использованию методов психологии, психофизиологии, оптике, физиологии в системах контроля объектов досмотра ручной клади с применением рентгеновских установок. Технический результат заключается в повышении точности восприятия объектов досмотра. На первом этапе обучают операторов рентгеновской установки наблюдать стереоскопическую глубину на стереоскопических проекциях содержимого багажа, а затем при досмотре багажа выводят проекцию объектов ручной клади на весь экран монитора компьютера, устанавливают перед экраном монитора пластину с набором цилиндрических линз, получают на экране периодику с изображением объектов досмотра за счет использования набора цилиндрических линз, с учетом периодики обеспечивают глубину и объем предметов багажа. 4 ил.

Морфологическое сглаживание (мс) при повторном проецировании двухмерного изображения // 2562759

Изобретение относится к трехмерному визуальному представлению изображений и, более конкретно, к морфологическому сглаживанию (МС) при повторном проецировании одного или более двухмерных изображений. Техническим результатом является уменьшение объема вычислений при сглаживании визуальных искажений для трехмерного отображения изображений. Морфологическое сглаживание при повторном проецировании двухмерного изображения может быть осуществлено способом, обеспечивающим более высокий результат при использовании меньшего количества ресурсов процессора. Определяются одна или более неоднородностей между каждым соседним пикселем двухмерного изображения. Идентифицируются один или более предварительно определенных образов, сформированных одной или более неоднородностями. Величина смешивания вычисляется для каждого пикселя, соседнего с идентифицированными предварительно определенными образами. Трехмерное повторное проецирование применяется к двухмерному изображению и величине смешивания для каждого пикселя, генерируя этим повторно проецированные величины смешивания. Соседние пиксели трехмерного повторного проецирования затем смешиваются в соответствии с повторно проецируемыми величинами смешивания. 2 н. и 21 з.п. ф-лы, 4 ил.

Визуализация видеоизображения в существующих неподвижных изображениях // 2573239

Изобретение относится к средствам формирования комбинированного изображения. Техническим результатом является повышение качества сформированного изображения. В способе получают выборку видеоизображения, выбирают неподвижное изображение, чьи границы содержат часть границ видеоизображения, идентифицируют признаки изображения, общие для выборки видеоизображения и выбранного изображения, определяют параметры преобразования и выравнивания видеоизображения для интеграции с выбранным изображением, принимают видеоизображение, преобразуют и выравнивают принятое видеоизображение с использованием параметров преобразования, формируют объединенное изображение. 3 н. и 10 з.п. ф-лы, 6 ил.