Способ обучения автоматическому распознаванию образов

Авторы патента:

БОГИНО ВИТАЛИЙ ИГНАТЬЕВИЧ

ВОДОЛАЗКИЙ ВАЛЕНТИН ИВАНОВИЧ

ЗАРИЦКИЙ АЛЕКСАНДР ФЕДОРОВИЧ

ЗАЙЦЕВ СЕРГЕЙ ВЛАДИМИРОВИЧ

СУВОРОВ ДМИТРИЙ АНАТОЛЬЕВИЧ

G10L15/06 - создание эталонных шаблонов; обучение систем распознавания речи, например по характеристикам голоса говорящего (G10L 15/14 имеет преимущество)

СПОСОБ ОБУЧЕНИЯ АВТОМАТИЧЕСКОМУ РАСПОЗНАВАНИЮ ОБРАЗОВ, включающий вьщеление сигнал-параметров и сравнение их с эталонами, которые формируют путем записи нормализованных сигнал-параметров в массивы по принадлежности образов к классам и поиска наилучших эталонов по аппроксимации сигнал-параметров внутри массива и эффективности различения сигнал-параметров разных массивов, отличающийся тем, что, с целью ускорения поиска наилучших эталонов, последовательно генерируют последовательности ортонормальных опорных сигналов и формируют смеси опорных сигналов из одной последовательности с амплитудами, обеспечиваюпщми минимальное расхождение с внутриклассовой совокупностью сигналпараметров , вьщеляют автокорреляции амплитуд, вычитают из них смешанные корреляции классов, по минимуму (А разности г осуществляют поиск оптиС мальной последовательности опорных сигналов и иэ них формируют наилучшие эталоны.

СОЮЗ СОВЕТСНИХ вн (юн

РЕСПУБЛИК (19) (с l

447 А а 10

4 (54)

ГОСУДАРСТВЕННЫЙ НОМИТЕТ СССР

ПО ДЕЛАМ ИЖИРЕТЕНИЙ И СТНРЫТЙ

ОПИСАНИЕ ИЗОБРЕТ н с втссснсвт сввнтвъствт (21) 3437682/24-10 (22) 13.05.82 (46) 23.02.85. Бюл. Ф 7 (72) В.И.Богицо, В.И, Водолазкий, А.Ф.Зарицкий, С.В.Зайцев и Д.А.Суворов (71) Ордена Лейина институт кибернетики АН Украинской CCP (53) 621.391 (088, 8) (56) 1,.Авторское свидетельство СССР

В 266375, кл. С 06 G 7/16, 1968.

2.Рамишвили Г.С.Автоматическое опознание говорящего по голосу. М., "Радио и связь", 1981, с. 122- 149. (54)(57) СПОСОБ ОБУЧЕНИЯ АВТОМАТИЧЕСКОМУ РАСПОЗНАВАНИЮ ОБРАЗОВ, включающий выделение сигнал-параметров и сравнение их с эталонами, которые формируют путем записи нормализованных сигнал-параметров в массивы по принадлежности образов к классам и поиска наилучших эталонов по аппроксимации сигнал-параметров внутри массива и эффективности различения сигнал-параметров разных массивов, отличающийся тем, что, с целью ускорения поиска наилучших эталонов, последовательно генерируют последовательности ортонормальных опорных сигналов и формируют смеси опорных сигналов из одной последовательности с амплитудами, обеспечивающими минимальное расхождение с внутриклассовой совокупностью сигналпараметров, выделяют автокорреляции амплитуд, вычитают из них смешанные корреляции классов, по минимуму разности . - осуществляют поиск оптимальной последовательности опорных сигналов и из них формируют наилучшие эталоны.

4, 11

Изобретение относится к технике распознавания образов и может быть использовано для обучения электронных вычислительных машин различению речевых команд при голосовом управ лении промьшшенными объектами.

Известен способ селекции функций, выбираемых из неминимального сигнального алфавита, включающий линейное комбинирование, вьделение скалярных произведений и итеративный, выбор и компенсацию наибольшего расхождения. Этот способ реализован в синтезаторе электрических сигналов и позволяет автоматически формировать линейное подпространство, MBHH мизирующее размерность и ошибку пред ставления сообщений 1.1 3.

Однако способ не обеспечивает автоматизации выбора пространств, конт растирующих межклассовые различия, распознаваемых сигналов.

Известен также способ обучения автоматическому распознаванию обра.зов, включающий вьделение сигналпараметров и сравнение их с эталонами, которые формируют путем записи нормализованных сигнал-параметров в массивы по принадлежности образов к классам и поиска наилучших эталонов по аппроксимации сигнал-параметров внутри массива и эффективности различения сигнал-параметров разных массивов 12 .1.

Недостатком известного способа является неопределенность выбора эталонов, ограничивающая скорость обучения распознаванию образов, в результате которой поиск обычно обрывают, не достигнув оптимума, что неизбежно ухудшает качество распознавания.

Цель изобретения вЂ” ускорение поиска наилучших эталонов.

Поставленная цель достигается тем, что согласно способу обучения автоматическому распознаванию образов, включающему вьделение сигналпараметров и сравнение их с эталонами, которые формируют путем записи нормализованных сигнал-параметров в массивы по принадлежности образов к классам и поиска наилучших эталонов по аппроксимации сигнал-параметров внутри массива и эффективности различения сигнал-параметров различных массивов, последовательно генерируют последовательности ортонормальных опорных сигналов и формируют смеси

41447

55 опорных сигналов по одной последовательности с амплитудами, обеспечивающими минимальное расхождение с внутриклассовой совокупностью сигналпараметров, вьделяют автокорреляции амплитуд, вычитают из них смешанные корреляции классов, по минимуму разности осуществляют поиск оптимальной последовательности опорных сигналов и из них формируют наилучшие эталоны.

На чертеже показана блок-схема. устройства, реализующего способ.

Устройство содержит управляемый генератор 1 опорных сигналов присоеР диненные к его вьиодам усилители 2-4 с управляемым усилением, вьиоды котоВ рых соединены с входами сумматора 5, а управляющие входы генератора и усилителей соединены с соответствующими выходами блока 6 управления.

Выход сумматора 5 соединен с входом блока 7 сравнения, второй вход которого соединен с выходом выделителя

8 сигнал-параметров через первый блок 9 памяти, адресный вход которого соединен с вьиодом блока 10 принятия решений, выходы которого также соединены с входами генератора 1 опорных сигналов и блока 6 управле ния. Входы блока 10 принятия решений соединены с выходами блока управления через соединенные последовательно блок 11 буферной памяти, блок 12 скаляторов и сравнивающий узел 13, а также с выходом регистра 14 памяти.

Входом. для распознаваемых сигналов является вход вьделителя 8 сигналпараметров, а выходом устройства является вьиод блока 10 принятия решений.

Способ обучения автоматическому распознаванию речевых образов осуществляется предлагаемым устройством я. следующем порядке. г

Из произносимых речевых сигналов вьделяют сигнал-параметры, которые записывают в первом блоке памяти, а сопровождающие сведения и принадлежности образов этих сигналов к классам заносят в регистр памяти.

Затем блок управления устанавливает управляемый генератор 1 опорных сигналов в режим генерации последовательно изменяемых последовательностей ортонормальных опорных сигналов, кроме того, с помощью введенного в блок управления регулятора управляют усилением усилителей 2-4 и задают

Речебой

Сигюм

КО еше жя

Филиал ППП тент, г,Ужгород, ул.Проактиая, 4

3 114144 амплитуды опбрных сигналов, которые суммируют в сумматоре 5, образуя текущие эталоны. Результаты сравнений текущих эталонов с сигнал-пара,вЂ” метрами, выбираемыми из первого блока памяти, пересылают из блока 7 сравнения в блок 10 принятия решений, Текущие значения амплитуд опорных сигналов переписывают в блок буферной памяти, из которого они пересылаются в блок 12 скаляторов, где выделяют автокорреляции амплитуд и вычитают смешанные корреляции классов, после чего сопоставляют разности в сравнивающем узле 13, а резуль- таты сравнений передают в блок принятия решений.

Процесс обучения по зарегистрированным сигнал-параметрам разворачивается во времени и заканчивается выбором оптимальных эталонов, что определяется достижением границы, 7 4 оцениваемой показателем, называемым поперечником А,Н.Колмогорова. Достижение этой границы обеспечивается применением экстремального регулятора к выбору подпространства, обеспечивающего скорейшее приближение внутри классов и наибольшие разпичия между ними.

После обучения устройство переключается в режим распознавания, который выполняют сравнением с найденными эталонами.

Способ обучения автоматическому распознаванию образов найдет применение для распознавания акустических сигналов различного происхождения, удовлетворяющих условию верного соответствия сигналов и сопровождаю- щей информации. В частности он может использоваться при поиске эталонов для идентификации голосов и эмоций.

Способ автоматической идентификации личности // 2161826

Изобретение относится к обработке информации и может быть использовано в телекоммуникационных системах

Способ автоматического распознавания человека с использованием акустических сигналов, снимаемых с тела человека // 2263358

Изобретение относится к области автоматического распознавания человека по его голосовым характеристикам и может быть использовано для ограничения и разграничения доступа (в том числе удаленного) к устройствам и системам, к средствам электронно-вычислительной техники, к конфиденциальной информации, к услугам (например, телекоммуникационным, информационным, банковским), а также к охраняемым зонам и помещениям

Способ распознавания фонем речи и устройство для реализации способа // 2268504

Изобретение относится к области анализа и распознавания речевых сигналов и касается способа распознавания фонем речи

Способ распознавания слов речи // 2296376

Изобретение относится к области анализа и распознавания речевых сигналов

Способ организации синхронного перевода устной речи с одного языка на другой посредством электронной приемопередающей системы // 2419142

Изобретение относится к области электроники, в частности к переводу фраз с первого языка на второй

Детектирование автоответчика путем распознавания речи // 2439716

Изобретение относится к способам и устройствам детектирования автоответчика, используемым для определения того, является ли получатель вызова реальной персоной или автоответчиком

Способ ускоренного воспроизведения речевых сообщений и устройство для его осуществления // 1406636

Способ смысловой интерпретации слитно произносимых слов // 1408449

Устройство для распознавания речевых команд // 1578744

Изобретение относится к речевой информатике

Способ и сервер для синтеза речи по тексту // 2632424

Изобретение относится к средствам синтеза речи по тексту. Технический результат заключается в повышении естественности человеческого голоса в синтезированной речи. Акустическая пространственная модель обучается на основе обучающих данных речевых атрибутов с использованием глубокой нейронной сети для определения факторов взаимозависимости между речевыми атрибутами в обучающих данных. Глубокая нейронная сеть создает единственную непрерывную акустическую пространственную модель на основе факторов взаимозависимости. Акустическая пространственная модель, таким образом, учитывает множество взаимозависимых речевых атрибутов и дает возможность моделировать непрерывный спектр взаимозависимых речевых атрибутов. Далее происходит получение текста; получение выбора одного или нескольких речевых атрибутов, причем каждый речевой атрибут обладает весом выбранного атрибута. Текст преобразуется в синтезированную речь с использованием акустической пространственной модели, и синтезированная речь обладает выбранным речевым атрибутом. Синтезированная речь выводится в виде аудио, обладающего выбранным речевым атрибутом. 2 н. и 12 з.п. ф-лы, 4 ил.