Способ распознавания слитно произнесенных слов и устройство для его осуществления

 

1. Способ распознавания слитно произнесенных слов, включающий выделение текущих параметров, формирование массивов номеров и моментов начала потенциально оканчивающихся слов и. принятие решения о произнес -йной последовательности слов, о т л ичающийся тем, что, с целью повьппения быстродействия, пррГформировании массивов рекуррентно накапливают интегральные меры сходства между последовательностью теку1цих параметров от первого до текущего отсчета и эталоннь ми сигналамислитной речи, заканчиваюпщмися всеми возможными эталонными элементами всех слов словаря, при эТом считывают интегральные меры сходства , накопленные для нескольких предшествующих отсчетов текущих параметров , а массивы записывамт код номера потенциально закончившегося в данный текущий момент слова и код момента его начала, соответст вующие максимальной из полученных интегральных схем сходства. 2. Устройство для распознавания слитно произнесенных слов, содержащее соединенный с входом устройства цифровой спектроанализатор с информационным и управляющим выходами, контроллер , управляющий вход которого соединен с управляющим выходом цифрового спектроанализатора, буферный регистр, вход которого соединен с информационным выходом спектроанали (Л затора, а выход - с первым входом измерителя сходства, второй вход которого соединен с контроллером через блок памяти эталонов, и блок принятия решения, выход которого является выходом устройства, отличаю щ ее с я тем, что, с целью ел повьпнения быстродействия, в него со введены запоминающее устройство сходств, запоминающее устройство моС71 ментов начала слов и вьщелитель макСО симального сходства, при этом адресные входы запоминающего устройства моментов начала слов и запоминающего устройства сходств соединены с адресным выходом контроллера, выделитель максимального сход. ,тва соединен с информационными, шинами запомийающих устройств и выходом измерителя сходства , а информационный и управляющий входы блока принятия решения соединены соответственно с информационным выходом вьщелителямаксимальното сжодст в а и управляющим выходом контроллера .

. СОЮЗ СОВЕТСКИХ

СОЦИАЛИСТИЧЕСНИХ

РЕСПУБЛИК (19) (((1

4 (511

ГОСУДАРСТВЕННЫЙ НОМИТЕТ СССР

ПО ДЕЛАМ ИЗОБРЕТЕНИЙ И ОТНРЬ(ТИЙ

/ (21) 3560077/24-10 (22) 28.02.83 (46) 30.05.85. Бюл. ¹ 20 (72) Т.К. Винцюк и А.Б. Лысенко (71) Ордена Ленина институ кибернетики им. В,M. Глушкова (53) 681.39(088.8) (56) 1. Винцюк Т,К, Альтернативные пути решения проблемы распознавания и смысловой интерпретации слитной речи для устного диалога человека и

ЭВ11. Сб, АРС0-12, Киев, 1982, с. 8-12.

2. Винцюк Т.К. Обобщенная задача распознования слитной речи,СбАРСО-12, Киев, 1982, с. 345- 348 (прототип), 3. Патент США ¹ 4059725, кл, 179-1, 1979 (прототип). (54) СПОСОБ. РАСПОЗНАВАНИЯ СЛИТНО

ПРОИЗНЕСЕННЫХ СЛОВ И УСТРОЙСТВО ДЛЯ

ЕГО ОСУЩЕСТВЛЕНИЯ. (57) !. Способ распознавания слитно произнесенных слов, включающий вьщеление текущих параметров, формирование массивов номеров и моментов начала потенциально оканчивающихся слов и принятие решения о произнесе(Мкой последовательности слов, о т л ич а ю шийся тем, что, с целью повышения быстродействия, пф формировании массивов рекуррентно накапl ливают интегральные меры схо ства между последовательностью отс тов текущих параметров от гервого отсчета до текущего отсчета и эталонными сигналами слитной речи, заканчивающимися всеми возможными эталонными элементами всех слов словаря, при этом считывают интегральные меры сходст- ва, накопленные для нескольких предшест(.ующих отсчетов текущих параметров, а массивы записывают код номера потенциально закончившегося в данный текущий момент слова и код момента его начала, соответствующие максимальной из полученных интегральных схем сходства.

2. Устройство для распознавания слитно произнесенных слов, содержащее соединенный с входом устройства цифровой спектроанализатор с .информа- . ционным и управляющим выходами, контроллер, управляющий вход которого соединен с управляющим выходом циф- рового спектроанализатора, буферный регистр, вход которого соединен с 7 информационным выходом спектроанализатора, а выход — с первым входом измерителя сходства,. второй вход которого соединен с контроллером через блок памяти эталонов, и блок принятия решения, выход которого является выходом устройства, о т л иФаиий чающее ся тем, что, сцелью повышения быстродействия, в него введены запоминающее устройство, сходств, запоминающее устройство моментов начала слов и вьщелитель максимального сходства, при этом адресные входы запоминающего устройства моментов начала слов и запоминающего устройства сходств соединены с адресным выходом контроллера, выделитель

-максимального сход".тва соединен с. 3 информационнымц шинами запоминающих устройств и выходом измерителя сходства,.а информационный и управляющий входы блока принятия решения соедине " ны соответственно с информационным выходом выделителямаксимального сходстваа и управляющим выходом контроллер».

9 тов начала потенциально оканчивающихся слов и принятие решения о произнесенной последовательности слов, при формировании массивов рекуррентно накапливают интегральные меры сходства между последовательностью отсчетов текущих параметров от первого отсчета до текущего отсчета н эталонными сигналами слитной речи, заканчивающимися всеми возможными эталонными элементамн всех слов словаря. При этом считывают интегральные меры сходства, накопленные для нескольких предшествующих отсчетов текущих параметров, а в массиве записывают код номера потенциально закончившего- ся в данный текущий момент слова и код комента его начала, соответствующие максимальной из полученных интегральных мер сходства.

В устройство для распознавания слитно произнесенных слов, содержащее соединенный с входом устройства цифровой спектроанализатор с информационным и управляющим выходами, контроллер, управляющий вход котороF0 соединен с управляющим выходом цифрового спектроанализатора., буферный регистр, вход которого соединен с информационным выходом цифрового спектроанализатора, а выход — с пер" вым входом измерителя сходства, второй вход которого соединен с конт% роллером через блок памяти эталонов, и блок принятия решения, выход которого является выходом устройства, введены запоминающее устройство сходств, запоминающее устройство моментов начала слов и выделитель максимального сходства, при этом адресные входы запоминающего устройства моментов начала слов и запоминающего устройства сходств соединены с адресным выходом контроллера, выделитель максимального сходства соединен с информационными шинами запоминающих устройств и выходом измерителя сход,ства., а информационный и управляющий входы блока принятия решения соединены соответственно с информационными выходом выделителя максимального сходства и управляющим выходом контроллера.

1 t 1590

Изобретение относится к технике обработки речевой информации с использованием спектральных свойств речевого сигнала и может найти применение для голосового управления промыш- g лепными обьектЪми.

Известен способ распознавания слитной речи путем формирования и проверки цепей гипотез о различных композициях элементарных речевых сигна- 40 лов $1 ).

Однако быстродействие этого способа ограничивается большим объемом вычислений, необходимых для выявления правдоподобных гипотез о возмож- > ных интерпретациях слитно произнесенных речевых высказываний.

Наиболее близок к предлагаемому способ распознавания слитно проиэне» сенных слов, включающий выделение текущих параметров, фЬрмирование массивов номеров и моментов. начала потенциально оканчивающихся слов и принятие решения о произнесенной последовательности слов «2 ), Недостаток этого способа состоит в низком быстродействии, которое ограничивается большим обьемом перебора различных вариантов начал и окончаний возможных слов, Известно устройство для распознавания слитно произнесенных слов, содержащее соединенный с входом уст- ройства цифровой спектроанализатор с информационным и управляющим выходами, контроллер„ управляющий вход З5 которого соединен с управляющим выходом цифрового спектроанализатора, буферйый регистр, вход которого соединен с информационным выходом цифрового спектроанализатора, а выход — О с первым входом измерителя сходства, второй вход которого соединен с контроллером через блок памяти эталонов, и блок принятия решения, выход которого является выходом устройства (3).

Недостаток этого устройства состоит s низкой скорости обработки слитной речи, что приводит к значительному запаздыванию в принятии решения., Целью изобретения является повышение быстродействия распознавания слов в слитной речи.

Укаэанная цель достигается тем, что согласно способу распознавания И слитно произнесенных слов, включающему выделение текущих параметров, формирование массивов номеров и моменНа чертеже показана блок-схема устройства для распознавания слитно произнесенных слов, реализующего предложенный способ.

3 11590

Схема содержит цифровой спектроанализатор 1, буферный регистр 2, контроллер 3, блок 4 памяти эталойов-, измеритель 5 сходства, запоминающее устройство 6 сходств, запоминающее устройство 7 моментов начала слов„ выделитель 8 максимального сходства, блок 9 принятия ре ения.

Акустическая волна слитной речи, преобразованная микрофоном в электрический сигнал, обрабатывается в цифровом спектроанализаторе 1g на информационном выходе которого с пе-.риодом.дискретизации, 15-20 ме в цифровом виде формируются отсчеты теку» щего спектра входного речевого сигнала, каждый из которых представлен спектральным вектором, Аналогично представлены эталоны слов, хранящие-" ся s блоке 4 памяти эталонов. С управляющего выхода цифрового спектро анализатора на управляющий вход контроллера 3 поступает сигнал, сопровождающий формирование спектрального вектора, пересылаемого с информационного выхода цифрового спектроанализатора в буферный регистр 2.

При этом на адресном выходе контрол.,лера формируется последовательность адресов, по которым нз блока 4 памя30 ти эталонов, запоминающего устройства 6 сходств, запоминающего устройства 7 моментов начала слов считывается хранящаяся в них информация.

Измеритель 5 сходства формирует текущеЕ значение сходства спектральных векторов, поступивших на его входы..

Последовательность текущих значений сходств пересылается в выделитель 8 максимального сходства, куда также пересылаются интегральные меры сход- 4О ства предшествующих обрабатываемому спектральных векторов речевого сигнала. Выделнтель максимального сходства формирует новое значение интегральной меры сходства путем суммиро- вания наилучшей из полученных мер с текущим значением сходства, посту59 4 пившим с измерителя сходства. Кроме того, вьщелитель максимального сход ства формирует сопутствующую информацию а началах потенциально окончившихся слов и по сигналу синхронизации записи, посылаемому контроллером, передает. новые значения интегральной меры сходства и моментов начала слов в соответствующие запоминающие устройства. Перечисленные операции повторяются до окончания последовательности спектральных век торов эталонов. После этого в блок

9 принятия решения передается значение интегральной меры сходства, соответствующее потенциально закончившемуся в данный текущий момент слову, и его номер и момент начала.

Эти значения накапливаютвя до окончания высказывания. Сигнал окончания высказывания формируется контролле-.ром по управляющему сигналу цифрового спектрального анализатора. По результатам накопления блок принятия решения выделяет последовательность слов, имевшихся в слитном высказывании.

Таким образом, для каждого спектрального вектора распознаваемого речевого сигнала введенный выделитель максимального сходства совместно с запоминающими устройствами сходств и моментов начала слов осуществляет выделение максимального сходства между последовательностями -спектральных векторов от первого до текущего и всеми возможными спектральными векторами всех слов словаря, что существенно сокращает количество сравниваемых вариантов, чем и достигает-, ся повышение быстродействия при распознавании слитно произнесенных слов.

Использование изобретения позволяет повысить оперативность работы человекомашинных систем с речевым вы. водом информации.

1159059

Тираж 372 Подписное

ВНИИИИ Государственного комитета СССР по делам изобретений и открытий

113035, Москв@, Ж-35, Раушская наб., д. 4/5

Заказ 3596/51

Филиал ППП "Патент", r. Ужгород, ул. Проектная, 4

Составитель В. Махонин

Редактор С. Тимохина Техред Т.Дубинчак Корректор В, Буттяга

Способ распознавания слитно произнесенных слов и устройство для его осуществления Способ распознавания слитно произнесенных слов и устройство для его осуществления Способ распознавания слитно произнесенных слов и устройство для его осуществления Способ распознавания слитно произнесенных слов и устройство для его осуществления 

 

Похожие патенты:
Наверх