Устройство распознавания речевых команд в условиях шумов

Изобретение относится к радиотехнике. Технический результат заключается в повышении вероятности правильного распознавания команды в условиях шумов. Сущность изобретения заключается в том, что в устройство, содержащее блок определения начала и конца команды (БОНиКК), первый блок памяти (БП), блок сегментации на слоги (БСнС), блок нормирования команды по времени (БНКпВ), блок эталонных команд (БЭК) и вычислитель схожести команд (ВСК), причем выход БОНиКК соединен с первыми входами первого БП и БСнС, выход первого БП подключен к первому входу БНКпВ, второй вход которого соединен с выходом БСнС, дополнительно введены вход опорного шума (ОШ), второй БП, блок нормирования шума по времени (БНШпВ), первый и второй блоки нормирования по уровню (БНпУ) и смеситель сигналов (СС), при этом вход речевой команды соединен с входом БОНиКК и со вторыми входами БСнС и первого БП, вход ОШ подключен к первому входу второго БП, ко второму входу которого подключен выход БОНиКК, выход второго БП подсоединен к первому входу БНШпВ, выход БСнС подключен ко вторым входам БНШпВ, первого и второго БНпУ, БЭК и третьим входам первого и второго БП, выход БНШпВ подсоединен к первому входу СС, ко второму входу которого подсоединен выход БЭК, первый вход которого подключен к первому выходу ВСК, выход СС подсоединен к первому входу второго БНпУ, выход которого соединен со вторым входом ВСК, к первому входу которого подключен выход первого БНпУ, первый вход которого соединен с выходом БНКпВ. 6 ил.

 

Изобретение относится к системам обработки информации и управления, в частности к устройствам распознавания речевых команд в условиях шумов, и может быть использовано при построении систем речевого управления транспортным средством, работающих в условиях акустических шумов, например, в кабине автомобиля, самолета или на борту корабля.

Известны системы распознавания речевых команд в условиях шумов (см., например, патент США №6529866 В1, опубл. 04.03.2003), основанные на определении параметров скрытой марковской модели (СММ) речевой команды и содержащие, как и предлагаемое устройство, вход для речевой команды и блок определения начала и конца команды. Кроме того, известные системы содержат блоки выделения и хранения параметров СММ речевых единиц и блок соотнесения параметров известных речевых единиц определенным параметрам. Выход блока выделения начала и конца команды подсоединен ко входу блока выделения параметров СММ речевых единиц, выход которого подсоединен к первому входу блока соотнесения параметров известных речевых единиц определенным параметрам, ко второму входу которого подключен выход блока хранения параметров СММ речевых единиц. Для уменьшения влияния шумового фона на качество распознавания в таких системах используются либо частотные фильтры, подключенные на входе обучающего речевого сигнала, либо к блоку принятия решения о принадлежности известных речевых единиц сигналу подключается корректирующий блок, хранящий информацию о статистических отличиях зашумленных и "чистых" фрагментов речи (дополнительная марковская модель, обученная на зашумленных речевых сигналах). Однако неопределенность в объеме обучающей выборки при построении блоков, содержащих параметры СММ, влечет за собой чрезмерное увеличение используемой в устройстве памяти. Недостатком устройств, основанных на блоках выделения параметров СММ, является также нестабильность их работы в условиях изменяющихся шумов со сложной акустической структурой, поскольку хранящаяся в памяти устройства СММ не может содержать параметры всех возможных состояний шума.

Известно также устройство распознавания речевых команд в условиях шумов по патенту США №6678656 В2, опубл. 13.01.2004, содержащее, как и предлагаемое устройство, вход речевой команды и, кроме того, фильтры высокой и низкой частоты, блок фильтрации шума, блок вычитания опорного шума из высокочастотной составляющей сигнала, сумматор отфильтрованной от шума низкочастотной речевой составляющей и высокочастотной речевой составляющей. Ко входу речевой команды у известного устройства подключены фильтры высокой и низкой частоты. Выход фильтра низкой частоты подключен к входу блока фильтрации шума, имеющему в свою очередь два выхода: к одному из которых подключен блок вычитания опорного шума из высокочастотной составляющей сигнала, а ко второму - сумматор отфильтрованной от шума низкочастотной речевой составляющей и высокочастотной речевой составляющей. Выход фильтра высокой частоты подключен к входу блока вычитания опорного шума, выход которого соединен со входом сумматора высокочастотной и низкочастотной составляющей сигнала. Наличие в устройстве фильтров, разделяющих речевой сигнал, обеспечивает фильтрацию высокочастотной составляющей сигнала от мешающих шумов по опорному шуму, отфильтрованному от низкочастотной составляющей. Недостатком известного устройства является высокая вероятность подавления информационной составляющей сигнала фильтром шума, включенным в цепь низкочастотной составляющей сигнала. Кроме того, ошибка работы шумового фильтра низкочастотной составляющей влечет за собой ошибку вычитания опорного шума из высокочастотной составляющей, что приводит к снижению вероятности правильной идентификации речевого сигнала системой распознавания в целом.

Наиболее близким к предлагаемому является устройство распознавания речевых команд по патенту США №4979212, класса G 10 L 7/08, опубл. 18.12.1990, прототип, содержащий, как и предлагаемое устройство, вход речевой команды, блок определения начала и конца команды, первый блок памяти, блок сегментации на слоги, блок нормирования команды по времени, блок эталонных команд и вычислитель схожести команд, причем выход блока определения начала и конца команды соединен с первыми входами первого блока памяти и блока сегментации на слоги, выход первого блока памяти подключен к первому входу блока нормирования команды по времени, второй вход которого соединен с выходом блока сегментации на слоги.

В отличие от предлагаемого известное устройство содержит также блок-преобразователь входного речевого сигнала в его частотную интерпретацию и блок принятия решения. Вход блока-преобразователя входного речевого сигнала в его частотную интерпретацию подключен к входу речевой команды, а выход - к первому входу блока определения начала и конца команды и входу блока памяти. Кроме того, выход блока нормирования команды по времени подключен к первому входу вычислителя схожести команд, ко второму входу которого подключен блок эталонных команд, а к выходу вычислителя схожести признаков команд подключен блок принятия решения. Недостатком прототипа является низкая вероятность правильного распознавания речевой команды в условиях шумов со сложной акустической структурой, поскольку в блоке эталонных команд содержатся команды либо без шумового фона, либо с шумовым фоном, отличным от фона распознающейся команды, кроме того, блок-преобразователь входного сигнала выделяет спектр речевой составляющей сигнала, маскированный спектром шумовой составляющей сигнала, что приводит к разнородности сигналов команды и эталонов и соответственно - к ошибкам в работе вычислителя схожести признаков команд.

Потребность в использовании речевых команд возникает, например, при управлении автомобилем, кораблем или иным другим транспортным средством для снижения нагрузки на органы восприятия информации и коммуникативные средства водителя или пилота. Для этого может быть использовано устройство речевого ответа на речевой запрос о состоянии бортового оборудования или физических характеристик транспортного средства. Подобные устройства основываются на системе распознавания речевых команд в условиях интенсивных акустических шумов. Вероятность правильного распознавания команды в большой степени зависит от характеристик и интенсивности шума среды, в которой произносится команда. Объясняется это тем, что распознавание основано на определении сходства характеристик произнесенной команды с характеристиками эталонных команд, при этом команда рассматривается как сигнал, разбитый на N временных отрезков, а ее характеристиками служат, например, значения нормированного по амплитуде сигнала, определенные с некоторым дискретом на каждом из N отрезков. Если на каждом отрезке определено К характеристик, то критерием сходства может служить величина

где и - значения i-х из N характеристик двух команд. Из (1) видно, что если , при i=1...N, k=1...К, то ρ=0, и чем больше абсолютная разность соответствующих значений характеристик, тем больше значение ρ. Чем меньше значение ρ для двух команд, тем больше схожи команды. Команда признается идентичной тому эталону, с которым значение ρ минимально. Используемые эталонные команды произнесены в отсутствии шумов, а шумы в команде, произнесенной для распознавания, вносят погрешность в ее характеристики, что приводит к увеличению ρ для произнесенной и соответствующей ей эталонной команды. Это ведет к снижению вероятности правильного распознавания. В тех случаях, когда от качества работы системы распознавания зависит безопасность оборудования или человека, возникает потребность в максимальном увеличении вероятности правильного понимания команды, что предъявляет повышенные требования к точности работы устройства распознавания речевых команд в условиях шумов.

Для достижения технического результата - повышения вероятности правильного распознавания команды в условиях шумов - в известное устройство распознавания речевых команд, содержащее вход речевой команды, первый блок памяти, блок сегментации на слоги, блок нормирования команды по времени, блок эталонных команд, вычислитель схожести команд и блок определения начала и конца команды, выход которого соединен с первыми входами блока сегментации на слоги и первого блока памяти, выход которого подключен к первому входу блока нормирования команды по времени, второй вход которого соединен с выходом блока сегментации на слоги, дополнительно вводятся вход опорного шума, второй блок памяти, блок нормирования шума по времени, первый и второй блоки нормирования по уровню и смеситель сигналов. При этом вход речевой команды соединен с входом блока определения начала и конца команды и со вторыми входами блока сегментации на слоги и первого блока памяти. Вход опорного шума подключен к первому входу второго блока памяти, ко второму входу которого подключен выход блока определения начала и конца команды. Выход второго блока памяти подсоединен к первому входу блока нормирования шума по времени, выход блока сегментации на слоги подключен ко вторым входам блока нормирования шума по времени, первого блока нормирования по уровню, второго блока нормирования по уровню, блока эталонных команд и третьим входам первого и второго блоков памяти. Выход блока нормирования шума по времени подсоединен к первому входу смесителя сигналов, ко второму входу которого подсоединен выход блока эталонных команд, первый вход которого подключен к первому выходу вычислителя схожести команд. Выход смесителя сигналов подсоединен к первому входу второго блока нормирования по уровню, выход которого соединен со вторым входом вычислителя схожести команд, к первому входу которого подключен выход первого блока нормирования по уровню, первый вход которого соединен с выходом блока нормирования команды по времени. Второй выход вычислителя схожести команд является выходом устройства распознавания речевых команд в условиях шумов.

Введением входа опорного шума и смесителя сигналов обеспечивается формирование у эталонных команд искусственного шумового фона, близкого к фону распознаваемой команды. Этим достигается большее сходство распознаваемой команды на фоне шума и соответствующей ей эталонной (изначально не содержащей шумового фона), что обеспечивает повышение вероятности правильного распознавания команды в условиях шумов без применения дополнительных алгоритмов фильтрации шума. При этом второй блок памяти служит для хранения опорного шума, блок нормирования шума по времени служит для приведения длительности опорного шума к длительности эталонных команд, первый и второй блоки нормирования по уровню служат для нормирования амплитуд сравниваемых команд.

Проведенный заявителем анализ уровня техники, включающий поиск по патентным и научно-техническим источникам информации, и выявление источников, содержащих сведения об аналогах заявленного изобретения, позволили установить, что заявитель не обнаружил аналог, характеризующийся признаками, тождественными всем существенным признакам заявленного изобретения. Выбор из перечня выявленных аналогов прототипа, как наиболее близкого по совокупности существенных признаков аналога, позволило выявить совокупность существенных по отношению к усматриваемому заявителем техническому результату отличительных признаков в заявленном устройстве, изложенных в формуле изобретения. Следовательно, заявленное изобретение соответствует критерию "новизна".

Для проверки соответствия заявленного изобретение критерию "изобретательский уровень" заявитель провел дополнительный поиск известных решений, чтобы выявить признаки, совпадающие с отличительными от прототипа признаками заявленного устройства. Результаты поиска показали, что заявленное изобретение не вытекает для специалиста явным образом из известного уровня техники, определенного заявителем. Не выявлено влияние преобразований, предусматриваемых существенными признаками заявленного изобретения, на достижение технического результата. В частности, заявленным изобретением не предусматриваются следующие преобразования: дополнение известного средства какой-либо известной частью, присоединяемой к нему по известным правилам, для достижения технического результата, в отношении которого установлено влияние именно таких дополнений; замену какой-либо части известного средства другой известной частью для достижения технического результата, в отношении которого установлено влияние именно такой замены; исключение какой-либо части средства с одновременным исключением обусловленной ее наличием функции и достижением при этом обычного для такого исключения результата; увеличение однотипных элементов для усиления технического результата, обусловленного наличием в средстве именно таких элементов; выполнение известного средства или его части из известного материала для достижения технического результата, обусловленного известными свойствами материала; создание средства, состоящего из известных частей, выбор которых и связь между которыми осуществлены на основании известных правил, рекомендаций и достигаемый при этом технический результат обусловлен только известными свойствами частей этого объекта и связей между ними; изменение количественных признаков или взаимосвязи признаков, если известен факт влияния каждого из них на технический результат и новые значения признаков или их взаимосвязь могли быть получены из известных зависимостей. Следовательно, заявленное изобретение соответствует критерию "изобретательский уровень".

В частном случае выполнения первый и второй блоки нормирования по уровню могут быть выполнены в виде умножителей входного сигнала на величину, обратную средней амплитуде сигнала. Смеситель сигналов может являться сумматором сигналов.

Вычислитель схожести команд может являться сумматором абсолютных разностей последовательно поступающих на его первый и второй входы сигналов. Первый и второй блоки памяти могут являться ОЗУ. Блок эталонных команд может быть ПЗУ. Блоки нормирования команды по времени и нормирования шума по времени могут быть выполнены в виде параллельных регистров. Блоки определения начала и конца команды и сегментации на слоги могут быть аналогичными соответствующим блокам устройства прототипа.

Изобретение поясняется графическими материалами, при этом на фиг.1 представлена функциональная схема устройства распознавания речевых команд в условиях шумов; на фиг.2 - блок-схема алгоритма определения начала и конца команды; на фиг.3 - блок-схема алгоритма сегментации команды на слоги; на фиг.4 - блок-схема алгоритма нормирования команды по уровню; на фиг.5 - блок-схема алгоритма идентификации команды; на фиг.6 - графики зависимости вероятности правильного распознавания речевых команд (%) от отношения уровня сигнала команды к уровню фонового шума (дБ), где кривая 1 соответствует заявляемому устройству, кривая 2 - прототипу.

Устройство распознавания речевых команд в условиях шумов содержит вход 1 команды, вход 2 опорного шума, блок 3 определения начала и конца команды, второй блок памяти 4, блок 5 сегментации на слоги, первый блок памяти 6, блок 7 нормирования шума по времени, блок 8 эталонных команд, смеситель сигналов 9, первый блок нормирования по уровню 10, второй блок нормирования по уровню 11, вычислитель 12 схожести команд, выход кода 14, блок 15 нормирования команды по времени. При этом вход команды 1 соединен с входом блока 3 определения начала и конца команды и вторыми входами блоков 5 сегментации на слоги и 6 памяти, выход блока 3 определения начала и конца команды соединен с первыми входами первого блока 6 памяти и блока 5 сегментации на слоги. Выход первого блока 6 памяти соединен с первым входом блока 15 нормирования команды по времени. Выход блока 15 нормирования команды по времени подключен к первому входу блока 10 нормирования по уровню, выход которого подключен к первому входу вычислителя 12 схожести команд. Вход 2 опорного шума подключен к первому входу второго блока 4 памяти, ко второму входу которого подключен выход блока 3 определения начала и конца команды. Выход второго блока 4 памяти подсоединен к первому входу блока 7 нормирования шума по времени. Выход блока 5 сегментации на слоги подсоединен ко вторым входам блока 15 нормирования команды по времени, блока 7 нормирования шума по времени, блока 10 нормирования по уровню, блока 11 нормирования по уровню, блока 8 эталонных команд и к третьим входам блоков 4 и 6 памяти. Выход блока 7 нормирования шума по времени подсоединен к первому входу смесителя сигналов 9, ко второму входу которого подсоединен выход блока 8 эталонных команд, первый вход которого подключен к первому выходу вычислителя 12 схожести команд. Выход смесителя сигналов 9 подсоединен к первому входу второго блока 11 нормирования по уровню, выход которого соединен со вторым входом вычислителя 12 схожести команд. Второй выход вычислителя 12 схожести команд является выходом кода 14 устройства распознавания речевых команд в условиях шумов.

В одном из вариантов исполнения блоки памяти 4 и 6 могут представлять собой ОЗУ, блок 8 эталонных команд - ПЗУ. Блок 3 определения начала и конца команды, блок 5 сегментации на слоги, а также вычислитель 12 схожести команд могут быть идентичны соответствующим блокам устройства прототипа. Блоки 15 нормирования команды по времени и 7 нормирования шума по времени могут быть выполнены в виде параллельных регистров. Блоки 10 и 11 нормирования по уровню могут быть выполнены в виде вычислителей в соответствии с блок-схемой фиг.4. Смеситель сигналов 9 может представлять собой сумматор.

Устройство распознавания речевых команд в условиях шумов работает следующим образом. На вход команды 1 поступает сигнал речевой команды, произнесенной человеком в условии шумов. Одновременно на вход опорного шума поступает сигнал опорного шума. Опорный шум может быть получен, например, с помощью микрофона, расположенного в некотором удалении от микрофона, принимающего команду. Опорным шумом может являться также шум, выделенный каким-то образом из смеси команды и шума. В блоке определения начала и конца команды определяется начало и конец команды, например, в соответствии с блок-схемой фиг.2. На шаге 1 присваиваются нулевые начальные значения: сумме модулей отсчетов сигнала Su из Km отсчетов, номеру К текущего отсчета в окне и номеру i текущего отсчета в сигнале. На шаге 2 к Su прибавляется значение i-го отсчета сигнала, после чего номер К текущего отсчета в окне и номер i текущего отсчета увеличивается на единицу. Если К равно максимальному числу отсчетов в окне Km, то на шаге 3 осуществляется переход к условию шага 4, если нет, то повторяется шаг 2. На шаге 4 анализируется среднее значение модуля суммы Su в окне. Если Su/Km превышает пороговое значение S0, то на шаге 6 значению F1 присваивается единица и блоком 3 формируется импульс, разрешающий запись команды в блок памяти 6, а опорного шума - в блок 4 памяти. Кроме того, этот импульс разрешает обработку команды блоком 5 сегментации на слоги. Если Su/Km не превышает пороговое значение SO, то анализируется следующее окно. После превышения средним модулем Su/Km порогового значения, на шагах 8, 9, 11 происходит анализ среднего модуля сигнала в окне аналогично шагам 2, 3, 5. Если на шаге 10 Su/Km меньше порогового значения SO, то формирование импульса блоком 3 прекращается.

Сегментация команды на слоги в блоке 5 может быть выполнена, например, в соответствии с блок-схемой фиг.3. Пусть S - совокупность дискретных отсчетов команды. S разбивается на N частей, по I дискретных отсчетов в каждой, S(i,j) - i-й отсчет j-й части S. На шаге 1 формируются начальные значения: числа слогов Ns=1, числа частей сигнала по I отсчетов в каждом слоге SL(K) (К - номер слога) SL(1)=0, номера текущей части сигнала j=1. На шаге 2 находится значение среднего уровня Pm всей команды по формуле

На шаге 3 определяется средний уровень текущей части сигнала P(j) по формуле

а значению Р(0) присваивается значение Р(1), это необходимо для того, чтобы значения Р(0) и Р(1) одинаково соотносились с Pm, иначе в цикле при первом проходе шагов 4, 5, 7 при неизвестном значении P(j=0) (начальное значение j=1) может ложно увеличиться Ns число слогов. На шаге 4 значения P(j) и P(j-1) сравниваются со значением Pm. Если P(j) и P(j-1) не меньше Pm, то на шаге 5 количество частей SL(Ns) в текущем слоге Ns увеличивается на единицу, после чего анализируется следующая часть команды. Затем происходит переход к шагу 8. Если условие шага 4 не выполнено, то происходит переход к условию шага 6. Если P(j) и P(j-1) меньше Pm, т.е. условие шага 6 выполняется, то выполняются действия шага 5, если нет, то на шаге 7 количество слогов Ns увеличивается на единицу, значению частей сигнала в текущем слоге SL(Ns) присваивается единица, а номер текущей части изменяется на следующий. На шаге 8 проверяется, не является ли текущая часть сигнала последней. Если "нет", то действия повторяются начиная с шага 3, если "да", то происходит остановка алгоритма. В результате сегментации определяется число слогов Ns в команде, а также длительность L(К) каждого слога (K=1...Ns).

где f0 - частота дискретизации команды. Затем в течение длительности каждого слога L(К) (K=1...Ns) блок 5 генерирует импульсы с частотой

где L0 - нормированная длительность слога;

к - задаваемый коэффициент уменьшения частоты f0, равный примерно 0,2-0,3.

При поступлении первого импульса из блока 5 на выход блока 6 памяти с частотой f0 начинают поступать отсчеты команды, а на выход блока 4 памяти - отсчеты шума. Кроме того, при поступлении каждого импульса из блока 5 блок 15 нормирования команды по времени из последовательности отсчетов, поступающих с блока 6 памяти, выделяет один отсчет, непосредственно следующий за импульсом с блока 5, одновременно блок 7 нормирования шума по времени выделяет отсчет, поступающий с блока 4 памяти, а блок 8 эталонных команд выделяет очередной отсчет эталонной команды, с которой сравнивается в данный момент распознаваемая команда. Также каждый импульс, поступающий из блока 5, разрешает запись отсчетов, поступающих на входы блоков 10 и 11 нормирования по уровню. Схема работы блоков 7 и 15, например, может соответствовать схеме работы параллельного регистра.

В смесителе сигналов 9 происходит добавление отсчетов опорного шума, поступающих из блока 7 к отсчетам эталонной команды, поступающим из блока эталонных команд 8. Смешанная с опорным шумом эталонная команда поступает в блок 11 нормирования по уровню, а распознаваемая команда - в блок 10 нормирования по уровню. Нормирование команд по уровню осуществляется, например, в соответствии с блок-схемой фиг.4. На шаге 1 определяется средний уровень Su команды, а также присваивается начальное значение i=0 номеру текущего отсчета, затем на шаге 2 текущий отсчет команды делится на значение среднего уровня, а номер текущего отсчета увеличивается на единицу i=i+1. Если условие окончания команды на шаге 3 не выполнено, т.е. если i не равно N(S), то действие шага 2 повторяется. В результате применения алгоритма блок-схемы фиг.4 команда нормируется по уровню.

Далее отсчеты распознаваемой и эталонной команд поступают в вычислитель схожести команд 12. В блоке 12 определяется критерий сходства (1) между распознаваемой и эталонной командами (расстояние между командами), например, по алгоритму блок-схемы фиг.5. На шаге 1 значению минимального расстояния Rm между командами присваивается заведомо большое значение Rm=Rmax, номеру С эталонной команды присваивается нулевое значение С=0, номеру эталонной команды, давшей минимальное расстояние, присваивается несуществующий номер команды, например, Cm=-1. На 2 шаге проверяется равенство длин команд. Если длины команд равны, то на шаге 3 находится расстояние между командами как сумма абсолютных разностей отсчетов команд

Если длины команд не равны, то на шаге 4 расстоянию присваивается заведомо большее значение R=Rmax. На шаге 5 полученное расстояние сравнивается с имеющимся минимальным расстоянием Rm, a также с пороговым R0. Если полученное расстояние R меньше Rm и R0, то на шаге 6 минимальному расстоянию присваивается значение полученного расстояния, номеру Cm эталонной команды, давшей минимальное расстояние, присваивается значение номера текущего эталона, а также происходит переход к следующему эталону. Если условие шага 5 не выполнено, то на шаге 7 происходит переход к следующему эталону. На шаге 8 определяется, является ли текущая эталонная команда последней, если "нет", то на шаге 9 блоком 12 генерируется импульс, задающий следующий эталон в блоке 8, далее происходит сравнение распознаваемой команды с очередной эталонной командой (начиная с шага 2). Если текущая эталонная команда последняя, то на выход блока 12 подается значение номера Cm эталонной команды, с которой определено минимальное расстояние. При поступлении на вход блока 8 импульса со второго выхода вычислителя 12, на выход блока подаются отсчеты очередной эталонной команды. После чего блоки 9, 11, 12 выполняют свои функции, как приведенные выше. После сравнения распознаваемой команды со всеми эталонными на выходе кода 14 будет либо код, соответствующий - 1 (если расстояния, определенные со всеми эталонными командами больше R0), либо код, соответствующий номеру одной из эталонных команд, хранящихся в блоке 8 эталонных команд.

Вышеизложенные сведения свидетельствуют о выполнении при использовании заявленного устройства следующей совокупности условий:

- средство, воплощающее заявленное устройство при его осуществлении, предназначено для построения систем речевого управления транспортным средством, работающих в условиях акустических шумов;

- для заявленного устройства в том виде, как оно охарактеризовано в формуле изобретения, подтверждена возможность его осуществления с помощью описанных в заявке или известных до даты приоритета средств и методов;

- средство, воплощающее заявленное изобретение при его осуществлении, способно обеспечить достижение усматриваемого заявителем технического результата. Таким образом, заявленное изобретение соответствует критерию "промышленная применимость".

Устройство распознавания речевых команд в условиях шумов прошло апробацию в лабораториях Ульяновского государственного технического университета, для этого оно было смоделировано на ПЭВМ в среде Delphi. Использовались следующее экспериментальные средства: компьютер типа IBM с тактовой частотой процессора 600 Mhz, звуковая карта SB Live и динамический микрофон. В качестве шумового фона речевых команд и опорного шума использовался шум авиационного двигателя, записанный в реальных условиях. Испытания проводились на словаре эталонных команд, состоящем из 23 слов авиационной терминологии. Для определения оценки вероятности распознавания каждая команда из словаря была произнесена три раза, затем 23×3 речевые команды соотносились с 23 эталонами. Команды произносились одним диктором (мужской голос). Характеристики, показанные устройством при испытаниях в разных шумовых условиях, приведены на графике фиг.6, где показаны также характеристики прототипа. Таким образом, апробация подтвердила достижение технического результата - повышение вероятности правильного распознавания команды в условиях шумов, так, например, для отношения сигнал/шум 3дБ вероятность правильного распознавания команд у заявленного устройства - 92%, что на 15% больше, чем вероятность правильного распознавания - 77% у прототипа.

Устройство распознавания речевых команд в условиях шумов, содержащее вход речевой команды, блок определения начала и конца команды, первый блок памяти, блок сегментации на слоги, блок нормирования команды по времени, блок эталонных команд и вычислитель схожести команд, причем выход блока определения начала и конца команды соединен с первыми входами первого блока памяти и блока сегментации на слоги, выход первого блока памяти подключен к первому входу блока нормирования команды по времени, второй вход которого соединен с выходом блока сегментации на слоги, отличающееся тем, что в него введены вход опорного шума, второй блок памяти, блок нормирования шума по времени, первый и второй блоки нормирования по уровню и смеситель сигналов, при этом вход речевой команды соединен с входом блока определения начала и конца команды и со вторыми входами блока сегментации на слоги и первого блока памяти, вход опорного шума подключен к первому входу второго блока памяти, ко второму входу которого подключен выход блока определения начала и конца команды, выход второго блока памяти подсоединен к первому входу блока нормирования шума по времени, выход блока сегментации на слоги подключен ко вторым входам блока нормирования шума по времени, первого блока нормирования по уровню, второго блока нормирования по уровню, блока эталонных команд и третьим входам первого и второго блоков памяти, выход блока нормирования шума по времени подсоединен к первому входу смесителя сигналов, ко второму входу которого подсоединен выход блока эталонных команд, первый вход которого подключен к первому выходу вычислителя схожести команд, выход смесителя сигналов подсоединен к первому входу второго блока нормирования по уровню, выход которого соединен со вторым входом вычислителя схожести команд, к первому входу которого подключен выход первого блока нормирования по уровню, первый вход которого соединен с выходом блока нормирования команды по времени, второй выход вычислителя вхожести команд является выходом устройства распознавания речевых команд в условиях шумов.



 

Похожие патенты:

Изобретение относится к системе связи и предназначено для выполнения кодирования с линейным предсказанием, возбуждаемого кодом переменной скорости. .

Изобретение относится к речевой информатике и может быть использовано при распознавании речи. .

Изобретение относится к анализу речи в неблагоприятных условиях окружения

Изобретение относится к оценке шума, в частности к оценке шума в сигналах, используемых для распознавания образов

Изобретение относится к распознаванию и передаче речи, в частности к способам и устройствам для определения правдоподобия состояния речи на основании сигнала альтернативного датчика и сигнала микрофона, основанного на принципе воздушной проводимости

Изобретение относится к области обработки аудиосигналов, в частности к обработке потоков битов аудиоданных с метаданными. Технический результат заключается в обеспечении приема потоков битов. Технический результат достигается за счет анализа метаданных, чтобы определять то, действительно ли упомянутые метаданные представляют собой или включают в себя метаданные профиля, указывающие целевой профиль, причем метаданные профиля пригодны для выполнения по меньшей мере одного из управления громкостью, нормализации громкости или управления динамическим диапазоном аудиоданных в соответствии с целевым профилем, и при этом целевой профиль определяет целевую громкость и/или по меньшей мере одну целевую характеристику динамического диапазона, подвергнутой рендерингу версии аудиоданных для воспроизведения устройством воспроизведения аудио из группы устройств воспроизведения аудио. 4 н. и 15 з.п. ф-лы, 17 ил.
Наверх