Устройство для распознавания речевых сигналов

 

СОЮЗ СОВЕТСКИХ

СОЦИАЛИСТИЧННИХ

РЕСПУБЛИК (!9) (И) М59 10 Ь 1 02

ОПИСАНИЕ ИЗОБРЕТЕНИЯ

ГОсудАРстВенный НОмитет сссР

Гю делАм изоБРетений и ОтнРытий

И ABTGPGHONIY СВИДЕТЕЛЬСТВУ (21) 3383637/18-10 (22) 08.01. 82 (46) 23.07. 83. Бюл. Р 27(72) И. Ф. Бондаренко, A. Я. Дрюченко, A.È. Кантемир и B.IO. Соколов (71) Харьковский ордена Трудового

Красного Знамени институт радиоэлектроники (53) 534.781(088.8) (56) 1 ° Авторское свидетельство СССР

Р 568963, кл. G 10 L 1/02, 1977.

2. Авторское свидетельство. СССР

9 830521, кл. G 10 Ь 1/02, 1981.

t 54) (57):УСТРОЙСТВО ДЛЯ РАСПОЗНАВАНИЯ

РЕЧЕВЫХ СИГНАЛОВ,: содержащее блок измерителя элементарной площади. распознаваемого сигнала, генератор тактовой частоты, блок памяти, анализатор, о т л и ч а ю щ е е с я тем, что, с " целью повышения быстродействия, надежности и упрощения конструкции, в него введены динамический нормализатор уровня, рецептор, классификатор, причем первый выход динамического нормализатора уровня подсоединен - к второму- вкоду блока измерителя элементарной площади, второй выход динамического нормалиэатора уровня подключен к третьему входу рецептора, выход блока измерителя элементарной площади подключен к второму входу рецептора, выход которого подключен к второму входу блока памяти, который соединен с вторым входом анализатора, выход анализатора подключен .к второму входу классификатора, выход генератора тактовой частоты подключен Q соответственно к первым входам блока измерителя элементарной площади, рецептора, блока памяти, анализатора и классификатора. с

1030840

Изобретение относится к распозна. ванию речевых сигналов и может быть использовано при создании средств речевого ввода информации в вычислительные машины, а также при разработке других средств автоматики с рече- 5 вым управлением.

Известно устройство для распознавания речевых сигналов, содержащее нуль-органы, количество которых равно числу уровней квантования, форми- !О рователь эталонных уровней напряжения, измерители времени существования, блок памяти и блок. сравнения(1)..

Недостатком данного устройства является его конструктивная слож,ность °

Наиболее близким к изобретению по технической сущности является устройство для распознавания речевых сигналов, содержащее входную 20 шину, соединенную с одним из входов нуль-органов, другой вход которых соединен с выходом формирователя .... эталонных уровней напряжения, блок измерителя элементарной площади распознаваемого сигнала, включенный между выходами нуль-органов и входом блока памяти, подключенного к входу блока сравнения (анализатора), соединеннсго с выходной шиной (2).

Недостатком известного устройства является невысокое быстродействие, обусловленное необходимостью большого числа переборов результатов измерений реализаций каждого класса распознаваемых образов и эталонов, а также кон-35 структивная сложность, связанная с необходимостью иметь для каждого эталон.ного уровня свой нуль-орган. При этом для повышения точности преобразования

I необходимо увеличить число эталонных 40 уровней напряжения, что приводит к услОжнению схемы и к снижению надежности устройства.

Цель изобретения — повышение быстродействия, надежности и упрощения конструкции. устройства.

Поставленная цель достигается тем, что в устройство для распознавания речевых сигналов, содержащее блок измерителя элементарной площади распознаваемого сигнала, генератор,тактовой частоты, блок памяти, анализатор, введены динамический нормализатор уровня, рецептор, классификатор, причем первый выход динамического нормализатора уровня подсоединен к второму входу блока измерителя зле= ментарной площади, второй выход динамического нормализатора уровня подключен к третьему входу рецептора, выход блока измерителя элементарной 60 площади подключен к второму входу ре.цептора, вь|ход которого подключен к второму входу блока памяти, который соединен с вторым входом анализатора, выход анализатора подключен к второ- 65 г у входу классификатора, выход генератора тактовой частоты подключен соответственно к первым входам блока измерителя элементарной площади, рецептора, блока памяти, анализатора и классификатора.

На фиг. 1 представлена функциональная схема устройства; на фиг. 2 временная диаграмма процесса дискретизации речевого сигнала.

Устройство содержит входную шину 1, динамический нормализатор 2 1 уровня, блок 3 измерителя элементарной площади распознаваемого сигнала, генератор 4 тактовой частоты, рецептор 5, блок б памяти, анализа" тор 7, классификатор 8, выходную шину 9.

Устройство для распознавания речевых сигналов работает следующим образом.

По входной шине 1 речевой сигнал поступает в динамический нормализатор 2 уровня, который нормирует его по уровню на квазистационарных участках в реальном масштабе времени.

Динамический нормализатор 2 уровня имеет два идентичных канала усиления, В одном канале осуществляется измерение максимального амплитудного значе- ния сигнала на интервале одного сегмента и вырабатывает сигнал управления ослаблением речевого сигнала во втором канале на интервале следующего сегмента. Динамический нормалиэатор 2 уровня формирует по второму выходу управляющий сигнал, подаваемый в рецептор 5 на третий вход. Генератор 4 тактовой частоты осуществляет синхронизацию устройства.

Нормированный по уровню униполярный, вынесенный в положительную область, речевой сигнал подается на вход блока 3 измерителя элементарной площади распознаваемого сигнала, логические нули и единицы с выхода которого поразрядно считываются по каждому импульсу тактовой частоты в шину данных (второй вход рецептора 5) как последовательный двоичный код исходного речевого сигнала. Рецептор 5 осуществляет поразрядный логический анализ (в реальном времени) последовательного двоичного кода, поступающего с выхода блока 3 измерителя элементарной площади распознаваемого сигнала (фиг. 2, ИС вЂ” исходный сигнал, ДС вЂ” дискредитизированный сигнал, Итч — импульсы тактовой частоты, Яоэлементарная площадь), и выделяет из него инвариантные признаки, представляющие собой детерминированные структуры двоичных элементов У, Х1, NI,ÂÓ.

Каждая такая структура существует (реализуется) во времени .на опреде- . ленном интервале. Время существования указанных структур является также инвариантным признакои и измеряется

1030840

° 1

8ИИИПИ Заказ 5219/51 . Тираж 382 . Подписное

Филиал ППП "Патент", r.Óæãîðîä,óë.Ïðoåêòíàÿ, 4 шагами дискретизации (1 mar = 1 импульсу тактовой частоты). Результаты анализа засылаются в блок б памяти.

При этом для каждого конкретного признака У, Х1, 81 или Ву используется.

: свой регистр и в него записывается . число, характеризующее временной интервал (время существования } соответствующего признака в текущем сегменте. Каждый такой сегмент в акте фонации реализуется на одном периоде частоты основного тона диктора и не превышает 10 мс. При нормальном темпе речи длительность гласных звуков составляет 200-300 мс, т ° е. каждый. гласный звук представляет последователь- 15 ность, состоящую 1 не менее чем из

20-30 сегментов одного тина. B качестве отличительного признака начала нового сегмента используется область

У. Память состоит из 10 модулей, каж- 2О дый из которых содержит один полный набор регистров У, Х1, N3. BY. Всяхий раз, .когда рецептор 5.обнаруживает новую область У, он засылает результаты анализа данного сегмента в очередной модуль, накапливая тем самым информацию о признаках сигнала.,Процесс накопления завершается либо при заполнении всех модулей памяти, либо по истечении 1 0 мс анализа. При вы.полнении хотя бы одного из названных условий процесс накопления информации завершается и рецептор 5 формирует строб разрешения работы анализатора 7.

Процедура анализа осуществляется в виде ряда последовательных операций проверки между двумя импульсами тактовой частоты. Анализ заключается в измерении длительности времени существования соответствующих -признаков

У, X1, Nl, ВУ. При этом дпя У и N1 выбираются максимальные значения этик признаков по множеству сегментов, накопленных в блоке б памяти sa один такт работы рецептора 5. Для Õ1 выбирается минимальное значеяие по множеству, а для ВУ - сумма значений ВУ в каждом сегменте, содержащемся и блок 6 памяти. после завершения процедуры анализа осуществляется классификация сигналов и блоке .8 кдасоификатора, который представляет собой специализированный дешифратор. На выходе дешифратора вырабатывается код распозн ан ного . звука .

Использование предлагаемого устройства для распознавания речевых сигналов позволяет пОвысить быстродействие и надежность распознавания.

Устройство для распознавания речевых сигналов Устройство для распознавания речевых сигналов Устройство для распознавания речевых сигналов 

 

Похожие патенты:

Изобретение относится к доступу и воспроизведению информации в компьютерной системе, а более конкретно к представлению данных на основе голосового ввода, осуществляемого пользователем

Изобретение относится к технике обработки речевых сигналов оптическими методами и может быть использовано при распознавании сигналов для сокращения избыточности речевого потока при его вводе в вычислительную систему, работающую в режиме обмена с оператором на естественном языке

Изобретение относится к области цифровой связи и технологиям обработки речи в условиях зашумления. Технический результат - повышение достоверности классификации сегментов зашумленной речи по типовым классификационным группам. В способе классификации сегментов зашумленной речи осуществляют полиспектральный анализ для частичного шумоподавления путем повышения адекватности Фурье-спектра сигнала, который восстанавливают из оценки биспектра обрабатываемого зашумленного речевого сигнала; далее на основе исходного речевого сигнала и нормализованного Фурье-спектра в каждом сегменте выделяют наличие/отсутствие классификационных признаков речевого сигнала и весовых коэффициентов, осуществляют их коррекцию с применением процедуры иерархии и на конечном этапе принимают решение по вопросу отнесения сегмента к типовым группам, по результатам сравнения осуществляют формирование последовательности символов, обозначающих типовые группы. 2 н. и 8 з.п. ф-лы, 7 ил.

Изобретение относится к области техники анализа речи, в частности к способу оценки мгновенной частоты в точках локального максимума речевых сигналов. Техническим результатом является уменьшение количества вычислений для оценки мгновенной частоты в точках локального экстремума. Вводят в память компьютера частоты стробирования f и амплитуды звукового сигнала либо посредством использования микрофона и стандартной программы ввода, либо посредством считывания файла звукового сигнала. Производят отыскание точек локального максимума амплитуды речевого сигнала. Производят вычисление величины , где n - позиция локального максимума. Выполняют подсчет мгновенной частоты в указанной точке по формуле w=ƒ*argcos(Val). Выводят позицию локального максимума и найденную оценку мгновенной частоты в формате n, w. 2 ил.

Изобретение относится к средствам для поиска в компьютерных системах и базах данных. Технический результат заключается в обеспечении возможности подбора музыкальной и текстовой информации друг к другу на основании их ритмических свойств. Способ включает индексацию текстовой информации, ввод запроса и поиск по индексу. Для индексации базы текстов, хранящихся в базе данных, с использованием системы поиска вычисляют ритмические характеристики текстов, а именно векторы, кодирующие ритмические свойства отдельных строк текста и всего текста в целом. Построение векторов системой поиска происходит в два этапа. На первом этапе строка сегментируется на слоги, после чего в строке автоматически проставляются ударения и на выходе первого этапа в строке текста расставлены границы слогов и для каждого из них указано, ударный это слог, безударный или система поиска не может однозначно определить его ударность. На втором этапе система поиска вычисляет вектор для каждой строки текста, после чего вычисляет агрегированный вектор для всего текста, который определяет ритмическую структуру этого текста. Агрегированный вектор сохраняют в хранилище векторов, поддерживающем функцию поиска ближайших соседей. Осуществляют ввод запроса в текстовом или псевдотекстовом виде для нахождения текстовых данных, подходящих звуковых данных. 2 н. и 3 з.п. ф-лы, 5 ил.

Устройство для распознавания речевых сигналов

Наверх