Устройство для автоматического распознавания фонем речевого сигнала

 

Изобретение отн9сится к устройствам для распознавания речевых образов . Цель изобретения - повышение точности распознавания фонем. Для определения числа нулевых пересечений период сигнала после прохождения фильтра 7 и триггера 8 формирует сигнал триггера 9, равный периоду основного тона. При воздействии этого сигнала счетчик 10 производит подсчет числа выходных импульсов с выхода триггера Шмитта I1. При помощи дешифратора 12 цифровые сигналы преобразуются в аналоговые, которые подаются на вход элемента И 13. При наличии обоих сигналов на выходе элемента И 1 3 его выходной сигнал свидетельствует о завершении процесса распознавания . 1 ил. 00 СП ГчЭ ел ГчЭ 00

СОЮЗ СОВЕТСКИХ

СОЦИАЛИСТИЧЕСКИХ

РЕСПУБЛИК

„„SU„„1352523 А1

151> 4 С 10 L 9/00, 9/02

ОПИСАНИЕ ИЗОБРЕТЕНИЯ

Н ABT0PGH0MV СВИДЕТЕЛЬСТВУ

ГОСУДАРСТВЕННЫЙ КОМИТЕТ СССР

ПО ДЕЛАМ ИЗОБРЕТЕНИЙ И ОТНРЫТИЙ (21) 3930596/24-10 (22) 18.07.85 (46) 15.11.87. Бюл. Ф 42 (71) Институт кибернетики АН ЭССР (72) Э.IO.Кюннап (53) 681.32(088.8) (56) Патент CUA N 3870817, кл. G 01 ? 1/00, опублик. 1975. (54) УСТРОЙСТВО ДЛЯ АВТОМАТИЧЕСКОГО

РАСПОЗНАВАНИЯ @ОНЕМ РЕЧЕВОГО СИГНАЛА (57) Изобретение относится к устройствам для распознавания речевых образов. Цель изобретения — повышение точности распознавания фонем. Для определения числа нулевых пересечений период сигнала после прохождения фильтра 7 и триггера 8 формирует сигнал триггера 9, равный периоду основного тона. При воздействии этого сигнала счетчик 10 производит подсчет числа выходных импульсов с выхода триггера Шмитта 11. При помощи дешифратора 12 цифровые сигналы преобразуются в аналоговые, которые подаются на вход элемента И 13. При наличии обоих сигналов на выходе элемента И 13 его выходной сигнал свидетельствует о завершении процесса распознавания. 1 ил.

Составитель А. Антипов

Редактор М. Андрушенко Техред Л.Олийнык Корректор С.Шекмар

Заказ 5569/50

Тираж 346 Подписное

ВНИИПИ Государственного комитета СССР по делам изобретений и открытий

113035, Москва, 11(-35, Раушская наб °, д. 4/5

Производственно-полиграфическое предприятие, r. Ужгород, ул. Проектная, 4

1 1352 2

Изобретение относитс я к технической кибернетике, в частности к устройствам для распознавания речевых образов, и может бь:ть использовано для управления голосом определенными объектами, Цель изобретения — повышение точности распознавания фонем.

На чертеже представлена блок †схема предлагаемого устройства. 10

Входной речевой сигнал через мик— рофон 1 и блок 2 нормализации амплитуд сигнала передается на фильтры 3, центральные частоты которых совпадают со средними частотами первых двух 15 формант, а диапазоны полос пропускания выбраны соответственно стандартньгм отклонениям формантных частот от их среднего значения при произнесении данной фонемы диктором. Порого- 20 вое значение огибающей для каждой форманты после прохождения через фильтр 3, выпрямитель 4 и интегратор

5 оценивается в компараторе 6 таким образом, что величина средней амплитуды выходного сигнала соответствующего фильтра 3 всегда превышает это значение. В этом случае на выходе компаратора б появляется сигнал "1", Для определения числа нулевых пе — 30 ресечений период сигнала после прохождения фильтра 7 (до 90 Гц) и триггера 8 формирует сигнал триггера 9, равный периоду основного тона. При воздействии этого сигнала декадный счетчик 10 производит подсчет числа выходных импульсов с выхода второго триггера Шмитта 11. При низком уровне сигнала триггера 9 счетчик пребывает в ожидании. Пределы числа нуле- 10 вых пересечений в течение периода основного тона устанавливаются при по3 2 моши двух выx(.äîâ счетчика 10 )l?IH каждой фонемьг в отдельности. 11ри помощи деиц фратора 12 цифровые сигналы преобразуются и аналоговые, которые подаются на третий вход элемента И

13. При наличии обоих сигналов на выходе элемента И 13 его выходной сигнал свидетельствует о завершении процесса распознавания. формулаизобретения

Устройство для автоматического распознавания фонем речевого сигнала, содержащее микрофон, соединенный через блок нормализации амплитуд сигнала с входами полосовых фильтров, выходы которых подключены к входам вы— прямителей, триггеры, компараторы, элементы И, о т л и ч а ю щ е е с я тем, что, с целью повышения точности распознавания фонем, полосовые фильтры выполнены в виде фильтров формантных частот и в каждый из К (К вЂ” число фонем) каналов введены интеграторы, фильтр низких частот, первый и второй триггеры Шмитта, декадный счетчик и счетчик †дешифрат, причем в каждом канале выходы двух фильтров формантных частот соединены по двум параллельным цепям через соответствующие выпрямители, интеграторы и компараторы с первым и вторым входами элемента И, к третьему входу которого через фильтр низких частот, пер— вый триггер Шмитта, триггер, декад— ный счетчик и счетчик-дешифратор подключен блок нормализации амплитуд сигнала, выход которого через второй триггер Шмитта соединен с управляющим входом декадного счетчика, а выход элемента И каждого канала является одной из выходных шин устройства.

Устройство для автоматического распознавания фонем речевого сигнала Устройство для автоматического распознавания фонем речевого сигнала 

 

Похожие патенты:

Изобретение относится к доступу и воспроизведению информации в компьютерной системе, а более конкретно к представлению данных на основе голосового ввода, осуществляемого пользователем

Изобретение относится к технике обработки речевых сигналов оптическими методами и может быть использовано при распознавании сигналов для сокращения избыточности речевого потока при его вводе в вычислительную систему, работающую в режиме обмена с оператором на естественном языке

Изобретение относится к области цифровой связи и технологиям обработки речи в условиях зашумления. Технический результат - повышение достоверности классификации сегментов зашумленной речи по типовым классификационным группам. В способе классификации сегментов зашумленной речи осуществляют полиспектральный анализ для частичного шумоподавления путем повышения адекватности Фурье-спектра сигнала, который восстанавливают из оценки биспектра обрабатываемого зашумленного речевого сигнала; далее на основе исходного речевого сигнала и нормализованного Фурье-спектра в каждом сегменте выделяют наличие/отсутствие классификационных признаков речевого сигнала и весовых коэффициентов, осуществляют их коррекцию с применением процедуры иерархии и на конечном этапе принимают решение по вопросу отнесения сегмента к типовым группам, по результатам сравнения осуществляют формирование последовательности символов, обозначающих типовые группы. 2 н. и 8 з.п. ф-лы, 7 ил.

Изобретение относится к области техники анализа речи, в частности к способу оценки мгновенной частоты в точках локального максимума речевых сигналов. Техническим результатом является уменьшение количества вычислений для оценки мгновенной частоты в точках локального экстремума. Вводят в память компьютера частоты стробирования f и амплитуды звукового сигнала либо посредством использования микрофона и стандартной программы ввода, либо посредством считывания файла звукового сигнала. Производят отыскание точек локального максимума амплитуды речевого сигнала. Производят вычисление величины , где n - позиция локального максимума. Выполняют подсчет мгновенной частоты в указанной точке по формуле w=ƒ*argcos(Val). Выводят позицию локального максимума и найденную оценку мгновенной частоты в формате n, w. 2 ил.

Изобретение относится к средствам для поиска в компьютерных системах и базах данных. Технический результат заключается в обеспечении возможности подбора музыкальной и текстовой информации друг к другу на основании их ритмических свойств. Способ включает индексацию текстовой информации, ввод запроса и поиск по индексу. Для индексации базы текстов, хранящихся в базе данных, с использованием системы поиска вычисляют ритмические характеристики текстов, а именно векторы, кодирующие ритмические свойства отдельных строк текста и всего текста в целом. Построение векторов системой поиска происходит в два этапа. На первом этапе строка сегментируется на слоги, после чего в строке автоматически проставляются ударения и на выходе первого этапа в строке текста расставлены границы слогов и для каждого из них указано, ударный это слог, безударный или система поиска не может однозначно определить его ударность. На втором этапе система поиска вычисляет вектор для каждой строки текста, после чего вычисляет агрегированный вектор для всего текста, который определяет ритмическую структуру этого текста. Агрегированный вектор сохраняют в хранилище векторов, поддерживающем функцию поиска ближайших соседей. Осуществляют ввод запроса в текстовом или псевдотекстовом виде для нахождения текстовых данных, подходящих звуковых данных. 2 н. и 3 з.п. ф-лы, 5 ил.
Наверх