Способ обработки речевого сигнала

Авторы патента:

G10L15/08 - классификация речи или поиск (распознавание знаков G06K 9/00)

СПОСОБ ОБРАБОТКИ РЕЧЕВОГО СИГНАЛА, заключающийся в выделении периодов основного тона и cyvfMapHoro звуков л о аешпения на п&{жопе , отличающийся тем, что, с пепью повышения.аосговерностясегментапвв и иаентифвкаоии за счет повышения информативности параметров, выделяемых из речевого сигнала, в прецепах кажцсяо основного тона попоташтепьно. измеряют интенсивность максимальные амяпвтуцы положительной и отрицательной попуволн речевого сигнала и характеризуют его коэффипиеи тамикг.4. w Р 1 - 212-. и-Ащ. I, . Г р Р «Ч D-Jp интенсивность речевого casr гце ° нала на периоца осношюго J-тона; суммарное звуковое цавп 6ние за париоа основного тона: A - максимальная амплитуца положительной полуволны; - максимальная аъшлитуца Ж отрицательной полуволны.

СОЮЗ СОВЕТСНИХ

«к °

РЕСПУБЛИК (!9) (11) у 610 4 1/02

ГОСУДАРСТВЕННЫЙ НОМИТЕТ СССР

ПО ДЕЛАМ ИЗОБРЕТЕНИЙ И ОТНРЫТИЙ

ОПИСАНИЕ ИЗОБРЕТЕНИЯ к автсвсксмт свВВтвъствт в

1 вУ.ъ а 1 а (21) 3394265/18-10 (22) 09.02.82 (46) 07.07,83. Бюп. М 25 (72) А. П. Беликов и Н, В. Мупюкин(71) Московский r îcóïàpñòâåííûé пеаа гогический институт иностранных языков им. М. Тореза (53) 621.391.19 (088.8)

; (5В) 1. Авторское свицетепьство СССР

Ж 591908, кп. 5104 1/02, 1976.

2. Патент ClllA М 4060695, кл. G10L 1/00, 1977.

3. Авторское свицетепьство СССР

Ив 781884, кп. 510 Ь 1/02, 1979. (54) (57) СПОСОБ ОБРАБОТКИ РЕЧЕВОГО СИГНАЛА, заключающийся в выцелении периопов основного тона и суммарного звукового цавпения на периоде, отпичающийсятем, что, с цепью повышения.цостоверностисегментации и ицентифнкации за счет повышения информативности параметров, выпеваяемых из речевого сигнала, в пре цепах кажцого периоца основного тона цопопнитепьно измеряют интенсивность максимальные амппитуцы положительной и отрицательной нонуво н речевого сигнала и характеризуют его коэффициентами д +

К = вЂ” ;К= вЂ” К= вЂ” ", 2 Р

«Т 2 гце 3 = Р интенсивность речевжо сиг. нала на периоце основного

Т тона;

p щ) )ф- суммарное звуковое цавпео ние за nepsoa основного

ТОНИ

А+ максимальная амплитуца

М пояожитепьной цопувопны, А - максимальная амппитуца отрицательной попувопны.

1027761 . 2

g J ри- seeeeceeeoore peeeeoro с» нала на периоде основного тона; р дц ф суммарное звуковое цавление о за периоц основного тона.

На чертеже прецставлена блок-схема прецлвгаемого устройства.

Устройство соцержит выцелитель 1 основного тона линейный цетектор 2, 10 квацратичный цетектор 3, цвв пиковых цетектора 4 и 5, цва интегратора 6 s 7, блок 8 извлечения квацратного корня, три блока 9 - 11 целения.

Устройство работает слецующим об

1S разом.

Речевой сигнал прступает оцновреь менно на выцелитель 1 основного тона линейный цетектор 2 и квацратичный детектор 3, а также на пиковые ць20 текторы 4 и 5 отриштельной и положительной полуволн, которые управляются выцелнтелем 1 основного тона. Сиг налы с выхоцов цетекторов 2 и 3 поступают соответственно на интеграть2g ры 6 и 7, которые управляются выцелителем 1 основного тона, опрецеляющнм интервалы интегрирования. Сигнал с выхоца интегратора 6 поступает на вхоцы блоков 9 - 11 цепения. Сигнал с выхоца пикового цетектора 4 поступает на второй вхоц блока 10 целения, а с выхоца пикового цетектора 5 «на вто» рой вхоц блока 11 целения. С выхонии ца интегратора 7 сигнал поступает на вхоц блока 8 извлечения квацратного корня,с выхоца которого сигнал поступает на второй вхоц блока 9 целения. В результате на выхоце блоков 9 - 11 имеются сигналы прецставляющие речевой сигнал с учь40 том его формы и с высоким временным разрешением, равным периоду основного тонвн

Изобретение относится к речевой акустике и может быть использовано цля автоматической сегментации рече вого сигнала и ицентификапии личности по речи.

Известны способы анализа речевого сигнала, основанные на симметрии речевого сигнала. (1 ) .

Оцнвко цанные способы малоинфор матнвны, так квк они учитывают лишь оцин иэ параметров звуковой волны.

Известен также способ, в котором распознавание говорящего произвоцится

;по пиковым огибающим речевого сигна ла (2g °

Нецостатком известного способа яв» ляется произвольное квантование по вр мени и уровню.

Наиболее близким к прецлагаемому является способ, основанный на изме ренин периоцов основного тона и сум марного звукового цавления зэ этот периоц (3 ) .

Нецоствтком известного способа преобразования речевого сигнала являеп» ся отсутствие характеристик, отражаю щих форму речевого сигнала, что отрицательно влияет на цостоверность сегм талии и-инцентнфикапни.

Uemü изобретения - повышение цос товерн ости сегментации и ицентификации речевого сигнала.

Поставленная цель достигается тем что согласно способу обработки речевого сигнала, заключающемуся в выцеле периоцов основного тона и суммарного звукового цавления на периоце, цопопни тельно измеряют интенсивность, максимальные амплитуды положительной и отрицательной полуволк речевого сиги ла в прецелах кажцого периоцв основн тона и характеризуют речевой сигнал коэффициентами

)(. «Ave., Ayn где A - максимальная амплитуца оп 45

Wl рицательной полуволны1

Д+ максимальная амплитуда пой ложительной полуволны1

Ввецение указанных цополнительных операций нац речевым сигналом позволяет повысить цостоверность сегментации и ицентификации речевого сигнала.

Составитель Б. Поспелов

Рецактор П. Макаревич ТехрецМ.Гергель КорректорО. Тигор

Заказ 4746/55 . Тираж 382 Поцписное

ВНИИПИ Госуцарственного комитета СССР по цепам изобретений и открытий

113035, Москва, Ж-35, Рву цокая наб., ц. 4/S

Филиал ППП Патент, г. Ужгороц, ул, Проектная, 4

Способ обработки речевых сигналов // 781885

Синтезатор звуков // 681446

Устройство для распознавания речевого сигнала // 643960

Устройство для распознования команд // 585520

Устройство кодирования речевых сигналов // 559269

Устройство для передачи сигнала основного тона речи методом дельта-модуляции // 558412

Устройство коррекции ошибок выделения основного тона речи // 555546

Устройство для распознавания речи // 522512

Устройство для идентификации однократных временных сигналов // 511623

Дистанционное вокодирование по линии связи на большую дальность действия // 2147771

Представление данных на основе введенных пользователем данных // 2360281

Изобретение относится к доступу и воспроизведению информации в компьютерной системе, а более конкретно к представлению данных на основе голосового ввода, осуществляемого пользователем

Устройство для распознавания речевых сигналов // 1030840

Способ селекции признаков для распознавания речевых сигналов // 1037292

Устройство для автоматического распознавания фонем речевого сигнала // 1352523

Устройство для распознавания речевых сигналов // 1695376

Изобретение относится к технике обработки речевых сигналов оптическими методами и может быть использовано при распознавании сигналов для сокращения избыточности речевого потока при его вводе в вычислительную систему, работающую в режиме обмена с оператором на естественном языке

Способ и устройство классификации сегментов зашумленной речи с использованием полиспектрального анализа // 2606566

Изобретение относится к области цифровой связи и технологиям обработки речи в условиях зашумления. Технический результат - повышение достоверности классификации сегментов зашумленной речи по типовым классификационным группам. В способе классификации сегментов зашумленной речи осуществляют полиспектральный анализ для частичного шумоподавления путем повышения адекватности Фурье-спектра сигнала, который восстанавливают из оценки биспектра обрабатываемого зашумленного речевого сигнала; далее на основе исходного речевого сигнала и нормализованного Фурье-спектра в каждом сегменте выделяют наличие/отсутствие классификационных признаков речевого сигнала и весовых коэффициентов, осуществляют их коррекцию с применением процедуры иерархии и на конечном этапе принимают решение по вопросу отнесения сегмента к типовым группам, по результатам сравнения осуществляют формирование последовательности символов, обозначающих типовые группы. 2 н. и 8 з.п. ф-лы, 7 ил.

Способ оценки мгновенной частоты речевого сигнала в точках локального максимума // 2621647

Изобретение относится к области техники анализа речи, в частности к способу оценки мгновенной частоты в точках локального максимума речевых сигналов. Техническим результатом является уменьшение количества вычислений для оценки мгновенной частоты в точках локального экстремума. Вводят в память компьютера частоты стробирования f и амплитуды звукового сигнала либо посредством использования микрофона и стандартной программы ввода, либо посредством считывания файла звукового сигнала. Производят отыскание точек локального максимума амплитуды речевого сигнала. Производят вычисление величины , где n - позиция локального максимума. Выполняют подсчет мгновенной частоты в указанной точке по формуле w=ƒ*argcos(Val). Выводят позицию локального максимума и найденную оценку мгновенной частоты в формате n, w. 2 ил.

Алгоритм поиска в компьютерных системах и базах данных // 2648572

Изобретение относится к средствам для поиска в компьютерных системах и базах данных. Технический результат заключается в обеспечении возможности подбора музыкальной и текстовой информации друг к другу на основании их ритмических свойств. Способ включает индексацию текстовой информации, ввод запроса и поиск по индексу. Для индексации базы текстов, хранящихся в базе данных, с использованием системы поиска вычисляют ритмические характеристики текстов, а именно векторы, кодирующие ритмические свойства отдельных строк текста и всего текста в целом. Построение векторов системой поиска происходит в два этапа. На первом этапе строка сегментируется на слоги, после чего в строке автоматически проставляются ударения и на выходе первого этапа в строке текста расставлены границы слогов и для каждого из них указано, ударный это слог, безударный или система поиска не может однозначно определить его ударность. На втором этапе система поиска вычисляет вектор для каждой строки текста, после чего вычисляет агрегированный вектор для всего текста, который определяет ритмическую структуру этого текста. Агрегированный вектор сохраняют в хранилище векторов, поддерживающем функцию поиска ближайших соседей. Осуществляют ввод запроса в текстовом или псевдотекстовом виде для нахождения текстовых данных, подходящих звуковых данных. 2 н. и 3 з.п. ф-лы, 5 ил.