Способ разделения речевых и нестационарных шумовых сигналов

 

Изобретение относится к измерительной технике и может быть использовано при создании устройств для анализа сигналов сложной формы. Цель: повышение помехоустойчивости разделения речевых и нестационарных шумовых сигналов. Сущность изобретения: способ состоит в усилении анализируемого сигнала, его низкочастотной фильтрации, определении значений числа нулевых переходов полученного сигнала с последующим сравнением их с пороговой величиной, по результатам которого идентифицируют речевые и нестационарные шумовые сигналы, причем после низкочастотной фильтрации сигнала в его выборке выделяют участки с наибольшей интенсивностью, для которых и определяют значения числа нулевых переходов. 2 ил.

СОЮЗ СОВЕТСКИХ

СОЦИАЛИСТИЧЕСКИХ

РЕСПУБЛИК (s»s G 10 L 5/00, 7/00

ГОСУДАРСТВЕННЫЙ КОМИТЕТ

ПО ИЗОБРЕТЕНИЯМ И ОТКРЫТИЯМ

ПРИ ГКНТ СССР

ОПИСАНИЕ ИЗОБРЕТЕНИЯ

К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ (21) 4870056/10 (22) 27.09.90 (46) 15.12,92. Бюл. N 46 (71) Ленинградский научно-исследовательский институт "Вектор" (72) А.П.Молчанов, Л.Н,Бабкина и Б,Г,Денисон (56) Патент США

3Ф 4027102, кл. Н 04 М 3/22, 1977.

Патент ФРГ

N 3236,000, кл. G 101 1/08, 1984. (54) СПОСОБ РАЗДЕЛЕНИЯ РЕЧЕВЫХ И

НЕСТАЦИОНАРНЫХ ШУМОВЫХ СИГНАЛОВ (57) Изобретение относится к измерительной технике и может быть использовано при

Изобретение относится к измерительной технике и может быть использовано при создании устройств для анализа сигналов сложной формы, применяемых в технике связи, акустике, в системах распознавания речевых и иных сигналов.

Известен способ распознавания речевых сигналов в телефонной линии по оценке наличия в них пауз характерной длительности, Недостатком такого способа является необходимость использования достаточно длительной выборки анализируемого сигнала не менее нескольких десятков секунд для выявления и определения распределения длительностей, встречающихся в нем пауз.

Наиболее близким к заявленному способу разделения сигналов на речевые и неречевые является известный способ классификации речевых сигналов, в котором предусматривается усиление анализируемого сигнала, фильтрация его через НЧ

БЫ, 1781701 А1 создании устройств для анализа сигналов сложной формы. Цель: повышение помехоустойчивости разделения речевых и нестационарных шумовых сигналов. Сущность изобретения: способ состоит в усилении анализируемого сигнала, его низкочастотной фильтрации, определении значений числа нулевых переходов полученного сигнала с последующим сравнением их с пороговой величиной, по результатам которого идентифицируют речевые и нестационарные шумовые сигналы, причем после низкочастотной фильтрации сигнала в его выборке выделяют участки с наибольшей интенсивностью, для которых и определяют значения числа нулевых переходов. 2 ил.. фильтр с частотой среза 3 кГц, ограничение по амплитуде и цифровое кодирование с д. последующим сравнением нулевых переходов в анализируемом сигнале с заданным значением, определенным для сигналов других типов. Для реализации способа создано устройство, содержащее последовательно соединенные усилитель, фильтр, С ограничитель. АЦП с компараторами. Ограничитель описанного устройства выполнен на двух встречно включенных диодах.

Недостатком вышеописанного способа является его низкая помехоустойчивость по отношению к помехам типа белого шума.

Проведенные исследования показали, что разделение речевых сигналов и сигналов типа нестационарного шума с помощью описанного выше способа идет эффективно лишь в том случае, если отношение сигнал/шум для речевого сигнала не менее 10.

Уже при отношении сигнал/шум менее 8

1781701 наблюдается существенное ухудшение вероятности правильной классификации.

Целью изобретения является повышение помехоустойчивости разделения речевых и нестационарных шумовых сигналов, Для достижения поставленной цели в способе разделения речевых и нестационарных шумовых сигналов, заключающемся в усилении анализйруемого сигнала, его низкочастотной фильтрации, определении значений числа Ъулевых переходов полученйого сигнала с йоследующим сравнением их с пороговой величиной, по результатам которого идентифицируют речевые и нестационарные шумовые сигналы, после низкочастотной фильтрации анализируемого сигнала в его выборке выделяют участки с наибольшей интенсивностью, для которых определяют значение числа нулевых переходов.

Значение числа переходов анализируемого сигнала через ноль, определенное только для его участков с наибольшей энергией в случае речевого сигнала, в меньшей степени зависит от отношения сигнал/шум, чем значение числа переходов через ноль, определенное для всей выборки речевого сигнала, В то же время для нестационарных шумовых сйгналов зна- ения числа переходов через ноль как для всей выборки, так и для ее участков с наибольшей энергией близки друг к другу и мало зависят от отношения сигнал/шум. Таким образом, в предлагаемом способе отличие в значениях числа переходов разделяемых сигналов через ноль оказывается менее зависимым от отношения сигнал/шум, т.е, более помехоустойчивым, в чем и состоит полезность предлагаемого способа.

На фиг.1 изображена функциональная схема, реализующая предлагаемый способ разделения речевых и нестационарных шумовых сигналов; на фиг.2 — гистограммы значений чисел перехода речевых сигналов (пунктир) и нестационарных шумовых сигналов (сплошная линия) через ноль, определенных для всей выборки сигналов (а,б) и для наибольших элементов в выборках сигналов (в.г) при различных отношениях сигнал/шум: (а,в) — отношении сигнал/шум 10, (б,г) — сигнал/шум 5.

На фиг.1 использованы следующие обозначения: 1 — источник си налою; 2— усилитель; 3 — фильтр низких частот; 4— выделитель элементов выборки сигнала; 5— определитель числа переходов через ноль для элементов выборки сигналов; 6 — определитель энергии элементов выборки сигнала; 7 — блок запоминания значений числа переходов через ноль для элементов выборки сигнала и их энергией; 8 — выделитель элементов в выборках сигнала, имеющих наибольшую энергию (интенсивность); 95 определитель средней частоты переходов через ноль для выделенных элементов выборки сигнала; 10 — блок сравнения; 11— источник порогового значения.

По предлагаемому способу сигнал

10 после усиления и фильтрации Делят на элементы, для каждого из которых определяют число переходов через ноль и энергию. Полученные данные запоминают для . всех элементов, входящих в выборку анали15 зируемого сигнала. После чего определяют среднюю частоту перехода через ноль для элементов, имеющих наибольшую энергию

1 (например, превышающую д от значения

20 максимальной энергии элемента в данной выборке). Полученнбе значение средней частоты перехода через ноль сравнивают с пороговым значением, на основании чего и производят разделение речевых и шумовых

25 нестационарных сигналов, Функциональная схема на фиг.1, реализующая предлагаемый способ, включает в себя источник сигнала 1, усилитель 2, фильтр 3, выделитель элементов выборки

30 сигнала 4, определитель числа переходов сигнала через ноль для элемента выборки сигнала 5. определитель энергии элемента выборки сигнала б, Блок запоминания значений числа переходов через ноль и энергий

35 элементов, входящих в выборку сигнала 7, выделиталь элементов с наибольшей энергией 8, определитель значения средней частоты перехода через ноль для элементов с наибольшей энергией 9, схема сравнения

40 10, источник порогового значения 11..

Выполнение описанных выше операций в функциональной схеме, изображенной на фиг.1, обеспечивается тем, что выход источника сигнала 1, соединен со входом усили45 теля 2, выход которого соединен со входом фильтра 3, выход которого соединен со входом выделителя элементов выборки сигнала

4, один из выходов которого соединен со входом определителя числа переходов че50 рез ноль для элемента выборки сигнала 5, выход которого соединен со входом блока запоминания 7, другой вход которого соединен с выходом определителя энергии элемента выборки сигнала 6, один вход

55 которого соединен са вторым выходом выделителя элементов выборки сигнала 4, а второй вход соединен с выходом фильтра 3, причем выход блока запоминания 7 соединен со входом выделителя элементов с наибольшей энергией (интенсивность о) 8, 1781701 выход которого соединен с определителем средней частоты перехода через ноль для выделенных элементов выборки сигнала 9, выход которого соединен со входом схемы сравнения 10, другой вход которой соединен с выходом источника порогового значения 11, а выход схемы сравнения 10 является выход всей схемы.

Практическая реализация узлов, входящих в функциональную схему, изображенную на фиг,1, может быть выполнена на серийно выпускаемых элементах.

Так усилитель 2 и фильтр низкйх частот

3, выполня отся на операционных усилителях по типовым схемам (например, на микросхемах типа 140 IVD2A и 140 ИЭ4).

Выделитель элемейтов выборкй сигнала 4 может быть реализован в соответствии со схемой сегментатора, описанной в авторском свидетельстве N. 485565, B простейшем случае в качестве выделителя элементов выборки сигнала 4 мо>кет использоваться ключевая схема, уп равляемая интеграл ьн ым и рограммируемым (например, 580 ВИ 53) или непрограммируемым (например, 1006 ВИ1) таймером с периодом порядка 10 мс.

Определитель числа переходов через ноль для элементов выборки сигналов 5 может быть реализован на интегральных компараторе и счетчике (например, на микросхемах 597СА3А и 561 ИЕ10). Определитель энергии элементов выборки сигнала 6 в простейшем случае может быть образован последовательно включенными двухполупериодным измерительным выпрямителем, интегратором, схемой выборки хранения и аналого-цифровым преобразователем, управляемым узлом 4. Эти компоненты могут строиться на микросхемах 140УД20, 544УД1А, 590КН12, 1100СК2Б. 1113ПВ1А и логических схемах малой интеграции.

Дальнейшую обработку целесообразно вести средствами микропроцессорного контроллера, имеющего оперативную память достаточной емкости, выполняющей функции блока 7 запоминания значений числа переходов через ноль и энергии для элементов выборки сигнала, Выделитель элементов с наибольшей энергией 8 реализуется программно. Он осуществляет операцию выбора наибольшего значения энергии (интенсивности) . Emax элемента из запомненных в блоке па-. мяти и определяет номера тех элементов, значения энергии интенсивности которых

Emax превышают величину —, где N — заранее заданная величина (например, 2).

10

40 взрывных, фрикативных, дрожащих звуках

В контроллере, выполняющем указанную операцию, может использоваться микропроцессорный комплект серии 580 с микросхемами памяти серии 537. Определитель средней частоты переходов через ноль для выделенных элементов выборки сигнала 9 выполняется с помощью того же контроллера.

Значения частот переходов через ноль для выделенных элементов складываются и полученная величина делится на число выделенных элементов.

Схема сравнения 10 реализуется программно средствами типового контроллера, выполняющего операцию вычитания двух чисел, занесенных в блок памяти.

В качестве источника порогового значения 11, используется блок памяти, в заданной ячейке которого записано значение пороговой величины, определенное на основе анализа обучающих выборок разделяемых классов сигналов.

В целом функции, выполняемые совокупйостью"узлов 7, 8, 9, 10, 11, могут быть полностью реализованы с помощью малых универсальных ЭВМ типа "Электроника60М", СМ1425, ЕС1841 и т.п.

Для анализа причин, обуславливающих недостаточную помехоустойчивость существующих способов разделения речевых и нестационарных шумовых сигналов по частоте перехода через ноль, рассмотрим особенности временных структур разделяемых сигналов.

Основной особенностью структуры речевых сигналов являются микропаузы

Наличие в речи микропауз обусловлено самой природой процесса формирования звуков речи. Так наличие прерываний во создает микропаузы даже в намеренно непрерывной речи, К таким микропаузам прибавляются паузы между словами, интонационные паузы и т.п. .. -.В целом вероятностное распределение пауз в непрерывной речи описывается распределением Вайбулла. Таким образом, в выборке из речевого сигнала длительностью в 0,5 с суммарное время пауз составит около 250 мс.

Частота перехода через ноль у чистого речевого сигнала в основном обусловлена частотой перехода на участках гласных звуков, которые занимают основное время в течении звучания речи. Характерные значения частоты перехода через ноль для гласных звуков гораздо ниже тактовых для нестационарного шума, что и позволяет по этому признаку разделять эти два класса сигналов.

1781701 l0

20

40

В то же время появление шумовой помехи в речевом сигнале на участках гласных мало влияет на частоту перехода через ноль.

Однако на участках пауз,шум обеспечивает резкое возрастание частоты переходов через ноль, что влияет на общее значение этого параметра, определенного по всей выборке анализируемого речевого сигнала.

В то же время у шумового нестационарного сигнала паузы практически отсутствуют и, следовательно, наличие шумовой помехи у сигналов такого класса должно мало влиять на среднее значение частоты перехода через. ноль.

Для проверки эффективности предлагаемого способа разделения речевых и нестационарных шумовых сигналов был разработан и испытан макет, реализующий функциональную схему, изобра>кенную на фиг.1.

В качестве источника сигнала использо.вались: магнитофон "Электроника-004" (для речевых сигналов) и генераторы Г2 — 57 SG

201 и ГЗ-101 (для шумовых сигналов);

Формирование смеси сигнала с шумом осуществлялось сумматорами на операциойных усилителях типа 140УД7.

В качестве речевого сигнала использовалась повествовательная речь на различных языках. Длительность записей составляла не менее 3-х мин каждая. Всего было использовано при экспериментах 25 записей различных дикторов, При построении гистограмм использовалось не менее

100 выборок каждого сигнала. Длительность анализируемой выборки сигнала составляла менее 0,5 с. В качестве фильтра использовался активный PC фильтра Бесселя низких частот 10 порядка с частотой среза 4 кГц.

Фильтр реализован на операционных усилителях 140УД7.

Выделение элементов выборки сигнала осуществлялось с помощью тактового генератора (Г5-60), Длительность элемента составляла 10 мс, Всего в выборке использовалось 32 элемента.

Определитель энергии элемента сигнала реализовывался с помощью интегратора, собранного на операционном усилителе типа 544УД1А со схемой сброса на ключах

590КН5, срабатывающей от импульсов тактового генератора после задержки необходимой для записи сигнала интегратора схемой выборки-хранения 1100 СК2. Преобразование сигнала с выхода этой схемы в код производилось с помощью АЦП типа

1113П В1А. Определитель частоты перехода через ноль для элемента сигнала реализовывался с помощью микросхем типа

597САЗ и 133ИЕ5, Код числа переходов через ноль и код с выхода АЦП в конце каждого элемента считывались через интерфейс ЭВМ по команде от тактового генератора.

Блоки 7,8,9,10,11, а также алгоритмы управления экспериментом были реализованы средствами ЭВМ "Электроника-60", программы управления считыванием данных, их накопления и предоставления результатов разрабатывались и отлаживались средствами операционной системы РАФОС на комплекс "Электроника-В", дополненном накопителем на гибких магнитных дисках ГМД 70.

На фиг.2 представлены гистограммы, характеризующие эффективность существующего и предлагаемого способов разделения речевых и шумовых нестационарных сигналов.

На фиг.2(а,б), представлены числа переходов через ноль, определенных по существующему способу, т.е, для всей выборки сигналов для речевых (пунктирная линия) и шумовых нестационарных сигналов (сплошная линия) при отсутствии помех (фиг.2а— отношение сигнал/шум больше 10) и при их наличии (фиг.2б — отношение сигнал/шум равно 5).

Сопоставление гистограмм, изображенных на фиг.2(а и б), показывает; что в то время как для чистых сигналов оба класса по частоте переходов через ноль, определенной по существующему способу, хорошо разделяются, появление даже незначительной помехи резко ухудшает разделение сигналов. Так для отношения сигнал/шум, равного 5, вероятность ошибки разделения составляет 357;.

Характерна, что появление шумовой помехи мало влияет на характер гистограммы для нестационарного шума и ухудшение разделения сигналов идет за счет деформации шумовой помехой гистограмма для речевого сигнала.

Рассмотрение аналогичных гистограмм, приведенных на фиг.2в, 2г для значений частоты переходов через ноль, определенных по предлагаемому способу, показывает и значительно большую помехоустойчивость.

Из фиг.2(в, r) следует, что процесс разделения по предлагаемому способу для шумовых и речевых нестационарных сигналов при соотношении сигнал/шум, равном 5, происходит с вероятностью ошибки не хуже 6 .

Таким образом, экспериментально подтверждено, что предлагаемый способ обес1781701

10 печивает увеличение помехоустойчивости разделения речевых и шумовых нестационарных сигналов не менее, чем в 5 раз по сравнению с существующим способом, что и определяет его полезность.

Формула изобретения

Способ разделения речевых и нестационарных шумовых сигналов, заключающийся в усилении анализируемого сигнала, его низкочастотной фильтрации, определении значений числа нулевых переходов полученного сигнала с последующим сравнением их с пороговой величиной, по результатам которого идентифицируют речевые и нестационарные шумовые сигналы, о т л и ч а ю- .

5 шийся тем, что, с целью повышения помехоустойчивости разделения, после низкочастотной фильтрации анализируемого сигнала в его выборке определяют участки с наибольшей интенсивностью, для

10 которых определяют значения числа нулевых переходов.

1781701

l (L

pi гч г LJ !.д Ь!

Редактор

Заказ 4276 Тираж Подписное

ВНИИПИ Государственного комитета по изобретениям и открытиям при ГКНТ СССР

113035, Москва, Ж-35, Раушская наб., 4/5

Производственно-издательский комбинат "Патент", г, Ужгород, ул.Гагарина, 101

t5

М

С

< -о !О .р

5 Р с: с!.

2 о

О з

М $ и. с и и

> з

O 3Î

50 с . 320 =с о се (5

Ю а tO

Ю м д- v с н

25 о «4

С Ъ

5 !О f 20 25 30 35 гО т

l г" ">

t !

I .

I ! г 1

I ! ! 4

l

1

l — —.3-С вЂ” — Г

5 !О Ю 2о 25 30 35 . 00 (иалд перехОдой через но!6 фи2. 2

Составитель А.Молчанов

Техред М.Моргентал . Корректор Н.Бучок

Способ разделения речевых и нестационарных шумовых сигналов Способ разделения речевых и нестационарных шумовых сигналов Способ разделения речевых и нестационарных шумовых сигналов Способ разделения речевых и нестационарных шумовых сигналов Способ разделения речевых и нестационарных шумовых сигналов Способ разделения речевых и нестационарных шумовых сигналов 

 

Похожие патенты:

Изобретение относится к технике передачи информации и может быть использовано в системах телефонной связи для повышения точности анализа параметров речевого сигнала

Изобретение относится к акустике, в частности к способам распознавания речевых сигналов

Изобретение относится к приборостроению

Изобретение относится к приборостроению

Изобретение относится к области автоматики и вычислительной техники и может быть использовано для ввода речевых команд в управляющую вычислительную машину

Изобретение относится к приборостроению и может быть использовано в акустике , например, при анализе и синтезе звуковой информации

Изобретение относится к технике анализа и распознавания речевых сигналов и может быть использовано в управляющих, информационно-расчетных и справочных системах в условиях меняющейся окружающей шумовой обстановки, Цель изобретения - повышение помехоустойчивости при определении границ слов путем осуществления автоматической корректировки значений используемых временных параметров в зависимости от характера изменения уровня окружающих нестационарных шумов

Изобретение относится к звукотехнике и позволяет воссоздать качество звучания фонограмм , записанных с нелинейными искажениями с подъемом верхних частот речевого спектра

Изобретение относится к автоматике и вычислительной технике и может быть использовано в системах понимания речи, системах управления технологическим оборудованием, работами, средствами вычислительной техники, автоматического речевого перевода, в справочных системах и др

Изобретение относится к системам обработки информации и управления, а именно к способам построения систем распознавания речи

Изобретение относится к автоматике и вычислительной технике и может быть использовано в системах понимания речи, системах управления технологическим оборудованием, роботами, средствами вычислительной техники, автоматического речевого перевода, в справочных системах и др

Изобретение относится к области приборостроения, в частности, к устройствам преобразования речевых сигналов, а более конкретно, к синтезаторам речевых сообщений, и может быть использовано в авиационной технике, телефонии, системах связи и оповещения, вычислительной технике

Изобретение относится к технике связи и вычислительной технике

Изобретение относится к технике электросвязи, в частности к области передачи в паузах речи других видов информации через телефонный тракт с вокодерами

Изобретение относится к анализу речи, в частности при распознавании больших словарей в приложениях типа автоматической пишущей машинки

Изобретение относится к области приборостроения и может быть использовано в медицине для оценки лечения больных с патологией речи

Изобретение относится к технике цифровой обработки речи и может быть использовано в различных приложениях, таких, как системы речевого общения человека с ЭВМ, автоматическая коммутация в телефонной сети голосом абонента, медицинские исследования патологий речеобразующего тракта пациентов и других
Наверх