Способ обнаружения и коррекции аномальных цифровых ошибок при передаче речи методом импульсно-кодовой модуляции

Авторы патента:

G10L19/02 - с использованием спектрального анализа, например преобразовательные вокодеры, вокодеры с поддиапазонами

Изобретение относится к технике цифровой обработки речевых сигналов, передаваемых по линиям связи методом импульсно-кодовой модуляции (ИКМ) , и может быть использовано для повышения помехозащищенности многоканальных систем передачи цифровой телефонии. Исправление аномальных цифровых ошибок позволяет снизить требования к помехозащищенности линий связи, использовать более дешевый кабель, либо увеличить длину участков регенерации, либо повысить относительное число уплотняемых пар в кабеле системами с ИКМ при сохранении неизменным субъективного восприятия качества речи. Техническим результатом предлагаемого изобретения является повышение качества приема речевых сигналов, передаваемых цифровым методом с помощью ИКМ по линиям связи с невысокой помехозащищенностью. Сущность предлагаемого способа обнаружения и коррекции аномальных цифровых ошибок при передаче речи методом импульсно-кодовой модуляции заключается в отслеживании идущих друг за другом повышенных сдвоенных (разного знака) "скачков" уровня первой производной речевого сигнала на основе запоминания предшествующего данному отрезка речевого сигнала, измерения среднего модуля первой производной сигнала на протяжении этого отрезка путем накопления модулей разности двух соседних ИКМ-отсчетов сигнала и установке двух одинаковых адаптивных порогов разного знака, пропорциональных среднему модулю первой производной, превышение которых подряд двумя текущими разностями соседних ИКМ-отсчетов сигнала позволяет обнаружить кодовую комбинацию, содержащую аномальную цифровую ошибку, коррекция которой заключается в поочередной инверсии одного из двух старших разрядов ИКМ-кода до тех пор, пока не будут устранены сдвоенные "скачки" первой производной. 1 ил.

Предлагаемое изобретение относится к технике цифровой обработки речевых сигналов, передаваемых по линиям связи методом импульсно-кодовой модуляции (ИКМ) и может быть использовано для повышения помехозащищенности многоканальных систем передачи цифровой телефонии.

Известен /2/ способ обнаружения цифровых ошибок (ложных импульсов) в составе комбинаций ИКМ-кода, основанный на передаче по линии связи биполярного квазитроичного кода (кода с ЧПИ-чередованием полярностей импульсов). Нарушение биполярности импульсной последовательности в линии связи свидетельствует о наличии цифровой ошибки.

Недостатком этого способа является несовершенство самого кода с ЧПИ, в составе которого могут встречаться импульсные последовательности с числом следующих подряд пробелов более трех, что может привести к нарушению тактовой синхронизации в системе связи.

Наиболее близким техническим решением (прототипом) можно считать способ /1/ обнаружения цифровых ошибок (ложных импульсов) в составе комбинаций ИКМ-кода, основанный на передаче по линии связи более совершенного квазитроичного кода (кода с МЧПИ-чередованием полярностей импульсов, в котором предусмотрены нарушения биполярности в виде вставок пар импульсов одной полярности). Нарушения биполярности кода МЧПИ чередуются по полярности, благодаря чему удается обнаруживать ошибки в цифровом сигнале по нарушениям этого чередования.

Недостатком данного способа обнаружения цифровых ошибок является невозможность на его основе исправлять ложные импульсы из-за малой избыточности квазитроичного кода с МЧПИ.

Присутствие цифровых ошибок вызывает на приемной стороне так называемый шум ложных импульсов, снижающий качество цифровой телефонной связи. Особенно опасны /1, 2/ аномальные цифровые ошибки, связанные с трансформациями двух старших разрядов нелинейного ИКМ-кода. Эти ошибки сопровождаются на стороне приема неприятными для абонентов импульсными помехами типа "щелчков", резко ухудшающими качество воспроизведения речи. Нормирование аномальных ошибок (на уровне не более одного "щелчка" в минуту) предъявляет повышенные требования к качеству линий связи, предназначенных для передачи речи методом ИКМ (допустимая вероятность ошибки на один регенерационный участок не должна превышать величины P_ош= 10^-6).

Исправление аномальных цифровых ошибок позволит снизить требования к помехозащищенности линий связи, использовать более дешевый кабель, либо увеличить длину участков регенерации, либо повысить относительное число уплотняемых пар в кабеле системами с ИКМ при сохранении неизменным субъективного восприятия качества речи.

Техническим результатом предлагаемого изобретения является повышение качества приема речевых сигналов, передаваемых цифровым методом с помощью ИКМ по линиям связи с невысокой помехозащищенностью.

Сущность предлагаемого способа обнаружения и коррекции аномальных цифровых ошибок при передаче речи методом ИКМ заключается в отслеживании идущих друг за другом повышенных сдвоенных (разного знака) "скачков" уровня первой производной речевого сигнала на основе запоминания предшествующего данному отрезка речевого сигнала, измерения среднего модуля первой производной сигнала на протяжении этого отрезка путем накопления модулей разности двух соседних ИКМ-отсчетов сигнала и установке двух одинаковых адаптивных порогов разного знака, пропорциональных среднему модулю первой производной, превышение которых подряд двумя текущими разностями соседних ИКМ-отсчетов сигнала позволяет обнаружить кодовую комбинацию, содержащую аномальную цифровую ошибку, коррекция которой заключается в поочередной инверсии одного из двух старших разрядов ИКМ-кода до тех пор, пока не будут устранены сдвоенные " скачки " первой производной.

На фиг. 1 (а-г) представлены временные диаграммы обработки сигнала, иллюстрирующие предложенный способ обнаружения и коррекции аномальных цифровых ошибок при передаче речи методом ИКМ.

На фиг. 1а изображена исходная передаваемая последовательность отсчетов речевого сигнала, а на фиг. 1б - искаженная принятая последовательность отсчетов речевого сигнала из-за ошибочного приема старшего (знакового) разряда ИКМ-кода одного из отсчетов. Трансформация знака отсчета привела в данном случае к появлению импульсной помехи значительного уровня, воспринимаемой на слух, как неприятный щелчок.

Паузе в сигнале (" режиму молчания ") на фиг. 1а соответствует появление щелчка на фиг. 1б из-за искажения второго разряда ИКМ-кода (старшего разряда модуля отсчета сигнала).

Таким образом, аномальные цифровые ошибки (в двух старших разрядах кода) приводят к существенным импульсным помехам как в режиме разговора, так и в паузах речи. Исследования /2/ показали, что искажения остальных шести младших разрядов нелинейного ИКМ-кода не вызывают импульсных помех типа щелчков, а воспринимаются как сравнительно небольшой шум, мешающее действие которого значительно слабее. Следовательно, устранение аномальных цифровых ошибок приведет к заметному повышению качества восприятия речи при цифровой передаче.

На фиг. 1в показан график первой производной речевого сигнала, пропорциональной разности двух соседних отсчетов. Как видно из рисунка, аномальная ошибка сопровождается двумя скачками первой производной сигнала разного знака, следующими один за другим. В отсутствии подобных ошибок сдвоенных скачков первой производной повышенного уровня в естественной речи не наблюдается. Это объясняется сильными корреляционными связями между соседними отсчетами речевого сигнала. Согласно /2/ такие связи охватывают до десяти идущих подряд отсчетов, поскольку речь имеет большую избыточность. Энергетический спектр речевого сигнала резко неравномерен, имеет подъем в области частот (400-500) Гц и быстрый спад (со скоростью в среднем 9 дБ на октаву) в диапазоне частот (500 - 4000) Гц. Поскольку частота следования отсчетов сигнала при ИКМ f_д = 8 кГц существенно выше области частот, в которой сосредоточена основная энергия речи, сигнал изменяется сравнительно медленно и за время действия двух соседних отсчетов изменения в среднем незначительны. Другими словами, больших уровней первой производной в речевом сигнале не ожидается. Исследования на реальной речи показывают, что средний модуль производной речевого сигнала для мужских голосов в 4-5 раз, а для женских и детских голосов в 3-4 раза меньше среднего модуля сигнала. При этом распределение мгновенных значений первой производной речевого сигнала хорошо аппроксимируется нормальным законом с нулевым средним значением и дисперсией, в среднем в 10-20 раз меньшей, чем дисперсия (мощность) речевого сигнала.

Адаптивные пороги допустимых значений первой производной речевого сигнала должны выбираться из компромиссных соображений. С одной стороны, пороги должны быть достаточно высокими с тем, чтобы редкие естественные увеличения мгновенных значений первой производной речи не были ложно приняты за аномальную цифровую ошибку и скорректированы, что приведет к искажениям речевого сигнала. С другой стороны, пороги нужно по возможности понижать с целью более надежного обнаружения и дальнейшей коррекции всех существенных цифровых ошибок, воспринимаемых на слух как "щелчки ".

Разрешить это противоречие удается благодаря тому, что в речевом сигнале практически не встречается двойных скачков первой производной разного знака, сопровождающихся удвоенным по уровню скачком второй производной, график которой приведен на фиг. 1г. Как показали исследования на реальных речевых сигналах, средний модуль второй производной речи оказался соизмеримым со средним модулем первой производной речи.

Таким образом, двойное превышение первой производной речи двух адаптивных порогов разного знака эквивалентно однократному превышению второй производной удвоенного порога (фиг. 1г), что совершенно нереально. Подтверждением этого является то обстоятельство, что в естественной речи никаких реализаций, воспринимаемых на слух как "щелчки", никогда не наблюдается.

Полагая закон распределения мгновенных значений первой производной речевого сигнала нормальным, целесообразно установить адаптивные пороги (фиг. 1в) на уровне порядка

(2-3) U_Эфф, где U_Эфф - эффективное (действующее) значение первой производной речевого сигнала, измеренное на предыдущем отрезке сигнала. Поскольку измерение действующего значения случайного процесса связано со значительными трудностями, гораздо проще измерить средний модуль сигнала U_ср, пропорциональный действующему значению. Для нормального процесса известна связь:

Отсюда величина адаптивного порога: U_пор = (2-3) U_эфф = (2.5-3.75) U_ср Таким образом, обнаружение "щелчков" напрямую связано с формированием адаптивных порогов, с которыми сравниваются текущие значения первой производной речевого сигнала. Среднее значение модуля первой производной U_ср должно быть измерено заранее на предыдущем интервале анализа Т_а речевого сигнала.

Выбор величины Т_а также определяется компромиссными соображениями. С одной стороны, интервал анализа должен быть достаточно большим и содержать много отсчетов речевого сигнала для надежного усреднения модуля первой производной и получения достоверной величины U_ср и пропорционального уровня порога U_пор. С другой стороны, за время Т_а параметры речевого сигнала не должны заметно изменяться, то есть информация о величине порога, полученная на предшествующем интервале анализа, не должна устаревать в течение всего последующего интервала анализа Т_а.

Известно, что интервал стационарности речевого сигнала Т_ст, на протяжении которого параметры речи остаются практически неизменными, примерно совпадает с продолжительностью самого короткого звука и составляет (20 - 30) м

с. Выбор интервала Т_а порядка половины Т_ст, Т_а = Т_ст/2 = (10-15) м

с оказывается оптимальным. За это время проходит (80-120) ИКМ-отсчетов речевого сигнала, что вполне достаточно для надежного усреднения модуля первой производной. В то же время, на интервале 2Т_а = Т_ст информация о величине адаптивного порога U_пор остается достоверной.

После обнаружения двойного скачка первой производной, выражающегося в последовательном превышении обоих порогов разного знака, необходимо осуществить коррекцию аномальной цифровой ошибки. Для этого требуется определить, какой из двух старших разрядов ИКМ-кода искажен.

Если канал связи находится в режиме молчания, последует однозначный вывод о том, что искажению подвергся второй разряд нелинейного кода, то есть старший разряд модуля отсчета сигнала, поскольку искажение знака отсчетов малого уровня не приводит к большим скачкам производной. Инверсия второго разряда кода позволит предотвращать неприятные импульсные помехи во время пауз речи.

Если же канал связи находится в активном режиме, то есть по нему передается речевой сигнал, задача коррекции "ложного бита" несколько усложняется. И в этом случае иногда по некоторым признакам можно избежать перебора из двух возможных альтернатив и однозначно указать номер инвертированного разряда кода.

Так, например, если знак обнаруженного отсчета отличается одновременно от знаков предыдущего и последующего за ним отсчетов, будет принято решение об инверсии знакового разряда данного отсчета.

Если знак обнаруженного отсчета совпадает одновременно со знаками предыдущего и последующего за ним отсчетов, будет принято решение об инверсии второго разряда кода, а именно старшего разряда модуля отсчета сигнала.

Если же знак обнаруженного отсчета совпадает со знаком предыдущего и противоположен знаку последующего (либо наоборот), то однозначного вывода о номере искаженного разряда сразу сделать не удастся. В этом случае придется поочередно инвертировать знаки первого и второго разрядов кода. После первой инверсии совершается проверка, сохранился или нет двойной скачок первой производной сигнала, превышающий установленные пороги. Если скачок исчез, последует вывод о том, что коррекция "щелчка" завершена. Если же двойной скачок первой производной сигнала сохранился, будет сделан вывод о том, что первая инверсия знака была произведена ошибочно, следует ее отменить и инвертировать другой разряд кода.

Литература: 1. Голубев А.Н., Иванов Ю.П., Левин Л.С. и др. Аппаратура ИКМ - 120. - М.: Радио и связь, 1989. - 256 с.

2. Гуревич В.Э., Лопушнян Ю.Г., Рабинович Г.В. Импульсно-кодовая модуляция в многоканальной телефонной связи. - М.: Связь, 1973. - 336 с.

Формула изобретения

Способ обнаружения и коррекции аномальных цифровых ошибок при передаче речи методом импульсно-кодовой модуляции (ИКМ), отличающийся тем, что осуществляется отслеживание идущих друг за другом повышенных сдвоенных разного знака "скачков" уровня первой производной речевого сигнала на основе запоминания предшествующего данному отрезку речевого сигнала, измерения среднего модуля первой производной сигнала на протяжении этого отрезка путем накопления модулей разности двух соседних ИКМ-отсчетов сигнала и установке двух одинаковых адаптивных порогов разного знака, пропорциональных среднему модулю первой производной, превышение которых подряд двумя текущими разностями соседних ИКМ-отсчетов сигнала позволяет обнаружить кодовую комбинацию, содержащую аномальную цифровую ошибку, коррекция которой заключается в поочередной инверсии одного из двух старших разрядов ИКМ-кода до тех пор, пока не будут устранены сдвоенные "скачки" первой производной.

РИСУНКИ

Рисунок 1

Изобретение относится к области передачи и хранения акустической информации и может быть использовано при проектировании систем цифровой радиосвязи, радио и телевидения, телефонии, систем цифровой звукозаписи и звуковоспроизведения

Способ измерения индекса передачи речи // 1700584

Изобретение относится к техническим средствам быстрого оценивания качества передачи речи по каналам связи или в помещениях

Устройство для распознавания речевых сигналов // 1695376

Изобретение относится к технике обработки речевых сигналов оптическими методами и может быть использовано при распознавании сигналов для сокращения избыточности речевого потока при его вводе в вычислительную систему, работающую в режиме обмена с оператором на естественном языке

Устройство распознавания речевых сигналов // 1691881

Изобретение относится к обработке речевых сигналов оптическими методами и может быть использовано для решения задач распознавания сигналов с целью сокращения избыточности речевого потока при его вводе в вычислительную систему, работающую в режиме обмена с оператором на естественном языке

Устройство для распознавания речевых сигналов // 1597897

Изобретение относится к радиотехнике и направлено на повышение надежности распознавания речевых команд, а также обеспечение возможности автоматизации процесса подстройки под диктора

Способ вокодерных преобразований речевых сигналов и устройство для его осуществления // 1525731

Способ анализа и синтеза речи и устройство для его осуществления // 1501138

Изобретение относится к речевой информатике и может быть использовано в вычислительной технике и технике связи для выделения и реконструкции речевых сообщений