Способ селекции цифровых потоков

Изобретение относится к области радиотехники, в частности к радиосетям передачи данных и речевых сообщений диапазона высоких частот. Технический результат заключается в повышении вероятности правильной селекции ЦП, в условиях априорной неопределенности о их параметрах и структуре, форме кадра управления. Технический результат достигается за счет дополнительного определения линейных взаимосвязей между элементами усеченной выборки автокорреляционной функции rM={r0, r1, r2, …,rM-1}, M<N, N - количество бит в ЦП у, на основе вычисления средней квадратичной ошибки (СКО) Ем линейного предсказания (ЛП) и значений коэффициентов линейного предсказания (КЛП) {am}М, m=1, 2, … М, где М определяет порядок ЛП, а решение об используемом в ЦП виде связи принимают по совокупности событий: превышению значения СКО ЛП ЕМ порогового значения Епор1=0,2 и наличию в наборе КЛП {am}М глобального минимума со значением , порядковый номер m которого совпадает с одним из значений объема Nб, Nб=М-1, пакета ЦП, что соответствует приему речевого сообщения. В противном случае, решение о приеме текста или изображения принимают по результатам пороговой обработки с Епор2=0,1. Выполнение условия Епор2>0,1 соответствует приему изображения, иначе - приему текста. 6 ил., 1 табл.

 

Изобретение относится к области радиотехники, в частности, к радиосетям передачи данных и речевых сообщений диапазона высоких частот (ВЧ) и может быть использовано для анализа и выделения (селекции) цифровых потоков, формируемых низкоскоростными кодерами речи, определения факта смены радиостанцией вида связи.

Заявленное техническое решение расширяет возможности средств аналогичного назначения за счет более высокой точности селекции цифровых потоков, формируемых низкоскоростными кодерами речи, на основе анализа линейных взаимосвязей между элементами (битами) исследуемого цифрового потока (ЦП) канального уровня (КУ), формируемого вокодером радиостанции при передаче речевого сообщения.

Известны способы селекции цифровых потоков, предложенные в Пат. РФ №2480932, МПК H04L 25/03, опубл. 27.04.2013, бюл. №13. Аналоги предполагают одновременный прием ЦП набором декодеров, определение по заданному критерию номера декодера, успешно принявшего ЦП, формирование выходного информационного сигнала на основе использования сигнала на выходе наиболее успешного декодера.

В качестве недостатков аналогов следует отметить следующее:

большая аппаратурная избыточность;

требуют априорного знания характеристик всех используемых в ЦП кодеров речи.

Наиболее близким к заявленному является способ селекции цифровых потоков (см. Тимофеев Д.И., Тавалинский Д.А., Чубатый Д.Н. Анализ параметров низкоскоростных кодеров речи в условиях структурной и параметрической неопределенности // Наукоемкие технологии, №8,2011. - С. 4-9.). Он заключается в том, что в течение интервала времени ΔT принимают цифровой информационный поток у=(у1, у2, …, yn,…, yN), где yn - n-й бит ЦП у, содержащего N бит, на основе ЦП у формируют нормированную автокорреляционную функцию (АКФ) r={r0, r1, r2, …, rN-1}, где rn=cn/Dn - n_й коэффициент корреляции, - n-й коэффициент ковариации, D(y)=М[у2]-(М[у])2 - дисперсия ЦП у, М[.] - стандартная функция вычисления математического ожидания, - центрированный вектор, - центрированный вектор, сдвинутый на n=0, 1, 2, …, N-1 значений относительно , по наличию регулярных с равными интервалами Δn экстремумов АКФ r принимают решение о наличии блочной битовой структуры в ЦП у, что соответствует наличию в ЦП речевого сообщения, подвергнутого низкоскоростному кодированию.

Прототип обеспечивает достаточно высокую точность селекции цифровых информационных потоков КУ с наличием блочной структуры на основе автокорреляционного метода, в том числе при отсутствии кадра управления, в рассматриваемых коммуникационных протоколах. Однако ЦП имеет блочную структуру не только при обмене речевыми сообщениями, но и при передаче данных. Автокорреляционная функция ЦП, содержащего текстовое сообщение (фиг. 1а), имеет значительное сходство с АКФ ЦП речевого сообщения (фиг. 1б). В результате недостаток прототипа проявляется через снижение точностных характеристик при увеличении доли цифровых потоков с блочной структурой, содержащих данные. В конечном счете это не позволяет правильно определять используемый радиостанцией вид связи и осуществлять выделение цифровых потоков, формируемых низкоскоростными кодерами речи (НКР).

Кроме того, при использовании способа-прототипа исследуемые цифровые потоки с блочной структурой, содержащие данные, ложно определяются как реализации, сформированные на основе новых протоколов НКР, что приводит к снижению вероятности правильного распознавания протоколов НКР.

Целью изобретения является разработка способа селекции цифровых потоков, обеспечивающего повышение вероятности правильной селекции ЦП, в условиях априорной неопределенности о их параметрах и структуре, форме кадра управления, благодаря выполнению дополнительного анализа линейных взаимосвязей между элементами одной реализации ЦП.

Поставленная цель достигается тем, что в известном способе селекции цифровых потоков, включающем прием в течение интервала времени ΔT цифрового информационного потока у=(у1; у2, …, yn, …, yN), где yn - n-й бит цифрового потока y, содержащего N бит, формирование на основе ЦП у нормированной автокорреляционной функции r={r0, r1, r2, …, rN-1} по наличию регулярных экстремумов функции r с интервалами между ними, равными Δn, принятие решения о наличии блочной битовой структуры в ЦП у, дополнительно определяют линейные взаимосвязи между элементами усеченной выборки значений АКФ rM={r0, r1, r2, …, rM-1}, М<N, на основе вычисления средней квадратичной ошибки (СКО) ЕМ линейного предсказания (ЛП) и значений коэффициентов линейного предсказания (КЛП) {am}М, m=1, 2, … М, где М определяет порядок линейного предсказания, а решение об используемом в ЦП виде связи принимают по совокупности событий: превышению значения СКО ЛП ЕМ заданного порогового значения и наличию в наборе КЛП {am}М глобального минимума , порядковый номер m которого совпадает с одним из значений объема Nб, Nб=М-1, пакета ЦП, что соответствует приему речевого сообщения, в противном случае решение о приеме текста или изображения принимают по результатам пороговой обработки с где значение ЕМ>0,1 соответствует приему изображения, иначе - приему текста.

Благодаря новой совокупности существенных признаков в заявленном способе достигается повышение вероятности правильной селекции ЦП, содержащего кодированные речевые сообщения, за счет вычисления значения СКО ЛП ЕМ и значений КЛП {am} (m=1, 2, …, М), сравнения значения СКО ЕМ ЛП с пороговым значением , определения факта наличия глобального минимума , совпадающего с одним из известных значений m объема Nб пакета, характерных для цифровых потоков, которые содержат речевые сообщения. Кроме того, для ЦП, имеющего блочную структуру, но не содержащего речевое сообщение, сравнение значения ЕМ с пороговым уровнем позволяет определить наличие в ЦП изображений или текста.

Заявленный способ поясняется чертежами, на которых показаны:

на фиг. 1 - автокорреляционные функции, сформированные по цифровым потокам, которые содержат текст (1а) и речевое сообщение (1б);

на фиг. 2 - значения КЛП {am} для цифровых потоков, содержащих речь и сформированных вокодерами типов LPC-10-2400 (2а) и MELPe-600 (2б);

на фиг. 3 - значения {am} для цифровых потоков, содержащих текст (3а) и изображение (3б);

на фиг. 4 - обобщенный (для L>1) алгоритм селекции цифровых потоков;

на фиг. 5 - алгоритм селекции цифровых потоков в соответствии с заявленным изобретением;

на фиг. 6 - зависимость выигрыша ΔТ по точности от доли ложных (неправильно отобранных) ЦП b, определяющих вероятность ложной тревоги.

Основным направлением развития техники радиосвязи диапазона ВЧ является переход на системы передачи дискретной информации. Замена устаревших аналоговых средств радиосвязи привела к широкому распространению цифровых радиостанций, в том числе в диапазоне ВЧ (см. Аладинский В.А., Кузьминский С.В. Анализ цифровых потоков на выходах вокодеров, применяемых на зарубежных линиях радиосвязи диапазона высоких частот // Успехи современной радиоэлектроники, №7, 2015. С. 71-74), со встроенными или внешними (подключаемыми) вокодерами, разработанными на основе методов ЛП. При этом для передачи сообщений с НКР или данных применяются одни и те же стандарты радиосвязи с аналогичными параметрами радиосигналов.

Данный факт затрудняет выполнение селекции цифровых потоков КУ, содержащих разнотипные сообщения, на основе сравнения таких параметров вокодера, как скорость Ввок и количество Nб бит в одном блоке ЦП, значения которых задаются на этапе разработки конкретного изделия (см. там же) и могут совпадать со значениями аналогичных параметров цифровых потоков различных видов связи. Кроме того, передаваемые изображения и данные зачастую имеют периодическую структуру, что приводит к появлению ошибок селекции цифровых потоков на основе сравнения значений параметров АКФ r.

Исходя из принципа подобия, повышение качества селекции цифровых потоков, сформированных вокодерами с ЛП, может быть достигнуто при анализе АКФ r принимаемого ЦП на основе исследования таких параметров ЛП, как СКО и КЛП. В общем виде значение СКО ЛП порядка М определяется по известной формуле (см. Wai Chu С. Speech coding algorithms: Foundation and evolution of standardized coders. Hoboken: Wiley-Interscience. - 2003. - 558 p.):

где am - m-й коэффициент ЛП, m=1, 2, …, М.

Значения КЛП вычисляются на основе матричного уравнения вида (см. там же)

где

т - операция транспонирования.

по различным алгоритмам. Эффективным по минимизации вычислительных затрат считается итерационный алгоритм Левинсона-Дарбина (см. там же), для которого исходными данными являются усеченная выборка значений АКФ {r0, r1, r2, …, rm, …, rM-1} и начальное значение СКО ЛП Е0=r0. Количество циклов итерации задается величиной М. При m=1 имеем: a1=-r1/E0, E1=E0(1-a1). Значения m-го КЛП и соответствующего СКО вычисляются по следующим формулам (см. там же)

где - значения КЛП, вычисленные на предыдущих i=1, 2, …, m-1 циклах.

Последовательность действий, предложенная Левинсоном и Дарбиным была реализована на ЭВМ в среде программирования MATLAB. При этом входные цифровые потоки содержали речевые сообщения, сформированные модельными вокодерами типов LPC-10-2400 (Nб=54) и MELPe-600 (Nб=60), которые активно применяются в радиостанциях диапазона ВЧ (см. Аладинский В.А., Кузьминский С.В. Анализ цифровых потоков на выходах вокодеров, применяемых на зарубежных линиях радиосвязи диапазона высоких частот // Успехи современной радиоэлектроники, №7, 2015. С. 71-74), а также текстовые сообщения и изображения. Исходя из свойств АКФ r, для уменьшения количества итераций в алгоритме Левинсона-Дарбина было принято, что М=Nб+1. Как правило, значение Nб априорно неизвестно для каждой входной реализации, поэтому в ходе эксперимента кроме значений Nб=54 и 60 были также выбраны максимально возможные значения Nб=81 и 96.

По каждому из трех видов сообщений были сформированы L=200 цифровых потоков КУ. Д ля цифровых потоков одного вида сообщений по формуле (1) с учетом формул (3) и (4) были вычислены значения и усреднены следующим образом (см. Математический энциклопедический словарь. / Гл. ред. Прохоров Ю.В. - М.: Большая российская энциклопедия, 1995. Репринтное издание - М.: Сов. энциклопедия, 1988. - 847 с.):

Итоговые результаты эксперимента приведены в таблице 1.

Из анализа таблицы 1 следует, что для цифровых потоков, содержащих речевые сообщения, значения существенно больше в сравнении с цифровыми потоками, содержащими тексты или изображения. На фиг. 1 приведены результаты расчета значений АКФ по цифровым потокам, содержащим текст (фиг. 1а) или речевое сообщение (фиг. 1б).

В ходе эксперимента установлено, что вектор КЛП аМ, полученный при анализе АКФ ЦП с речевым сообщением, имеет глобальный минимум для m∈{Nб}. При этом максимальное значение из совокупности {Nб} априорно известных значений определяло величину . На фиг. 2 приведены результаты расчета значений {am} при М=97 по цифровым потокам КУ, сформированным вокодерами типа LPC-10-2400 (фиг. 2а) и MELPe-600 (фиг. 2б). Здесь имеет значения при m=54 и m=60 соответственно, m∈{Nб}. На фиг. 3 приведены аналогичные результаты для цифровых потоков КУ, содержащих тексты (фиг. 3а) и изображения (фиг. 3б), в которых отсутствуют глобальные минимумы.

Из вышесказанного следует, что критерием для принятия решения об обнаружении, а, следовательно, и для выполнения операции селекции речевых сообщений из ЦП, целесообразно считать выполнение следующих условий: значение (см. Таблицу 1); в наборе КЛП {am} имеется глобальный минимум , для которого m∈{Nб}. Введение порога позволяет селектировать между собой текстовые сообщения и изображения.

Исходя из изложенного выше, предлагается следующая обобщенная (для L>1) последовательность операций (см. фиг. 4) при анализе цифровых потоков КУ:

1. Ввод исходных данных: интервал времени ΔT; значения {Nб} известных вокодеров; М=Nбmax+1; количество реализаций ЦП L.

2. Задание начальной переменной

3. Прием ЦП

4. Вычисление АКФ

5. Проверка на наличие блочной структуры в ЦП. При положительном результате осуществляют переход на этап №6. При отрицательном результате переход на этап №19.

6. Формирование усеченной выборки значений АКФ размерности М, М<N

7. Нахождение по формуле (3) с учетом (4) составляющих am вектора КЛП аМ.

8. Вычисление значения по формуле (1).

9. Проверка на завершение цикла При выполнении условия переход на этап №11, иначе на этапе №10.

10. Изменение переменной

11. Определение усредненного значения в соответствии с (5).

12. Проверка выполнения условия: Если условие выполняется, то осуществляется переход на этап №13, иначе - переход на этап №15.

13. Поиск глобального минимума в наборе аМ.

14. Проверка выполнения условия для . Если для найденного значение m∈{Nб}, то осуществляется переход на этап №16, иначе - переход на этап №15.

15. Проверка выполнения условия: Если условие выполняется, то осуществляется переход на этап №15, иначе - на этап №18.

16. Формирование результата: «ЦП содержит речевое сообщение».

17. Формирование результата: «ЦП содержит изображение».

18. Формирование результата «ЦП содержит текст».

19. Формирование результата «ЦП не содержит заданной информации».

20. Вывод информации.

Селекция цифровых потоков, как правило, предполагает L=1. В связи с этим предлагается (см. фиг. 5) следующая последовательность операций, соответствующая заявленному способу:

1. Ввод исходных данных: интервал времени ΔТ; значения {Nб} известных вокодеров; M=Nб max+1; ;

2. Прием ЦП у=(y1, у2, …, yn, …, yN).

3. Вычисление АКФ r={r0, r1, r2, …, rN-1}.

4. Проверка на наличие блочной структуры в ЦП. При отрицательном результате переход на этап №15.

5. Формирование усеченной выборки значений АКФ rM={r0, r1, r2, …, rm, …, rM-1} размерности М, M<N.

6. Нахождение по формулам (2), (3) с учетом (4) составляющих am вектора КЛП аМ.

7. Вычисление значения ЕМ по формуле (1).

8. Проверка выполнения условия: Если условие выполняется, то осуществляется переход на этап №9, иначе - переход на этап №11.

9. Поиск глобального минимума в наборе аМ.

10. Проверка выполнения условия для . Если для найденного значение m∈{Nб}, то осуществляется переход на этап №12, иначе - переход на этап №11.

11. Проверка выполнения условия ЕМ>0,1. Если условие выполняется, то осуществляется переход на этап №13, иначе переход на этап №14.

12. Формирование результата: «ЦП содержит речевое сообщение».

13. Формирование результата: «ЦП содержит изображение».

14. Формирование результата «ЦП содержит текст».

15. Формирование результата «ЦП не содержит заданной информации».

16. Вывод информации.

Таким образом, при анализе АКФ ЦП на основе ЛП по алгоритму Левинсона-Дарбина обеспечивается вычисление значений КЛП и СКО. Экспериментальная проверка методом моделирования на ЭВМ показала, что для ЦП, содержащего речевое сообщение, вектор КЛП имеет глобальный минимум, а величина СКО ЛП существенно больше, чем по другим видам сообщений (тексты, изображения). Текстовые сообщения и изображения, передаваемые по цифровому каналу, также имеют контрастный признак ЕМ, позволяющий их идентифицировать.

Точность селекции цифровых потоков, определяется выражением (см. Маннинг К.Д., Рагхаван П., Шютце Х. Введение в информационный поиск. - М.: ООО «И.Д. Вильямс», 2011. - 528 с.)

где ν - доля цифровых потоков, правильно отобранных при их селекции (содержащих речевые сообщения, т.е. истинных); b - доля цифровых потоков, неправильно отобранных (не содержащих речевые сообщения, т.е. ложных и определяющих вероятность ложной тревоги) по каким-либо причинам; (ν+b) - общее количество цифровых потоков, подвергшихся селекции.

По результатам селекции пяти тысяч реальных и модельных цифровых потоков, сформированных вокодерами, установлено следующее. Предлагаемый способ обеспечивает значение ν не хуже, чем способ-прототип, но при прочих равных условиях устраняет не менее 90% неправильно отобранных цифровых потоков из общего их числа (ν+b). Таким образом, уменьшается вероятность ложной тревоги до значения 0,1. Доля неправильно отобранных цифровых потоков при использовании предлагаемого способа составляет не более 0,1b при постоянном значении ν. Разность между полученным значением точности селекции Т1

и Т, определяемым согласно (5) при селекции на основе способа-прототипа, составит выигрыш по точности селекции цифровых потоков, содержащих речевые сообщения:

Принимая, что (ν+b)=1 при ν, b∈[0, 1], подставим в (8) ν=1-b и после некоторых сокращений получим

Из (9) следует, что значение выигрыша ΔТ по точности селекции цифровых потоков, содержащих речевые сообщения, определяется значением доли b∈[0, 1]. В реальных условиях доля цифровых потоков с блочной структурой, содержащих данные, не превышает 10%, что соответствует b≤0,1. На фиг. 6 представлена вычисленная по формуле (9) зависимость выигрыша ΔТ по точности селекции от значения b. Выполненный анализ показывает, что максимальный выигрыш по точности селекции при b=0,1 и прочих равных условиях составит ΔТ=0,089 или 8,9%.

Способ селекции цифровых потоков, заключающийся в том, что в течение интервала времени ΔT принимают цифровой информационный поток y=(y1, у2, …, yn, …, yN), где yn - n-й бит цифрового потока (ЦП) у, содержащего N бит, на основе ЦП у формируют нормированную автокорреляционную функцию (АКФ) r={r0, r1, r2, …, rN-1}, по наличию регулярных экстремумов функции r с интервалами между ними, равными Δn, принимают решение о наличии блочной битовой структуры в ЦП у, отличающийся тем, что дополнительно определяют линейные взаимосвязи между элементами усеченной выборки значений АКФ rM={r0, r1, r2, …, rM-1), М<N, на основе вычисления средней квадратичной ошибки (СКО) ЕМ линейного предсказания (ЛП) и значений коэффициентов линейного предсказания (КЛП) {am}М, m=1, 2, … М, где М определяет порядок линейного предсказания, а решение об используемом в ЦП виде связи принимают по совокупности событий: превышению значения СКО ЛП ЕМ порогового значения Епор1=0,2 и наличию в наборе КЛП {am}М глобального минимума со значением , порядковый номер m которого совпадает с одним из значений объема Nб, Nб=М-1, пакета ЦП, что соответствует приему речевого сообщения, в противном случае решение о приеме текста или изображения принимают по результатам пороговой обработки с Епор2=0,1, где значение ЕМ>0,1 соответствует приему изображения, иначе - приему текста.



 

Похожие патенты:

Изобретение относится к области вычислительной техники для анализа аудиоданных. Технический результат заключается в снижении нагрузки на стороне приема аудиоданных при передаче аудиоданных нескольких типов.

Изобретение относится к обработке аудиосигнала. Технический результат - уменьшение разрыва аудио при восстановлении пакета в начальной точке аудио.

Изобретение относится к средствам для кодирования и декодирования аудио. Технический результат заключается в сокращении количества кодируемых битов, которые должны быть распределены для кодирования спектра расширенной полосы, наряду с предотвращением ухудшения качества звука в расширенной полосе.

Изобретение относится к технике связи и предназначено для обработки данных при передаче множественных видов элементов аудиоданных. Технический результат – уменьшение нагрузки по обработке данных на приеме при передаче множественных видов элементов аудиоданных.

Изобретение относится к средствам для кодирования аудио. Технический результат заключается в повышении эффективности усиления диалога в аудиосистемах.

Изобретение относится к средствам для приема и передачи данных. Технический результат заключается в повышении эффективности приемопередачи аудиоданных.

Изобретение относится к области вычислительной техники для цифровой обработки звуковой фонограммы. Технический результат заключается в повышении скорости обработки цифровой фонограммы с записью речи.

Изобретение относится к области вычислительной техники. Технический результат заключается в повышении эффективности получения предварительно заданного типа аудиоданных из числа множества типов аудиоданных.

Изобретение относится к средствам для приема и передачи аудиоданных. Технический результат заключается в повышении эффективности обработки на приемной стороне при передаче аудиоданных нескольких типов.

Изобретение относится к обработке аудиосигналов, в частности, к способу воспроизведения многоканального аудиосигнала, включающего в себя звуковой сигнал с возвышением в окружении с горизонтальной схемой расположения, тем самым получая параметр рендеринга в соответствии с типом рендеринга и конфигурируя матрицу понижающего микширования.

Изобретение относится к области электротехники и может быть использовано в автоматизированных комплексах связи. Технический результат заключается в повышении надежности работы устройства в условиях высоких шумов.

Изобретение относится к области вычислительной техники для обработки и передачи данных с корректировкой орфографических ошибок. Технический результат заключается в расширении коммуникативной функции языка общения людей с дефектами слуха и речи с говорящим и слышащим человеком за счет увеличения объема передаваемой информации.

Изобретение относится к средствам для получения транскрипции речевого фрагмента. Технический результат заключается в повышении точности транскрипции речевого фрагмента.

Изобретение относится к области электросвязи, когнитивной психологии и психофизиологии и может быть использовано для определения истинности речевой информации, циркулирующей в инфокоммуникационных системах.

Изобретение относится к области техники анализа речи, в частности к способу оценки мгновенной частоты в точках локального максимума речевых сигналов. Техническим результатом является уменьшение количества вычислений для оценки мгновенной частоты в точках локального экстремума.

Группа изобретений относится к вычислительной технике и может быть использована для активации электрического устройства из режима ожидания в режим работы на полную мощность.

Данное изобретение относится к технологиям распознавания речи, т.е. перевода звукового сигнала, содержащего речь, в транскрипционное представление.

Изобретение относится к средствам помехоустойчивой классификации режимов кодирования речи. Технический результат заключается в повышении эффективности классификации режимов речи для повышения эффективности многорежимного кодирования с переменной скоростью передачи данных.

Изобретение относится к средствам обработки изображений. Технический результат заключается в уменьшении времени распознавания команды и выполнения операции.

Изобретение относится к автоматике и вычислительной технике. .

Изобретение относится к области цифровой вычислительной техники и предназначено для моделирования комбинаторных задач при проектировании вычислительных систем. Технический результат заключается в расширении арсенала технических средств.
Наверх