Принцип кодирования информации

Авторы патента:

ПИНО Альфонсо (DE)

ФИШЕР Йоханнес (DE)

ХЮТТЕНБЕРГЕР Маттиас (DE)

БЯКСТРЕМ Том (DE)

ФИШЕР ПЕДЕРСЕН Кристиан (DK)

G10L19/07 - Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи

G10L19/02 - с использованием спектрального анализа, например преобразовательные вокодеры, вокодеры с поддиапазонами

Владельцы патента RU 2670384:

ФРАУНХОФЕР-ГЕЗЕЛЛЬШАФТ ЦУР ФЕРДЕРУНГ ДЕР АНГЕВАНДТЕН ФОРШУНГ Е.Ф. (DE)

Изобретение относится к области аудиокодирования. Технический результат заключается в повышении эффективности аудиокодирования. Технический результат достигается за счет анализа информационного сигнала (IS) для получения коэффициентов линейного предсказания предсказательного полинома A(z); преобразования коэффициентов линейного предсказания предсказательного полинома A(z) в значения частоты (f₁…f_n) спектрального частотного представления (RES, IES) предсказательного полинома A(z); ограничения числового диапазона спектров (RES, IES) полиномов P(z) и Q(z) путем умножения полиномов P(z) и Q(z) или одного или более полиномов, выведенных из полиномов P(z) и Q(z), на фильтрационный полином B(z), причем фильтрационный полином B(z) симметричен и не имеет корней на единичной окружности; получения квантованных значений частоты (f_q1…f_qn) из значений частоты (f₁…f_n); и формирования битового потока (BS), содержащего квантованные значения частоты (f_q1…f_qn). 3 н. и 17 з.п. ф-лы, 8 ил.

Для кодирования речи чаще всего используется принцип линейного предсказания с возбуждением алгебраическим кодом (ACELP), на котором основаны, например, стандарты семейства AMR, G.718 и MPEG USAC [1-3]. В их основе лежит моделирование речи с использованием исходной модели, состоящей из линейного предсказателя (LP) для моделирования спектральной огибающей, долговременного предсказателя (LTP) для моделирования основной частоты и алгебраической кодовой книги для остатка.

Коэффициенты линейной предсказательной модели очень чувствительны к квантованию, в связи с чем, они обычно сначала преобразуются в линейные спектральные частоты (LSF) или спектральные частоты иммитанса (ISF), а затем квантуются. Области LSF/ISF устойчивы к ошибкам квантования, и в этих областях легко поддерживать устойчивость предсказателя, что обеспечивает подходящую область для квантования [4].

LSF/ISF, в дальнейшем именуемые значениями частоты, можно получать из линейного предсказательного полинома A(z) m-го порядка следующим образом. Полиномы пары линейных спектров задаются в виде

P(z)=A(z)+(z^-m-l)A(z^-1)

Q(z)=A(z)-(z^-m-l)A(z^-1) (1)

где l=1 для представления в виде пары линейных спектров и l=0 для представления в виде пары спектров иммитанса, но, в принципе, пригодно любое l≥0. Таким образом, в дальнейшем, предполагается только, что l≥0.

Заметим, что первоначальный предсказатель всегда можно реконструировать с использованием A(z)=1/2[P(z)+Q(z)]. Таким образом, полиномы P(z) и Q(z) содержат всю информацию A(z).

Основное свойство полиномов LSP/ISP состоит в том, что, если и только если все корни A(z) располагаются внутри единичной окружности, то корни P(z) и Q(z) чередуются на единичной окружности. Поскольку корни P(z) и Q(z) располагаются на единичной окружности, их можно представлять только их углами. Эти углы соответствуют частотам, и поскольку спектры P(z) и Q(z) имеют вертикальные линии в их спектрах логарифмической величины на частотах, соответствующих корням, корни именуются значениями частоты.

Отсюда следует, что значения частоты кодируют всю информацию предсказателя A(z). Кроме того, было установлено, что значения частоты устойчивы к ошибкам квантования, благодаря чему, малая ошибка в одном из значений частоты создает малую ошибку в спектре реконструированного предсказателя, которая располагается, в спектре, вблизи соответствующей частоты. Благодаря этим благоприятным свойствам, квантование в областях LSF или ISF используется во всех распространенных речевых кодеках [1-3].

Однако одной из проблем, связанных с использованием значений частоты, является эффективное отыскание их положений из коэффициентов полиномов P(z) и Q(z). В конце концов, отыскание корней полиномов является классической и трудной задачей. Ранее предложенные способы решения этой задачи включают в себя следующие подходы:

• один из ранних подходов использует тот факт, что нули располагаются на единичной окружности, благодаря чему они выглядят как нули в спектре величины [5]. Таким образом, взяв дискретное преобразование Фурье коэффициентов P(z) и Q(z), можно искать впадины в спектре величины. Каждая впадина указывает положение корня, и если подвергнуть спектр достаточной повышающей дискретизации, можно найти все корни. Однако этот способ дает только приближенную позицию, поскольку из положения впадины трудно определить точную позицию.

• наиболее часто используемый подход базируется на полиномах Чебышева и представлен в [6]. Он исходит из того, что полином P(z) симметричен, и полином Q(z) антисимметричен, благодаря чему, они содержат много избыточной информации. Удаляя тривиальные нули при z=±1 и подставляя x=z+z^-1 (что называется преобразованием Чебышева), полиномы можно преобразовать в альтернативное представление FP(x) и FQ(x). Порядок этих полиномов вдвое меньше, чем у P(z) и Q(z), и они имеют только действительные корни в диапазоне от -2 до +2. Заметим, что полиномы FP(x) и FQ(x) являются действительнозначными при действительном x. Кроме того, поскольку корни являются простыми, FP(x) и FQ(x) будет иметь пересечение нуля на каждом из своих корней.

В речевых кодеках, например, AMR-WB, этот подход применяется таким образом, что полиномы FP(x) и FQ(x) оцениваются на фиксированной сетке на действительной оси для отыскания всех пересечений нуля. Положения корней дополнительно уточняются посредством линейной интерполяции вокруг пересечения нуля. Преимущество этого подхода состоит в сниженной сложности благодаря устранению избыточных коэффициентов.

Хотя вышеописанные способы достаточно хорошо работают в существующих кодеках, они сталкиваются с рядом проблем.

Задача заключается в обеспечении улучшенного принципа кодирования информации.

В первом аспекте для решения задачи предусмотрен информационный кодер для кодирования информационного сигнала. Информационный кодер содержит:

анализатор для анализа информационного сигнала для получения коэффициентов линейного предсказания предсказательного полинома A(z);

преобразователь для преобразования коэффициентов линейного предсказания предсказательного полинома A(z) в значения частоты спектрального частотного представления предсказательного полинома A(z), причем преобразователь выполнен с возможностью определения значений частоты путем анализа пары полиномов P(z) и Q(z), заданных в виде

P(z)=A(z)+(z^-m-l)A(z^-1) и

Q(z)=A(z)-(z^-m-l)A(z^-1),

где m - порядок предсказательного полинома A(z) и l больше или равно нулю, причем преобразователь выполнен с возможностью получения значений частоты путем установления строго действительного спектра, выведенного из P(z) и строго мнимого спектра из Q(z) и путем идентификации нулей строго действительного спектра, выведенного из P(z), и строго мнимого спектра, выведенного из Q(z);

квантователь для получения квантованных значений частоты из значений частоты; и

формирователь битового потока для формирования битового потока, содержащего квантованные значения частоты.

Информационный кодер согласно изобретению использует поиск пересечения нуля, тогда как спектральный подход для отыскания корней согласно уровню техники опирается на отыскание впадин в спектре величины. Однако поиск впадин менее точен, чем поиск пересечений нуля. Рассмотрим, например, последовательность [4, 2, 1, 2, 3]. Очевидно, наименьшее значение имеет третий элемент, в соответствии с чем, нуль находится где-то между вторым и четвертым элементом. Другими словами, невозможно определить, находится ли нуль справа или слева от третьего элемента. Если же рассмотреть последовательность [4, 2, 1, -2, -3], можно сразу же понять, что пересечение нуля находится между третьим и четвертым элементами, благодаря чему, предел погрешности снижается наполовину. Отсюда следует, что, согласно подходу спектра величины, требуется вдвое больше точек анализа для получения той же точности, что и при поиске пересечений нуля.

По сравнению с оцениванием величин |P(z)| и |Q(z)|, подход пересечения нуля имеет значительное преимущество в точности. Рассмотрим, например, последовательность 3, 2, -1, -2. Согласно подходу пересечения нуля, очевидно, что нуль располагается между 2 и -1. Однако, на основании соответствующей последовательности величин 3, 2, 1, 2, можно заключить, что нуль располагается где-то между вторым и последним элементами. Другими словами, подход пересечения нуля дает вдвое большую точность по сравнению с подходом на основе величины.

Кроме того, информационный кодер согласно изобретению может использовать длинные предсказатели, например, m=128. Вместо этого, преобразование Чебышева осуществляется в достаточной степени только при сравнительно малой длине A(z), например, m≤20. Для длинных предсказателей преобразование Чебышева численно нестабильно, из-за чего, практическая реализация алгоритма невозможна.

Основные свойства предложенного информационного кодера, таким образом, дают возможность получать такую же или более высокую точность, чем способ на основе преобразования Чебышева, поскольку поиск пересечений нуля и преобразование из временной области в частотную область осуществляются, таким образом, что нули можно найти очень низкой вычислительной сложностью.

В результате, информационный кодер согласно изобретению определяет нули (корни) не только более точно, но и с низкой вычислительной сложностью.

Информационный кодер согласно изобретению можно использовать в любом приложении обработки сигнала, которому нужно определять линейный спектр последовательности. Данный информационный кодер рассмотрен в порядке иллюстрации в контексте кодирования речи. Изобретение применимо в устройстве или приложении кодирования речевого, аудио и/или видеосигнала, использующем линейный предсказатель для моделирования огибающей спектральной величины, перцептивного порога частотного маскирования, огибающей временной величины, перцептивного порога временного маскирования или других форм огибающей или других представлений, эквивалентных форме огибающей, например, сигнала автокорреляции, использующем линейный спектр для представления информации огибающей, для кодирования, анализа или обработки, которому требуется способ определения линейного спектра из входного сигнала, например, речевого или общего аудиосигнала, и где входной сигнал представляется как цифровой фильтр или другая последовательность чисел.

Информационный сигнал может представлять собой, например, аудиосигнал или видеосигнал. Значениями частоты могут быть линейные спектральные частоты или спектральные частоты иммитанса. Квантованные значения частоты, передаваемые в битовом потоке, позволяют декодеру декодировать битовый поток для воссоздания аудиосигнала или видеосигнала.

Согласно предпочтительному варианту осуществления изобретения, преобразователь содержит определяющее устройство для определения полиномов P(z) и Q(z) из предсказательного полинома A(z).

Согласно предпочтительному варианту осуществления изобретения, преобразователь содержит идентификатор нулей для идентификации нулей строго действительного спектра, выведенного из P(z), и строго мнимого спектра, выведенного из Q(z).

Согласно предпочтительному варианту осуществления изобретения, идентификатор нулей выполнен с возможностью идентификации нулей посредством

a) начинания с действительного спектра на нулевой частоте;

b) увеличения частоты, пока перемена знака в действительном спектре обнаружена;

c) увеличения частоты, пока не будет обнаружена дополнительная перемена знака в мнимом спектре; и

d) повторения этапов b) и c), пока не будут обнаружены все нули.

Заметим, что Q(z) и, таким образом, мнимая часть спектра всегда имеет нуль на нулевой частоте. Поскольку корни перекрываются, P(z) и, таким образом, действительная часть спектра всегда будет отлична от нуля на нулевой частоте. Поэтому можно начинать с действительной части на нулевой частоте и увеличивать частоту, пока не будет обнаружена первая перемена знака, которая указывает первое пересечение нуля и, таким образом, первое значение частоты.

Поскольку корни чередуются, спектр Q(z) будет иметь следующую перемену знака. Таким образом, можно увеличивать частоту, пока не будет обнаружена перемена знака для спектра Q(z). Этот процесс может повторяться, перемежаясь между спектрами P(z) и Q(z), пока не будут найдены все значения частоты. Подход, используемый для определения положения пересечения нуля в спектрах, таким образом, аналогичен подходу, применяемому в области преобразования Чебышева [6, 7].

Поскольку нули P(z) и Q(z) чередуются, можно попеременно искать нули на действительных и комплексных частях, что позволяет находить все нули за один проход, и наполовину снижать сложность по сравнению с полным поиском.

Согласно предпочтительному варианту осуществления изобретения, идентификатор нулей выполнен с возможностью идентификации нулей посредством интерполяции.

Помимо подхода пересечения нуля можно легко применять интерполяцию, что позволяет оценивать позицию нуля с еще более высокой точностью, например, чем при осуществлении традиционными способами, например [7].

Согласно предпочтительному варианту осуществления изобретения, преобразователь содержит устройство заполнения нулями для добавления одного или более коэффициентов, имеющих значение ʺ0ʺ, к полиномам P(z) и Q(z) для формирования пары удлиненных полиномов P_e(z) и Q_e(z). Точность можно дополнительно повысить за счет увеличения длины оцененного спектра. На основании информации о системе, в ряде случаев фактически возможно определить минимальное расстояние между значениями частоты, и, таким образом, определить минимальную длину спектра, которая позволяет найти все значения частоты [8].

Согласно предпочтительному варианту осуществления изобретения, преобразователь выполнен таким образом, что в ходе преобразования коэффициентов линейного предсказания в значения частоты спектрального частотного представления предсказательного полинома A(z) исключается, по меньшей мере, часть операций с коэффициентами, про которые известно, что они имеют значение ʺ0ʺ, удлиненных полиномов P_e(z) и Q_e(z).

Однако увеличение длины спектра не приводит к возрастанию вычислительной сложности. Наибольший вклад в сложность вносит преобразование из временной области в частотную область, например, быстрое преобразование Фурье коэффициентов A(z). Однако, поскольку вектор коэффициентов заполнен нулями до нужной длины, он очень разрежен. Этот факт легко можно использовать для снижения сложности. Это довольно простая задача в том смысле, что точно известно, какие коэффициенты равны нуль, благодаря чему, на каждой итерации быстрого преобразования Фурье можно просто исключить операции, в которых участвуют нули. Применение такого разреженного быстрого преобразования Фурье является прямым, и любой программист может реализовать его. Сложность такой реализации можно представить как O(N log₂(1+m+l)), где N - длина спектра, и m и l определены ранее.

Согласно предпочтительному варианту осуществления изобретения, преобразователь содержит формирователь составного полинома, выполненный с возможностью установления составного полинома C_e(P_e(z), Q_e(z)) из удлиненных полиномов P_e(z) и Q_e(z).

Согласно предпочтительному варианту осуществления изобретения, преобразователь выполнен таким образом, что строго действительный спектр, выведенный из P(z), и строго мнимый спектр из Q(z) устанавливаются посредством единого преобразования Фурье путем преобразования составного полинома C_e(P_e(z), Q_e(z)).

Согласно предпочтительному варианту осуществления изобретения, преобразователь содержит устройство преобразования Фурье для осуществления преобразования Фурье над парой полиномов P(z) и Q(z) или одним или более полиномов, выведенных из пары полиномов P(z) и Q(z), в частотную область и регулировочное устройство для регулировки фазы спектра, выведенного из P(z), таким образом, чтобы он был строго действительным, и для регулировки фазы спектра, выведенного из Q(z), таким образом, чтобы он был строго мнимым. Устройство преобразования Фурье может действовать на основе быстрого преобразования Фурье или дискретного преобразования Фурье.

Согласно предпочтительному варианту осуществления изобретения, регулировочное устройство выполнено в виде устройства сдвига коэффициентов для осуществления циклического сдвига коэффициентов пары полиномов P(z) и Q(z) или одного или более полиномов, выведенных из пары полиномов P(z) и Q(z).

Согласно предпочтительному варианту осуществления изобретения, устройство сдвига коэффициентов выполнено с возможностью осуществления циклического сдвига коэффициентов таким образом, чтобы первоначальная средняя точка последовательности коэффициентов сдвигалась к первой позиции последовательности.

Теоретически, общеизвестно, что преобразование Фурье симметричной последовательности является действительнозначным, и антисимметричные последовательности имеют чисто мнимые Фурье-спектры. В данном случае, наша входная последовательность представляет собой коэффициенты полинома P(z) или Q(z), который имеет длину m+l, тогда как предпочтительно иметь дискретное преобразование Фурье гораздо большей длины N>>(m+l). Традиционный подход к формированию более длинных Фурье-спектров предусматривает заполнение нулями входного сигнала. Однако заполнение последовательности нулями необходимо реализовать аккуратно, чтобы сохранить свойства симметрии.

Рассмотрим сначала полином P(z) с коэффициентами

[p₀, p₁, p₂, p₁, p₀].

При обычном применении алгоритмов FFT требуется, чтобы первым элементом была точка симметрии, благодаря чему, при применении, например, в MATLAB, можно записать

fft([p₂, p₁, p₀, p₀, p₁])

для получения действительнозначного выходного сигнала. В частности, можно применять циклический сдвиг, в результате чего точка симметрии, соответствующая элементу средней точки, то есть коэффициент p₂, сдвигается влево и оказывается в первой позиции. Затем коэффициенты, находившиеся слева от p₂, присоединяются к концу последовательности.

Для заполненной нулями последовательности

[p₀, p₁, p₂, p₁, p₀, 0, 0... 0]

можно применять тот же процесс. Последовательность

[p₂, p₁, p₀, 0, 0... 0, p₀, p₁]

таким образом, будет иметь действительнозначное дискретное преобразование Фурье. При этом количество нулей во входных последовательностях равно N-m-l, если N - нужная длина спектра.

Соответственно, рассмотрим коэффициенты

[q₀, q₁, 0, -q₁, -q₀],

соответствующие полиному Q(z). Применяя циклический сдвиг, при котором предыдущая средняя точка переходит в первую позицию, получаем последовательность

[0, -q₁, -q₀, q₀, q₁],

которая имеет чисто мнимое дискретное преобразование Фурье. Затем преобразование с заполнением нулями можно использовать для последовательности

[0, -q₁, -q₀, 0, 0... 0, q₀, q₁].

Заметим, что вышеупомянутое применяется только для случаев, когда длина последовательности является нечетной, благодаря чему, m+l является четным. Для случаев, когда m+l нечетно, существует два варианта. Можно реализовать циклический сдвиг в частотной области либо применять DFT с полувыборками (см. ниже).

Согласно предпочтительному варианту осуществления изобретения, регулировочное устройство выполнено в виде фазовращателя для осуществления сдвига фазы выходного сигнала устройства преобразования Фурье.

Согласно предпочтительному варианту осуществления изобретения, фазовращатель выполнен с возможностью осуществления сдвига фазы выходного сигнала устройства преобразования Фурье путем умножения k-го элемента разрешения по частоте на exp(i2πkh/N), где N - длина выборки, и h=(m+l)/2.

Общеизвестно, что циклический сдвиг во временной области эквивалентен чередованию фаз в частотной области. В частности, сдвиг на h=(m+l)/2 шагов во временной области соответствует умножению k-го элемента разрешения по частоте на exp(-i2πkh/N), где N - длина спектра. Вместо циклического сдвига, можно, таким образом, применять умножение в частотной области для получения в точности такого же результата. Этот подход немного увеличивает сложность. Заметим, что h=(m+l)/2 является целым числом только при четном m+l. При нечетном m+l, циклический сдвиг потребует задержки на рациональное число шагов, что трудно реализовать напрямую. Вместо этого, можно применять соответствующий сдвиг в частотной области путем вышеописанного чередования фаз.

Альтернативно можно реализовать DFT с полувыборками. В частности, в то время как традиционное DFT задается в виде

(2)

DFT с полувыборками можно задать в виде

(3)

Для этого представления легко разработать быструю реализацию в виде FFT.

Преимущество этого представления состоит в том, что теперь точка симметрии находится в n=1/2 вместо обычного n=1. Это DFT с полувыборками позволяет, с помощью последовательности

[2, 1, 0, 0, 1, 2],

получать действительнозначный Фурье-спектр.

В случае нечетного m+l, для полинома P(z) с коэффициентами p₀, p₁, p₂, p₂, p₁, p₀ можно, посредством DFT с полувыборками и заполнения нулями, получить действительнозначный спектр, когда входная последовательность представляет собой

[p₂, p₁, p₀, 0, 0... 0, p₀, p₁, p₂].

Соответственно, для полинома Q(z) можно применять DFT с полувыборками к последовательности

[-q₂, -q₁, -q₀, 0, 0... 0, q₀, q₁, q₂]

для получения чисто мнимого спектра.

Согласно этим способам, для любой комбинации m и l, можно получить действительнозначный спектр для полинома P(z) и чисто мнимый спектр для любого Q(z). Фактически, поскольку спектры P(z) и Q(z) являются чисто действительными и мнимыми, соответственно, их можно сохранять в едином комплексном спектре, который в этом случае соответствует спектру P(z)+Q(z)=2A(z). Масштабирование с коэффициентом 2 не изменяет положение корней, поэтому его можно игнорировать. Таким образом, спектры P(z) и Q(z) можно получать, оценивая только спектр A(z) с использованием единого FFT. Необходимо применять только циклический сдвиг, как объяснено выше, к коэффициентам A(z).

Например, при m=4 и l=0, коэффициенты A(z) образуют последовательность

[a₀, a₁, a₂, a₃, a₄]

которую можно заполнять нулями до произвольной длины N в виде

[a₀, a₁, a₂, a₃, a₄, 0, 0... 0].

Если затем применить циклический сдвиг на (m+l)/2=2 шага, получится

[a₂, a₃, a₄, 0, 0... 0, a₀, a₁].

Произведя DFT этой последовательности, можно получить спектр P(z) и Q(z) в действительных и комплексных частях спектра.

Согласно предпочтительному варианту осуществления изобретения, преобразователь выполнен таким образом, что строго действительный спектр, выведенный из P(z), и строго мнимый спектр из Q(z) устанавливаются посредством единого преобразования Фурье, например, быстрого преобразования Фурье (FFT), путем преобразования составного полинома C(P(z), Q(z)).

Полином P(z) симметричен, и полином Q(z) антисимметричен, с осью симметрии в z^-(m+l)/2. Отсюда следует, что спектры z^-(m+l)/2P(z) и z^-(m+l)/2Q(z), соответственно, оцененные на единичной окружности z=exp(iθ), имеют действительные и комплексные значения, соответственно. Поскольку нули располагаются на единичной окружности, их можно найти посредством поиска пересечений нуля. Кроме того, оценивание на единичной окружности можно реализовать просто посредством быстрого преобразования Фурье.

Поскольку спектры, соответствующие z^-(m+l)/2P(z) и z^-(m+l)/2Q(z), являются действительными и комплексными, соответственно, 2z^-(m+l)/2A(z) можно реализовать посредством единого быстрого преобразования Фурье. В частности, если взять сумму z^-(m+l)/2(P(z)+Q(z)), то действительные и комплексные части спектров соответствуют z^-(m+l)/2P(z) и z^-(m+l)/2Q(z), соответственно. Кроме того, поскольку

z^-(m+l)/2(P(z)+Q(z))=2z^-(m+l)/2A(z), (4)

можно напрямую брать FFT от 2z^-(m+l)/2A(z) для получения спектров, соответствующих z^-(m+l)/2P(z) и z^-(m+l)/2Q(z), не определяя в явном виде P(z) и Q(z). Поскольку интерес представляют только положения нулей, можно исключить умножение на скаляр 2 и вместо этого оценивать z^-(m+l)/2A(z) с помощью FFT. Заметим, что, поскольку A(z) имеет только m+1 ненулевых коэффициентов, для снижения сложность можно использовать урезанное FFT [11]. Чтобы гарантировать, что найдены все корни, следует использовать FFT достаточно большой длины N, с которой спектр оценивается на, по меньшей мере, одной частоте между каждыми двумя нулями.

Согласно предпочтительному варианту осуществления изобретения, преобразователь содержит ограничительное устройство для ограничения числового диапазона спектров полиномов P(z) и Q(z) путем умножения полиномов P(z) и Q(z) или одного или более полиномов, выведенных из полиномов P(z) и Q(z), на фильтрационный полином B(z), причем фильтрационный полином B(z) симметричен и не имеет корней на единичной окружности.

Речевые кодеки часто реализуются на мобильном устройстве с ограниченными ресурсами, в связи с чем, числовые операции нужно реализовать посредством представлений фиксированной точки. Поэтому важно, чтобы реализуемые алгоритмы действовали с числовыми представлениями ограниченного диапазона. Однако для спектральных огибающих обычной речи, числовой диапазон Фурье-спектра настолько велик, что требуется 32-битовая реализация FFT, чтобы гарантировать, что положение пересечений нуля остаются неизменными.

С другой стороны, 16-битовое FFT часто реализуется с более низкой сложностью, в связи с чем, полезно ограничивать диапазон спектральных значений для согласования с этим 16-битовым диапазоном. Из уравнений |P(e^iθ)|≤2|A(e^iθ)| и |Q(e^iθ)|≤2|A(e^iθ)| следует, что ограничение числового диапазона B(z)A(z) влечет за собой ограничение числового диапазона B(z)P(z) и B(z)Q(z). Если B(z) не имеет нулей на единичной окружности, то B(z)P(z) и B(z)Q(z) будут иметь то же самое пересечение нуля на единичной окружности, что и P(z) и Q(z). Кроме того, B(z) должен быть симметричен, чтобы z^-(m+l+n)/2P(z)B(z) и z^-(m+l+n)/2Q(z)B(z) оставались симметричным и антисимметричным и их спектры были чисто действительным и мнимым, соответственно. Таким образом, вместо того, чтобы оценивать спектр z^(n+l)/2A(z), можно оценивать z^(n+l+n)/2A(z)B(z), где B(z) - симметричный полином n-го порядка, не имеющий корней на единичной окружности. Другими словами, можно применять вышеописанный подход, но сначала умножать A(z) на фильтр B(z) и применять видоизмененный фазовый сдвиг z^-(m+l+n)/2.

B₁(z)=β₀+β₁z^-1+β₂z^-2 (5)

где β_k∈R являются параметрами, и |β₂|>2|β₁|. Регулируя β_k, можно изменять наклон спектра и, таким образом, уменьшать числовой диапазон произведения A(z)B₁(z). Очень вычислительно эффективный подход состоит в выборе β таким образом, чтобы величины на нулевой частоте и частоте Найквиста были равны, |A(1)B₁(1)|=|A(-1)B₁(-1)|, например, можно выбрать

β₀=A(1)-A(-1) и β₁=2(A(1)+A(-1)). (6)

Этот подход обеспечивает приблизительно плоский спектр.

Можно видеть (см. также фиг. 5) что A(z) пропускает высокие частоты, и B₁(z) пропускает низкие частоты, благодаря чему, произведение A(z)B₁(z), предположительно, имеет одинаковую величину на нулевой частоте и частоте Найквиста и имеет более или менее плоскую частотную характеристику. Поскольку B₁(z) имеет только одну степень свободы, очевидно, трудно предположить, что произведение будет иметь совершенно плоскую частотную характеристику. Тем не менее, заметим, что отношение между самым высоким пиком и самой низкой впадиной B₁(z)A(z) может быть много меньше, чем у A(z). Это означает, что получен нужный результат; числовой диапазон B₁(z)A(z) много меньше, чем у A(z).

Второй, немного более сложный, способ предусматривает вычисление автокорреляции r_k импульсной характеристики A(0,5z). В данном случае, умножение на 0,5 перемещает нули A(z) в направлении начала, благодаря чему, спектральная величина снижается приблизительно наполовину. Благодаря применению алгоритма Левинсона-Дарбина к автокорреляции r_k, получается минимально-фазовый фильтр H(z) n-го порядка. В этом случае можно задать B₂(z)=z^-nH(z)H(z^-1) для получения приблизительно постоянного |B₂(z)A(z)|. Заметим, что диапазон |B₂(z)A(z)| меньше, чем у |B₁(z)A(z)|. Дополнительные подходы к конструированию B(z) легко найти в классической литературе по конструированию КИХ-фильтров [18].

Согласно предпочтительному варианту осуществления изобретения, преобразователь содержит ограничительное устройство для ограничения числового диапазона спектров удлиненных полиномов P_e(z) и Q_e(z) или одного или более полиномов, выведенных из удлиненных полиномов P_e(z) и Q_e(z) путем умножения удлиненных полиномов P_e(z) и Q_e(z) на фильтрационный полином B(z), причем фильтрационный полином B(z) симметричен и не имеет корней на единичной окружности. B(z) можно найти, как объяснено выше.

В дополнительном аспекте для решения задачи предусмотрен способ работы информационного кодера для кодирования информационного сигнала. Способ содержит этапы:

анализа информационного сигнала для получения коэффициентов линейного предсказания предсказательного полинома A(z);

преобразования коэффициентов линейного предсказания предсказательного полинома A(z) в значения частоты f₁…f_n спектрального частотного представления предсказательного полинома A(z), причем значения частоты f₁…f_n определяются путем анализа пары полиномов P(z) и Q(z), заданных в виде

P(z)=A(z)+(z^-m-l)A(z^-1) и

Q(z)=A(z)-(z^-m-l)A(z^-1),

где m - порядок предсказательного полинома A(z) и l больше или равно нулю, причем значения частоты f₁…f_n получаются путем установления строго действительного спектра, выведенного из P(z) и строго мнимого спектра из Q(z) и путем идентификации нулей строго действительного спектра, выведенного из P(z), и строго мнимого спектра, выведенного из Q(z);

получения квантованных значений частоты f_q1…f_qn из значений частоты f₁…f_n; и

формирования битового потока, содержащего квантованные значения частоты f_q1…f_qn.

Кроме того, предусмотрена программа, именуемая компьютерной программой для, при исполнении на процессоре, выполнения способа согласно изобретению.

Предпочтительные варианты осуществления изобретения рассмотрены со ссылкой на прилагаемые чертежи, в которых:

фиг. 1 демонстрирует вариант осуществления информационного кодера согласно изобретению в схематическом виде;

фиг. 2 демонстрирует иллюстративное соотношение A(z), P(z) и Q(z);

фиг. 3 демонстрирует первый вариант осуществления преобразователя информационного кодера согласно изобретению в схематическом виде;

фиг. 4 демонстрирует второй вариант осуществления преобразователя информационного кодера согласно изобретению в схематическом виде;

фиг. 5 демонстрирует иллюстративный спектр величины предсказателя A(z), соответствующих выравнивающих фильтров B₁(z) и B₂(z) и произведений A(z)B₁(z) и A(z)B₂(z);

фиг. 6 демонстрирует третий вариант осуществления преобразователя информационного кодера согласно изобретению в схематическом виде;

фиг. 7 демонстрирует четвертый вариант осуществления преобразователя информационного кодера согласно изобретению в схематическом виде; и

фиг. 8 демонстрирует пятый вариант осуществления преобразователя информационного кодера согласно изобретению в схематическом виде.

Фиг. 1 демонстрирует вариант осуществления информационного кодера 1 согласно изобретению в схематическом виде.

Информационный кодер 1 для кодирования информационного сигнала IS содержит:

анализатор 2 для анализа информационного сигнала IS для получения коэффициентов линейного предсказания предсказательного полинома A(z);

преобразователь 3 для преобразования коэффициентов линейного предсказания предсказательного полинома A(z) в значения частоты f₁…f_n спектрального частотного представления RES, IES предсказательного полинома A(z), причем преобразователь 3 выполнен с возможностью определения значений частоты f₁…f_n путем анализа пары полиномов P(z) и Q(z), заданных в виде

P(z)=A(z)+(z^-m-l)A(z^-1) и

Q(z)=A(z)-(z^-m-l)A(z^-1),

где m - порядок предсказательного полинома A(z) и l больше или равно нулю, причем преобразователь 3 выполнен с возможностью получения значений частоты f₁…f_n путем установления строго действительного спектра RES выведенный из P(z) и строго мнимого спектра IES из Q(z) и путем идентификации нулей строго действительного спектра RES, выведенного из P(z), и строго мнимого спектра IES, выведенного из Q(z);

квантователь 4 для получения квантованных значений частоты fq₁…fq_n из значений частоты f₁…f_n; и

формирователь 5 битового потока для формирования битового потока BS, содержащего квантованные значения частоты f_q1…f_qn.

Информационный кодер 1 согласно изобретению использует поиск пересечения нуля, тогда как спектральный подход для отыскания корней согласно уровню техники опирается на отыскание впадин в спектре величины. Однако поиск впадин менее точен, чем поиск пересечений нуля. Рассмотрим, например, последовательность [4, 2, 1, 2, 3]. Очевидно, наименьшее значение имеет третий элемент, в соответствии с чем, нуль находится где-то между вторым и четвертым элементом. Другими словами, невозможно определить, находится ли нуль справа или слева от третьего элемента. Если же рассмотреть последовательность [4, 2, 1, -2, -3], можно сразу же понять, что пересечение нуля находится между третьим и четвертым элементами, благодаря чему, предел погрешности снижается наполовину. Отсюда следует, что, согласно подходу спектра величины, требуется вдвое больше точек анализа для получения той же точности, что и при поиске пересечений нуля.

Основные свойства предложенного информационного кодера 1, таким образом, дают возможность получать такую же или более высокую точность, чем способ на основе преобразования Чебышева, поскольку поиск пересечений нуля и преобразование из временной области в частотную область осуществляются, таким образом, что нули можно найти очень низкой вычислительной сложностью.

В результате, информационный кодер 1 согласно изобретению определяет нули (корни) не только более точно, но и с низкой вычислительной сложностью.

Информационный кодер 1 согласно изобретению можно использовать в любом приложении обработки сигнала, которому нужно определять линейный спектр последовательности. Данный информационный кодер 1 рассмотрен в порядке иллюстрации в контексте кодирования речи. Изобретение применимо в устройстве или приложении кодирования речевого, аудио и/или видеосигнала, использующем линейный предсказатель для моделирования огибающей спектральной величины, перцептивного порога частотного маскирования, огибающей временной величины, перцептивного порога временного маскирования или других форм огибающей или других представлений, эквивалентных форме огибающей, например, сигнала автокорреляции, использующем линейный спектр для представления информации огибающей, для кодирования, анализа или обработки, которому требуется способ определения линейного спектра из входного сигнала, например, речевого или общего аудиосигнала, и где входной сигнал представляется как цифровой фильтр или другая последовательность чисел.

Информационный сигнал IS может представлять собой, например, аудиосигнал или видеосигнал.

Фиг. 2 демонстрирует иллюстративное соотношение A(z), P(z) и Q(z). Вертикальные штриховые линии изображают значения частоты f₁…f₆. Заметим, что величина выражается на линейной оси, а не на логарифмической шкале, чтобы пересечения нуля оставались видимыми. Можно видеть, что линейные спектральные частоты возникают в пересечениях нуля P(z) и Q(z). Кроме того, величины P(z) и Q(z) везде меньше или равны 2|A(z)|; |P(e^iθ)|≤2|A(e^iθ)| и |Q(e^iθ)|≤2|A(e^iθ)|.

Фиг. 3 демонстрирует первый вариант осуществления преобразователя информационного кодера согласно изобретению в схематическом виде.

Согласно предпочтительному варианту осуществления изобретения, преобразователь 3 содержит определяющее устройство 6 для определения полиномов P(z) и Q(z) из предсказательного полинома A(z).

Согласно предпочтительному варианту осуществления изобретения, преобразователь содержит устройство преобразования Фурье 8 для осуществления преобразования Фурье над парой полиномов P(z) и Q(z) или одним или более полиномов, выведенных из пары полиномов P(z) и Q(z), в частотную область и регулировочное устройство 7 для регулировки фазы спектра RES выведенного из P(z), таким образом, чтобы он был строго действительным, и для регулировки фазы спектра IES выведенного из Q(z), таким образом, чтобы он был строго мнимым. Устройство 8 преобразования Фурье может действовать на основе быстрого преобразования Фурье или дискретного преобразования Фурье.

Согласно предпочтительному варианту осуществления изобретения регулировочное устройство 7 выполнено в виде устройства 7 сдвига коэффициентов для осуществления циклического сдвига коэффициентов пары полиномов P(z) и Q(z) или одного или более полиномов, выведенных из пары полиномов P(z) и Q(z).

Согласно предпочтительному варианту осуществления изобретения, устройство 7 сдвига коэффициентов выполнено с возможностью осуществления циклического сдвига коэффициентов таким образом, чтобы первоначальная средняя точка последовательности коэффициентов сдвигалась к первой позиции последовательности.

Рассмотрим сначала полином P(z) с коэффициентами

[p₀, p₁, p₂, p₁, p₀].

При обычном применении алгоритмов быстрого преобразования Фурье требуется, чтобы первым элементом была точка симметрии, благодаря чему, при применении, например, в MATLAB, можно записать

fft([p₂, p₁, p₀, p₀, p₁])

Для заполненной нулями последовательности

[p₀, p₁, p₂, p₁, p₀, 0, 0, …, 0]

можно применять тот же процесс. Последовательность

[p₂, p₁, p₀, 0, 0, …, 0, p₀, p₁]

Соответственно, рассмотрим коэффициенты

[q₀, q₁, 0, -q₁, -q₀],

[0, -q₁, -q₀, q₀, q₁],

[0, -q₁, -q₀, 0, 0... 0, q₀, q₁]

Согласно предпочтительному варианту осуществления изобретения, преобразователь 3 содержит идентификатор 9 нулей для идентификации нулей строго действительного спектра RES, выведенного из P(z), и строго мнимого спектра IES, выведенного из Q(z).

Согласно предпочтительному варианту осуществления изобретения, идентификатор 9 нулей выполнен с возможностью идентификации нулей посредством

a) начинания с действительного спектра RES на нулевой частоте;

b) увеличения частоты, пока перемена знака в действительном спектре RES обнаружена;

c) увеличения частоты, пока не будет обнаружена дополнительная перемена знака в мнимом спектре IES; и

d) повторения этапов b) и c), пока не будут обнаружены все нули.

Заметим, что Q(z) и, таким образом, мнимая часть IES спектра всегда имеет нуль на нулевой частоте. Поскольку корни перекрываются, P(z) и, таким образом, действительная часть RES спектра всегда будет отлична от нуля на нулевой частоте. Поэтому можно начинать с действительной части RES на нулевой частоте и увеличивать частоту, пока не будет обнаружена первая перемена знака, которая указывает первое пересечение нуля и, таким образом, первое значение частоты f₁.

Поскольку корни чередуются, спектр IES Q(z) будет иметь следующую перемену знака. Таким образом, можно увеличивать частоту, пока не будет обнаружена перемена знака для спектра IES Q(z). Этот процесс может повторяться, перемежаясь между спектрами P(z) и Q(z), пока не будут найдены все значения частоты f₁…f_n. Таким образом, подход, используемый для определения положения пересечения нуля в спектрах RES и IES, аналогичен подходу, применяемому в области преобразования Чебышева [6, 7].

Поскольку нули P(z) и Q(z) чередуются, можно попеременно искать нули на действительных частях RES и комплексных частях IES, что позволяет находить все нули за один проход, и наполовину снижать сложность по сравнению с полным поиском.

Согласно предпочтительному варианту осуществления изобретения, идентификатор 9 нулей выполнен с возможностью идентификации нулей посредством интерполяции.

Фиг. 4 демонстрирует второй вариант осуществления преобразователя 3 информационного кодера 1 согласно изобретению в схематическом виде.

Согласно предпочтительному варианту осуществления изобретения, преобразователь 3 содержит устройство заполнения нулями 10 для добавления одного или более коэффициентов, имеющих значение ʺ0ʺ, к полиномам P(z) и Q(z) для формирования пары удлиненных полиномов P_e(z) и Q_e(z). Точность можно дополнительно повысить за счет увеличения длины оцененного спектра RES, IES. На основании информации о системе, в ряде случаев фактически возможно определить минимальное расстояние между значениями частоты f₁…f_n, и, таким образом, определить минимальную длину спектра RES, IES, с помощью которой можно найти все значения частоты f₁…f_n [8].

Согласно предпочтительному варианту осуществления изобретения, преобразователь 3 выполнен таким образом, что в ходе преобразования коэффициентов линейного предсказания в значения частоты f₁…f_n, спектрального частотного представления RES, IES предсказательного полинома A(z) исключается, по меньшей мере, часть операций с коэффициентами, про которые известно, что они имеют значение ʺ0ʺ, удлиненных полиномов P_e(z) и Q_e(z).

Согласно предпочтительному варианту осуществления изобретения, преобразователь содержит ограничительное устройство 11 для ограничения числового диапазона спектров удлиненных полиномов P_e(z) и Q_e(z) или одного или более полиномов, выведенных из удлиненных полиномов P_e(z) и Q_e(z) путем умножения удлиненных полиномов P_e(z) и Q_e(z) на фильтрационный полином B(z), причем фильтрационный полином B(z) симметричен и не имеет корней на единичной окружности. B(z) можно найти, как объяснено выше.

Фиг. 5 демонстрирует иллюстративный спектр величины предсказателя A(z), соответствующих выравнивающих фильтров B₁(z) и B₂(z) и произведений A(z)B₁(z) и A(z)B₂(z). Горизонтальная пунктирная линия демонстрирует уровень A(z)B1(z) на нулевой частоте и частоте Найквиста.

Согласно предпочтительному варианту осуществления (не показан) изобретения, преобразователь 3 содержит ограничительное устройство 11 для ограничения числового диапазона спектров RES, IES полиномов P(z) и Q(z) путем умножения полиномов P(z) и Q(z) или одного или более полиномов, выведенных из полиномов P(z) и Q(z), на фильтрационный полином B(z), причем фильтрационный полином B(z) симметричен и не имеет корней на единичной окружности.

Остается задача сконструировать фильтр B(z), ограничивающий числовой диапазон A(z)B(z), с тем условием, что B(z) должен быть симметричным и не иметь корней на единичной окружности. Простейший фильтр, удовлетворяющий требованиям, представляет собой линейно-фазовый фильтр 2-го порядка B₁(z)=β₀+β₁z^-1+β₂z^-2, где β_k∈R являются параметрами, и |β₂|>2|β₁|. Регулируя β_k, можно изменять наклон спектра и, таким образом, уменьшать числовой диапазон произведения A(z)B₁(z). Очень вычислительно эффективный подход состоит в выборе β таким образом, чтобы величины на нулевой частоте и частоте Найквиста были равны, |A(1)B₁(1)|=|A(-1)B₁(-1)|, например, можно выбрать β₀=A(1)-A(-1) и β₁=2(A(1)+A(-1)).

Этот подход обеспечивает приблизительно плоский спектр.

Из фиг. 5 можно видеть что A(z) пропускает высокие частоты, и B₁(z) пропускает низкие частоты, благодаря чему, произведение A(z)B₁(z), предположительно, имеет одинаковую величину на нулевой частоте и частоте Найквиста и имеет более или менее плоскую частотную характеристику. Поскольку B₁(z) имеет только одну степень свободы, очевидно, трудно предположить, что произведение будет иметь совершенно плоскую частотную характеристику. Тем не менее, заметим, что отношение между самым высоким пиком и самой низкой впадиной B₁(z)A(z) может быть много меньше, чем у A(z). Это означает, что получен нужный результат; числовой диапазон B₁(z)A(z) много меньше, чем у A(z).

Фиг. 6 демонстрирует третий вариант осуществления преобразователя 3 информационного кодера 1 согласно изобретению в схематическом виде.

Согласно предпочтительному варианту осуществления изобретения регулировочное устройство 12 выполнено в виде фазовращателя 12 для осуществления сдвига фазы выходного сигнала устройства преобразования Фурье 8.

Согласно предпочтительному варианту осуществления изобретения, фазовращатель 12 выполнен с возможностью осуществления сдвига фазы выходного сигнала устройства преобразования Фурье 8 путем умножения k-го элемента разрешения по частоте на exp(i2πkh/N), где N - длина выборки, и h=(m+l)/2.

Фиг. 7 демонстрирует четвертый вариант осуществления преобразователя 3 информационного кодера 1 согласно изобретению в схематическом виде.

Согласно предпочтительному варианту осуществления изобретения, преобразователь 3 содержит формирователь составного полинома 13 выполненный с возможностью установления составного полинома C(P(z), Q(z)) из полиномов P(z) и Q(z).

Согласно предпочтительному варианту осуществления изобретения, преобразователь 3 выполнен таким образом, что строго действительный спектр, выведенный из P(z), и строго мнимый спектр из Q(z) устанавливаются посредством единого преобразования Фурье, например, быстрого преобразования Фурье (FFT), путем преобразования составного полинома C(P(z), Q(z)).

Поскольку спектры, соответствующие z^-(m+l)/2P(z) и z^-(m+l)/2Q(z), являются действительными и комплексными, соответственно, их можно реализовать посредством единого быстрого преобразования Фурье. В частности, если взять сумму z^-(m+l)/2(P(z)+Q(z)), то действительные и комплексные части спектров соответствуют z^-(m+l)/2P(z) и z^-(m+l)/2Q(z), соответственно. Кроме того, поскольку z^-(m+l)/2(P(z)+Q(z))=2z^-(m+l)/2A(z), можно напрямую брать FFT от 2z^-(m+l)/2A(z) для получения спектров, соответствующих z^-(m+l)/2P(z) и z^-(m+l)/2Q(z), не определяя в явном виде P(z) и Q(z). Поскольку интерес представляют только положения нулей, можно исключить умножение на скаляр 2 и вместо этого оценивать z^-(m+l)/2A(z) с помощью FFT. Заметим, что, поскольку A(z) имеет только m+1 ненулевых коэффициентов, для снижения сложность можно использовать урезанное FFT [11]. Чтобы гарантировать, что найдены все корни, следует использовать FFT достаточно большой длины N, с которой спектр оценивается на, по меньшей мере, одной частоте между каждыми двумя нулями.

Согласно предпочтительному варианту осуществления (не показан) изобретения, преобразователь 3 содержит формирователь составного полинома, выполненный с возможностью установления составного полинома C_e(P_e(z), Q_e(z)) из удлиненных полиномов P_e(z) и Q_e(z).

Согласно предпочтительному варианту осуществления (не показан) изобретения, преобразователь выполнен таким образом, что строго действительный спектр, выведенный из P(z), и строго мнимый спектр из Q(z) устанавливаются посредством единого преобразования Фурье путем преобразования составного полинома C_e(P_e(z), Q_e(z)).

Фиг. 8 демонстрирует пятый вариант осуществления преобразователя 3 информационного кодера 1 согласно изобретению в схематическом виде.

Согласно предпочтительному варианту осуществления изобретения, преобразователь 3 содержит устройство преобразования Фурье 14 для осуществления преобразования Фурье над парой полиномов P(z) и Q(z) или одним или более полиномов, выведенных из пары полиномов P(z) и Q(z), в частотную область с половиной выборок таким образом, чтобы спектр, выведенный из P(z), был строго действительным, и таким образом, чтобы спектр, выведенный из Q(z), был строго мнимым.

DFT с полувыборками можно задать в виде

Для этого представления легко разработать быструю реализацию в виде FFT.

[2, 1, 0, 0, 1, 2]

получать действительнозначный Фурье-спектр RES.

В случае нечетного m+l, для полинома P(z) с коэффициентами p₀, p₁, p₂, p₂, p₁, p₀ можно, посредством DFT с полувыборками и заполнения нулями, получить действительнозначный спектр RES, когда входная последовательность представляет собой

[p₂, p₁, p₀, 0, 0... 0, p₀, p₁, p₂].

Соответственно, для полинома Q(z) можно применять DFT с полувыборками к последовательности

[-q₂, -q₁, -q₀, 0, 0... 0, q₀, q₁, q₂]

для получения чисто мнимого спектра IES.

Например, при m=4 и l=0, коэффициенты A(z) образуют последовательность

[a₀, a₁, a₂, a₃, a₄],

которую можно заполнять нулями до произвольной длины N в виде

[a₀, a₁, a₂, a₃, a₄, 0, 0... 0].

Если затем применить циклический сдвиг на (m+l)/2=2 шага, получится

[a₂, a₃, a₄, 0, 0... 0, a₀, a₁].

Произведя DFT этой последовательности, можно получить спектр P(z) и Q(z) в действительных частях RES и комплексных частях IES спектра.

Общий алгоритм в случае четного m+l можно задать следующим образом. Пусть коэффициенты A(z), обозначенные a_k, располагаются в буфере длиной N.

1. Применить циклический сдвиг к a_k на (m+l)/2 шагов влево.

2. Вычислить быстрое преобразование Фурье последовательности a_k и обозначить его A_k.

3. Пока не будут найдены все значения частоты, начинать с k=0 и попеременно

(a) пока sign(real(A_k))=sign(real(A_k+1)) увеличивать k:=k+1. Найдя пересечение нуля, сохранить k в списке значений частоты.

(b) пока sign(imag(A_k))=sign(imag(A_k+1)) увеличивать k:=k+1. Найдя пересечение нуля, сохранить k в списке значений частоты.

4. Для каждого значения частоты, интерполировать между A_k и A_k+1 для определения точной позиции.

Здесь функции sign(x), real(x) и imag(x) означают знак x, действительную часть x и мнимую часть x, соответственно.

Для случая нечетного m+l, циклический сдвиг уменьшается до только (m+l-1)/2 шагов влево, и стандартное быстрое преобразование Фурье заменяется быстрым преобразованием Фурье с полувыборками.

Альтернативно, всегда можно заменить комбинацию циклического сдвига и 1-го преобразования Фурье быстрым преобразованием Фурье и фазовым сдвигом в частотной области.

Для более точного определения положения корней, можно использовать предложенный выше способ для обеспечения первого предположения и затем применять второй этап для уточнения положения корней. Для уточнения можно применять любой классический метод отыскания корней полинома, например, метод Дюрана-Кернера, Аберта-Эрлиха, Лагерра, Гаусса-Ньютона или другие [11-17].

В одном представлении, представленный способ состоит из следующих этапов:

(a) Для последовательности длиной m+l+1, заполненной нулями до длины N, где m+l четно, применения циклического сдвига на (m+l)/2 шагов влево, таким образом, что длина буфера равна N и соответствует нужной длине выходного спектра, или

для последовательности длиной m+l+1, заполненной нулями до длины N, где m+l нечетно, применения циклического сдвига на (m+l-1)/2 шагов влево, таким образом, что длина буфера равна N и соответствует нужной длине выходного спектра.

(b) При четном m+l, применения к последовательности стандартного DFT. При нечетном m+l, применения к последовательности DFT с полувыборками, как описано в ур. 3 или эквивалентном представлении.

(c) Если входной сигнал симметричен или антисимметричен, поиска пересечений нуля представления в частотной области и сохранения положений в списке.

Если входной сигнал является составной последовательностью B(z)=P(z)+Q(z), поиска пересечений нуля в действительной и мнимой части представления в частотной области и сохранения положений в списке. Если входной сигнал является составной последовательностью B(z)=P(z)+Q(z), и корни P(z) и Q(z) перемежаются или имеют аналогичную структуру, поиска пересечений нуля попеременно в действительной и мнимой части представления в частотной области и сохранения положений в списке.

В другом представлении, представленный способ состоит из следующих этапов

(a) Для входного сигнала, имеющего такую же форму, как в предыдущем пункте, применения DFT к входной последовательности.

(b) Применения чередования фаз к значениям в частотной области, что эквивалентно циклическому сдвигу входного сигнала на (m+l)/2 шагов влево.

В отношении кодера 1 и способов описанных вариантов осуществления отметим следующее:

Хотя некоторые аспекты были описаны в контексте устройства, ясно, что эти аспекты также представляют описание соответствующего способа, где блок или устройство соответствует этапу способа или признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа также представляют описания соответствующего блока или элемента или признака соответствующего устройства.

В зависимости от конкретных требований реализации, варианты осуществления изобретения можно реализовать аппаратными средствами или программными средствами. Реализацию можно осуществлять с использованием цифрового носителя данных, например, флоппи-диска, DVD, CD, ROM, PROM, EPROM, EEPROM или флэш-памяти, на котором хранятся электронно считываемые сигналы управления, которые взаимодействуют (или способны взаимодействовать) с программируемой компьютерной системой для осуществления соответствующего способа.

Некоторые варианты осуществления согласно изобретению содержат среду переноса данных, имеющую электронно считываемые сигналы управления, которые способны взаимодействовать с программируемой компьютерной системой для осуществления одного из описанных здесь способов.

В общем случае, варианты осуществления настоящего изобретения можно реализовать в виде компьютерного программного продукта с программным кодом, причем программный код пригоден для осуществления одного из способов при выполнении компьютерного программного продукта на компьютере. Программный код может, например, храниться на машиночитаемом носителе.

Другие варианты осуществления содержат компьютерную программу для осуществления одного из описанных здесь способов, хранящуюся на машиночитаемом носителе или нетранзиторном носителе данных.

Другими словами, вариант осуществления способа, отвечающего изобретению, предусматривает, таким образом, компьютерную программу, имеющую программный код для осуществления одного из описанных здесь способов при выполнении компьютерной программы на компьютере.

Дополнительный вариант осуществления способов, отвечающих изобретению, предусматривает, таким образом, среду переноса данных (или цифровой носитель данных или компьютерно-считываемый носитель), на котором записана компьютерная программа для осуществления одного из описанных здесь способов.

Дополнительный вариант осуществления способа, отвечающего изобретению, предусматривает, таким образом, поток данных или последовательность сигналов, представляющих компьютерную программу для осуществления одного из описанных здесь способов. Поток данных или последовательность сигналов может, например, переноситься через соединение с возможностью передачи данных, например, через интернет.

Дополнительный вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, выполненное с возможностью или адаптированное для осуществления одного из описанных здесь способов.

Дополнительный вариант осуществления содержит компьютер с установленной на нем компьютерной программой для осуществления одного из описанных здесь способов.

В некоторых вариантах осуществления, программируемое логическое устройство (например, вентильная матрица, программируемая пользователем) может использоваться для осуществления некоторых или всех функциональных возможностей описанных здесь способов. В некоторых вариантах осуществления, вентильная матрица, программируемая пользователем может взаимодействовать с микропроцессором для осуществления одного из описанных здесь способов. В общем случае, способы преимущественно осуществляются любым аппаратным устройством.

Хотя это изобретение описано применительно к некоторым вариантам осуществления, допустимы изменения, перестановки и эквиваленты, не выходящие за рамки объема этого изобретения. Следует также заметить, что существует много альтернативных путей осуществления способов и составов настоящего изобретения. Поэтому нижеследующую формулу изобретения следует рассматривать как включающую в себя все подобные изменения, перестановки и эквиваленты, отвечающие истинной сущности и объему настоящего изобретения.

Ссылочные позиции:

1 информационный кодер

2 анализатор

3 преобразователь

4 квантователь

5 формирователь битового потока

6 определяющее устройство

7 устройство сдвига коэффициентов

8 устройство преобразования Фурье

9 идентификатор нулей

10 устройство заполнения нулями

11 ограничительное устройство

12 фазовращатель

13 формирователь составного полинома

14 устройство преобразования Фурье с половинными выборками

IS информационный сигнал

RES действительный спектр

IES мнимый спектр

f₁…f_n значения частоты

f_q1…f_qn квантованные значения частоты

BS битовый поток

Ссылки:

[1] B. Bessette, R. Salami, R. Lefebvre, M. Jelinek, J. Rotola-Pukkila, J. Vainio, H. Mikkola, and K. Järvinen, ʺThe adaptive multirate wideband speech codec (AMR-WB)ʺ, Speech and Audio Processing, IEEE Transactions on, vol. 10, no. 8, pp. 620-636, 2002.

[2] ITU-T G.718, ʺFrame error robust narrow-band and wideband embedded variable bit-rate coding of speech and audio from 8-32 kbit/sʺ, 2008.

[3] M. Neuendorf, P. Gournay, M. Multrus, J. Lecomte, B. Bessette, R. Geiger, S. Bayer, G. Fuchs, J. Hilpert, N. Rettelbach, R. Salami, G. Schuller, R. Lefebvre, and B. Grill, ʺUnified speech and audio coding scheme for high quality at low bitratesʺ, in Acoustics, Speech and Signal Processing. ICASSP 2009. IEEE Int Conf, 2009, pp. 1-4.

[4] T. Bäckström and C. Magi, ʺProperties of line spectrum pair polynomials - a reviewʺ, Signal Processing, vol. 86, no. 11, pp. 3286-3298, November 2006.

[5] G. Kang and L. Fransen, ʺApplication of line-spectrum pairs to low-bit-rate speech encodersʺ, in Acoustics, Speech, and Signal Processing, IEEE International Conference on ICASSP'85., vol. 10. IEEE, 1985, pp. 244-247.

[6] P. Kabal and R. P. Ramachandran, ʺThe computation of line spectral frequencies using Chebyshev polynomialsʺ, Acoustics, Speech and Signal Processing, IEEE Transactions on, vol. 34, no. 6, pp. 1419-1426, 1986.

[7] 3GPP TS 26.190 V7.0.0, ʺAdaptive multi-rate (AMR-WB) speech codecʺ, 2007.

[8] T. Bäckström, C. Magi, and P. Alku, ʺMinimum separation of line spectral frequenciesʺ, IEEE Signal Process. Lett., vol. 14, no. 2, pp. 145-147, February 2007.

[9] T. Bäckström, ʺVandermonde factorization of Toeplitz matrices and applications in filtering and warping,ʺ IEEE Trans. Signal Process., vol. 61, no. 24, pp. 6257-6263, 2013.

[10] V. F. Pisarenko, ʺThe retrieval of harmonics from a covariance functionʺ, Geophysical Journal of the Royal Astronomical Society, vol. 33, no. 3, pp. 347-366, 1973.

[11] E. Durand, Solutions Numériques des Équations Algébriques. Paris: Masson, 1960.

[12] I. Kerner, ʺEin Gesamtschrittverfahren zur Berechnung der Nullstellen von Polynomenʺ, Numerische Mathematik, vol. 8, no. 3, pp. 290-294, May 1966.

[13] O. Aberth, ʺIteration methods for finding all zeros of a polynomial simultaneouslyʺ, Mathematics of Computation, vol. 27, no. 122, pp. 339-344, April 1973.

[14] L. Ehrlich, ʺA modified newton method for polynomialsʺ, Communications of the ACM, vol. 10, no. 2, pp. 107-108, February 1967.

[15] D. Starer and A. Nehorai, ʺPolynomial factorization algorithms for adaptive root estimationʺ, in Int. Conf. on Acoustics, Speech, and Signal Processing, vol. 2. Glasgow, UK: IEEE, May 1989, pp. 1158-1161.

[16] --, ʺAdaptive polynomial factorization by coefficient matchingʺ, IEEE Transactions on Signal Processing, vol. 39, no. 2, pp. 527-530, February 1991.

[17] G. H. Golub and C. F. van Loan, Matrix Computations, 3rd ed. John Hopkins University Press, 1996.

[18] T. Saramäki, ʺFinite impulse response filter designʺ, Handbook for Digital Signal Processing, pp. 155-277, 1993.

1. Информационный кодер для кодирования информационного сигнала (IS), причем информационный кодер (1) содержит:

анализатор (2) для анализа информационного сигнала (IS) для получения коэффициентов линейного предсказания предсказательного полинома A(z);

преобразователь (3) для преобразования коэффициентов линейного предсказания предсказательного полинома A(z) в значения частоты f₁…f_n спектрального частотного представления предсказательного полинома A(z), причем преобразователь (3) выполнен с возможностью определения значений частоты f₁…f_n путем анализа пары полиномов P(z) и Q(z), заданных в виде

P(z)=A(z)+z^-m-lA(z^-1) и

Q(z)=A(z)-z^-m-lA(z^-1),

где m - порядок предсказательного полинома A(z) и l больше или равно нулю, причем преобразователь (3) выполнен с возможностью получения значений частоты (f₁…f_n) путем установления строго действительного спектра (RES), выведенного из P(z), и строго мнимого спектра (IES) из Q(z) и путем идентификации нулей строго действительного спектра (RES), выведенного из P(z), и строго мнимого спектра (IES), выведенного из Q(z), причем преобразователь (3) содержит ограничительное устройство (11) для ограничения числового диапазона спектров (RES, IES) полиномов P(z) и Q(z) путем умножения полиномов P(z) и Q(z) или одного или более полиномов, выведенных из полиномов P(z) и Q(z), на фильтрационный полином B(z), причем фильтрационный полином B(z) симметричен и не имеет корней на единичной окружности;

квантователь (4) для получения квантованных значений частоты (f_q1…f_qn) из значений частоты (f₁…f_n); и

формирователь (5) битового потока для формирования битового потока, содержащего квантованные значения частоты (f_q1…f_qn).

2. Информационный кодер по п. 1, в котором преобразователь (3) содержит определяющее устройство (6) для определения полиномов P(z) и Q(z) из предсказательного полинома A(z).

3. Информационный кодер по п. 1, в котором преобразователь (3) содержит идентификатор (9) нулей для идентификации нулей строго действительного спектра (RES), выведенного из P(z), и строго мнимого спектра (IES), выведенного из Q(z).

4. Информационный кодер по п. 3, в котором идентификатор (9) нулей выполнен с возможностью идентификации нулей посредством

a) начинания с действительного спектра (RES) на нулевой частоте;

b) увеличения частоты, пока не будет обнаружена перемена знака в действительном спектре (RES);

c) увеличения частоты, пока не будет обнаружена дополнительная перемена знака в мнимом спектре (IES); и

d) повторения этапов b) и c), пока не будут обнаружены все нули.

5. Информационный кодер по п. 3, в котором идентификатор нулей выполнен с возможностью идентификации нулей посредством интерполяции.

6. Информационный кодер по п. 1, в котором преобразователь (3) содержит устройство (10) заполнения нулями для добавления одного или более коэффициентов, имеющих значение ʺ0ʺ, к полиномам P(z) и Q(z) для формирования пары удлиненных полиномов P_e(z) и Q_e(z).

7. Информационный кодер по п. 5, в котором преобразователь (3) выполнен таким образом, что в ходе преобразования коэффициентов линейного предсказания в значения частоты (f₁…f_n) спектрального частотного представления (RES, IES) предсказательного полинома A(z) исключается, по меньшей мере, часть операций с коэффициентами, про которые известно, что они имеют значение ʺ0ʺ, удлиненных полиномов P_e(z) и Q_e(z).

8. Информационный кодер по п. 5, в котором преобразователь (3) содержит формирователь (13) составного полинома, выполненный с возможностью установления составного полинома C_e(P_e(z), Q_e(z)) из удлиненных полиномов P_e(z) и Q_e(z).

9. Информационный кодер по п. 8, в котором преобразователь (3) выполнен таким образом, что строго действительный спектр (RES), выведенный из P(z), и строго мнимый спектр (IES) из Q(z) устанавливаются посредством единого преобразования Фурье путем преобразования составного полинома C_e(P_e(z), Q_e(z)).

10. Информационный кодер по п. 1, в котором преобразователь (3) содержит устройство (8) преобразования Фурье для осуществления преобразования Фурье над парой полиномов P(z) и Q(z) или одним или более полиномов, выведенных из пары полиномов P(z) и Q(z), в частотную область и регулировочное устройство (7, 12) для регулировки фазы спектра (RES), выведенного из P(z), таким образом, чтобы он был строго действительным, и для регулировки фазы спектра (IES), выведенного из Q(z), таким образом, чтобы он был строго мнимым.

11. Информационный кодер по п. 10, в котором регулировочное устройство (7, 12) выполнено в виде устройства (7) сдвига коэффициентов для осуществления циклического сдвига коэффициентов пары полиномов P(z) и Q(z) или одного или более полиномов, выведенных из пары полиномов P(z) и Q(z).

12. Информационный кодер по п. 11, в котором устройство (7) сдвига коэффициентов выполнено с возможностью осуществления циклического сдвига коэффициентов таким образом, чтобы первоначальная средняя точка последовательности коэффициентов сдвигалась к первой позиции последовательности.

13. Информационный кодер по п. 10, в котором регулировочное устройство (7, 12) выполнено в виде фазовращателя (12) для осуществления сдвига фазы выходного сигнала устройства (8) преобразования Фурье.

14. Информационный кодер по п. 13, в котором фазовращатель (12) выполнен с возможностью осуществления сдвига фазы выходного сигнала устройства (8) преобразования Фурье путем умножения k-го элемента разрешения по частоте на exp(i2πkh/N), где N - длина выборки и h=(m+l)/2.

15. Информационный кодер по п. 1, в котором преобразователь (3) содержит устройство (14) преобразования Фурье для осуществления преобразования Фурье над парой полиномов P(z) и Q(z) или одним или более полиномов, выведенных из пары полиномов P(z) и Q(z), в частотную область с половиной выборок таким образом, чтобы спектр (RES), выведенный из P(z), был строго действительным, и таким образом, чтобы спектр (IES), выведенный из Q(z), был строго мнимым.

16. Информационный кодер по п. 1, в котором преобразователь (3) содержит формирователь (13) составного полинома, выполненный с возможностью установления составного полинома C(P(z), Q(z)) из полиномов P(z) и Q(z).

17. Информационный кодер по п. 16, в котором преобразователь (3) выполнен таким образом, что строго действительный спектр (RES), выведенный из P(z), и строго мнимый спектр (IES) из Q(z) устанавливаются посредством единого преобразования Фурье путем преобразования составного полинома C(P(z), Q(z)).

18. Информационный кодер по п. 6, в котором преобразователь (3) содержит ограничительное устройство (11) для ограничения числового диапазона спектров (RES, IES) удлиненных полиномов P_e(z) и Q_e(z) или одного или более полиномов, выведенных из удлиненных полиномов P_e(z) и Q_e(z) путем умножения удлиненных полиномов P_e(z) и Q_e(z) на фильтрационный полином B(z), причем фильтрационный полином B(z) симметричен и не имеет корней на единичной окружности.

19. Способ работы информационного кодера (1) для кодирования информационного сигнала (IS), причем способ содержит этапы, на которых:

анализируют информационный сигнал (IS) для получения коэффициентов линейного предсказания предсказательного полинома A(z);

преобразуют коэффициенты линейного предсказания предсказательного полинома A(z) в значения частоты (f₁…f_n) спектрального частотного представления (RES, IES) предсказательного полинома A(z), причем значения частоты (f₁…f_n) определяются путем анализа пары полиномов P(z) и Q(z), заданных в виде

P(z)=A(z)+z^-m-lA(z^-1) и

Q(z)=A(z)-z^-m-lA(z^-1),

где m - порядок предсказательного полинома A(z) и l больше или равно нулю, причем значения частоты (f₁…f_n) получаются путем установления строго действительного спектра (RES), выведенного из P(z), и строго мнимого спектра (IES) из Q(z) и путем идентификации нулей строго действительного спектра (RES), выведенного из P(z), и строго мнимого спектра (IES), выведенного из Q(z);

ограничивают числовой диапазон спектров (RES, IES) полиномов P(z) и Q(z) путем умножения полиномов P(z) и Q(z) или одного или более полиномов, выведенных из полиномов P(z) и Q(z), на фильтрационный полином B(z), причем фильтрационный полином B(z) симметричен и не имеет корней на единичной окружности;

получают квантованные значения частоты (f_q1…f_qn) из значений частоты (f₁…f_n); и

формируют битовый поток (BS), содержащий квантованные значения частоты (f_q1…f_qn).

20. Компьютерно-считываемый носитель, на котором записана компьютерная программа для выполнения способа по п. 19 при исполнении на процессоре.

Похожие патенты:

Квантование аудиопараметров // 2670377

Изобретение относится к средствам для аналого-цифрового преобразования аудио. Технический результат заключается в повышении эффективности аналого-цифрового преобразования аудио.

Устройство кодирования аудиосигнала, устройство декодирования аудиосигнала, способ кодирования аудиосигнала и способ декодирования аудиосигнала // 2669706

Изобретение относится к средствам для кодирования и декодирования аудиосигнала. Технический результат заключается в повышении эффективности кодирования.

Устройство для квантования коэффициентов кодирования с линейным предсказанием, устройство кодирования звука, устройство для деквантования коэффициентов кодирования с линейным предсказанием, устройство декодирования звука, и электронное устройство для этого // 2669139

Изобретение относится к области декодирования звука. Технический результат – повышение эффективности декодирования битового потока.

Кодер, декодер и способы для обратно совместимого пространственного кодирования аудиообъектов с переменным разрешением // 2669079

Изобретение относится к средствам кодирования и декодирования аудиосигнала. Технический результат заключается в повышении качества кодированного аудиосигнала.

Кодер и декодер аудиосигнала, использующие процессор частотной области, процессор временной области и кросспроцессор для непрерывной инициализации // 2668397

Изобретение относится к кодированию и декодированию аудиосигнала. Технический результат – обеспечение усовершенствованого принципа аудиокодирования.

Способ и устройство вывода аудиосигнала, способ и устройство кодирования, способ и устройство декодирования и программа // 2668113

Изобретение относится к средствам для кодирования, декодирования и вывода аудиосигнала. Технический результат заключается в повышении качества аудиосигнала.

Способ и устройство для сжатия и распаковки представления на основе амбиофонии высшего порядка // 2668060

Изобретение относится к средствам для сжатия и распаковки представления на основе амбиофонии высшего порядка. Технический результат заключается в повышении эффективности сжатия.

Сжатие разложенных представлений звукового поля // 2668059

Изобретение относится к средствам для сжатия разложенных представлений звукового поля. Технический результат заключается в повышении эффективности обработки звукового поля.

Оптимизированный масштабный коэффициент для расширения диапазона частот в декодере сигналов звуковой частоты // 2668058

Изобретение относится к средствам для расширения диапазона частот при декодировании аудиосигналов. Технический результат заключается в повышении эффективности расширения диапазона частот без дополнительной информации из кодера.

Способы и системы переключения технологий кодирования в устройстве // 2667973

Изобретение относится к средствам для переключения технологии кодирования при кодировании аудиосигнала. Технический результат заключается в сокращении артефактов на границах кадров и несогласованностей энергии при переключении технологии кодирования.

Способы и системы переключения технологий кодирования в устройстве // 2667973

Гармоническое преобразование, усовершенствованное перекрестным произведением // 2667629

Данное изобретение относится к системам звукового кодирования, которые используют способ гармонического преобразования для высокочастотной реконструкции. Технический результат заключается в повышении качества декодируемого звукового сигнала.

Генерация сигнала верхней полосы // 2667460

Изобретение относится к средствам для генерации сигнала верхней полосы. Технический результат заключается в повышении эффективности кодирования.

Способ и устройство кодирования аудио // 2667380

Изобретение относится к области технологий обработки сигналов и предназначено для кодирования аудиосигналов. Технический результат – уменьшение сложности кодирования и повышение точности кодирования.

Устройство и способ формирования расширенного сигнала с использованием заполнения независимым шумом // 2667376

Изобретение относится к обработке аудиосигнала. Технический результат – обеспечение формирования расширенного сигнала из входного сигнала.

Способ оценки шума в аудиосигнале, средство оценки шума, аудиокодер, аудиодекодер и система для передачи аудиосигналов // 2666474

Изобретение относится к области обработки аудиосигналов. Технический результат – обеспечение эффективной оценки шума в аудиосигнале.

Расширение полосы пропускания аудио посредством вставки шума с предварительно приданной формой по времени в частотной области // 2666468

Изобретение относится к средствам для расширения полосы пропускания аудио посредством вставки шума. Технический результат заключается в повышении эффективности расширения полосы пропускания.

Устройство и способ обработки сигнала и программа // 2666291

Изобретение относится к средствам для обработки сигнала. Технический результат заключается в повышении качества декодированного сигнала.

Оценивание фонового шума в аудиосигналах // 2665916

Изобретение относится к средствам для оценивания фонового шума в аудиосигнале. Технический результат заключается в повышении точности оценивания, содержит ли аудиосигнал активную речь или музыку или нет.

Способ аудиокодирования и соответствующее устройство // 2670790

Изобретение относится к технологиям аудиокодирования. Технический результат заключается в повышении эффективности аудиокодирования. Технический результат достигается за счет осуществления обработки временно-частотного преобразования на сигнале временной области текущего кадра аудио, для получения спектральных коэффициентов текущего кадра аудио; получения одного или более опорных параметров кодирования текущего кадра аудио; и если полученный опорный параметр кодирования текущего кадра аудио удовлетворяет любому одному из набора условий параметра, кодируют спектральные коэффициенты текущего кадра аудио на основании алгоритма возбуждения, кодированного с преобразованием; или если полученный опорный параметр кодирования текущего кадра аудио не удовлетворяет ни одному из набора условий параметра, кодируют спектральные коэффициенты текущего кадра аудио на основании алгоритма кодирования с преобразованием высокого качества. 6 н. и 16 з.п. ф-лы, 10 ил.