Устройство кодирования и способ кодирования

Изобретение относится к кодированию речевых и аудиосигналов. Техническим результатом является уменьшение искажения кодирования по сравнению со стандартным способом и получение достаточного качества звука для слухового восприятия. В устройстве кодирования блок (111) квантования форм квантует форму входного спектра с малым количеством положений и полярностей импульсов. Блок (111) квантования форм устанавливает ширину импульсной амплитуды, подлежащую поиску позже, при поиске положения импульса на значение, не большее, чем ширина амплитуды импульса, которая искалась ранее. Блок (112) квантования усилений вычисляет усиление импульса, который искался блоком (111) квантования форм, для каждой из полос. 2 н. и 1 з.п. ф-лы, 4 ил.

 

Область техники, к которой относится изобретение

Настоящее изобретение относится к устройству кодирования и способу кодирования для кодирования речевых сигналов и аудиосигналов.

Предшествующий уровень техники

При осуществлении мобильной связи является необходимым сжимать и кодировать цифровую информацию, такую как речь и изображения, для эффективного использования емкости радиоканала и носителей хранения для радиоволн, и много схем кодирования и декодирования было разработано до настоящего времени.

Среди них производительность технологии речевого кодирования была значительно повышена посредством фундаментальной схемы "CELP (возбуждаемое кодом линейное предсказание)", в которой квалифицированно применено векторное квантование посредством моделирования системы вокального тракта речи. Дополнительно, производительность технологии звукового кодирования, такой как аудиокодирование, была значительно улучшена посредством технологий кодирования с преобразованием (таких как ACC и MP3 стандарта MPEG).

При кодировании речевых сигналов на основе схемы CELP и других речевой сигнал часто представляется посредством фильтра возбуждения и синтеза. Если вектор, имеющий форму, аналогичную сигналу возбуждения, который является векторной последовательностью временной области, может быть декодирован, является возможным получать волновую форму, аналогичную входной речи, через фильтр синтеза и достигать хорошего воспринимаемого качества. Это является качественной характеристикой, которая привела к успеху алгебраической кодовой книги, используемой в CELP.

С другой стороны, масштабируемый кодек, стандартизация которого находится в процессе исполнения в текущий момент со стороны ITU-T (Сектора Стандартизации в области Телекоммуникаций - Международного Телекоммуникационного Союза) и других, разрабатывается, чтобы охватывать от стандартного речевого диапазона (300 Гц по 3,4 кГц) до широкого диапазона (вплоть до 7 кГц), с его расходов битов (битрейтом), установленным настолько высоко, как вплоть до приблизительно 32 кбит/с. То есть широкополосный кодек должен даже применять некоторую степень кодирования к аудио и поэтому не может поддерживаться посредством только стандартных способов речевого кодирования с низким битрейтом на основе модели человеческого голоса, такой как CELP. Теперь стандарт G.729.1 от ITU-T, объявленный ранее как рекомендация, использует схему кодирования аудиокодека, соответствующую кодированию преобразования, чтобы кодировать речь широкого диапазона и выше.

Патентный документ 1 раскрывает схему кодирования частотного спектра, использующую спектральные параметры и параметры основного тона, в силу чего ортогональное преобразование и кодирование сигнала, полученного посредством обратной фильтрации речевого сигнала, выполняются на основе спектральных параметров, и дополнительно раскрывает, в качестве примера кодирования, способ кодирования на основе кодовых книг алгебраических структур.

Патентный документ 1: Открыто выложенная японская патентная заявка номер HEI10-260698.

Раскрытие изобретения

Проблемы, подлежащие решению посредством этого изобретения

Тем не менее, в стандартной схеме кодирования частотного спектра ограниченная битовая информация назначается информации о положениях импульсов. С другой стороны, эта ограниченная битовая информация не назначается амплитудной информации импульсов, и амплитуды всех импульсов являются фиксированными. Следовательно, искажение кодирования остается.

Поэтому задачей настоящего изобретения является обеспечить устройство кодирования и способ кодирования, которые могут уменьшать среднее искажение кодирования по сравнению со стандартной схемой и достигать хорошего воспринимаемого качества звука в схеме кодирования частотного спектра.

Средство для решения проблемы

В устройстве кодирования по настоящему изобретению, которое моделирует и кодирует частотный спектр с множеством фиксированных волновых форм, применяется конфигурация, имеющая секцию квантования форм, которая осуществляет поиск и кодирует положения и полярности фиксированных волновых форм; и секцию квантования усилений, которая кодирует усиления фиксированных волновых форм, при этом при поиске положений фиксированных волновых форм секция квантования форм устанавливает амплитуду фиксированной волновой формы, поиск в отношении которой должен быть выполнен позже, равной или меньшей, чем амплитуда фиксированной волновой формы, которая искалась ранее.

Способ кодирования по настоящему изобретению, относящемуся к моделированию и кодированию частотного спектра с множеством фиксированных волновых форм, включает в себя этап квантования форм, на котором осуществляют поиск и кодирование положений и полярностей фиксированных волновых форм; и этап квантования усилений, при котором кодируют усиления фиксированных волновых форм, при этом при поиске положений фиксированных волновых форм на этапе квантования устанавливают амплитуду фиксированной волновой формы, поиск в отношении которой должен быть выполнен позже, равной или меньшей, чем амплитуда фиксированной волновой формы, которая искалась ранее.

Выгодные эффекты изобретения

Согласно настоящему изобретению, в схеме кодирования частотного спектра посредством установки амплитуды импульса, поиск которого должен быть выполнен позже, равной или меньшей, чем амплитуда импульса, который искался ранее, является возможным уменьшать среднее искажение кодирования по сравнению со стандартной схемой и обеспечивать высокое качество звука даже при низком битрейте.

Перечень фигур чертежей

Фиг.1 - блок-схема, показывающая конфигурацию устройства кодирования речи согласно одному варианту осуществления настоящего изобретения;

Фиг.2 - блок-схема, показывающая конфигурацию устройства декодирования речи согласно одному варианту осуществления настоящего изобретения;

Фиг.3 - блок-схема последовательности операций, показывающая алгоритм поиска для секции квантования формы согласно одному варианту осуществления настоящего изобретения; и

Фиг.4 - пример спектра, представленный импульсом, поиск осуществляется секцией квантования формы согласно одному варианту осуществления настоящего изобретения.

Наилучший вариант осуществления для выполнения изобретения

При кодировании речевого сигнала на основе схемы CELP и других схем речевой сигнал часто представляется посредством фильтра возбуждения и синтеза. Если вектор, имеющий форму, аналогичную сигналу возбуждения, который является векторной последовательностью временной области, может быть декодирован, является возможным получать волновую форму, аналогичную входной речи, через фильтр синтеза и достигать хорошего воспринимаемого качества. Это является качественной характеристикой, которая привела к успеху алгебраической кодовой книги, используемой в CELP.

С другой стороны, в случае кодирования частотного спектра (вектора) фильтр синтеза имеет спектральные усиления в качестве его компонентов, и поэтому искажение частот (т.е. положений) компонентов большой мощности является более значительным, чем искажение этих усилений. То есть посредством поиска положений высокой энергии и декодирования импульсов в положениях высокой энергии, нежели декодирования вектора, имеющего форму, аналогичную входному спектру, является более вероятным достигать хорошего воспринимаемого качества.

Поэтому при кодировании частотного спектра применяется модель кодирования частоты посредством малого количества импульсов и применяется способ поиска импульсов по открытому контуру в частотном интервале цели кодирования.

Авторы настоящего изобретения делают акцент на том моменте, что так как импульсы выбираются в порядке от импульсов, которые уменьшают искажение, то импульс, поиск которого должен быть выполнен позже, имеет меньшее значение ожидания, и пришли к настоящему изобретению. То есть характерная особенность настоящего изобретения лежит в установке амплитуды импульса, поиск которого должен быть выполнен позже, равной или меньшей, чем амплитуда импульса, поиск которого выполнялся ранее.

Один вариант осуществления настоящего изобретения будет объяснен ниже с использованием сопровождающих чертежей.

Фиг.1 - это блок-схема, показывающая конфигурацию устройства кодирования речи согласно настоящему варианту осуществления. В устройстве кодирования речи, показанном на фиг.1, предусмотрена секция 101 анализа LPC, секция 102 квантования LPC, обратный фильтр 103, секция 104 ортогонального преобразования, секция 105 спектрального кодирования и секция 106 мультиплексирования. В секции 105 спектрального кодирования предусмотрена секция 111 квантования форм и секция 112 квантования усилений.

Секция 101 анализа LPC выполняет анализ с линейным предсказанием в отношении сигнала входной речи и выводит параметр огибающей спектра в секцию 102 квантования LPC как результат этого анализа. Секция 102 квантования LPC выполняет обработку по квантованию параметра огибающей спектра (LPC: коэффициент линейного предсказания), выведенного из секции 101 анализа LPC, и выводит код, представляющий квантованный LPC, в секцию 106 мультиплексирования. Дополнительно, секция 102 квантования LPC выводит декодированные параметры, полученные посредством декодирования кода, представляющего квантованный LPC, в обратный фильтр 103. Здесь, при квантовании параметра может применяться векторное квантование ("VQ"), квантование с предсказанием, многоэтапное VQ, расщипленное VQ и другие режимы.

Обратный фильтр 103 осуществляет обратную фильтрацию входной речи с использованием декодированных параметров и выводит результирующий остаточный компонент в секцию 104 ортогонального преобразования.

Секция 104 ортогонального преобразования применяет окно соответствия, такое как синусное окно, к остаточному компоненту, выполняет ортогональное преобразование с использованием MDCT и выводит спектр, преобразованный в спектр частотной области (ниже "входной спектр"), в секцию 105 спектрального кодирования. Здесь, ортогональное преобразование может применять другие преобразования, такие как FFT, KLT и Оейвлет-преобразование, и хотя их использование варьируемо, является возможным преобразовывать остаточный компонент во входной спектр с использованием любого из перечисленных.

Здесь, порядок обработки между обратным фильтром 103 и секцией 104 ортогонального преобразования может меняться на противоположный. То есть посредством разделения входной речи, подвергаемой ортогональному преобразованию посредством частотного спектра обратного фильтра (т.е. вычитания в логарифмической оси), является возможным вырабатывать такой же входной спектр.

Секция 105 спектрального кодирования разделяет входной спектр посредством квантования форм и усиления спектра по отдельности и выводит результирующие коды квантования в секцию 106 мультиплексирования. Секция 111 квантования форм квантует форму входного спектра с использованием малого количества положений и полярностей импульсов, и секция 112 квантования усилений вычисляет и квантует усиления импульсов, которые искались секцией 111 квантования форм, на полосной основе. Секция 111 квантования форм и секция 112 квантования усилений будут описываться подробно позже.

Секция 106 мультиплексирования принимает в качестве входных данных код, представляющий LPC квантования, из секции 102 квантования LPC и код, представляющий квантованный входной спектр из секции 105 спектрального кодирования, мультиплексирует эту информацию и выводит результат в канал передачи в качестве информации кодирования.

Фиг.2 - это блок-схема, показывающая конфигурацию устройства декодирования речи согласно настоящему варианту осуществления. В устройстве декодирования речи, показанном на фиг.2, предусмотрены секция 201 демультиплексирования, секция 202 декодирования параметров, секция 203 декодирования спектра, секция 204 ортогонального преобразования и фильтр 205 синтеза.

На фиг.2 информация кодирования демультиплексируется в индивидуальные коды в секции 201 демультиплексирования. Код, представляющий квантованный LPC, выводится в секцию 202 декодирования параметров, и код входного спектра выводится в секцию 203 декодирования спектра.

Секция 202 декодирования параметров декодирует параметр огибающей спектра и выводит результирующий декодированный параметр в фильтр 205 синтеза.

Секция 203 декодирования спектра декодирует вектор формы и усиление посредством способа, поддерживающего способ кодирования в секции 105 спектрального кодирования, показанной на фиг.1, получает декодированный спектр посредством умножения декодированного вектора формы на декодированное усиление и выводит декодированный спектр в секцию 204 ортогонального преобразования.

Секция 204 ортогонального преобразования выполняет обратное преобразование декодированного спектра, выведенного из секции 203 декодирования спектра, по сравнению с секцией 104 ортогонального преобразования, показанной на фиг.1, и выводит результирующий, декодированный остаточный сигнал временной последовательности в фильтр 205 синтеза.

Фильтр 205 синтеза вырабатывает выходную речь посредством применения фильтрации синтеза к декодированному остаточному сигналу, выведенному из секции 204 ортогонального преобразования, с использованием декодированного параметра, выведенного из секции 202 декодирования параметров.

Здесь, чтобы обращать порядок обработки между обратным фильтром 103 и секцией 104 ортогонального преобразования, показанной на фиг.1, устройство декодирования речи на фиг.2 умножает декодированный спектр посредством частотного спектра декодированного параметра (т.е. добавление в логарифмической оси) и выполняет ортогональное преобразование результирующего спектра.

Далее, секция 111 квантования форм и секция 112 квантования усилений будут объясняться в деталях.

Секция 111 квантования форм осуществляет поиск положения и полярности (+/-) импульса на основе один за одним по всему предопределенному интервалу поиска.

Следующее уравнение 1 является опорным для поиска. Здесь, в уравнении 1, E представляет искажение кодирования, si представляет входной спектр, g представляет оптимальное усиление, δ - это дельта-функция, p представляет положение импульса, γb представляет амплитуду импульса, и b представляет номер импульса. Секция 111 квантования формы устанавливает амплитуду импульса, поиск которого должен выполняться позже, равной или меньшей, чем амплитуда импульса, поиск которого выполнялся ранее.

[1]

... (Уравнение 1)

Из уравнения 1, приведенного выше, положение импульса, чтобы минимизировать функцию стоимости, - это положение, в котором абсолютное значение |sp| входного спектра в каждой полосе является максимальным, и его полярность - это полярность значения величины входного спектра в положении этого импульса.

Согласно настоящему варианту осуществления, амплитуда импульса для поиска определяется заранее на основе порядка поиска импульсов. Амплитуда импульса устанавливается согласно, например, следующим этапам. (1) Во-первых, амплитуды всех импульсов устанавливаются на "1.0".

Далее, "n" устанавливается на "2" как начальное значение. (2) Посредством уменьшения амплитуды n-го импульса мало-помалу и кодирования/декодирования данных обучения, значение, в котором рабочие характеристики (как, например, отношение S/N и SD (Спектральное расстояние)) являются пиковыми. В этом случае, предполагаем, что амплитуды (n+1)-го или более поздних импульсов являются такими же, как амплитуда n-го импульса. (3) Все амплитуды, которым соответствуют наилучшие рабочие характеристики, являются фиксированными, и n=n+1 имеет место. (4) Обработка вышеописанных действий с (2) по (3) повторяется до тех пор, пока n не будет равно количеству импульсов.

Будет объясняться иллюстративный случай, где векторная длина входного спектра - это шестьдесят четыре выборки (шесть битов) и спектр кодируется с пятью импульсами. В этом примере, шесть битов требуются, чтобы показывать положение импульса (записи положений: 16) и один бит требуется, чтобы показывать полярность (+/-), требуя информационных битов в количестве тридцати пяти битов в целом.

Последовательность операций алгоритма для поиска секции 111 квантования форм в этом примере будет показана на фиг.3. Здесь, символы, используемые в блок-схеме последовательности операций по фиг.3, обозначают следующее.

c: положение импульса

pos[b]: результат поиска (положение)

pol[b]: результат поиска (полярность)

s[i]: входной спектр

x: член числителя

y: член знаменателя

dn_mx: максимальный член числителя

cc:mx максимальный член знаменателя

dn: член числителя, который искался ранее

cc: член знаменателя, который искался ранее

b: номер импульса

γ[b]: амплитуда импульса

Фиг.3 иллюстрирует алгоритм поиска положения, отвечающего наивысшей энергии, и повышения импульса в упомянутом положении сначала и затем поиска следующего импульса без повышения двух импульсов в одном и том же положении (см. знак "*" на фиг.3). Здесь, в алгоритме по фиг.3, знаменатель "y" зависит только от номера "b", и, следовательно, посредством вычисления этого значения заранее является возможным упростить алгоритм по фиг.3.

Пример спектра, представленного посредством импульсов, которые искались секцией 111 квантования форм, показан на фиг.4. Здесь, фиг.4 иллюстрирует случай, где импульсы с P1 по P5 ищутся в порядке. Как показано на фиг.4, настоящий вариант осуществления устанавливает амплитуду импульса, поиск которого должен выполняться позже, равной или меньшей, чем амплитуда импульса, поиск которого выполнялся ранее. Амплитуды импульсов для поиска определяются заранее на основе порядка поиска импульсов, так что является необходимым использовать информационные биты для представления амплитуд и является возможным делать полное количество информационных битов таким же, как в случае фиксирования амплитуд.

Секция 112 квантования усилений анализирует корреляцию между декодированной последовательностью импульсов и входным спектром и вычисляет идеальное усиление. Идеальное усиление "g" вычисляется посредством следующего уравнения 2. Здесь, в уравнении 2, s(i) представляет входной спектр, и v(i) представляет вектор, полученный посредством декодирования формы.

[2]

... (Уравнение 2)

Дополнительно секция 112 квантования усилений вычисляет идеальные усиления и затем выполняет кодирование посредством скалярного квантования (SQ) или векторного квантования. В случае выполнения векторного квантования, является возможным выполнять эффективное кодирование посредством квантования с предсказанием, многоэтапного VQ, расщепленного VQ и так далее. Здесь, усиление может восприниматься слышимым образом на основе логарифмического масштаба, и, следовательно, посредством выполнения SQ или VQ после выполнения логарифмического преобразования усиления является возможным вырабатывать хороший с точки зрения восприятия синтезированный звук.

Таким образом, согласно настоящему варианту осуществления, в схеме кодирования частотного спектра посредством установки амплитуды импульса, поиск которого должен выполняться позже, равной или меньшей, чем амплитуда импульса, который искался ранее, является возможным уменьшать среднее искажение кодирования по сравнению со стандартной схемой и достигать хорошего качества звука даже в случае низкого битрейта скорости.

Дополнительно, посредством применения настоящего изобретения к случаю группирования амплитуд импульсов и поиска групп открытым образом является возможным улучшать рабочие характеристики. Например, когда общее количество из восьми импульсов группируется в пять импульсов и три импульса, пять импульсов ищутся и фиксируются первыми, и затем ищется остаток из трех импульсов, амплитуды последних трех импульсов равным образом уменьшаются. Является экспериментально доказанным, что посредством установки амплитуд пяти импульсов, которые искались первыми, на [1.0, 1.0, 1.0, 1.0, 1.0] и установки амплитуд трех импульсов, которые искались позже, на [0.8, 0.8, 0.8] является возможным улучшать рабочие характеристики по сравнению со случаем установки импульсов всех импульсов на "1.0". Дополнительно, посредством установки амплитуд пяти импульсов, которые искались первыми, на "1.0" умножения амплитуд не являются необходимыми, тем самым подавляя величину вычислений.

Дополнительно, хотя случай был описан выше с настоящим вариантом осуществления, где кодирование усилений выполняется после кодирования форм, настоящее изобретение может обеспечивать такие же рабочие характеристики, если кодирование форм выполняется после кодирования усилений.

Дополнительно, хотя иллюстративный случай был описан с вышеописанным вариантом осуществления, где длина спектра - это шестьдесят четыре и количество импульсов - это пять при квантовании формы спектра, настоящее изобретение не зависит от вышеуказанных числовых значений и может обеспечивать такие же эффекты с другими числовыми значениями.

Дополнительно, может быть возможным применять способ выполнения кодирования усилений на полосной основе и затем нормирования спектра декодированными усилениями, и выполнения кодирования форм согласно настоящему изобретению. Например, если обработка по s[pos[b]]=0, dn=dn_mx и cc=cc_mx не выполняется, является возможным повышать множество импульсов в одном и том же положении. Однако, если множество импульсов происходят в одном и том же положении, их амплитуды могут возрастать, и поэтому является необходимым проверять количество импульсов в каждом положении и вычислять член знаменателя точно.

Дополнительно, хотя кодирование посредством импульсов выполняется для спектра, подвергаемого ортогональному преобразованию в настоящем варианте осуществления, настоящее изобретение не ограничено этим и является также применимым к другим векторам. Например, настоящее изобретение может применяться к векторам комплексных чисел в FFT или комплексном DCT и может применяться к векторной последовательности временной области в вейвлет-преобразовании или подобном. Дополнительно, настоящее изобретение является также применимым к векторной последовательности временной области, такой как волновые формы возбуждения схемы CELP. Что касается волновых форм возбуждения в CELP, задействуется фильтр синтеза, и поэтому функция стоимости включает в себя матричное вычисление. Здесь, рабочие характеристики не являются достаточными при поиске в открытом контуре, когда задействуется фильтр, и поэтому в некоторой степени должен выполняться поиск в закрытом контуре. Когда имеется много импульсов, является эффективным использовать лучевой поиск или подобное, чтобы уменьшать объем вычислений.

Дополнительно, согласно настоящему изобретению, волновая форма, подлежащая поиску, не ограничена импульсом, и является равным образом возможным искать даже другие фиксированные волновые формы (как, например, дуальный импульс, треугольная волна, конечная волна импульсного отклика, волновые формы коэффициентов фильтра и в=фиксированные волновые формы, которые изменяют форму адаптивно), и дают тот же самый эффект.

Дополнительно, хотя случай был описан с заранее заданным вариантом осуществления, где настоящее изобретение применяется к CELP, настоящее изобретение не ограничено этим, но является эффективным с другими кодеками.

Дополнительно, не только речевой сигнал, но также аудиосигнал может использоваться как сигнал согласно настоящему изобретению. Является также возможным применять конфигурацию, в которой настоящее изобретение применяется к остаточному сигналу предсказания LPC вместо входного сигнала.

Устройство кодирования и устройство декодирования согласно настоящему изобретению могут монтироваться на терминальном устройстве связи и устройстве базовой станции в системе мобильной связи, так что является возможным обеспечивать терминальное устройство связи, устройство базовой станции и систему мобильной связи, имеющие один и тот же функциональный эффект, как указано выше.

Хотя случай был описан с вышеописанным вариантом осуществления в качестве примера, где настоящее изобретение реализуется в аппаратном обеспечении, настоящее изобретение может быть реализовано в программном обеспечении. Например, посредством описания алгоритма согласно настоящему изобретению на языке программирования, сохранения этой программы в памяти и предписания секции обработки информации исполнять эту программу является возможным реализовывать ту же функцию как устройство кодирования согласно настоящему изобретению.

Дополнительно, каждый функциональный блок, примененный в описании каждого из вышеупомянутых вариантов осуществления, может обычно реализовываться как LSI, составленная интегральной схемой. Они могут быть отдельными чипами, или частично, или полностью содержащимися на единичном чипе.

Здесь используется "LSI", но это может также упоминаться как "IC", "системная LSI", "супер LSI" или "ультра LSI" в зависимости от отличающихся степеней интеграции.

Дополнительно, способ схемной интеграции не ограничен LSI, и вариант осуществления с использованием специализированных схем или процессоров общего назначения является также возможным. После производства LSI использование FPGA (программируемой пользователем вентильной матрицы) или переконфигурируемого процессора, где соединения и установки схемных ячеек в LSI могут переконфигурироваться, является также возможным.

Дополнительно, если технология интегральных схем выходит, чтобы заменять LSI как результат продвижения полупроводниковой технологии или производной другой технологии, является естественно также возможным выполнять интеграцию функциональных блоков с использованием этой технологии. Применение биотехнологии является также возможным.

Раскрытие японской патентной заявки номер 2007-053500, поданной 2 марта 2007, включая описание, чертежи и реферат, включается сюда по ссылке в своей полноте.

Промышленная применимость

Настоящее изобретение является подходящим для устройства кодирования, которое кодирует речевые сигналы и аудиосигналы, и устройства декодирования, которое декодирует эти закодированные сигналы.

1. Устройство кодирования, которое моделирует и кодирует частотный спектр с помощью множества фиксированных волновых форм, при этом устройство содержит:
секцию квантования форм, которая осуществляет поиск и кодирует положения и полярности фиксированных волновых форм; и
секцию квантования усилений, которая кодирует усиления этих фиксированных волновых форм,
при этом секция квантования форм разделяет множество фиксированных волновых форм на множество групп и осуществляет поиск положений и полярностей фиксированных волновых форм в открытом контуре, и устанавливает амплитуду фиксированной волновой формы из группы, которая является целевой для осуществления по ней поиска, равной или меньшей, чем амплитуда фиксированной волновой формы, найденной ранее при поиске.

2. Устройство кодирования по п.1, в котором секция квантования форм осуществляет поиск фиксированных волновых форм путем оценки искажения кодирования посредством идеального усиления, вычисленного посредством вектора, полученного путем декодирования входного спектра и формы.

3. Способ кодирования на основе моделирования и кодирования частотного спектра с помощью множества фиксированных волновых форм, при этом способ содержит:
этап квантования форм, на котором осуществляют поиск и кодирование положений и полярностей фиксированных волновых форм; и этап квантования усилений, на котором кодируют усиления фиксированных волновых форм,
при этом на этапе квантования форм разделяют множество фиксированных волновых форм на множество групп и осуществляют поиск положений и полярностей фиксированных волновых форм в открытом контуре, и устанавливают амплитуду фиксированной волновой формы из группы, которая является целевой для осуществления по ней поиска, равной или меньшей, чем амплитуда фиксированной волновой формы, найденной ранее при поиске.



 

Похожие патенты:

Изобретение относится к устройству и способу кодирования речи, в частности к устройству и способу кодирования речи для выполнения поиска фиксированной кодовой книги.

Изобретение относится к вычислительной технике

Изобретение относится к средствам кодирования с использованием сокращенной кодовой книги с адаптивной установкой в исходное положение. Технический результат заключается в снижении объема информации, передаваемой от приемной стороны передающей стороне. В условиях обратной связи в канале MIMO из кодовой книги выбирается кодовое слово. Чтобы уменьшить передачу сигналов, кодовые слова организуются в подмножества кодовых слов. Приемник передает сигнал индекса кодового слова в текущее подмножество кодовых слов, ранее сообщенных передатчику. Текущее подмножество кодовых слов адаптивно выбирается на основе порогового критерия. Например, если лучшее кодовое слово из текущего подмножества кодовых слов близко не совпадает с лучшим кодовым словом в полной кодовой книге, делается переключение в подмножестве кодовых слов. 3 н. и 17 з.п. ф-лы, 22 ил.

Изобретение относится к кодированию и декодированию звукового сигнала, имеющего гармоническое или речевое содержание, который может быть подвергнут обработке с деформацией по времени. Технический результат - повышение эффективности кодирования. Для этого кодер включает контроллер функции окна, устройство организации окна, устройство для деформации по времени с заключительной функциональной возможностью проверки качества, преобразователь времени/частоты, стадию TNS или квантизатор кодирующего устройства. Контроллер функции окна, устройство для деформации по времени, стадия TNS или дополнительный анализатор шумового наполнения регулируются результатами анализа сигнала, полученными анализатором деформации по времени или классификатором сигнала. Декодер применяет операцию шумового наполнения, используя оценку отрегулированного шумового наполнения в зависимости от гармонической или речевой характеристики звукового сигнала. 6 н. и 10 з.п. ф-лы, 37 ил.

Изобретение относится к средствам преобразования сигнала активации с деформацией по времени. Технический результат заключается в повышении качества кодирования при понижении скорости передачи информации. Кодер включает контроллер функции окна, устройство организации окна, устройство для деформации по времени с заключительной функциональной возможностью проверки качества, преобразователь времени/частоты, стадию TNS или квантизатор кодирующего устройства, контроллер функции окна, устройство для деформации по времени, стадию TNS или дополнительный анализатор шумового наполнения (524) регулируются результатами анализа сигнала, полученными анализатором деформации по времени или классификатором сигнала. Декодер применяет операцию шумового наполнения, используя оценку отрегулированного шумового наполнения в зависимости от гармонической или речевой характеристики звукового сигнала. 3 н. и 1 з.п. ф-лы, 37 ил.

Изобретение относится к средствам кодирования и декодирования закодированного аудиосигнала. Технический результат заключается в обеспечении кодирования и декодирования информации импульсов с использованием меньшего количества битов для представления информации импульсов, что обеспечит возможность уменьшения скорости передачи соответствующим образом закодированного аудиосигнала. Устройство содержит декодер информации импульсов и декодер сигналов. Декодер информации импульсов выполнен с возможностью декодировать множество позиций импульсов, причем каждая из позиций импульсов указывает одну из позиций дорожки одной из дорожек, чтобы указать позицию одного из импульсов дорожки, и причем декодер информации импульсов выполнен с возможностью декодировать множество позиций импульса посредством использования количества позиций дорожки, указывающего общее количество позиций дорожки по меньшей мере одной из дорожек, общего количества импульсов, указывающего общее количество импульсов по меньшей мере одной из дорожек, и одного номера состояния. 6 н. и 9 з.п. ф-лы, 7 ил.

Изобретение относится к средствам преобразования сигнала активации с деформацией по времени. Технический результат заключается в увеличении скорости битрейта. Кодер включает контроллер функции окна, устройство организации окна, устройство для деформации по времени с заключительной функциональной возможностью проверки качества, преобразователь времени/частоты, стадию TNS или квантизатор кодирующего устройства, контроллер функции окна, устройство для деформации по времени, стадия TNS или дополнительный анализатор шумового наполнения регулируются результатами анализа сигнала, полученными анализатором деформации по времени или классификатором сигнала. Декодер применяет операцию шумового наполнения, используя оценку отрегулированного шумового наполнения в зависимости от гармонической или речевой характеристики звукового сигнала. 6 н.п. ф-лы, 37 ил.

Изобретение относится к звуковому кодированию и декодированию и связано с кодированием/декодированием звукового сигнала, имеющего гармоническое или речевое содержание, который может быть подвергнут обработке с деформацией по времени. Технический результат - повышение точности кодирования. Кодер включает контроллер функции окна, устройство организации окна, устройство для деформации по времени с заключительной функциональной возможностью проверки качества, преобразователь времени/частоты, стадию TNS или квантизатор кодирующего устройства, при этом контроллер функции окна, устройство для деформации по времени, стадия TNS или дополнительный анализатор шумового наполнения регулируются результатами анализа сигнала, полученными анализатором деформации по времени или классификатором сигнала. Декодер применяет операцию шумового наполнения, используя оценку отрегулированного шумового наполнения в зависимости от гармонической или речевой характеристики звукового сигнала. 3 н. и 4 з.п. ф-лы, 37 ил.

Изобретение относится к средствам кодирования/декодирования звукового сигнала. Технический результат заключается в повышении эффективности кодирования/декодирования звукового сигнала, имеющего гармоническое или речевое содержание. Кодер включает контроллер функции окна (504), устройство организации окна (502), устройство для деформации по времени (506) с заключительной функциональной возможностью проверки качества, преобразователь времени/частоты (508), стадию TNS (510) или квантизатор кодирующего устройства (512), контроллер функции окна (504), устройство для деформации по времени (506), стадию TNS (510) или дополнительный анализатор шумового наполнения (524) регулируются результатами анализа сигнала, полученными анализатором деформации по времени (516) или классификатором сигнала (520). Декодер применяет операцию шумового наполнения, используя оценку отрегулированного шумового наполнения в зависимости от гармонической или речевой характеристики звукового сигнала. 6 н. и 2 з.п. ф-лы, 37 ил.

Изобретение относится к средствам для кодирования аудиосигнала. Технический результат заключается в повышении эффективности кодирования аудио. Устройство кодирования речевого сигнала посредством определения вектора кодовой книги алгоритма кодирования речи содержит модуль определения матрицы для определения автокорреляционной матрицы R и модуль определения вектора кодовой книги для определения вектора кодовой книги в зависимости от автокорреляционной матрицы R. Модуль определения матрицы выполнен с возможностью определять автокорреляционную матрицу R посредством определения коэффициентов вектора для вектора r, при этом автокорреляционная матрица R содержит множество строк и множество столбцов, при этом вектор r обозначает один из столбцов или одну из строк автокорреляционной матрицы R, где R(i, j)=r(|i-j|), где R(i, j) обозначает коэффициенты автокорреляционной матрицы R, где i является первым индексом, обозначающим одну из множества строк автокорреляционной матрицы R, и где j является вторым индексом, обозначающим один из множества столбцов автокорреляционной матрицы R. 12 н. и 12 з.п. ф-лы, 3 ил.
Наверх