Устройство для квантования коэффициентов кодирования с линейным предсказанием, устройство кодирования звука, устройство для деквантования коэффициентов кодирования с линейным предсказанием, устройство декодирования звука и электронное устройство для этого

Изобретение относится к области квантования коэффициентов кодирования с линейным предсказанием. Технический результат – обеспечение повышения эффективности квантования аудио или речевого сигнала посредством выбора оптимального модуля квантования. Устройство квантования речевого или аудио сигнала содержит: модуль выбора, выполненный с возможностью выбора на основе ошибки предсказания одного из первого блока квантования и второго блока квантования методом открытого контура; первый блок квантования выполнен с возможностью квантования входного сигнала, включающего в себя по меньшей мере один из речевого сигнала или аудио сигнала, без межкадрового предсказания; второй блок квантования выполнен с возможностью квантования входного сигнала с межкадровым предсказанием. 19 з.п. ф-лы, 38 ил., 9 табл.

 

ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕ

Аппаратура, устройства и изделия производства, совместимые с настоящим раскрытием, относятся к квантованию и деквантованию коэффициентов кодирования с линейным предсказанием и, более конкретно, к устройству для эффективного квантования коэффициентов кодирования с линейным предсказанием с низкой сложностью, устройству кодирования звука, использующему устройство квантования, устройству для деквантования коэффициентов кодирования с линейным предсказанием, устройству декодирования звука, использующему устройство деквантования, и электронным устройствам для этого.

УРОВЕНЬ ТЕХНИКИ

В системах для кодирования звука, такого как речь или аудио, коэффициенты кодирования с линейным предсказанием (LPC) используются, чтобы представлять кратковременную частотную характеристику звука. Коэффициенты LPC получаются в схеме разделения входного звука на блоки кадров и минимизации энергии ошибки предсказания на каждый кадр. Однако, так как коэффициенты LPC имеют большой динамический диапазон и характеристика используемого фильтра LPC является очень чувствительной к ошибкам квантования коэффициентов LPC, устойчивость фильтра LPC не гарантируется.

Таким образом, квантование выполняется посредством преобразования коэффициентов LPC в другие коэффициенты, для которых легко проверять устойчивость фильтра, которые являются предпочтительными для интерполяции, и которые имеют хорошую характеристику квантования. Главным образом является предпочтительным, чтобы квантование выполнялось посредством преобразования коэффициентов LPC в коэффициенты частот спектральных линий (LSF) или частот спектрального иммитанса (ISF). В частности, способ квантования коэффициентов LPC может увеличивать выигрыш квантования посредством использования высокой межкадровой корреляции коэффициентов LSF в частотной области и временной области.

Коэффициенты LSF указывают частотную характеристику кратковременного звука, и для кадров, в которых частотная характеристика входного звука изменяется быстро, коэффициенты LSF кадров также быстро изменяются. Однако для модуля квантования, использующего высокую межкадровую корреляцию коэффициентов LSF, так как должное предсказание не может выполняться для быстро изменяющихся кадров, производительность квантования модуля квантования уменьшается.

СУЩНОСТЬ ИЗОБРЕТЕНИЯ

ТЕХНИЧЕСКАЯ ЗАДАЧА

Одним аспектом является обеспечить устройство для эффективного квантования коэффициентов кодирования с линейным предсказанием (LPC) с низкой сложностью, устройство кодирования звука, использующее это устройство квантования, устройство для деквантования коэффициентов LPC, устройство декодирования звука, использующее это устройство деквантования, и электронное устройство для этого.

Согласно одному аспекту одного или более примерных вариантов осуществления, обеспечивается устройство квантования, содержащее блок определения пути квантования, который определяет один из множества путей, включающего в себя первый путь, не использующий межкадровое предсказание, и второй путь, использующий межкадровое предсказание, в качестве пути квантования входного сигнала, на основе критерия до квантования входного сигнала; первый блок квантования, который квантует входной сигнал, если в качестве пути квантования входного сигнала определяется первый путь; и второй блок квантования, который квантует входной сигнал, если в качестве пути квантования входного сигнала определяется второй путь.

Согласно другому аспекту одного или более примерных вариантов осуществления, обеспечивается устройство кодирования, содержащее блок определения режима кодирования, который определяет режим кодирования входного сигнала; блок квантования, который определяет один из множества путей, включающего в себя первый путь, не использующий межкадровое предсказание, и второй путь, использующий межкадровое предсказание, в качестве пути квантования входного сигнала на основе критерия до квантования входного сигнала, и который квантует входной сигнал посредством использования одной из первой схемы квантования и второй схемы квантования согласно определенному пути квантования; блок кодирования переменного режима, который кодирует квантованный входной сигнал в режиме кодирования; и блок кодирования параметров, который генерирует битовый поток, включающий в себя одно из результата, квантованного в первом блоке квантования, и результата, квантованного во втором блоке квантования, режим кодирования входного сигнала, и информацию пути, относящуюся к квантованию входного сигнала.

Согласно другому аспекту одного или более примерных вариантов осуществления, обеспечивается устройство деквантования, содержащее блок определения пути деквантования, который определяет один из множества путей, включающего в себя первый путь, не использующий межкадровое предсказание, и второй путь, использующий межкадровое предсказание, в качестве пути деквантования параметров кодирования с линейным предсказанием (LPC) на основе информации пути квантования, включенной в битовый поток; первый блок деквантования, который деквантует параметры LPC, если в качестве пути деквантования параметров LPC определяется первый путь; и второй блок деквантования, который деквантует параметры LPC, если в качестве пути деквантования параметров LPC выбирается второй путь, при этом информация пути квантования определяется на основе критерия до квантования входного сигнала на стороне кодирования.

Согласно другому аспекту одного или более примерных вариантов осуществления, обеспечивается устройство декодирования, содержащее блок декодирования параметров, который декодирует параметры кодирования с линейным предсказанием (LPC) и режим кодирования, включенные в битовый поток; блок деквантования, который деквантует декодированные параметры LPC посредством использования одной из первой схемы деквантования, не использующей межкадровое предсказание, и второй схемы деквантования, использующей межкадровое предсказание, на основе информации пути квантования, включенной в битовый поток; и блок декодирования переменного режима, который декодирует деквантованные параметры LPC в декодированном режиме кодирования, при этом информация пути квантования определяется на основе критерия до квантования входного сигнала на стороне кодирования.

Согласно другому аспекту одного или более примерных вариантов осуществления, обеспечивается электронное устройство, включающее в себя блок связи, который принимает, по меньшей мере, одно из звукового сигнала и закодированного битового потока, или который передает, по меньшей мере, одно из закодированного звукового сигнала и восстановленного звука; и модуль кодирования, который выбирает один из множества путей, включающего в себя первый путь, не использующий межкадровое предсказание, и второй путь, использующий межкадровое предсказание, в качестве пути квантования принятого звукового сигнала на основе критерия до квантования принятого звукового сигнала, квантует принятый звуковой сигнал посредством использования одной из первой схемы квантования и второй схемы квантования согласно выбранному пути квантования, и кодирует квантованный звуковой сигнал в режиме кодирования.

Согласно другому аспекту одного или более примерных вариантов осуществления, обеспечивается электронное устройство, включающее в себя блок связи, который принимает, по меньшей мере, одно из звукового сигнала и закодированного битового потока, или который передает, по меньшей мере, одно из закодированного звукового сигнала и восстановленного звука; и модуль декодирования, который декодирует параметры кодирования с линейным предсказанием (LPC) и режим кодирования, включенные в битовый поток, деквантует декодированные параметры LPC посредством использования одной из первой схемы деквантования, не использующей межкадровое предсказание, и второй схемы деквантования, использующей межкадровое предсказание на основе информации пути, включенной в битовый поток, и декодирует деквантованные параметры LPC в декодированном режиме кодирования, при этом информация пути определяется на основе критерия до квантования звукового сигнала на стороне кодирования.

Согласно другому аспекту одного или более примерных вариантов осуществления, обеспечивается электронное устройство, включающее в себя блок связи, который принимает, по меньшей мере, одно из звукового сигнала и закодированного битового потока, или который передает, по меньшей мере, одно из закодированного звукового сигнала и восстановленного звука; модуль кодирования, который выбирает один из множества путей, включающего в себя первый путь, не использующий межкадровое предсказание, и второй путь, использующий межкадровое предсказание, в качестве пути квантования принятого звукового сигнала на основе критерия до квантования принятого звукового сигнала, квантует принятый звуковой сигнал посредством использования одной из первой схемы квантования и второй схемы квантования согласно выбранному пути квантования, и кодирует квантованный звуковой сигнал в режиме кодирования; и модуль декодирования, который декодирует параметры кодирования с линейным предсказанием (LPC) и режим кодирования, включенные в битовый поток, деквантует декодированные параметры LPC посредством использования одной из первой схемы деквантования, не использующей межкадровое предсказание, и второй схемы деквантования, использующей межкадровое предсказание, на основе информации пути, включенной в битовый поток, и декодирует деквантованные параметры LPC в декодированном режиме кодирования.

ПОЛОЖИТЕЛЬНЫЕ ЭФФЕКТЫ ИЗОБРЕТЕНИЯ

Согласно представленной новой концепции, чтобы эффективно квантовать аудио или речевой сигнал, посредством применения множества режимов кодирования согласно характеристикам аудио или речевого сигнала и назначения различных количеств битов аудио или речевому сигналу согласно отношению сжатия, применяемому к каждому из режимов кодирования, может выбираться оптимальный модуль квантования с низкой сложностью в каждом из режимов кодирования.

КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙ

Вышеописанные и другие аспекты станут более ясными из подробного описания их примерных вариантов осуществления со ссылкой на прилагаемые чертежи, на которых:

Фиг. 1 является блок-схемой устройства кодирования звука согласно одному примерному варианту осуществления;

Фиг. 2A-2D являются примерами различных режимов кодирования, которые могут выбираться модулем выбора режима кодирования устройства кодирования звука из фиг. 1;

Фиг. 3 является блок-схемой модуля квантования коэффициентов кодирования с линейным предсказанием (LPC) согласно одному примерному варианту осуществления;

Фиг. 4 является блок-схемой определителя взвешивающей функции согласно одному примерному варианту осуществления;

Фиг. 5 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления;

Фиг. 6 является блок-схемой модуля выбора пути квантования согласно одному примерному варианту осуществления;

Фиг. 7A и 7B являются блок-схемами последовательности операций, иллюстрирующими операции модуля выбора пути квантования из фиг. 6, согласно одному примерному варианту осуществления;

Фиг. 8 является блок-схемой модуля выбора пути квантования согласно другому примерному варианту осуществления;

Фиг. 9 иллюстрирует информацию относительно состояния канала, передаваемого в сетевом конце, когда обеспечивается служба кодека;

Фиг. 10 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления;

Фиг. 11 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления;

Фиг. 12 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления;

Фиг. 13 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления;

Фиг. 14 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления;

Фиг. 15 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления;

Фиг. 16A и 16B являются блок-схемами модулей квантования коэффициентов LPC согласно другим примерным вариантам осуществления;

Фиг. 17A-17C являются блок-схемами модулей квантования коэффициентов LPC согласно другим примерным вариантам осуществления;

Фиг. 18 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления;

Фиг. 19 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления;

Фиг. 20 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления;

фиг. 21 является блок-схемой модуля выбора типа модуля квантования согласно одному примерному варианту осуществления;

Фиг. 22 является блок-схемой последовательности операций, иллюстрирующей работу способа выбора типа модуля квантования, согласно одному примерному варианту осуществления;

Фиг. 23 является блок-схемой устройства декодирования звука согласно одному примерному варианту осуществления;

Фиг. 24 является блок-схемой модуля деквантования коэффициентов LPC согласно одному примерному варианту осуществления;

Фиг. 25 является блок-схемой модуля деквантования коэффициентов LPC согласно другому примерному варианту осуществления;

Фиг. 26 является блок-схемой примера первой схемы деквантования и второй схемы деквантования в модуле деквантования коэффициентов LPC из фиг. 25, согласно одному примерному варианту осуществления;

Фиг. 27 является блок-схемой последовательности операций, иллюстрирующей способ квантования согласно одному примерному варианту осуществления;

Фиг. 28 является блок-схемой последовательности операций, иллюстрирующей способ деквантования согласно одному примерному варианту осуществления;

Фиг. 29 является блок-схемой электронного устройства, включающего в себя модуль кодирования, согласно одному примерному варианту осуществления;

Фиг. 30 является блок-схемой электронного устройства, включающего в себя модуль декодирования, согласно одному примерному варианту осуществления; и

Фиг. 31 является блок-схемой электронного устройства, включающего в себя модуль кодирования и модуль декодирования, согласно одному примерному варианту осуществления.

ВАРИАНТ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ

Представленная новая концепция может обеспечивать возможность различных типов изменения или модификации и различных изменений в форме, и конкретные примерные варианты осуществления иллюстрируются на чертежах и описываются подробно в описании. Однако следует понимать, что конкретные примерные варианты осуществления не ограничивают представленную новую концепцию конкретной формой раскрытия, но включают в себя каждую модифицированную, эквивалентную, или замененную форму в пределах сущности и технического объема представленной новой концепции. В последующем описании, хорошо известные функции или конструкции подробно не описываются, так как они могли бы затруднить понимание изобретения излишними деталями.

Хотя такие признаки, как 'первый' и 'второй', могут использоваться, чтобы описывать разнообразные элементы, элементы не могут быть ограничены упомянутыми признаками. Упомянутые признаки могут использоваться, чтобы отличать некоторый элемент от другого элемента.

Терминология, используемая в заявке, используется только, чтобы описывать конкретные примерные варианты осуществления и не имеет какого-либо намерения, чтобы ограничивать новую концепцию. Хотя общие термины, такие как те, что в настоящее время широко используются как возможные, выбраны в качестве признаков, используемых в представленной новой концепции, при принятии в рассмотрение функций в представленной новой концепции, они могут изменяться согласно намерению специалистов в данной области техники, судебным прецедентам, или появлению новой технологии. В дополнение, в конкретных случаях, могут использоваться признаки, намеренно выбранные заявителем, и в этом случае, смысл признаков будет раскрываться в соответствующем описании. Соответственно, признаки, используемые в представленной новой концепции, должны определяться не посредством простых названий признаков, но посредством смысла признаков и содержания в соответствии с представленной новой концепцией.

Выражение в форме единственного числа включает в себя выражение в форме множественного числа, если они не являются явным образом отличающимися друг от друга в контексте. В настоящей заявке, следует понимать, что признаки, такие как 'включать в себя' и 'иметь', используются, чтобы указывать существование осуществленного признака, количества, этапа, операции, элемента, части, или их комбинации без исключения заранее возможности существования или добавления одного или более других признаков, количеств, этапов, операций, элементов, частей, или их комбинаций.

Представленная новая концепция теперь будет описываться более полно со ссылкой на сопровождающие чертежи, на которых показаны примерные варианты осуществления настоящего изобретения. Сходные ссылочные позиции на чертежах обозначают сходные элементы, и, таким образом, их повторное описание будет пропускаться.

Такие выражения, как "по меньшей мере, одно из", когда предшествуют списку элементов, модифицируют весь список элементов и не модифицируют отдельные элементы списка.

Фиг. 1 является блок-схемой устройства 100 кодирования звука согласно одному примерному варианту осуществления.

Устройство 100 кодирования звука, показанное на фиг. 1, может включать в себя процессор предварительной обработки (например, центральный блок обработки (CPU)) 111, анализатор 113 спектра и линейного предсказания (LP), модуль 115 выбора режима кодирования, модуль 117 квантования коэффициентов кодирования с линейным предсказанием (LPC), кодер 119 переменного режима, и кодер 121 параметров. Каждый из компонентов устройства 100 кодирования звука может осуществляться посредством, по меньшей мере, одного процессора (например, центрального блока обработки (CPU)) посредством объединения в, по меньшей мере, одном модуле. Следует отметить, что звук может означать аудио, речь, или комбинацию перечисленного. Описание, которое следует, для удобства описания ссылается на звук в качестве речи. Однако следует понимать, что может обрабатываться любой звук.

Как показано на фиг. 1, процессор 111 предварительной обработки может предварительно обрабатывать входной речевой сигнал. В процессе предварительной обработки, нежелательный частотный компонент может удаляться из речевого сигнала, или частотная характеристика речевого сигнала может регулироваться, чтобы быть предпочтительной для кодирования. Подробно, процессор 111 предварительной обработки может выполнять фильтрацию верхних частот, предыскажение, или преобразование дискретизации.

Анализатор 113 спектра и LP может извлекать коэффициенты LPC посредством анализа характеристик в частотной области или выполнения анализа LP над предварительно обработанным речевым сигналом. Хотя, в общем, выполняется один анализ LP на кадр, два или более анализа LP на кадр могут выполняться для дополнительного улучшения качества звука. В этом случае, один анализ LP является LP для конца кадра, который выполняется как стандартный анализ LP, и другие могут быть LP для средних подкадров для улучшения качества звука. В этом случае, конец кадра текущего кадра указывает конечный подкадр среди подкадров, формирующих текущий кадр, и конец кадра предыдущего кадра указывает конечный подкадр среди подкадров, формирующих предыдущий кадр. Например, один кадр может состоять из 4 подкадров.

Средние подкадры указывают один или более подкадров среди подкадров, существующих между конечным подкадром, который является концом кадра предыдущего кадра, и конечным подкадром, который является концом кадра текущего кадра. Соответственно, анализатор 113 спектра и LP может извлекать в целом два или более наборов коэффициентов LPC. Коэффициенты LPC могут использовать порядок 10, когда входной сигнал является узкополосным, и могут использовать порядок от 16 до 20, когда входной сигнал является широкополосным. Однако размерность коэффициентов LPC не ограничена этим.

Модуль 115 выбора режима кодирования может выбирать один из множества режимов кодирования в соответствии с множеством скоростей. В дополнение, модуль 115 выбора режима кодирования может выбирать один из множества режимов кодирования посредством использования характеристик речевого сигнала, которые получаются из информации о диапазоне, информации об основном тоне, или информации анализа частотной области. В дополнение, модуль 115 выбора режима кодирования может выбирать один из множества режимов кодирования посредством использования множества скоростей и характеристик речевого сигнала.

Модуль 117 квантования коэффициентов LPC может квантовать коэффициенты LPC, извлеченные посредством анализатора 113 спектра и LP. Модуль 117 квантования коэффициентов LPC может выполнять квантование посредством преобразования коэффициентов LPC в другие коэффициенты, подходящие для квантования. Модуль 117 квантования коэффициентов LPC может выбирать один из множества путей, включающего в себя первый путь, не использующий межкадровое предсказание, и второй путь, использующий межкадровое предсказание, в качестве пути квантования речевого сигнала на основе первого критерия до квантования речевого сигнала и квантовать речевой сигнал посредством использования одной из первой схемы квантования и второй схемы квантования согласно выбранному пути квантования. Альтернативно, модуль 117 квантования коэффициентов LPC может квантовать коэффициенты LPC как для первого пути посредством первой схемы квантования, не использующей межкадровое предсказание, так и для второго пути посредством второй схемы квантования, использующей межкадровое предсказание, и выбирать результат квантования одного из первого пути и второго пути на основе второго критерия. Первый и второй критерии могут быть идентичными друг с другом или отличающимися друг от друга.

Кодер 119 переменного режима может генерировать битовый поток посредством кодирования коэффициентов LPC, квантованных посредством модуля 117 квантования коэффициентов LPC. Кодер 119 переменного режима может кодировать квантованные коэффициенты LPC в режиме кодирования, выбранном посредством модуля 115 выбора режима кодирования. Кодер 119 переменного режима может кодировать сигнал возбуждения коэффициентов LPC в блоках кадров или подкадров.

Примером алгоритмов кодирования, используемых в кодере 119 переменного режима, может быть линейное предсказание с кодовым возбуждением (CELP) или алгебраическое CELP (ACELP). Алгоритм кодирования с преобразованием может дополнительно использоваться согласно режиму кодирования. Показательными параметрами для кодирования коэффициентов LPC в алгоритме CELP являются индекс адаптивной кодовой книги, усиление адаптивной кодовой книги, индекс фиксированной кодовой книги, и усиление фиксированной кодовой книги. Текущий кадр, закодированный посредством кодера 119 переменного режима, может сохраняться для кодирования последующего кадра.

Кодер 121 параметров может кодировать параметры, подлежащие использованию концом декодирования для декодирования, подлежащие включению в битовый поток. Является предпочтительным, если кодируются параметры, соответствующие режиму кодирования. Битовый поток, сгенерированный кодером 121 параметров, может сохраняться или передаваться.

Фиг. 2A - 2D являются примерами различных режимов кодирования, которые могут выбираться модулем 115 выбора режима кодирования устройства 100 кодирования звука из фиг. 1. Фиг. 2A и 2C являются примерами режимов кодирования, классифицированных в случае, когда количество битов, назначенное квантованию, является большим, т.е. в случае высокой скорости передачи битов, и фиг. 2B и 2D являются примерами режимов кодирования, классифицированных в случае, когда количество битов, назначенное квантованию, является маленьким, т.е. в случае низкой скорости передачи битов.

Во-первых, в случае высокой скорости передачи битов, речевой сигнал может классифицироваться в режим общего кодирования (GC) и режим транзитивного кодирования (TC) для простой структуры, как показано на фиг. 2A. В этом случае, режим GC включает в себя режим невокализированного кодирования (UC) и режим вокализованного кодирования (VC). В случае высокой скорости передачи битов, режим неактивного кодирования (IC) и режим кодирования аудио (AC) могут дополнительно включаться сюда, как показано на фиг. 2C.

В дополнение, в случае низкой скорости передачи битов, речевой сигнал может классифицироваться в режим GC, режим UC, режим VC, и режим TC, как показано на фиг. 2B. В дополнение, в случае низкой скорости передачи битов, режим IC и режим AC могут дополнительно включаться сюда, как показано на фиг. 2D.

На фиг. 2A и 2C, режим UC может выбираться тогда, когда речевой сигнал является невокализированным звуком или шумом, имеющим характеристики, аналогичные невокализированному звуку. Режим VC может выбираться, когда речевой сигнал является вокализованным звуком. Режим TC может использоваться, чтобы кодировать сигнал интервала перехода, в котором характеристики речевого сигнала быстро изменяются. Режим GC может использоваться, чтобы кодировать другие сигналы. Режим UC, режим VC, режим TC, и режим GC основываются на определении и критерии классификации, раскрытых в ITU-T G.718, но не ограничены этим.

На фиг. 2B и 2D, режим IC может выбираться для тихого звука, и режим AC может выбираться тогда, когда характеристики речевого сигнала являются приближенными к аудио.

Режимы кодирования могут дополнительно классифицироваться согласно диапазонам речевого сигнала. Диапазоны речевого сигнала могут классифицироваться в, например, узкополосный (NB), широкополосный (WB), сверхширокополосный (SWB), и с полной полосой частот (FB). NB может иметь ширину полосы от приблизительно 300 Гц до приблизительно 3400 Гц или от приблизительно 50 Гц до приблизительно 4000 Гц, WB может иметь ширину полосы от приблизительно 50 Гц до приблизительно 7000 Гц или от приблизительно 50 Гц до приблизительно 8000 Гц, SWB может иметь ширину полосы от приблизительно 50 Гц до приблизительно 14000 Гц или от приблизительно 50 Гц до приблизительно 16000 Гц, и FB может иметь ширину полосы вплоть до приблизительно 20000 Гц. Здесь, численные значения, относящиеся к ширинам полос, установлены для удобства и не ограничены этим. В дополнение, классификация диапазонов может устанавливаться более просто или с большей сложностью, чем вышеизложенное описание.

Кодер 119 переменного режима из фиг. 1 может кодировать коэффициенты LPC посредством использования разных алгоритмов кодирования, соответствующих режимам кодирования, показанным на фиг. 2A-2D. Когда типы режимов кодирования и количество режимов кодирования определяются, может иметься необходимость обучения кодовой книги снова посредством использования речевых сигналов, соответствующих определенным режимам кодирования.

Таблица 1 показывает пример схем и структур квантования в случае 4 режимов кодирования. Здесь, способ квантования, не использующий межкадровое предсказание, может называться страховочной схемой, и способ квантования, использующий межкадровое предсказание, может называться схемой с предсказанием. В дополнение, VQ обозначает модуль векторного квантования, и BC-TCQ обозначает модуль ограниченного по блокам квантования с решетчатым кодированием.

[Таблица 1]

Таблица 1
Режим кодирования Схема квантования Структура
UC, NB/WB Страховочная VQ+BC-TCQ
VC, NB/WB Страховочная
С предсказанием
VQ+BC-TCQ с межкадровым предсказанием + BC-TCQ с внутрикадровым предсказанием
GC, NB/WB Страховочная
С предсказанием
VQ+BC-TCQ с межкадровым предсказанием + BC-TCQ с внутрикадровым предсказанием
TC, NB/WB Страховочная VQ+BC-TCQ

Режимы кодирования могут изменяться согласно применяемой скорости передачи битов. Как описано выше, чтобы квантовать коэффициенты LPC при высокой скорости передачи битов с использованием двух режимов кодирования, 40 или 41 бит на кадр могут использоваться в режиме GC, и 46 битов на каждый кадр могут использоваться в режиме TC.

Фиг. 3 является блок-схемой модуля 300 квантования коэффициентов LPC согласно одному примерному варианту осуществления.

Модуль 300 квантования коэффициентов LPC, показанный на фиг. 3, может включать в себя первый преобразователь 311 коэффициентов, определитель 313 взвешивающей функции, модуль 315 квантования частот спектрального иммитанса (ISF)/частот спектральных линий (LSF), и второй преобразователь 317 коэффициентов. Каждый из компонентов модуля 300 квантования коэффициентов LPC может осуществляться посредством, по меньшей мере, одного процессора (например, центрального блока обработки (CPU)) посредством объединения в, по меньшей мере, одном модуле.

Как показано на фиг. 3, первый преобразователь 311 коэффициентов может преобразовывать коэффициенты LPC, извлеченные посредством выполнения анализа LP над концом кадра текущего или предыдущего кадра речевого сигнала, в коэффициенты в другом формате. Например, первый преобразователь 311 коэффициентов может преобразовывать коэффициенты LPC конца кадра текущего или предыдущего кадра в любой формат коэффициентов LSF и коэффициентов ISF. В этом случае, коэффициенты ISF или коэффициенты LSF указывают пример форматов, в которых коэффициенты LPC могут легко квантоваться.

Определитель 313 взвешивающей функции может определять взвешивающую функцию, относящуюся к важности коэффициентов LPC по отношению к концу кадра текущего кадра и концу кадра предыдущего кадра, посредством использования коэффициентов ISF или коэффициентов LSF, преобразованных из коэффициентов LPC. Определенная взвешивающая функция может использоваться в обработке выбора пути квантования или поиска индекса кодовой книги, посредством которого минимизируются ошибки взвешивания в квантовании. Например, определитель 313 взвешивающей функции может определять взвешивающую функцию по амплитуде и взвешивающую функцию по частоте.

В дополнение, определитель 313 взвешивающей функции может определять взвешивающую функцию посредством принятия в рассмотрение, по меньшей мере, одного из частотного диапазона, режима кодирования, и информации анализа спектра. Например, определитель 313 взвешивающей функции может выводить оптимальную взвешивающую функцию на каждый режим кодирования. В дополнение, определитель 313 взвешивающей функции может выводить оптимальную взвешивающую функцию по частотному диапазону. Дополнительно, определитель 313 взвешивающей функции может выводить оптимальную взвешивающую функцию на основе информации частотного анализа речевого сигнала. Информация частотного анализа может включать в себя информацию наклона спектра. Определитель 313 взвешивающей функции будет описываться более подробно ниже.

Модуль 315 квантования ISF/LSF может квантовать коэффициенты ISF или коэффициенты LSF, преобразованные из коэффициентов LPC конца кадра текущего кадра. Модуль 315 квантования ISF/LSF может получать оптимальный индекс квантования во входном режиме кодирования. Модуль 315 квантования ISF/LSF может квантовать коэффициенты ISF или коэффициенты LSF посредством использования взвешивающей функции, определенной посредством определителя 313 взвешивающей функции. Модуль 315 квантования ISF/LSF может квантовать коэффициенты ISF или коэффициенты LSF посредством выбора одного из множества путей квантования при использовании взвешивающей функции, определенной посредством определителя 313 взвешивающей функции. Как результат квантования, могут получаться индекс квантования коэффициентов ISF или коэффициентов LSF и коэффициенты квантованных ISF (QISF) или квантованных LSF (QLSF) по отношению к концу кадра текущего кадра.

Второй преобразователь 317 коэффициентов может преобразовывать коэффициенты QISF или QLSF в квантованные коэффициенты LPC (QLPC).

Теперь будет описываться отношение между векторным квантованием коэффициентов LPC и взвешивающей функцией.

Векторное квантование указывает обработку выбора индекса кодовой книги, имеющего наименьшую ошибку, посредством использования показателя возведенного в квадрат расстояния ошибки, при принятии в рассмотрение, что все элементы в векторе имеют одну и ту же важность. Однако, так как важность является разной в каждом из коэффициентов LPC, если ошибки важных коэффициентов уменьшаются, воспринимаемое качество конечного синтезированного сигнала может увеличиваться. Таким образом, когда коэффициенты LSF квантуются, устройства декодирования могут увеличивать характеристику синтезированного сигнала посредством применения взвешивающей функции, представляющей важность каждого из коэффициентов LSF по отношению к показателю возведенного в квадрат расстояния ошибки, и выбора оптимального индекса кодовой книги.

Согласно одному примерному варианту осуществления, взвешивающая функция по амплитуде может определяться на основе того, что каждый из коэффициентов ISF или LSF фактически влияет на огибающую спектра, посредством использования частотной информации и фактических спектральных амплитуд коэффициентов ISF или LSF. Согласно одному примерному варианту осуществления, дополнительная эффективность квантования может получаться посредством комбинирования взвешивающей функции по амплитуде и взвешивающей функции по частоте при принятии в рассмотрение характеристик восприятия и распределения формант частотной области. Согласно одному примерному варианту осуществления, так как используется фактическая амплитуда частотной области, информация огибающей всех частот может отражаться хорошо, и вес каждого из коэффициентов ISF или LSF может корректно выводиться.

Согласно одному примерному варианту осуществления, когда выполняется векторное квантование коэффициентов ISF или LSF, преобразованных из коэффициентов LPC, если важность каждого коэффициента является разной, может определяться взвешивающая функция, указывающая то, какой элемент является относительно более важным в векторе. В дополнение, чтобы улучшать точность кодирования, может определяться взвешивающая функция, способная обеспечивать больший вес части высокой энергии, посредством анализа спектра кадра, подлежащего кодированию. Высокая спектральная энергия указывает высокую корреляцию во временной области.

Описывается пример применения такой взвешивающей функции к функции ошибки.

Во-первых, если изменение входного сигнала является высоким, когда квантование выполняется без использования межкадрового предсказания, функция ошибки для поиска индекса кодовой книги посредством коэффициентов QISF может представляться посредством Уравнения 1 ниже. В противном случае, если изменение входного сигнала является низким, когда квантование выполняется с использованием межкадрового предсказания, функция ошибки для поиска индекса кодовой книги посредством коэффициентов QISF, может представляться посредством Уравнения 2. Индекс кодовой книги указывает значение для минимизации соответствующей функции ошибки.

(1)

(2)

Здесь, w(i) обозначает взвешивающую функцию, z(i) и r(i) обозначают входы модуля квантования, z(i) обозначает вектор, в котором среднее значение удалено из ISF(i) на фиг. 3, и r(i) обозначает вектор, в котором значение межкадрового предсказания удалено из z(i). Ewerr(k) может использоваться, чтобы осуществлять поиск в кодовой книге в случае, когда межкадровое предсказание не выполняется, и Ewerr(p) может использоваться, чтобы осуществлять поиск в кодовой книге в случае, когда межкадровое предсказание выполняется. В дополнение, c(i) обозначает кодовую книгу, и p обозначает порядок коэффициентов ISF, который обычно равняется 10 в NB и от 16 до 20 в WB.

Согласно одному примерному варианту осуществления, устройства кодирования могут определять оптимальную взвешивающую функцию посредством комбинирования взвешивающей функции по амплитуде при использовании спектральных амплитуд, соответствующих частотам коэффициентов ISF или LSF, преобразованных из коэффициентов LPC, и взвешивающей функции по частоте при принятии в рассмотрение характеристик восприятия и распределения формант входного сигнала.

Фиг. 4 является блок-схемой определителя 400 взвешивающей функции согласно одному примерному варианту осуществления. Определитель 400 взвешивающей функции показан вместе с оконным процессором 421, блоком 423 частотного преобразования, и модулем 425 вычисления амплитуды анализатора 410 спектра и LP.

Как показано на фиг. 4, оконный процессор 421 может применять окно к входному сигналу. Окно может быть прямоугольным окном, окном Хемминга, или синусным окном.

Блок 423 частотного преобразования может преобразовывать входной сигнал во временной области во входной сигнал в частотной области. Например, блок 423 частотного преобразования может преобразовывать входной сигнал в частотную область посредством быстрого преобразования Фурье (FFT) или модифицированного дискретного косинусного преобразования (MDCT).

Модуль 425 вычисления амплитуды может вычислять амплитуды интервалов частотного спектра по отношению к входному сигналу, преобразованному в частотную область. Количество интервалов частотного спектра может быть таким же, как количество для нормализации коэффициентов ISF или LSF посредством определителя 400 взвешивающей функции.

Информация анализа спектра может вводиться в определитель 400 взвешивающей функции как результат, выполненный посредством анализатора 410 спектра и LP. В этом случае, информация анализа спектра может включать в себя наклон спектра.

Определитель 400 взвешивающей функции может нормализовывать коэффициенты ISF или LSF, преобразованные из коэффициентов LPC. Диапазон, к которому нормализация фактически применяется из числа коэффициентов ISF p-ого порядка, равняется с 0-ого по (p-2)-ой порядок. Обычно, коэффициенты ISF с 0-ого по (p-2)-ой порядок существуют между 0 и π. Определитель 400 взвешивающей функции может выполнять нормализацию с таким же числом K, что и количество интервалов частотного спектра, которое выведено посредством блока 423 частотного преобразования, чтобы использовать информацию анализа спектра.

Определитель 400 взвешивающей функции может определять амплитудную взвешивающую функцию W1(n), в которой коэффициенты ISF или LSF влияют на огибающую спектра для среднего подкадра, посредством использования информации анализа спектра. Например, определитель 400 взвешивающей функции может определять амплитудную взвешивающую функцию W1(n) посредством использования частотной информации коэффициентов ISF или LSF и фактических спектральных амплитуд входного сигнала. Амплитудная взвешивающая функция W1(n) может определяться для коэффициентов ISF или LSF, преобразованных из коэффициентов LPC.

Определитель 400 взвешивающей функции может определять амплитудную взвешивающую функцию W1(n) посредством использования амплитуды интервала частотного спектра, соответствующего каждому из коэффициентов ISF или LSF.

Определитель 400 взвешивающей функции может определять амплитудную взвешивающую функцию W1(n) посредством использования амплитуд интервала спектра, соответствующего каждому из коэффициентов ISF или LSF, и, по меньшей мере, одного смежного интервала спектра, расположенного около упомянутого интервала спектра. В этом случае, определитель 400 взвешивающей функции может определять амплитудную взвешивающую функцию W1(n), относящуюся к огибающей спектра, посредством извлечения репрезентативного значения каждого интервала спектра и, по меньшей мере, одного смежного интервала спектра. Пример репрезентативного значения является максимальным значением, средним значением, или промежуточным значением интервала спектра, соответствующего каждому из коэффициентов ISF или LSF и, по меньшей мере, одному смежному интервалу спектра.

Определитель 400 взвешивающей функции может определять частотную взвешивающую функцию W2(n) посредством использования частотной информации коэффициентов ISF или LSF. Подробно, определитель 400 взвешивающей функции может определять частотную взвешивающую функцию W2(n) посредством использования характеристик восприятия и распределения формант входного сигнала. В этом случае, определитель 400 взвешивающей функции может извлекать характеристики восприятия входного сигнала согласно шкале барков. Затем, определитель 400 взвешивающей функции может определять частотную взвешивающую функцию W2(n) на основе первой форманты распределения формант.

Частотная взвешивающая функция W2(n) может давать результатом относительно низкий вес в супер низкой частоте и высокой частоте и давать результатом постоянный вес в частотном интервале низкой частоты, например, интервале, соответствующем первой форманте.

Определитель 400 взвешивающей функции может определять конечную взвешивающую функцию W(n) посредством комбинирования амплитудной взвешивающей функции W1(n) и частотной взвешивающей функции W2(n). В этом случае, определитель 400 взвешивающей функции может определять конечную взвешивающую функцию W(n) посредством умножения или добавления амплитудной взвешивающей функции W1(n) на или к частотной взвешивающей функции W2(n).

В качестве другого примера, определитель 400 взвешивающей функции может определять амплитудную взвешивающую функцию W1(n) и частотную взвешивающую функцию W2(n) посредством принятия в рассмотрение режима кодирования и информации частотного диапазона входного сигнала.

Для этого, определитель 400 взвешивающей функции может проверять режимы кодирования входного сигнала для случая, когда ширина полосы входного сигнала является NB, и случая, когда ширина полосы входного сигнала является WB, посредством проверки ширины полосы входного сигнала. Когда режим кодирования входного сигнала является режимом UC, определитель 400 взвешивающей функции может определять и комбинировать амплитудную взвешивающую функцию W1(n) и частотную взвешивающую функцию W2(n) в режиме UC.

Когда режим кодирования входного сигнала не является режимом UC, определитель 400 взвешивающей функции может определять и комбинировать амплитудную взвешивающую функцию W1(n) и частотную взвешивающую функцию W2(n) в режиме VC.

Если режим кодирования входного сигнала является режимом GC или режимом TC, определитель 400 взвешивающей функции может определять взвешивающую функцию посредством такой же обработки, что и в режиме VC.

Например, когда входной сигнал частотно преобразовывается посредством алгоритма FFT, амплитудная взвешивающая функция W1(n), использующая спектральные амплитуды коэффициентов FFT, может определяться посредством Уравнения 3 ниже.

, Min = минимальное значение (3)

Где

для

для или 127

тогда и

,

Например, частотная взвешивающая функция W2(n) в режиме VC может определяться посредством Уравнения 4, и частотная взвешивающая функция W2(n) в режиме UC может определяться посредством Уравнения 5. Постоянные в Уравнениях 4 и 5 могут изменяться согласно характеристикам входного сигнала:

, для (4)

для,

, для

, для (5)

, для

В конечном счете выводимая взвешивающая функция W(n) может определяться посредством Уравнения 6.

для (6)

Фиг. 5 является блок-схемой модуля квантования коэффициентов LPC согласно одному примерному варианту осуществления.

Как показано на фиг. 5, модуль 500 квантования коэффициентов LPC может включать в себя определитель 511 взвешивающей функции, определитель 513 пути квантования, первую схему 515 квантования, и вторую схему 517 квантования. Так как определитель 511 взвешивающей функции был описан на фиг. 4, здесь его описание пропускается.

Определитель 513 пути квантования может определять, что один из множества путей, включающего в себя первый путь, не использующий межкадровое предсказание, и второй путь, использующий межкадровое предсказание, выбирается в качестве пути квантования входного сигнала, на основе критерия до квантования входного сигнала.

Первая схема 515 квантования может квантовать входной сигнал, обеспеченный от определителя 513 пути квантования, когда в качестве пути квантования входного сигнала выбирается первый путь. Первая схема 515 квантования может включать в себя первый модуль квантования (не показан) для грубого квантования входного сигнала и второй модуль квантования (не показан) для точного квантования сигнала ошибки квантования между входным сигналом и выходным сигналом первого модуля квантования.

Вторая схема 517 квантования может квантовать входной сигнал, обеспеченный от определителя 513 пути квантования, когда в качестве пути квантования входного сигнала выбирается второй путь. Первая схема 515 квантования может включать в себя элемент для выполнения ограниченного по блокам квантования с решетчатым кодированием над ошибкой предсказания входного сигнала и значением межкадрового предсказания и элемент межкадрового предсказания.

Первая схема 515 квантования является схемой квантования, не использующей межкадровое предсказание, и может называться страховочной схемой. Вторая схема 517 квантования является схемой квантования, использующей межкадровое предсказание, и может называться схемой с предсказанием.

Первая схема 515 квантования и вторая схема 517 квантования не ограничены текущим примерным вариантом осуществления и могут осуществляться посредством использования первой и второй схем квантования согласно различным примерным вариантам осуществления, описанным ниже, соответственно.

Соответственно, в соответствии с низкой скоростью передачи битов для высоко эффективной интерактивной услуги передачи речи до высокой скорости передачи битов для обеспечения услуги различимого качества, может выбираться оптимальный модуль квантования.

Фиг. 6 является блок-схемой определителя пути квантования согласно одному примерному варианту осуществления. Как показано на фиг. 6, определитель 600 пути квантования может включать в себя модуль 611 вычисления ошибки предсказания и модуль 613 выбора схемы квантования.

Модуль 611 вычисления ошибки предсказания может вычислять ошибку предсказания различными способами посредством приема значения межкадрового предсказания p(n), взвешивающей функции w(n), и коэффициента LSF z(n), из которого значение постоянного тока (DC) удалено. Во-первых, может использоваться модуль межкадрового предсказания (не показан), который является таким же, как используемый во второй схеме квантования, т.е. схеме с предсказанием. Здесь, может использоваться любой из метода авторегрессии (AR) и метода скользящих средних (MA). Сигнал z(n) предыдущего кадра для межкадрового предсказания может использовать квантованное значение или неквантованное значение. В дополнение, ошибка предсказания может получаться посредством использования или не использования взвешивающей функции w(n). Соответственно, полное количество комбинаций равняется 8, 4 из которых являются следующими:

Во-первых, взвешенная AR ошибка предсказания, использующая квантованный сигнал предыдущего кадра, может представляться посредством Уравнения 7.

Во-вторых, AR ошибка предсказания, использующая квантованный сигнал предыдущего кадра, может представляться посредством Уравнения 8.

В-третьих, взвешенная AR ошибка предсказания, использующая сигнал z(n) предыдущего кадра, может представляться посредством Уравнения 9.

В-четвертых, AR ошибка предсказания, использующая сигнал z(n) предыдущего кадра, может представляться посредством Уравнения 10.

В Уравнениях 7-10, M обозначает порядок коэффициентов LSF и M обычно равняется 16, когда ширина полосы входного речевого сигнала является WB, и обозначает коэффициент предсказания метода AR. Как описано выше, в общем, используется информация относительно непосредственно предыдущего кадра, и схема квантования может определяться посредством использования ошибки предсказания, полученной из вышеизложенного описания.

В дополнение, для случая, когда информация относительно предыдущего кадра не существует вследствие ошибок кадра в предыдущем кадре, вторая ошибка предсказания может получаться посредством использования кадра непосредственно перед предыдущим кадром, и схема квантования может определяться посредством использования второй ошибки предсказания. В этом случае, вторая ошибка предсказания может представляться посредством Уравнения 11 ниже по сравнению с Уравнением 7.

Модуль 613 выбора схемы квантования определяет схему квантования текущего кадра посредством использования, по меньшей мере, одного из ошибки предсказания, полученной посредством модуля 611 вычисления ошибки предсказания, и режима кодирования, полученного посредством определителя режима кодирования (115 на фиг. 1).

Фиг. 7A является блок-схемой последовательности операций, иллюстрирующей работу определителя пути квантования из фиг. 6, согласно одному примерному варианту осуществления. В качестве примера, в качестве режима предсказания могут использоваться 0, 1 и 2. В режиме предсказания 0, может использоваться только страховочная схема, и в модели предсказания может использоваться только схема с предсказанием. В режиме предсказания 2, страховочная схема и схема с предсказанием могут переключаться.

Сигнал, подлежащий кодированию в режиме предсказания 0, имеет нестационарную характеристику. Нестационарный сигнал имеет большое изменение между соседними кадрами. Поэтому, если межкадровое предсказание выполняется над нестационарным сигналом, ошибка предсказания может быть более большой, чем исходный сигнал, что дает результатом ухудшение в производительности модуля квантования. Сигнал, подлежащий кодированию в режиме предсказания 1, имеет стационарную характеристику. Так как стационарный сигнал имеет маленькое изменение между соседними кадрами, его межкадровая корреляция является высокой. Оптимальная производительность может получаться посредством выполнения в режиме предсказания 2 квантования сигнала, в котором нестационарная характеристика и стационарная характеристика смешаны. Даже хотя сигнал имеет как нестационарную характеристику, так и стационарную характеристику, может устанавливаться либо режим предсказания 0, либо режим предсказания 1, на основе отношения смешивания. Между тем, отношение смешивания, подлежащее установке в режиме предсказания 2, может определяться как оптимальное значение заранее экспериментально или посредством моделирований.

Как показано на фиг. 7A, в операции 711, определяется, равняется ли режим предсказания текущего кадра 0, т.е. имеет ли речевой сигнал текущего кадра нестационарную характеристику. Как результат определения в операции 711, если режим предсказания равняется 0, например, когда изменение речевого сигнала текущего кадра является большим как в режиме TC или режиме UC, так как межкадровое предсказание является трудоемким, в качестве пути квантования в операции 714 может определяться страховочная схема, т.е. первая схема квантования.

Как результат определения в операции 711, если режим предсказания не равняется 0, в операции 712 определяется, равняется ли режим предсказания 1, т.е. имеет ли речевой сигнал текущего кадра стационарную характеристику. Как результат определения в операции 712, если режим предсказания равняется 1, так как производительность межкадрового предсказания является превосходной, в качестве пути квантования в операции 715 может определяться схема с предсказанием, т.е. вторая схема квантования.

Как результат определения в операции 712, если режим предсказания не равняется 1, определяется, что режим предсказания равняется 2, чтобы использовать первую схему квантования и вторую схему квантования способом переключения. Например, когда речевой сигнал текущего кадра не имеет нестационарную характеристику, т.е. когда режим предсказания равняется 2 в режиме GC или режиме VC, одна из первой схемы квантования и второй схемы квантования может определяться в качестве пути квантования посредством принятия в рассмотрение ошибки предсказания. Для этого, в операции 713 определяется, является ли первая ошибка предсказания между текущим кадром и предыдущим кадром более большой, чем первый порог. Первый порог может определяться заранее в качестве оптимального значения экспериментально или посредством моделирований. Например, в случае WB, имеющего порядок 16, первый порог может устанавливаться на 2,085,975.

Как результат определения в операции 713, если первая ошибка предсказания больше или равна первому порогу, в операции 714 в качестве пути квантования может определяться первая схема квантования. Как результат определения в операции 713, если первая ошибка предсказания не больше, чем первый порог, в операции 715 в качестве пути квантования может определяться схема с предсказанием, т.е. вторая схема квантования.

Фиг. 7B является блок-схемой последовательности операций, иллюстрирующей работу определителя пути квантования из фиг. 6, согласно другому примерному варианту осуществления.

Как показано на фиг. 7B, операции 731-733 являются идентичными операциям 711-713 из фиг. 7A, и дополнительно содержится операция 734, в которой вторая ошибка предсказания между кадром непосредственно перед предыдущим кадром и текущим кадром должна сравниваться со вторым порогом. Второй порог может определяться заранее в качестве оптимального значения экспериментально или посредством моделирований. Например, в случае WB, имеющего порядок 16, второй порог может устанавливаться на (первый порог×1.1).

Как результат определения в операции 734, если вторая ошибка предсказания больше или равна второму порогу, страховочная схема, т.е. первая схема квантования, может определяться в качестве пути квантования в операции 735. Как результат определения в операции 734, если вторая ошибка предсказания не больше, чем второй порог, схема с предсказанием, т.е. вторая схема квантования, может определяться в качестве пути квантования в операции 736.

Хотя на фиг. 7A и 7B количество режимов предсказания равняется 3, настоящее изобретение не ограничено этим.

Между тем, при определении схемы квантования, может дополнительно использоваться дополнительная информация помимо режима предсказания или ошибки предсказания.

Фиг. 8 является блок-схемой определителя пути квантования согласно одному примерному варианту осуществления. Как показано на фиг. 8, определитель 800 пути квантования может включать в себя модуль 811 вычисления ошибки предсказания, анализатор 813 спектра, и модуль 815 выбора схемы квантования.

Так как модуль 811 вычисления ошибки предсказания является идентичным модулю 611 вычисления ошибки предсказания из фиг. 6, его подробное описание пропускается.

Анализатор 813 спектра может определять характеристики сигнала текущего кадра посредством анализа информации спектра. Например, в анализаторе 813 спектра, взвешенное расстояние D между N (N является целым числом, большим, чем 1) предыдущими кадрами и текущим кадром может получаться посредством использования информации спектральной амплитуды в частотной области, и когда взвешенное расстояние больше, чем порог, т.е. когда межкадровое изменение является большим, в качестве схемы квантования может определяться страховочная схема. Так как количество объектов, подлежащих сравнению, увеличивается по мере того, как N увеличивается, сложность увеличивается по мере того, как N увеличивается. Взвешенное расстояние D может получаться с использованием Уравнения 12 ниже. Чтобы получить взвешенное расстояние D с низкой сложностью, текущий кадр может сравниваться с предыдущими кадрами посредством использования только спектральных амплитуд около частоты, определенной посредством LSF/ISF. В этом случае, среднее значение, максимальное значение, или промежуточное значение амплитуд M частотных интервалов около частоты, определенной посредством LSF/ISF, может сравниваться с предыдущими кадрами.

, где M=16 (12)

В Уравнении 12, взвешивающая функция Wk(i) может получаться посредством Уравнения 3, описанного выше, и является идентичной W1(n) из Уравнения 3. В Dn, n обозначает разность между предыдущим кадром и текущим кадром. Случай n=1 указывает взвешенное расстояние между непосредственно предыдущим кадром и текущим кадром, и случай n=2 указывает взвешенное расстояние между вторым предыдущим кадром и текущим кадром. Когда значение Dn больше, чем порог, может определяться, что текущий кадр имеет нестационарную характеристику.

Модуль 815 выбора схемы квантования может определять путь квантования текущего кадра посредством приема ошибок предсказания, обеспечиваемых от модуля 811 вычисления ошибки предсказания, и характеристик сигнала, режима предсказания, и информации канала передачи, обеспечиваемых от анализатора 813 спектра. Например, информации, вводимой в модуль 815 выбора схемы квантования, могут назначаться приоритеты для последовательного рассмотрения, когда выбирается путь квантования. Например, когда режим высокой частоты ошибок кадров (FER) включен в информацию канала передачи, отношение выбора страховочной схемы может устанавливаться относительно высоким, или может выбираться только страховочная схема. Отношение выбора страховочной схемы может переменным образом устанавливаться посредством регулировки порога, относящегося к ошибкам предсказания.

Фиг. 9 иллюстрирует информацию относительно состояния канала, передаваемого в сетевом конце, когда обеспечивается служба кодека.

Так как состояние канала является плохим, ошибки канала увеличиваются, и, как результат, межкадровое изменение может быть большим, давая результатом возникновение ошибок кадров. Таким образом, отношение выбора схемы с предсказанием в качестве пути квантования уменьшается и отношение выбора страховочной схемы увеличивается. Когда состояние канала является в высшей степени плохим, в качестве пути квантования может использоваться только страховочная схема. Для этого, значение, указывающее состояние канала посредством комбинирования множества частей информации канала передачи, выражается с помощью одного или более уровней. Высокий уровень указывает состояние, в котором вероятность ошибки канала является высокой. Наиболее простой случай является случаем, когда количество уровней равняется 1, т.е. случаем, когда состояние канала определяется как режим высокой FER посредством определителя 911 режима высокой FER, как показано на фиг. 9. Так как режим высокой FER указывает, что состояние канала является очень нестабильным, кодирование выполняется посредством использования наивысшего отношения выбора страховочной схемы или с использованием только страховочной схемы. Когда количество уровней является множественным, отношение выбора страховочной схемы может устанавливаться уровень за уровнем.

Как показано на фиг. 9, алгоритм определения режима высокой FER в определителе 911 режима высокой FER может выполняться посредством, например, 4 частей информации. Подробно, 4 части информации могут быть (1) информацией быстрой обратной связи (FFB), которая является обратной связью гибридного автоматического запроса повторения (HARQ), передаваемой в физический слой, (2) информацией медленной обратной связи (SFB), которая обеспечивается из сетевой сигнализации, передаваемой в более высокий слой, чем физический слой, (3) информацией внутри-диапазонной обратной связи (ISB), которая сигнализируется внутри диапазона от декодера 913 EVS в дальнем конце, и (4) информацией кадра высокой чувствительности (HSF), которая выбирается кодером 915 EVS по отношению к конкретному критическому кадру, подлежащему передаче избыточным способом. В то время как информация FFB и информация SFB являются независимыми от кодека EVS, информация ISB и информация HSF являются зависящими от кодека EVS и могут требовать конкретных алгоритмов для кодека EVS.

Алгоритм определения состояния канала как режима высокой FER посредством использования 4 частей информации, может быть выражен посредством, например, следующего кода как таблицы 2-4.

[Таблица 2]

Таблица 2
Определения
SFBavg: Средняя частота ошибок по Ns кадрам
FFBavg: Средняя частота ошибок по Nf кадрам
ISBavg: Средняя частота ошибок по Ni кадрам
Ts: Порог для частоты ошибок медленной обратной связи
Tf: Порог для частоты ошибок быстрой обратной связи
Ti: Порог для частоты ошибок обратной связи внутри диапазона

[Таблица 3]

Таблица 3
Установка в течение инициализации
Ns=100 Nf=10 Ni=100 Ts=20 Tf=2 Ti=20

[Таблица 4]

Таблица 4
Алгоритм
Цикл по каждому кадру {HFM=0; ЕСЛИ((HiOK) И SFBavg>Ts), ТОГДА HFM=1; ИНАЧЕ ЕСЛИ ((HiOK) И FFBavg>Tf), ТОГДА HFM=1; ИНАЧЕ ЕСЛИ ((HiOK) И ISBavg>TI), ТОГДА HFM=1; ИНАЧЕ ЕСЛИ ((HiOK) И (HSF=1), ТОГДА HFM=1; Обновление SFBavg; Обновление FFBavg; Обновление ISBavg;}

Как показано выше, кодеку EVS может даваться указание, чтобы входить в режим высокой FER, на основе информации анализа, обработанной с помощью одной или более из 4 частей информации. Информация анализа может быть, например, (1) SFBavg, выведенной из вычисленной средней частоты ошибок Ns кадров посредством использования информации SFB, (2) FFBavg, выведенной из вычисленной средней частоты ошибок Nf кадров посредством использования информации FFB, и (3) ISBavg, выведенной из вычисленной средней частоты ошибок Ni кадров посредством использования информации ISB, и порогами Ts, Tf, и Ti информации SFB, информации FFB, и информации ISB, соответственно. Может определяться, что определяется, что кодек EVS входит в режим высокой FER, на основе результата сравнения SFBavg, FFBavg, и ISBavg с порогами Ts, Tf, и Ti, соответственно. Для всех условий, может проверяться HiOK в отношении того, поддерживает ли обыкновенно каждый кодек режим высокой FER.

Определитель 911 режима высокой FER может включаться в качестве компонента кодера 915 EVS или кодера другого формата. Альтернативно, определитель 911 режима высокой FER может осуществляться в другом внешнем устройстве, другом, нежели компонент кодера 915 EVS или кодер другого формата.

Фиг. 10 является блок-схемой модуля 1000 квантования коэффициентов LPC согласно другому примерному варианту осуществления.

Как показано на фиг. 10, модуль 1000 квантования коэффициентов LPC может включать в себя определитель 1010 пути квантования, первую схему 1030 квантования, и вторую схему 1050 квантования.

Определитель 1010 пути квантования определяет один из первого пути, включающего в себя страховочную схему, и второго пути, включающего в себя схему с предсказанием, в качестве пути квантования текущего кадра, на основе, по меньшей мере, одного из ошибки предсказания и режима кодирования.

Первая схема 1030 квантования выполняет квантование без использования межкадрового предсказания, когда в качестве пути квантования определяется первый путь, и может включать в себя модуль многоэтапного векторного квантования (MSVQ) 1041 и модуль решетчатого векторного квантования (LVQ) 1043. MSVQ 1041 может предпочтительно включать в себя два этапа. MSVQ 1041 генерирует индекс квантования посредством грубого выполнения векторного квантования коэффициентов LSF, из которых значение DC удалено. LVQ 1043 генерирует индекс квантования посредством выполнения квантования посредством приема ошибок квантования LSF между обратными коэффициентами QLSF, выводимыми из MSVQ 1041, и коэффициентами LSF, из которых значение DC удалено. Конечные коэффициенты QLSF генерируются посредством сложения выходного сигнала MSVQ 1041 и выходного сигнала LVQ 1043 и затем добавления значения DC к результату сложения. Первая схема 1030 квантования может осуществлять очень эффективную структуру модуля квантования посредством использования комбинации MSVQ 1041, имеющего превосходную производительность при низкой скорости передачи битов, хотя большой размер памяти является необходимым для кодовой книги, и LVQ 1043, который является эффективным на низкой скорости передачи битов с малым размером памяти и низкой сложностью.

Вторая схема 1050 квантования выполняет квантование с использованием межкадрового предсказания, когда в качестве пути квантования определяется второй путь, и может включать в себя BC-TCQ 1063, который имеет модуль 1065 внутрикадрового предсказания, и модуль 1061 межкадрового предсказания. Модуль 1061 межкадрового предсказания может использовать любой из метода AR и метода MA. Например, применяется метод AR первого порядка. Коэффициент предсказания определяется заранее, и вектор, выбранный в качестве оптимального вектора в предыдущем кадре, используется в качестве последнего вектора для предсказания. Ошибки предсказания LSF, полученные из значений предсказания модуля 1061 межкадрового предсказания, квантуются посредством BC-TCQ 1063, содержащего модуль 1065 внутрикадрового предсказания. Соответственно, может максимизироваться характеристика BC-TCQ 1063, имеющего превосходную производительность квантования с маленьким размером памяти и низкой сложностью при высокой скорости передачи битов.

Как результат, когда используются первая схема 1030 квантования и вторая схема 1050 квантования, может осуществляться оптимальный модуль квантования в соответствии с характеристиками входного речевого сигнала.

Например, когда 41 бит используется в модуле 1000 квантования коэффициентов LPC, чтобы квантовать речевой сигнал в режиме GC с WB 8 кГц, 12 битов и 28 битов могут назначаться MSVQ 1041 и LVQ 1043 первой схемы 1030 квантования, соответственно, за исключением 1 бита, указывающего информацию пути квантования. В дополнение, 40 битов могут назначаться BC-TCQ 1063 второй схемы 1050 квантования за исключением 1 бита, указывающего информацию пути квантования.

Таблица 5 показывает пример, в котором биты назначаются речевому сигналу WB диапазона 8 кГц.

[Таблица 5]

Таблица 5
Режим кодирования Схема квантования LSF/ISF MSVQ-LVQ [биты] BC-TCQ [биты]
GC, WB Страховочная
С предсказанием
40/41- -40/41
TC, WB Страховочная 41 -

Фиг. 11 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления. Модуль 1100 квантования коэффициентов LPC, показанный на фиг. 11, имеет структуру, противоположную структуре, показанной на фиг. 10.

Как показано на фиг. 11, модуль 1100 квантования коэффициентов LPC может включать в себя определитель 1110 пути квантования, первую схему 1130 квантования, и вторую схему 1150 квантования.

Определитель 1110 пути квантования определяет один из первого пути, включающего в себя страховочную схему, и второго пути, включающего в себя схему с предсказанием, в качестве пути квантования текущего кадра, на основе, по меньшей мере, одного из ошибки предсказания и режима предсказания.

Первая схема 1130 квантования выполняет квантование без использования межкадрового предсказания, когда в качестве пути квантования выбирается первый путь, и может включать в себя модуль векторного квантования (VQ) 1141 и BC-TCQ 1143, содержащий модуль 1145 внутрикадрового предсказания. VQ 1141 генерирует индекс квантования посредством грубого выполнения векторного квантования коэффициентов LSF, из которых значение DC удалено. BC-TCQ 1143 генерирует индекс квантования посредством выполнения квантования посредством приема ошибок квантования LSF между обратными коэффициентами QLSF, выводимыми из VQ 1141, и коэффициентами LSF, из которых значение DC удалено. Конечные коэффициенты QLSF генерируются посредством сложения выходного сигнала VQ 1141 и выходного сигнала BC-TCQ 1143 и затем добавления значения DC к результату сложения.

Вторая схема 1150 квантования выполняет квантование с использованием межкадрового предсказания, когда в качестве пути квантования определяется второй путь, и может включать в себя LVQ 1163 и модуль 1161 межкадрового предсказания. Модуль 1161 межкадрового предсказания может осуществляться таким же, как или аналогичным модулю межкадрового предсказания из фиг. 10. Ошибки предсказания LSF, полученные из значений предсказания модуля 1161 межкадрового предсказания, квантуются посредством LVQ 1163.

Соответственно, так как количество битов, назначаемое BC-TCQ 1143, является маленьким, BC-TCQ 1143 имеет низкую сложность, и так как LVQ 1163 имеет низкую сложность при высокой скорости передачи битов, квантование может, в общем, выполняться с низкой сложностью.

Например, когда 41 бит используется в модуле 1100 квантования коэффициентов LPC, чтобы квантовать речевой сигнал в режиме GC с WB 8 кГц, 6 битов и 34 бита могут назначаться VQ 1141 и BC-TCQ 1143 первой схемы 1130 квантования, соответственно, за исключением 1 бита, указывающего информацию пути квантования. В дополнение, 40 битов могут назначаться LVQ 1163 второй схемы 1150 квантования за исключением 1 бита, указывающего информацию пути квантования.

Таблица 6 показывает пример, в котором биты назначаются речевому сигналу WB диапазона 8 кГц.

[Таблица 6]

Таблица 6
Режим кодирования Схема квантования LSF/ISF MSVQ-LVQ [биты] BC-TCQ [биты]
GC, WB Страховочная
С предсказанием
-40/41 40/41-
TC, WB Страховочная - 41

Оптимальный индекс, относящийся к VQ 1141, используемому в большинстве режимов кодирования, может получаться посредством поиска индекса для минимизации Ewerr(p) из Уравнения 13.

(13)

В Уравнении 13, w(i) обозначает взвешивающую функцию, определенную в определителе взвешивающей функции (313 из фиг. 3), r(i) обозначает входной сигнал VQ 1141, и c(i) обозначает выходной сигнал VQ 1141. То есть, получается индекс для минимизации взвешенного искажения между r(i) и c(i).

Показатель искажения d(x, y), используемый в BC-TCQ 1143, может представляться посредством Уравнения 14.

(14)

Согласно одному примерному варианту осуществления, взвешенное искажение может получаться посредством применения взвешивающей функции wk к показателю искажения d(x, y), как представлено посредством Уравнения 15.

(15)

То есть, оптимальный индекс может получаться посредством получения взвешенного искажения во всех этапах BC-TCQ 1143.

Фиг. 12 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления.

Как показано на фиг. 12, модуль 1200 квантования коэффициентов LPC может включать в себя определитель 1210 пути квантования, первую схему 1230 квантования, и вторую схему 1250 квантования.

Определитель 1210 пути квантования определяет один из первого пути, включающего в себя страховочную схему, и второго пути, включающего в себя схему с предсказанием, в качестве пути квантования текущего кадра, на основе, по меньшей мере, одного из ошибки предсказания и режима предсказания.

Первая схема 1230 квантования выполняет квантование без использования межкадрового предсказания, когда в качестве пути квантования определяется первый путь, и может включать в себя VQ или MSVQ 1241 и LVQ или TCQ 1243. VQ или MSVQ 1241 генерирует индекс квантования посредством грубого выполнения векторного квантования коэффициентов LSF, из которых значение DC удалено. LVQ или TCQ 1243 генерирует индекс квантования посредством выполнения квантования посредством приема ошибок квантования LSF между обратными коэффициентами QLSF, выводимыми из VQ 1141, и коэффициентами LSF, из которых значение DC удалено. Конечные коэффициенты QLSF генерируются посредством сложения выходного сигнала VQ или MSVQ 1241 и выходного сигнала LVQ или TCQ 1243 и затем добавления значения DC к результату сложения. Так как VQ или MSVQ 1241 имеет хорошую частоту появления ошибочных битов, хотя VQ или MSVQ 1241 имеет высокую сложность и использует большую величину памяти, количество этапов VQ или MSVQ 1241 может увеличиваться от 1 до n посредством принятия в рассмотрение полной сложности. Например, когда используется только первый этап, VQ или MSVQ 1241 становится VQ, и когда используются два или более этапов, VQ или MSVQ 1241 становится MSVQ. В дополнение, так как LVQ или TCQ 1243 имеет низкую сложность, ошибки квантования LSF могут эффективно квантоваться.

Вторая схема 1250 квантования выполняет квантование с использованием межкадрового предсказания, когда в качестве пути квантования определяется второй путь, и может включать в себя модуль 1261 межкадрового предсказания и LVQ или TCQ 1263. Модуль 1261 межкадрового предсказания может осуществляться таким же, как или аналогичным модулю межкадрового предсказания из фиг. 10. Ошибки предсказания LSF, полученные из значений предсказания модуля 1261 межкадрового предсказания, квантуются посредством LVQ или TCQ 1263. Подобным образом, так как LVQ или TCQ 1243 имеет низкую сложность, ошибки предсказания LSF могут эффективно квантоваться. Соответственно, квантование может, в общем, выполняться с низкой сложностью.

Фиг. 13 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления.

Как показано на фиг. 13, модуль 1300 квантования коэффициентов LPC может включать в себя определитель 1310 пути квантования, первую схему 1330 квантования, и вторую схему 1350 квантования.

Определитель 1310 пути квантования определяет один из первого пути, включающего в себя страховочную схему, и второго пути, включающего в себя схему с предсказанием, в качестве пути квантования текущего кадра, на основе, по меньшей мере, одного из ошибки предсказания и режима предсказания.

Первая схема 1330 квантования выполняет квантование без использования межкадрового предсказания, когда в качестве пути квантования определяется первый путь, и так как первая схема 1330 квантования является такой же, как схема, показанная на фиг. 12, ее описание пропускается.

Вторая схема 1350 квантования выполняет квантование с использованием межкадрового предсказания, когда в качестве пути квантования определяется второй путь, и может включать в себя модуль 1361 межкадрового предсказания, VQ или MSVQ 1363, и LVQ или TCQ 1365. Модуль 1361 межкадрового предсказания может осуществляться таким же, как или аналогичным модулю межкадрового предсказания из фиг. 10. Ошибки предсказания LSF, полученные с использованием значений предсказания модуля 1361 межкадрового предсказания, грубо квантуются посредством VQ или MSVQ 1363. Вектор ошибок между ошибками предсказания LSF и деквантованными ошибками предсказания LSF, выведенными из VQ или MSVQ 1363, квантуется посредством LVQ или TCQ 1365. Подобным образом, так как LVQ или TCQ 1365 имеет низкую сложность, ошибки предсказания LSF могут эффективно квантоваться. Соответственно, квантование может, в общем, выполняться с низкой сложностью.

Фиг. 14 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления. По сравнению с модулем 1200 квантования коэффициентов LPC, показанным на фиг. 12, модуль 1400 квантования коэффициентов LPC имеет отличие в том, что первая схема 1430 квантования включает в себя BC-TCQ 1443, содержащий модуль 1445 внутрикадрового предсказания, вместо LVQ или TCQ 1243, и вторая схема 1450 квантования включает в себя BC-TCQ 1463, содержащий модуль 1465 внутрикадрового предсказания, вместо LVQ или TCQ 1263.

Например, когда 41 бит используется в модуле 1400 квантования коэффициентов LPC, чтобы квантовать речевой сигнал в режиме GC с WB 8 кГц, 5 битов и 35 битов могут назначаться VQ 1441 и BC-TCQ 1443 первой схемы 1430 квантования, соответственно, за исключением 1 бита, указывающего информацию пути квантования. В дополнение, 40 битов могут назначаться BC-TCQ 1463 второй схемы 1450 квантования за исключением 1 бита, указывающего информацию пути квантования.

Фиг. 15 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления. Модуль 1500 квантования коэффициентов LPC, показанный на фиг. 15, является конкретным примером модуля 1300 квантования коэффициентов LPC, показанного на фиг. 13, при этом MSVQ 1541 первой схемы 1530 квантования и MSVQ 1563 второй схемы 1550 квантования имеют два этапа.

Например, когда 41 бит используется в модуле 1500 квантования коэффициентов LPC, чтобы квантовать речевой сигнал в режиме GC с WB 8 кГц, 6+6=12 битов и 28 битов могут назначаться двухэтапному MSVQ 1541 и LVQ 1543 первой схемы 1530 квантования, соответственно, за исключением 1 бита, указывающего информацию пути квантования. В дополнение, 5+5=10 битов и 30 битов могут назначаться двухэтапному MSVQ 1563 и LVQ 1565 второй схемы 1550 квантования, соответственно.

Фиг. 16A и 16B являются блок-схемами модулей квантования коэффициентов LPC согласно другим примерным вариантам осуществления. В частности, модули 1610 и 1630 квантования коэффициентов LPC, показанные на фиг. 16A и 16B, соответственно, могут использоваться, чтобы формировать страховочную схему, т.е. первую схему квантования.

Модуль 1610 квантования коэффициентов LPC, показанный на фиг. 16A, может включать в себя VQ 1621 и TCQ или BC-TCQ 1623, содержащий модуль 1625 внутрикадрового предсказания, и модуль 1630 квантования коэффициентов LPC, показанный на фиг. 16B, может включать в себя VQ или MSVQ 1641 и TCQ или LVQ 1643.

Как показано на фиг. 16A и 16B, VQ 1621 или VQ или MSVQ 1641 грубо квантует весь входной вектор с маленьким количеством битов, и TCQ или BC-TCQ 1623 или TCQ или LVQ 1643 точно квантует ошибки квантования LSF.

Когда для каждого кадра используется только страховочная схема, т.е. первая схема квантования, способ списочного алгоритма Витерби (LVA) может применяться для дополнительного улучшения производительности. То есть, так как имеется пространство в терминах сложности по сравнению со способом переключения, когда используется только первая схема квантования, может применяться способ LVA, достигающий улучшение производительности посредством увеличения сложности в операции поиска. Например, посредством применения способа LVA к BC-TCQ, может устанавливаться таким образом, что сложность структуры LVA является более низкой, чем сложность структуры переключения, даже хотя сложность структуры LVA увеличивается.

Фиг. 17A-17C являются блок-схемами модулей квантования коэффициентов LPC согласно другим примерным вариантам осуществления, которые в частности имеют структуру BC-TCQ, использующего взвешивающую функцию.

Как показано на фиг. 17A, модуль квантования коэффициентов LPC может включать в себя определитель 1710 взвешивающей функции и схему 1720 квантования, включающую в себя BC-TCQ 1721, содержащий модуль 1723 внутрикадрового предсказания.

Как показано на фиг. 17B, модуль квантования коэффициентов LPC может включать в себя определитель 1730 взвешивающей функции и схему 1740 квантования, включающую в себя BC-TCQ 1743, который имеет модуль 1745 внутрикадрового предсказания, и модуль 1741 межкадрового предсказания. Здесь, 40 битов могут назначаться BC-TCQ 1743.

Как показано на фиг. 17C, модуль квантования коэффициентов LPC может включать в себя определитель 1750 взвешивающей функции и схему 1760 квантования, включающую в себя BC-TCQ 1763, который имеет модуль 1765 внутрикадрового предсказания, и VQ 1761. Здесь, 5 битов и 40 битов могут назначаться VQ 1761 и BC-TCQ 1763, соответственно.

Фиг. 18 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления.

Как показано на фиг. 18, модуль 1800 квантования коэффициентов LPC может включать в себя первую схему 1810 квантования, вторую схему 1830 квантования, и определитель 1850 пути квантования.

Первая схема 1810 квантования выполняет квантование без использования межкадрового предсказания и может использовать комбинацию MSVQ 1821 и LVQ 1823 для улучшения производительности квантования. MSVQ 1821 может предпочтительно включать в себя два этапа. MSVQ 1821 генерирует индекс квантования посредством грубого выполнения векторного квантования коэффициентов LSF, из которых значение DC удалено. LVQ 1823 генерирует индекс квантования посредством выполнения квантования посредством приема ошибок квантования LSF между обратными коэффициентами QLSF, выводимыми из MSVQ 1821, и коэффициентами LSF, из которых значение DC удалено. Конечные коэффициенты QLSF генерируются посредством сложения выходного сигнала MSVQ 1821 и выходного сигнала LVQ 1823 и затем добавления значения DC к результату сложения. Первая схема 1810 квантования может осуществлять очень эффективную структуру модуля квантования посредством использования комбинации MSVQ 1821, имеющего превосходную производительность на низкой скорости передачи битов, и LVQ 1823, который является эффективным на низкой скорости передачи битов.

Вторая схема 1830 квантования выполняет квантование с использованием межкадрового предсказания и может включать в себя BC-TCQ 1843, который имеет модуль 1845 внутрикадрового предсказания, и модуль 1841 межкадрового предсказания. Ошибки предсказания LSF, полученные с использованием значений предсказания модуля 1841 межкадрового предсказания, квантуются посредством BC-TCQ 1843, содержащего модуль 1845 внутрикадрового предсказания. Соответственно, может максимизироваться характеристика BC-TCQ 1843, имеющего превосходную производительность квантования при высокой скорости передачи битов.

Определитель 1850 пути квантования определяет один из выходного сигнала первой схемы 1810 квантования и выходного сигнала второй схемы 1830 квантования в качестве конечного выходного сигнала квантования посредством принятия в рассмотрение режима предсказания и взвешенного искажения.

Как результат, когда используются первая схема 1810 квантования и вторая схема 1830 квантования, оптимальный модуль квантования может осуществляться в соответствии с характеристиками входного речевого сигнала. Например, когда 43 бита используются в модуле 1800 квантования коэффициентов LPC, чтобы квантовать речевой сигнал в режиме VC с WB 8 кГц, 12 битов и 30 битов могут назначаться MSVQ 1821 и LVQ 1823 первой схемы 1810 квантования, соответственно, за исключением 1 бита, указывающего информацию пути квантования. В дополнение, 42 бита могут назначаться BC-TCQ 1843 второй схемы 1830 квантования за исключением 1 бита, указывающего информацию пути квантования.

Таблица 7 показывает пример, в котором биты назначаются речевому сигналу WB диапазона 8 кГц.

[Таблица 7]

Таблица 7
Режим кодирования Схема квантования LSF/ISF MSVQ-LVQ [биты] BC-TCQ [биты]
VC, WB Страховочная
С предсказанием
43- -43

Фиг. 19 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления.

Как показано на фиг. 19, модуль 1900 квантования коэффициентов LPC может включать в себя первую схему 1910 квантования, вторую схему 1930 квантования, и определитель 1950 пути квантования.

Первая схема 1910 квантования выполняет квантование без использования межкадрового предсказания и может использовать комбинацию VQ 1921 и BC-TCQ 1923, содержащего модуль 1925 внутрикадрового предсказания для улучшения производительности квантования.

Вторая схема 1930 квантования выполняет квантование с использованием межкадрового предсказания и может включать в себя BC-TCQ 1943, который имеет модуль 1945 внутрикадрового предсказания, и модуль 1941 межкадрового предсказания.

Определитель 1950 пути квантования определяет путь квантования посредством приема режима предсказания и взвешенного искажения с использованием оптимально квантованных значений, полученных посредством первой схемы 1910 квантования и второй схемы 1930 квантования. Например, определяется, равняется ли режим предсказания текущего кадра 0, т.е. имеет ли речевой сигнал текущего кадра нестационарную характеристику. Когда изменение речевого сигнала текущего кадра является большим как в режиме TC или режиме UC, так как межкадровое предсказание является трудоемким, страховочная схема, т.е. первая схема 1910 квантования, всегда определяется в качестве пути квантования.

Если режим предсказания текущего кадра равняется 1, т.е. если речевой сигнал текущего кадра находится в режиме GC или режиме VC, не имеющем нестационарную характеристику, определитель 1950 пути квантования определяет одну из первой схемы 1910 квантования и второй схемы 1930 квантования в качестве пути квантования посредством принятия в рассмотрение ошибок предсказания. Для этого, прежде всего рассматривается взвешенное искажение первой схемы 1910 квантования, так что модуль 1900 квантования коэффициентов LPC является устойчивым к ошибкам кадров. То есть, если значение взвешенного искажения первой схемы 1910 квантования меньше, чем предварительно определенный порог, выбирается первая схема 1910 квантования независимо от значения взвешенного искажения второй схемы 1930 квантования. В дополнение, вместо простого выбора схемы квантования, имеющей меньшее значение взвешенного искажения, первая схема 1910 квантования выбирается посредством принятия в рассмотрение ошибок кадров в случае одного и того же значения взвешенного искажения. Если значение взвешенного искажения первой схемы 1910 квантования в определенное количество раз больше, чем значение взвешенного искажения второй схемы 1930 квантования, может выбираться вторая схема 1930 квантования. Определенное количество раз может быть, например, установлено на 1.15. Как таковой, когда определяется путь квантования, передается индекс квантования, сгенерированный посредством схемы квантования определенного пути квантования.

Считая, что количество режимов предсказания равняется 3, можно осуществить, чтобы выбирать первую схему 1910 квантования, когда режим предсказания равняется 0, выбирать вторую схему 1930 квантования, когда режим предсказания равняется 1, и выбирать одну из первой схемы 1910 квантования и второй схемы 1930 квантования, когда режим предсказания равняется 2, в качестве пути квантования.

Например, когда 37 битов используются в модуле 1900 квантования коэффициентов LPC, чтобы квантовать речевой сигнал в режиме GC с WB 8 кГц, 2 бита и 34 бита могут назначаться VQ 1921 и BC-TCQ 1923 первой схемы 1910 квантования, соответственно, за исключением 1 бита, указывающего информацию пути квантования. В дополнение, 36 битов могут назначаться BC-TCQ 1943 второй схемы 1930 квантования за исключением 1 бита, указывающего информацию пути квантования.

Таблица 8 показывает пример, в котором биты назначаются речевому сигналу WB диапазона 8 кГц.

[Таблица 8]

Таблица 8
Режим кодирования Схема квантования LSF/ISF Количество используемых битов
VC, WB Страховочная
С предсказанием
4343
GC, WB Страховочная
С предсказанием
3737
TC, WB Страховочная 44

Фиг. 20 является блок-схемой модуля квантования коэффициентов LPC согласно другому примерному варианту осуществления.

Как показано на фиг. 20, модуль 2000 квантования коэффициентов LPC может включать в себя первую схему 2010 квантования, вторую схему 2030 квантования, и определитель 2050 пути квантования.

Первая схема 2010 квантования выполняет квантование без использования межкадрового предсказания и может использовать комбинацию VQ 2021 и BC-TCQ 2023, содержащего модуль 2025 внутрикадрового предсказания, для улучшения производительности квантования.

Вторая схема 2030 квантования выполняет квантование с использованием межкадрового предсказания и может включать в себя LVQ 2043 и модуль 2041 межкадрового предсказания.

Определитель 2050 пути квантования определяет путь квантования посредством приема режима предсказания и взвешенного искажения с использованием оптимально квантованных значений, полученных посредством первой схемы 2010 квантования и второй схемы 2030 квантования.

Например, когда 43 бита используются в модуле 2000 квантования коэффициентов LPC, чтобы квантовать речевой сигнал в режиме VC с WB 8 кГц, 6 битов и 36 битов могут назначаться VQ 2021 и BC-TCQ 2023 первой схемы 2010 квантования, соответственно, за исключением 1 бита, указывающего информацию пути квантования. В дополнение, 42 бита могут назначаться LVQ 2043 второй схемы 2030 квантования за исключением 1 бита, указывающего информацию пути квантования.

Таблица 9 показывает пример, в котором биты назначаются речевому сигналу WB диапазона 8 кГц.

[Таблица 9]

Таблица 9
Режим кодирования Схема квантования LSF/ISF MSVQ-LVQ [биты] BC-TCQ [биты]
VC, WB Страховочная
С предсказанием
-43 43-

Фиг. 21 является блок-схемой модуля выбора типа модуля квантования согласно одному примерному варианту осуществления. Модуль 2100 выбора типа модуля квантования, показанный на фиг. 21, может включать в себя определитель 2110 скорости передачи битов, определитель 2130 ширины полосы, определитель 2150 частоты внутренней дискретизации, и определитель 2107 типа модуля квантования. Каждый из компонентов может осуществляться посредством, по меньшей мере, одного процессора (например, центрального блока обработки (CPU)) посредством объединения в, по меньшей мере, одном модуле. Модуль 2100 выбора типа модуля квантования может использоваться в режиме предсказания 2, в котором переключаются две схемы квантования. Модуль 2100 выбора типа модуля квантования может содержаться как компонент модуля 117 квантования коэффициентов LPC устройства 100 кодирования звука из фиг. 1 или компонент устройства 100 кодирования звука из фиг. 1.

Как показано на фиг. 21, определитель 2110 скорости передачи битов определяет скорость передачи битов кодирования речевого сигнала. Скорость передачи битов кодирования может определяться для всех кадров или в блоке кадра. Тип модуля квантования может изменяться в зависимости от скорости передачи битов кодирования.

Определитель 2130 ширины полосы определяет ширину полосы речевого сигнала. Тип модуля квантования может изменяться в зависимости от ширины полосы речевого сигнала.

Определитель 2150 частоты внутренней дискретизации определяет частоту внутренней дискретизации на основе верхнего предела ширины полосы, используемой в модуле квантования. Когда ширина полосы речевого сигнала равняется или является более широкой, чем WB, т.е. WB, SWB, или FB, частота внутренней дискретизации изменяется согласно тому, равняется ли верхний предел ширины полосы кодирования 6,4 кГц или 8 кГц. Если верхний предел ширины полосы кодирования равняется 6,4 кГц, частота внутренней дискретизации равняется 12,8 кГц, и если верхний предел ширины полосы кодирования равняется 8 кГц, частота внутренней дискретизации равняется 16 кГц. Верхний предел ширины полосы кодирования не ограничен этим.

Определитель 2107 типа модуля квантования выбирает один из открытого контура и замкнутого контура в качестве типа модуля квантования посредством приема выходного сигнала определителя 2110 скорости передачи битов, выходного сигнала определителя 2130 ширины полосы, и выходного сигнала определителя 2150 частоты внутренней дискретизации. Определитель 2107 типа модуля квантования может выбирать открытый контур в качестве типа модуля квантования, когда скорость передачи битов кодирования больше, чем предварительно определенное эталонное значение, ширина полосы речевого сигнала равняется или является более широкой, чем WB, и частота внутренней дискретизации равняется 16 кГц. В противном случае, в качестве типа модуля квантования может выбираться замкнутый контур.

Фиг. 22 является блок-схемой последовательности операций, иллюстрирующей способ выбора типа модуля квантования, согласно одному примерному варианту осуществления.

Как показано на фиг. 22, в операции 2201, определяется, является ли скорость передачи битов более большой, чем эталонное значение. Эталонное значение устанавливается на 16,4 Кбит/с на фиг. 22, но не ограничено этим. Как результат определения в операции 2201, если скорость передачи битов равняется или меньше, чем эталонное значение, в операции 2209 выбирается тип замкнутого контура.

Как результат определения в операции 2201, если скорость передачи битов больше, чем эталонное значение, в операции 2203 определяется, является ли ширина полосы входного сигнала более широкой, чем NB. Как результат определения в операции 2203, если ширина полосы входного сигнала является NB, в операции 2209 выбирается тип замкнутого контура.

Как результат определения в операции 2203, если ширина полосы входного сигнала является более широкой, чем NB, т.е. если ширина полосы входного сигнала является WB, SWB, или FB, в операции 2205 определяется, является ли частота внутренней дискретизации определенной частотой. Например, на фиг. 22 определенная частота устанавливается на 16 кГц. Как результат определения в операции 2205, если частота внутренней дискретизации не является определенной эталонной частотой, в операции 2209 выбирается тип замкнутого контура.

Как результат определения в операции 2205, если частота внутренней дискретизации равняется 16 кГц, в операции 2207 выбирается тип открытого контура.

Фиг. 23 является блок-схемой устройства декодирования звука согласно одному примерному варианту осуществления.

Как показано на фиг. 23, устройство 2300 декодирования звука может включать в себя декодер 2311 параметров, модуль 2313 деквантования коэффициентов LPC, декодер 2315 переменного режима, и постпроцессор 2319. Устройство 2300 декодирования звука может дополнительно включать в себя модуль 2317 восстановления ошибок. Каждый из компонентов устройства 2300 декодирования звука может осуществляться посредством, по меньшей мере, одного процессора (например, центрального блока обработки (CPU)) посредством объединения в, по меньшей мере, одном модуле.

Декодер 2311 параметров может декодировать параметры, подлежащие использованию для декодирования из битового потока. Когда режим кодирования включен в битовый поток, декодер 2311 параметров может декодировать режим кодирования и параметры, соответствующие режиму кодирования. Деквантование коэффициентов LPC и декодирование возбуждения могут выполняться в соответствии с декодированным режимом кодирования.

Модуль 2313 деквантования коэффициентов LPC может генерировать декодированные коэффициенты LSF посредством деквантования квантованных коэффициентов ISF или LSF, квантованных ошибок квантования ISF или LSF или квантованных ошибок предсказания ISF или LSF, включенных в параметры LPC, и генерирует коэффициенты LPC посредством преобразования декодированных коэффициентов LSF.

Декодер 2315 переменного режима может генерировать синтезированный сигнал посредством декодирования коэффициентов LPC, сгенерированных посредством модуля 2313 деквантования коэффициентов LPC. Декодер 2315 переменного режима может выполнять декодирование в соответствии с режимами кодирования, как показано на фиг. 2A-2D, согласно устройствам кодирования, соответствующим устройствам декодирования.

Модуль 2317 восстановления ошибок, если содержится, может восстанавливать или скрывать текущий кадр речевого сигнала, когда ошибки возникают в текущем кадре как результат декодирования декодера 2315 переменного режима.

Постпроцессор (например, центральный блок обработки (CPU)) 2319 может генерировать конечный синтезированный сигнал, т.е. восстановленный звук, посредством выполнения различных типов фильтрации и обработки улучшения качества речи синтезированного сигнала, сгенерированного посредством декодера 2315 переменного режима.

Фиг. 24 является блок-схемой модуля деквантования коэффициентов LPC согласно одному примерному варианту осуществления.

Как показано на фиг. 24, модуль 2400 деквантования коэффициентов LPC может включать в себя модуль 2411 деквантования ISF/LSF и преобразователь 2413 коэффициентов.

Модуль 2411 деквантования ISF/LSF может генерировать декодированные коэффициенты ISF или LSF посредством деквантования квантованных коэффициентов ISF или LSF, квантованных ошибок квантования ISF или LSF, или квантованных ошибок предсказания ISF или LSF, включенных в параметры LPC, в соответствии с информацией пути квантования, включенной в битовый поток.

Преобразователь 2413 коэффициентов может преобразовывать декодированные коэффициенты ISF или LSF, полученные как результат деквантования посредством модуля 2411 деквантования ISF/LSF, в пары спектрального иммитанса (ISP) или пары спектральных линий (LSP) и выполняет интерполяцию для каждого подкадра. Интерполяция может выполняться посредством использования пар ISP/LSP предыдущего кадра и пар ISP/LSP текущего кадра. Преобразователь 2413 коэффициентов может преобразовывать деквантованные и интерполированные пары ISP/LSP каждого подкадра в коэффициенты LSP.

Фиг. 25 является блок-схемой модуля деквантования коэффициентов LPC согласно другому примерному варианту осуществления.

Как показано на фиг. 25, модуль 2500 деквантования коэффициентов LPC может включать в себя определитель 2511 пути деквантования, первую схему 2513 деквантования, и вторую схему 2515 деквантования.

Определитель 2511 пути деквантования может обеспечивать параметры LPC в одну из первой схемы 2513 деквантования и второй схемы 2515 деквантования на основе информации пути квантования, включенной в битовый поток. Например, информация пути квантования может представляться посредством 1 бита.

Первая схема 2513 деквантования может включать в себя элемент для грубого деквантования параметров LPC и элемент для точного деквантования параметров LPC.

Вторая схема 2515 деквантования может включать в себя элемент для выполнения ограниченного по блокам деквантования с решетчатым кодированием и элемент межкадрового предсказания по отношению к параметрам LPC.

Первая схема 2513 деквантования и вторая схема 2515 деквантования не ограничены текущим примерным вариантом осуществления и могут осуществляться посредством использования обратных обработок первой и второй схем квантования описанных выше примерных вариантов осуществления согласно устройствам кодирования, соответствующим устройствам декодирования.

Конфигурация модуля 2500 деквантования коэффициентов LPC может применяться независимо от того, является ли способ квантования типом открытого контура или типом замкнутого контура.

Фиг. 26 является блок-схемой первой схемы 2513 деквантования и второй схемы 2515 деквантования в модуле 2500 деквантования коэффициентов LPC из фиг. 25, согласно одному примерному варианту осуществления.

Как показано на фиг. 26, первая схема 2610 деквантования может включать в себя модуль многоэтапного векторного квантования (MSVQ) 2611 для деквантования квантованных коэффициентов LSF, включенных в параметры LPC, посредством использования первого индекса кодовой книги, сгенерированного посредством MSVQ (не показан) кодирующего конца (не показан), и модуль решетчатого векторного квантования (LVQ) 2613 для деквантования ошибок квантования LSF, включенных в параметры LPC, посредством использования второго индекса кодовой книги, сгенерированного посредством LVQ (не показан) кодирующего конца. Конечные декодированные коэффициенты LSF генерируются посредством сложения деквантованных коэффициентов LSF, полученных посредством MSVQ 2611, и деквантованных ошибок квантования LSF, полученных посредством LVQ 2613, и затем добавления среднего значения, которое является предварительно определенным значением DC, к результату сложения.

Вторая схема 2630 деквантования может включать в себя модуль ограниченного по блокам квантования с решетчатым кодированием (BC-TCQ) 2631 для деквантования ошибок предсказания LSF, включенных в параметры LPC, посредством использования третьего индекса кодовой книги, сгенерированного посредством BC-TCQ (не показан) кодирующего конца, модуль 2633 внутрикадрового предсказания, и модуль 2635 межкадрового предсказания. Обработка деквантования начинается с самого нижнего вектора из числа векторов LSF, и модуль 2633 внутрикадрового предсказания генерирует значение предсказания для последующего элемента вектора посредством использования декодированного вектора. Модуль 2635 межкадрового предсказания генерирует значения предсказания посредством межкадрового предсказания посредством использования коэффициентов LSF, декодированных в предыдущем кадре. Конечные декодированные коэффициенты LSF генерируются посредством сложения коэффициентов LSF, полученных посредством BC-TCQ 2631 и модуля 2633 внутрикадрового предсказания, и значений предсказания, сгенерированных посредством модуля 2635 межкадрового предсказания, и затем добавления среднего значения, которое является предварительно определенным значением DC, к результату сложения.

Первая схема 2610 деквантования и вторая схема 2630 деквантования не ограничены текущим примерным вариантом осуществления и могут осуществляться посредством использования обратных обработок первой и второй схем квантования вышеописанных примерных вариантов осуществления согласно устройствам кодирования, соответствующим устройствам декодирования.

Фиг. 27 является блок-схемой последовательности операций, иллюстрирующей способ квантования согласно одному примерному варианту осуществления.

Как показано на фиг. 27, в операции 2710, путь квантования принятого звука определяется на основе предварительно определенного критерия до квантования принятого звука. В примерном варианте осуществления, может определяться один из первого пути, не использующего межкадровое предсказание, и второго пути, использующего межкадровое предсказание.

В операции 2730, проверяется путь квантования, определенный из числа первого пути и второго пути.

Если первый путь определяется в качестве пути квантования как результат проверки в операции 2730, принятый звук квантуется с использованием первой схемы квантования в операции 2750.

С другой стороны, если второй путь определяется в качестве пути квантования как результат проверки в операции 2730, принятый звук квантуется с использованием второй схемы квантования в операции 2770.

Обработка определения пути квантования в операции 2710 может выполняться посредством различных примерных вариантов осуществления, описанных выше. Обработки квантования в операциях 2750 и 2770 могут выполняться посредством использования различных примерных вариантов осуществления, описанных выше, и первой и второй схем квантования, соответственно.

Хотя в текущем примерном варианте осуществления первый и второй пути устанавливаются как пути квантования, которые могут выбираться, множество путей, включающее в себя первый и второй пути, может устанавливаться, и блок-схема последовательности операций из фиг. 27 может изменяться в соответствии с множеством установленных путей.

Фиг. 28 является блок-схемой последовательности операций, иллюстрирующей способ деквантования согласно одному примерному варианту осуществления.

Как показано на фиг. 28, в операции 2810, декодируются параметры LPC, включенные в битовый поток.

В операции 2830, путь квантования, включенный в битовый поток, проверяется, и в операции 2850 определяется, является ли проверенный путь квантования первым путем или вторым путем.

Если путь квантования является первым путем как результат определения в операции 2850, декодированные параметры LPC деквантуются посредством использования первой схемы деквантования в операции 2870.

Если путь квантования является вторым путем как результат определения в операции 2850, декодированные параметры LPC деквантуются посредством использования второй схемы деквантования в операции 2890.

Обработки деквантования в операциях 2870 и 2890 могут выполняться посредством использования обратных обработок первой и второй схем квантования различных примерных вариантов осуществления, описанных выше, соответственно, согласно устройствам кодирования, соответствующим устройствам декодирования.

Хотя первый и второй пути устанавливаются как проверенные пути квантования в текущем примерном варианте осуществления, множество путей, включающее в себя первый и второй пути, может устанавливаться, и блок-схема последовательности операций из фиг. 28 может изменяться в соответствии с множеством установленных путей.

Способы из фиг. 27 и 28 могут программироваться и могут выполняться посредством, по меньшей мере, одного блока обработки. В дополнение, примерные варианты осуществления могут выполняться в блоке кадра или блоке подкадра.

Фиг. 29 является блок-схемой электронного устройства, включающего в себя модуль кодирования, согласно одному примерному варианту осуществления.

Как показано на фиг. 29, электронное устройство 2900 может включать в себя блок 2910 связи и модуль 2930 кодирования. В дополнение, электронное устройство 2900 может дополнительно включать в себя блок 2950 хранения для хранения звукового битового потока, полученного как результат кодирования согласно использованию звукового битового потока. В дополнение, электронное устройство 2900 может дополнительно включать в себя микрофон 2970. То есть, блок 2950 хранения и микрофон 2970 могут необязательно включаться сюда. Электронное устройство 2900 может дополнительно включать в себя произвольный модуль декодирования (не показан), например, модуль декодирования для выполнения общей функции декодирования или модуль декодирования согласно одному примерному варианту осуществления. Модуль 2930 кодирования может осуществляться посредством, по меньшей мере, одного процессора (например, центрального блока обработки (CPU)) (не показан) посредством объединения с другими компонентами (не показаны), включенными в электронное устройство 2900 как один корпус.

Блок 2910 связи может принимать, по меньшей мере, одно из звука или закодированного битового потока, обеспеченного из вне, или передавать, по меньшей мере, одно из декодированного звука или звукового битового потока, полученного как результат кодирования посредством модуля 2930 кодирования.

Блок 2910 связи сконфигурирован с возможностью передавать и принимать данные в и от внешнего электронного устройства посредством беспроводной сети, такой как беспроводная сеть Интернет, беспроводная внутренняя сеть, беспроводная телефонная сеть, беспроводная локальная сеть (WLAN), Wi-Fi, прямой Wi-Fi (WFD), третье поколение (3G), четвертое поколение (4G), Bluetooth, стандарт ассоциации инфракрасной передачи данных (IrDA), радиочастотная идентификация (RFID), ультра широкополосная связь (UWB), Zigbee, или связь ближнего поля (NFC), или посредством проводной сети, такой как проводная телефонная сеть или проводная сеть Интернет.

Модуль 2930 кодирования может генерировать битовый поток посредством выбора одного из множества путей, включающего в себя первый путь, не использующий межкадровое предсказание, и второй путь, использующий межкадровое предсказание, в качестве пути квантования звука, обеспеченного посредством блока 2910 связи или микрофона 2970, на основе предварительно определенного критерия до квантования звука, квантования звука посредством использования одной из первой схемы квантования и второй схемы квантования согласно выбранному пути квантования, и кодирования квантованного звука.

Первая схема квантования может включать в себя первый модуль квантования (не показан) для грубого квантования звука и второй модуль квантования (не показан) для точного квантования сигнала ошибки квантования между звуком и выходным сигналом первого модуля квантования. Первая схема квантования может включать в себя MSVQ (не показан) для квантования звука и LVQ (не показан) для квантования сигнала ошибки квантования между звуком и выходным сигналом MSVQ. В дополнение, первая схема квантования может осуществляться посредством одного из различных примерных вариантов осуществления, описанных выше.

Вторая схема квантования может включать в себя модуль межкадрового предсказания (не показан) для выполнения межкадрового предсказания звука, модуль внутрикадрового предсказания (не показан) для выполнения внутрикадрового предсказания ошибок предсказания, и BC-TCQ (не показан) для квантования ошибок предсказания. Подобным образом, вторая схема квантования может осуществляться посредством одного из различных примерных вариантов осуществления, описанных выше.

Блок 2950 хранения может хранить закодированный битовый поток, сгенерированный посредством модуля 2930 кодирования. Блок 2950 хранения может хранить различные программы, необходимые, чтобы управлять электронным устройством 2900.

Микрофон 2970 может обеспечивать звук пользователя вне модуля 2930 кодирования.

Фиг. 30 является блок-схемой электронного устройства, включающего в себя модуль декодирования, согласно одному примерному варианту осуществления.

Как показано на фиг. 30, электронное устройство 3000 может включать в себя блок 3010 связи и модуль 3030 декодирования. В дополнение, электронное устройство 3000 может дополнительно включать в себя блок 3050 хранения для хранения восстановленного звука, полученного как результат декодирования согласно использованию восстановленного звука. В дополнение, электронное устройство 3000 может дополнительно включать в себя громкоговоритель 3070. То есть, блок 3050 хранения и громкоговоритель 3070 могут необязательно включаться сюда. Электронное устройство 3000 может дополнительно включать в себя произвольный модуль кодирования (не показан), например, модуль кодирования для выполнения общей функции кодирования или модуль кодирования согласно одному примерному варианту осуществления настоящего изобретения. Модуль 3030 декодирования может осуществляться посредством, по меньшей мере, одного процессора (например, центрального блока обработки (CPU)) (не показан) посредством объединения с другими компонентами (не показаны), включенными в электронное устройство 3000 как один корпус.

Блок 3010 связи может принимать, по меньшей мере, одно из звука или закодированного битового потока, обеспеченного из вне, или передавать, по меньшей мере, одно из восстановленного звука, полученного как результат декодирования модуля 3030 декодирования, или звукового битового потока, полученного как результат кодирования. Блок 3010 связи может, по существу, осуществляться как блок 2910 связи из фиг. 29.

Модуль 3030 декодирования может генерировать восстановленный звук посредством декодирования параметров LPC, включенных в битовый поток, обеспеченный посредством блока 3010 связи, деквантования декодированных параметров LPC посредством использования одной из первой схемы деквантования, не использующей межкадровое предсказание, и второй схемы деквантования, использующей межкадровое предсказание, на основе информация пути, включенной в битовый поток, и декодирования деквантованных параметров LPC в декодированном режиме кодирования. Когда режим кодирования включен в битовый поток, модуль 3030 декодирования может декодировать деквантованные параметры LPC в декодированном режиме кодирования.

Первая схема деквантования может включать в себя первый модуль деквантования (не показан) для грубого деквантования параметров LPC и второй модуль деквантования (не показан) для точного деквантования параметров LPC. Первая схема деквантования может включать в себя MSVQ (не показан) для деквантования параметров LPC посредством использования первого индекса кодовой книги и LVQ (не показан) для деквантования параметров LPC посредством использования второго индекса кодовой книги. В дополнение, так как первая схема деквантования выполняет обратную операцию первой схемы квантования, описанной на фиг. 29, первая схема деквантования может осуществляться посредством одной из обратных обработок различных примерных вариантов осуществления, описанных выше, соответствующих первой схеме квантования согласно устройствам кодирования, соответствующим устройствам декодирования.

Вторая схема деквантования может включать в себя BC-TCQ (не показан) для деквантования параметров LPC посредством использования третьего индекса кодовой книги, модуль внутрикадрового предсказания (не показан), и модуль межкадрового предсказания (не показан). Подобным образом, так как вторая схема деквантования выполняет обратную операцию второй схемы квантования, описанной на фиг. 29, вторая схема деквантования может осуществляться посредством одной из обратных обработок различных примерных вариантов осуществления, описанных выше, соответствующих второй схеме квантования, согласно устройствам кодирования, соответствующим устройствам декодирования.

Блок 3050 хранения может хранить восстановленный звук, сгенерированный посредством модуля 3030 декодирования. Блок 3050 хранения может хранить различные программы для управления электронным устройством 3000.

Громкоговоритель 3070 может выводить восстановленный звук, сгенерированный посредством модуля 3030 декодирования, во вне.

Фиг. 31 является блок-схемой электронного устройства, включающего в себя модуль кодирования и модуль декодирования, согласно одному примерному варианту осуществления.

Электронное устройство 3100, показанное на фиг. 31, может включать в себя блок 3110 связи, модуль 3120 кодирования, и модуль 3130 декодирования. В дополнение, электронное устройство 3100 может дополнительно включать в себя блок 3140 хранения для хранения звукового битового потока, полученного как результат кодирования, или восстановленного звука, полученного как результат декодирования, согласно использованию звукового битового потока или восстановленного звука. В дополнение, электронное устройство 3100 может дополнительно включать в себя микрофон 3150 и/или громкоговоритель 3160. Модуль 3120 кодирования и модуль 3130 декодирования могут осуществляться посредством, по меньшей мере, одного процессора (например, центрального блока обработки (CPU)) (не показан) посредством объединения с другими компонентами (не показаны), включенными в электронное устройство 3100 как один корпус.

Так как компоненты электронного устройства 3100, показанного на фиг. 31, соответствуют компонентам электронного устройства 2900, показанного на фиг. 29, или компонентам электронного устройства 3000, показанного на фиг. 30, их подробное описание пропускаются.

Каждое из электронных устройств 2900, 3000, и 3100, показанных на фиг. 29, 30, и 31, может включать в себя терминал только речевой связи, такой как телефон или мобильный телефон, устройство только широковещания или музыки, такое как TV или проигрыватель MP3, или гибридное терминальное устройство терминала только речевой связи и устройства только широковещания или музыки, но не ограничены этим. В дополнение, каждое из электронных устройств 2900, 3000, и 3100 может использоваться в качестве клиента, сервера, или преобразователя, размещенного между клиентом и сервером.

Когда электронное устройство 2900, 3000, или 3100 является, например, мобильным телефоном, хотя не показано, электронное устройство 2900, 3000, или 3100 может дополнительно включать в себя блок пользовательского ввода, такой как клавиатура, блок отображения для отображения информации, обработанной посредством пользовательского интерфейса или мобильного телефона, и процессор (например, центральный блок обработки (CPU)) для управления функциями мобильного телефона. В дополнение, мобильный телефон может дополнительно включать в себя блок камеры, имеющий функцию захвата изображения, и, по меньшей мере, один компонент для выполнения функции для мобильного телефона.

Когда электронное устройство 2900, 3000, или 3100 является, например, TV, хотя не показано, электронное устройство 2900, 3000, или 3100 может дополнительно включать в себя блок пользовательского ввода, такой как клавиатура, блок отображения для отображения принимаемой широковещательной информации, и процессор (например, центральный блок обработки (CPU)) для управления всеми функциями TV. В дополнение, TV может дополнительно включать в себя, по меньшей мере, один компонент для выполнения функции TV.

Относящееся к BC-TCQ содержимое, воплощенное в связи с квантованием/деквантованием коэффициентов LPC, раскрывается подробно в патенте США № 7,630,890 (Block-constrained TCQ method, and method and apparatus for quantizing LSF parameter employing the same in speech coding system). Содержимое, связанное со способом LVA, раскрывается подробно в патентной заявке США № 20070233473 (Multi-path trellis coded quantization method and Multi-path trellis coded quantizer using the same). Содержимое патента США № 7,630,890 и патентной заявки США № 20070233473 включаются в настоящий документ по ссылке.

Способ квантования, способ деквантования, способ кодирования, и способ декодирования согласно примерным вариантам осуществления могут быть записаны как компьютерные программы и могут осуществляться в цифровых компьютерах общего назначения, которые исполняют программы с использованием компьютерно-читаемого записывающего носителя. В дополнение, структура данных, программная команда, или файл данных, доступные в примерных вариантах осуществления, могут быть записаны в компьютерно-читаемом записывающем носителе различными способами. Компьютерно-читаемый записывающий носитель является любым устройством хранения данных, которое может хранить данные, которые могут впоследствии считываться посредством компьютерной системы. Примеры компьютерно-читаемого записывающего носителя включают в себя магнитные носители записи, такие как жесткие диски, гибкие диски, и магнитные ленты, оптические носители записи, такие как CD-ROM и DVD, магнитооптические носители записи, такие как флоптические диски, и аппаратные устройства, такие как ROM, RAM, и флэш-памяти, в частности, сконфигурированные с возможностью хранить и исполнять программную команду. Компьютерно-читаемый записывающий носитель также может быть средой передачи для передачи сигнала, в котором назначены программная команда и структура данных. Примеры программной команды могут включать в себя коды машинного языка, созданные посредством компилятора, и коды высокоуровневого языка, исполнимые посредством компьютера с помощью интерпретатора.

Хотя представленная новая концепция была конкретно показана и описана со ссылкой на ее примерные варианты осуществления, специалистам в данной области техники следует понимать, что различные изменения в форме и деталях могут делаться в них без отступления от сущности и объема представленной новой концепции, которая определена посредством последующей формулы изобретения.

1. Устройство квантования речевого или аудио сигнала, содержащее:

модуль выбора, выполненный с возможностью выбора на основе ошибки предсказания одного из первого блока квантования и второго блока квантования методом открытого контура; причем

первый блок квантования выполнен с возможностью квантования входного сигнала, включающего в себя по меньшей мере один из речевого сигнала или аудио сигнала, без межкадрового предсказания; и

второй блок квантования выполнен с возможностью квантования входного сигнала с межкадровым предсказанием.

2. Устройство квантования по п. 1, причем первый блок квантования содержит модуль квантования с решетчатой структурой с ограничением по блокам и модуль внутрикадрового предсказания.

3. Устройство квантования по п. 1, причем второй блок квантования содержит модуль квантования с решетчатой структурой с ограничением по блокам, модуль внутрикадрового предсказания и модуль межкадрового предсказания.

4. Устройство квантования по п. 1, причем первый блок квантования содержит первый модуль квантования с решетчатой структурой с ограничением по блокам и модуль внутрикадрового предсказания, и второй блок квантования содержит второй модуль квантования с решетчатой структурой с ограничением по блокам, модуль внутрикадрового предсказания и модуль межкадрового предсказания.

5. Устройство квантования по п. 2, причем модуль квантования с решетчатой структурой с ограничением по блокам выполнен с возможностью поиска индекса на основе взвешивающей функции.

6. Устройство квантования по п. 3, причем модуль квантования с решетчатой структурой с ограничением по блокам выполнен с возможностью поиска индекса на основе взвешивающей функции.

7. Устройство квантования по п. 4, причем первый и второй модули квантования с решетчатой структурой с ограничением по блокам выполнены с возможностью поиска индекса на основе взвешивающей функции.

8. Устройство квантования по п. 1, причем ошибка предсказания основана на взвешивающей функции.

9. Устройство квантования по п. 1, причем ошибка предсказания основана на по меньшей мере одном из коэффициентов частот спектральных линий (LSF) текущего кадра, коэффициентов LSF предыдущего кадра, коэффициентов авторегрессивного предсказания и взвешивающей функции, относящихся к характеристикам сигнала.

10. Устройство квантования по п. 1, причем ошибка предсказания основана на взвешивающей функции, причем взвешивающая функция определяется на основе по меньшей мере одного из ширины полосы, режима кодирования и информации анализа спектра входного сигнала.

11. Устройство квантования по п. 1, причем режим кодирования входного сигнала представляет собой режим общего кодирования.

12. Устройство квантования по п. 1, причем режим кодирования входного сигнала представляет собой режим вокализированного кодирования.

13. Устройство квантования по п. 1, причем ошибка (Ер) предсказания получается из уравнения:

где М обозначает размерность коэффициентов частот спектральных линий (LSF), zk(i) обозначает ith коэффициент LSR kth кадра, zk-1(i) обозначает ith коэффициент LSR (k-1)th кадра, ρ(i) обозначает ith коэффициент авторегрессивного предсказания, и wend(i) обозначает ith вес.

14. Устройство квантования по п. 1, причем модуль выбора выполнен с возможностью сравнения ошибки предсказания с порогом, выбора первого блока квантования, если ошибка предсказания больше, чем порог, и выбора второго блока квантования, если ошибка предсказания меньше или равна порогу.

15. Устройство квантования по п. 14, причем порог представляет собой фиксированное значение.

16. Устройство квантования по п. 14, причем порог представляет собой переменное значение.

17. Устройство квантования по п. 1, причем модуль выбора выполнен с возможностью выбора первого блока квантования, если входной сигнал является нестационарным.

18. Устройство квантования по п. 1, причем первый блок квантования содержит модуль квантования с решетчатой структурой с ограничением по блокам, модуль внутрикадрового предсказания и модуль векторного квантования.

19. Устройство квантования по п. 1, причем второй блок квантования содержит модуль квантования с решетчатой структурой с ограничением по блокам, модуль внутрикадрового предсказания, модуль межкадрового предсказания и модуль векторного квантования.

20. Устройство квантования по п. 1, причем первый блок квантования содержит первый модуль квантования с решетчатой структурой с ограничением по блокам, модуль внутрикадрового предсказания и первый модуль векторного квантования, и второй блок квантования содержит второй модуль квантования с решетчатой структурой с ограничением по блокам, модуль внутрикадрового предсказания, модуль межкадрового предсказания и второй модуль векторного квантования.



 

Похожие патенты:

Группа изобретений относится к технологиям кодирования/декодирования аудио информации. Техническим результатом является повышение эффективности кодирования/декодирования аудио информации.

Изобретение относится к средствам возбуждения смешанной кодовой книги для кодирования речи. Технический результат заключается в повышении воспринимаемого качества речевого сигнала по сравнению с системами кодирования, использующими только импульсное возбуждение или только шумовое возбуждение.

Изобретение относится к аудиосистемам и предназначено для генерирования сигнала вывода аудио. Технический результат - повышение точности воспроизведения аудиосигнала.

Изобретение относится к области многоканального звукового кодирования. Техническим результатом является повышение качества кодированного и декодированного звукового сигнала.

Изобретение относится к обработке метаданных и предназначено для перекодировки метаданных с пониженной вычислительной сложностью. Технический результат - повышение точности перекодировки метаданных.

Группа изобретений относится к многокаскадным фильтрам и может быть использована для фильтрации данных с использованием таких фильтров. Техническим результатом является обеспечение параллельной обработки данных.

Изобретение относится к кодированию цифрового звука, а именно к средствам кодирования звуковых сигналов, содержащих составляющие разного характера. Технический результат заключается в повышении точности воспроизведения звука.

Изобретение относится к аудио кодированию. Технический результат заключается в повышении эффективности кодирования при незначительных вычислительных затратах.

Изобретение относится к вычислительной технике. Технический результат заключается в повышении эффективности кодирования последовательных фрагментов аудиоконтента.

Изобретение относится к средствам для получения пространственных параметров на основе акустического входного сигнала. Технический результат заключается в обеспечении возможности получения пространственных параметров для входного аудиосигнала с минимизированными расхождениями с моделью, связанными с изменениями во времени или временной нестабильностью входного аудиосигнала.

Изобретение относится к средствам возбуждения смешанной кодовой книги для кодирования речи. Технический результат заключается в повышении воспринимаемого качества речевого сигнала по сравнению с системами кодирования, использующими только импульсное возбуждение или только шумовое возбуждение.

Изобретение относится к вычислительной технике. Технический результат заключается в повышении эффективности кодирования последовательных фрагментов аудиоконтента.

Изобретение относится к средствам смешанного кодирования во временной области/частотной области для кодирования входного звукового сигнала. Технический результат заключается в уменьшении времени задержки обработки при классификации звукового сигнала и при его преобразовании в частотную область.

Изобретение относится к вычислительной технике. Технический результат заключается в обеспечении регулировки общего усиления без декодирования и дополнительного этапа повторного кодирования.

Настоящее изобретение относится к способу кодирования сигнала возбуждения в целевой речи. Технический результат заключается в обеспечении сигналов возбуждения для синтеза речи без эффекта приглушенности синтезированной речи.

Изобретение относится к средствам кодирования комбинированной обновляющей кодовой книги. Технический результат заключается в обеспечении возможности быстрого поиска даже с очень большими кодовыми книгами.

Предложены устройство и способ квантования, в суперкадре, включающем в себя последовательность кадров, LPC-фильтров, вычисленных во время кадров из этой последовательности.

Изобретение относится к обработке цифровых сигналов, например сигналов речи, музыки, в области телекоммуникаций. Объектом изобретения является способ маскирования ошибки передачи в цифровом сигнале, разбитом на множество последовательных фреймов, связанных с различными временными интервалами, в котором при приеме сигнал может содержать стертые фреймы и нормальные фреймы, при этом нормальные фреймы содержат информацию (inf), связанную с маскированием потери фрейма.

Изобретение относится к области способов передачи мультимедийной информации в сетях связи и запоминания в электронных устройствах, в частности к кодированию речи.

Изобретение относится к области методов сжатия данных, в частности к способу и устройству для многоступенчатого квантования. .

Изобретение относится к области аудиокодирования, и более конкретно к области синтезирования аудиосигнала. Технический результат – улучшение синтезирования аудиосигнала как на низких, так и на более высоких скоростях передачи путем использования наклона спектра аудиосигнала при синтезировании сигнала для улучшения достижимой эффективности кодирования и, следовательно, повышения качества воспроизводимого сигнала. В данном изобретении описываются способ и устройство для синтезирования аудиосигнала, а также аудиодекодер. Технический результат достигается за счет того, что наклон спектра применяется к коду кодировочной книги, используемому для синтезирования текущего кадра аудиосигнала. Наклон спектра основан на наклоне спектра текущего кадра аудиосигнала. 5 н. и 22 з.п. ф-лы, 5 ил.
Наверх