Способы, кодер и декодер для линейного прогнозирующего кодирования и декодирования звуковых сигналов после перехода между кадрами, имеющими различные частоты дискретизации

Изобретение относится к средствам для линейного прогнозирующего кодирования и декодирования звуковых сигналов после перехода между кадрами, имеющими различные частоты дискретизации. Технический результат заключается в повышении эффективности кодирования при переключении LP-кодеков между двумя битовыми скоростями с различными внутренними частотами дискретизации. Преобразуют параметры линейной прогнозирующей фильтрации из первой внутренней частоты S1 дискретизации кодера во вторую внутреннюю частоту S2 дискретизации кодера. При этом вычисляют на внутренней частоте S1 дискретизации спектр мощности синтезирующего LP-фильтра с использованием параметров LP-фильтрации. Модифицируют спектр мощности синтезирующего LP-фильтра, чтобы преобразовать его из внутренней частоты S1 дискретизации во внутреннюю частоту S2 дискретизации. Обратно преобразуют модифицированный спектр мощности синтезирующего LP-фильтра, чтобы определить автокорреляции синтезирующего LP-фильтра на внутренней частоте S2 дискретизации. Используют автокорреляции, чтобы вычислить параметры LP-фильтрации на внутренней частоте S2 дискретизации. 6 н. и 28 з.п. ф-лы, 5 ил.

 

Область техники, к которой относится изобретение

[0001] Настоящее раскрытие сущности относится к области техники кодирования звука. Более конкретно, настоящее раскрытие сущности относится к способам, кодеру и декодеру для линейного прогнозирующего кодирования и декодирования звуковых сигналов после перехода между кадрами, имеющими различные частоты дискретизации.

Уровень техники

[0002] Потребность в технологиях эффективного цифрового широкополосного кодирования речи/аудио с компромиссом между хорошим субъективным качеством и скоростью передачи битов растет для множества вариантов применения, таких как приложения аудио/видеоконференц-связи, мультимедийные приложения и приложения беспроводной связи, а также Интернет-приложения и пакетные сетевые приложения. До недавнего времени, телефонные полосы пропускания в диапазоне 200-3400 Гц в основном использовались в приложениях кодирования речи. Тем не менее, имеется возрастающая потребность в широкополосных речевых приложениях, чтобы повышать разборчивость и естественность речевых сигналов. Полоса пропускания в диапазоне 50-7000 Гц считается достаточной для доставки качества речи при личном разговоре. Для аудиосигналов, этот диапазон обеспечивает приемлемое качество звука, но является еще ниже качества CD (компакт-дисков), которое находится в диапазоне 20-20000 Гц.

[0003] Речевой кодер преобразует речевой сигнал в цифровой поток битов, который передается по каналу связи (или сохраняется на носителе хранения данных). Речевой сигнал оцифровывается (дискретизируется и квантуется обычно с помощью 16 битов на выборку), и речевой кодер имеет роль представления этих цифровых выборок с меньшим числом битов при поддержании хорошего субъективного качества речи. Речевой декодер или синтезатор управляет передаваемым или сохраненным потоком битов и преобразует его обратно в звуковой сигнал.

[0004] Одна из наилучших доступных технологий, допускающих достижение компромисса между хорошим качеством и скоростью передачи битов, представляет собой так называемую технологию CELP (линейного прогнозирования с возбуждением по коду). Согласно этой технологии, дискретизированный речевой сигнал обрабатывается в последовательных блоках из L выборок, обычно называемых "кадрами", где L является некоторым предварительно определенным числом (соответствующим 10-30 мс речи). В CELP, синтезирующий фильтр на основе LP (линейного прогнозирования) вычисляется и передается каждый кадр. L-выборочный кадр дополнительно разделяется на меньшие блоки, называемые "субкадрами", из N выборок, где L=kN, и k является числом субкадров в кадре (N обычно соответствует 4-10 мс речи). Сигнал возбуждения определяется в каждом субкадре, который обычно содержит два компонента: один из предыдущего возбуждения (также называется "долей основного тона" или "адаптивной кодовой книгой") и другой из изобретаемой кодовой книги (также называется "фиксированной кодовой книгой"). Этот сигнал возбуждения передается и используется в декодере в качестве ввода синтезирующего LP-фильтра для того, чтобы получать синтезированную речь.

[0005] Чтобы синтезировать речь согласно CELP-технологии, каждый блок из N выборок синтезируется посредством фильтрации надлежащего кодового вектора из изобретаемой кодовой книги через изменяющиеся во времени фильтры, моделирующие спектральные характеристики речевого сигнала. Эти фильтры содержат синтезирующий фильтр основного тона (обычно реализуемый в качестве адаптивной кодовой книги, содержащей предыдущий сигнал возбуждения) и синтезирующий LP-фильтр. На стороне кодера, вывод синтеза вычисляется для всех или поднабора кодовых векторов из изобретаемой кодовой книги (поиск в кодовой книге). Сохраняемый инновационный кодовый вектор представляет собой кодовый вектор, формирующий вывод синтеза, ближайший к исходному речевому сигналу согласно перцепционно взвешенному показателю искажения. Это перцепционное взвешивание выполняется с использованием так называемого перцепционного взвешивающего фильтра, который обычно извлекается из синтезирующего LP-фильтра.

[0006] В LP-кодерах, к примеру, в CELP, LP-фильтр вычисляется, затем квантуется и передается один раз в расчете на каждый кадр. Тем не менее, чтобы обеспечивать плавную динамику синтезирующего LP-фильтра, параметры фильтрации интерполируются в каждом субкадре на основе LP-параметров из предыдущего кадра. Параметры LP-фильтрации не являются подходящими для квантования вследствие проблем стабильности фильтра. Обычно используется другое LP-представление, более эффективное для квантования и интерполяции. Обычно используемое представление LP-параметров представляет собой область частот спектральной линии (LSF).

[0007] При широкополосном кодировании, звуковой сигнал дискретизируется при 16000 выборок в секунду, и кодированная полоса пропускания расширена вплоть до 7 кГц. Тем не менее, при широкополосном кодировании на низкой скорости передачи битов (ниже 16 Кбит/с), обычно более эффективно понижающе дискретизировать входной сигнал до немного более низкой скорости и применять CELP-модель к более низкой полосе пропускания, затем использовать расширение полосы пропускания в декодере, чтобы формировать сигнал вплоть до 7 кГц. Это обусловлено этим фактом, что CELP моделирует нижние частоты с высокой энергией лучше, чем верхние частоты. Таким образом, более эффективно ориентировать модель на более низкую полосу пропускания на низких скоростях передачи битов. Стандарт AMR-WB (ссылочный материал [1]) является таким примером кодирования, в котором входной сигнал понижающе дискретизируется при 12800 выборок в секунду, и CELP кодирует сигнал вплоть до 6,4 кГц. В декодере, расширение полосы пропускания используется для того, чтобы формировать сигнал от 6,4 до 7 кГц. Тем не менее, на скоростях передачи битов выше 16 Кбит/с более эффективно использовать CELP для того, чтобы кодировать сигнал вплоть до 7 кГц, поскольку имеется достаточно битов для того, чтобы представлять всю полосу пропускания.

[0008] Последние кодеры представляют собой многоскоростные кодеры, охватывающие широкий диапазон скоростей передачи битов, чтобы обеспечивать гибкость в различных сценариях применения. Кроме того, AMR-WB является таким примером, в котором кодер работает на скоростях передачи битов от 6,6 до 23,85 Кбит/с. В многоскоростных кодерах, кодек должен иметь возможность переключаться между различными скоростями передачи битов на основе кадров без введения артефактов при переключении. В AMR-WB это легко достигается, поскольку все скорости используют CELP на внутренней частоте дискретизации в 12,8 кГц. Тем не менее, в недавнем кодере с использованием дискретизации при 12,8 кГц на скоростях передачи битов ниже 16 Кбит/с и дискретизации при 16 кГц на скоростях передачи битов выше 16 Кбит/с, должны разрешаться проблемы, связанные с переключением скорости передачи битов между кадрами с использованием различных частот дискретизации. Основные проблемы заключаются в переходе LP-фильтра и в запоминающем устройстве синтезирующего фильтра и адаптивной кодовой книги.

[0009] Следовательно, остается потребность в эффективных способах для переключения LP-кодеков между двумя битовыми скоростями с различными внутренними частотами дискретизации.

Сущность изобретения

[0010] Согласно настоящему раскрытию сущности, предусмотрен способ, реализованный в кодере звуковых сигналов для преобразования параметров линейной прогнозирующей (LP) фильтрации из частоты S1 дискретизации звуковых сигналов в частоту S2 дискретизации звуковых сигналов. Спектр мощности синтезирующего LP-фильтра вычисляется, на частоте S1 дискретизации, с использованием параметров LP-фильтрации. Спектр мощности синтезирующего LP-фильтра модифицируется таким образом, чтобы преобразовывать его из частоты S1 дискретизации в частоту S2 дискретизации. Модифицированный спектр мощности синтезирующего LP-фильтра обратно преобразуется таким образом, чтобы определять автокорреляции синтезирующего LP-фильтра на частоте S2 дискретизации. Автокорреляции используются для того, чтобы вычислять параметры LP-фильтрации на частоте S2 дискретизации.

[0011] Согласно настоящему раскрытию сущности, также предусмотрен способ, реализованный в декодере звуковых сигналов для преобразования принимаемых параметров линейной прогнозирующей (LP) фильтрации из частоты S1 дискретизации звуковых сигналов в частоту S2 дискретизации звуковых сигналов. Спектр мощности синтезирующего LP-фильтра вычисляется, на частоте S1 дискретизации, с использованием принимаемых параметров LP-фильтрации. Спектр мощности синтезирующего LP-фильтра модифицируется таким образом, чтобы преобразовывать его из частоты S1 дискретизации в частоту S2 дискретизации. Модифицированный спектр мощности синтезирующего LP-фильтра обратно преобразуется таким образом, чтобы определять автокорреляции синтезирующего LP-фильтра на частоте S2 дискретизации. Автокорреляции используются для того, чтобы вычислять параметры LP-фильтрации на частоте S2 дискретизации.

[0012] Согласно настоящему раскрытию сущности, также предусмотрено устройство для использования в кодере звуковых сигналов для преобразования параметров линейной прогнозирующей (LP) фильтрации из частоты S1 дискретизации звуковых сигналов в частоту S2 дискретизации звуковых сигналов. Устройство содержит процессор, выполненный с возможностью:

- вычислять, на частоте S1 дискретизации, спектр мощности синтезирующего LP-фильтра с использованием принимаемых параметров LP-фильтрации,

- модифицировать спектр мощности синтезирующего LP-фильтра таким образом, чтобы преобразовывать его из частоты S1 дискретизации в частоту S2 дискретизации,

- обратно преобразовывать модифицированный спектр мощности синтезирующего LP-фильтра таким образом, чтобы определять автокорреляции синтезирующего LP-фильтра на частоте S2 дискретизации, и

- использовать автокорреляции для того, чтобы вычислять параметры LP-фильтрации на частоте S2 дискретизации.

[0013] Настоящее раскрытие сущности дополнительно относится к устройству для использования в декодере звуковых сигналов для преобразования принимаемых параметров линейной прогнозирующей (LP) фильтрации из частоты S1 дискретизации звуковых сигналов в частоту S2 дискретизации звуковых сигналов. Устройство содержит процессор, выполненный с возможностью:

- вычислять, на частоте S1 дискретизации, спектр мощности синтезирующего LP-фильтра с использованием принимаемых параметров LP-фильтрации,

- модифицировать спектр мощности синтезирующего LP-фильтра таким образом, чтобы преобразовывать его из частоты S1 дискретизации в частоту S2 дискретизации,

- обратно преобразовывать модифицированный спектр мощности синтезирующего LP-фильтра таким образом, чтобы определять автокорреляции синтезирующего LP-фильтра на частоте S2 дискретизации, и

- использовать автокорреляции для того, чтобы вычислять параметры LP-фильтрации на частоте S2 дискретизации.

[0014] Вышеприведенные и другие цели, преимущества и признаки настоящего раскрытия сущности должны становиться более очевидными из прочтения нижеприведенного неограничивающего описания его иллюстративного варианта осуществления, предоставленного только в качестве примера со ссылкой на прилагаемые чертежи.

Краткое описание чертежей

[0015] На прилагаемых чертежах:

[0016] Фиг. 1 является принципиальной блок-схемой системы звуковой связи, иллюстрирующей пример использования кодирования и декодирования звука;

[0017] Фиг. 2 является принципиальной блок-схемой, иллюстрирующей структуру кодера и декодера на основе CELP, части системы звуковой связи по фиг. 1;

[0018] Фиг. 3 иллюстрирует пример кадрирования и интерполяции LP-параметров;

[0019] Фиг. 4 является блок-схемой, иллюстрирующей вариант осуществления для преобразования параметров LP-фильтрации между двумя различными частотами дискретизации; и

[0020] Фиг. 5 является упрощенной блок-схемой примерной конфигурации аппаратных компонентов, формирующих кодер и/или декодер по фиг. 1 и 2.

Подробное описание изобретения

[0021] Неограничивающий иллюстративный вариант осуществления настоящего раскрытия сущности относится к способу и устройству для эффективного переключения, в LP-кодеке, между кадрами с использованием различных внутренних частот дискретизации. Способ и устройство переключения могут использоваться с любыми звуковыми сигналами, включающими в себя речевые и аудиосигналы. Переключение между внутренними частотами дискретизации в 12,8 кГц и в 16 кГц приводится в качестве примера, тем не менее, способ и устройство переключения также могут применяться к другим частотам дискретизации.

[0022] Фиг. 1 является принципиальной блок-схемой системы звуковой связи, иллюстрирующей пример использования кодирования и декодирования звука. Система 100 звуковой связи поддерживает передачу и воспроизведение звукового сигнала через канал 101 связи. Канал 101 связи может содержать, например, линию проводной, оптической или волоконно-оптической связи. Альтернативно, канал 101 связи может содержать, по меньшей мере, частично линию радиочастотной связи. Линия радиочастотной связи зачастую поддерживает несколько одновременных сеансов речевой связи, что требует совместно используемых ресурсов полосы пропускания, к примеру, что может иметь место в случае сотовой телефонии. Хотя не показано, канал 101 связи может быть заменен посредством устройства хранения данных в варианте осуществления одного устройства системы 101 связи, которое записывает и сохраняет кодированный звуковой сигнал для последующего воспроизведения.

[0023] По-прежнему ссылаясь на фиг. 1, например, микрофон 102 формирует исходный аналоговый звуковой сигнал 103, который предоставляется в аналого-цифровой (A/D) преобразователь 104 для преобразования его в исходный цифровой звуковой сигнал 105. Исходный цифровой звуковой сигнал 105 также может записываться и подаваться из устройства хранения данных (не показано). Звуковой кодер 106 кодирует исходный цифровой звуковой сигнал 105, за счет этого формируя набор параметров 107 кодирования, которые кодируются в двоичную форму и доставляются в необязательный канальный кодер 108. Необязательный канальный кодер 108, если присутствует, добавляет избыточность в двоичное представление параметров кодирования до их передачи по каналу 101 связи. На стороне приемного устройства, необязательный канальный декодер 109 использует вышеуказанную избыточную информацию в цифровом потоке 111 битов, чтобы обнаруживать и корректировать канальные ошибки, которые, возможно, возникают в ходе передачи по каналу 101 связи, формирующей принимаемые параметры 112 кодирования. Звуковой декодер 110 преобразует принимаемые параметры 112 кодирования для создания синтезированного цифрового звукового сигнала 113. Синтезированный цифровой звуковой сигнал 113, восстановленный в звуковом декодере 110, преобразуется в синтезированный аналоговый звуковой сигнал 114 в цифро-аналоговом (D/A) преобразователе 115 и воспроизводится в блоке 116 громкоговорителя. Альтернативно, синтезированный цифровой звуковой сигнал 113 также может предоставляться и записываться на устройство хранения данных (не показано).

[0024] Фиг. 2 является принципиальной блок-схемой, иллюстрирующей структуру кодера и декодера на основе CELP, частью системы звуковой связи по фиг. 1. Как проиллюстрировано на фиг. 2, звуковой кодек содержит две базовых части: звуковой кодер 106 и звуковой декодер 110 введенные в вышеприведенном описании по фиг. 1. В кодер 106 предоставляется исходный цифровой звуковой сигнал 105, он определяет параметры 107 кодирования, описанные в данном документе ниже, представляющие исходный аналоговый звуковой сигнал 103. Эти параметры 107 кодируются в цифровой поток 111 битов, который передается с использованием канала связи, например, канала 101 связи по фиг. 1, в декодер 110. Звуковой декодер 110 восстанавливает синтезированный цифровой звуковой сигнал 113 таким образом, что он является максимально возможно аналогичным исходному цифровому звуковому сигналу 105.

[0025] В настоящее время, самые широко распространенные технологии кодирования речи основаны на линейном прогнозировании (LP) в частности, CELP. В LP-кодировании, синтезированный цифровой звуковой сигнал 113 формируется посредством фильтрации возбуждения 214 через синтезирующий LP-фильтр 216, имеющий передаточную функцию . В CELP, возбуждение 214 типично состоит из двух частей: доли 222 адаптивной кодовой книги на первом каскаде, выбранной из адаптивной кодовой 218 книги и усиленной посредством усиления gp 226 адаптивной кодовой книги, и доли 224 фиксированной кодовой книги на втором каскаде, выбранной из фиксированной кодовой книги 220 и усиленной посредством усиления gc 228 фиксированной кодовой книги. Вообще говоря, доля 222 адаптивной кодовой книги моделирует периодическую часть возбуждения, и доля 214 фиксированной кодовой книги добавляется, чтобы моделировать динамику звукового сигнала.

[0026] Звуковой сигнал обрабатывается посредством кадров типично в 20 мс, и параметры LP-фильтрации передаются один раз в расчете на каждый кадр. В CELP, кадр дополнительно разделяется на несколько субкадров, чтобы кодировать возбуждение. Длина субкадра типично составляет 5 мс.

[0027] CELP использует принцип, называемый "анализом через синтез", в котором возможные выводы декодера пробуются (синтезируются) уже во время процесса кодирования в кодере 106 и затем сравниваются с исходным цифровым звуковым сигналом 105. Таким образом, кодер 106 включает в себя элементы, аналогичные элементам декодера 110. Эти элементы включают в себя долю 250 адаптивной кодовой книги, выбранную из адаптивной кодовой 242 книги, которая предоставляет предыдущий сигнал v(n) возбуждения, свернутый с импульсной характеристикой взвешенного синтезирующего фильтра H(z) (см. 238) (каскад из синтезирующего LP-фильтра 1/A(z) и перцепционного взвешивающего фильтра W(z)), результат y1(n) которого усиливается посредством усиления gp 240 адаптивной кодовой книги. Также включается доля 252 фиксированной кодовой книги, выбранная из фиксированной кодовой 244 книги, которая предоставляет инновационный кодовый вектор ck(n), свернутый с импульсной характеристикой взвешенного синтезирующего фильтра H(z) (см. 246), результат y2(n) которого усиливается посредством усиления gc 248 фиксированной кодовой книги.

[0028] Кодер 106 также содержит перцепционный взвешивающий фильтр W(z) 233 и поставщик 234 характеристики при отсутствии входного сигнала каскада (H(z)) из синтезирующего LP-фильтра 1/A(z) и перцепционного взвешивающего фильтра W(z). Модули 236, 254 и 256 вычитания, соответственно, вычитают характеристику при отсутствии входного сигнала, долю 250 адаптивной кодовой книги и долю 252 фиксированной кодовой книги из исходного цифрового звукового сигнала 105, фильтрованного посредством перцепционного взвешивающего фильтра 233, чтобы предоставлять среднеквадратическую ошибку 232 между исходным цифровым звуковым сигналом 105 и синтезированным цифровым звуковым сигналом 113.

[0029] Поиск в кодовой книге минимизирует среднеквадратическую ошибку 232 между исходным цифровым звуковым сигналом 105 и синтезированным цифровым звуковым сигналом 113 в перцепционно взвешенной области, где дискретный временной индекс n=0, 1,..., N-1 и N является длиной субкадра. Перцепционный взвешивающий фильтр W(z) использует эффект частотного маскирования и типично извлекается из LP-фильтра A(z).

[0030] Пример перцепционного взвешивающего фильтра W(z) для WB- (широкополосных, для полосы пропускания в 50-7000 Гц) сигналов содержатся в ссылочном материале [1].

[0031] Поскольку запоминающее устройство синтезирующего LP-фильтра 1/A(z) и взвешивающего фильтра W(z) является независимым от искомых кодовых векторов, это запоминающее устройство может вычитаться из исходного цифрового звукового сигнала 105 до поиска в фиксированной кодовой книге. Фильтрация возможных вариантов кодовых векторов затем может выполняться посредством свертки с импульсной характеристикой каскада фильтров 1/A(z) и W(z), представленных посредством H(z) на фиг. 2.

[0032] Цифровой поток 111 битов, передаваемый из кодера 106 в декодер 110, типично содержит следующие параметры 107: квантованные параметры LP-фильтра A(z), индексы адаптивной кодовой 242 книги и фиксированной кодовой 244 книги и усиления gp 240 и gc 248 адаптивной кодовой 242 книги и фиксированной кодовой 244 книги.

Преобразование параметров LP-фильтрации при переключении на границах кадров с различными частотами дискретизации

[0033] В LP-кодировании, LP-фильтр A(z) определяется один раз в расчете на каждый кадр и затем интерполируется для каждого субкадра. Фиг. 3 иллюстрирует пример кадрирования и интерполяции LP-параметров. В этом примере, текущий кадр разделяется на четыре субкадра SF1, SF2, SF3 и SF4, и окно LP-анализа центрируется на последнем субкадре SF4. Таким образом, LP-параметры, получающиеся в результате LP-анализа в текущем кадре F1, используются как есть в последнем субкадре, т.е. SF4=F1. Для первых трех субкадров SF1, SF2 и SF3, LP-параметры получаются посредством интерполяции параметров в текущем кадре F1 и предыдущем кадре F0. Иными словами:

[0034] SF1=0,75F0+0,25F1;

[0035] SF2=0,5F0+0,5F1;

[0036] SF3=0,25F0+0,75F1

[0037] SF4=F1.

[0038] Другие примеры интерполяции альтернативно могут использоваться в зависимости от формы, длины и позиции окна LP-анализа. В другом варианте осуществления, кодер переключается между внутренними частотами дискретизации в 16 кГц и в 12,8 кГц, при этом 4 субкадра в расчете на кадр используются при 12,8 кГц, и 5 субкадров в расчете на кадр используются при 16 кГц, и при этом LP-параметры также квантуются в середине текущего кадра (Fm). В этом другом варианте осуществления, интерполяция LP-параметров для кадра на 12,8 кГц задается следующим образом:

[0039] SF1=0,5F0+0,5Fm;

[0040] SF2=Fm;

[0041] SF3=0,5Fm+0,5F1;

[0042] SF4=F1.

[0043] Для дискретизации при 16 кГц, интерполяция задается следующим образом:

[0044] SF1=0,55F0+0,45Fm;

[0045] SF2=0,15F0+0,85Fm;

[0046] SF3=0,75Fm+0,25F1;

[0047] SF4=0,35Fm+0,65F1;

[0048] SF5=F1.

[0049] LP-анализ приводит к вычислению параметров синтезирующего LP-фильтра с использованием:

, (1)

[0050] где , являются параметрами LP-фильтрации, а M является порядком фильтра.

[0051] Параметры LP-фильтрации преобразуются в другую область в целях квантования и интерполяции. Другие обычно используемые представления LP-параметров представляют собой коэффициенты отражения, логарифмические отношения площадей, пары спектра иммитанса (используемые в AMR-WB; ссылочный материал [1]) и пары спектральных линий, которые также называются "частотами спектральной линии (LSF)". В этом иллюстративном варианте осуществления, используется представление на основе частот спектральной линии. Пример способа, который может использоваться для того, чтобы преобразовывать LP-параметры в LSF-параметры и наоборот, содержится в ссылочном материале [2]. Пример интерполяции в предыдущем параграфе применяется к LSF-параметрам, которые могут находиться в частотной области в диапазоне между 0 и Fs/2 (где Fs является частотой дискретизации) либо в масштабированной частотной области между 0 и π, либо в косинусоидальной области (косинус масштабированной частоты).

[0052] Как описано выше, различные внутренние частоты дискретизации могут использоваться на различных скоростях передачи битов, чтобы повышать качество при многоскоростном LP-кодировании. В этом иллюстративном варианте осуществления, используется многоскоростной широкополосный CELP-кодер, в котором внутренняя частота дискретизации в 12,8 кГц используется на более низких скоростях передачи битов, а внутренняя частота дискретизации в 16 кГц - на более высоких скоростях передачи битов. На частоте дискретизации в 12,8 кГц, LSF охватывают полосу пропускания от 0 до 6,4 кГц, в то время как при частоте дискретизации в 16 кГц они охватывают диапазон из 0-8 кГц. При переключении скорости передачи битов между двумя кадрами, в которых внутренняя частота дискретизации отличается, разрешаются некоторые проблемы, чтобы обеспечивать прозрачное переключение. Эти проблемы включают в себя интерполяцию параметров LP-фильтрации и запоминающие устройства синтезирующего фильтра и адаптивной кодовой книги, которые имеют различные частоты дискретизации.

[0053] Настоящее раскрытие сущности вводит способ для эффективной интерполяции LP-параметров между двумя кадрами на различных внутренних частотах дискретизации. В качестве примера, рассматривается переключение между частотами дискретизации в 16 кГц и на 12,8 кГц. Тем не менее, раскрытые технологии не ограничены этими конкретными частотами дискретизации и могут применяться к другим внутренним частотам дискретизации.

[0054] Допустим, что кодер переключается с кадра F1 с внутренней частотой S1 дискретизации на кадр F2 с внутренней частотой S2 дискретизации. LP-параметры в первом кадре обозначаются как LSF1S1, а LP-параметры во втором кадре обозначаются как LSF2S2. Чтобы обновлять LP-параметры в каждом субкадре кадра F2, LP-параметры, LSF1 и LSF2 интерполируются. Чтобы выполнять интерполяцию, фильтры должны задаваться на идентичной частоте дискретизации. Это требует выполнения LP-анализа кадра F1 на частоте S2 дискретизации. Чтобы не допускать передачи LP-фильтра два раза на двух частотах дискретизации в кадре F1, LP-анализ на частоте S2 дискретизации может выполняться для предыдущего синтезирующего сигнала, который доступен в кодере и декодере. Этот подход заключает в себе повторную дискретизацию предыдущего синтезирующего сигнала из частоты S1 до частоты S2 и выполнение полного LP-анализа, причем эта операция повторяется в декодере, что обычно требует высокой вычислительной нагрузки.

[0055] Альтернативный способ и устройства раскрыты в данном документе для преобразования параметров LSF1 синтезирующей LP-фильтрации из частоты S1 дискретизации в частоту S2 дискретизации без необходимости повторно дискретизировать предыдущий синтез и выполнять полный LP-анализ. Способ, используемый при кодировании и/или при декодировании, содержит вычисление спектра мощности синтезирующего LP-фильтра на частоте S1; модификацию спектра мощности таким образом, чтобы преобразовывать его из частоты S1 в частоту S2; преобразование модифицированного спектра мощности обратно во временную область, чтобы получать автокорреляцию фильтра на частоте S2; и в завершение использование автокорреляции для того, чтобы вычислять параметры LP-фильтрации на частоте S2.

[0056] По меньшей мере, в некоторых вариантах осуществления, модификация спектра мощности таким образом, чтобы преобразовывать его из частоты S1 в частоту S2, содержит следующие операции:

[0057] Если S1 превышает S2, модификация спектра мощности содержит усечение K-выборочного спектра мощности до K(S2/S1) выборок, т.е. удаление K(S1-S2)/S1 выборок.

[0058] С другой стороны, если S1 меньше S2, то модификация спектра мощности содержит расширение K-выборочного спектра мощности до K(S2/S1) выборок, т.е. добавление K (S2-S1)/S1 выборок.

[0059] Вычисление LP-фильтра на частоте S2 из автокорреляций может выполняться с использованием алгоритма Левинсона-Дурбина (см. ссылочный материал [1]). После того, как LP-фильтр преобразуется в частоту S2, параметры LP-фильтрации преобразуются в область интерполяции, которая представляет собой LSF-область в этом иллюстративном варианте осуществления.

[0060] Процедура, описанная выше, обобщается на фиг. 4, который является блок-схемой, иллюстрирующей вариант осуществления для преобразования параметров LP-фильтрации между двумя различными частотами дискретизации.

[0061] Последовательность 300 операций показывает то, что простой способ для вычисления спектра мощности синтезирующего LP-фильтра 1/A(z) заключается в том, чтобы оценивать частотную характеристику фильтра при K частот от 0 до .

[0062] Частотная характеристика синтезирующего фильтра задается следующим образом:

, (2)

[0063] и спектр мощности синтезирующего фильтра вычисляется как энергия частотной характеристики синтезирующего фильтра, заданная следующим образом:

(3)

[0064] Первоначально, LP-фильтр имеет частоту, равную S1 (этап 310). K-выборочный (т.е. дискретный) спектр мощности синтезирующего LP-фильтра вычисляется (этап 320) посредством дискретизации частотного диапазона от 0 до . Иными словами:

(4)

[0065] Следует отметить, что можно уменьшать функциональную сложность посредством вычисления только для , поскольку спектр мощности от до является зеркалом спектра мощности от 0 до .

[0066] Тест (этап 330) определяет то, какой из следующих случаев применяется. В первом случае, частота S1 дискретизации превышает частоту S2 дискретизации, и спектр мощности для кадра F1 усекается (этап 340), так что новое число выборок составляет .

[0067] Подробнее, когда S1 превышает S2, длина усеченного спектра мощности составляет выборок. Поскольку спектр мощности усекается, он вычисляется из . Поскольку спектр мощности является симметричным около , в таком случае предполагается, что:

[0068] Преобразование Фурье для автокорреляций сигнала обеспечивает спектр мощности того сигнала. Таким образом, применение обратного преобразования Фурье к усеченному спектру мощности приводит к автокорреляциям импульсной характеристики синтезирующего фильтра на частоте S2 дискретизации.

[0069] Обратное дискретное преобразование Фурье (IDFT) усеченного спектра мощности задается следующим образом:

(5)

[0070] Поскольку порядок фильтра составляет M, в таком случае IDFT может вычисляться только для i=0,…,M. Дополнительно, поскольку спектр мощности является действительным и симметричным, то IDFT спектра мощности также является действительным и симметричным. С учетом симметрии спектра мощности, а также того, что требуется только M+1 корреляций, обратное преобразование спектра мощности может задаваться следующим образом:

(6)

[0071] Иными словами:

(7)

для .

для .

[0072] После того, как автокорреляции вычисляются на частоте S2 дискретизации, алгоритм Левинсона-Дурбина (см. ссылочный материал [1]) может использоваться для того, чтобы вычислять параметры LP-фильтра на частоте S2 дискретизации. Затем параметры LP-фильтрации преобразуются в LSF-область для интерполяции с LSF кадра F2, чтобы получать LP-параметры в каждом субкадре.

[0073] В иллюстративном примере, в котором кодер кодирует широкополосный сигнал и переключается с кадра с внутренней частотой дискретизации S1=16 кГц на кадр с внутренней частотой дискретизации S2=12,8 кГц, при условии, что , длина усеченного спектра мощности составляет выборок. Спектр мощности вычисляется для 41 выборки с использованием уравнения (4), и затем автокорреляции вычисляются с использованием уравнения (7) с .

[0074] Во втором случае, когда тест (этап 330) определяет то, что S1 меньше S2, длина расширенного спектра мощности составляет выборок (этап 350) После вычисления спектра мощности из , спектр мощности расширяется до . Поскольку отсутствует исходный спектральный контент между и , расширение спектра мощности может выполняться посредством вставки числа выборок вплоть до с использованием очень низких выборочных значений. Простой подход заключается в том, чтобы повторять выборку при вплоть до . Поскольку спектр мощности является симметричным около , в таком случае предполагается, что:

[0075] В любом случае, обратное DFT затем вычисляется, аналогично уравнению (6), чтобы получать автокорреляции на частоте S2 дискретизации (этап 360), и алгоритм Левинсона-Дурбина (см. ссылочный материал [1]) используется для того, чтобы вычислять параметры LP-фильтрации на частоте S2 дискретизации (этап 370). Затем параметры фильтрации преобразуются в LSF-область для интерполяции с LSF кадра F2, чтобы получать LP-параметры в каждом субкадре.

[0076] С другой стороны, рассмотрим иллюстративный пример, в котором кодер переключается с кадра с внутренней частотой дискретизации S1=12,8 кГц на кадр с внутренней частотой дискретизации S2=16 кГц, и допустим, что . Длина расширенного спектра мощности составляет выборок. Спектр мощности вычисляется для 51 выборки с использованием уравнения (4), и затем автокорреляции вычисляются с использованием уравнения (7) с .

[0077] Следует отметить, что другие способы могут использоваться для того, чтобы вычислять спектр мощности синтезирующего LP-фильтра или обратное DFT спектра мощности без отступления от сущности настоящего раскрытия сущности.

[0078] Следует отметить, что в этом иллюстративном варианте осуществления, преобразование параметров LP-фильтрации между различными внутренними частотами дискретизации применяется к квантованным LP-параметрам, чтобы определять интерполированные параметры синтезирующей фильтрации в каждом субкадре, и это повторяется в декодере. Следует отметить, что взвешивающий фильтр использует неквантованные параметры LP-фильтрации, но считается достаточным интерполировать между неквантованными параметрами фильтрации в новом кадре F2 и дискретизирующе преобразованными квантованными LP-параметрами из предыдущего кадра F1, чтобы определять параметры взвешивающего фильтра в каждом субкадре. Это также исключает необходимость применять дискретизирующее преобразование с помощью LP-фильтра к неквантованным параметрам LP-фильтрации.

Другие факторы при переключении на границах кадров с различными частотами дискретизации

[0079] Другая проблема, которая должна рассматриваться при переключении между кадрами с различными внутренними частотами дискретизации, заключается в контенте адаптивной кодовой книги, которая обычно содержит предыдущий сигнал возбуждения. Если новый кадр имеет внутреннюю частоту S2 дискретизации, и предыдущий кадр имеет внутреннюю частоту S1 дискретизации, то контент адаптивной кодовой книги повторно дискретизируется из частоты S1 до частоты S2, и это выполняется как в кодере, так и в декодере.

[0080] Чтобы уменьшать сложность, в этом раскрытии сущности, новому кадру F2 инструктируется использовать переходный режим кодирования, который является независимым от истории предыдущих возбуждений и в силу этого не использует историю адаптивной кодовой книги. Пример кодирования в переходном режиме содержится в PCT-заявке на патент WO 2008/049221 A1 "Method and device for coding transition frames in speech signals", раскрытие сущности которой содержится по ссылке в данном документе.

[0081] Другой фактор при переключении на границах кадров с различными частотами дискретизации представляет собой запоминающее устройство прогнозирующих квантователей. В качестве примера, квантователи LP-параметров обычно используют прогнозирующее квантование, которое не может работать надлежащим образом, когда параметры имеют различные частоты дискретизации. Чтобы уменьшать артефакты при переключении, квантователь LP-параметров может принудительно переводиться в режим непрогнозирующего кодирования при переключении между различными частотами дискретизации.

[0082] Дополнительный фактор представляет собой запоминающее устройство синтезирующего фильтра, который может повторно дискретизироваться при переключении между кадрами с различными частотами дискретизации.

[0083] В завершение, дополнительная сложность, которая является результатом преобразования параметров LP-фильтрации при переключении между кадрами с различными внутренними частотами дискретизации, может компенсироваться посредством модификации частей обработки кодирования или декодирования. Например, чтобы не увеличивать сложность кодера, поиск в фиксированной кодовой книге может модифицироваться посредством снижения числа итераций в первом субкадре кадра (см. ссылочный материал [1] для примера поиска в фиксированной кодовой книге).

[0084] Дополнительно, чтобы не увеличивать сложность декодера, определенная постобработка может пропускаться. Например, в этом иллюстративном варианте осуществления, может использоваться технология постобработки, как описано в патенте (США) 7529660 "Method and device for frequency-selective pitch enhancement of synthesized speech", раскрытие сущности которой содержится по ссылке в данном документе. Эта постфильтрация пропускается в первом кадре после переключения на другую внутреннюю частоту дискретизации (пропуск этой постфильтрации также преодолевает необходимость в предыдущем синтезе, используемом в постфильтре).

[0085] Дополнительно, другие параметры, которые зависят из частоты дискретизации, могут масштабироваться соответствующим образом. Например, предыдущая задержка основного тона, используемая для классификатора декодеров и маскирования стирания кадров, может масштабироваться на коэффициент S2/S1.

[0086] Фиг. 5 является упрощенной блок-схемой примерной конфигурации аппаратных компонентов, формирующих кодер и/или декодер по фиг. 1 и 2. Устройство 400 может реализовываться как часть мобильного терминала, как часть портативного мультимедийного проигрывателя, базовой станции, Интернет-оборудования или в любом аналогичном устройстве и может включать кодер 106, декодер 110 либо как кодер 106, так и декодер 110. Устройство 400 включает в себя процессор 406 и запоминающее устройство 408. Процессор 406 может содержать один или более различных процессоров для выполнения инструкций с кодом, чтобы выполнять этапы по фиг. 4. Процессор 406 может осуществлять различные элементы кодера 106 и декодера 110 по фиг. 1 и 2. Процессор 406 дополнительно может выполнять задачи мобильного терминала, портативного мультимедийного проигрывателя, базовой станции, Интернет-оборудования и т.п. Запоминающее устройство 408 функционально соединяется с процессором 406. Запоминающее устройство 408, которое может представлять собой энергонезависимое запоминающее устройство, сохраняет инструкции с кодом, выполняемые посредством процессора 406.

[0087] Аудиоввод 402 присутствует в устройстве 400 при использовании в качестве кодера 106. Аудиоввод 402 может включать в себя, например, микрофон или интерфейс, соединяемый с микрофоном. Аудиоввод 402 может включать в себя микрофон 102 и аналого-цифровой преобразователь 104 и формировать исходный аналоговый звуковой сигнал 103 и/или исходный цифровой звуковой сигнал 105. Альтернативно, аудиоввод 402 может принимать исходный цифровой звуковой сигнал 105. Аналогично, кодированный вывод 404 присутствует, когда устройство 400 используется в качестве кодера 106, и выполнен с возможностью перенаправлять параметры 107 кодирования или цифровой поток 111 битов, содержащий параметры 107, включающие в себя параметры LP-фильтрации, в удаленный декодер через линию связи, например, через канал 101 связи или в дополнительное запоминающее устройство (не показано) для хранения. Неограничивающие примеры реализации кодированного вывода 404 содержат радиоинтерфейс мобильного терминала, физический интерфейс, такой как, например, порт универсальной последовательной шины (USB) портативного мультимедийного проигрывателя и т.п.

[0088] Кодированный ввод 403 и аудиовывод 405 присутствуют в устройстве 400 при использовании в качестве декодера 110. Кодированный ввод 403 может быть структурирован с возможностью принимать параметры 107 кодирования или цифровой поток 111 битов, содержащие параметры 107, включающие в себя параметры LP-фильтрации, из кодированного вывода 404 кодера 106. Когда устройство 400 включает в себя как кодер 106, так и декодер 110, кодированный вывод 404 и кодированный ввод 403 могут формировать общий модуль связи. Аудиовывод 405 может содержать цифро-аналоговый преобразователь 115 и блок 116 громкоговорителя. Альтернативно, аудиовывод 405 может содержать интерфейс, соединяемый с аудиопроигрывателем, с громкоговорителем, с устройством записи и т.п.

[0089] Аудиоввод 402 или кодированный ввод 403 также может принимать сигналы из устройства хранения данных (не показано). Таким же образом, кодированный вывод 404 и аудиовывод 405 могут предоставлять выходной сигнал в устройство хранения данных (не показано) для записи.

[0090] Аудиоввод 402, кодированный ввод 403, кодированный вывод 404 и аудиовывод 405 функционально соединяются с процессором 406.

[0091] Специалисты в данной области техники должны понимать, что описание способов, кодера и декодера для линейного прогнозирующего кодирования и декодирования звуковых сигналов является только иллюстративным и не имеет намерение быть ограничивающим в каком-либо отношении. Другие варианты осуществления должны быть легко выявляемыми такими специалистами в данной области техники с использованием преимущества настоящего раскрытия сущности. Кроме того, раскрытые способы, кодер и декодер могут быть индивидуально настроены с возможностью предлагать ценные решения для существующих потребностей и проблем переключения кодеков на основе линейного прогнозирования между двумя битовыми скоростями с различными частотами дискретизации.

[0092] В интересах ясности, показаны и описаны не все из стандартных признаков реализаций способов, кодера и декодера. Конечно, следует принимать во внимание, что при разработке любой такой фактической реализации способов, кодера и декодера, множество конкретных для реализации решений, возможно, должны приниматься для того, чтобы достигать конкретных целей разработчика, таких как соответствие прикладным, системным, сетевым и бизнес-ориентированным ограничениям, а также то, что эти конкретные цели должны варьироваться между реализациями и между разработчиками. Кроме того, следует принимать во внимание, что опытно-конструкторские работы могут быть сложными и времязатратными, но, несмотря на это, представлять собой стандартную задачу проектирования для специалистов в области техники кодирования звука с использованием преимущества настоящего раскрытия сущности.

[0093] В соответствии с настоящим раскрытием сущности, компоненты, этапы процесса и/или структуры данных, описанные в данном документе, могут реализовываться с использованием различных типов операционных систем, вычислительных платформ, сетевых устройств, компьютерных программ и/или машин общего назначения. Помимо этого, специалисты в данной области техники должны распознавать, что также могут использоваться устройства с характером менее общего назначения, к примеру, аппаратные устройства, программируемые пользователем вентильные матрицы (FPGA), специализированные интегральные схемы (ASIC) и т.п. Если способ, содержащий последовательность операций, реализуется посредством компьютера или машины, и эти операции могут сохраняться в качестве последовательности инструкций, считываемых посредством машины, они могут сохраняться на материальном носителе.

[0094] Системы и модули, описанные в данном документе, могут содержать программное обеспечение, микропрограммное обеспечение, аппаратные средства или любую комбинацию(и) программного обеспечения, микропрограммного обеспечения или аппаратных средств, подходящие для целей, описанных в данном документе.

[0095] Хотя настоящее раскрытие сущности описано выше посредством его неограничивающих, иллюстративных вариантов осуществления, эти варианты осуществления могут модифицироваться по желанию в пределах объема прилагаемой формулы изобретения без отступления от сущности и предмета настоящего раскрытия сущности.

Ссылочные материалы

[0096] Следующие материалы содержатся по ссылке в данном документе.

[1] 3GPP Technical Specification 26.190, "Adaptive Multi-Rate - Wideband (AMR-WB) speech codec; Transcoding functions", июль 2005 года; http://www.3gpp.org.

[2] ITU-T Recommendation G.729 "Coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear prediction (CS-ACELP)", 01.2007 года.

1. Способ, реализуемый в кодере звуковых сигналов для преобразования параметров линейной прогнозирующей (LP) фильтрации из первой внутренней частоты S1 дискретизации кодера во вторую внутреннюю частоту S2 дискретизации кодера, при этом способ содержит этапы, на которых:

- вычисляют на внутренней частоте S1 дискретизации спектр мощности синтезирующего LP-фильтра с использованием параметров LP-фильтрации;

- модифицируют спектр мощности синтезирующего LP-фильтра, чтобы преобразовать его из внутренней частоты S1 дискретизации во внутреннюю частоту S2 дискретизации;

- обратно преобразуют модифицированный спектр мощности синтезирующего LP-фильтра, чтобы определить автокорреляции синтезирующего LP-фильтра на внутренней частоте S2 дискретизации; и

- используют автокорреляции, чтобы вычислить параметры LP-фильтрации на внутренней частоте S2 дискретизации.

2. Способ по п. 1, в котором модификация спектра мощности синтезирующего LP-фильтра, чтобы преобразовать его из внутренней частоты S1 дискретизации во внутреннюю частоту S2 дискретизации, содержит этапы, на которых:

- если S1 меньше S2, расширяют спектр мощности синтезирующего LP-фильтра на основе отношения между S1 и S2;

- если S1 превышает S2, усекают спектр мощности синтезирующего LP-фильтра на основе отношения между S1 и S2.

3. Способ по п. 1, в котором преобразование параметров LP-фильтрации выполняют, когда кодер переключается с кадра обработки звукового сигнала, использующего внутреннюю частоту S1 дискретизации, на кадры обработки звукового сигнала, использующие внутреннюю частоту S2 дискретизации.

4. Способ по п. 3, содержащий этап, на котором вычисляют параметры LP-фильтрации в каждом субкадре текущего кадра обработки звукового сигнала посредством интерполяции параметров LP-фильтрации текущего кадра на внутренней частоте S2 дискретизации параметрами LP-фильтрации предыдущего кадра обработки звукового сигнала, преобразованными из внутренней частоты S1 дискретизации во внутреннюю частоту S2 дискретизации.

5. Способ по п. 4, содержащий этап, на котором принудительно переводят текущий кадр в режим кодирования, который не использует историю адаптивной кодовой книги.

6. Способ по п. 4, содержащий этап, на котором инструктируют квантователю LP-параметров использовать способ непрогнозирующего квантования в текущем кадре.

7. Способ по п. 1, в котором спектр мощности синтезирующего LP-фильтра является дискретным спектром мощности.

8. Способ по п. 1, содержащий этапы, на которых:

- вычисляют спектр мощности синтезирующего LP-фильтра при K выборках;

- расширяют спектр мощности синтезирующего LP-фильтра до K(S2/S1) выборок, когда внутренняя частота S1 дискретизации меньше внутренней частоты S2 дискретизации; и

- усекают спектр мощности синтезирующего LP-фильтра до K(S2/S1) выборок, когда внутренняя частота S1 дискретизации превышает внутреннюю частоту S2 дискретизации.

9. Способ по п. 1, содержащий этап, на котором вычисляют спектр мощности синтезирующего LP-фильтра в качестве энергии частотной характеристики синтезирующего LP-фильтра.

10. Способ по п. 1, содержащий этап, на котором обратно преобразуют модифицированный спектр мощности синтезирующего LP-фильтра посредством использования обратного дискретного преобразования Фурье.

11. Способ по п. 1, содержащий этап, на котором выполняют поиск в фиксированной кодовой книге с использованием сокращенного числа итераций.

12. Способ, реализуемый в декодере звуковых сигналов для преобразования принимаемых параметров линейной прогнозирующей (LP) фильтрации из первой внутренней частоты S1 дискретизации декодера во вторую внутреннюю частоту S2 дискретизации декодера, при этом способ содержит этапы, на которых:

- вычисляют на внутренней частоте S1 дискретизации спектр мощности синтезирующего LP-фильтра с использованием принимаемых параметров LP-фильтрации;

- модифицируют спектр мощности синтезирующего LP-фильтра, чтобы преобразовать его из внутренней частоты S1 дискретизации во внутреннюю частоту S2 дискретизации;

- обратно преобразуют модифицированный спектр мощности синтезирующего LP-фильтра, чтобы определить автокорреляции синтезирующего LP-фильтра на внутренней частоте S2 дискретизации; и

- используют автокорреляции, чтобы вычислить параметры LP-фильтрации на внутренней частоте S2 дискретизации.

13. Способ по п. 12, в котором модификация спектра мощности синтезирующего LP-фильтра, чтобы преобразовать его из внутренней частоты S1 дискретизации во внутреннюю частоту S2 дискретизации, содержит этапы, на которых:

- если S1 меньше S2, расширяют спектр мощности синтезирующего LP-фильтра на основе отношения между S1 и S2;

- если S1 превышает S2, усекают спектр мощности синтезирующего LP-фильтра на основе отношения между S1 и S2.

14. Способ по п. 12, в котором преобразование принимаемых параметров LP-фильтрации выполняют, когда декодер переключается с кадра обработки звукового сигнала, использующего частоту S1 дискретизации, на кадр обработки звукового сигнала, использующий частоту S2 дискретизации.

15. Способ по п. 14, содержащий этап, на котором вычисляют параметры LP-фильтрации в каждом субкадре текущего кадра обработки звукового сигнала посредством интерполяции параметров LP-фильтрации текущего кадра на внутренней частоте S2 дискретизации параметрами LP-фильтрации предыдущего кадра обработки звукового сигнала, преобразованными из внутренней частоты S1 дискретизации во внутреннюю частоту S2 дискретизации.

16. Способ по п. 12, в котором спектр мощности синтезирующего LP-фильтра является дискретным спектром мощности.

17. Способ по п. 12, содержащий этапы, на которых:

- вычисляют спектр мощности синтезирующего LP-фильтра при K выборках;

- расширяют спектр мощности синтезирующего LP-фильтра до K(S2/S1) выборок, когда внутренняя частота S1 дискретизации меньше внутренней частоты S2 дискретизации; и

- усекают спектр мощности синтезирующего LP-фильтра до K(S2/S1) выборок, когда внутренняя частота S1 дискретизации превышает внутреннюю частоту S2 дискретизации.

18. Способ по п. 12, содержащий этап, на котором вычисляют спектр мощности синтезирующего LP-фильтра в качестве энергии частотной характеристики синтезирующего LP-фильтра.

19. Способ по п. 12, содержащий этап, на котором обратно преобразуют модифицированный спектр мощности синтезирующего LP-фильтра посредством использования обратного дискретного преобразования Фурье.

20. Способ по п. 12, в котором постфильтрация пропускается, чтобы уменьшать сложность декодирования.

21. Устройство для использования в кодере звуковых сигналов для преобразования параметров линейной прогнозирующей (LP) фильтрации из первой внутренней частоты S1 дискретизации кодера во вторую внутреннюю частоту S2 дискретизации кодера, причем устройство содержит:

- по меньшей мере один процессор; и

- запоминающее устройство, соединенное с процессором, и содержащее энергонезависимые инструкции, которые при исполнении побуждают процессор:

- вычислять на внутренней частоте S1 дискретизации спектр мощности синтезирующего LP-фильтра с использованием параметров LP-фильтрации,

- модифицировать спектр мощности синтезирующего LP-фильтра, чтобы преобразовать его из внутренней частоты S1 дискретизации во внутреннюю частоту S2 дискретизации,

- обратно преобразовывать модифицированный спектр мощности синтезирующего LP-фильтра, чтобы определить автокорреляции синтезирующего LP-фильтра на внутренней частоте S2 дискретизации, и

- использовать автокорреляции, чтобы вычислить параметры LP-фильтрации на внутренней частоте S2 дискретизации.

22. Устройство по п. 21, в котором процессор выполнен с возможностью:

- расширять спектр мощности синтезирующего LP-фильтра на основе отношения между S1 и S2, если S1 меньше S2; и

- усекать спектр мощности синтезирующего LP-фильтра на основе отношения между S1 и S2, если S1 превышает S2.

23. Устройство по п. 21 или 22, в котором процессор выполнен с возможностью вычислять параметры LP-фильтрации в каждом субкадре текущего кадра обработки звукового сигнала посредством интерполяции параметров LP-фильтрации текущего кадра на внутренней частоте S2 дискретизации параметрами LP-фильтрации предыдущего кадра обработки звукового сигнала, преобразованными из внутренней частоты S1 дискретизации во внутреннюю частоту S2 дискретизации.

24. Устройство по п. 21, в котором процессор выполнен с возможностью:

- вычислять спектр мощности синтезирующего LP-фильтра при K выборках;

- расширять спектр мощности синтезирующего LP-фильтра до K(S2/S1) выборок, когда внутренняя частота S1 дискретизации меньше внутренней частоты S2 дискретизации; и

- усекать спектр мощности синтезирующего LP-фильтра до K(S2/S1) выборок, когда внутренняя частота S1 дискретизации превышает внутреннюю частоту S2 дискретизации.

25. Устройство по п. 21, в котором процессор выполнен с возможностью вычислять спектр мощности синтезирующего LP-фильтра в качестве энергии частотной характеристики синтезирующего LP-фильтра.

26. Устройство по п. 21, в котором процессор выполнен с возможностью обратно преобразовывать модифицированный спектр мощности синтезирующего LP-фильтра посредством использования обратного дискретного преобразования Фурье.

27. Машиночитаемое энергонезависимое запоминающее устройство, хранящее инструкции с кодом для осуществления при выполнении в процессоре способа по любому из пп. 1-11.

28. Устройство для использования в декодере звуковых сигналов для преобразования принимаемых параметров линейной прогнозирующей (LP) фильтрации из первой внутренней частоты S1 дискретизации декодера во вторую внутреннюю частоту S2 дискретизации декодера, причем устройство содержит:

- по меньшей мере один процессор; и

- запоминающее устройство, соединенное с процессором и содержащее энергонезависимые инструкции, которые при исполнении побуждают процессор:

- вычислять на внутренней частоте S1 дискретизации спектр мощности синтезирующего LP-фильтра с использованием принимаемых параметров LP-фильтрации,

- модифицировать спектр мощности синтезирующего LP-фильтра, чтобы преобразовать его из внутренней частоты S1 дискретизации во внутреннюю частоту S2 дискретизации,

- обратно преобразовывать модифицированный спектр мощности синтезирующего LP-фильтра, чтобы определить автокорреляции синтезирующего LP-фильтра на внутренней частоте S2 дискретизации, и

- использовать автокорреляции, чтобы вычислить параметры LP-фильтрации на внутренней частоте S2 дискретизации.

29. Устройство по п. 28, в котором процессор выполнен с возможностью:

- расширять спектр мощности синтезирующего LP-фильтра на основе отношения между S1 и S2, если S1 меньше S2; и

- усекать спектр мощности синтезирующего LP-фильтра на основе отношения между S1 и S2, если S1 превышает S2.

30. Устройство по п. 28, в котором процессор выполнен с возможностью вычислять параметры LP-фильтрации в каждом субкадре текущего кадра обработки звукового сигнала посредством интерполяции параметров LP-фильтрации текущего кадра на внутренней частоте S2 дискретизации параметрами LP-фильтрации предыдущего кадра обработки звукового сигнала, преобразованными из внутренней частоты S1 дискретизации во внутреннюю частоту S2 дискретизации.

31. Устройство по п. 28, в котором процессор выполнен с возможностью:

- вычислять спектр мощности синтезирующего LP-фильтра при K выборках;

- расширять спектр мощности синтезирующего LP-фильтра до K(S2/S1) выборок, когда внутренняя частота S1 дискретизации меньше внутренней частоты S2 дискретизации; и

- усекать спектр мощности синтезирующего LP-фильтра до K(S2/S1) выборок, когда внутренняя частота S1 дискретизации превышает внутреннюю частоту S2 дискретизации.

32. Устройство по п. 28, в котором процессор выполнен с возможностью вычислять спектр мощности синтезирующего LP-фильтра в качестве энергии частотной характеристики синтезирующего LP-фильтра.

33. Устройство по п. 28, в котором процессор выполнен с возможностью обратно преобразовывать модифицированный спектр мощности синтезирующего LP-фильтра посредством использования обратного дискретного преобразования Фурье.

34. Машиночитаемое энергонезависимое запоминающее устройство, хранящее инструкции с кодом для осуществления при выполнении в процессоре способа по любому из пп. 12-20.



 

Похожие патенты:

Изобретение относится к обработке звука, в частности, к обработке звука с перекрывающимися окнами для анализа или синтеза в цепочке обработки звукового сигнала. Технический результат – повышение качества обработки звукового сигнала.

Изобретение относится к средствам для генерации множества звуковых каналов. Технический результат заключается в повышении гибкости схемы расположения громкоговорителей.

Изобретение относится к средствам для кодирования и декодирования аудиосигнала. Технический результат заключается в создании усовершенствованной концепции кодирования/декодирования аудиоданных, позволяющей уменьшить скорость передачи дополнительной информации для схемы направленного декодирования.

Изобретение относится к средствам для кодирования и декодирования кодированного звукового сигнала. Технический результат заключается в повышении эффективности кодирования звукового сигнала.

Настоящее изобретение относится к обработке аудиосигналов, в частности к способу воспроизведения многоканального аудиосигнала, включающего в себя звуковой сигнал с возвышением в окружении с горизонтальной схемой расположения, тем самым получая параметр рендеринга в соответствии с типом рендеринга и конфигурируя матрицу понижающего микширования.

Изобретение относится к средствам для кодирования аудиосигнала. Технический результат заключается в повышении эффективности кодирования аудиоданных.

Изобретение относится к многоканальным аудиокодеру и аудиодекодеру для формирования кодированного представления многоканального аудиосигнала и двух выходных аудиосигналов на основании кодированного представления.

Изобретение относится к средствам аудиокодирования и аудиодекодирования. Технический результат заключается в повышении эффективности кодирования аудиоданных.

Изобретение относится к акустике, в частности к декодерам звукового сигнала. Устройство содержит средство приема звукового сигнала, которое выполнено с возможностью приема кадров, содержащих звуковую информацию.

Изобретение относится к кодированию и декодированию цифрового звукового сигнала. Технический результат – обеспечение эффективного перехода от кодирования или декодирования с преобразованием к кодированию или декодированию с предсказанием.
Изобретение относится к технологиям аудиокодирования. Технический результат заключается в повышении эффективности аудиокодирования.

Изобретение относится к средствам для переключения технологии кодирования при кодировании аудиосигнала. Технический результат заключается в сокращении артефактов на границах кадров и несогласованностей энергии при переключении технологии кодирования.

Изобретение относится к области обработки аудиосигналов. Технический результат заключается в повышении эффективности обработки аудиосигналов.

Изобретение относится к области обработки сигналов. Технический результат заключается в повышении качества генерируемого комфортного шума кадров тишины.

Изобретение относится к средствам для определения режима кодирования и для кодирования/декодирования аудиосигналов. Технический результат заключается в сокращении задержек, вызванных частым изменением режима кодирования.

Изобретение относится к области обработки цифровых сигналов. Технический результат – обеспечение коррекции потери кадров посредством использования спектральных компонент на последних достоверных кадрах.

Изобретение относится к средствам для кодирования аудио. Технический результат заключается в повышении качества кодирования аудио.

Изобретение относится к кодированию аудиосигнала. Технический результат изобретения заключается в возможности поддерживать качество речи при уменьшении скорости передачи битов.

Изобретение относится к средствам для кодирования и декодирования аудиосигнала. Технический результат заключается в повышении качества кодируемого звука при низких скоростях передачи битов.

Изобретение относится к области кодирования аудио и речи. Технический результат – обеспечение эффективного сокращения объема вычислений при преобразовании коэффициентов линейного предсказания.
Наверх