Устройство и способ для выбора режима генерирования комфортного шума

Изобретение относится к средствам для кодирования аудиоинформации. Технический результат заключается в повышении эффективности кодирования. Декодируют кодированную аудиоинформацию для получения информации режима, кодируемой в пределах кодированной аудиоинформации, при этом информация режима указывает указанный режим генерирования комфортного шума из двух или более режимов генерирования комфортного шума. Генерирование выходного аудиосигнала посредством генерирования, в зависимости от указанного режима генерирования комфортного шума, комфортного шума. Первый из двух или более режимов генерирования комфортного шума является режимом генерирования комфортного шума частотной области. Если указанный режим генерирования комфортного шума является режимом генерирования комфортного шума в частотной области, комфортный шум генерируется в частотной области и осуществляется частотно-временное преобразование комфортного шума, сформированного в частотной области. 7 н. и 9 з.п. ф-лы, 5 ил.

 

Настоящее изобретение относится к декодированию, обработке и кодированию аудиосигналов, и в частности, к устройству и способу для выбора режима генерирования комфортного шума.

Речевые и аудио кодеки связи (например, AMR-WB, G.718) в общем, включают в себя схему прерывистой передачи (DTX) и алгоритм генерирования комфортного шума (CNG). Операция DTX/CNG используется для сокращения скорости передачи посредством моделирования фонового шума во время неактивных периодов сигналов.

Например, CNG может быть реализовано несколькими способами.

Самый распространенный способ, используемый в кодеках, таких как AMR-WB (ITU-T G.722.2, приложение A) и G.718 (ITU-T G.718, раздел 6.12 и 7.12), основан на модели возбуждение+линейное предсказание (LP). Сначала генерируется сигнал случайного возбуждения, затем масштабируется усилением и в конечном счете синтезируется с использованием обратного фильтра LP, производя сигнал CNG временной области. Двумя главными передаваемыми параметрами являются энергия возбуждения и коэффициенты LP (в общем, с использованием представления LSF или ISF). Этот способ здесь упоминается как LP-CNG.

Другой способ, предлагаемый в последнее время и описанный, например, в заявке на патент WO2014/096279, " Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals ", основан на представлении частотной области (FD) фонового шума. Случайный шум генерируется в частотной области (например, FFT, MDCT, QMF), затем формируется с использованием представления FD фонового шума, и в конечном счете преобразуется из частотной во временную область, формируя сигнал CNG временной области. Двумя главными передаваемыми параметрами являются общее усиление и набор из уровней шума полосы. Этот способ здесь упоминается как FD-CNG.

Задача настоящего изобретения заключается в том, чтобы обеспечить улучшенные концепции для генерирования комфортного шума. Задача настоящего изобретения решается устройством по пункту 1, устройством по пункту 10, системой по пункту 13, способом по пункту 14, способом по пункту 15 и компьютерной программой по пункту 16.

Обеспечено устройство для кодирования аудиоинформации. Устройство для кодирования аудиоинформации содержит селектор для выбора режима генерирования комфортного шума из двух или более режимов генерирования комфортного шума в зависимости от характеристики фонового шума входного аудиосигнала, и блок кодирования для кодирования аудиоинформации, при этом аудиоинформация содержит информацию режима, указывающую выбранный режим генерирования комфортного шума.

Между прочим, варианты осуществления основаны на знании того, что FD-CNG предоставляет лучшее качество в отношении сигналов фонового шума с высоким наклоном, таких как, например шум автомобиля, в то время как LP-CNG предоставляет лучшее качество в отношении более спектрально-ровных сигналов фонового шума, например, шума в офисе.

Чтобы получить наилучшее возможное качество из системы DTX/CNG, согласно вариантам осуществления используются оба подхода CNG и один из них выбирается в зависимости от характеристик фонового шума.

Варианты осуществления обеспечивают селектор, который решает, какой режим CNG должен быть использован, например, или LP-CNG, или FD-CNG.

Согласно варианту осуществления селектор, например, может быть сконфигурирован с возможностью определения наклона фонового шума входного аудиосигнала в качестве характеристики фонового шума. Селектор, например, может быть сконфигурирован с возможностью выбора упомянутого режима генерирования комфортного шума из двух или более режимов генерирования комфортного шума в зависимости от определенного наклона.

В варианте осуществления устройство, например, может дополнительно содержать модуль оценки шума для оценки из расчета на полосу фонового шума для каждой из множества полос частот. Селектор, например, может быть сконфигурирован с возможностью определения наклона в зависимости от оцененного фонового шума упомянутого множества полос частот.

Согласно варианту осуществления модуль оценки шума, например, может быть сконфигурирован с возможностью оценки из расчета на полосу фонового шума посредством оценки энергии фонового шума каждой из множества полос частот.

В варианте осуществления модуль оценки шума, например, может быть сконфигурирован с возможностью определения значения низкочастотного фонового шума, указывающего первую энергию фонового шума для первой группы упомянутого множества полос частот в зависимости от оценки из расчета на полосу фонового шума каждой полосы частот из упомянутой первой группы упомянутого множества полос частот.

Более того, в таком варианте осуществления модуль оценки шума, например, может быть сконфигурирован с возможностью определения значения высокочастотного фонового шума, указывающего вторую энергию фонового шума для второй группы упомянутого множества полос частот в зависимости от оценки из расчета на полосу фонового шума каждой полосы частот из упомянутой второй группы упомянутого множества полос частот. Например, по меньшей мере одна полоса частот из первой группы может иметь более низкую центральную частоту, чем центральная частота по меньшей мере одной полосы частот из второй группы. Например, в конкретном варианте осуществления каждая полоса частот из первой группы может иметь более низкую центральную частоту, чем центральная частота каждой полосы частот из второй группы.

Кроме того, селектор, например, может быть сконфигурирован с возможностью определения наклона в зависимости от значения низкочастотного фонового шума и в зависимости от значения высокочастотного фонового шума.

Согласно варианту осуществления модуль оценки шума, например, может быть сконфигурирован с возможностью определения значения L низкочастотного фонового шума согласно

при этом i указывает i-ю полосу частот из упомянутой первой группы полос частот, при этом I1 указывает первую полосу из упомянутого множества полос частот, при этом I2 указывает вторую полосу из упомянутого множества полос частот, и при этом N[i] указывает оценку энергии у энергии фонового шума i-й полосы частот.

В варианте осуществления модуль оценки шума, например, может быть сконфигурирован с возможностью определения значения H высокочастотного фонового шума согласно

при этом i указывает i-ю полосу частот из упомянутой второй группы полос частот, при этом I3 указывает третью полосу из упомянутого множества полос частот, при этом I4 указывает четвертую полосу из упомянутого множества полос частот, и при этом N[i] указывает оценку энергии у энергии фонового шума i-й полосы частот.

Согласно варианту осуществления, селектор, например, может быть сконфигурирован с возможностью определения наклона T в зависимости от значения L низкочастотного фонового шума и в зависимости от значения H высокочастотного фонового шума согласно формуле

,

или согласно формуле

,

или согласно формуле

T=L - H,

или согласно формуле

T=H - L.

В варианте осуществления селектор, например, может быть сконфигурирован с возможностью определения наклона в качестве текущего краткосрочного значения наклона. Более того, селектор, например, может быть сконфигурирован с возможностью определения текущего долгосрочного значения наклона в зависимости от текущего краткосрочного значения наклона и в зависимости от предыдущего долгосрочного значения наклона. Кроме того, селектор, например, может быть сконфигурирован с возможностью выбора одного из двух или более режимов генерирования комфортного шума в зависимости от текущего долгосрочного значения наклона.

Согласно варианту осуществления селектор, например, может быть сконфигурирован с возможностью определения текущего долгосрочного значения TcLT наклона согласно формуле:

TcLT=α TpLT+(1 - α) T,

при этом T является текущим краткосрочным значением наклона, при этом TpLT является упомянутым предыдущим долгосрочным значением наклона, и при этом α является действительным числом с 0 < α < 1.

В варианте осуществления первый из двух или более режимов генерирования комфортного шума, например, может быть режимом генерирования комфортного шума частотной области. Более того, второй из двух или более режимов генерирования комфортного шума, например, может быть режимом генерирования комфортного шума области линейного предсказания. Кроме того, селектор, например, может быть сконфигурирован с возможностью выбора режима генерирования комфортного шума частотной области, если ранее выбранный режим генерирования, являющийся ранее выбранным селектором, является режимом генерирования комфортного шума области линейного предсказания и, если текущее долгосрочное значение наклона больше, чем первое пороговое значение. Более того, селектор, например, может быть сконфигурирован с возможностью выбора режима генерирования комфортного шума области линейного предсказания, если ранее выбранный режим генерирования, являющийся ранее выбранным селектором, является режимом генерирования комфортного шума частотной области и, если текущее долгосрочное значение наклона меньше, чем второе пороговое значение.

Более того, обеспечено устройство для генерирования выходного аудиосигнала на основе принятой кодированной аудиоинформации. Устройство содержит блок декодирования для декодирования кодированной аудиоинформации для получения информации режима, кодируемой в пределах кодированной аудиоинформации, при этом информация режима указывает указанный режим генерирования комфортного шума из двух или более режимов генерирования комфортного шума. Более того, устройство содержит сигнальный процессор для генерирования выходного аудиосигнала посредством генерирования, в зависимости от указанного режима генерирования комфортного шума, комфортного шума.

Согласно варианту осуществления первый из двух или более режимов генерирования комфортного шума, например, может быть режимом генерирования комфортного шума частотной области. Сигнальный процессор, например, может быть сконфигурирован с возможностью, если указанный режим генерирования комфортного шума является режимом генерирования комфортного шума частотной области, генерирования комфортного шума в частотной области и посредством выполнения частотно-временного преобразования комфортного шума, генерируемого в частотной области. Например, в конкретном варианте осуществления сигнальный процессор, например, может быть сконфигурирован с возможностью, если указанный режим генерирования комфортного шума является режимом генерирования комфортного шума частотной области, генерирования комфортного шума посредством генерирования случайного шума в частотной области, посредством формирования случайного шума в частотной области для получения сформированного шума, и посредством преобразования сформированного шума из частотной области во временную область.

В варианте осуществления второй из двух или более режимов генерирования комфортного шума, например, может быть режимом генерирования комфортного шума области линейного предсказания. Сигнальный процессор, например, может быть сконфигурирован с возможностью, если указанный режим генерирования комфортного шума является режимом генерирования комфортного шума области линейного предсказания, генерирования комфортного шума посредством использования фильтра линейного предсказания. Например, в конкретном варианте осуществления сигнальный процессор, например, может быть сконфигурирован с возможностью, если указанный режим генерирования комфортного шума является режимом генерирования комфортного шума области линейного предсказания, генерирования комфортного шума посредством генерирования сигнала случайного возбуждения, посредством масштабирования сигнала случайного возбуждения для получения масштабированного сигнала возбуждения, и посредством синтезирования масштабированного сигнала возбуждения с использованием обратного фильтра LP.

Кроме того, обеспечена система. Система содержит устройство для кодирования аудиоинформации согласно одному из вышеописанных вариантов осуществления, и устройство для генерирования выходного аудиосигнала на основе принятой кодированной аудиоинформации согласно одному из вышеописанных вариантов осуществления. Селектор устройства для кодирования аудиоинформации сконфигурирован с возможностью выбора режима генерирования комфортного шума из двух или более режимов генерирования комфортного шума в зависимости от характеристики фонового шума входного аудиосигнала. Блок кодирования устройства для кодирования аудиоинформации сконфигурирован с возможностью кодирования аудиоинформации, содержащей информацию режима, указывающую выбранный режим генерирования комфортного шума в качестве указанного режима генерирования комфортного шума, для получения кодированной аудиоинформации. Более того, блок декодирования устройства для генерирования выходного аудиосигнала сконфигурирован с возможностью приема кодированной аудиоинформации, и кроме того, сконфигурирован с возможностью декодирования кодированной аудиоинформации для получения информации режима, кодируемой в пределах кодированной аудиоинформации. Сигнальный процессор устройства для генерирования выходного аудиосигнала сконфигурирован с возможностью генерирования выходного аудиосигнала посредством генерирования, в зависимости от указанного режима генерирования комфортного шума, комфортного шума.

Более того, обеспечен способ для кодирования аудиоинформации. Способ содержит:

- Выбор режима генерирования комфортного шума из двух или более режимов генерирования комфортного шума в зависимости от характеристики фонового шума входного аудиосигнала. И:

- Кодирование аудиоинформации, при этом аудиоинформация содержит информацию режима, указывающую выбранный режим генерирования комфортного шума.

Кроме того, обеспечен способ для генерирования выходного аудиосигнала на основе принятой кодированной аудиоинформации. Способ содержит:

- Декодирование кодированной аудиоинформации для получения информации режима, кодируемой в пределах кодированной аудиоинформации, при этом информация режима указывает указанный режим генерирования комфортного шума из двух или более режимов генерирования комфортного шума. И:

- Генерирование выходного аудиосигнала посредством генерирования, в зависимости от указанного режима генерирования комфортного шума, комфортного шума.

Более того, обеспечивается компьютерная программа для реализации вышеописанного способа, когда исполняется на компьютере или сигнальном процессоре.

Итак, в некоторых вариантах осуществления предложенный селектор, например, может быть преимущественно основан на наклоне фонового шума. Например, если наклон фонового шума является высоким, тогда выбирается FD-CNG, иначе выбирается LP-CNG.

Сглаженная версия наклона фонового шума и гистерезис, например, могут быть использованы, чтобы избегать частого переключения из одного режима в другой.

Наклон фонового шума, например, может быть оценен с использованием соотношения энергии фонового шума в низких частотах и энергии фонового шума в высоких частотах.

Энергия фонового шума, например, может быть оценена в частотной области с использованием модуля оценки шума.

В дальнейшем варианты осуществления настоящего изобретения описаны более подробно со ссылками на чертежи, на которых:

Фиг. 1 иллюстрирует устройство для кодирования аудиоинформации согласно варианту осуществления,

Фиг. 2 иллюстрирует устройство для кодирования аудиоинформации согласно другому варианту осуществления,

Фиг. 3 иллюстрирует поэтапный подход для выбора режима генерирования комфортного шума согласно варианту осуществления,

Фиг. 4 иллюстрирует устройство для генерирования выходного аудиосигнала на основе принятой кодированной аудиоинформации согласно варианту осуществления, и

Фиг. 5 иллюстрирует систему согласно варианту осуществления.

Фиг. 1 иллюстрирует устройство для кодирования аудиоинформации согласно варианту осуществления.

Устройство для кодирования аудиоинформации содержит селектор 110 для выбора режима генерирования комфортного шума из двух или более режимов генерирования комфортного шума в зависимости от характеристики фонового шума входного аудиосигнала.

Более того, устройство содержит блок 120 кодирования для кодирования аудиоинформации, при этом аудиоинформация содержит информацию режима, указывающую выбранный режим генерирования комфортного шума.

Например, первый из двух или более режимов генерирования комфортного шума, например, может быть режимом генерирования комфортного шума частотной области. И/или, например, второй из двух или более режимов генерирования, например, может быть режимом генерирования комфортного шума области линейного предсказания.

Например, если на стороне декодера принимается кодированная аудиоинформация, при этом информация режима, кодируемая в пределах кодированной аудиоинформации, указывает, что выбранный режим генерирования комфортного шума является режимом генерирования комфортного шума частотной области, тогда сигнальный процессор на стороне декодера, например, может генерировать комфортный шум посредством генерирования случайного шума в частотной области, посредством формирования случайного шума в частотной области для получения сформированного шума, и посредством преобразования сформированного шума из частотной области во временную область.

Однако, если например, информация режима, кодируемая в пределах кодированной аудиоинформации, указывает, что выбранный режим генерирования комфортного шума является режимом генерирования комфортного шума области линейного предсказания, тогда сигнальный процессор на стороне декодера, например, может генерировать комфортный шум посредством генерирования сигнала случайного возбуждения, посредством масштабирования сигнала случайного возбуждения для получения масштабированного сигнала возбуждения, и посредством синтезирования масштабированного сигнала возбуждения с использованием обратного фильтра LP.

В пределах кодированной аудиоинформации может быть кодирована не только информация о режиме генерирования комфортного шума, но также дополнительная информация. Например, специфические для полосы частот коэффициенты усиления также могут быть кодированы, например, один коэффициент усиления для каждой полосы частот. Или, например, один или более коэффициентов фильтра LP или коэффициентов LSF или коэффициентов ISF, например, могут быть кодированы в пределах кодированной аудиоинформации. Информация о выбранном режиме генерирования комфортного шума и дополнительная информация, кодируемая в пределах кодированной аудиоинформации, например, затем может быть передана на сторону декодера, например, в пределах кадра SID (SID=дескриптора вставки тишины).

Информация о выбранном режиме генерирования комфортного шума может быть кодирована явно или неявно.

Если выбранный режим генерирования комфортного шума кодируется явным образом, тогда один или более битов, например, могут быть использованы для указания того, какой из двух или более режимов генерирования комфортного шума является выбранным режимом генерирования комфортного шума. В таком варианте осуществления упомянутый один или более битов затем являются кодированной информацией режима.

Однако в других вариантах осуществления выбранный режим генерирования комфортного шума неявно кодируется в пределах аудиоинформации. Например, в вышеупомянутом примере специфические для полосы частот коэффициенты усиления и один или более коэффициентов LP (или LSF, или ISF), например, могут иметь различный формат данных или, например, могут иметь различную длину в битах. Если, например, специфические для полосы частот коэффициенты усиления кодируются в пределах аудиоинформации, это, например, может указывать, что режим генерирования комфортного шума частотной области является выбранным режимом генерирования комфортного шума. Однако, если один или более коэффициентов LP (или LSF, или ISF) кодируются в пределах аудиоинформации, это, например, может указывать, что режим генерирования комфортного шума области линейного предсказания является выбранным режимом генерирования комфортного шума. Когда используется такое неявное кодирование, тогда специфические для полосы частот коэффициенты усиления или один или более коэффициентов LP (или LSF, или ISF) представляют информацию режима, кодируемую в пределах кодированного аудиосигнала, при этом эта информация режима указывает выбранный режим генерирования комфортного шума.

Согласно варианту осуществления селектор 110, например, может быть сконфигурирован с возможностью определения наклона фонового шума входного аудиосигнала в качестве характеристики фонового шума. Селектор 110, например, может быть сконфигурирован с возможностью выбора упомянутого режима генерирования комфортного шума из двух или более режимов генерирования комфортного шума в зависимости от определенного наклона.

Например, может быть использовано значение низкочастотного фонового шума и значение высокочастотного фонового шума, и например наклон фонового шума может быть вычислен в зависимости от значения низкочастотного фонового шума и в зависимости от значения высокочастотного фонового шума.

Фиг. 2 иллюстрирует устройство для кодирования аудиоинформации согласно дополнительному варианту осуществления. Устройство с Фиг. 2 дополнительно содержит модуль 105 оценки шума для оценки из расчета на полосу фонового шума для каждой из множества полос частот. Селектор 110, например, может быть сконфигурирован с возможностью определения наклона в зависимости от оцененного фонового шума упомянутого множества полос частот.

Согласно варианту осуществления модуль 105 оценки шума, например, может быть сконфигурирован с возможностью оценки из расчета на полосу фонового шума посредством оценки энергии фонового шума каждой из множества полос частот.

В варианте осуществления модуль 105 оценки шума, например, может быть сконфигурирован с возможностью определения значения низкочастотного фонового шума, указывающего первую энергию фонового шума для первой группы упомянутого множества полос частот в зависимости от оценки из расчета на полосу фонового шума каждой полосы частот из упомянутой первой группы упомянутого множества полос частот.

Более того, модуль 105 оценки шума, например, может быть сконфигурирован с возможностью определения значения высокочастотного фонового шума, указывающего вторую энергию фонового шума для второй группы упомянутого множества полос частот в зависимости от оценки из расчета на полосу фонового шума каждой полосы частот из упомянутой второй группы упомянутого множества полос частот. Например, по меньшей мере одна полоса частот из первой группы может иметь более низкую центральную частоту, чем центральная частота по меньшей мере одной полосы частот из второй группы. Например, в конкретном варианте осуществления каждая полоса частот из первой группы может иметь более низкую центральную частоту, чем центральная частота каждой полосы частот из второй группы.

Кроме того, селектор 110, например, может быть сконфигурирован с возможностью определения наклона в зависимости от значения низкочастотного фонового шума и в зависимости от значения высокочастотного фонового шума.

Согласно варианту осуществления модуль 105 оценки шума, например, может быть сконфигурирован с возможностью определения значения L низкочастотного фонового шума согласно

при этом i указывает i-ю полосу частот из упомянутой первой группы полос частот, при этом I1 указывает первую полосу из упомянутого множества полос частот, при этом I2 указывает вторую полосу из упомянутого множества полос частот, и при этом N[i] указывает оценку энергии у энергии фонового шума i-й полосы частот.

Аналогичным образом, в варианте осуществления модуль 105 оценки шума, например, может быть сконфигурирован с возможностью определения значения H высокочастотного фонового шума согласно

при этом i указывает i-ю полосу частот из упомянутой второй группы полос частот, при этом I3 указывает третью полосу из упомянутого множества полос частот, при этом I4 указывает четвертую полосу из упомянутого множества полос частот, и при этом N[i] указывает оценку энергии у энергии фонового шума i-й полосы частот.

Согласно варианту осуществления, селектор 110, например, может быть сконфигурирован с возможностью определения наклона T в зависимости от значения L низкочастотного фонового шума и в зависимости от значения H высокочастотного фонового шума согласно формуле:

,

или согласно формуле

,

или согласно формуле

T=L - H,

или согласно формуле

T=H - L.

Например, когда L и H представлены в логарифмической области, может быть использована одна из формул вычитания (T=L - H или T=H - L).

В варианте осуществления селектор 110, например, может быть сконфигурирован с возможностью определения наклона в качестве текущего краткосрочного значения наклона. Более того, селектор 110, например, может быть сконфигурирован с возможностью определения текущего долгосрочного значения наклона в зависимости от текущего краткосрочного значения наклона и в зависимости от предыдущего долгосрочного значения наклона. Кроме того, селектор 110, например, может быть сконфигурирован с возможностью выбора одного из двух или более режимов генерирования комфортного шума в зависимости от текущего долгосрочного значения наклона.

Согласно варианту осуществления селектор 110, например, может быть сконфигурирован с возможностью определения текущего долгосрочного значения TcLT наклона согласно формуле:

TcLT=α TpLT+(1 - α) T,

при этом T является текущим краткосрочным значением наклона, при этом TpLT является упомянутым предыдущим долгосрочным значением наклона, и при этом α является действительным числом с 0 < α < 1.

В варианте осуществления первый из двух или более режимов генерирования комфортного шума, например, может быть режимом генерирования комфортного шума частотной области FD_CNG. Более того, второй из двух или более режимов генерирования комфортного шума, например, может быть режимом генерирования комфортного шума области линейного предсказания LP_CNG. Селектор 110, например, может быть сконфигурирован с возможностью выбора режима генерирования комфортного шума частотной области FD_CNG, если ранее выбранный режим генерирования cng_mode_prev, являющийся ранее выбранным селектором 110, является режимом генерирования комфортного шума области линейного предсказания LP_CNG и, если текущее долгосрочное значение наклона больше, чем первое пороговое значение thr1. Более того, селектор 110, например, может быть сконфигурирован с возможностью выбора режима генерирования комфортного шума области линейного предсказания LP_CNG, если ранее выбранный режим генерирования cng_mode_prev, являющийся ранее выбранным селектором 110, является режимом генерирования комфортного шума частотной области FD_CNG и, если текущее долгосрочное значение наклона меньше, чем второе пороговое значение thr2.

В некоторых вариантах осуществления первое пороговое значение является равным второму пороговому значению. Однако, в некоторых других вариантах осуществления первое пороговое значение отличается от второго порогового значения.

Фиг. 4 иллюстрирует устройство для генерирования выходного аудиосигнала на основе принятой кодированной аудиоинформации согласно варианту осуществления.

Устройство содержит блок 210 декодирования для декодирования кодированной аудиоинформации для получения информации режима, кодируемой в пределах кодированной аудиоинформации. Информация режима указывает указанный режим генерирования комфортного шума из двух или более режимов генерирования комфортного шума.

Более того, устройство содержит сигнальный процессор 220 для генерирования выходного аудиосигнала посредством генерирования, в зависимости от указанного режима генерирования комфортного шума, комфортного шума.

Согласно варианту осуществления первый из двух или более режимов генерирования комфортного шума, например, может быть режимом генерирования комфортного шума частотной области. Сигнальный процессор 220, например, может быть сконфигурирован с возможностью, если указанный режим генерирования комфортного шума является режимом генерирования комфортного шума частотной области, генерирования комфортного шума в частотной области и посредством выполнения частотно-временного преобразования комфортного шума, генерируемого в частотной области. Например, в конкретном варианте осуществления сигнальный процессор, например, может быть сконфигурирован с возможностью, если указанный режим генерирования комфортного шума является режимом генерирования комфортного шума частотной области, генерирования комфортного шума посредством генерирования случайного шума в частотной области, посредством формирования случайного шума в частотной области для получения сформированного шума, и посредством преобразования сформированного шума из частотной области во временную область.

Например, могут быть использованы концепции, описанные в WO 2014/096279 A1.

Например, случайный генератор может быть применен для возбуждения каждой индивидуальной спектральной полосы в области FFT и/или в области QMF посредством генерирования одной или более случайных последовательностей (FFT=быстрое преобразование Фурье; QMF=квадратурный зеркальный фильтр). Формирование случайного шума, например, может быть выполнено посредством индивидуального вычисления амплитуды случайных последовательностей в каждой полосе таким образом, что спектр сгенерированного комфортного шума становится похожим на спектр фактического текущего фонового шума, например, в битовом потоке, содержащем, например, входной аудиосигнал. Затем, например, вычисленная амплитуда, например, может быть применена в отношении случайной последовательности, например, посредством умножения случайной последовательности на вычисленную амплитуду в каждой полосе частот. Затем, может быть использовано преобразование сформированного шума из частотной области во временную область.

В варианте осуществления второй из двух или более режимов генерирования комфортного шума, например, может быть режимом генерирования комфортного шума области линейного предсказания. Сигнальный процессор 220, например, может быть сконфигурирован с возможностью, если указанный режим генерирования комфортного шума является режимом генерирования комфортного шума области линейного предсказания, генерирования комфортного шума посредством использования фильтра линейного предсказания. Например, в конкретном варианте осуществления сигнальный процессор, например, может быть сконфигурирован с возможностью, если указанный режим генерирования комфортного шума является режимом генерирования комфортного шума области линейного предсказания, генерирования комфортного шума посредством генерирования сигнала случайного возбуждения, посредством масштабирования сигнала случайного возбуждения для получения масштабированного сигнала возбуждения, и посредством синтезирования масштабированного сигнала возбуждения с использованием обратного фильтра LP.

Например, может быть использовано генерирование комфортного шума, как описано в G.722.2 (см. ITU-T G.722.2, приложение A) и/или как описано в G.718 (см. ITU-T G.718, раздел 6.12 и 7.12). Такое генерирование комфортного шума в области случайного возбуждения посредством масштабирования сигнала случайного возбуждения для получения масштабированного сигнала возбуждения, и посредством синтезирования масштабированного сигнала возбуждения с использованием обратного фильтра LP хорошо известно специалисту в данной области техники.

Фиг. 5 иллюстрирует систему согласно варианту осуществления. Система содержит устройство 100 для кодирования аудиоинформации согласно одному из вышеописанных вариантов осуществления, и устройство 200 для генерирования выходного аудиосигнала на основе принятой кодированной аудиоинформации согласно одному из вышеописанных вариантов осуществления.

Селектор 110 устройства 100 для кодирования аудиоинформации сконфигурирован с возможностью выбора режима генерирования комфортного шума из двух или более режимов генерирования комфортного шума в зависимости от характеристики фонового шума входного аудиосигнала. Блок 120 кодирования устройства 100 для кодирования аудиоинформации сконфигурирован с возможностью кодирования аудиоинформации, содержащей информацию режима, указывающую выбранный режим генерирования комфортного шума в качестве указанного режима генерирования комфортного шума, для получения кодированной аудиоинформации.

Более того, блок 210 декодирования устройства 200 для генерирования выходного аудиосигнала сконфигурирован с возможностью приема кодированной аудиоинформации, и кроме того сконфигурирован с возможностью декодирования кодированной аудиоинформации для получения информации режима, кодируемой в пределах кодированной аудиоинформации. Сигнальный процессор 220 устройства 200 для генерирования выходного аудиосигнала сконфигурирован с возможностью генерирования выходного аудиосигнала посредством генерирования, в зависимости от указанного режима генерирования комфортного шума, комфортного шума.

Фиг. 3 иллюстрирует поэтапный подход для выбора режима генерирования комфортного шума согласно варианту осуществления.

На этапе 310 модуль оценки шума используется для оценки энергии фонового шума в частотной области. Это, в общем, выполняется на основе из расчета на полосу, производя одну оценку энергии на полосу

Может быть использован какой-либо модуль оценки шума, производящий оценку из расчета на полосу энергии фонового шума. Одним примером является модуль оценки шума, используемый в G.718 (ITU-T G.718, раздел 6.7).

На этапе 320 энергия фонового шума в низких частотах вычисляется с использованием

с и может зависеть от ширины полосы частот сигнала, например, для NB и для WB.

L может учитываться как значение низкочастотного фонового шума, как описано выше по тексту.

На этапе 330 энергия фонового шума в высоких частотах вычисляется с использованием

с и может зависеть от ширины полосы частот сигнала, например, для NB и для WB.

H может учитываться как значение высокочастотного фонового шума, как описано выше по тексту.

Этапы 320 и 330, например, могут быть выполнены позднее или независимо друг от друга.

На этапе 340 наклон фонового шума вычисляется с использованием

Некоторые варианты осуществления, например, могут переходить к этапу 350. На этапе 350 наклон фонового шума сглаживается, производя долгосрочную версию наклона фонового шума

например, с равным 0,9. В этом рекурсивном уравнении TLT с левой стороны знака равенства является текущим долгосрочным значением TcLT наклона, упомянутым выше по тексту, и TLT с правой стороны знака равенства является упомянутым предыдущим долгосрочным значением TpLT наклона, упомянутым выше по тексту.

В конечном счете, на этапе 360 режим CNG выбирается с использованием следующего классификатора с гистерезисом

при этом и может зависеть от ширины полосы, например, для NB и для WB.

cng_mode является режимом генерирования комфортного шума, который (в настоящий момент) выбран селектором 110.

cng_mode_prev является ранее выбранным режимом генерирования (комфортного шума), который ранее был выбран селектором 110.

То, что случается, когда ни одно из вышеуказанный условий этапа 360 не выполняется, зависит от реализации. Например, в варианте осуществления, если ни одно из обоих условий этапа 360 не выполняется, режим CNG может остаться таким же, каким он был, так что

cng_mode=cng_mode_prev.

Другие варианты осуществления могут реализовывать другие стратегии выбора.

В то время как в варианте осуществления с Фиг. 3 thr1 отличается от thr2, в некоторых других вариантах осуществления, однако, thr1 является равным thr2.

Хотя некоторые аспекты были описаны в контексте устройства, понятно, что эти аспекты также представляют собой описание соответствующего способа, где блок или устройство соответствует этапу способа или признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют собой описание соответствующего блока или элемента, или признака соответствующего устройства.

Обладающий признаками изобретения разложенный сигнал может быть сохранен на цифровом носителе данных или может быть передан по передающей среде, такой как беспроводная передающая среда или проводная передающая среда, такая как Интернет.

В зависимости от некоторых требований реализации, варианты осуществления изобретения могут быть реализованы в аппаратном или программном обеспечении. Реализация может быть выполнена с использованием цифрового носителя данных, например, дискеты, DVD, CD, ROM, PROM, EPROM, EEPROM или флэш-памяти, имеющего электронным образом считываемые управляющие сигналы, сохраненные на нем, которые взаимодействуют (или способны взаимодействовать) с программируемой компьютерной системой, так что выполняется соответствующий способ.

Некоторые варианты осуществления согласно изобретению содержат, невременный носитель данных, содержащий электронным образом считываемые управляющие сигналы, которые способны взаимодействовать с программируемой компьютерной системой таким образом, что выполняется один из способов, описанных в этом документе.

В общем, варианты осуществления настоящего изобретения могут быть реализованы в качестве компьютерного программного продукта с программным кодом, причем программный код действует для выполнения одного из способов, когда компьютерный программный продукт исполняется на компьютере. Программный код, например, может быть сохранен на машиночитаемом носителе.

Другие варианты осуществления содержат компьютерную программу для выполнения одного из способов, описанных в этом документе, сохраненную на машиночитаемом носителе.

Другими словами, вариантом осуществления нового способа, следовательно, является компьютерная программа, имеющая программный код для выполнения одного из способов, описанных в этом документе, когда компьютерная программа исполняется на компьютере.

Следовательно, дополнительным вариантом осуществления новых способов является носитель данных (или цифровой носитель данных, или считываемый компьютером носитель), содержащий записанную на нем компьютерную программу для выполнения одного из способов, описанных в этом документе.

Следовательно, дополнительным вариантом осуществления нового способа является поток данных или последовательность сигналов, представляющих компьютерную программу для выполнения одного из способов, описанных в этом документе. Поток данных или последовательность сигналов, например, может быть сконфигурирована с возможностью передачи по соединению связи данных, например, через Интернет.

Дополнительный вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, сконфигурированное или адаптированное с возможностью выполнения одного из способов, описанных в этом документе.

Дополнительный вариант осуществления содержит компьютер, имеющий установленную на нем компьютерную программу для выполнения одного из способов, описанных в этом документе.

В некоторых вариантах осуществления программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может быть использовано для выполнения некоторых или всех функциональных возможностей способов, описанных в этом документе. В некоторых вариантах осуществления программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором для того, чтобы выполнять один из способов, описанных в этом документе. В общем, способы предпочтительно выполняются посредством какого-либо аппаратного устройства.

Описанные выше по тексту варианты осуществления являются просто иллюстративными для принципов настоящего изобретения. Следует понимать, что модификации и вариации компоновок и деталей, описанных в этом документе, будут очевидны для специалистов в данной области техники. Поэтому предполагается, ограничиться только объемом приложенной патентной формулы изобретения и не посредством конкретных деталей, представленных в этом документе в качестве описания и объяснения вариантов осуществления.

1. Устройство для кодирования аудиоинформации, содержащее:

селектор (110) для выбора режима генерирования комфортного шума из двух или более режимов генерирования комфортного шума в зависимости от характеристики фонового шума входного аудиосигнала, и

блок (120) кодирования для кодирования аудиоинформации, при этом аудиоинформация содержит информацию режима, указывающую выбранный режим генерирования комфортного шума,

причем первый из двух или более режимов генерирования комфортного шума является режимом генерирования комфортного шума частотной области и причем режим генерирования комфортного шума частотной области указывает, что комфортный шум должен быть сгенерирован в частотной области и что комфортный шум, сгенерированный в частотной области, должен быть подвергнут частотно-временному преобразованию.

2. Устройство по п. 1,

при этом селектор (110) сконфигурирован с возможностью определения наклона фонового шума входного аудиосигнала в качестве характеристики фонового шума, и

при этом селектор (110) сконфигурирован с возможностью выбора упомянутого режима генерирования комфортного шума из двух или более режимов генерирования комфортного шума в зависимости от определенного наклона.

3. Устройство по п. 2,

при этом устройство дополнительно содержит модуль (105) оценки шума для оценки из расчета на полосу фонового шума для каждой из множества полос частот, и

при этом селектор (110) сконфигурирован с возможностью определения наклона в зависимости от оцененного фонового шума упомянутого множества полос частот.

4. Устройство по п. 3,

при этом модуль (105) оценки шума сконфигурирован с возможностью определения значения низкочастотного фонового шума, указывающего первую энергию фонового шума для первой группы упомянутого множества полос частот в зависимости от оценки из расчета на полосу фонового шума каждой полосы частот из упомянутой первой группы упомянутого множества полос частот,

при этом модуль (105) оценки шума сконфигурирован с возможностью определения значения высокочастотного фонового шума, указывающего вторую энергию фонового шума для второй группы упомянутого множества полос частот в зависимости от оценки из расчета на полосу фонового шума каждой полосы частот из упомянутой второй группы упомянутого множества полос частот, при этом по меньшей мере одна полоса частот из упомянутой первой группы имеет более низкую центральную частоту, чем центральная частота по меньшей мере одной полосы частот из упомянутой второй группы, и

при этом селектор (110) сконфигурирован с возможностью определения наклона в зависимости от значения низкочастотного фонового шума и в зависимости от значения высокочастотного фонового шума.

5. Устройство по п. 4,

при этом модуль (105) оценки шума сконфигурирован с возможностью определения значения L низкочастотного фонового шума согласно

,

при этом i указывает i-ю полосу частот из упомянутой первой группы полос частот, при этом I1 указывает первую полосу из упомянутого множества полос частот, при этом I2 указывает вторую полосу из упомянутого множества полос частот и при этом N[i] указывает оценку энергии у энергии фонового шума i-й полосы частот,

при этом модуль (105) оценки шума сконфигурирован с возможностью определения значения H высокочастотного фонового шума согласно

,

при этом i указывает i-ю полосу частот из упомянутой второй группы полос частот, при этом I3 указывает третью полосу из упомянутого множества полос частот, при этом I4 указывает четвертую полосу из упомянутого множества полос частот и при этом N[i] указывает оценку энергии у энергии фонового шума i-й полосы частот.

6. Устройство по п. 4,

при этом селектор (110) сконфигурирован с возможностью определения наклона T в зависимости от значения L низкочастотного фонового шума и в зависимости от значения H высокочастотного фонового шума согласно формуле

,

или согласно формуле

,

или согласно формуле

T=L - H,

или согласно формуле

T=H - L.

7. Устройство по п. 2,

при этом селектор (110) сконфигурирован с возможностью определения наклона в качестве текущего краткосрочного значения наклона (T),

при этом селектор (110) сконфигурирован с возможностью определения текущего долгосрочного значения наклона в зависимости от текущего краткосрочного значения наклона и в зависимости от предыдущего долгосрочного значения наклона,

при этом селектор (110) сконфигурирован с возможностью выбора одного из двух или более режимов генерирования комфортного шума в зависимости от текущего долгосрочного значения наклона.

8. Устройство по п. 7,

при этом селектор (110) сконфигурирован с возможностью определения текущего долгосрочного значения TcLT наклона согласно формуле:

TcLT=α TpLT+(1 - α) T,

при этом T является текущим краткосрочным значением наклона,

при этом TpLT является упомянутым предыдущим долгосрочным значением наклона и

при этом α является действительным числом с 0 < α < 1.

9. Устройство по п. 7,

при этом первый из двух или более режимов генерирования комфортного шума является режимом генерирования комфортного шума частотной области,

при этом второй из двух или более режимов генерирования комфортного шума является режимом генерирования комфортного шума области линейного предсказания,

при этом селектор (110) сконфигурирован с возможностью выбора режима генерирования комфортного шума частотной области, если ранее выбранный режим генерирования, являющийся ранее выбранным селектором (110), является режимом генерирования комфортного шума области линейного предсказания и если текущее долгосрочное значение наклона больше, чем первое пороговое значение, и

при этом селектор (110) сконфигурирован с возможностью выбора режима генерирования комфортного шума области линейного предсказания, если ранее выбранный режим генерирования, являющийся ранее выбранным селектором (110), является режимом генерирования комфортного шума частотной области и если текущее долгосрочное значение наклона меньше, чем второе пороговое значение.

10. Устройство для генерирования выходного аудиосигнала на основе принятой кодированной аудиоинформации, содержащее:

блок (210) декодирования для декодирования кодированной аудиоинформации для получения информации режима, кодируемой в пределах кодированной аудиоинформации, при этом информация режима указывает указанный режим генерирования комфортного шума из двух или более режимов генерирования комфортного шума, и

сигнальный процессор (220) для генерирования выходного аудиосигнала посредством генерирования, в зависимости от указанного режима генерирования комфортного шума, комфортного шума,

при этом первый из двух или более режимов генерирования комфортного шума является режимом генерирования комфортного шума частотной области, и

при этом сигнальный процессор сконфигурирован с возможностью, если указанный режим генерирования комфортного шума является режимом генерирования комфортного шума частотной области, генерирования комфортного шума в частотной области и посредством выполнения частотно-временного преобразования комфортного шума, генерируемого в частотной области.

11. Устройство по п. 10,

при этом второй из двух или более режимов генерирования комфортного шума является режимом генерирования комфортного шума области линейного предсказания, и

при этом сигнальный процессор (220) сконфигурирован с возможностью, если указанный режим генерирования комфортного шума является режимом генерирования комфортного шума области линейного предсказания, генерирования комфортного шума посредством использования фильтра линейного предсказания.

12. Система для кодирования аудиоинформации и генерирования выходного аудиосигнала, содержащая:

устройство (100) по одному из пп. 1-9 для кодирования аудиоинформации и

устройство (200) по п. 10 или 11 для генерирования выходного аудиосигнала на основе принятой кодированной аудиоинформации,

при этом селектор (110) устройства (100) по одному из пп. 1-9 сконфигурирован с возможностью выбора режима генерирования комфортного шума из двух или более режимов генерирования комфортного шума в зависимости от характеристики фонового шума входного аудиосигнала,

при этом блок (120) кодирования устройства (100) по одному из пп. 1-9 сконфигурирован с возможностью кодирования аудиоинформации, содержащей информацию режима, указывающую выбранный режим генерирования комфортного шума в качестве указанного режима генерирования комфортного шума, для получения кодированной аудиоинформации,

при этом блок (210) декодирования устройства (200) по п. 10 или 11 сконфигурирован с возможностью приема кодированной аудиоинформации и кроме того сконфигурирован с возможностью декодирования кодированной аудиоинформации для получения информации режима, кодируемой в пределах кодированной аудиоинформации, и

при этом сигнальный процессор (220) устройства (200) по п. 10 или 11 сконфигурирован с возможностью генерирования выходного аудиосигнала посредством генерирования, в зависимости от указанного режима генерирования комфортного шума, комфортного шума.

13. Способ для кодирования аудиоинформации, содержащий:

выбор режима генерирования комфортного шума из двух или более режимов генерирования комфортного шума в зависимости от характеристики фонового шума входного аудиосигнала, и

кодирование аудиоинформации, при этом аудиоинформация содержит информацию режима, указывающую выбранный режим генерирования комфортного шума,

причем первый из двух или более режимов генерирования комфортного шума является режимом генерирования комфортного шума частотной области и причем режим генерирования комфортного шума частотной области указывает, что комфортный шум должен быть сгенерирован в частотной области и что комфортный шум, сгенерированный в частотной области, должен быть подвергнут частотно-временному преобразованию.

14. Способ для генерирования выходного аудиосигнала на основе принятой кодированной аудиоинформации, содержащий:

декодирование кодированной аудиоинформации для получения информации режима, кодируемой в пределах кодированной аудиоинформации, при этом информация режима указывает указанный режим генерирования комфортного шума из двух или более режимов генерирования комфортного шума, и

генерирование выходного аудиосигнала посредством генерирования, в зависимости от указанного режима генерирования комфортного шума, комфортного шума,

причем первый из двух или более режимов генерирования комфортного шума является режимом генерирования комфортного шума частотной области, и

причем, если указанный режим генерирования комфортного шума является режимом генерирования комфортного шума в частотной области, комфортный шум генерируется в частотной области и осуществляется частотно-временное преобразование комфортного шума, сформированного в частотной области.

15. Цифровой носитель данных, содержащий компьютерную программу для реализации способа по п. 13 при исполнении на компьютере или сигнальном процессоре.

16. Цифровой носитель данных, содержащий компьютерную программу для реализации способа по п. 14 при исполнении на компьютере или сигнальном процессоре.



 

Похожие патенты:

Изобретение относится к области технологии прямой видеотрансляции. Техническим результатом является обеспечение прямой трансляции игры через мобильный телефон.

Изобретение относится к средствам для кодирования аудиосигналов. Технический результат заключается в повышении эффективности кодирования аудио.

Изобретение относится к средствам для расширения диапазона частот для акустических сигналов. Технический результат заключается в повышении эффективности расширения диапазона частот входных сигналов для повышения качества аудио.

Изобретение относится к средствам для подавления шума. Технический результат заключается в повышении эффективности подавления шума.

Изобретение относится к области обработки звуковых сигналов. Технический результат заключается в повышении качества обработки звукового сигнала при расширении частотного диапазона звукового сигнала.

Изобретение относится к области техники передачи и трансляции речевой информации. Технический результат заключается в повышении точности определения момента появления и увеличении значения вероятности правильного решения о появлении речевого сигнала при наличии акустического шума.

Изобретение относится к обнаружению голосовой активности (VAD). Технический результат – увеличение точности обнаружения кадров речевой неактивности до и после голосовых сегментов.

Изобретение относится к средствам для кодирования многоканального аудиосигнала. Технический результат заключается в повышении эффективности кодирования аудиосигнала.

Изобретение относится к средствам для кодирования и декодирования речи. Технический результат заключается в уменьшении опережающего и запаздывающего эха.

Изобретение относится к средствам для кодирования и декодирования многоканального аудиосигнала. Технический результат заключается в повышении эффективности обработки аудиосигнала.

Изобретение относится к средствам для генерирования кодированного битового аудиопотока. Технический результат заключается в повышении эффективности кодирования аудиоданных.

Изобретение относится к средствам кодирования и декодирования. Технический результат заключается в повышении качества кодированного и декодированного сигналов при пониженной скорости передачи данных.

Изобретение относится к обработке аудиосигналов. Технический результат – оптимизация канального аудиосигнала для среды прослушивания.

Изобретение относится к системам обработки медиаданных и, в частности, к адаптивной обработке медиаданных на основе состояний обработки медиаданных для медиаданных.

Изобретение относится к высокочастотной реконструкции (HFR), усиленной перекрестными произведениями, где новая составляющая с частотой QΩ+rΩ0 генерируется на основе существующих составляющих с частотами Ω и Ω+Ω0.

Изобретение относится к области кодирования аудио и речи. Технический результат – обеспечение эффективного сокращения объема вычислений при преобразовании коэффициентов линейного предсказания.

Изобретение относится к средствам для кодирования и декодирования многоканального сигнала. Технический результат заключается в повышении эффективности кодирования.

Изобретение относится к средствам для кодирования звуковых сигналов, содержащих составляющие разного характера. Технический результат заключается в повышении качества кодирования неоднородного звукового сигнала.

Изобретение относится к средствам для принятия решений относительно управления инструментами фильтрации гармоник. Технический результат заключается в повышении эффективности кодирования.

Изобретение относится к средствам кодирования и декодирования аудио. Технический результат заключается в повышении эффективности кодирования и декодирования аудио.
Наверх