Генерирование комфортного шума с высоким спектрально-временным разрешением при прерывистой передаче аудиосигналов

Изобретение относится к средствам для генерирования комфортного шума с высоким спектрально-временным разрешением. Технический результат заключается в повышении качества аудиосигнала посредством добавления комфортного шума. Декодируют битовый поток для получения из него выходного аудиосигнала. Битовый поток содержит активную фазу, за которой следует неактивная фаза. Битовый поток имеет закодированный в нем кадр дескриптора вставки молчания, который описывает спектр фонового шума. Аудиодекодер содержит декодер дескриптора вставки молчания, выполненный с возможностью декодирования кадра дескриптора вставки молчания для восстановления спектра фонового шума; устройство декодирования, выполненное с возможностью восстановления выходного аудиосигнала из битового потока во время активной фазы; спектральный преобразователь, выполненный с возможностью определения спектра выходного аудиосигнала; устройство оценивателя шума; преобразователь разрешения; устройство оценки спектра комфортного шума и генератор комфортного шума. 4 н. и 15 з.п. ф-лы, 5 ил.

 

Настоящее изобретение относится к обработке аудиосигналов, и в частности к добавлению комфортного шума к аудиосигналам

Генераторы комфортного шума обычно используются при прерывистой передаче (DTX) аудиосигналов, в частности аудиосигналов, содержащих речь. В таком режиме аудиосигнал сначала классифицируется на активные и неактивные кадры детектором голосовой активности (VAD). Основываясь на результате VAD, только активные кадры речи кодируются и передаются с номинальной скоростью передачи в битах. Во время длинных пауз, где присутствует только фоновый шум, скорость передачи в битах понижается или становится равной нулю, и фоновый шум кодируется эпизодически и параметрически, используя кадры дескриптора вставки молчания (кадры SID). Средняя скорость передачи в битах тогда существенно уменьшается.

Шум генерируется во время неактивных кадров на стороне декодера генератором комфортного шума (CNG). На практике размер кадра SID очень ограничен. Поэтому, количество параметров, описывающих фоновый шум, должно поддерживаться максимально малым. С этой целью, оценка шума не применяется непосредственно на выходе спектральных преобразований. Вместо этого, она применяется при более низком спектральном разрешении посредством усреднения входного энергетического спектра среди групп полос, например, по масштабу Барка. Усреднение может достигаться или арифметическим, или геометрическим способом. К сожалению, ограниченное количество параметров, передаваемых в кадрах SID, не позволяет захватывать структуру спектра высокого разрешения фонового шума. Следовательно, только посредством CNG может воспроизводиться только плавная спектральная огибающая шума. Когда VAD запускает кадр CNG, расхождение между плавным спектром восстановленного комфортного шума и спектром фактического фонового шума может стать очень слышимым на переходах между активными кадрами (содержащими нормальное кодирование и декодирование зашумленных участков речи сигнала) и кадрами CNG.

Задачей настоящего изобретения является обеспечение улучшенных принципов обработки аудиосигналов. Более конкретно, задачей настоящего изобретения является обеспечение улучшенных принципов добавления комфортного шума к аудиосигналам. Задача настоящего изобретения достигается посредством аудиодекодера по п. 1 формулы изобретения, системы по п. 17 формулы изобретения, способа по п. 18 формулы изобретения и компьютерной программы по п. 19 формулы изобретения.

В одном аспекте изобретение обеспечивает аудиодекодер, выполненный с возможностью декодирования битового потока для получения из него выходных аудиосигналов, причем битовый поток содержит по меньшей мере активную фазу, за которой следует по меньшей мере неактивная фаза, в котором в битовом потоке закодирован по меньшей мере кадр дескриптора вставки молчания, который описывает спектр фонового шума, причем аудиодекодер содержит:

декодер дескриптора вставки молчания, выполненный с возможностью декодирования кадра дескриптора вставки молчания для восстановления спектра фонового шума;

устройство декодирования, выполненное с возможностью восстановления выходного аудиосигнала из битового потока во время активной фазы;

спектральный преобразователь, выполненный с возможностью определения спектра выходного аудиосигнала;

устройство оценивателя шума, выполненное с возможностью определения первого спектра шума выходного аудиосигнала, основываясь на спектре выходного аудиосигнала, обеспечиваемого спектральным преобразователем, в котором первый спектр шума выходного аудиосигнала имеет более высокое спектральное разрешение, чем спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания;

преобразователь разрешения, выполненный с возможностью установления второго спектра шума выходного аудиосигнала, основываясь на первом спектре шума выходного аудиосигнала, в котором второй спектр шума выходного аудиосигнала имеет такое же спектральное разрешение, что и спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания;

устройство оценки спектра комфортного шума, имеющее устройство вычисления масштабных коэффициентов, выполненное с возможностью вычисления масштабных коэффициентов для спектра для комфортного шума, основываясь на спектре фонового шума, обеспечиваемом декодером дескриптора вставки молчания, и основываясь на втором спектре шума выходного аудиосигнала, обеспечиваемом преобразователем разрешения, и имеющее генератор спектра комфортного шума, выполненный с возможностью вычисления спектра для комфортного шума, основываясь на масштабных коэффициентах; и

генератор комфортного шума, выполненный с возможностью получения комфортного шума во время неактивной фазы, основываясь на спектре для комфортного шума.

Битовый поток содержит активные фазы и неактивные фазы, в котором активная фаза представляет собой фазу, которая содержит полезные компоненты аудиоинформации, такой как речь или музыка, тогда как неактивная фаза представляет собой фазу, которая не содержит никаких полезных компонентов аудиоинформации. Неактивные фазы обычно происходят во время пауз, когда не присутствуют полезные компоненты, такие как музыка или речь. Поэтому, неактивные фазы обычно содержат только фоновый шум. Информация в битовом потоке, содержащем кодированный аудиосигнал, вставляется в так называемые кадры, причем каждый из этих кадров содержит аудиоинформацию, ссылающуюся на некоторый момент времени. Во время активных фаз активные кадры, содержащие аудиоинформацию, включающую в себя аудиоинформацию, касающуюся полезного сигнала, могут передаваться в битовом потоке. В противоположность этому, во время неактивных фаз кадры дескриптора вставки молчания, содержащие информацию о шуме, могут передаваться в битовом потоке с меньшей средней скоростью передачи в битах по сравнению со средней скоростью передачи в битах активных фаз.

Декодер дескриптора вставки молчания выполнен с возможностью декодирования кадров дескриптора вставки молчания для восстановления спектра фонового шума. Однако этот спектр фонового шума не позволяет захватывать структуру спектра высокого разрешения фонового шума из-за ограниченного количества параметров, передаваемых в кадрах дескриптора вставки молчания.

Устройством декодирования может быть устройство или компьютерная программа, способные декодировать битовый поток аудио, который представляет собой поток цифровых данных, содержащий аудиоинформацию, во время активных фаз. Процесс декодирования может приводить к цифровому декодированному выходному аудиосигналу, который может подаваться на цифроаналоговый (D/A) преобразователь для получения аналогового аудиосигнала, который затем может подаваться на громкоговоритель для получения звукового сигнала.

Спектральный преобразователь может получать спектр выходного аудиосигнала, который имеет существенно более высокое спектральное разрешение, чем спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания.

Поэтому, оцениватель шума может определять первый спектр шума выходного аудиосигнала, основываясь на спектре выходного аудиосигнала, обеспечиваемом спектральным преобразователем, в котором первый спектр шума выходного аудиосигнала имеет более высокое спектральное разрешение, чем спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания.

Кроме того, преобразователь разрешения может устанавливать второй спектр шума выходного аудиосигнала, основываясь на первом спектре шума выходного аудиосигнала, в котором второй спектр шума выходного аудиосигнала имеет такое же спектральное разрешение, что и спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания.

Устройство вычисления масштабных коэффициентов может легко вычислять масштабные коэффициенты для спектра для комфортного шума, основываясь на спектре фонового шума, обеспечиваемом декодером дескриптора вставки молчания, и основываясь на втором спектре шума выходного аудиосигнала, обеспечиваемом преобразователем разрешения, так как спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания, и второй спектр шума выходного аудиосигнала имеют одинаковое спектральное разрешение.

Генератор спектра комфортного шума может устанавливать спектр для комфортного шума, основываясь на масштабных коэффициентах и основываясь на первом спектре шума выходного аудиосигнала, обеспечиваемом устройством оценки шума.

Кроме того, генератор комфортного шума может получать комфортный шум во время неактивной фазы, основываясь на спектре комфортного шума.

Оценки шума, полученные на декодере, содержат информацию о спектральной структуре фонового шума, которая является более точной, чем информация о гладкой спектральной огибающей фонового шума, содержащейся в кадрах SID. Однако эти оценки не могут обновляться во время неактивных фаз, так как оценка шума выполняется над декодированным выходным аудиосигналом во время активных фаз. В противоположность этому, кадры SID доставляют новую информацию о спектральной огибающей во время неактивных фаз. Декодер согласно изобретению объединяет эти два источника информации. Масштабные коэффициенты могут обновляться во время активных фаз в зависимости от оценок шума на стороне декодера и во время неактивных фаз в зависимости от оценок шума, содержащихся в кадрах SID. Непрерывное обновление масштабных коэффициентов гарантирует, что нет внезапных изменений характеристик получаемого комфортного шума.

Так как спектр фонового шума, содержащийся в кадрах SID, и второй спектр шума выходного аудиосигнала имеют одинаковое спектральное разрешение, обновление масштабных коэффициентов и, следовательно, комфортного шума может легко выполняться, так как для каждой группы частотных полос спектра фонового шума, содержащегося в кадрах SID, существует точно одна группа частотных полос во втором спектре шума выходного аудиосигнала. Необходимо отметить, что в предпочтительном варианте осуществления группы частотных полос спектра фонового шума, содержащегося в кадрах SID, и группы частотных полос второго спектра шума выходного аудиосигнала соответствуют друг другу.

Кроме того, так как спектр фонового шума, содержащийся в кадрах SID, и второй спектр шума выходного аудиосигнала имеют одинаковое спектральное разрешение, обновление масштабных коэффициентов не создает или создает только едва слышимые помехи.

Согласно предпочтительному варианту осуществления изобретения спектральный анализатор содержит устройство быстрого преобразования Фурье. Быстрое преобразование Фурье (FFT) представляет собой алгоритм для вычисления дискретного преобразования Фурье (DFT), и его обратного преобразования, который требует только низких вычислительных затрат. Поэтому, устройство быстрого преобразования Фурье может легко вычислять спектр выходного аудиосигнала.

Согласно предпочтительному варианту осуществления изобретения устройство оценивателя шума в декодере содержит устройство преобразователя, выполненное с возможностью преобразования спектра выходного аудиосигнала в преобразованный спектр выходного аудиосигнала, который, в основном, имеет значительно меньшее спектральное разрешение. Посредством обеспечения преобразованного спектра выходного аудиосигнала может уменьшаться сложность последующих вычислительных этапов.

Согласно предпочтительному варианту осуществления изобретения устройство оценивателя шума содержит оцениватель шума, выполненный с возможностью определения первого спектра шума выходного аудиосигнала, основываясь на преобразованном спектре выходного аудиосигнала, обеспечиваемом устройством преобразователя. Когда преобразованный спектр выходного аудиосигнала используется в качестве основы для оценки шума в декодере, вычислительные затраты могут уменьшаться без снижения качества оценки шума.

Согласно предпочтительному варианту осуществления изобретения устройство вычисления масштабных коэффициентов выполнено с возможностью вычисления масштабных коэффициентов по формуле , в которой обозначает масштабный коэффициент для группы i частотных полос комфортного шума, в которой обозначает уровень группы i частотных полос спектра фонового шума, содержащегося в кадрах SID, в которой обозначает уровень группы i частотных полос второго спектра шума выходного аудиосигнала, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра фонового шума, содержащегося в кадрах SID, и второго спектра шума выходного аудиосигнала. Посредством этих признаков могут легко вычисляться масштабные коэффициенты.

Согласно предпочтительному варианту осуществления изобретения генератор спектра комфортного шума выполнен с возможностью вычисления спектра комфортного шума, основываясь на масштабных коэффициентах и основываясь на первом спектре шума выходного аудиосигнала, обеспечиваемом устройством оценки шума. Посредством этих признаков спектр комфортного шума может вычисляться таким образом, что он имеет спектральное разрешение первого спектра шума выходного аудиосигнала, которое, в основном, значительно выше спектрального разрешения, полученного из кадров SID.

Согласно предпочтительному варианту осуществления изобретения генератор спектра комфортного шума выполнен с возможностью вычисления спектра комфортного шума по формуле , в которой обозначает уровень частотной полосы k спектра комфортного шума, в которой обозначает масштабный коэффициент группы i частотных полос спектра фонового шума, содержащегося в кадрах SID, и второго спектра шума выходного аудиосигнала, в которой обозначает уровень частотной полосы k первого спектра шума выходного аудиосигнала, в которой k=bLR(i), …, bLR(i+1)-1, в которой bLR(i) представляет собой первую частотную полосу одной из групп частотных полос, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра фонового шума, содержащегося в кадрах SID, и второго спектра шума выходного аудиосигнала. Посредством этих признаков спектр комфортного шума может легко вычисляться с высоким разрешением.

Согласно предпочтительному варианту осуществления изобретения преобразователь разрешения содержит первую ступень преобразователя, выполненную с возможностью установления третьего спектра шума выходного аудиосигнала, основываясь на первом спектре шума выходного аудиосигнала, в котором спектральное разрешение третьего спектра шума выходного аудиосигнала выше или такое же, что и спектральное разрешение первого спектра шума выходного аудиосигнала, и в котором преобразователь разрешения содержит вторую ступень преобразователя, выполненную с возможностью установления второго спектра шума выходного аудиосигнала.

Согласно предпочтительному варианту осуществления изобретения генератор спектра комфортного шума выполнен с возможностью вычисления спектра комфортного шума, основываясь на масштабных коэффициентах и основываясь на третьем спектре шума выходного аудиосигнала, обеспечиваемом первой ступенью преобразователя в преобразователе разрешения. Посредством этих признаков спектр комфортного шума может быть получен во время неактивных фаз, который имеет более высокое спектральное разрешение, чем спектральное разрешение первого спектра шума выходного аудиосигнала во время активных фаз.

Согласно предпочтительному варианту осуществления изобретения генератор спектра комфортного шума выполнен с возможностью вычисления спектра комфортного шума по формуле , в которой обозначает уровень частотной полосы k спектра комфортного шума, в которой обозначает масштабный коэффициент группы i частотных полос спектра фонового шума, содержащегося в кадрах SID, и второго спектра шума выходного аудиосигнала, в которой обозначает уровень частотной полосы k третьего спектра шума выходного аудиосигнала, в которой k=bLR(i), …, bLR(i+1)-1, в которой bLR(i) представляет собой первую частотную полосу группы частотных полос, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра фонового шума, содержащегося в кадрах SID, и второго спектра шума выходного аудиосигнала. Посредством этих признаков спектр комфортного шума может легко вычисляться с высоким разрешением.

Согласно предпочтительному варианту осуществления изобретения генератор комфортного шума содержит первый быстрый преобразователь Фурье, выполненный с возможностью регулировки уровней частотных полос комфортного шума в области быстрого преобразования Фурье, и второй быстрый преобразователь Фурье для получения по меньшей мере части комфортного шума, основываясь на выходном сигнале первого быстрого преобразователя Фурье. Посредством этих признаков может легко получаться фоновый шум.

Согласно предпочтительному варианту осуществления изобретения устройство декодирования содержит основной декодер, выполненный с возможностью получения выходного аудиосигнала во время активной фазы. Посредством этих признаков может достигаться простая конструкция декодера, который подходит для узкополосных (NB) и широкополосных (WB) применений.

Согласно предпочтительному варианту осуществления изобретения устройство декодирования содержит основной декодер, выполненный с возможностью получения аудиосигнала, и модуль расширения полосы частот, выполненный с возможностью получения выходного аудиосигнала, основываясь на аудиосигнале, обеспечиваемом основным декодером. Посредством этих признаков может достигаться простая конструкция декодера, который пригоден для суперширокополосных (SWB) применений.

Согласно предпочтительному варианту осуществления изобретения модуль расширения полосы частот содержит декодер копирования спектральной полосы, анализатор квадратурного зеркального фильтра и/или синтезатор квадратурного зеркального фильтра.

Согласно предпочтительному варианту осуществления изобретения комфортный шум, обеспечиваемый быстрым преобразователем Фурье, подается на модуль расширения полосы частот. Посредством этого признака комфортный шум, обеспечиваемый быстрым преобразователем Фурье, может преобразовываться в комфортный шум с большей полосой частот.

Согласно предпочтительному варианту осуществления изобретения генератор комфортного шума содержит устройство регулятора квадратурного зеркального фильтра, выполненное с возможностью регулировки уровней частотных полос комфортного шума в области квадратурного зеркального фильтра, причем выходной сигнал синтезатора квадратурного зеркального фильтра подается на модуль расширения полосы частот. Посредством этих признаков информация о шуме, передаваемая кадрами дескриптора вставки молчания, относящимися к частотам шума выше полосы частот основного декодера, может использоваться для дополнительного улучшения комфортного шума.

В другом аспекте изобретение относится к системе, содержащей декодер и кодер, в которой декодер разработан согласно изобретению.

В другом аспекте изобретение относится к способу декодирования битового потока аудио для получения из него выходного аудиосигнала, причем битовый поток содержит по меньшей мере активную фазу, за которой следует по меньшей мере неактивная фаза, в котором битовый поток имеет кодированный в нем по меньшей мере кадр дескриптора вставки молчания, который описывает спектр фонового шума, причем способ содержит этапы:

декодирования кадра дескриптора вставки молчания для восстановления спектра фонового шума;

восстановления выходного аудиосигнала из битового потока во время активной фазы;

определения спектра выходного аудиосигнала;

определения первого спектра шума выходного аудиосигнала, основываясь на спектре выходного аудиосигнала, в котором первый спектр шума выходного аудиосигнала имеет более высокое спектральное разрешение, чем спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания;

установления второго спектра шума выходного аудиосигнала, основываясь на первом спектре шума выходного аудиосигнала, в котором второй спектр шума выходного аудиосигнала имеет такое же спектральное разрешение, что и спектр фонового шума, обеспечиваемый декодером дескриптора вставки молчания;

вычисления масштабных коэффициентов для спектра для комфортного шума, основываясь на спектре фонового шума, обеспечиваемом декодером дескриптора вставки молчания, и основываясь на втором спектре шума выходного аудиосигнала; и

получения комфортного шума во время неактивной фазы, основываясь на спектре комфортного шума.

В другом аспекте изобретение относится к компьютерной программе для выполнения, при выполнении на компьютере или процессоре, обладающими признаками изобретения способа.

Предпочтительные варианты осуществления изобретения ниже описываются в отношении прилагаемых чертежей, на которых:

фиг. 1 иллюстрирует первый вариант осуществления декодера согласно изобретению;

фиг. 2 иллюстрирует второй вариант осуществления декодера согласно изобретению;

фиг. 3 иллюстрирует третий вариант осуществления декодера согласно изобретению;

фиг. 4 иллюстрирует первый вариант осуществления кодера, пригодного для обладающей признаками изобретения системы; и

фиг. 5 иллюстрирует второй вариант осуществления кодера, пригодного для обладающей признаками изобретения системы.

Фиг. 1 иллюстрирует первый вариант осуществления декодера 1 согласно изобретению. Аудиодекодер 1, изображенный на фиг. 1, выполнен с возможностью декодирования битового потока BS для получения из него выходного аудиосигнала OS, причем битовый поток BS содержит по меньшей мере активную фазу, за которой следует по меньшей мере неактивная фаза, в котором битовый поток BS имеет кодированный в нем по меньшей мере кадр SI дескриптора вставки молчания, который описывает спектр SBN фонового шума, причем аудиодекодер 1 содержит:

устройство 2 декодирования, выполненное с возможностью восстановления выходного аудиосигнала OS из битового потока BS во время активной фазы;

декодер 3 дескриптора вставки молчания, выполненный с возможностью декодирования кадра SI дескриптора вставки молчания для восстановления спектра SBN фонового шума;

спектральный преобразователь 4, выполненный с возможностью определения спектра SAS выходного аудиосигнала OS;

устройство 5 оценивателя шума, выполненное с возможностью определения первого спектра SN1 шума выходного аудиосигнала OS, основываясь на спектре SAS выходного аудиосигнала AS, обеспечиваемом спектральным преобразователем 4, в котором первый спектр SN1 шума выходного аудиосигнала OS имеет более высокое спектральное разрешение, чем спектр SBN фонового шума;

преобразователь 6 разрешения, выполненный с возможностью установления второго спектра SN2 шума выходного аудиосигнала OS, основываясь на первом спектре SN1 шума выходного аудиосигнала OS, в котором второй спектр SN2 шума выходного аудиосигнала OS имеет такое же спектральное разрешение, что и спектр SBN фонового шума;

устройство 7 оценки спектра комфортного шума, имеющее устройство 7a вычисления масштабных коэффициентов, выполненное с возможностью вычисления масштабных коэффициентов SF для спектра SCN для комфортного шума CN, основываясь на спектре SBN фонового шума, обеспечиваемом декодером 3 дескриптора вставки молчания, и основываясь на втором спектре SN2 шума выходного аудиосигнала OS, обеспечиваемом преобразователем 6 разрешения, и имеющее генератор 7b спектра комфортного шума, выполненный с возможностью вычисления спектра SCN для комфортного шума CN, основываясь на масштабных коэффициентах SF; и

генератор 8 комфортного шума, выполненный с возможностью получения комфортного шума CN во время неактивной фазы, основываясь на спектре SCN для комфортного шума CN.

Битовый поток BS содержит активные фазы и неактивные фазы, причем активная фаза представляет собой фазу, которая содержит полезные компоненты аудиоинформации, такие как речь или музыку, тогда как неактивная фаза представляет собой фазу, которая не содержит никаких полезных компонентов аудиоинформации.

Неактивные фазы обычно происходят во время пауз, где не присутствуют полезные компоненты, такие как музыка или речь. Поэтому, неактивные фазы обычно содержат исключительно фоновый шум. Информация в битовом потоке BS, содержащем кодированный аудиосигнал, встраивается в так называемые кадры, причем каждый из этих кадров содержит аудиоинформацию, ссылающуюся на некоторый момент времени. Во время активных фаз кадры, содержащие аудиоинформацию, включающую в себя аудиоинформацию, касающуюся полезного сигнала, могут передаваться в битовом потоке BS. В противоположность этому, во время неактивных фаз кадры SI дескриптора вставки молчания, содержащие информацию о шуме, могут передаваться в битовом потоке с меньшей средней скоростью передачи в битах по сравнению со средней скоростью передачи в битах активных фаз.

Устройство 2 декодирования может представлять собой устройство или компьютерную программу, способную декодировать битовой поток BS аудио, который представляет собой поток цифровых данных, содержащий аудиоинформацию, во время активных фаз. Процесс декодирования может приводить к цифровому декодированному выходному аудиосигналу OS, который может подаваться на D/A-преобразователь для получения аналогового аудиосигнала, который затем может подаваться на громкоговоритель для получения звукового сигнала.

Декодер 3 дескриптора вставки молчания выполнен с возможностью декодирования кадров SI дескриптора вставки молчания для восстановления спектра SBN фонового шума. Однако спектр SBN фонового шума не позволяет захватывать структуру спектра высокого разрешения фонового шума из-за ограниченного количества параметров, передаваемых в кадрах SI дескриптора вставки молчания.

Спектральный преобразователь 4 может получать спектр SAS выходного аудиосигнала OS, который имеет существенно более высокое спектральное разрешение, чем спектр SBN фонового шума, обеспечиваемый декодером 3 дескриптора вставки молчания.

Поэтому, оцениватель 10 шума может определять первый спектр SN1 шума выходного аудиосигнала OS, основываясь на спектре SAS выходного аудиосигнала OS, обеспечиваемом спектральным преобразователем 4, причем первый спектр SN1 шума выходного аудиосигнала OS имеет более высокое спектральное разрешение, чем спектр фонового шума SBN.

Кроме того, преобразователь 6 разрешения может устанавливать второй спектр SN2 шума выходного аудиосигнала OS, основываясь на первом спектре SN1 шума выходного аудиосигнала OS, причем второй спектр SN2 шума выходного аудиосигнала OS имеет такое же спектральное разрешение, что и спектр фонового шума SBN.

Устройство 7a вычисления масштабных коэффициентов может легко вычислять масштабные коэффициенты SF для спектра SCN для комфортного шума CN, основываясь на спектре SBN фонового шума, обеспечиваемом декодером 3 дескриптора вставки молчания, и основываясь на втором спектре SN2 шума выходного аудиосигнала OS, обеспечиваемом преобразователем 6 разрешения, так как спектр SBN фонового шума и второй спектр SN2 шума выходного аудиосигнала OS имеют одинаковое спектральное разрешение.

Генератор 7b спектра комфортного шума может устанавливать спектр SCN для комфортного шума CN, основываясь на масштабных коэффициентах SF.

Кроме того, генератор 8 комфортного шума может получать комфортный шум CN во время неактивной фазы, основываясь на спектре SCN для комфортного шума.

Оценки шума, полученные в декодере 1, содержат информацию о спектральной структуре фонового шума, которая более точная, чем информация о спектральной структуре фонового шума, содержащаяся в кадрах SI SID. Однако эти оценки не могут адаптироваться во время неактивных фаз, так как оценка шума выполняется по декодированному выходному аудиосигналу OS. В противоположность этому, кадры SID доставляют новую информацию о спектральной огибающей с регулярными интервалами во время неактивных фаз. Декодер 1 согласно изобретению объединяет эти два источника информации. Масштабные коэффициенты SF могут обновляться во время активных фаз в зависимости от оценок шума на стороне декодера и во время неактивных фаз в зависимости от оценок шума, содержащихся в кадрах SI SID. Непрерывное обновление масштабных коэффициентов SF гарантирует, что нет внезапных изменений характеристик получаемого комфортного шума CN.

Так как спектр SBN фонового шума, содержащийся в кадрах SI SID, и второй спектр SN2 шума выходного аудиосигнала OS имеют одинаковое спектральное разрешение, обновление масштабных коэффициентов SF и, следовательно, комфортного шума CN может легко выполняться, так как для каждой группы частотных полос спектра SBN фонового шума, содержащегося в кадрах SI SID, точно одна группа частотных полос существует во втором спектре SN2 шума выходного аудиосигнала OS. Необходимо отметить, что в предпочтительном варианте осуществления группы частотных полос спектра фонового шума, содержащегося в кадрах SI SID, и группы частотных полос второго спектра SN2 шума выходного аудиосигнала OS соответствуют друг другу.

Кроме того, так как спектр SBN фонового шума, содержащийся в кадрах SI SID, и второй спектр SN2 шума выходного аудиосигнала OS имеют одинаковое спектральное разрешение, обновление масштабных коэффициентов SF не создает или создает только едва слышимые помехи.

Согласно предпочтительному варианту осуществления изобретения спектральный анализатор 4 содержит устройство быстрого преобразования Фурье. Быстрое преобразование Фурье (FFT) представляет собой алгоритм для вычисления дискретного преобразования Фурье (DFT), и его обратного преобразования, который требует только низких вычислительных затрат. Поэтому, устройство быстрого преобразования Фурье может легко вычислять спектр SAS выходного аудиосигнала OS.

Согласно предпочтительному варианту осуществления изобретения устройство 5 оценивателя шума содержит устройство 9 преобразователя, выполненное с возможностью преобразования спектра SAS выходного аудиосигнала OS в преобразованный спектр CSA выходного аудиосигнала OS, который имеет такое же спектральное разрешение, что и основной декодер 17. Как правило, спектральное разрешение спектра SAS выходного аудиосигнала OS, полученного спектральным преобразователем 4, значительно выше, чем спектральное разрешение основного декодера 17. Посредством обеспечения преобразованного спектра CSA выходного аудиосигнала OS может уменьшаться сложность последующих вычислительных этапов.

Согласно предпочтительному варианту осуществления изобретения устройство 5 оценивателя шума содержит оцениватель 10 шума, выполненный с возможностью определения первого спектра SN1 шума выходного аудиосигнала OS, основываясь на преобразованном спектре CAS выходного аудиосигнала OS, обеспечиваемом устройством 9 преобразователя. Когда преобразованный спектр CSA выходного аудиосигнала OS используется в качестве основы для оценки шума в декодере, вычислительные затраты могут уменьшаться без снижения качества оценки шума.

Согласно предпочтительному варианту осуществления изобретения устройство 7a вычисления масштабных коэффициентов выполнено с возможностью вычисления масштабных коэффициентов SF по формуле , в которой обозначает масштабный коэффициент SF для группы i частотных полос комфортного шума CN, в которой обозначает уровень группы i частотных полос спектра SBN фонового шума, в которой обозначает уровень группы i частотных полос второго спектра SN2 шума выходного аудиосигнала, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра SBN фонового шума, и второго спектра SN2 шума выходного аудиосигнала OS. Посредством этих признаков могут легко вычисляться масштабные коэффициенты SF.

Согласно предпочтительному варианту осуществления изобретения генератор 7b спектра комфортного шума выполнен с возможностью вычисления спектра SCN комфортного шума CN, основываясь на масштабных коэффициентах SF и основываясь на первом спектре SN1 шума выходного аудиосигнала OS, обеспечиваемом устройством 5 оценки шума. Посредством этих признаков спектр SCN комфортного шума может вычисляться таким образом, что он имеет спектральное разрешение первого спектра SN1 шума выходного аудиосигнала OS.

Согласно предпочтительному варианту осуществления изобретения генератор 7b спектра комфортного шума выполнен с возможностью вычисления спектра SCN комфортного шума CN по формуле , в которой обозначает уровень частотной полосы k спектра SCN комфортного шума CN, в которой обозначает масштабный коэффициент SF группы i частотных полос спектра SBN фонового шума и второго спектра SN2 шума выходного аудиосигнала OS, в которой обозначает уровень частотной полосы k первого спектра SN1 шума выходного аудиосигнала OS, в которой k=bLR(i), …, bLR(i+1)-1, в которой bLR(i) представляет собой первую частотную полосу одной из групп частотных полос, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра SBN фонового шума и второго спектра SN2 шума выходного аудиосигнала. Посредством этих признаков спектр SCN комфортного шума CN может легко вычисляться с высоким разрешением.

Согласно предпочтительному варианту осуществления изобретения преобразователь 6 разрешения содержит первую ступень 11 преобразователя, выполненную с возможностью установления третьего спектра SN3 шума выходного аудиосигнала OS, основываясь на первом спектре SN1 шума выходного аудиосигнала OS, в котором спектральное разрешение третьего спектра SN3 шума выходного аудиосигнала OS такое же или выше спектрального разрешения первого спектра SN1 шума выходного аудиосигнала OS, и в котором преобразователь 6 разрешения содержит вторую ступень 12 преобразователя, выполненную с возможностью установления второго спектра SN2 шума выходного аудиосигнала OS.

Согласно предпочтительному варианту осуществления изобретения генератор 7b спектра комфортного шума выполнен с возможностью вычисления спектра SCN комфортного шума CN, основываясь на масштабных коэффициентах SF и основываясь на третьем спектре SN3 шума выходного аудиосигнала OS, обеспечиваемом первой ступенью 11 преобразователя в преобразователе 6 разрешения. Посредством этих признаков может быть получен спектр SCN комфортного шума, который имеет более высокое спектральное разрешение, чем спектр SBN фонового шума, обеспечиваемый декодером 3 дескриптора вставки молчания.

Согласно предпочтительному варианту осуществления изобретения генератор 7b спектра комфортного шума выполнен с возможностью вычисления спектра SCN комфортного шума по формуле , в которой обозначает уровень частотной полосы k спектра SCN комфортного шума CN, в которой обозначает масштабный коэффициент SF группы i частотных полос спектра SCN фонового шума и второго спектра SN2 шума выходного аудиосигнала OS, в которой обозначает уровень частотной полосы k третьего спектра SN3 шума выходного аудиосигнала OS, в которой k=bLR(i), …, bLR(i+1)-1, в которой bLR(i) представляет собой первую частотную полосу группы частотных полос, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра SBN фонового шума и второго спектра SN2 шума выходного аудиосигнала OS. Посредством этих признаков спектр SCN комфортного шума может легко вычисляться с высоким разрешением.

Согласно предпочтительному варианту осуществления изобретения генератор 8 комфортного шума содержит первый быстрый преобразователь 15 Фурье, выполненный с возможностью регулировки уровней частотных полос комфортного шума CN в области быстрого преобразования Фурье, и второй быстрый преобразователь 16 Фурье для получения по меньшей мере части комфортного шума CN, основываясь на выходном сигнале первого быстрого преобразователя 15 Фурье. Посредством этих признаков может легко получаться комфортный шум.

Согласно предпочтительному варианту осуществления изобретения устройство 2 декодирования содержит основной декодер 17, выполненный с возможностью получения выходного аудиосигнала OS во время активной фазы. Посредством этих признаков может достигаться простая конструкция декодера, который подходит для узкополосных (NB) и широкополосных (WB) применений.

Согласно предпочтительному варианту осуществления изобретения аудиодекодер 1 содержит устройство 18 считывания заголовка, которое выполнено с возможностью различения активных фаз и неактивных фаз. Устройство 18 считывания заголовка дополнительно выполнено с возможностью переключения устройства 19 переключения таким образом, что битовый поток BS во время активных фаз подается на основной декодер 17, и что кадры дескриптора вставки молчания во время неактивных фаз подаются на декодер 3 дескриптора вставки молчания. Следовательно, флаг неактивной фазы передается на генератор 8 фонового шума, так что может запускаться генерирование комфортного шума CN.

Фиг. 2 иллюстрирует второй вариант осуществления аудиодекодера 1 согласно изобретению. Декодер, изображенный на фиг. 2, основывается на декодере 1 по фиг. 1. Ниже объясняются только различия. Аудиодекодер 1 второго варианта осуществления изобретения содержит модуль 20 расширения полосы частот, на который подается выходной сигнал основного декодера 17. Модуль 20 расширения полосы частот выполнен с возможностью получения выходного сигнала EOS с расширенной полосой частот, основываясь на выходном аудиосигнале OS. Посредством этих признаков может достигаться простая конструкция декодера 1, который пригоден для суперширокополосных (SWB) применений.

Согласно предпочтительному варианту осуществления изобретения комфортный шум CN, обеспечиваемый быстрым преобразователем 16 Фурье, подается на модуль 20 расширения полосы частот. Посредством этого признака комфортный шум CN, обеспечиваемый быстрым преобразователем 16 Фурье, может преобразовываться в комфортный шум CN с большей полосой частот.

Согласно предпочтительному варианту осуществления изобретения генератор 8 комфортного шума содержит устройство 24 регулятора квадратурного зеркального фильтра, выполненное с возможностью регулировки уровней частотных полос комфортного шума CN в области квадратурного зеркального фильтра, причем выходной сигнал синтезатора 24 квадратурного зеркального фильтра подается на модуль 20 расширения полосы частот в качестве дополнительного комфортного шума CN’. Уровни квадратурного зеркального фильтра (QMF), содержащиеся в кадрах SI дескриптора вставки молчания, могут подаваться на устройство 24 синтезатора квадратурного зеркального фильтра. Посредством этих признаков информация о шуме, передаваемая кадрами SI дескриптора вставки молчания, относящаяся к частотам шума выше полосы частот основного декодера 17, может использоваться для дополнительного улучшения комфортного шума CN.

Согласно предпочтительному варианту осуществления изобретения модуль 20 расширения полосы частот содержит декодер 21 копирования спектральной полосы, анализатор 22 квадратурного зеркального фильтра и/или синтезатор 23 квадратурного зеркального фильтра.

Фиг. 3 иллюстрирует третий вариант осуществления декодера 1 согласно изобретению. Декодер 1 по фиг. 3 основывается на декодере 1 по фиг. 2. В нижеследующем описываются только различия.

Согласно предпочтительному варианту осуществления изобретения устройство 2 декодирования содержит основной декодер 17, выполненный с возможностью получения аудиосигнала AS, и модуль 20 расширения полосы частот, выполненный с возможностью получения выходного аудиосигнала OS, основываясь на аудиосигнале AS, обеспечиваемом основным декодером 17. Посредством этих признаков может достигаться простая конструкция декодера, который пригоден для суперширокополосных (SWB) применений.

В принципе, модуль 20 расширения полосы частот по фиг. 3 является таким же, что и модуль 20 расширения полосы частот по фиг. 2. Однако в третьем варианте осуществления аудиодекодера 1 согласно изобретению модуль 20 расширения полосы частот используется для получения выходного аудиосигнала OS, который подается на спектральный преобразователь 4. Посредством этих признаков вся полоса частот может использоваться для получения комфортного шума.

Что касается трех вариантов осуществлении аудиодекодера согласно изобретению, то можно добавить: На стороне декодера случайный генератор 8 может применяться для возбуждения каждой индивидуальной спектральной полосы в области FFT, а также в области QMF для режимов SWB. Амплитуда случайных последовательностей должна индивидуально вычисляться в каждой полосе, так что спектр генерируемого комфортного шума CN имеет сходство со спектром фактического фонового шума, присутствующего в битовом потоке.

Оценки шума с высоким разрешением, полученные в декодере 1, захватывают информацию о структуре спектра высокого разрешения фонового шума. Однако эти оценки не могут адаптироваться во время неактивных фаз, так как оценка шума выполняется по декодированному сигналу OS. В противоположность этому, кадры SI SID доставляют новую информацию о спектральной огибающей с регулярными интервалами во время неактивных фаз. Настоящий декодер 1 объединяет эти два источника информации в попытке воспроизведения структуры спектра высокого разрешения, захваченной из фонового шума, присутствующего во время активных фаз, в то же время обновляя только спектральную огибающую комфортного шума CN во время неактивных частей при помощи информации SID.

Для достижения этой цели дополнительный оцениватель 5 шума используется в декодере 1, как показано на фиг. 1-3. Следовательно, оценка шума выполняется на обеих сторонах системы передачи, но применяя более высокое спектральное разрешение в декодере 1, чем в кодере 100. Одним путем получения высокого спектрального разрешения в декодере 1 является просто принятие во внимание индивидуально каждой спектральной полосы (полное разрешение) вместо группирования их посредством усреднения подобно кодеру 100. Альтернативно, может быть получен компромисс между спектральным разрешением и вычислительной сложностью посредством выполнения группирования спектра также в декодере 1, но, используя увеличенное количество спектральных групп по сравнению с кодером 100, получая, таким образом, квантование с меньшим шагом оси частот в декодере.

Отметьте, что оценка шума на стороне декодера работает по декодированному сигналу OS. В системе на основе DTX она должна, поэтому, быть способна работать только во время активных фаз, т.е. обязательно над содержимым с чистой речью или речью с шумами (в противоположность только шуму).

Энергетический спектр шума с высоким разрешением (HR), вычисленный в декодере, может сначала интерполироваться (например, используя линейную интерполяцию) для получения энергетического спектра с полным разрешением (FR). Он затем может преобразовываться в энергетический спектр с низким разрешением (LR) посредством спектрального группирования (т.е. усреднения), как это делается в кодере. Энергетический спектр проявляет, поэтому, такое же спектральное разрешение, что и уровни шума, полученные из кадров SI SID. Сравнивая спектры и шума с низким разрешением, спектр шума с полным разрешением может, в конечном счете, масштабироваться для получения энергетического спектра с полным разрешением следующим образом:

где LLR представляет собой количество спектральных групп, используемых оценкой шума с низким разрешением в кодере, и bLR(i) обозначает первую спектральную полосу i-ой спектральной группы, i=0, …, LLR-1. Энергетический спектр шума с полным разрешением может, в конечном счете, использоваться для точной регулировки уровня комфортного шума, генерируемого в каждой индивидуальной полосе FFT или QMF (последний только для режимов SWB).

На фиг. 1 и 2 вышеприведенный механизм применяется только к коэффициентам FFT. Следовательно, для систем SWB он не применяется в полосах QMF, захватывающих высокочастотное содержимое, отбрасываемое основным уровнем. Так как эти частоты с учетом восприятия являются менее существенными, является, как правило, достаточным воспроизведение плавной спектральной огибающей шума для этих частот.

Чтобы регулировать уровень комфортного шума, применяемого в области QMF для частот, которые находятся выше полосы частот основного уровня в режимах SWB, система основывается исключительно на информации, передаваемой кадрами SID. Модуль SBR, таким образом, обходится, когда VAD запускает кадр CNG. В режимах WB модуль CNG не учитывает полосы QMF, так как применяется слепое расширение полосы частот для восстановления требуемой полосы частот.

Тем не менее, схема легко может быть расширена для охвата всей полосы частот посредством применения оценивателя шума на стороне декодера на выходе модуля расширения полосы частот вместо применения ее на выходе основного декодера. Это расширение, как показано на фиг. 3, вызывает повышение вычислительной сложности, так как также должны учитываться высокие частоты, захватываемые блоком фильтров QMF.

Фиг. 4 иллюстрирует первый вариант осуществления кодера 100, пригодного для обладающей признаками изобретения системы. Входной аудиосигнал IS подается на первый спектральный преобразователь 25, выполненный с возможностью пересылки этого сигнала IS временной области в частотную область. Первый спектральный преобразователь 25 может представлять собой анализатор квадратурного зеркального фильтра. Выходной сигнал первого спектрального преобразователя 25 подается на второй спектральный преобразователь 26, который выполнен с возможностью пересылки выходного сигнала первого спектрального преобразователя 25 в область. Второй спектральный преобразователь 26 может представлять собой синтезатор квадратурного зеркального фильтра. Выходной сигнал второго спектрального преобразователя 26 подается на третий спектральный преобразователь 27, которым может быть устройство быстрого преобразования Фурье. Выходной сигнал третьего спектрального преобразователя 27 подается на устройство 28 оценивателя шума, который состоит из устройства 29 преобразования и оценивателя 30 шума.

Кроме того, кодер 100 содержит детектор 31 активности сигнала, который выполнен с возможностью переключения устройства 32 переключения таким образом, что во время активных фаз входной сигнал подается на основной кодер 33 и что в кадрах SID во время неактивных фаз оценка шума, создаваемая устройством 28 оценки шума, подается на кодер 35 дескриптора вставки молчания. Кроме того, в неактивные фазы флаг неактивности подается на обновитель 34 основного уровня.

Кодер 100 дополнительно содержит устройство 36 получения битового потока, которое принимает кадры SI дескриптора вставки молчания от кодера 35 дескриптора вставки молчания и кодированный входной сигнал ISE от основного кодера 33 для получения из него битового потока BS.

Фиг. 5 иллюстрирует второй вариант осуществления кодера 100, пригодного для обладающей признаками изобретения системы, который основывается на кодере 100 первого варианта осуществления. Дополнительные признаки второго варианта осуществления кратко объясняются ниже. Выходной сигнал первого преобразователя 25 также подается на устройство 28 оценивателя шума. Кроме того, во время активных фаз кодер 37 копирования спектральной полосы получает сигнал ES улучшения, который содержит информацию о более высоких частотах во входном аудиосигнале IS. Этот сигнал 37 улучшения также пересылается на устройство 36 получения битового потока для встраивания этого сигнала ES улучшения в битовый поток BS.

Что касается кодеров, показанных на фиг. 4 и 5, то может быть добавлена следующая информация: В случае, когда VAD запускает фазу CNG, передаются кадры SID, содержащие информацию о входном фоновом шуме. Она должна дать возможность декодеру генерировать искусственный шум, имеющий сходство с фактическим фоновым шумом с точки зрения спектрально-временных характеристик. С этой целью, оцениватель 28 шума применяется на стороне кодера для отслеживания спектральной формы фонового шума, присутствующего во входном сигнале IS, как показано на фиг. 4 и 5.

В принципе, оценка шума может применяться с любым инструментальным средством спектрально-временного анализа, разбивающим сигнал временной области на многочисленные спектральные полосы, до тех пор, пока он проявляет достаточное спектральное разрешение. В настоящей системе блок фильтров QMF используется в качестве инструментального средства повторной выборки для понижающей дискретизации входного сигнала до частоты дискретизации основного уровня. Он проявляет существенно меньшее спектральное разрешение, чем FFT, которое применяется к сигналу основного уровня с пониженной дискретизацией.

Так как основной кодер 33 уже охватывает всю полосу частот NB, и так как режимы WB основываются на слепом расширении полосы частот, частоты выше полосы частот основного уровня являются несущественными и могут просто отбрасываться для систем NB и WB. В режимах SWB, в противоположность этому, эти частоты захватываются верхними полосами QMF и должны явно приниматься во внимание.

Размер кадра SI SID очень ограничен на практике. Поэтому, количество параметров, описывающих фоновый шум, должно поддерживаться минимально возможным. С этой целью, оценка шума не применяется непосредственно в выходном сигнале спектральных преобразований. Вместо этого, она применяется при более низком спектральном разрешении посредством усреднения входного энергетического спектра среди групп полос, например, следуя масштабу Барка. Усреднение может достигаться или арифметическим, или геометрическим образом. В случае SWB спектральное группирование осуществляется для областей FFT и QMF отдельно, тогда как режимы NB и WB основываются только на области FFT.

Отметьте, что снижение спектрального разрешения также является полезным с точки зрения вычислительной сложности, так как необходимо, чтобы оценка шума применялась только к малому количеству спектральных групп вместо принятия во внимание каждой полосы спектра индивидуально.

Оцененные уровни шума (один для каждой спектральной группы) может совместно кодироваться в кадрах SID, используя методы векторного квантования. В режимах NB и WB применяется только область FFT. В противоположность этому, для режимов SWB кодирование кадров SID может выполняться для обеих областей FFT и QMF совместно, используя векторное квантование, т.е. обращаясь к единственной кодовой книге, охватывающей обе области.

Хотя некоторые аспекты были описаны в контексте устройства, ясно, что эти аспекты также представляют описание соответствующего способа, где блок или устройство соответствует этапу способа или признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента или признака соответствующего устройства. Некоторые или все этапы способа могут выполняться посредством (или используя) устройство аппаратных средств, подобное, например, микропроцессору, программируемому компьютеру или электронной схеме. В некоторых вариантах осуществления некоторый один или несколько из наиболее важных этапов способа могут выполняться таким устройством.

В зависимости от некоторых требований к реализации варианты осуществления изобретения могут быть реализованы аппаратными или программными средствами. Реализация может выполняться с использованием долговременной запоминающей среды, такой как цифровая запоминающая среда, например дискета, цифровой многофункциональный диск (DVD), диск Blu-Ray, компакт-диск (CD), постоянное запоминающее устройство (ROM), программируемое ROM (PROM) и стираемое программируемое ROM (EPROM), электрически стираемое программируемое ROM (EEPROM) или флэш-память, имеющие хранимые на них сигналы управления, считываемые электронным образом, которые взаимодействуют (или способны взаимодействовать) с программируемой компьютерной системой, так что выполняется соответствующий способ. Поэтому, цифровая запоминающая среда может быть считываемой компьютером.

Некоторые варианты осуществления согласно изобретению содержат носитель данных, имеющий сигналы управления, считываемые электронным образом, которые способны взаимодействовать с программируемой компьютерной системой, так что выполняется один из способов, описанных в данном документе.

Как правило, варианты осуществления настоящего изобретения могут быть реализованы в виде продукта компьютерной программы с программным кодом, причем программный код является действующим для выполнения одного из способов, когда продукт компьютерной программы выполняется на компьютере. Программный код, например, может храниться на машиносчитываемом носителе.

Другие варианты осуществления содержат компьютерную программу для выполнения одного из способов, описанных в данном документе, хранимую на машиносчитываемом носителе.

Другими словами, вариант осуществления обладающего признаками изобретения способа, поэтому, представляет собой компьютерную программу, имеющую программный код для выполнения одного из способов, описанных в данном документе, когда компьютерная программа выполняется на компьютере.

Другой вариант осуществления обладающего признаками изобретения способа, поэтому, представляет собой носитель данных (или цифровую запоминающую среду, или считываемую компьютером среду), содержащий записанную на нем компьютерную программу для выполнения одного из способов, описанных в данном документе. Носитель данных, цифровая запоминающая среда или записанная среда обычно являются материальными и/или долговременными.

Другой вариант осуществления обладающими признаками изобретения способа, поэтому, представляет собой поток данных или последовательность сигналов, представляющих компьютерную программу для выполнения одного из способов, описанных в данном документе. Поток данных или последовательность сигналов, например, могут быть выполнены с возможностью пересылки по соединению передачи данных, например, по Интернету.

Другой вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, выполненное с возможностью, или приспособленное для, выполнения одного из способов, описанных в данном документе.

Другой вариант осуществления содержит компьютер, имеющий установленную на нем компьютерную программу для выполнения одного из способов, описанных в данном документе.

Другой вариант осуществления согласно изобретению содержит устройство или систему, выполненную с возможностью пересылки (например, электронным или оптическим образом) компьютерной программы для выполнения одного из способов, описанных в данном документе, на приемник. Приемником, например, может быть компьютер, мобильное устройство, устройство памяти или т.п. Устройство или система, например, могут содержать файловый сервер для пересылки компьютерной программы на приемник.

В некоторых вариантах осуществления программируемое логическое устройство (например, программируемая вентильная матрица) может использоваться для выполнения некоторых или всех функциональных возможностей способов, описанных в данном документе. В некоторых вариантах осуществления программируемая вентильная матрица может взаимодействовать с микропроцессором, чтобы выполнять один из способов, описанных в данном документе. Как правило, способы предпочтительно выполняются любым устройством аппаратных средств.

Вышеописанные варианты осуществления являются просто иллюстративными для принципов настоящего изобретения. Понятно, что модификации и варианты устройств и подробностей, описанных в данном документе, очевидны для специалиста в данной области техники. Поэтому, предполагается, что изобретение ограничивается только объемом рассматриваемой формулы изобретения и не конкретными подробностями, представленными посредством описания и объяснения вариантов осуществления в данном документе.

ССЫЛОЧНЫЕ ПОЗИЦИИ

1 – аудиодекодер

2 – устройство декодирования

3 – декодер дескриптора вставки молчания

4 – спектральный преобразователь

5 – устройство оценивателя шума

6 – преобразователь разрешения

7 – устройство оценки спектра комфортного шума

7a – устройство вычисления масштабных коэффициентов

7b – генератор спектра комфортного шума

8 – генератор комфортного шума

9 – устройство преобразователя

10 – оцениватель шума

11 – первая ступень преобразователя

12 – вторая ступень преобразователя

15 – первый быстрый преобразователь Фурье

16 – второй быстрый анализатор Фурье

17 – основной декодер

18 – устройство считывания заголовка

19 – устройство переключения

20 – модуль расширения полосы частот

21 – декодер копирования спектральной полосы

22 – анализатор квадратурного зеркального фильтра

23 – синтезатор квадратурного зеркального фильтра

24 – устройство регулятора квадратурного зеркального фильтра

25 – первый спектральный преобразователь

26 – второй спектральный преобразователь

27 – третий спектральный преобразователь

28 – устройство оценивателя шума

29 – устройство преобразователя

30 – оцениватель шума

31 – детектор активности сигнала

32 – устройство переключения

33 – основной кодер

34 – обновитель основного уровня

35 – кодер дескриптора вставки молчания

36 – устройство получения битового потока

37 – кодер копирования спектральной полосы

100 – кодер

BS – битовый поток

OS – выходной аудиосигнал

SI – кадр дескриптора вставки молчания

SBN – спектр фонового шума

SAS – спектр аудиосигнала

SN1 – первый спектр шума аудиосигнала

SN2 – второй спектр шума аудиосигнала

SF – масштабные коэффициенты

SCN – спектр комфортного шума

CN – комфортный шум

AS – выходной сигнал

CSA – преобразованный спектр аудиосигнала

SN3 – третий спектр шума аудиосигнала

EOS – выходной сигнал с расширенной полосой частот

IS – входной аудиосигнал

ISE – кодированный входной сигнал

ES – сигнал улучшения

1. Аудиодекодер для декодирования битового потока (BS) для получения из него выходного аудиосигнала (OS), причем битовый поток (BS) содержит по меньшей мере активную фазу, за которой следует по меньшей мере неактивная фаза, в котором битовый поток (BS) имеет закодированный в нем по меньшей мере кадр (SI) дескриптора вставки молчания, который описывает спектр фонового шума (SBN), причем аудиодекодер (1) содержит:

декодер (3) дескриптора вставки молчания, выполненный с возможностью декодирования кадра (SI) дескриптора вставки молчания для восстановления спектра (SBN) фонового шума;

устройство (2) декодирования, выполненное с возможностью восстановления выходного аудиосигнала (OS) из битового потока во время активной фазы;

спектральный преобразователь (4), выполненный с возможностью определения спектра (SAS) выходного аудиосигнала (OS);

устройство (5) оценивателя шума, выполненное с возможностью определения первого спектра (SN1) шума выходного аудиосигнала (OS), основываясь на спектре (SAS) выходного аудиосигнала (OS), обеспечиваемом спектральным преобразователем (4), в котором первый спектр (SN1) шума выходного аудиосигнала (OS) имеет более высокое спектральное разрешение, чем спектр (SBN) фонового шума;

преобразователь (6) разрешения, выполненный с возможностью установления второго спектра (SN2) шума выходного аудиосигнала (OS), основываясь на первом спектре (SN1) шума выходного аудиосигнала (OS), в котором второй спектр (SN2) шума выходного аудиосигнала (OS) имеет такое же спектральное разрешение, что и спектр (SBN) фонового шума;

устройство (7) оценки спектра комфортного шума, имеющее устройство (7a) вычисления масштабных коэффициентов, выполненное с возможностью вычисления масштабных коэффициентов (SF) для спектра (SCN) для комфортного шума (CN), основываясь на спектре (SBN) фонового шума, обеспечиваемом декодером (3) дескриптора вставки молчания, и основываясь на втором спектре (SN2) шума выходного аудиосигнала (OS), обеспечиваемом преобразователем (6) разрешения, и имеющее генератор (7b) спектра комфортного шума, выполненный с возможностью вычисления спектра (SCN) для комфортного шума (CN), основываясь на масштабных коэффициентах (SF); и

генератор (8) комфортного шума, выполненный с возможностью получения комфортного шума (CN) во время неактивной фазы, основываясь на спектре (SCN) для комфортного шума (CN).

2. Аудиодекодер по п. 1, в котором спектральный анализатор (4) содержит устройство (4) быстрого преобразования Фурье.

3. Аудиодекодер по п. 1, в котором устройство (5) оценивателя шума содержит устройство (9) преобразователя, выполненное с возможностью преобразования спектра (SAS) выходного аудиосигнала (OS) в преобразованный спектр (CSA) выходного аудиосигнала (OS), который имеет такое же или меньшее спектральное разрешение, чем спектр (SAS) выходного аудиосигнала, и более высокое спектральное разрешение, чем спектр (SBN) фонового шума.

4. Аудиодекодер по п. 3, в котором устройство (5) оценивателя шума содержит оцениватель (10) шума, выполненный с возможностью определения первого спектра (SN1) шума выходного аудиосигнала (OS), основываясь на преобразованном спектре (CSA) выходного аудиосигнала (OS), обеспечиваемом устройством (9) преобразователя.

5. Аудиодекодер по п. 1, в котором устройство (7a) вычисления масштабных коэффициентов выполнено с возможностью вычисления масштабных коэффициентов (SF) по формуле , в которой обозначает масштабный коэффициент (SF) для группы i частотных полос спектра (SCN) комфортного шума (CN), в которой обозначает уровень группы i частотных полос спектра (SBN) фонового шума, в которой обозначает уровень группы i частотных полос второго спектра (SN2) шума выходного аудиосигнала (OS), в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра (SBN) фонового шума и второго спектра (SN2) шума выходного аудиосигнала (OS).

6. Аудиодекодер по п. 1, в котором генератор (7b) спектра комфортного шума выполнен с возможностью вычисления спектра комфортного шума (SCN), основываясь на масштабных коэффициентах (SF) и основываясь на первом спектре (SN1) шума выходного аудиосигнала (OS), обеспечиваемом устройством (5) оценки шума.

7. Аудиодекодер по п. 1, в котором генератор (7b) спектра комфортного шума выполнен с возможностью вычисления спектра (SCN) комфортного шума по формуле , в которой обозначает уровень частотной полосы k спектра комфортного шума (SCN), в которой обозначает масштабный коэффициент (SF) группы i частотных полос спектра (SBN) фонового шума и второго спектра (SN2) шума выходного аудиосигнала, в которой обозначает уровень частотной полосы k первого спектра (SN1) шума выходного аудиосигнала (OS), в которой k=bLR(i), …, bLR(i+1)-1, в которой bLR(i) представляет собой первую частотную полосу одной из групп частотных полос, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра (SBN) фонового шума и второго спектра (SN2) шума выходного аудиосигнала (OS).

8. Аудиодекодер по п. 1, в котором преобразователь (6) разрешения содержит первую ступень (11) преобразователя, выполненную с возможностью установления третьего спектра (SN3) шума выходного аудиосигнала (OS), основываясь на первом спектре (SN1) шума выходного аудиосигнала (OS), в котором спектральное разрешение третьего спектра (SN3) шума выходного аудиосигнала (OS) такое же или выше спектрального разрешения первого спектра (SN1) шума выходного аудиосигнала (OS) и в котором преобразователь (6) разрешения содержит вторую ступень (12) преобразователя, выполненную с возможностью установления второго спектра (SN2) шума выходного аудиосигнала (OS).

9. Аудиодекодер по п. 8, в котором генератор (7b) спектра комфортного шума выполнен с возможностью вычисления спектра комфортного шума (SCN), основываясь на масштабных коэффициентах (SF) и основываясь на третьем спектре (SN3) шума выходного аудиосигнала (OS), обеспечиваемом первой ступенью (11) преобразователя в преобразователе (6) разрешения.

10. Аудиодекодер по п. 8, в котором генератор (7b) спектра комфортного шума выполнен с возможностью вычисления спектра (SCN) комфортного шума по формуле , в которой обозначает уровень частотной полосы k спектра комфортного шума (SCN), в которой обозначает масштабный коэффициент (SF) группы i частотных полос спектра (SBN) фонового шума и второго спектра (SN2) шума выходного аудиосигнала, в которой обозначает уровень частотной полосы k третьего спектра (SN3) шума выходного аудиосигнала (OS), в которой k=bLR(i), …, bLR(i+1)-1, в которой bLR(i) представляет собой первую частотную полосу группы частотных полос, в которой i=0, …, LLR-1, в которой LLR представляет собой количество групп частотных полос спектра (SBN) фонового шума и второго спектра (SN2) шума выходного аудиосигнала (OS).

11. Аудиодекодер по п. 1, в котором генератор (8) комфортного шума содержит первый быстрый преобразователь (15) Фурье, выполненный с возможностью регулировки уровней частотных полос комфортного шума (CN) в области быстрого преобразования Фурье, и второй быстрый преобразователь (16) Фурье для получения по меньшей мере части комфортного шума, основываясь на выходном сигнале первого быстрого преобразователя (15) Фурье.

12. Аудиодекодер по п. 1, в котором устройство (2) декодирования содержит основной декодер (17), выполненный с возможностью получения выходного аудиосигнала (OS) во время активной фазы.

13. Аудиодекодер по п. 1, в котором устройство (2) декодирования содержит основной декодер (17), выполненный с возможностью получения аудиосигнала (AS), и модуль (20) расширения полосы частот, выполненный с возможностью получения выходного аудиосигнала (OS), основываясь на аудиосигнале (AS), обеспечиваемом основным декодером (17).

14. Аудиодекодер по п. 13, в котором модуль (20) расширения полосы частот содержит декодер (21) копирования спектральной полосы, анализатор (22) квадратурного зеркального фильтра и/или синтезатор (23) квадратурного зеркального фильтра.

15. Аудиодекодер по п. 13, в котором комфортный шум (CN), обеспечиваемый быстрым синтезатором (15) Фурье, подается на модуль (17) расширения полосы частот.

16. Аудиодекодер по п. 13, в котором генератор (8) комфортного шума содержит устройство (24) регулятора квадратурного зеркального фильтра, выполненное с возможностью регулировки уровней частотных полос комфортного шума (CN) в области квадратурного зеркального фильтра, причем выходной сигнал синтезатора (24) квадратурного зеркального фильтра подается на модуль (20) расширения полосы частот.

17. Система для получения битового потока и декодирования битового потока, содержащая декодер (1) и кодер (100), в которой декодер (1) выполнен по одному из пп. 1-16.

18. Способ декодирования битового потока (BS) аудио для получения из него выходного аудиосигнала (OS), причем битовый поток (BS) содержит по меньшей мере активную фазу, за которой следует по меньшей мере неактивная фаза, в котором битовый поток (BS) имеет кодированный в нем по меньшей мере кадр (SI) дескриптора вставки молчания, который описывает спектр фонового шума (SBN), причем способ содержит этапы:

декодирования кадра (SI) дескриптора вставки молчания для восстановления спектра (SBN) фонового шума;

восстановления выходного аудиосигнала (OS) из битового потока во время активной фазы;

определения спектра (SAS) выходного аудиосигнала (OS);

определения первого спектра (SN1) шума выходного аудиосигнала (OS), основываясь на спектре (SAS) выходного аудиосигнала (OS), в котором первый спектр (SN1) шума выходного аудиосигнала (OS) имеет более высокое спектральное разрешение, чем спектр (SBN) фонового шума;

установления второго спектра (SN2) шума выходного аудиосигнала (OS), основываясь на первом спектре (SN1) шума выходного аудиосигнала (OS), в котором второй спектр (SN2) шума выходного аудиосигнала (OS) имеет такое же спектральное разрешение, что и спектр (SBN) фонового шума;

вычисления масштабных коэффициентов для спектра (SCN) для комфортного шума (CN), основываясь на спектре (SBN) фонового шума и основываясь на втором спектре (SN2) шума выходного аудиосигнала (OS); и

получения комфортного шума (CN) во время неактивной фазы, основываясь на спектре (SCN) для комфортного шума (CN).

19. Машиночитаемый носитель, содержащий компьютерную программу для выполнения способа по п. 18 при исполнении ее на компьютере или процессоре.



 

Похожие патенты:

Изобретение относится к декодированию и кодированию информации. Технический результат изобретения заключается в возможности получения высококачественного реалистического звука.

Изобретение относится к средствам для кодирования и декодирования звукового сигнала. Технический результат заключается в повышении эффективности кодирования аудио.

Изобретение относится к области кодирования и декодирования аудиосигнала. Техническим результатом является повышение эффективности кодирования.

Изобретение относится к средствам для кодирования аудио. Технический результат заключается в повышении качества кодирования аудио.

Изобретение относится к средствам для параметрической реконструкции аудиосигналов. Технический результат заключается в повышении эффективности кодирования многоканального аудиосигнала.

Изобретение относится к кодированию и аудиоданных. Технический результат изобретения заключается в получении высококачественного реалистичного звучания при понижающем микшировании многоканальных аудиоданных.

Изобретение относится к классификации многоканального или стереофонического звукового сигнала для кодера звукового сигнала и, в частности, к кодеру многоканального или стереофонического звукового сигнала, предназначенного для использования в портативном устройстве.

Изобретение относится к средствам для кодирования и декодирования аудио. Технический результат заключается в сокращении количества битов, необходимых для кодирования спектра, при сохранении качества звука.

Изобретение относится к средствам для распределения битов по поддиапазонам при кодировании аудио. Технический результат заключается в повышении эффективности распределения битов в области частот, важной для восприятия.

Изобретение относится к устройствам декодирования и кодирования информации. Технический результат заключается в повышении эффективности кодирования для получения высококачественного реалистического звука.
Изобретение относится к средствам для обработки звукового сигнала. Технический результат заключается в повышении эффективности многоканального прямого-окружающего разложения звукового сигнала. Каждый из двух или более входных звуковых канальных сигналов содержит части прямого сигнала и части окружающего сигнала. Устройство для генерирования одного или нескольких выходных звуковых канальных сигналов содержит модуль определения фильтра для определения фильтра путем оценки первой информации спектральной плотности мощности и оценки второй информации спектральной плотности мощности. Помимо этого устройство содержит процессор обработки сигналов для генерирования одного или нескольких выходных звуковых канальных сигналов путем применения фильтра на двух или более входных звуковых канальных сигналах. Первая информация спектральной плотности мощности указывает информацию спектральной плотности мощности по двум или более входным звуковым канальным сигналам. 3 н. и 12 з.п. ф-лы, 7 ил.
Изобретение относится к аудио кодированию и декодированию. Технический результат заключается в повышении эффективности кодирования аудио. Система для определения таблицы диапазонов главного масштабного коэффициента высокочастотного сигнала в составе аудио сигнала, который должен быть сгенерирован на основании низкочастотного сигнала в составе аудио сигнала, с использованием схемы высокочастотной реконструкции, сконфигурирована для: получения набора параметров, передаваемых от устройства кодирования аудио сигнала наряду с потоком аудио битов; хранения множества предварительно определенных таблиц диапазонов масштабного коэффициента в памяти системы; определения таблицы диапазонов главного масштабного коэффициента посредством выбора одной конкретной из предварительно определенных таблиц диапазонов масштабного коэффициента. 5 н. и 28 з.п. ф-лы, 5 ил., 3 табл.

Изобретение относится к технике связи. Технический результат – улучшение акустического качества сигнала, полученного после восстановления шумовой составляющей. Данный способ включает в себя этапы, на которых: принимают битовый поток и декодируют битовый поток, чтобы получить речевой/звуковой сигнал; определяют первый речевой/звуковой сигнал в соответствии с речевым/звуковым сигналом; определяют символ каждого выборочного значения в первом речевом/звуковом сигнале и значение амплитуды каждого выборочного значения в первом речевом/звуковом сигнале; определяют длину адаптивной нормализации; определяют скорректированное значение амплитуды каждого выборочного значения в соответствии с длиной адаптивной нормализации и значением амплитуды каждого выборочного значения и определяют второй речевой/звуковой сигнал в соответствии с символом каждого выборочного значения и скорректированным значением амплитуды каждого выборочного значения. 2 н. и 20 з.п. ф-лы, 7 ил.

Изобретение относится к средствам для кодирования аудио. Технический результат заключается в повышении эффективности кодирования. Основанный на линейном предсказании аудиодекодер содержит: модуль оценки распределений вероятностей, сконфигурированный с возможностью определять, для каждой из множества спектральных компонент, оценку распределения вероятностей из информации коэффициентов линейного предсказания, содержащейся в потоке данных, в который закодирован аудиосигнал; каскад энтропийного декодирования и деквантования, сконфигурированный с возможностью осуществлять энтропийное декодирование и деквантование спектра, составленного из упомянутого множества спектральных компонент, из потока данных с использованием оценки распределения вероятностей, которая определена для каждой из упомянутого множества спектральных компонент; и фильтр, сконфигурированный с возможностью формировать спектр согласно передаточной функции, зависящей от синтезирующего фильтра линейного предсказания, определенного посредством информации коэффициентов линейного предсказания. 6 н. и 24 з.п. ф-лы, 14 ил.

Изобретение относится к области аудиокодирования/декодирования. Технический результат – обеспечение доставки аудиоконтента по каналу передачи с переменной битовой скоростью передачи и повышение качества звука. Аудиодекодер содержит устройство определения, выполненное с возможностью определения, является ли кадр кодированных аудиоданных специальным кадром, содержащим кодированные значения аудиовыборки, и дополнительную информацию, содержащую кодированные значения аудиовыборки нескольких кадров, предшествующих специальному кадру, чтобы инициализировать декодер для возможности декодирования значений аудиовыборки, ассоциированных со специальным кадром, если специальный кадр является первым кадром после запуска декодера. Декодер содержит устройство инициализации, выполненное с возможностью инициализации декодера, при этом инициализация декодера содержит декодирование кодированных значений аудиовыборки, введенных в дополнительную информацию перед тем, как декодировать кодированные значения аудиовыборки, ассоциированные со специальным кадром. 6 н. и 15 з.п. ф-лы, 11 ил., 2 табл.

Изобретение относится к средствам для кодирования и декодирования речи. Технический результат заключается в уменьшении опережающего и запаздывающего эха. Декодер речи включает в себя блок демультиплексирования, блок декодирования низкочастотной полосы, блок банка фильтров разделения полосы частот, блок анализа кодированной последовательности, блок декодирования/деквантования кодированной последовательности, блок генерирования высокочастотной полосы, блоки вычисления временной огибающей низкочастотной полосы, которые получают множество временных огибающих низкочастотной полосы, блок вычисления временной огибающей, который вычисляет временные огибающие высокочастотной полосы, используя информацию о временной огибающей и множество временных огибающих низкочастотной полосы, блок коррекции временной огибающей, который корректирует временную огибающую составляющих высокочастотной полосы, используя временные огибающие, полученные блоком вычисления временной огибающей, и блок банка фильтров синтеза полосы частот. 2 н.п. ф-лы, 40 ил.

Изобретение относится к кодированию и декодированию аудиосигналов. Технический результат изобретения заключается в улучшении эффективности кодирования, обработки и декодирования аудиосигналов. Декодер содержит интерфейс (110) приема входного аудиосигнала, содержащего множество сигналов аудиообъектов, для приема информации громкости о сигналах аудиообъектов и информации воспроизведения, указывающей, должен ли один или более из сигналов аудиообъектов усиливаться или ослабляться. Декодер содержит сигнальный процессор (120) для генерирования упомянутых одного или более выходных аудиоканалов выходного аудиосигнала. Сигнальный процессор (120) сконфигурирован с возможностью определять значение компенсации громкости в зависимости от информации громкости и в зависимости от информации воспроизведения. Сигнальный процессор (120) сконфигурирован с возможностью генерировать упомянутые один или более выходных аудиоканалов выходного аудиосигнала из входного аудиосигнала в зависимости от информации воспроизведения и в зависимости от значения компенсации громкости. 7 н. и 9 з.п. ф-лы, 12 ил.

Изобретение относится к аудиокодированию, в частности к аудиокодированию, основанному на LPC-подобной обработке в контексте кодовых книг. Технический результат – обеспечение улучшенной концепции для генерации сигнала маскирования ошибок. Устройство для генерации сигнала маскирования ошибок содержит: генератор представления LPC для генерации заменяющего представления LPC; вычислитель усиления для вычисления информации об усилении по представлениям LPC; компенсатор для компенсации влияния усиления заменяющего представления LPC с использованием информации об усилении и синтезатор LPC для фильтрации информации кодовой книги с использованием заменяющего представления LPC для получения сигнала маскирования ошибок, при этом компенсатор выполнен с возможностью умножения на весовые коэффициенты информации кодовой книги или выходного сигнала синтезирования LPC. 3 н. и 12 з.п. ф-лы, 19 ил.

Изобретение относится к средствам для гармонического расширения полосы аудиосигналов. Технический результат заключается в повышении качества синтезированной части верхней полосы выходного сигнала. Разделяют, в устройстве, входной аудиосигнал на, по меньшей мере, сигнал нижней полосы и сигнал верхней полосы. Сигнал нижней полосы соответствует диапазону нижней полосы частот, и сигнал верхней полосы соответствует диапазону верхней полосы частот. Выбирают функцию нелинейной обработки из множества функций нелинейной обработки. Генерируют первый расширенный сигнал на основании сигнала нижней полосы и функции нелинейной обработки. Генерируют по меньшей мере один регулировочный параметр на основании первого расширенного сигнала, сигнала верхней полосы или их обоих. 6 н. и 44 з.п. ф-лы, 6 ил.

Изобретение относится к средствам для декодирования кодированного аудиосигнала. Технический результат заключается в повышении качества декодированного аудиосигнала. Устройство для декодирования кодированного аудиосигнала, содержащего кодированный базовый сигнал и параметрические данные, содержит: базовый декодер для декодирования кодированного базового сигнала, чтобы получать декодированный базовый сигнал; анализатор для анализа декодированного базового сигнала до или после выполнения операции повторного формирования частоты, чтобы предоставлять результат анализа; и модуль повторного формирования частоты для повторного формирования спектральных частей, не включенных в декодированный базовый сигнал, с использованием спектральной части декодированного базового сигнала, параметрических данных и результата анализа. 6 н. и 12 з.п. ф-лы, 35 ил.
Наверх