Способ и устройство для разложения стереофонической записи с использованием обработки в частотной области, применяющей генератор спектральных весов

Изобретение относится к средствам для формирования стереофонического бокового сигнала из стереофонического входного сигнала. Технический результат заключается в обеспечении возможности формирования дополнительных каналов из стереофонического входного сигнала. Устройство содержит генератор информации об изменении для формирования информации об изменении на основании информации о среднем/боковом сигнале. Кроме того, устройство содержит блок манипулирования сигналами, выполненный с возможностью манипулирования первым входным каналом на основании информации об изменении для получения первого бокового канала, и выполненный с возможностью манипулирования вторым входным каналом на основании информации об изменении для получения второго бокового канала. Генератор информации об изменении содержит генератор спектральных весов для формирования информации об изменении путем формирования первого спектрального весового коэффициента на основании монофонического среднего сигнала и монофонического бокового сигнала в стереофоническом входном сигнале. 7 н. и 9 з.п. ф-лы, 24 ил., 1 табл.

 

Настоящее изобретение относится к обработке звуковых сигналов и в частности к способу и устройству для разложения стереофонической записи с использованием обработки в частотной области.

В обработке звуковых сигналов достигнут прогресс во многих отношениях. В частности, системы объемного звучания становятся все более и более важными. Однако большинство музыкальных записей по-прежнему кодируется и передается в виде стереофонического сигнала, а не в виде многоканального сигнала. Поскольку системы объемного звучания содержат множество громкоговорителей, например четыре или пять динамиков, предметом многих исследований стало то, какие сигналы следует подавать во множество громкоговорителей, когда доступно только два входных сигнала.

В этом смысле важную роль играет преобразование формата стереофонических сигналов для воспроизведения с использованием систем объемного звучания, то есть повышающее микширование. Термин «повышающее микширование m в n» описывает преобразование m-канального звукового сигнала в звуковой сигнал с n каналами, где n>m. Широко известны два подхода к повышающему микшированию: повышающее микширование с дополнительной информацией, управляющей процессом повышающего микширования, и неуправляемое («слепое») повышающее микширование без использования какой-либо дополнительной информации, которому здесь уделяется внимание.

В литературе описаны два разных подхода к процессу повышающего микширования. Этими идеями является прямой/основанный на окружении подход и «внутриполосный» подход. Основной составляющей прямых/основанных на окружении методик является извлечение окружающего сигнала, который подается в тыловые каналы многоканального сигнала объемного звучания. Окружающие звуки являются звуками, формирующими ощущение (виртуальной) среды прослушивания, включая реверберацию в помещении, зрительские звуки (например, аплодисменты), звуки окружающей среды (например, дождь), звуки для художественных эффектов (например, потрескивание винила) и фоновый шум. Воспроизведение окружения с использованием тыловых каналов вызывает у слушателя ощущение «обволакивания» («погружения в звук»). Кроме того, источники прямого звука распределяются по передним каналам в соответствии с их положением в стереофонической панораме.

«Внутриполосный» подход направлен на размещение всех звуков (прямой звук, а также окружающие звуки) вокруг слушателя с использованием всех доступных громкоговорителей. Положения источников звука, воспринимаемые при воспроизведении формата повышающего микширования, в идеале зависят от их воспринимаемых положений в стереофоническом входном сигнале. Этот подход может быть реализован с использованием предложенной обработки сигналов.

Ранее разработаны различные подходы к повышающему микшированию в частотной области [9, 10]. Они предпринимают попытку разложения входного сигнала на составляющую прямого и окружающего сигнала и разложения на основании пространственных положений источников звука. Составляющие окружающего сигнала идентифицируются на основании показателей межканальной когерентности между левым и правым каналом. Основанное на направлении разложение достигается на основании подобия величин спектральных коэффициентов. Заявка на патент US 2009/0080666 описывает способ извлечения окружающего сигнала с использованием спектрального взвешивания.

US 2010/0030563 описывает способ извлечения окружающего сигнала для применения повышающего микширования. Этот способ использует спектральное вычитание. Представление частотно-временной области получают из разности представления частотно-временной области у входного сигнала и его сжатой версии, предпочтительно вычисленной с использованием неотрицательной матричной факторизации.

US 2010/0296672 описывает способ повышающего микширования в частотной области, использующий векторное разложение сигнала. Это разложение направлено на извлечение центрированного канала в отличие от разложения прямого/окружающего сигнала [13]. Вычисляется выходной сигнал для центрального канала, который содержит всю информацию, общую для сигналов левого и правого входных каналов. Разностный сигнал у входных сигналов и сигналов центрального канала вычисляется для сигналов левого и правого выходных каналов.

Задача настоящего изобретения состоит в создании усовершенствованных концепций формирования дополнительных каналов из стереофонического входного сигнала, содержащего первый входной канал и второй входной канал. Задача настоящего изобретения решается устройством для формирования стереофонического бокового сигнала по п. 1 формулы, устройством для формирования стереофонического среднего сигнала по пункту 10 формулы, способом формирования стереофонического бокового сигнала по п. 12 формулы, способом формирования стереофонического среднего сигнала по п. 13 формулы и компьютерной программой по п. 15 формулы.

Предложено устройство для формирования стереофонического бокового сигнала, содержащего первый боковой канал и второй боковой канал, из стереофонического входного сигнала, содержащего первый входной канал и второй входной канал. Устройство содержит генератор информации об изменении для формирования информации об изменении на основании информации о среднем/боковом сигнале. Кроме того, устройство содержит блок манипулирования сигналами, выполненный с возможностью манипулирования первым входным каналом на основании информации об изменении для получения первого бокового канала, и выполненный с возможностью манипулирования вторым входным каналом на основании информации об изменении для получения второго бокового канала.

Генератор информации об изменении может содержать спектральный вычитатель для формирования информации об изменении путем формирования значения разности, указывающего разность между монофоническим средним сигналом или монофоническим боковым сигналом и первым или вторым входным каналом. Либо генератор информации об изменении может содержать генератор спектральных весов для формирования информации об изменении путем формирования первого спектрального весового коэффициента на основании монофонического среднего сигнала и монофонического бокового сигнала в стереофоническом входном сигнале.

Информация о среднем/боковом сигнале может быть монофоническим средним сигналом в стереофоническом входном сигнале, монофоническим боковым сигналом в стереофоническом входном сигнале и/или отношением между монофоническим средним сигналом и монофоническим боковым сигналом в стереофоническом входном сигнале. В варианте осуществления генератор информации об изменении выполнен с возможностью формирования информации об изменении на основании монофонического среднего сигнала в стереофоническом входном сигнале или на основании монофонического бокового сигнала в стереофоническом входном сигнале в качестве информации о среднем/боковом сигнале.

В соответствии с вариантом осуществления стереофоническая запись раскладывается на боковой и средний сигнал, которые, в отличие от обычного среднебокового (M-S) разложения, являются стереофоническими сигналами. Может применяться разделение сигналов, использующее фазовую нейтрализацию как в обычной M-S-обработке, совместно с обработкой в частотной области, а именно спектральным вычитанием или спектральным взвешиванием. Выведенные сигналы могут применяться для воспроизведения звуковых сигналов с дополнительными каналами воспроизведения.

Устройство в соответствии с вариантом осуществления раскладывает 2-канальную стереофоническую запись на стереофонический боковой сигнал и стереофонический средний сигнал. Стереофонический боковой сигнал обладает двумя основными характеристиками. Во-первых, он содержит все составляющие сигнала за исключением тех, которые панорамированы в центр. В этой связи он аналогичен боковому сигналу, который известен из среднебоковой обработки стереофонических сигналов. Фактически, он содержит такие же составляющие сигнала, как и боковой сигнал, выведенный посредством обычного M-S-разложения.

Важное отличие между предложенным стереофоническим боковым сигналом и обычным боковым сигналом описывается стереофоническим свойством: стереофонический боковой сигнал является 2-канальным стереофоническим сигналом в отличие от традиционного бокового сигнала, который является монофоническим. Левый канал стереофонического бокового сигнала содержит все составляющие сигнала, которые панорамированы к левой стороне во входном сигнале. Правый канал стереофонического сигнала содержит все составляющие сигнала, которые панорамированы к правой стороне.

Стереофонический средний сигнал является стереофоническим сигналом, который содержит все составляющие, которые существуют в обоих входных каналах. Он является 2-канальным стереофоническим сигналом и содержит меньше стереофонической информации по сравнению с входным сигналом и по сравнению со стереофоническим боковым сигналом, но он не является монофоническим сигналом, как традиционный средний сигнал. Он содержит такие же составляющие сигнала, как и традиционный средний сигнал, но вместе с исходной стереофонической информацией.

В соответствии с вариантом осуществления генератор информации об изменении содержит спектральный вычитатель. Спектральный вычитатель может быть выполнен с возможностью формирования информации об изменении путем вычитания значения величины или взвешенного значения величины первого или второго входного канала из значения величины или взвешенного значения величины монофонического среднего сигнала или монофонического бокового сигнала в стереофоническом входном сигнале. Либо спектральный вычитатель может быть выполнен с возможностью формирования информации об изменении путем вычитания значения величины или взвешенного значения величины монофонического среднего сигнала или монофонического бокового сигнала в стереофоническом входном сигнале из значения величины или взвешенного значения величины первого или второго входного канала.

Кроме того, генератор информации об изменении может содержать определитель величины. Определитель величины может быть выполнен с возможностью приема по меньшей мере одного из первого входного канала, второго входного канала, монофонического среднего сигнала или монофонического бокового сигнала, представляемых в спектральной области, в качестве принятого входного сигнала величины. Кроме того, определитель величины может быть выполнен с возможностью определения по меньшей мере одного значения величины у каждого принятого входного сигнала величины и может быть выполнен с возможностью передачи по меньшей мере одного значения величины у каждого принятого входного сигнала величины в спектральный вычитатель.

В варианте осуществления спектральный вычитатель содержит первый блок спектрального вычитания и второй блок спектрального вычитания, причем определитель величины выполнен с возможностью приема первого и второго входного канала и монофонического среднего сигнала, причем определитель величины выполнен с возможностью определения первого значения величины у первого входного канала, второго значения величины у второго входного канала и третьего значения величины у монофонического среднего сигнала, причем определитель величины выполнен с возможностью передачи первого, второго и третьего значения величины в спектральный вычитатель. Первый блок спектрального вычитания может быть выполнен с возможностью осуществления первого спектрального вычитания на основании первого значения величины у первого входного канала и третьего значения величины у монофонического среднего сигнала, чтобы получить первое стереофоническое боковое значение величины у первого стереофонического бокового сигнала, и причем второй блок спектрального вычитания выполнен с возможностью осуществления второго спектрального вычитания на основании второго значения величины у второго входного канала и третьего значения величины у монофонического среднего сигнала, чтобы получить второе стереофоническое боковое значение величины у второго стереофонического бокового сигнала.

Первый блок спектрального вычитания может быть выполнен с возможностью осуществления первого спектрального вычитания путем применения формулы:

где указывает первый стереофонический боковой спектр величины, когда результат спектрального вычитания положительный, причем |Xl(f)| указывает первый спектр величины у первого входного канала, причем |M1(f)| указывает третий спектр величины у монофонического среднего сигнала, и причем w указывает скалярный множитель в диапазоне 0≤w≤1. Второй блок спектрального вычитания может быть выполнен с возможностью осуществления второго спектрального вычитания путем применения формулы:

причем указывает второй стереофонической боковой спектр величины, когда результат спектрального вычитания положительный, причем |Xr(f)| указывает второй спектр величины у первого входного канала, причем |M1(f)| указывает третий спектр величины у монофонического среднего сигнала, и причем w указывает скалярный множитель в диапазоне 0≤w≤1.

В варианте осуществления блок манипулирования сигналами может содержать блок извлечения фазы и объединитель. Блок извлечения фазы может быть выполнен с возможностью приема первого входного канала и второго входного канала, причем блок извлечения фазы выполнен с возможностью определения первого значения фазы у первого входного канала в качестве первого стереофонического бокового значения фазы и второго значения фазы у второго входного канала в качестве второго стереофонического бокового значения фазы. Блок извлечения фазы может быть выполнен с возможностью передачи первого стереофонического бокового значения фазы и второго стереофонического бокового значения фазы в объединитель, причем первый блок спектрального вычитания выполнен с возможностью передачи первого стереофонического бокового значения величины в объединитель, причем второй блок спектрального вычитания выполнен с возможностью передачи второго стереофонического бокового значения фазы в объединитель. Объединитель может быть выполнен с возможностью объединения первого стереофонического бокового значения величины и первого стереофонического бокового значения фазы, чтобы получить первый комплексный коэффициент первого спектра первого бокового канала. Кроме того, объединитель может быть выполнен с возможностью объединения второго стереофонического бокового значения величины и второго стереофонического бокового значения фазы, чтобы получить второй комплексный коэффициент второго спектра второго бокового канала.

В соответствии с вариантом осуществления генератор информации об изменении содержит генератор спектральных весов для формирования информации об изменении путем формирования первого спектрального весового коэффициента, причем первый спектральный весовой коэффициент зависит от монофонического среднего сигнала и монофонического бокового сигнала в стереофоническом входном сигнале.

Генератор информации об изменении может дополнительно содержать определитель величины. Определитель величины может быть выполнен с возможностью приема монофонического среднего сигнала, представляемого в спектральной области. Определитель величины может быть выполнен с возможностью приема монофонического бокового сигнала, представляемого в спектральной области, причем определитель величины выполнен с возможностью определения значения величины у монофонического бокового сигнала в качестве бокового значения величины, и при этом определитель величины выполнен с возможностью определения значения величины у монофонического среднего сигнала в качестве среднего значения величины. Определитель величины может быть выполнен с возможностью передачи бокового значения величины и среднего значения величины в генератор спектральных весов. Генератор спектральных весов может быть выполнен с возможностью формирования первого спектрального весового коэффициента на основании отношения первого числа ко второму числу, причем первое число зависит от бокового значения величины, и причем второе число зависит от среднего значения величины и бокового значения величины.

В дополнительном варианте осуществления генератор спектральных весов выполнен с возможностью формирования коэффициента изменения в соответствии с формулой

причем |S(f)| указывает значение величины у монофонического бокового сигнала, причем |M(f)| указывает значение величины у монофонического среднего сигнала, и причем α, β, γ и δ являются скалярными множителями. В варианте осуществления α и β больше 0 (α>0; β>0); а γ и δ выбраны так, что 0≤γ≤1 и 0≤δ≤1. Предпочтительно, чтобы 4≥α>0 и 4≥β>0.

Кроме того, генератор спектральных весов может быть выполнен с возможностью формирования коэффициента модификации в соответствии с формулой:

либо при этом генератор спектральных весов выполнен с возможностью формирования коэффициента модификации в соответствии с формулой:

при

причем |S(f)| указывает спектр величины у монофонического бокового сигнала, причем |M(f)| указывает спектр величины у монофонического бокового сигнала, причем |Xl(f)| указывает спектр величины у первого входного канала, причем |Xr(f)| указывает спектр величины у первого входного канала, где M(f) указывает монофонический средний сигнал, и причем α, β, γ, δ и η являются скалярными множителями.

В соответствии с вариантом осуществления генератор информации об изменении выполнен с возможностью формирования информации об изменении на основании монофонического среднего сигнала в стереофоническом входном сигнале или на основании монофонического бокового сигнала в стереофоническом входном сигнале в качестве информации о среднем/боковом сигнале. Монофонический средний сигнал может зависеть от суммарного сигнала, получающегося в результате сложения первого и второго входного канала. Монофонический боковой сигнал может зависеть от разностного сигнала, получающегося в результате вычитания второго входного канала из первого входного канала.

Кроме того, устройство может дополнительно содержать генератор канала, причем генератор канала выполнен с возможностью формирования монофонического среднего сигнала или монофонического бокового сигнала на основании первого и второго входного канала.

Кроме того, устройство может дополнительно содержать блок преобразования для преобразования первого и второго входного канала в стереофоническом входном сигнале из временной области в спектральную область и блок обратного преобразования. Блок манипулирования сигналами может быть выполнен с возможностью манипулирования первым входным каналом, представляемым в спектральной области, и вторым входным каналом, представляемым в спектральной области, чтобы получить стереофонический боковой сигнал, представляемый в спектральной области. Блок обратного преобразования может быть выполнен с возможностью преобразования стереофонического бокового сигнала, представляемого в спектральной области, из спектральной области во временную область.

В варианте осуществления устройство может быть выполнено с возможностью формирования стереофонического среднего сигнала, содержащего первый средний канал и второй средний канал. Первый средний канал может формироваться на основании разности между первым стереофоническим входным каналом и первым боковым каналом. Второй средний канал может формироваться на основании разности между вторым стереофоническим входным каналом и вторым боковым каналом.

В соответствии с другим вариантом осуществления предоставляется устройство для формирования стереофонического среднего сигнала, содержащего первый средний канал и второй средний канал, из стереофонического входного сигнала, содержащего первый входной канал и второй входной канал. Устройство содержит генератор информации об изменении для формирования информации об изменении на основании информации о среднем/боковом сигнале и блок манипулирования сигналами, приспосабливаемый для манипулирования первым входным каналом на основании информации об изменении, чтобы получить первый средний канал, и приспосабливаемый для манипулирования вторым входным каналом на основании информации об изменении, чтобы получить второй средний канал.

В соответствии с вариантом осуществления генератор информации об изменении может содержать генератор спектральных весов для формирования информации об изменении путем формирования первого спектрального весового коэффициента. Первый спектральный весовой коэффициент может зависеть от монофонического среднего сигнала и монофонического бокового сигнала в стереофоническом входном сигнале. Генератор информации об изменении может дополнительно содержать определитель величины, причем определитель величины выполнен с возможностью определения значения величины у монофонического бокового сигнала, представляемого в спектральной области, в качестве бокового значения величины, и при этом определитель величины выполнен с возможностью определения значения величины у монофонического среднего сигнала, представляемого в спектральной области, в качестве среднего значения величины. Определитель величины может быть выполнен с возможностью передачи бокового значения величины и среднего значения величины в генератор спектральных весов. Генератор спектральных весов может быть выполнен с возможностью формирования первого спектрального весового коэффициента на основании отношения первого числа ко второму числу, причем первое число зависит от бокового значения величины, и причем второе число зависит от среднего значения величины и бокового значения величины.

Генератор спектральных весов может быть выполнен с возможностью формирования коэффициента модификации в соответствии с формулой

причем |M(f)| указывает спектр величины у монофонического среднего сигнала, где |S(f)| указывает спектр величины у монофонического бокового сигнала, и где α, β, γ и δ являются скалярными множителями. В варианте осуществления α и β больше 0 (α>0; β>0); а γ и δ выбираются так, что 0≤γ≤1 и 0≤δ≤1. Предпочтительно, чтобы 4≥α>0 и 4≥β>0.

Варианты осуществления настоящего изобретения объясняются со ссылкой на прилагаемые чертежи, на которых:

Фиг. 1 иллюстрирует устройство для формирования стереофонического бокового сигнала в соответствии с вариантом осуществления,

Фиг. 1a иллюстрирует устройство для формирования стереофонического бокового сигнала в соответствии с вариантом осуществления, в котором генератор информации о манипуляции содержит спектральный вычитатель,

Фиг. 1b иллюстрирует устройство для формирования стереофонического бокового сигнала в соответствии с вариантом осуществления, в котором генератор информации об изменении содержит генератор спектральных весов,

Фиг. 2 иллюстрирует спектральный вычитатель в соответствии с вариантом осуществления,

Фиг. 3 иллюстрирует генератор информации об изменении в соответствии с вариантом осуществления,

Фиг. 4 иллюстрирует устройство для формирования стереофонического бокового сигнала и стереофонического среднего сигнала для осуществления спектрального вычитания в соответствии с вариантом осуществления,

Фиг. 5 иллюстрирует устройство для формирования стереофонического бокового сигнала и стереофонического среднего сигнала в соответствии с другим вариантом осуществления,

Фиг. 6 иллюстрирует устройство для формирования стереофонического бокового сигнала, причем устройство содержит генератор спектральных весов в соответствии с вариантом осуществления,

Фиг. 7 иллюстрирует устройство для формирования стереофонического бокового сигнала, причем устройство содержит генератор спектральных весов в соответствии с другим вариантом осуществления,

Фиг. 8 иллюстрирует устройство для формирования стереофонического бокового сигнала, причем устройство содержит генератор спектральных весов в соответствии с дополнительным вариантом осуществления,

Фиг. 9 иллюстрирует генератор информации об изменении, причем устройство содержит генератор спектральных весов и генератор величины в соответствии с вариантом осуществления,

Фиг. 10 иллюстрирует устройство для формирования стереофонического среднего сигнала в соответствии с вариантом осуществления,

Фиг. 10a иллюстрирует устройство для формирования стереофонического среднего сигнала в соответствии с вариантом осуществления, в котором генератор информации о манипуляции содержит спектральный вычитатель,

Фиг. 10b иллюстрирует устройство для формирования стереофонического среднего сигнала в соответствии с вариантом осуществления, в котором генератор информации об изменении содержит генератор спектральных весов,

Фиг. 11 иллюстрирует примерные усиления для стереофонических боковых сигналов и стереофонических средних сигналов,

Фиг. 12 иллюстрирует результаты спектрального взвешивания для стереофонических боковых сигналов и стереофонических средних сигналов,

Фиг. 13 иллюстрирует устройство для формирования стереофонического бокового сигнала в соответствии с дополнительным вариантом осуществления,

Фиг. 14 иллюстрирует устройство для формирования стереофонического бокового сигнала в соответствии с дополнительным вариантом осуществления,

Фиг. 15 иллюстрирует устройство повышающего микширования в соответствии с вариантом осуществления,

Фиг. 16 иллюстрирует примерную квадрафоническую систему воспроизведения, использующую результаты предложенной обработки сигналов,

Фиг. 17 изображает блок-схему, иллюстрирующую обработку для формирования многоканального сигнала, подходящего для воспроизведения с помощью 5 каналов,

Фиг. 18 изображает блок-схему M-S-разложения,

Фиг. 19 изображает блок-схему, иллюстрирующую спектральное взвешивание, и

Фиг. 20 иллюстрирует типичные спектральные веса, которые используются в коррекции речевых сигналов.

УРОВЕНЬ ТЕХНИКИ

Перед описанием предпочтительных вариантов осуществления настоящего изобретения будут описаны соответствующие идеи, в частности будет объяснена M-S-обработка, основные положения спектрального вычитания и спектрального взвешивания.

Сначала будет более подробно описана среднебоковая обработка. Чтобы объяснить, каким образом вычисляются стереофонические боковые и средние сигналы, кратко рассматриваются основы обычной M-S-обработки. 2-канальный стереофонический сигнал x(t) можно представить двумя сигналами xl(t) и xr(t) соответственно для левого и правого канала с указателем t времени. Термины «левый» и «правый» указывают, что в конечном счете эти сигналы подаются соответственно в левое и правое ухо (используя громкоговорители или наушники) либо воспроизводятся соответственно левым и правым каналом в системе воспроизведения звука.

Предполагая, что стереофонический сигнал является смесью N сигналов zi источника, i=1, …, N, xl(t) и xr(t) можно переписать в виде

где hli(t), hri(t) являются передаточными функциями, описывающими то, как источники смешиваются в стереофонический сигнал, * является операцией свертывания, а nl(t), nr(t) являются некоррелированными окружающими сигналами. В случае микширования с использованием только амплитудного панорамирования, что часто имеет место для студийных записей, hli(t) и hri(t) являются скалярными. Результатом этого процесса микширования является то, что в литературе известно как мгновенные смеси, в отличие от свернутых смесей (в случаях, когда hli(t) и hri(t) имеют длину больше единицы). Отбрасывая окружающие элементы nl(t), nr(t), модель сигналов для мгновенного микширования можно переписать в виде

при этом коэффициент 0≤ai(t)≤1 микширования определяет воспринимаемое направление сигналов источника и смеси.

Та же информация, что содержится в сигнале x(t)=[xl(t) xr(t)], обеспечивается при использовании M-S-представления сигнала, причем средний сигнал m1(t) (также называемый суммарным сигналом) и боковой сигнал s1(t) (также называемый разностным сигналом) вычисляются из xl(t) и xr(t) в соответствии с:

Нижние индексы 1 используются для обозначения, что эти сигналы являются монофоническими. Такой M-S-сигнал полезен для различных применений, причем боковой и средний сигнал обрабатываются, кодируются или передаются отдельно. Такими применениями являются звукозапись, искусственное улучшение стереофонического образа, кодирование звука для воспроизведения на виртуальных громкоговорителях, воспроизведения с бинауральным эффектом в громкоговорителях и квадрафонического воспроизведения.

С учетом M-S-представления сигналы xl(t) и xr(t) могут вычисляться в соответствии с:

На фиг. 18 иллюстрируется M-S-разложение.

Оба представления содержат одинаковую информацию. Отметим, что нормализующие веса 0,5 в уравнениях (5) и (6) являются необязательными, и возможны другие веса, но показанный здесь вес гарантирует, что применение уравнений с (5) по (8) приведет к сигналам, которые идентичны входным сигналам. Использование других весов может привести к аналогичным или масштабированным сигналам.

Из модели сигналов и уравнений (3) и (4) следует, что сигнал s1(t) содержит только составляющие сигнала, которые панорамированы со смещением от центра (некоторые из них с отрицательной фазой), и является монофоническим сигналом. Средний сигнал m1(t) содержит все сигналы за исключением сигналов в s1(t). Описывая словами Майкла Герзона (Michael Gerzon), «M является сигналом, содержащим информацию о среднем сигнале из стереофонической сцены, тогда как S содержит только информацию о боковых сигналах». Оба являются монофоническими сигналами. Хотя амплитудно-панорамированные прямые звуки затухают в боковом сигнале в зависимости от их положения в стереофонической панораме, некоррелированные составляющие сигнала типа реверберации и других окружающих сигналов затухают в среднем сигнале на 3 дБ (для нулевой корреляции). Эти затухания обусловлены фазовой нейтрализацией между боковыми составляющими в левом и правом канале.

Ниже подробнее объясняется спектральное вычитание и спектральное взвешивание.

Спектральное вычитание является широко известным способом для коррекции речевых сигналов и шумоподавления. Оно было предложено (возможно, первоначально) Боллом (Boll) для уменьшения воздействий аддитивного шума в речевой связи [2]. Обработка выполняется в частотной области, где обрабатываются спектры коротких кадров последовательных (возможно, совпадающих) частей входного сигнала.

Основной принцип состоит в вычитании оценки спектра величины мешающего шумового сигнала из спектров величин входных сигналов, которые предполагаются смесью нужного речевого сигнала и мешающего шумового сигнала.

Спектральное взвешивание (или Краткосрочное спектральное затухание [3]) широко используется в различных применениях обработки звуковых сигналов, например в Коррекции речевых сигналов [4] и Слепом разделении источников. Как и в спектральном вычитании, целью этой обработки является отделение нужного сигнала d(t) или ослабление мешающего сигнала n(t), причем входной сигнал x(t) является аддитивной смесью d(t) и n(t),

Эта обработка иллюстрируется на фиг. 19. Обработка сигналов выполняется в частотной области. Поэтому входной сигнал x(t) преобразуется с использованием Оконного преобразования Фурье (STFT), гребенки фильтров или любого другого средства для выведения представления сигнала с несколькими полосами X(f, k) частот, с индексом f полосы частот и указателем k времени. Представление входных сигналов в частотной области обрабатывается так, что сигналы поддиапазонов масштабируются с помощью изменяющихся во времени весов G(f, k),

Веса вычисляются из представления X(f, k) входного сигнала так, что они имеют большие величины для высоких отношений сигнал-шум (SNR) и низкие значения для небольших SNR. Для вычисления весов G(f, k) необходима оценка обычно зависящего от времени и частоты SNR, или N(f, k) или S(f, k). В применениях по обработке речевых сигналов оценка шума вычисляется во время отсутствия речевой активности [2, 5], или с использованием минимальных статистик [6], то есть на основании отслеживания локальных минимумов в каждом поддиапазоне, или с использованием второго микрофона рядом с источником шума.

Результатом операции взвешивания Y(f, k) является представление выходного сигнала в частотной области. Выходной временной сигнал y(t) вычисляется с использованием обратной обработки к преобразованию в частотной области, например, Обратного STFT.

Часто веса G(f, k) выбираются вещественнозначными, что приводит к выходным спектрам Y, имеющим такую же информацию о фазе, что и X. Существуют различные правила получения, например, как вычисляются веса G(f, k), например, выводятся из спектрального вычитания и фильтрации Винера. Ниже будут описываться разные способы для выведения спектральных весов. Предполагается, что s и n взаимно ортогональны, то есть

Ниже подробнее объясняется фильтрация Винера. С учетом оценок спектральных плотностей мощности (PSD) (например, выведенных из коэффициентов STFT) у нужного сигнала Pdd и мешающего сигнала Pnn спектральные веса выводятся путем минимизации среднеквадратической ошибки

Теперь объясняется спектральное вычитание, использующее спектральное взвешивание.

Спектральные веса вычисляются так, что Pyy=Pxx-Pnn, то есть

В качестве альтернативы можно вывести вещественнозначные спектральные веса, которые приводят к |Y|=|X|-|N|, часто называемому спектральным вычитанием величины, с весами

|D| является спектром величины у d(t). |N| является спектром величины у n(t). Теперь объясняется обобщение правила спектрального взвешивания. Обобщенная формулировка фильтра STSA выводится путем введения трех параметров α, β и γ, причем α и β являются экспонентами, управляющими силой затухания, а γ является коэффициентом переоценки шума.

Уравнение (15) является обобщенной формулировкой описанных выше правил подавления шумов, причем α=2, β=2 соответствует спектральному вычитанию, а α=2, β=1 соответствует фильтрации Винера. Спектральное вычитание величины (вместо энергий) реализуется путем задания α=1, β=1. Параметр γ управляет количеством шума и учитывает возможные отклонения способа оценки шума. Он может выбираться связанным с оцененным SNR или с индексом частоты.

На фиг. 20 типичные спектральные веса иллюстрируются в зависимости от SNR, как используется при коррекции речевых сигналов.

Можно обнаружить ряд других правил получения с общими характеристиками в том, что веса монотонно увеличиваются вместе с SNR поддиапазона, например устройство оценки Эфраима-Малаха [7] или алгоритм Мягкого решения/переменного затухания (SDVA) [8].

В практических реализациях спектральные веса обычно ограничиваются минимальным значением больше нуля, чтобы уменьшить искажения. В разных частотных диапазонах могут применяться разные правила получения [4]. Результирующие усиления можно сгладить как по оси времени, так и по оси частоты, чтобы уменьшить искажения. Обычно фильтр нижних частот первого порядка (квазиинтегратор) используется для сглаживания по оси времени, а нуль-фазовый фильтр нижних частот применяется по оси частоты.

ВАРИАНТЫ ОСУЩЕСТВЛЕНИЯ:

Фиг. 1 иллюстрирует устройство для формирования стереофонического бокового сигнала, содержащего первый боковой канал Sl(f) и второй боковой канал Sr(f), из стереофонического входного сигнала, содержащего первый входной канал Xl(f) и второй входной канал Xr(f), в соответствии с вариантом осуществления. Устройство содержит генератор 110 информации об изменении для формирования информации об изменении modInf на основании информации о среднем/боковом сигнале midSideInf. Кроме того, устройство содержит блок 120 манипулирования сигналами, приспосабливаемый для манипулирования первым входным каналом Xl(f) на основании информации об изменении modInf, чтобы получить первый боковой канал Sl(f), и приспосабливаемый для манипулирования вторым входным каналом Xr(f) на основании информации об изменении modInf, чтобы получить второй боковой канал Sr(f).

Например, генератор 110 информации об изменении может быть выполнен с возможностью формирования информации об изменении modInf на основании информации о среднем/боковом сигнале midSideInf, которая связана с монофоническим средним сигналом в стереофоническом входном сигнале, монофоническим боковым сигналом в стереофоническом входном сигнале и/или отношением между монофоническим средним сигналом и монофоническим боковым сигналом в стереофоническом входном сигнале.

Монофонический средний сигнал может зависеть от суммарного сигнала, получающегося в результате сложения первого и второго входного канала Xl(f), Xr(f). Монофонический боковой сигнал может зависеть от разностного сигнала, получающегося в результате вычитания второго входного канала из первого входного канала. Например, монофонический средний сигнал может вычисляться в соответствии с формулой:

Монофонический боковой сигнал может, например, вычисляться в соответствии с формулой:

Фиг. 1a иллюстрирует устройство для формирования стереофонического бокового сигнала в соответствии с вариантом осуществления, в котором генератор 110 информации о манипуляции содержит спектральный вычитатель 115. Спектральный вычитатель 115 выполнен с возможностью формирования информации об изменении modInf путем формирования значения разности, указывающего разность между монофоническим средним сигналом или монофоническим боковым сигналом в стереофоническом входном сигнале и первым или вторым входным каналом. Например, спектральный вычитатель 115 может быть выполнен с возможностью формирования информации об изменении modInf путем вычитания значения величины или взвешенного значения величины первого или второго входного канала из значения величины или взвешенного значения величины монофонического среднего сигнала или монофонического бокового сигнала в стереофоническом входном сигнале. Либо спектральный вычитатель 115 может быть выполнен с возможностью формирования информации об изменении modInf путем вычитания значения величины или взвешенного значения величины монофонического среднего сигнала или монофонического бокового сигнала в стереофоническом входном сигнале из значения величины или взвешенного значения величины первого или второго входного канала.

Фиг. 1b иллюстрирует устройство для формирования стереофонического бокового сигнала в соответствии с вариантом осуществления, в котором генератор 110 информации об изменении содержит генератор 116 спектральных весов для формирования информации об изменении modInf путем формирования первого спектрального весового коэффициента на основании монофонического среднего сигнала и монофонического бокового сигнала в стереофоническом входном сигнале.

Фиг. 2 иллюстрирует спектральный вычитатель 210 в соответствии с вариантом осуществления. Первый спектр величины |Xl(f)| первого входного канала, второй спектр величины |Xr(f)| второго входного канала и третий спектр величины |M1(f)| монофонического среднего сигнала в стереофоническом входном сигнале подается в спектральный вычитатель 210.

Первый блок 215 спектрального вычитания в спектральном вычитателе 210 вычитает третий спектр |M1(f)|, взвешиваемый весовым коэффициентом w (w указывает скалярный множитель в диапазоне 0≤w≤1), из первого спектра |Xl(f)|, например, первое значение величины третьего спектра величины |M1(f)|, взвешенного весовым коэффициентом w, спектрально вычитается из первого значения величины первого спектра величины |Xl(f)|; второе значение величины третьего спектра величины |M1(f)|, взвешенного весовым коэффициентом w, спектрально вычитается из второго значения величины первого спектра величины |Xl(f)|; и т. п. При этом множество первых боковых значений величины получается в качестве информации об изменении. Первые боковые значения величины являются значениями величины у спектра величины первого бокового канала в стереофоническом боковом сигнале, когда результат спектрального вычитания положительный. Таким образом, первый блок 215 спектрального вычитания выполнен с возможностью применения формулы:

=|Xl(f)|-w|M1(f)| (16)

Аналогичным образом второй блок 218 спектрального вычитания в спектральном вычитателе 210 вычитает третий спектр |M1(f)|, взвешиваемый весовым коэффициентом w (w указывает скалярный множитель в диапазоне 0≤w≤1), из второго спектра |Xr(f)|, например, первое значение величины третьего спектра величины |M1(f)|, взвешенного весовым коэффициентом w, спектрально вычитается из второго значения величины второго спектра величины |Xr(f)|; второе значение величины третьего спектра величины |M1(f)|, взвешенного весовым коэффициентом w, спектрально вычитается из второго значения величины второго спектра величины |Xr(f)|; и т. п. Таким образом, множество вторых боковых значений величины получается в качестве информации об изменении, причем вторые боковые значения величины являются значениями величины у спектра величины второго бокового канала в стереофоническом боковом сигнале, когда результат спектрального вычитания положительный. При этом второй блок 218 спектрального вычитания выполнен с возможностью применения формулы:

Фиг. 3 иллюстрирует генератор информации об изменении в соответствии с вариантом осуществления. Генератор информации об изменении содержит определитель 305 величины и спектральный вычитатель 210. Определитель 305 величины выполнен с возможностью приема первого Xl(f) и второго Xr(f) входного канала и монофонического среднего сигнала M1(f) в стереофоническом входном сигнале. Определителем величины определяется первое значение величины у первого спектра величины |Xl(f)| первого входного канала Xl(f), второе значение величины у второго спектра величины |Xr(f)| второго входного канала Xr(f) и третье значение величины у третьего спектра величины |M1(f)| монофонического среднего сигнала M1(f). Определитель 305 величины подает в спектральный вычитатель 210 первое, второе и третье значение величины. Спектральный вычитатель может быть спектральным вычитателем в соответствии с фиг. 2, который выполнен с возможностью формирования первого стереофонического бокового значения величины у спектра величины первого бокового канала и второго стереофонического бокового значения величины у спектра величины второго бокового канала .

Фиг. 4 иллюстрирует устройство, осуществляющее спектральное вычитание в соответствии с вариантом осуществления. Первый входной канал xl(t) и второй входной канал xr(t), представляемые во временной области, вводятся в блок 405 преобразования. Блок 405 преобразования выполнен с возможностью преобразования первого и второго входного канала xl(t), xr(t) временной области из временной области в спектральную область, чтобы получить первый входной канал Xl(f) спектральной области и второй входной канал Xr(f) спектральной области. Входные каналы Xl(f), Xr(f) спектральной области подаются в генератор 408 канала. Генератор 408 канала выполнен с возможностью формирования монофонического среднего сигнала M1(f). Монофонический средний сигнал M1(f) может формироваться в соответствии с формулой:

Генератор 408 канала подает сформированный средний сигнал M1(f) в первый блок 411 извлечения величины, который извлекает значения величины из сформированного среднего сигнала M1(f). Кроме того, первый входной канал Xl(f) подается блоком 405 преобразования во второй блок 412 извлечения величины, который извлекает значения величины первого входного канала Xl(f). Кроме того, блок 405 преобразования подает второй входной канал Xr(f) в третий блок 413 извлечения величины, который извлекает значения величины из второго входного канала. Блок 405 преобразования также подает первый входной канал xl(f) в первый блок 421 извлечения фазы, который извлекает значения фазы из первого входного канала Xl(f). Кроме того, блок 405 преобразования также подает второй входной канал Xr(f) во второй блок 422 извлечения фазы, который извлекает значения фазы из второго входного канала.

Возвращаясь к первому блоку 411 извлечения величины, значения величины у сформированного монофонического среднего сигнала |M1(f)| подаются в первый вычитатель 431. Кроме того, в первый вычитатель 431 подаются извлеченные значения величины |Xl(f)|. Первый вычитатель 431 формирует значение разности между значением величины первого входного канала и значением величины сформированного среднего сигнала. Величину сформированного среднего сигнала можно взвесить. Например, первый вычитатель может вычислить значение разности в соответствии с формулой 16:

Аналогичным образом третий блок 413 извлечения величины подает значения величины |Xr(f)| во второй вычитатель 432. Кроме того, значения величины |M1(f)| также подаются во второй вычитатель 432. Аналогично первому блоку 431 вычитания второй блок 432 вычитания формирует значение величины у второго бокового канала путем вычитания значений величины |Xr(f)| и значений величины сформированного среднего сигнала. Второй блок 432 вычитания может, например, применять формулу:

Первый блок 431 вычитания затем подает сформированное значение величины в первый объединитель 441. Кроме того, первый блок 421 извлечения фазы подает извлеченное значение фазы первого входного канала Xl(f) в первый объединитель 441. Первый объединитель 441 затем формирует значения спектральной области у первого бокового канала путем объединения значения величины, сформированного первым блоком 431 вычитания, и значения фазы, доставленного первым блоком 421 извлечения фазы. Например, первый объединитель 441 может применять формулу

Если некоторые из значений являются отрицательными, то применение формулы приводит к объединению абсолютного значения и , где сдвигается по фазе на π.

Аналогичным образом второй блок 432 вычитания подает сформированное значение величины второго бокового сигнала во второй объединитель 442. Второй блок 422 извлечения фазы подает извлеченное значение фазы второго входного канала Xr(f) во второй объединитель 442. Второй объединитель выполнен с возможностью объединения второго значения величины, доставленного вторым блоком 432 вычитания, и значения фазы, доставленного блоком 422 извлечения фазы, чтобы получить второй боковой канал. Например, второй объединитель 442 может применять формулу:

Если некоторые из значений являются отрицательными, то применение формулы приводит к объединению абсолютного значения и , где сдвигается по фазе на π.

Первый объединитель 441 подает сформированный первый боковой сигнал, представляемый в спектральной области, в блок 450 обратного преобразования. Блок 450 обратного преобразования преобразует первый боковой канал спектральной области из спектральной области во временную область, чтобы получить первый боковой сигнал временной области. Кроме того, блок 450 обратного преобразования принимает от второго объединителя 442 второй боковой канал, представляемый в спектральной области. Блок 450 обратного преобразования преобразует второй боковой канал спектральной области из спектральной области во временную область, чтобы получить второй боковой канал временной области.

Как уже объяснялось, значения величины первого и второго бокового канала могут формироваться первым блоком 431 вычитания и вторым блоком 432 вычитания в соответствии с формулами:

Скалярный множитель 0≤w≤1 управляет степенью разделения. Результатом спектрального вычитания являются спектры величин стереофонических боковых сигналов

Временной сигнал m(t)=[ml(t) mr(t)] вычисляется путем вычитания стереофонического бокового сигнала из входного сигнала.

Из того, что средний сигнал вычисляется путем вычитания временных сигналов, следует, что необходимы только два обратных преобразования частоты. Параметр w предпочтительно выбирается близко к 1, но может зависеть от частоты.

Фиг. 5 иллюстрирует устройство в соответствии с вариантом осуществления, применяющее эти идеи.

Устройство, кроме того, содержит первый блок 501 преобразования, приспосабливаемый для преобразования первого входного канала xl(t) временной области из временной области в спектральную область, чтобы получить первый входной канал Xl(f) спектральной области, и второй блок 502 преобразования, приспосабливаемый для преобразования второго входного канала xr(t) временной области из временной области в спектральную область, чтобы получить второй входной канал Xr(f) спектральной области.

Устройство, кроме того, содержит генератор 508 канала, первый, второй и третий блок 511, 512 и 513 извлечения величины, первый и второй блок 521 и 522 извлечения фазы, первый и второй блок 531 и 532 вычитания и первый и второй объединитель 541 и 542, которые могут соответствовать генератору 408 канала, первому, второму и третьему блоку 411, 412 и 413 извлечения величины, первому и второму блоку 421 и 422 извлечения фазы, первому и второму блоку 431 и 432 вычитания и первому и второму объединителю 441 и 442 в устройстве из фиг. 4 соответственно.

Кроме того, устройство содержит первый блок 551 обратного преобразования. Первый блок 551 обратного преобразования принимает от первого объединителя 541 сформированный первый боковой канал, представляемый в спектральной области. Первый блок 551 обратного преобразования преобразует сформированный первый боковой канал Sl(f) спектральной области из спектральной области во временную область, чтобы получить первый боковой канал sl(t) временной области.

Кроме того, устройство содержит второй блок 552 обратного преобразования. Второй блок 552 обратного преобразования принимает от второго объединителя 542 сформированный второй боковой канал, представляемый в спектральной области. Второй блок 552 обратного преобразования преобразует второй боковой канал Sr(f) спектральной области из спектральной области во временную область, чтобы получить второй боковой канал sr(t) временной области.

Кроме того, устройство содержит генератор 561 первого среднего канала. Генератор 561 первого среднего канала формирует первый средний канал ml(t) в стереофоническом среднем сигнале во временной области путем применения формулы 20:

Кроме того, устройство содержит генератор 562 второго среднего канала. Генератор 562 второго среднего канала формирует первый средний канал mr(t) в стереофоническом среднем сигнале во временной области путем применения формулы 21:

Такие же результаты получаются путем реализации этой обработки с использованием спектрального взвешивания (аналогично обработке в вышеприведенном разделе «Уровень техники»), которое для примера показано здесь для левого канала. Комплекснозначные спектры Xl(f) взвешиваются, как показано в следующем уравнении:

Хотя вышеприведенное уравнение дает идентичный результат с фактическим взвешиванием, которое получается при спектральном вычитании (но с большей вычислительной нагрузкой; главным образом из-за деления для вычисления спектральных весов), подход со спектральным взвешиванием обладает преимуществами, потому что он предлагает больше возможностей для параметризации обработки, что приводит к разным результатам с аналогичными характеристиками, как описано ниже:

Теперь подробнее объясняется разложение сигнала с использованием спектрального взвешивания. Логическое обоснование идеи в соответствии с этим вариантом осуществления состоит в применении спектрального взвешивания к сигналам xl(t) и xr(t) левого и правого канала, причем спектральные веса выводятся из M-S-разложения. Промежуточным результатом M-S-разложения является отношение среднего и бокового сигнала на каждый частотно-временной фрагмент, в дальнейшем называемое среднебоковым отношением (MSR). Это MSR может использоваться для вычисления спектральных весов, но отметим, что в качестве альтернативы веса могут вычисляться без понятия MSR. В этом случае MSR преимущественно служит для объяснения основной идеи способа. Для вычисления стереофонического среднего сигнала m(t)=[ml(t) mr(t)] веса выбираются так, что они монотонно связаны с MSR. Для вычисления стереофонического бокового сигнала s(t)=[sl(t) sr(t)] веса выбираются так, что они монотонно связаны с обратной величиной MSR.

В варианте осуществления генератор информации об изменении содержит генератор спектральных весов. Фиг. 6 иллюстрирует устройство в соответствии с таким вариантом осуществления. Устройство содержит генератор 610 информации об изменении и блок 620 манипулирования сигналами. Генератор информации об изменении содержит генератор 615 спектральных весов. Блок 620 манипулирования сигналами содержит первый блок 621 манипуляции для манипуляции первым входным каналом Xl(f) стереофонического сигнала и второй блок 622 манипуляции для манипуляции вторым входным каналом Xr(f) стереофонического входного сигнала. Генератор 615 спектральных весов из фиг. 6 принимает монофонический средний сигнал M1(f) и монофонический боковой сигнал S1(f) в стереофоническом входном сигнале. Генератор 615 спектральных весов выполнен с возможностью определения спектрального весового коэффициента Gs(f) на основании монофонического среднего сигнала M1(f) и на основании монофонического бокового сигнала S1(f) в стереофоническом входном сигнале. Блок 620 манипулирования сигналами затем подает в генератор 620 информации об изменении сформированный спектральный весовой коэффициент Gs(f) в качестве информации об изменении. Первый блок 621 модификации в генераторе 620 информации об изменении выполнен с возможностью манипулирования первым входным каналом Xl(f) стереофонического входного сигнала на основании сформированного спектрального весового коэффициента Gs(f), чтобы получить первый боковой канал Sl(f) стереофонического бокового сигнала.

Другой вариант осуществления иллюстрируется на фиг. 7. Как и устройство из фиг. 6, устройство из фиг. 7 содержит генератор 710 информации об изменении и блок 720 манипулирования сигналами. Генератор информации об изменении содержит генератор 715 спектральных весов. Блок 720 манипулирования сигналами содержит первый блок 721 манипуляции для манипуляции первым входным каналом Xl(f) стереофонического сигнала и второй блок 722 манипуляции для манипуляции вторым входным каналом Xr(f) стереофонического входного сигнала. Блок 720 манипулирования сигналами в варианте осуществления из фиг. 7 выполнен с возможностью манипулирования первым входным каналом Xl(f), а также вторым входным каналом Xr(f) на основании того же сформированного спектрального весового коэффициента Gs(f), чтобы получить первый и второй боковой канал Sl(f) и Sr(f) в стереофоническом боковом сигнале.

Дополнительный вариант осуществления иллюстрируется на фиг. 8. Как и устройство из фиг. 6, устройство из фиг. 8 содержит генератор 810 информации об изменении и блок 820 манипулирования сигналами. Генератор информации об изменении содержит генератор 815 спектральных весов. Блок 820 манипулирования сигналами содержит первый блок 821 манипуляции для манипуляции первым входным каналом Xl(f) стереофонического сигнала и второй блок 822 манипуляции для манипуляции вторым входным каналом Xr(f) стереофонического входного сигнала. Генератор 815 спектральных весов выполнен с возможностью формирования двух или более спектральных весовых коэффициентов. Кроме того, первый блок 821 манипуляции в генераторе 820 информации об изменении выполнен с возможностью манипулирования первым входным каналом на основании сформированного первого спектрального весового коэффициента. Второй блок 822 манипуляции в генераторе 820 информации об изменении, кроме того, выполнен с возможностью манипулирования вторым входным каналом на основании сформированного второго спектрального весового коэффициента.

Фиг. 9 иллюстрирует генератор 910 информации об изменении в соответствии с вариантом осуществления. Генератор 910 информации об изменении содержит определитель 912 величины и генератор 915 спектральных весов. Определитель 912 величины выполнен с возможностью приема монофонического среднего сигнала M1(f), представляемого в спектральной области. Кроме того, определитель 912 величины выполнен с возможностью приема монофонического бокового сигнала S1(f), представляемого в спектральной области. Определитель 912 величины выполнен с возможностью определения значения величины у спектра |S1(f)| монофонического бокового сигнала S1(f) в качестве бокового значения величины. Кроме того, определитель 912 величины выполнен с возможностью определения значения величины у спектра |M1(f)| монофонического среднего сигнала M1(f) в качестве среднего значения величины.

Определитель 912 величины выполнен с возможностью передачи бокового значения величины и среднего значения величины в генератор 915 спектральных весов. Генератор 915 спектральных весов выполнен с возможностью формирования первого спектрального весового коэффициента Gs(f) на основании отношения первого числа ко второму числу, причем первое число зависит от бокового значения величины, и причем второе число зависит от среднего значения величины и бокового значения величины. Например, первый спектральный весовой коэффициент Gs(f) может вычисляться в соответствии с формулой:

где являются скалярными множителями.

Ниже подробнее описывается вычисление спектральных весов. Такие спектральные веса можно вывести с использованием одного из вышеописанных правил получения, которые описаны применительно к спектральному вычитанию и спектральному взвешиванию в вышеприведенном разделе «Уровень техники», путем подстановки нужного сигнала d(t) и мешающего сигнала n(t) в соответствии с Таблицей 1.

Таблица 1
Назначение сигналов M-S сигналам, используемым для вычисления спектральных весов
Нужный сигнал Источник помех
Стереофонический боковой сигнал s(t) m(t)
Стереофонический средний сигнал m(t) s(t)

Например, стереофонический боковой сигнал s(t)=[sl(t) sr(t)] может вычисляться в соответствии с уравнениями (23), (24) и (25).

Дополнительный параметр δ вводится для управления влиянием составляющих стереофонического бокового сигнала в процессе разложения.

Отметим, что нужно только вычислить преобразование частоты либо для пары сигналов [xl(t) xr(t)], либо для [m(t) s(t)], и верхняя пара выводится с помощью сложения и вычитаний в соответствии с Уравнениями (5) и (6).

Аналогичным способом может вычисляться стереофонический средний сигнал m(t)=[ml(t) mr(t)] в соответствии с Уравнениями (26), (27) и (28).

Фиг. 10 иллюстрирует устройство для формирования стереофонического среднего сигнала, содержащего первый средний канал Ml(f) и второй средний канал Mr(f), из стереофонического входного сигнала, содержащего первый входной канал и второй входной канал. Устройство содержит генератор 1010 информации об изменении для формирования информации об изменении modInf2 на основании информации о среднем/боковом сигнале midSideInf, и блок 1020 манипулирования сигналами, приспосабливаемый для манипулирования первым входным каналом Xl(f) на основании информации об изменении, чтобы получить первый средний канал Ml(f), и приспосабливаемый для манипулирования вторым входным каналом Xr(f) на основании информации об изменении modInf, чтобы получить второй средний канал Mr(f).

Фиг. 10a иллюстрирует устройство для формирования стереофонического среднего сигнала в соответствии с вариантом осуществления, в котором генератор 1010 информации о манипуляции содержит спектральный вычитатель 1015. Спектральный вычитатель 1015 выполнен с возможностью формирования информации об изменении modInf2 путем формирования значения разности, указывающего разность между монофоническим средним сигналом или монофоническим боковым сигналом в стереофоническом входном сигнале и первым или вторым входным каналом. Например, спектральный вычитатель 1015 может быть выполнен с возможностью формирования информации об изменении modInf2 путем вычитания значения величины или взвешенного значения величины первого или второго входного канала из значения величины или взвешенного значения величины монофонического среднего сигнала или монофонического бокового сигнала в стереофоническом входном сигнале. Либо спектральный вычитатель 1015 может быть выполнен с возможностью формирования информации об изменении modInf2 путем вычитания значения величины или взвешенного значения величины монофонического среднего сигнала или монофонического бокового сигнала в стереофоническом входном сигнале из значения величины или взвешенного значения величины первого или второго входного канала.

Фиг. 10b иллюстрирует устройство для формирования стереофонического среднего сигнала в соответствии с вариантом осуществления, в котором генератор 1010 информации об изменении содержит генератор 1016 спектральных весов для формирования информации об изменении modInf2 путем формирования первого спектрального весового коэффициента на основании монофонического среднего сигнала и монофонического бокового сигнала в стереофоническом входном сигнале.

Генератор информации об изменении может формировать информацию об изменении modInf2, например, в соответствии с формулой 26:

Альтернативой весам, показанным в Уравнении 26, является выведение весов из критерия для совместимости с понижающим микшированием, причем Gs(f)+Gm(f)=1 приводит к

Расширение описанного выше способа мотивируется наблюдением, что функция усиления (23) не приводит к весу, равному 1, даже в случае, когда элемент разрешения по времени/частоте жестко панорамирован к одной стороне. Это следствие того, знаменатель всегда больше числителя, поскольку средний сигнал приблизится к нулю, только если равен нулю левый и правый спектральный коэффициент. Чтобы добиться Gs(f)=1 для жестко панорамированных составляющих сигнала, уравнение (23) можно привести к

Модификация в уравнении (30) приводит к единичным усилениям для жестко панорамированных составляющих. В качестве альтернативы уравнения (31) и (32) показывают формулы усиления с параметром η, чьи результаты равны уравнению (23) для η=0 и (30) для η=1.

при

Отметим, что описанное выше спектральное взвешивание не обеспечивает совместимость с понижающим микшированием во всех случаях, то есть

Если нужно энергосберегающее разделение, то веса нужно выбирать так, что

что можно решить путем вычисления либо

как описано выше, и вычисления других весовых коэффициентов соответственно, например, в виде

При желании дополнительный постоянный масштабный коэффициент может применяться к одной из функций усиления перед вычитанием.

Для примера квадрафонического воспроизведения с совместимостью с понижающим микшированием параметры можно установить в

Сначала вычисляются спектральные веса Gs(f) и масштабируются на 1,5 дБ. Усиления для стереофонического среднего сигнала вычисляются в виде Gm(f)=1-Gs(f).

Функции усиления иллюстрируются на фиг. 11 в виде функции параметра a панорамирования. На фиг. 11 иллюстрируются примерные усиления для стереофонических боковых сигналов (сплошная линия) и стереофонических средних сигналов (пунктирная линия). Показано, что усиления являются комплементарными, то есть разделение совместимо с понижающим микшированием. Составляющие сигнала, которые панорамированы к любой одной стороне, затухают в стереофоническом среднем сигнале, а составляющие сигнала, которые панорамированы к центру, затухают в стереофоническом боковом сигнале. Составляющие сигнала, которые панорамированы между ними, появляются в обоих сигналах. Функции усиления иллюстрируются на фиг. 12 в виде функции параметра a панорамирования. Фиг. 12 иллюстрирует результаты спектрального взвешивания для стереофонических боковых сигналов (верхний чертеж) и стереофонических средних сигналов (нижний чертеж) для левого (сплошная линия) и правого канала (пунктирная линия).

Фиг. 13 иллюстрирует устройство для формирования стереофонического бокового сигнала в соответствии с дополнительным вариантом осуществления. Устройство содержит блок 1203 преобразования, генератор 1310 информации об изменении, блок 1320 манипулирования сигналами и блок 1325 обратного преобразования. Первый входной канал xl(t) и второй входной канал xr(t) в стереофоническом входном сигнале и средний сигнал m1(t) и боковой сигнал s1(t) в стереофоническом входном сигнале подаются в блок 1305 преобразования. Блок преобразования может быть блоком Оконного преобразования Фурье (блоком STFT), гребенкой фильтров или любым другим средством для выведения представления сигнала с несколькими полосами X(f, k) частот, с индексом f полосы частот и указателем k времени. Блок преобразования преобразует средний сигнал mid1(t), боковой сигнал s1(t), первый входной канал xl(t) и второй входной канал xr(t), представляемые во временной области, в сигналы спектральной области, в частности, в средний сигнал M1(f) спектральной области, боковой сигнал S1(f) спектральной области, первый входной канал Xl(f) спектральной области и второй входной канал Xr(f) спектральной области. Средний сигнал M1(f) спектральной области и боковой сигнал S1(f) спектральной области подаются в генератор 1310 информации об изменении в качестве информации о среднем/боковом сигнале.

Генератор 1310 информации об изменении формирует информацию об изменении modInf на основании монофонического среднего сигнала M1(f) спектральной области и монофонического бокового сигнала S1(f). Генератор информации об изменении из фиг. 13 также может принимать во внимание первый входной канал Xl(f) и/или второй входной канал Xr(f), что указано пунктирными соединительными линиями 1312 и 1314. Например, генератор 1310 информации об изменении может формировать информацию об изменении, которая основывается на монофоническом среднем сигнале M1(f), первом входном канале Xl(f) и втором входном канале Xr(f).

Генератор 1310 информации об изменении затем передает сформированную информацию об изменении modInf в блок 1320 манипулирования сигналами. Кроме того, блок 1305 преобразования подает первый входной канал Xl(f) спектральной области и второй входной канал Xr(f) спектральной области в блок 1320 манипулирования сигналами. Блок 1320 манипулирования сигналами выполнен с возможностью манипулирования первым входным каналом на основании информации об изменении modInf, чтобы получить первый боковой канал Sl(f) спектральной области и второй боковой канал Sr(f) спектральной области, которые подаются блоком 1320 манипулирования сигналами в блок 1325 обратного преобразования.

Блок 1325 обратного преобразования выполнен с возможностью преобразования первого бокового канала Sl(f) спектральной области во временную область, чтобы получить первый боковой канал sl(t) временной области, и для преобразования второго бокового канала Sr(f) спектральной области во временную область, чтобы получить соответственно второй боковой канал sr(t) временной области.

Фиг. 14 иллюстрирует устройство для формирования стереофонического бокового сигнала в соответствии с дополнительным вариантом осуществления. Проиллюстрированное фиг. 14 устройство отличается от устройства из фиг. 13 в том, что устройство по фиг. 14, дополнительно содержит генератор 1307 канала, который выполнен с возможностью приема первого входного канала Xl(f) и второго входного канала Xr(f) и для формирования монофонического среднего сигнала M1(f) и/или монофонического бокового сигнала S1(f) из первого и второго входного канала Xl(f), Xr(f). Например, монофонический средний сигнал M1(f) может формироваться в соответствии с формулой:

Монофонический боковой сигнал S1(f) может формироваться, например, в соответствии с формулой:

Логическое обоснование предложенного способа состоит в вычислении оценки спектров величин нужных сигналов, а именно m(t)=[ml(t) mr(t)] и s=[sl(t) sr(t)], путем обработки входного сигнала x(t)=[xl(t) xr(t)] и использования преимущества того, что представление m1(t) и s1(t) в частотной области содержит нужные составляющие сигнала.

В одном варианте осуществления применяется спектральное вычитание. Спектры входных сигналов изменяются с использованием спектров монофонического среднего сигнала. В другом варианте осуществления применяется спектральное взвешивание, причем веса выводятся с использованием монофонического среднего сигнала и монофонического бокового сигнала.

В соответствии с вариантами осуществления сигналы будут вычислены с аналогичными характеристиками, как и средний и боковой сигнал, но без потери стереофонического сигнала при прослушивании каждого из сигналов в отдельности. Это достигается с использованием спектрального вычитания в одном варианте осуществления и с использованием спектрального взвешивания в другом варианте осуществления.

В соответствии с другим вариантом осуществления предоставляется устройство повышающего микширования для формирования по меньшей мере четырех каналов повышающего микширования из стереофонического сигнала, содержащего два входных канала повышающего микширования.

Устройство повышающего микширования содержит устройство для формирования стереофонического бокового сигнала в соответствии с одним из вышеописанных вариантов осуществления, чтобы сформировать первый боковой канал в виде первого канала повышающего микширования и сформировать второй боковой канал в виде второго канала повышающего микширования. Устройство повышающего микширования дополнительно содержит первый блок объединения и второй блок объединения. Первый блок объединения выполнен с возможностью объединения первого входного канала и первого бокового канала, чтобы получить первый средний канал в виде третьего канала повышающего микширования. Кроме того, второй блок объединения выполнен с возможностью объединения второго входного канала и второго бокового канала в виде четвертого канала повышающего микширования.

Фиг. 15 иллюстрирует устройство повышающего микширования в соответствии с вариантом осуществления. Устройство повышающего микширования содержит устройство 1510 для формирования стереофонического бокового сигнала, генератор 1520 первого среднего канала и генератор 1530 второго среднего канала. Первый входной канал Xl(f) подается в устройство 1510 для формирования стереофонического бокового сигнала и в генератор 1520 первого среднего канала. Кроме того, второй входной канал X(f) подается в устройство 1510 для формирования стереофонического бокового сигнала и в генератор 1530 второго среднего канала. Кроме того, устройство 1510 для формирования стереофонического бокового сигнала подает сформированный первый боковой канал Sl(f) в генератор 1520 первого среднего канала, а кроме того, подает сформированный второй боковой канал Sr(f) в генератор 1530 второго среднего канала. Первый боковой канал Sl(f) выводится в качестве первого канала повышающего микширования, сформированного устройством повышающего микширования. Второй боковой канал Sr(f) выводится в качестве второго канала повышающего микширования, сформированного устройством повышающего микширования. Генератор 1520 первого среднего канала объединяет первый входной канал Xl(f) и сформированный первый боковой канал Sl(f), чтобы получить первый канал стереофонического среднего сигнала Ml(f). Например, генератор 1520 среднего канала может применять формулу:

Кроме того, второй блок объединения объединяет второй канал Sr(f) в стереофоническом боковом сигнале и второй входной канал Xr(f) от генератора 1530 среднего канала, чтобы получить второй канал Mr(f) в стереофоническом среднем сигнале. Например, второй блок объединения может применять формулу:

Первый канал стереофонического среднего сигнала Ml(f) и второй канал стереофонического среднего сигнала Mr(f) выводятся соответственно в качестве третьего и четвертого канала повышающего микширования. Как видно, наличие стереофонического среднего сигнала и стереофонического бокового сигнала полезно для применения повышающего микширования стереофонического сигнала для воспроизведения с использованием систем объемного звучания. Одним возможным применением стереофонического бокового и стереофонического среднего сигнала является квадрафоническое звуковоспроизведение, которое показано на фиг. 16. Оно содержит четыре канала, которые подаются в стереофонические средние сигналы и стереофонические боковые сигналы.

Примерное применение квадрафонического воспроизведения, которое описано выше, является хорошей иллюстрацией характеристик стереофонического бокового сигнала и стереофонического среднего сигнала. Отметим, что описанную обработку можно дополнительно расширить для воспроизведения звукового сигнала других форматов помимо квадрафонического. Больше сигналов выходных каналов вычисляется сначала путем разделения стереофонического бокового сигнала и стереофонического среднего сигнала и применения описанной обработки еще раз к одному из них или к обоим. Например, сигнал для воспроизведения с использованием 5 каналов в соответствии с ITU-R BS.775 [1] можно вывести путем повторения разложения сигнала со стереофоническим средним сигналом в качестве входного сигнала.

Фиг. 17 иллюстрирует блок-схему обработки для формирования многоканального сигнала, подходящего для воспроизведения с пятью каналами - центральным C, левым L, правым R, окружным левым SL и окружным правым SR каналом.

Вышеописанные способы и устройства представлены для разложения стереофонического входного сигнала на стереофонический боковой сигнал и/или стереофонический средний сигнал. Для спектрального разделения применяется спектральное вычитание или спектральное взвешивание. MS-разложение дает основанную на направлении информацию, которая необходима для вычисления степени, с которой каждый частотно-временной фрагмент вносит вклад в любой из стереофонического бокового сигнала и стереофонического среднего сигнала. Такие сигналы используются для применения повышающего микширования стереофонических сигналов для воспроизведения с помощью систем объемного звучания.

Хотя некоторые признаки описаны применительно к устройству, понято, что эти признаки также характеризуют соответствующий способ, причем блок или устройство соответствует этапу способа или признаку этапа способа. По аналогии признаки, описанные применительно к этапу способа, также характеризуют соответствующий блок или элемент либо признак соответствующего устройства.

Разложенный сигнал согласно изобретению может храниться на цифровом носителе информации или может передаваться в среде передачи, например среде беспроводной передачи или среде проводной передачи, такой как Интернет.

В зависимости от некоторых требований к реализации варианты осуществления изобретения можно реализовать в аппаратных средствах или в программном обеспечении. Реализация может осуществляться с использованием цифрового носителя информации, например дискеты, DVD, CD, ROM, PROM, EPROM, EEPROM или флэш-памяти, на котором сохранены считываемые электронными средствами управляющие сигналы, которые взаимодействуют (или допускают взаимодействие) с программируемой компьютерной системой таким образом, что выполняется соответствующий способ.

Некоторые варианты осуществления в соответствии с изобретением содержат постоянный носитель информации, имеющий считываемые электронными средствами управляющие сигналы, которые допускают взаимодействие с программируемой компьютерной системой таким образом, что выполняется один из способов, описанных в этом документе.

Варианты осуществления настоящего изобретения могут в общем быть реализованы в виде компьютерного программного продукта с программным кодом, причем программный код действует для выполнения одного из способов, когда компьютерный программный продукт выполняется на компьютере. Программный код может храниться, например, на машиночитаемом носителе.

Другие варианты осуществления содержат компьютерную программу для выполнения одного из описанных в этом документе способов, сохраненную на машиночитаемом носителе.

Другими словами, поэтому вариант осуществления способа согласно изобретению является компьютерной программой, имеющей программный код для выполнения одного из описанных в этом документе способов, когда компьютерная программа выполняется на компьютере.

Поэтому другой вариант осуществления патентоспособных способов является носителем информации (или цифровым носителем информации, или машиночитаемым носителем), содержащим записанную на нем компьютерную программу для выполнения одного из способов, описанных в этом документе.

Поэтому другой вариант осуществления способа согласно изобретению является потоком данных или последовательностью сигналов, представляющих собой компьютерную программу для выполнения одного из способов, описанных в этом документе. Поток данных или последовательность сигналов могут быть выполнены с возможностью, например, передачи по соединению передачи данных, например по Интернету.

Другой вариант осуществления содержит средство обработки, например компьютер или программируемое логическое устройство, конфигурированные или выполненные с возможностью выполнения одного из способов, описанных в этом документе.

Другой вариант осуществления содержит компьютер, на котором установлена компьютерная программа для выполнения одного из способов, описанных в этом документе.

В некоторых вариантах осуществления может использоваться программируемое логическое устройство (например, программируемая пользователем вентильная матрица) для выполнения некоторых или всех функциональных возможностей способов, описанных в этом документе. В некоторых вариантах осуществления программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором для выполнения одного из способов, описанных в этом документе. Способы в общем предпочтительно выполняются любым аппаратным устройством.

Вышеописанные варианты осуществления являются лишь пояснительными для принципов настоящего изобретения. Подразумевается, что модификации и изменения в структурах и подробностях, описанных в этом документе, будут очевидны другим специалистам в данной области техники. Поэтому подразумевается ограничение лишь объемом нижеприведенной формулы изобретения, но не определенными подробностями, приведенными в целях описания и пояснения вариантов осуществления в настоящем документе.

ЛИТЕРАТУРА:

[1] International Telecommunication Union, Radiocommunication Assembly, "Multichannel stereophonic sound system with and without accompanying picture", Recommendation ITU-R.BS.775-2, 2006, Geneva, Switzerland.

[2] S. Boll, "Suppression of acoustic noise in speech using spectral subtraction", IEEE Trans. on Accoustics, Speech, and Signal Processing, vol. 27, no.2, pp. 113-120, 1979

[3] O. Cappé, "Elimination of the musical noise phenomenon with the Ephraim-Malah noise suppressor", IEEE Trans. On Speech and Audio Processing, vol. 2, pp. 345-349, 1994.

[4] G. Schmidt, "Single-channel noise suppression based on spectral weighting", Eurasip Newsletter, 2004.

[5] M. Berouti, R. Schwartz, and J. Makhoul, „Enhancement of speech corrupted by acoustic noise", in Proc. of the IEEE Int. Conf. On Acoustics, Speech, and Signal Processing, ICASSP, 1979

[6] R. Martin, "Spectral subtraction based on minimum statistics", in Proc. of EUSIPCO, Edinburgh, UK, 1994

[7] Y. Ephraim and D. Malah, "Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator", in Proc. of the IEEE Int. Conf. on Acoustics, Speech, and Signal Processing, ICASSP, 1984

[8] E George, "Single-sensor speech enhancement using a soft-decision/variable attenuation algorithm", in Proc. Of the IEEE Int. Conf. on Acoustics, Speech, and Signal Processing, ICASSP, 1995.

[9] C. Avendano and J.-M. Jot, "A frequency-domain approach to multi-channel upmix", J. Audio Eng. Soc., vol. 52, 2004.

[10] C. Faller, "Multiple-loudspeaker playback of stereo signals", J. Audio Eng. Soc., vol. 54, 2006.

[11] C. Uhle, J. Herre, S. Geyersberger, F. Ridderbusch, A. Walter and O. Moser, „Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program", заявка на патент US 2009/0080666, 2009.

[12] C. Uhle, J. Herre, A. Walther, O. Hellmuth, and C. Janssen, "Apparatus and method for generating an ambient signal from an audio signal, apparatus and method for deriving a multi-channel audio signal from an audio signal and computer program", заявка на патент US 2010/0030563, 2010.

[13] E. Vickers, "Two-to-three channel upmix for center channel derivation", заявка на патент US 2010/0296672, 2010.

1. Устройство для формирования стереофонического бокового сигнала, содержащего первый боковой канал и второй боковой канал, из стереофонического входного сигнала, содержащего первый входной канал и второй входной канал, содержащее:
генератор (110; 610; 710; 810; 910; 1310) модифицирующей информации для формирования модифицирующей информации, содержащей первый спектральный весовой коэффициент, причем генератор (110; 610; 710; 810; 910; 1310) модифицирующей информации содержит генератор (116; 615; 715; 815; 915) спектральных весов для формирования модифицирующей информации путем формирования первого спектрального весового коэффициента с использованием монофонического среднего сигнала и монофонического бокового сигнала в стереофоническом входном сигнале, и
блок (120; 620; 720; 820; 1320) манипулирования сигналами, выполненный с возможностью манипулирования первым входным каналом на основании модифицирующей информации для получения первого бокового канала, и выполненный с возможностью манипулирования вторым входным каналом на основании модифицирующей информации для получения второго бокового канала.

2. Устройство по п. 1,
в котором блок (120; 620; 720; 820; 1320) манипулирования сигналами выполнен с возможностью манипулирования вторым входным каналом на основании первого спектрального весового коэффициента в качестве модифицирующей информации для получения второго бокового канала.

3. Устройство по п. 1,
в котором генератор (110; 610; 710; 810; 910; 1310) модифицирующей информации содержит генератор (116; 615; 715; 815; 915) спектральных весов для формирования модифицирующей информации путем формирования первого спектрального весового коэффициента на основании монофонического среднего сигнала и на основании монофонического бокового сигнала в стереофоническом входном сигнале,
причем генератор (116; 615; 715; 815; 915) спектральных весов выполнен с возможностью формирования второго спектрального весового коэффициента на основании монофонического среднего сигнала и на основании монофонического бокового сигнала в стереофоническом входном сигнале,
и при этом блок (120; 620; 720; 820; 1320) манипулирования сигналами выполнен с возможностью манипулирования вторым входным каналом на основании второго спектрального весового коэффициента в качестве модифицирующей информации для получения второго бокового канала.

4. Устройство по п. 1,
в котором генератор (110; 610; 710; 810; 910; 1310) модифицирующей информации содержит генератор (116; 615; 715; 815; 915) спектральных весов для формирования модифицирующей информации путем формирования первого спектрального весового коэффициента на основании монофонического среднего сигнала и на основании монофонического бокового сигнала в стереофоническом входном сигнале,
причем генератор (110; 610; 710; 810; 910; 1310) модифицирующей информации дополнительно содержит определитель (912) величины,
причем определитель (912) величины выполнен с возможностью приема монофонического среднего сигнала, представленного в спектральной области, и при этом определитель величины выполнен с возможностью приема монофонического бокового сигнала, представленного в спектральной области,
причем определитель (912) величины выполнен с возможностью определения значения величины монофонического бокового сигнала в качестве бокового значения величины, и при этом определитель (912) величины выполнен с возможностью определения значения величины монофонического среднего сигнала в качестве среднего значения величины,
при этом определитель (912) величины выполнен с возможностью передачи бокового значения величины и среднего значения величины в генератор (116; 615; 715; 815; 915) спектральных весов, и
при этом генератор (116; 615; 715; 815; 915) спектральных весов выполнен с возможностью формирования первого спектрального весового коэффициента с использованием бокового значения величины и среднего значения величины.

5. Устройство по п. 1,
в котором генератор (110; 610; 710; 810; 910; 1310) модифицирующей информации содержит генератор (116; 615; 715; 815; 915) спектральных весов для формирования модифицирующей информации путем формирования первого спектрального весового коэффициента на основании монофонического среднего сигнала и на основании монофонического бокового сигнала в стереофоническом входном сигнале,
при этом генератор (116; 615; 715; 815; 915) спектральных весов выполнен с возможностью формирования модифицирующего коэффициента в соответствии с формулой

или при этом генератор (116; 615; 715; 815; 915) спектральных весов выполнен с возможностью формирования модифицирующего коэффициента в соответствии с формулой:

или при этом генератор (116; 615; 715; 815; 915) спектральных весов выполнен с возможностью формирования модифицирующего коэффициента в соответствии с формулой:

при

причем |S(f)| указывает спектр величины монофонического бокового сигнала, причем |М(f)| указывает спектр величины монофонического бокового сигнала, причем указывает спектр величины первого входного канала, причем указывает спектр величины второго входного канала, причем M(f) указывает монофонический средний сигнал, и при этом α, β, γ, δ и η являются скалярными множителями.

6. Устройство по п. 2, в котором генератор (110; 610; 710; 810; 910; 1310) модифицирующей информации выполнен с возможностью формирования модифицирующей информации на основании монофонического среднего сигнала в стереофоническом входном сигнале или на основании монофонического бокового сигнала в стереофоническом входном сигнале, причем монофонический средний сигнал зависит от суммарного сигнала, получаемого сложением первого и второго входного каналов, и при этом монофонический боковой сигнал зависит от разностного сигнала, получаемого вычитанием второго входного канала из первого входного канала.

7. Устройство по п. 2, причем устройство дополнительно содержит генератор (561, 562) канала, при этом генератор канала выполнен с возможностью формирования монофонического среднего сигнала или монофонического бокового сигнала на основании первого и второго входных каналов.

8. Устройство по п. 2, причем устройство дополнительно содержит:
блок (1305) преобразования для преобразования первого и второго входных каналов в стереофоническом входном сигнале из временной области в спектральную область, и
блок (1325) обратного преобразования,
при этом блок (120; 620; 720; 820; 1320) манипулирования сигналами выполнен с возможностью манипулирования первым входным каналом, представленным в спектральной области, и вторым входным каналом, представленным в спектральной области, для получения стереофонического бокового сигнала, представленного в спектральной области,
и при этом блок (1325) обратного преобразования выполнен с возможностью преобразования стереофонического бокового сигнала, представленного в спектральной области, из спектральной области во временную область.

9. Устройство повышающего микширования, содержащее:
устройство (1510) для формирования стереофонического бокового сигнала, содержащего первый боковой канал и второй боковой канал, по одному из предшествующих пунктов, причем устройство выполнено с возможностью формирования первого бокового канала в качестве первого канала повышающего микширования, и при этом устройство выполнено с возможностью формирования первого бокового канала в качестве первого канала повышающего микширования,
генератор (1520) первого среднего канала для формирования первого среднего канала в качестве третьего канала повышающего микширования на основании разности между первым стереофоническим входным каналом и первым боковым каналом, и
генератор (1530) второго среднего канала для формирования второго среднего канала в качестве четвертого канала повышающего микширования на основании разности между вторым стереофоническим входным каналом и вторым боковым каналом.

10. Устройство для формирования стереофонического среднего сигнала, содержащего первый средний канал и второй средний канал, из стереофонического входного сигнала, содержащего первый входной канал и второй входной канал, содержащее:
генератор (1010) модифицирующей информации для формирования модифицирующей информации, содержащей первый спектральный весовой коэффициент, причем генератор (1010) модифицирующей информации содержит генератор спектральных весов для формирования модифицирующей информации путем формирования первого спектрального весового коэффициента с использованием монофонического среднего сигнала и монофонического бокового сигнала в стереофоническом входном сигнале, и
блок (1020) манипулирования сигналами, выполненный с возможностью манипулирования первым входным каналом на основании модифицирующей информации для получения первого среднего канала, и выполненный с возможностью манипулирования вторым входным каналом на основании модифицирующей информации для получения второго среднего канала.

11. Устройство по п. 10,
в котором генератор модифицирующей информации дополнительно содержит определитель величины,
причем определитель величины выполнен с возможностью определения значения величины у монофонического бокового сигнала, представленного в спектральной области, в качестве бокового значения величины, и при этом определитель величины выполнен с возможностью определения значения величины у монофонического среднего сигнала, представленного в спектральной области, в качестве среднего значения величины,
причем определитель величины выполнен с возможностью передачи бокового значения величины и среднего значения величины в генератор спектральных весов, и
при этом генератор спектральных весов выполнен с возможностью формирования первого спектрального весового коэффициента с использованием бокового значения величины и среднего значения величины.

12. Способ формирования стереофонического бокового сигнала, содержащего первый боковой канал и второй боковой канал, из стереофонического входного сигнала, содержащего первый входной канал и второй входной канал, содержащий этапы, на которых:
формируют модифицирующую информацию, содержащую первый спектральный весовой коэффициент, путем формирования первого спектрального коэффициента с использованием монофонического среднего сигнала и монофонического бокового сигнала в стереофоническом входном сигнале,
манипулируют первым входным каналом на основании модифицирующей информации для получения первого бокового канала, и
манипулируют вторым входным каналом на основании модифицирующей информации для получения второго бокового канала.

13. Способ формирования стереофонического среднего сигнала, содержащего первый средний канал и второй средний канал, из стереофонического входного сигнала, содержащего первый входной канал и второй входной канал, содержащий этапы, на которых:
формируют модифицирующую информацию, содержащую первый спектральный весовой коэффициент, путем формирования первого спектрального весового коэффициента с использованием монофонического среднего сигнала и монофонического бокового сигнала в стереофоническом входном сигнале,
манипулируют первым входным каналом на основании модифицирующей информации для получения первого среднего канала, и
манипулируют вторым входным каналом на основании модифицирующей информации для получения второго среднего канала.

14. Способ по п. 13, в котором этап, на котором формируют модифицирующую информацию, содержит этапы, на которых:
формируют модифицирующую информацию путем формирования первого спектрального весового коэффициента, причем первый спектральный весовой коэффициент зависит от монофонического среднего сигнала и монофонического бокового сигнала в стереофоническом входном сигнале,
определяют значение величины монофонического бокового сигнала, представленного в спектральной области, в качестве бокового значения величины,
определяют значение величины монофонического среднего сигнала, представленного в спектральной области, в качестве среднего значения величины,
подают боковое значение величины и среднее значение величины в генератор спектральных весов и
формируют первый спектральный весовой коэффициент с использованием бокового значения величины и среднего значения величины.

15. Машиночитаемый носитель, содержащий компьютерную программу для реализации способа по п. 12, исполняемую на компьютере или в процессоре.

16. Машиночитаемый носитель, содержащий компьютерную программу для реализации способа по п. 13 или 14, исполняемую на компьютере или в процессоре.



 

Похожие патенты:

Изобретение относится к аудиосистеме, в частности к виртуальному пространственному воспроизведению аудиосигналов. Технический результат - обеспечение полного восприятия пространственного звука на основе бинауральных сигналов.

Изобретение относится к аудиосистемам. Технический результат заключается в обеспечении возможности улучшения пространственного восприятия воспроизводимого аудиосистемой аудиосигнала, расширении арсенала доступных аудиоэффектов.

Изобретение относится к области одновременного воспроизведения многоканальных сигналов. Техническим результатом является обеспечение улучшенной обработки, снижение сложности и/или уменьшение вычислительной нагрузки, повышение качества звука, повышение производительности.

Изобретение относится к средствам для воспроизведения аудио сигнала. Технический результат заключается в повышении гибкости расположения громкоговорителей, увеличении уровня звукового давления и увеличении качества пространственного ощущения.

Изобретение относится к средствам кодирования и декодирования многоканального звукового сигнала. Технический результат заключается в повышении качества кодированного сигнала.

Изобретение относится к средствам фильтрации бинауральных воздействий в аудиопотоках и к средствам защиты индивидуального, группового и массового сознания граждан от скрытых вредоносных воздействий в аудиопотоках.

Изобретение относится к обработке звуковых сигналов. Технический результат - повышение точности распознавания звуковых сигналов.

Изобретение относится к аудиообработке и, в частности, к разложению аудиосигналов на различные компоненты. Технический результат - повышение точности воспроизведения стереофонического звука.

Изобретение относится к аудиообработке и, в частности, к разложению аудиосигналов на различные компоненты, к примеру, различно воспринимаемые компоненты. Технический результат - разложение сигнала с использованием заранее вычисленной частотно-зависимой кривой подобия в качестве эталонной кривой.

Изобретение относится к средствам для усовершенствованной авторской разработки и представления трехмерных аудиоданных. Технический результат заключается в уменьшении вычислительной сложности обработки трехмерного звука.

Изобретение относится к обработке звуковых сигналов. Технический результат изобретения заключается в повышении скорости передачи сигналов. Устройство для генерирования, по крайней мере, одного выходного звукового сигнала, представляющего наложение, по крайней мере, двух различных звуковых объектов, включает процессор для обработки входного звукового сигнала для обеспечения объектного представления входного звукового сигнала, где это объектное представление может быть сгенерировано параметрически управляемым приближением оригинальных объектов посредством использования сигнала понижающего микширования объекта. Манипулятор объекта индивидуально управляет объектами, используя объектно-ориентированные звуковые метаданные, относящиеся к индивидуальным звуковым объектам, чтобы получить управляемые звуковые объекты. Управляемые звуковые объекты микшируются посредством использования микшера объекта для того, чтобы, в конце концов, получить выходной звуковой сигнал, имеющий одно или многоканальные сигналы в зависимости от конкретной установки рендеринга. 6 н. и 6 з.п. ф-лы, 17 ил.

Настоящее изобретение относится к области многоканальных аудиосистем. Технический результат изобретения заключается в улучшении воспроизведения многоканального аудиосигнала. Изобретение раскрывает способ воспроизведения множества аудиоканалов, согласно которому первый и второй наборы несинфазной информации извлекают из боковых и/или задних боковых каналов, содержащихся в многоканальном аудиосигнале. Применяют указанные наборы несинфазной информации к первому и второму вертикальным высотным громкоговорителям соответственно. 3 н. и 12 з.п. ф-лы, 10 ил.

Изобретение относится к области обработки сигнала. Техническим результатом является уменьшение сложности алгоритмов кодирования и декодирования за счет декорреляции только вещественнозначных коэффициентов. Способ обработки аудиоданных включает прием из битового потока аудиоданных, соответствующих ряду звуковых каналов, применение процесса декорреляции к некоторым из аудиоданных, причем процесс декорреляции включает применение алгоритма декорреляции, действующего полностью на вещественнозначных коэффициентах. 3 н. и 13 з.п. ф-лы, 37 ил.

Настоящее изобретение относится к средствам обработки аудиосигнала. Технический результат заключается в улучшении качества звукового пространства при малом количестве регистраций за счет улучшения согласованности и динамического диапазона звука. Обрабатывают исходный аудиосигнал с N.х каналами, где N больше 1, а х больше или равно 0, включая стадию многоканальной обработки вышеупомянутого входного аудиосигнала посредством многоканальной свертки с заранее заданным образом. Вышеупомянутый образ создается путем захвата эталонного звука с помощью набора акустических экранов, расположенных в базовом пространстве. Дополнительно выбирают по меньшей мере один образ из множества образов, ранее созданных на различных звуковых фонах. 3 з.п. ф-лы, 3 ил.

Изобретение относится к обработке звуковых сигналов. Технический результат – повышение эффективности системы путем генерирования и представления звуковых сигналов в различных средах проигрывания. Предложенная система адаптивного звука обрабатывает аудиоданные, содержащие некоторое количество независимых монофонических аудиопотоков. С одним или несколькими из потоков были связаны метаданные, которые описывают, является указанный поток потоком на основе каналов или потоком на основе объектов. Потоки на основе каналов содержат информацию представления данных, кодированную посредством названия канала; а потоки на основе объектов содержат информацию местоположения, кодированную через выражения местоположения, закодированные в связанных метаданных. Кодек упаковывает независимые аудиопотоки в единую двоичную последовательность, которая содержит все аудиоданные. Такая конфигурация позволяет представлять данные звука в соответствии с аллоцентрической системой отсчета, в которой местоположение представления данных звука основывается на характеристиках среды проигрывания. Метаданные положения объектов содержат соответствующую информацию аллоцентрической системы отсчета, необходимую для верного проигрывания звука с использованием положений доступных громкоговорителей в помещении, которое приспособлено для проигрывания адаптивного звукового содержимого. 5 н. и 13 з.п. ф-лы, 11 ил., 12 табл.

Изобретение относится к средствам для сжатия и восстановления представления системы Амбисоник высшего порядка для звукового поля. Технический результат заключается в улучшении качества сжатого представления звукового поля HOA. Представление HOA анализируется на присутствие доминирующих источников звука и их направления оцениваются. Затем представление HOA разлагается на некоторое количество доминирующих направленных сигналов и остаточную компоненту. Эта остаточная компонента преобразуется в дискретную пространственную область, чтобы получать функции общих плоских волн в равномерных направлениях дискретизации, которые предсказываются из доминирующих направленных сигналов. В заключение, ошибка предсказания преобразуется назад в область HOA и представляет остаточную окружающую компоненту HOA, для которой выполняется уменьшение порядка, затем следует перцепционное кодирование доминирующих направленных сигналов и остаточной компоненты. 4 н. и 10 з.п. ф-лы, 8 ил.

Изобретение относится к аудиокодированию и декодированию. Технический результат – восстановление дискретизированной звуковой волны в одноканальном, стереофоническом или многоканальном формате. Система обработки аудио содержит компонент предварительной обработки, который принимает квантованные спектральные компоненты и выполняет обратное квантование, получая в результате представление временной области для промежуточного сигнала, каскад обработки в частотной области, сконфигурированный для предоставления представления временной области для обработанного аудиосигнала, и преобразователь частоты дискретизации, предоставляющий восстановленный аудиосигнал, дискретизированный с целевой частотой дискретизации. Соответствующие внутренние частоты дискретизации представления временной области для промежуточного аудиосигнала и представления временной области для обработанного аудиосигнала равны. В конкретных вариантах осуществления каскад обработки содержит каскад параметрического повышающего микширования, который работает в двух разных режимах и ассоциируется с каскадом задержки, который обеспечивает постоянную суммарную задержку. 3 н. и 12 з.п. ф-лы, 34 ил., 4 табл.

Изобретение относится к средствам для параметрического кодирования аудио. Технический результат заключается в повышении эффективности кодирования. Декодер содержит узел параметрического декодирования для генерирования множества первых оцененных сигналов аудиообъектов посредством повышающего микширования трех или более сигналов понижающего микширования. Узел параметрического декодирования сконфигурирован с возможностью повышающего микширования упомянутых трех или более сигналов понижающего микширования в зависимости от параметрической побочной информации, указывающей информацию об упомянутом множестве исходных сигналов аудиообъектов. Более того, декодер содержит узел обработки остатка для генерирования множества вторых оцененных сигналов аудиообъектов посредством модификации одного или более из упомянутых первых оцененных сигналов аудиообъектов. Узел обработки остатка сконфигурирован с возможностью модификации упомянутого одного или более из упомянутых первых оцененных сигналов аудиообъектов в зависимости от одного или более остаточных сигналов. 9 н. и 17 з.п. ф-лы, 18 ил.

Изобретение относится к средствам для управления межканальной когерентностью звуковых сигналов, подвергнутых повышающему микшированию. Технический результат заключается в повышении качества кодирования и декодирования аудиоданных. Определяют характеристики аудиоданных, соответствующих ряду звуковых каналов. Эти звуковые характеристики могут содержать данные пространственных параметров. Процессы декорреляционной фильтрации для аудиоданных могут основываться на звуковых характеристиках. Эти процессы декорреляционной фильтрации могут вызывать специфичную когерентность между сигналами декорреляции между специфичными для каналов сигналами декорреляции для по меньшей мере одной пары каналов. Такие специфичные для каналов сигналы декорреляции могут приниматься и/или определяться. Можно управлять межканальной когерентностью между рядом пар звуковых каналов. Путем выполнения операций на фильтрованных аудиоданных можно синтезировать набор специфичных для каналов сигналов декорреляции, соответствующих набору значений IDC. 3 н. и 14 з.п. ф-лы, 36 ил.

Изобретение относится к средствам для кодирования и декодирования звука. Технический результат заключается в повышении качества восстановления звуковых объектов. Способ кодирования включает, среди прочего, вычисление М сигналов понижающего микширования путем формирования комбинаций N звуковых объектов, при этом M≤N, и вычисление параметров, позволяющих восстанавливать набор звуковых объектов, сформированный на основе N звуковых объектов, исходя из М сигналов понижающего микширования. Вычисление М сигналов понижающего микширования осуществляют в соответствии с критерием, не зависящим от какой-либо конфигурации громкоговорителей. 6 н. и 21 з.п. ф-лы, 11 ил.
Наверх