Ограничение понижающего микширования

Авторы патента:

УИЛСОН Ронда (US)

ВАРД Майкл (US)

ВЕНЕЦИЯ Стивен (US)

ДРЕССЛЕР Роджер (US)

G10L19/008 - Техника анализа-синтеза речи для уменьшения избыточности, например в вокодерах ; кодирование или декодирование речи

Владельцы патента RU 2565015:

ДОЛБИ ЛАБОРАТОРИС ЛАЙСЭНЗИН КОРПОРЕЙШН (US)

Изобретение относится к области микширования. Технический результат - обеспечение совместимости уровня речевого сигнала, в то же время позволяя избегнуть клиппинга выходного (выходных) сигнала (сигналов), а также предоставление способов понижающего микширования, имеющих данные общие свойства и являющихся подходящими для сохранения динамических, временных и/или пространственных свойств звукового сигнала. Способ понижающего микширования множества входных звуковых сигналов включает этапы, на которых: определяют значения коэффициентов понижающего микширования как произведения упомянутых максимальных значений коэффициентов понижающего микширования и значения ограничивающего фактора, которое является общим в пределах каждой подгруппы, для удовлетворения с учетом входных данных условию попадания в диапазон для упомянутого по меньшей мере одного выходного звукового сигнала; и применяют значения коэффициентов понижающего микширования для осуществления понижающего микширования множества входных звуковых сигналов по меньшей мере в два выходных звуковых сигнала, относящихся к пространственно связанным каналам, при этом значения коэффициентов понижающего микширования определяют как произведения упомянутых максимальных значений коэффициентов понижающего микширования и значения ограничивающего фактора, при этом значение ограничивающего фактора является общим в пределах каждой подгруппы и для всех выходных звуковых сигналов, для удовлетворения совместно условию попадания в диапазон для каждого из упомянутых по меньшей мере двух выходных звуковых сигналов, соответствующих пространственно связанным каналам. 8 н. и 15 з.п. ф-лы, 5 ил.

Перекрестная ссылка на родственные заявки

Эта заявка претендует на приоритет Предварительной Заявки на Патент Соединенных Штатов, порядковый номер: 61/413237, поданной 12 ноября 2010 года, включенной сюда по ссылке во всей своей полноте.

Область техники

Изобретение, раскрытое здесь, в общем случае относится к способу обработки аналогового или цифрового звукового сигнала. Более конкретно, оно относится к понижающему микшированию ряда звуковых сигналов в меньшее число звуковых сигналов.

Уровень техники

Как используется здесь, понижающее микширование относится к операции получения N выходных звуковых сигналов (или каналов) на основе информации, закодированной с помощью M входных звуковых сигналов (или каналов), при этом 1≤N<M. Традиционные ожидания от высококачественного понижающего микширования включают низкую степень потери информации, совместимость уровней речевых сигналов и высокую психоакустическую верность передачи между входным и выходным сигналами.

Понижающее микширование часто включает комбинирование двух сигналов в один, происходит ли это путем суммирования сигналов, суммирования с коэффициентом преобразования, взвешенного усреднения или тому подобного. В то время как понижающее микширование стереофонического сигнала в монофонический может быть выражено простым соотношением

$y_{1} = \frac{x_{1} + x_{2}}{\sqrt{2}}$ , (1)

понижающее микширование M каналов в N каналов (M-в-N) в общем случае может быть записано в матричном виде как:

$[\begin{matrix} y_{1} \\ ⋮ \\ y_{N} \end{matrix}] = [\begin{matrix} a_{11} & \dots & a_{1 M} \\ ⋮ & ⋮ \\ a_{N 1} & \dots & a_{N M} \end{matrix}] [\begin{matrix} x_{1} \\ ⋮ \\ x_{M} \end{matrix}]$ . (2)

Здесь относительное распределение веса между входными каналами, дающими вклад в данный выходной канал $y_{k}$ , выражаемое с помощью коэффициентов понижающего микширования $a_{k 1}, \dots, a_{k M}$ , может следовать из художественных соображений или может быть связано с пространственным расположением воспроизводящих источников звука. После установления относительных отношений значений коэффициентов понижающего микширования значение коэффициента передачи понижающего микширования может быть определено, исходя из других соображений, в особенности из соображений сохранения энергии в случаях, когда один входной канал дает вклад в несколько выходных каналов. В других ситуациях приоритетом может стать поддержание совместимости уровня речевого сигнала. Это требование приводит к возможности плавного соединения сегментов звукового сигнала вместе, хотя они и были получены с помощью разных типов микширования или кодирования.

Трудностью, часто встречающейся при понижающем микшировании, выбирается ли коэффициент передачи из соображений сохранения энергии или в ответ на требование, предъявляемое к уровню речевого сигнала, является то, что выходной сигнал выходит за границы допустимого диапазона. Во избежание клиппинга выходного сигнала или повреждения воспроизводящего звукового оборудования традиционной практикой в данной области является уменьшение коэффициента передачи локально - в или в окрестности момента времени, в который в противном случае получались бы выходящие за диапазон значения - или глобально. В предположении, что выходной сигнал $y_{k}$ выходит за диапазон, общий коэффициент передачи может быть ограничен согласно

$[\begin{matrix} y_{1} \\ ⋮ \\ y_{N} \end{matrix}] = γ [\begin{matrix} a_{11} & \dots & a_{1 M} \\ ⋮ & ⋮ \\ a_{N 1} & \dots & a_{N M} \end{matrix}] [\begin{matrix} x_{1} \\ ⋮ \\ x_{M} \end{matrix}]$ , (3)

где $0 < γ < 1$ - ограничивающий фактор. Также можно уменьшить только коэффициент передачи сигналов, дающих вклад в $y_{k}$ , путем

$[\begin{matrix} y_{1} \\ ⋮ \\ y_{N} \end{matrix}] = [\begin{matrix} a_{11} & \dots & a_{1 M} \\ ⋮ & ⋮ \\ a_{k - 1,1} & \dots & a_{k - 1, M} \\ γ a_{k 1} & \dots & γ a_{k M} \\ a_{k + 1,1} & \dots & a_{k + 1, M} \\ ⋮ & ⋮ \\ a_{N 1} & \dots & a_{N M} \end{matrix}] [\begin{matrix} x_{1} \\ ⋮ \\ x_{M} \end{matrix}]$ . (4)

Независимо от того, как применяются ограничивающие факторы, требования соответствия уровня речевого сигнала и осуществления ограничения незаметным с психоакустической точки зрения способом явно противоречат друг другу. Ограничение коэффициента передачи более локально способствует совместимости уровня речевого сигнала, однако приводит к более резким и более воспринимаемым изменениям коэффициента передачи. Подобным образом, осуществление ограничения в течение большего периода времени способствует улучшению одной проблемы, но ухудшению другой. Следовательно, имеется необходимость в улучшенных способах осуществления понижающего микширования.

Сущность изобретения

Для преодоления, облегчения или, по меньшей мере, смягчения одной или более из проблем, относящихся к данной области, целью данного изобретения является предоставление способов для осуществления понижающего микширования звуковых потоков психоакустически менее заметным образом. Конкретной целью изобретения является предоставление способов понижающего микширования, которые обеспечивают совместимость уровня речевого сигнала, в то же время позволяя избегнуть клиппинга выходного (выходных) сигнала (сигналов). Другой конкретной целью изобретения является предоставление способов понижающего микширования, имеющих данные общие свойства и являющихся подходящими для сохранения динамических, временных и/или пространственных свойств звукового сигнала.

Изобретение позволяет достичь по меньшей мере одной из данных целей путем предоставления способа, системы микширования и программного продукта для компьютера, согласно независимым пунктам формулы изобретения. Зависимые пункты формулы изобретения задают предпочтительные варианты осуществления данного изобретения.

В первом аспекте изобретение предоставляет способ понижающего микширования множества входных звуковых сигналов, которые переносят входные данные, по меньшей мере в один выходной звуковой сигнал. Свойства микширования способа зависят от максимальных значений коэффициентов понижающего микширования, по меньшей мере одного условия попадания в диапазон для выходного (выходных) звукового сигнала (звуковых сигналов) и разбиения входных сигналов на подгруппы. Способ включает получение значений коэффициентов понижающего микширования из максимальных значений коэффициентов понижающего микширования путем уменьшения всех максимальных значений коэффициентов понижающего микширования, относящихся к одной и той же подгруппе, в число раз, равное значению общего ограничивающего фактора, для соответствия условию (условиям) попадания в диапазон. Значения коэффициентов понижающего микширования, полученные таким образом, являются подходящими для осуществления понижающего микширования входных сигналов.

Во втором аспекте изобретение предоставляет систему микширования, приспособленную для осуществления способа, согласно первому аспекту. В третьем аспекте изобретение предоставляет программный продукт для компьютера, с помощью которого способ, согласно первому аспекту, реализуется на программируемом компьютере.

Доктрина изобретения включает то, что общий ограничивающий фактор применяется ко всем коэффициентам понижающего микширования, управляя вкладами входных сигналов в подгруппе по меньшей мере из двух подгрупп. С помощью данной широты в ограничении различных входных сигналов в различной степени относительно более воспринимаемые сигналы могут быть ограничены в относительно меньшей степени. Это обеспечивает большую простоту сочетания совместимости уровня речевого сигнала с дискретными переходами между частями сигналов с и без ограничения коэффициента передачи.

Со ссылкой на приложенную формулу изобретения отмечается, что каждый из сигналов может быть как аналоговым (с непрерывными значениями), так и цифровым (с дискретными значениями). «Подгруппа» может включать один входной сигнал или несколько входных сигналов. «Условие попадания в диапазон» для сигнала может относиться к верхней границе для сигнала, нижней границе для сигнала или требованию для сигнала оставаться в интервале, имеющем нижнюю и верхнюю границы. Условие попадания в диапазон может применяться к конкретному временному сегменту, набору временных сегментов или может быть глобальным, применяющимся без ограничений к сигналу в целом. Понятно, что термины «условие попадания в диапазон» и «условие отсутствия клиппинга» могут использоваться в данном раскрытии взаимозаменяемым образом, так же как и термины «ограничивающий фактор» и «ограничивающий фактор коэффициента передачи». Значение ограничивающего фактора для каждой подгруппы определяется на основе не только максимальных значений коэффициентов понижающего микширования, заданных для входных сигналов как таковых, но также на основе входных данных, переносимых входными сигналами. Наконец, отмечается, что сама по себе операция понижающего микширования, то есть, образования линейных комбинаций из входных сигналов для получения выходных сигналов, может быть проведена с помощью способов, которые являются сами по себе известными в данной области техники.

За исключением нелокальных условий попадания в диапазон, нелокальных способов сглаживания (см. ниже) или подобных применяемых мер изобретение включает варианты осуществления как в реальном времени, так и в автономном режиме, например, обработку на основе файл-в-файл.

В одном варианте осуществления по меньшей мере одна подгруппа содержит два или более входных сигналов. Поскольку для уменьшения значений коэффициентов понижающего микширования для всех данных входных сигналов используется общий ограничивающий фактор, значительные связи между несколькими входными сигналами могут быть сохранены при понижающем микшировании. Следовательно, воспринимаемые динамические, временные, тембровые и/или пространственные ощущения, которые передаются во входных сигналах в целом, подвергаются влиянию только в ограниченной степени при понижающем микшировании, согласно данному варианту осуществления.

В дальнейших развитиях предыдущего варианта осуществления входные сигналы соответствуют пространственно связанным звуковым каналам, таким как левый и правый каналы; левый, центральный и правый каналы; левый и правый широкие каналы; левый и правый центральные каналы; и левый, центральный и правый объемные каналы.

В одном варианте осуществления значения коэффициентов понижающего микширования поддерживаются как можно более высокими. Это способствует совместимости уровня речевого сигнала. Например, если условие попадания в диапазон является нестрогим неравенством, значения ограничивающих факторов могут быть установлены равными или близкими к их верхним значениям (или «резким» значениям, или «плотным» значениям, или «точным» значениям), то есть, к значениям, которые приводят к равенству в условии попадания в диапазон. Предпочтительно, чтобы значения коэффициентов понижающего микширования не отличались более чем на 20% от значений, определенных от верхних границ, более предпочтительно - не более чем на 10%, и наиболее предпочтительно - не более чем на 5%. В вариантах осуществления, которые дополнительно включают сглаживание значений коэффициентов понижающего микширования (см. ниже), предпочтительным является наложение одного из вышеуказанных условий на значения, которые имеют коэффициенты понижающего микширования перед сглаживанием.

В одном варианте осуществления выходной сигнал разбивается на временные сегменты. Временные сегменты могут иметь одинаковую или разную длину; они могут быть результатом дискретизации аналоговых данных, обработки сигнала с преобразованием, или могут быть результатом применения какого-нибудь подобного способа. Временной сегмент может состоять из ряда дискретных значений. Кроме того, временной сегмент может состоять из ряда блоков, каждый из которых содержит ряд дискретных значений. Входной сигнал может быть разбит на подобные или различные временные сегменты, или может быть неразбитым. В способе, согласно данному варианту осуществления, могут осуществляться попытки удовлетворить условию попадания в диапазон в каждом временном сегменте по отдельности с учетом входных данных, относящихся к данному временному сегменту. Способ может быть сконфигурирован так, чтобы удовлетворять условию попадания в диапазон во всех временных сегментах или в некоторых временных сегментах. Для медленно меняющихся входных сигналов последняя опция может привести к уменьшению вычислительной нагрузки при ограниченном уменьшении качества, поскольку становится необходимым рассматривать не все временные сегменты.

В варианте, подходящем для обеспечения понижающего микширования на несколько выходных сигналов, способ может быть сконфигурирован для удовлетворения условию попадания в диапазон в отдельных временных сегментах, однако совместно для всех выходных сигналов. Это может привести к сохранению воспринимаемого пространственного баланса выходных сигналов.

Варианты осуществления для получения выходных сигналов, разбитых на временные сегменты, могут преимущественно сочетаться со сглаживанием (или регуляризацией). В качестве одного примера, значения конкретного коэффициента понижающего микширования, полученные для разных временных сегментов, могут рассматриваться как последовательность (во времени) и могут подвергаться операции сглаживания. Сглаженные значения коэффициентов понижающего микширования могут быть использованы в операции понижающего микширования вместо несглаженных значений коэффициентов понижающего микширования. Один или более выбранных значений коэффициентов понижающего микширования или все значения коэффициентов понижающего микширования могут подвергаться сглаживанию; эти способы могут применяться параллельно друг с другом. Специалисты в данной области поймут, что сглаживание значений ограничивающего фактора для конкретной подгруппы приведет к получению того же самого результата, как и сглаживание значений коэффициентов понижающего микширования, действующих на входные сигналы в данной подгруппе; следовательно, поскольку оба данных подхода попадают в объем изобретения, нет необходимости описывать их оба подробно в данном раскрытии.

Сглаживание может осуществляться любым подходящим способом, известным по сути в данной области. Предпочтительным образом сглаживание обуславливается верхней границей для скорости изменения. После проведения сглаживания таким образом отдельное значение в последовательности посегментных значений будет окружено спадающим и возрастающим наклонами умеренно изменяющихся значений таким образом, что резкие изменения исключаются. Наклоны могут быть охарактеризованы постоянным значением возрастания или спада в линейном или логарифмическом масштабе, таком как масштаб в дБ. Следовательно, путем регулировки значений коэффициента понижающего микширования таким образом, что получаются сглаженные значения коэффициента понижающего микширования, для которого скорость возрастания или спада (в абсолютных значениях) не является слишком большой, могут быть получены постепенные и, следовательно, менее воспринимаемые переходы между частями микшированных с понижением сигналов с ограниченным и неограниченным коэффициентами передачи. Другим предпочтительным вариантом является осуществление сглаживания путем регулировки значений коэффициентов понижающего микширования путем уменьшения или сохранения исходных значений. Увеличения значений коэффициентов понижающего микширования по сравнению с исходными значениями следует избегать, поскольку условие попадания в диапазон может затем более не удовлетворяться.

В одном варианте осуществления по меньшей мере одна подгруппа входных сигналов связана с нижней границей для ограничивающего фактора, используемого для определения значений коэффициентов понижающего микширования, действующих на входные сигналы в данной подгруппе. Граница является границей априори в том смысле, что в данном варианте осуществления изобретения осуществляется попытка удовлетворения условию попадания в диапазон для выходного сигнала путем поиска решений, находящихся только выше нижней границы. Это гарантирует то, что вклад от рассматриваемой подгруппы не станет произвольно малым.

В дальнейшем развитии предыдущего варианта осуществления основная и второстепенная подгруппы связаны с разными нижними (априори) границами для их соответствующих ограничивающих факторов. Нижняя граница, относящаяся к основной подгруппе, является большей по величине или равной нижней границе, относящейся к второстепенной подгруппе. Это может быть использовано для задания относительного баланса между подгруппами. Например, основной подгруппе может быть придано относительно большее психоакустическое значение по сравнению с второстепенной подгруппой.

В другом варианте осуществления поиск значений ограничивающего фактора, при которых удовлетворяется условие попадания в диапазон, может быть сконфигурирован в пользу основной группы. В частности, способ, согласно данному варианту осуществления, может быть сконфигурирован для поиска значений ограничивающего фактора, которые удовлетворяют условию попадания в диапазон, при этом значение ограничивающего фактора для основной подгруппы является равным или близким к верхней границе для ограничивающего фактора для основной подгруппы.

В варианте предыдущего варианта осуществления верхняя и нижняя границы могут быть заданы для соответствующих ограничивающих факторов для основной подгруппы и второстепенной подгруппы. Способ, согласно данному варианту осуществления, сконфигурирован для поиска вначале решений с включением ограничивающего фактора для основной подгруппы, равного своей верхней границе. Значение ограничивающего фактора для второстепенной подгруппы варьируется между своими верхней и нижней границами. После этого, если не найдено решение для условия попадания в диапазон, в рамках способа производится поиск решения с включением ограничивающего фактора для второстепенной подгруппы, равного своей нижней границе. Значение ограничивающего фактора для основной подгруппы варьируется между своими верхней и нижней границами. Иначе говоря, в способе значения обоих ограничивающих факторов вначале устанавливаются равными своим максимальным значениям (что приведет к лучшему сохранению совместимости уровня речевого сигнала) и затем уменьшаются избирательным способом, пока не находится пара значений ограничивающих факторов, которые приводят к удовлетворению условию попадания в диапазон. Избирательное уменьшение включает вначале уменьшение значения ограничивающего фактора для второстепенной подгруппы до его нижней границы, а затем, при необходимости, также уменьшение значения ограничивающего фактора для основной подгруппы. Это преимущественно обеспечивает то, что основные каналы, которые могут быть заданы как более важные каналы с точки зрения восприятия, затрагиваются ограничением коэффициента передачи в наименьшей возможной степени.

Со ссылкой на вышеприведенные варианты осуществления, в которых различаются основная и второстепенная подгруппы, основная подгруппа может включать сигналы, относящиеся к каналам, которые являются более важными с психоакустической точки зрения. Эти каналы включают каналы, предназначенные для воспроизведения источниками звука, расположенными в полупространстве перед слушателем; во второстепенной группе могут затем быть собраны остальные каналы, в особенности те, которые предназначены для воспроизведения позади или по сторонам от слушателя. Согласно другой модели, основными каналами могут быть те, которые предназначены для воспроизведения источниками звука, расположенными в значительной степени на той же самой высоте, что и слушатель (или уши слушателя) и/или распространяющие звук в значительной степени горизонтально; во второстепенной группе могут затем содержаться остальные каналы, предназначенные для воспроизведения звука на других высотах и/или распространяющие звук негоризонтально. В качестве еще одного варианта, основная подгруппа может быть составлена из каналов, воспроизводимых в переднем полупространстве и в значительной степени на той же самой высоте, на которой находится слушатель.

В одном варианте осуществления по меньшей мере одна из подгрупп связана с верхней границей для ограничивающего фактора для данной подгруппы. В вариантах осуществления, в которых для нескольких подгрупп задана верхняя граница для их ограничивающего фактора, и способ сконфигурирован для поиска наибольших возможных значений ограничивающего фактора в качестве решений, сочетание обоих значений ограничивающих факторов, равных их верхним границам, является допустимым решением. В данной ситуации предпочтительным является установление значений верхних границ равными друг другу таким образом, что пропорции, выраженные с помощью наперед заданных максимальных значений коэффициентов понижающего микширования, между входными сигналами от разных подгрупп, сохраняются при понижающем микшировании.

Один вариант осуществления сконфигурирован для получения по меньшей мере двух выходных звуковых сигналов, относящихся к пространственно связанным каналам. Такие пространственно связанные каналы могут принадлежать одной из следующих групп каналов или их сочетанию: передних, объемного звучания, задних объемного звучания, прямых объемного звучания, широких, центральных, боковых, высоких, вертикальных высоких. Доктрина изобретения включает получение одного значения ограничивающего фактора для каждой подгруппы для того, чтобы удовлетворить условиям попадания в диапазон для всех выходных каналов совместно. Это может привести к переводу воспринимаемого пространственного баланса входных сигналов в соответствующий баланс выходных сигналов, и может таким образом привести к исключению нежелательного дрейфа воспринимаемого местоположения источника звука и тому подобных проблем. В одном конкретном варианте осуществления определение значения общего ограничивающего фактора может происходить в два подэтапа. Во-первых, определяются значения коэффициентов понижающего микширования как произведения максимальных значений коэффициентов понижающего микширования и значений предварительных ограничивающих факторов, которые удовлетворяют условию попадания в диапазон для каждого из (пространственно связанных) выходных сигналов, которые получаются из входных сигналов в рассматриваемой подгруппе. Во-вторых, значение ограничивающего фактора, применяемое к данной подгруппе, получается путем выделения минимального значения из всех значений предварительных ограничивающих факторов, полученных для упомянутых выходных сигналов на первом подэтапе.

В одном варианте осуществления система кодирования приспособлена для получения множества звуковых сигналов для осуществления их понижающего микширования по меньшей мере в один микшированный с понижением сигнал, согласно изобретению, и для кодирования микшированного (микшированных) с понижением сигнала (сигналов) в виде потока битов.

В одном варианте осуществления система декодирования приспособлена для получения потока битов, с помощью которого закодированы звуковые сигналы, и спецификации понижающего микширования, сгенерированной согласно изобретению. Спецификация понижающего микширования может включать значения коэффициентов понижающего микширования и/или разбиение сигналов на подгруппы. Кроме того декодер приспособлен для осуществления понижающего микширования звуковых сигналов по меньшей мере в один микшированный с понижением сигнал, согласно спецификации понижающего микширования, например, с применением коэффициентов понижающего микширования.

В одном варианте осуществления система декодирования может включать входной порт, декодер и микшер. Система декодирования приспособлена для декодирования и осуществления понижающего микширования сигнала, согласно спецификации, сгенерированной согласно изобретению. Как видно из изложенного выше, доктрина изобретения включает то, что значения коэффициентов понижающего микширования уменьшаются в соответствии с условием попадания в диапазон с помощью мультипликативного ограничивающего фактора, который является общим в пределах каждой подгруппы сигналов. Это будет означать то, что значения отношений коэффициентов, применяемых к сигналам в одной подгруппе, являются постоянными, в то время как значения отношений коэффициентов, применяемых к сигналам в разных подгруппах, являются переменными. Здесь термины «постоянные» и «переменные» относятся к возможным изменениям между различными наборами значений коэффициентов понижающего микширования. Например, один набор значений коэффициентов понижающего микширования может быть вычислен для каждого временного сегмента. Однако, как включает в себя доктрина изобретения, система понижающего микширования будет сохранять определенные значения отношений между коэффициентами понижающего микширования в пределах таких наборов. Поскольку некоторые из отношений являются переменными, система декодирования может быть приспособлена для ограничения относительно более воспринимаемых сигналов (например, в основной подгруппе) в относительно меньшей степени. Это приводит к упрощению сочетания совместимости уровня речевого сигнала с дискретными переходами между частями сигналов с и без ограничения коэффициента передачи. Если в подгруппе содержится два или более сигналов, система декодирования может сохранять значительные связи между этими сигналами при их совместном декодировании и понижающем микшировании таким образом, что воспринимаемые динамические, временные, тембровые и/или пространственные ощущения, которые передаются входными сигналами в целом, подвергаются влиянию только в малой степени.

Отмечается, что изобретение относится ко всем возможным сочетаниям характерных особенностей, перечисленных в формуле изобретения.

Краткое описание чертежей

Настоящее изобретение будет теперь описано более подробно со ссылкой на сопроводительные чертежи, на которых:

На фигуре 1 представлена обобщенная блок-схема части системы микширования, согласно варианту осуществления;

На фигуре 2 представлен график, иллюстрирующий выбор значений факторов микширования для основной и второстепенной подгрупп, согласно варианту осуществления;

На фигуре 3 представлены два графика, иллюстрирующие выбор допустимых интервалов для значений ограничивающих факторов на основе максимальных значений коэффициентов понижающего микширования, согласно варианту осуществления;

На фигуре 4 представлена обобщенная блок-схема системы микширования, согласно варианту осуществления; и

На фигуре 5 проиллюстрирован способ сглаживания, составляющий часть варианта осуществления.

Подробное описание вариантов осуществления

На фигуре 1 показана часть системы микширования 100, согласно варианту осуществления изобретения. Система 100 приспособлена для удовлетворения следующему условию попадания в диапазон для k-го выходного сигнала:

$| y_{k} | \leq {\hat{y}}_{k}$ (5)

Первые умножители 101 и сумматор 103 вычисляют значение k-го выходного сигнала на основе значений 1-го, 2-го и 4-го входных сигналов согласно

$y_{k} = a_{k 1} x_{1} + a_{k 2} x_{2} + a_{k 4} x_{4}$ ,

где $a_{k 1}, a_{k 2}, a_{k 4}$ - наперед заданные максимальные значения коэффициентов понижающего микширования, определяющие относительные веса входных сигналов при отсутствии ограничения. Путем наперед заданного разбиения 1-й и 4-й входные сигналы относятся к первой подгруппе, в то время как 2-й и 3-й входные сигналы относятся ко второй подгруппе. Принимая во внимание данное разбиение на подгруппы, контроллер 104 будет осуществлять попытки удовлетворения условию попадания в диапазон (5) путем выбора значений ограничивающих факторов $α_{1}, α_{2} > 0$ в

$y_{k} = α_{1} (a_{k 1} x_{1} + a_{k 4} x_{4}) + α_{2} a_{k 2} x_{2}$ .(6)

Со ссылкой на фигуру 1, вторые умножители 102 применяют значения ограничивающих факторов $α_{1}, α_{2}$ к входным сигналам. Контроллер 104 осуществляет выбор значений ограничивающих факторов $α_{1}, α_{2}$ в ответ на значение выходного сигнала $y_{k}$ .

Теперь со ссылкой на всю систему микширования 100, обсуждаемую выше, в целом действие ограничивающих входных сигналов при понижающем микшировании может быть выражено в матричном виде следующим образом. Понижающее микширование без ограничения удовлетворяет соотношению $Y = A X$ , где $X, Y$ - векторы входного и выходного сигнала и

$A = [\begin{matrix} a_{11} & \dots & a_{14} \\ ⋮ & ⋮ \\ a_{M 1} & \dots & a_{M 4} \end{matrix}]$ .

Понижающее микширование с ограничением удовлетворяет уравнению

$Y = (α_{1} A_{1} + α_{2} A_{2}) X$

$A_{1} = [\begin{matrix} a_{11} & 0 & 0 & a_{14} \\ ⋮ & ⋮ & ⋮ & ⋮ \\ a_{M 1} & 0 & 0 & a_{M 4} \end{matrix}]$ и $A_{2} = [\begin{matrix} 0 & a_{12} & a_{13} & 0 \\ ⋮ & ⋮ & ⋮ & ⋮ \\ 0 & a_{M 2} & a_{M 3} & 0 \end{matrix}]$ .

Очевидно, если налагается одно из условий попадания в диапазон $Y \leq \overset{\land}{Y}$ , $\overset{\lor}{Y} \leq Y$ и $\overset{\lor}{Y} \leq Y \leq \overset{\land}{Y}$ , где $\overset{\lor}{Y}, \overset{\land}{Y}$ - постоянные векторы, то значения ограничивающих факторов $α_{1}, α_{2}$ будут выбираться достаточно малыми таким образом, чтобы условия попадания в диапазон для всех выходных сигналов удовлетворялись совместно.

Ограничение коэффициента передачи, согласно изобретению, может быть сделано менее воспринимаемым при трактовании вышеупомянутых подгрупп по-разному. Первая подгруппа ${y_{1}, y_{4}}$ может трактоваться как основная подгруппа, в то время как вторая подгруппа ${y_{2}, y_{3}}$ может трактоваться как второстепенная подгруппа. Например, сигналы в основной подгруппе могут соответствовать передним левым и передним правым сигналам, которые имеют основное психоакустическое значение. Сигналы во второй подгруппе могут соответствовать объемного звучания левому и объемного звучания правому сигналам, которые предназначены для воспроизведения расположенным не спереди источником звука и, следовательно, имеют меньшее значение.

Для отображения неравного значения двух подгрупп система микширования 100, согласно данному варианту осуществления, может осуществлять выбор значения основного ограничивающего фактора из интервала $L_{1} \leq α_{1} \leq U_{1}$ и значения второстепенного ограничивающего фактора из интервала $L_{2} \leq α_{2} \leq U_{2}$ . Соответственно, $L_{1}, L_{2} > 0$ .

Это будет теперь проиллюстрировано на примере, в котором принимается, что значения верхних границ равны, что приводит к сохранению пропорций микширования, выражаемых с помощью максимальных значений коэффициентов понижающего микширования, где это возможно, и равны единице, то есть, $U_{1} = U_{2} = 1$ . Далее принимается, что ${\hat{y}}_{k} = 1$ .

Очевидно, что в ситуации, когда $a_{k 1} x_{1} + a_{k 4} x_{4} = 0,5$ и $a_{k 2} x_{2} = 0,4$ в уравнении (6), ограничение коэффициента передачи не является необходимым, так что значения ограничивающих факторов могут быть установлены равными $(α_{1}, α_{2}) = (1,1)$ и все еще соответствовать условию попадания в диапазон, то есть, максимальные значения коэффициентов понижающего микширования применяются в качестве значений коэффициентов понижающего микширования.

Теперь, если $a_{k 1} x_{1} + a_{k 4} x_{4} = 0,8$ и $a_{k 2} x_{2} = 0,4$ в уравнении (6), то условие попадания в диапазон $| y_{k} | \leq 1$ удовлетворяется для пар значений ограничивающего фактора $(α_{1}, α_{2})$ , находящихся в пределах пятиугольной области с углами в точках $(L_{1}, L_{2}), (1, L_{2}), (1, \frac{1}{2}), (\frac{3}{4},1)$ и $(L_{1},1)$ , как показано на фигуре 2. По уже указанным причинам является предпочтительным не ограничивать коэффициент передачи больше, чем необходимо, и, соответственно, система 100 предпочтительно осуществляет попытки нахождения верхнего (или «острого») решения $y_{k} = 1$ путем выбора значений ограничивающих факторов из краевого сегмента, находящегося между точками $(1, \frac{1}{2})$ и $(\frac{3}{4},1)$ . Далее, ограничение второстепенных входных каналов является более предпочтительным по сравнению с ограничением основных входных каналов, и это переводит к выбору пары значений ограничивающих факторов в правой экстремальной точке (наибольшее значение $α_{1}$ ) на данном сегменте. Это приводит к решению в виде $(α_{1}, α_{2}) = (1, \frac{1}{2})$ , и k-й выходной сигнал будет задаваться в виде

$y_{k} = a_{k 1} x_{1} + a_{k 2} x_{2} + \frac{a_{k 4}}{2} x_{4}$ .

Однако, если $L_{2} > \frac{1}{2}$ , то значение основного ограничивающего фактора $α_{1}$ будет обязательно меньшим, чем его верхняя граница $U_{1} = 1$ . Для того, чтобы максимальным образом отдать приоритет основной подгруппе по сравнению с второстепенной, предпочтительным выбором значений ограничивающих факторов является $(α_{1}, α_{2}) = (\frac{5}{4} - \frac{L_{2}}{2}, L_{2})$ .

В вариантах данного варианта осуществления, в которых система 100 сконфигурирована для поиска значений ограничивающих факторов способом, отличающимся от описанного в примере, приведенном в предыдущем параграфе, основной подгруппе может отдаваться приоритет путем связывания с ней большего значения нижней границы, чем для второстепенной подгруппы, то есть $L_{1} > L_{2}$ .

В одном варианте осуществления система микширования 100 может определять подходящие значения верхней и нижней границ для значений ограничивающих факторов на основе максимальных значений коэффициентов понижающего микширования. Если условие попадания в диапазон выражается как $- 1 \leq Y \leq 1$ , задано число $W \leq 1$ , и выражения для значений границ записываются в виде

$L_{1} = m_{p} W, L_{2} = m_{s} W, U_{1} = U_{2} = W$ (7)

то в данном варианте осуществления используется

$m_{s} = \min {Q, \frac{1}{W (P + S)}}, m_{p} = \frac{1}{P} (\frac{1}{W} - m_{s} S)$ (8)

где $P$ - сумма абсолютных значений коэффициентов понижающего микширования, примененных к сигналам в основной подгруппе, и $S$ - сумма абсолютных значений коэффициентов понижающего микширования, примененных к сигналам во второстепенной подгруппе. При варьировании значения константы $0 < Q < 1$ , тенденция системы 100 к ограничению второстепенных сигналов, а не основных сигналов, может быть сделана более или менее резко выраженной. В примере, обсуждаемом выше, $P = | a_{k 1} | + | a_{k 4} |$ и $S = | a_{k 2} |$ .

На фигурах 3А и 3 В пунктирные области представляют собой результаты выбора $(α_{1}, α_{2})$ значений факторов ограничений, которые удовлетворяют двойному неравенству

$- 1 \leq W (m_{p} P + m_{s} S) \leq 1$ ,

которое представляет собой то, чего достигает вышеуказанное условие попадания в диапазон в наихудшем случае, когда все входные сигналы имеют величину, равную единице, и одинаковые знаки со знаками значений коэффициентов понижающего микширования, то есть, для некоторых $k$ , $a_{k l} x_{l} = | a_{k l} |$ для всех $l$ или $a_{k l} x_{l} = - | a_{k l} |$ для всех $l$ . Заштрихованные подобласти представляют собой результаты выбора значений ограничивающих факторов, для которых основные сигналы являются ограниченными в меньшей степени, чем второстепенные сигналы. Значения нижних границ в формулах (7), (8) представляют собой результаты выбора ограничивающих значений, для которых происходит начальное удовлетворение условия попадания в диапазон (т. е. удовлетворяется «пиково») в наихудшем случае. С целью иллюстрации константа $Q$ была установлена равной 1/2. Этот вариант осуществления основан на понимании того, что значения ограничивающих факторов никогда не имеют необходимости быть выбранными меньшими, чем данные значения. Поняв этот иллюстрирующий вариант осуществления, специалисты в данной области смогут обобщить его на другие условия попадания в диапазон, отличные от условия $- 1 \leq Y \leq 1$ .

На фигуре 4 показана система 400 микширования для осуществления понижающего микширования восьми звуковых каналов в два канала. Можно утверждать, что система 400 имеет трехслойную структуру, содержащую секцию 420 конфигурирования, контроллер (секцию ограничения коэффициента передачи) 440 и секцию 460 микширования. Секция 420 конфигурирования приспособлена для определения подходящих интервалов для значений ограничивающих факторов на основе параметров, формирующих свойства системы 400. Контроллер ограничения 440 приспособлен для определения значений коэффициентов понижающего микширования, применяемых в секции 460 микширования, на основе интервалов, поступающих от секции 420 конфигурирования, и далее на основе некоторых входных данных, поступающих от секции 460 микширования. Секция 460 микширования приспособлена для получения вектора входных звуковых сигналов $X = {[\begin{matrix} L_{8} & R_{8} & C & L F E & L s & R s & L r s & R r s \end{matrix}]}^{T}$ и для осуществления понижающего микширования этих сигналов в вектор выходных звуковых сигналов $Y = {[\begin{matrix} L & R \end{matrix}]}^{T}$ с помощью микшера 462 и с использованием значений коэффициентов понижающего микширования.

Система 400 микширования приспособлена для обработки сигналов, разбитых на временные сегменты. Для примера, сигналы могут быть согласованными с цифровым форматом распределения, описанным в статье: J.R. Stuart et al., “MLP lossless compression”, Meridian Audio Ltd., Хантингдон, Англия, которая включена сюда по ссылке. В данном формате распределения блоки (или блоки доступа) образуются из дискретных значений в количестве от 40 до 160, и пакеты (соответствующие интервалам повторного запуска) образуются из фиксированного числа блоков. Пакет, который может состоять из 128 блоков и включать заголовок повторного запуска, будет рассматриваться как временной сегмент для целей данного примера.

Секция 420 конфигурирования включает узел 421, предназначенный для получения матрицы максимальных значений коэффициентов понижающего микширования

$d m_{8 \to 2} = [\begin{matrix} 1 & 0 & 10^{- \frac{3}{20}} & 0 & 1 & 0 & 1 & 0 \\ 0 & 1 & 10^{- \frac{3}{20}} & 0 & 0 & 1 & 0 & 1 \end{matrix}]$

и для получения маскирующих матриц

$m a s k_{p} = [\begin{matrix} 1 & 1 & 1 & 0 & 0 & 0 & 0 & 0 \\ 1 & 1 & 1 & 0 & 0 & 0 & 0 & 0 \end{matrix}]$

$m a s k_{s} = [\begin{matrix} 0 & 0 & 0 & 0 & 1 & 1 & 1 & 1 \\ 0 & 0 & 0 & 0 & 1 & 1 & 1 & 1 \end{matrix}]$

которые задают разбиение входных сигналов на основную подгруппу ( $L_{8}, R_{8}, C$ , которые предназначены для воспроизведения перед слушателем и приблизительно на уровне ушей) и второстепенную подгруппу ( $L s, R s, L r s, R r s$ ). Третья подгруппа, содержащая только канал низкочастотных эффектов ( $L F E$ ), не будет давать вклад в любые выходные сигналы в данной системе 400 микширования. Приемный узел 421 осуществляет вычисление чисел $P, S$ , относящихся к вышеупомянутому, и образует маскированные матрицы микширования

$p r i m a r y_{8 \to 2} = m a s k_{p} \cdot d m_{8 \to 2}$ , $s e c o n d a r y_{8 \to 2} = m a s k_{s} \cdot d m_{8 \to 2}$ ,

где $\cdot$ обозначает поэлементное (или по Адамару) умножение матриц. Поскольку максимальные значения коэффициентов понижающего микширования являются симметричными, числа являются

$P = 1 + 10^{- \frac{3}{20}}$ и $S = 1 + 1 = 2$ .

Секция 420 конфигурирования дополнительно содержит узлы 423, 424, 434 для вычисления верхних и нижних границ для соответствующих ограничивающих факторов для основной и второстепенной подгрупп. Первый узел 423 определяет промежуточное значение

$α = \frac{1}{W (P + S)}$ ,

основываясь на значении параметра $m a x a u d i o$ , определяющего применение условия попадания в диапазон, значениях $P, S$ , полученных от приемного узла 421, и далее основываясь на значении общей верхней границы $W$ для основного и второстепенного ограничивающих факторов. Значение верхней границы m $W$ может передаваться непосредственно первому узлу 423 в виде параметра конфигурации системы 400. Как показано на фигуре 4, оно может также передаваться преобразователем 422 для вычисления значения верхней границы $W$ , основываясь на значениях нормы речевого сигнала; как иллюстративный пример, значение верхней границы может быть задано соотношением

$W = 10^{\frac{d i a l n o r m_{8 c h} - d i a l n o r m_{2 c h}}{20}}$ ,

где $d i a l n o r m_{8 c h}$ обозначает значение нормы речевого сигнала, относящееся к 8-канальному входному представлению звукового сигнала, и $d i a l n o r m_{2 c h}$ - желаемое значение нормы речевого сигнала в 2-канальном выходном представлении. Возвращаясь к вычислению значений верхних и нижних границ, второй узел 424 приспособлен для оценки, основываясь на значении α, значений переменных $m_{p}, m_{s}$ , заданных уравнениями (8). Наконец, третий и четвертый узлы 425, 426 приспособлены для получения соответственно значений $m_{p}, W$ и $m_{s}, W$ и для нахождения значений основных и второстепенных верхних и нижних границ для ограничивающих факторов с использованием уравнений (7).

Обращаясь теперь к контроллеру 440, выходной канал $L$ имеет связанный с ним ограничитель 442, служащий для определения того, какие необходимо иметь значения основного и второстепенного ограничивающих факторов $α_{P L}, α_{S L}$ для удовлетворения условию попадания в диапазон, заданному с помощью параметра $m a x a u d i o$ . Ограничитель 442 определяет значения для одного временного сегмента в один момент времени и может быть сконфигурирован для осуществления этого способом, описанным выше, отдавая приоритет основным входным сигналам по сравнению с второстепенными. Для данного временного сегмента ограничитель 442 основывает свои решения на значении параметра попадания в диапазон $m a x a u d i o$ на интервалах $[L_{1}, U_{1}], [L_{2}, U_{2}]$ , в которых ограничитель 442 имеет возможность осуществлять выбор значений ограничивающих факторов $α_{1}, α_{2}$ , и далее на данных входного сигнала для временного сегмента. В данном варианте осуществления входные данные поступают от предварительного микшера 441 к ограничителю 442 в виде сигналов $L_{2 P}, L_{2 S}$ , заданных посредством

$[\begin{matrix} L_{2 P} \\ R_{2 P} \end{matrix}] = p r i m a r y_{8 \to 2} X$ и $[\begin{matrix} L_{2 S} \\ R_{2 S} \end{matrix}] = s e c o n d a r y_{8 \to 2} X$ .

Предварительный микшер 441 коммуникативно связан с входным портом 461 для получения входных сигналов $X$ или, возможно, подмножества (например, не включающего $L F E$ ), достаточного для вычисления значений $L_{2 P}, L_{2 S}, R_{2 P}, R_{2 S}$ . Ограничитель 443 для другого выходного канала $R$ сконфигурирован подобным образом, как и ограничитель $L$ 442, за исключением того, что он получает сигналы $R_{2 P}, R_{2 S}$ вместо $L_{2 P}, L_{2 S}$ и дает на выходе значения $α_{P R}, α_{S R}$ .

После этого, для восстановления баланса между входными каналами на пути к выходным каналам, значения левого и правого основных ограничивающих факторов $α_{P L}, α_{P R}$ передаются экстрактору минимума 444, приспособленному к тому, чтобы возвращать значение $α_{P} = \min {α_{P L}, α_{P R}}$ . Подобным образом, значения левого и правого второстепенных ограничивающих факторов $α_{S L}, α_{S R}$ поступают к еще одному экстрактору минимума 445, сконфигурированному для получения на выходе значения $α_{S} = \min {α_{S L}, α_{S R}}$ .

В данном варианте осуществления сглаживание временной последовательности значений основных и второстепенных ограничивающих факторов $α_{P} (n), α_{S} (n)$ , где $n$ - индекс временного сегмента, осуществляется с помощью регуляризаторов 446, 447, которые возвращают сглаженные последовательности значений ограничивающих факторов ${\tilde{α}}_{P} (n), {\tilde{α}}_{S} (n)$ . Работа регуляризаторов 446, 447 будет более подробно описана ниже. В данном варианте осуществления регуляризаторы 446, 447 дополняются соответствующими буферными усилителями 448, 449, которые обеспечивают возможность регуляризаторам 446, 447 работать с большим числом значений ограничивающего фактора, чем текущее. Буферные усилители 448, 449 могут быть реализованы в виде регистров сдвига.

В качестве последнего шага, выполняемого контроллером 440, умножители 450, 451 и сумматор 452 вычисляют, используя сглаженные значения ограничивающих факторов и маскированные матрицы микширования, следующие матрицы понижающего микширования, применяемые к n-му временному сегменту:

${\tilde{α}}_{P} (n) p r i m a r y_{8 \to 2} + {\tilde{α}}_{S} (n) p r i m a r y_{8 \to 2} .$

Как уже упоминалось, секция 460 микширования содержит входной порт 461, предназначенный для получения входных сигналов $X$ и для передачи их предварительному микшеру 441. Входной порт 461 далее передает входные сигналы $X$ микшеру 461, который приспособлен для получения матрицы понижающего микширования и для вычисления уравнения

$Y = ({\tilde{α}}_{P} (n) p r i m a r y_{8 \to 2} + {\tilde{α}}_{S} (n) p r i m a r y_{8 \to 2}) X .$

На фигуре 5 показан пример сглаживания, обеспеченного с помощью одного или обоих из регуляризаторов 446, 447. Значения ограничивающих факторов перед сглаживанием (верхняя кривая) и после сглаживания (нижняя кривая) были построены в виде графиков в полулогарифмическом масштабе. Острые направленные вниз пики на несглаженных значениях, которые могут быть вызваны высокими значениями входного сигнала, соответствуют уширенным пикам на сглаженных значениях для обеспечения того, что удовлетворяется условие наибольшей (абсолютной) скорости изменения. В данном примере уширение происходит с двух сторон. Далее, как положение, так и амплитуда пика сохраняются. Этого возможно достичь с помощью упреждающего фильтра. Для допустимой скорости изменения $R_{m}$ [единицы сигнала на временной сегмент] и максимального ожидаемого изменения величины сигнала $A_{m}$ [единицы сигнала] подходящее число отводов составляет $\frac{A_{m}}{R_{m}}$ , и период упреждения будет приблизительно равным числу отводов, умноженному на длину сегмента. При сглаживании, как уже отмечалось, не рекомендуется настраивать отдельные посегментные значения коэффициентов понижающего микширования путем их увеличения, поскольку это может привести к нарушению условия попадания в диапазон во временных сегментах, затронутых при сглаживании.

В аналогичном осуществлении регуляризаторы 446, 447 могут быть реализованы с помощью фильтров ограничения скорости, таких как фильтры, показанные в виде примеров в патенте под номером US3252105, который включен в данное описание ссылкой. Такие фильтры применяются преимущественно вместе с соответствующими линиями задержки для обеспечения достаточной синхронности ограничивающих факторов и входных сигналов, микшируемых с понижением. В варианте осуществления, показанном на фигуре 4, линия задержки может быть смонтирована между входным портом 461 и микшером 462 и может соответствовать размеру буферных усилителей 448, 449.

Дальнейшие варианты осуществления данного изобретения станут очевидными специалисту в данной области после изучения вышеприведенного описания. Хотя в данном описании и на чертежах раскрыты варианты осуществления и примеры, изобретение не ограничивается данными конкретными примерами. Многочисленные модификации и варианты могут быть реализованы без отклонения от объема данного изобретения, который определяется сопроводительной формулой изобретения.

Системы и способы, раскрытые выше, могут быть осуществлены в виде программного обеспечения, програмно-аппаратного обеспечения, аппаратного обеспечения или их сочетания. При осуществлении в виде аппаратного обеспечения разделение задач между функциональными узлами, о которых говорилось в вышеприведенном описании, не обязательно соответствует разделению на физические узлы; наоборот, один физический компонент может выполнять несколько функций, и одно задание может выполняться несколькими физическими компонентами во взаимодействии. Некоторые компоненты или все компоненты могут быть осуществлены в виде программного обеспечения, выполняемого процессором цифровых сигналов или микропроцессором, или быть осуществлены в виде аппаратного обеспечения или в виде зависимой от приложения интегральной микросхемы. Такое программное обеспечение может распространяться на машиночитаемых носителях, которые могут содержать компьютерные носители информации (или постоянные носители) и каналы передачи информации (или временные носители). Как хорошо известно специалисту в данной области, компьютерные носители информации включают как энергозависимые, так и энергонезависимые, съемные и несъемные носители, воплощенные любым способом или по любой технологии для хранения информации, такой как машиночитаемые инструкции, структуры данных, программные модули или другие данные. Компьютерные носители информации включают, но не ограничиваются этим, ОЗУ, ПЗУ, ЭСППЗУ, флеш-память или другую технологию памяти, компакт-диски, компакт-диски формата DVD или другие оптические диски для хранения информации, магнитные кассеты, магнитную ленту, магнитный диск для хранения информации или другие магнитные устройства для хранения информации, или любой другой носитель, который может быть использован для хранения желаемой информации, и который может быть доступным с помощью компьютера. Дополнительно специалисту хорошо известно, что в каналах передачи информации, как правило, осуществлены машиночитаемые инструкции, структуры данных, программные модули или другие данные в виде модулированного сигнала данных, такого как несущая волна или другой механизм переноса, и включены любые средства для доставки информации.

1. Способ понижающего микширования множества входных звуковых сигналов, содержащих входные данные, по меньшей мере в один выходной звуковой сигнал,
при этом максимальные значения коэффициентов понижающего микширования задают наперед, по меньшей мере одно условие попадания в диапазон для указанного по меньшей мере одного выходного звукового сигнала задают наперед и входные звуковые сигналы разбивают на наперед заданные подгруппы,
причем условие попадания в диапазон для указанного по меньшей мере одного выходного звукового сигнала представляет собой верхнюю границу для по меньшей мере одного выходного звукового сигнала, или нижнюю границу для по меньшей мере одного выходного звукового сигнала, или требование для по меньшей мере одного выходного звукового сигнала оставаться в интервале, имеющем нижнюю и верхнюю границы,
причем способ включает этапы, на которых:
определяют значения коэффициентов понижающего микширования как произведения упомянутых максимальных значений коэффициентов понижающего микширования и значения ограничивающего фактора, которое является общим в пределах каждой подгруппы, для удовлетворения с учетом входных данных условию попадания в диапазон для упомянутого по меньшей мере одного выходного звукового сигнала; и
применяют значения коэффициентов понижающего микширования для осуществления понижающего микширования множества входных звуковых сигналов по меньшей мере в два выходных звуковых сигнала, относящихся к пространственно связанным каналам,
при этом значения коэффициентов понижающего микширования определяют как произведения упомянутых максимальных значений коэффициентов понижающего микширования и значения ограничивающего фактора, при этом значение ограничивающего фактора является общим в пределах каждой подгруппы и для всех выходных звуковых сигналов, для удовлетворения совместно условию попадания в диапазон для каждого из упомянутых по меньшей мере двух выходных звуковых сигналов, соответствующих пространственно связанным каналам,
причем упомянутое определение значений коэффициентов понижающего микширования включает подэтапы, на которых:
определяют для каждого из выходных звуковых сигналов, в которые дают вклад входные звуковые сигналы в подгруппе, значение коэффициента понижающего микширования как произведение максимального значения коэффициента понижающего микширования и значения предварительного ограничивающего фактора; и
определяют значение ограничивающего фактора, общего в пределах подгруппы, путем выбора минимального значения из значений предварительных ограничивающих факторов.

2. Способ по п. 1, отличающийся тем, что по меньшей мере одна из упомянутых подгрупп входных звуковых сигналов содержит два или более входных звуковых сигнала.

3. Способ по п. 1, отличающийся тем, что входные звуковые сигналы в подгруппе относят к пространственно связанным звуковым каналам, предпочтительно включающим:
левый и правый каналы или
левый, правый и центральный каналы.

4. Способ по п. 1, отличающийся тем, что значения коэффициентов понижающего микширования определяют таким образом, что условие попадания в диапазон будет удовлетворяться самое большее в пределах 20 процентов, предпочтительно - самое большее в пределах 10 процентов, наиболее предпочтительно - самое большее в пределах 5 процентов.

5. Способ по п. 1, отличающийся тем, что выходной звуковой сигнал разбивают на временные сегменты, и при этом посегментный набор значений коэффициентов понижающего микширования определяют для каждого из множества временных сегментов как произведения упомянутых максимальных значений коэффициентов понижающего микширования и значения ограничивающего фактора, которое является общим в пределах каждой подгруппы, для удовлетворения независимо от входных данных в данном временном сегменте верхней границе выходного сигнала.

6. Способ по п. 5, отличающийся тем, что посегментный набор значений коэффициентов понижающего микширования определяют для каждого из множества временных сегментов как произведения упомянутых максимальных значений коэффициентов понижающего микширования и значения ограничивающего фактора, которое является общим в пределах каждой подгруппы, для удовлетворения совместно условию попадания в диапазон для каждого из упомянутых по меньшей мере двух выходных звуковых сигналов, соответствующих пространственно связанным каналам, независимо от входных данных во временном сегменте.

7. Способ по п. 6, отличающийся тем, что дополнительно включает этапы, на которых:
определяют последовательность посегментных значений коэффициента понижающего микширования, исходя из упомянутых посегментных наборов значений коэффициентов понижающего микширования;
сглаживают последовательность посегментных значений коэффициента понижающего микширования; и
применяют сглаженные посегментные значения к осуществлению понижающего микширования множества входных звуковых сигналов.

8. Способ по п. 7, отличающийся тем, что последовательность посегментных значений сглаживают с применением верхней границы скорости изменения,
причем последовательность посегментных значений сглаживают путем сохранения или уменьшения посегментных значений для удовлетворения верхней границе скорости изменения.

9. Способ по п. 1, отличающийся тем, что по меньшей мере одну подгруппу связывают с нижней границей для ограничивающего фактора для данной подгруппы.

10. Способ по п. 9, отличающийся тем, что задают основную и второстепенную подгруппы, при этом нижняя граница для ограничивающего фактора, относящаяся к основной подгруппе, является больше, чем нижняя граница для ограничивающего фактора, относящаяся к второстепенной подгруппе.

11. Способ по п. 1, отличающийся тем, что основную и второстепенную подгруппы задают наперед, и основную подгруппу связывают с верхней границей для ограничивающего фактора, и
при этом упомянутое определение значений коэффициентов понижающего микширования включает преимущественное использование значения верхней границы для ограничивающего фактора для основной подгруппы в качестве значения ограничивающего фактора для основной подгруппы.

12. Способ по п. 11, отличающийся тем, что основную и второстепенную подгруппы задают наперед, и каждую из них связывают с соответствующей нижней границей и соответствующей верхней границей для ограничивающих факторов (L₁≤α₁≤U₁, L₂≤α_2≤U₂), и
при этом упомянутое определение значений коэффициентов понижающего микширования включает подэтапы, на которых:
осуществляют попытку вначале удовлетворить условию попадания в диапазон для упомянутого по меньшей мере одного выходного звукового сигнала в подпространстве значений ограничивающих факторов таким образом, чтобы значение ограничивающего фактора для основной подгруппы было равным его верхней границе (α₁=U₁, L₂≤α_2≤U₂);
далее, если начальная попытка не удается, осуществляют попытку удовлетворить условию попадания в диапазон для упомянутого по меньшей мере одного выходного звукового сигнала в подпространстве значений ограничивающих факторов таким образом, чтобы значение ограничивающего фактора для второстепенной подгруппы было равным его нижней границе (L₁≤α₁≤U₁, α₂=L₂).

13. Способ по п. 10, отличающийся тем, что:
основная подгруппа соответствует каналам из одной из следующих групп:
(i) каналы для воспроизведения источниками звука, расположенными в переднем полупространстве относительно слушателя,
(ii) каналы для воспроизведения источниками звука, расположенными в значительной степени на той же самой высоте, что и слушатель;
и
при этом второстепенная подгруппа соответствует каналам, отличающимся от (i) или (ii).

14. Способ по п. 13, отличающийся тем, что:
основная подгруппа соответствует каналам из одной из следующих групп: (iii) передних каналов,
(iv) центральных каналов,
(v) широких каналов;
и
при этом второстепенная подгруппа соответствует каналам, отличающимся от (iii), (iv) или (v).

15. Способ по п. 1, отличающийся тем, что по меньшей мере одну подгруппу связывают с верхней границей для ограничивающего фактора.

16. Способ по п. 15, отличающийся тем, что две или более подгруппы связывают с общей верхней границей для ограничивающего фактора.

17. Способ по п. 1, отличающийся тем, что предпочтительно упомянутые пространственно связанные каналы принадлежат к одной из следующих групп каналов:
передних, объемного звучания, задних объемного звучания, прямых объемного звучания, широких, центральных, боковых, высоких, вертикальных высоких.

18. Способ кодирования множества звуковых сигналов в виде потока битов, включающий этапы, на которых:
получают множество звуковых сигналов;
осуществляют понижающее микширование звуковых сигналов в микшированный с понижением сигнал согласно способу понижающего микширования по п. 1; и
кодируют микшированный с понижением сигнал в виде потока битов.

19. Носитель данных, на котором хранятся машиноисполняемые инструкции, предназначенные для осуществления способа по п. 1.

20. Способ декодирования, включающий этапы, на которых:
получают поток битов, содержащий множество закодированных звуковых сигналов и матрицу микширования, полученную из коэффициентов понижающего микширования, определенных способом по любому из пп. 1-17;
декодируют кодированные звуковые сигналы для генерирования декодированных звуковых сигналов; и
микшируют декодированные звуковые сигналы в один или несколько выходных звуковых сигналов согласно матрице микширования.

21. Носитель данных, на котором хранятся машиноисполняемые инструкции, предназначенные для осуществления способа по п. 20.

22. Система (400) микширования, содержащая:
входной порт (461), предназначенный для получения множества входных звуковых сигналов, содержащих входные данные;
секцию (420) конфигурирования, предназначенную для получения максимальных значений коэффициентов понижающего микширования,
условия попадания в диапазон для упомянутого по меньшей мере одного выходного сигнала, и
разбиения множества входных звуковых сигналов на подгруппы;
причем условие попадания в диапазон для указанного по меньшей мере одного выходного звукового сигнала представляет собой верхнюю границу для по меньшей мере одного выходного звукового сигнала, или нижнюю границу для по меньшей мере одного выходного звукового сигнала, или требование для по меньшей мере одного выходного звукового сигнала оставаться в интервале, имеющем нижнюю и верхнюю границы,
контроллер (440), предназначенный для определения значений коэффициентов понижающего микширования как произведений максимальных значений упомянутых коэффициентов понижающего микширования и значения ограничивающего фактора, которое является общим в пределах каждой подгруппы, для удовлетворения с учетом входных данных условию попадания в диапазон для упомянутого по меньшей мере одного выходного звукового сигнала; и
микшер (462), предназначенный для применения значений коэффициентов понижающего микширования, определенных с помощью контроллера (440), для осуществления понижающего микширования упомянутого множества входных звуковых сигналов по меньшей мере в два пространственно связанных выходных звуковых сигнала;
причем контроллер (440) выполнен с возможностью определения значения коэффициентов понижающего микширования как произведения упомянутых максимальных значений коэффициентов понижающего микширования и значения ограничивающего фактора, при этом значение ограничивающего фактора является общим в пределах каждой подгруппы и для всех выходных звуковых сигналов, для удовлетворения совместно условию попадания в диапазон для каждого из упомянутых выходных звуковых сигналов;
при этом контроллер (440) содержит:
устройство (442, 443), предназначенное для определения для каждого из выходных звуковых сигналов, в которые дают вклад входные звуковые сигналы в подгруппе, значения коэффициента понижающего микширования как произведение максимального значения коэффициента понижающего микширования и значения предварительного ограничивающего фактора; и
экстрактор минимума (444, 445), предназначенный для определения значения ограничивающего фактора, общего в пределах подгруппы, путем выбора минимального значения из значений предварительных ограничивающих факторов.

23. Система декодирования, содержащая:
входной порт, предназначенный для получения потока битов, содержащего множество закодированных звуковых сигналов и матрицу микширования, полученную из коэффициентов понижающего микширования, определенных способом по любому из пп. 1-17;
декодер, предназначенный для декодирования кодированных звуковых сигналов в один или несколько выходных звуковых сигналов для генерирования декодированных звуковых сигналов; и
микшер, предназначенный для микширования декодированных звуковых сигналов в один или несколько выходных звуковых сигналов согласно матрице микширования.

Изобретение относится к способам и системам конфигурирования (в том числе путем адаптивного обновления) фильтра с предсказанием. Технический результат заключается в повышении эффективности определения небольших групп наборов возможных коэффициентов фильтра с предсказанием, из которых для конфигурирования фильтра с предсказанием может выбираться требуемый набор коэффициентов для оптимизации фильтра с бесконечной импульсной характеристикой (IIR) при использовании в соответствии со значимыми характеристиками сигнала.

Передискретизация выходных сигналов аудиокодеков на основе квадратурных зеркальных фильтров (qmf) // 2562434

Изобретение относится к средствам передискретизации выходных сигналов аудиокодеков на основе квадратурных зеркальных фильтров. Технический результат заключается в расширении арсенала технических средств для передискретизации аудиосигнала.

Избирательный басовый постфильтр // 2562422

Изобретение относится к кодированию цифрового звука, а именно к способам кодирования звуковых сигналов, содержащих составляющие разного характера. Технический результат заключается в повышении точности воспроизведения звука.

Способ и устройство для обработки аудио сигнала и для обеспечения большей детализации во времени для комбинированного унифицированного кодека речи и аудио (usac) // 2562384

Изобретение относится к обработке аудио сигнала. Технический результат - упрощение устройства и обеспечение большей детализации во времени для комбинированного унифицированного кодека речи и аудио.

Устройство и способ для кодирования и декодирования аудио, применяющие синусоидальную замену // 2562383

Изобретение относится к кодированию, декодированию и к обработке аудиосигнала и, в частности, к кодированию и декодированию аудио, применяющему синусоидальную замену.

Аудиокодер и декодер // 2562375

Изобретение относится к средствам кодирования и декодирования. Технический результат заключается в повышении качества кодированного и декодированного сигналов при пониженной скорости передачи данных.

Параметрическое кодирование и декодирование // 2560790

Изобретение относится к параметрическому кодированию и декодированию и, в частности, к параметрическому кодированию и декодированию многоканальных сигналов с использованием понижающего микширования и параметрических данных повышающего микширования.

Устройство и способ для обработки декодированного аудиосигнала в спектральной области // 2560788

Изобретение относится к аудиообработке, а именно к обработке декодированного аудиосигнала. Технический результат заключается в обеспечении постобработки с низкой задержкой декодированного аудиосигнала.

Стереофоническое кодирование на основе mdct с комплексным предсказанием // 2559899

Изобретение относится к средствам стереофонического кодирования на основе MDCT с комплексным предсказанием. Технический результат заключается в повышении эффективности стереофонического кодирования при передаче данных с высокой битовой скоростью.

Способ кодирования, способ декодирования, кодер, декодер, программа и носитель записи // 2559709

Изобретение относится к области кодирования и декодирования. Технический результат - повышенная эффективность сжатия.

Способ создания музыкального произведения и устройство его осуществления // 2568265

Изобретение относится к вариантам создания музыкальных произведений, может быть использовано для создания музыки на электронных таблицах из коллекции Word 2007 в ноутбуке. Технический результат заключается в обеспечении возможности записи музыкального произведения на электронные таблицы для исполнения музыкального произведения без музыканта-исполнителя. Способ осуществляется записью параметров звуков в формат-кадры, представляемые электронными таблицами, заполняемые параметрами звуков на экране ноутбука и последовательно загружаемые в память ноутбука. Реализация способа осуществляется устройством воспроизведения музыки, включающим ноутбук, блок кодирования, блок генераторов звуковых частот, с первого по сорок второй блоки ключей, и четыре канала воспроизведения музыки. 2 н.п. ф-лы, 7 ил., 4 табл.

Адаптивная обработка несколькими узлами обработки медиаданных // 2568372

Изобретение относится к адаптивной обработке медиаданных. Технический результат - улучшение представления и обработки содержимого медиаданных. Способ обработки медиаданных, включающий этапы, на которых: определяют первым устройством в цепочке обработки медиаданных то, выполнялась ли на выходной версии медиаданных операция обработки медиаданных; в ответ на определение первым устройством того, что операция обработки медиаданных была выполнена на выходной версии медиаданных, выполняют: создание или модифицирование первым устройством состояния медиаданных, где состояние указывает тип обработки медиаданных, выполненной на выходной версии медиаданных; передачу выходной версии медиаданных и состояния медиаданных из первого устройства во второе устройство в нисходящем направлении по цепочке обработки медиаданных. 6 н. и 24 з.п. ф-лы, 26 ил.

Аудиокодер, аудиодекодер, способ для кодирования аудиоинформации, способ для декодирования аудиоинформации и компьютерная программа, использующие оптимизированную хэш-таблицу // 2568381

Изобретение относится к средствам кодирования и декодирования аудиоинформации, использующим оптимизированную кэш-таблицу. Технический результат заключается в повышении скорости передачи информации. Преобразовывают информацию из частотной области во временную область для предоставления аудиопредставления временной области используя декодированные спектральные значения, чтобы получить декодированную аудиоинформацию. Выбирают правило отображения, описывающее отображение кодового значения, представляющего спектральное значение или матрицу старших битов спектрального значения, в кодированной форме на символьный код, представляющий спектральное значение или матрицу старших битов спектрального значения, в декодированной форме в зависимости от состояния контекста, описанного числовым текущим значением контекста. Определяют числовое текущее значение контекста в зависимости от множества ранее декодированных спектральных значений. Оценивают кэш-таблицу, записи которой задают как значимые значения состояния среди числовых значений контекста, так и границы интервалов числовых значений контекста. 7 н. и 12 з.п. ф-лы, 101 ил.

Устройство и способ извлечения прямого сигнала/сигнала окружения из сигнала понижающего микширования и пространственной параметрической информации // 2568926

Изобретение относится к области обработки звуковых сигналов. Технический результат заключается в обеспечении возможности извлечения части прямого сигнала или части сигнала окружения из сигнала понижающего микширования посредством использования пространственной параметрической информации. Технический результат достигается за счет устройства для извлечения прямого сигнала и/или сигнала окружения из сигнала понижающего микширования и пространственной параметрической информации, которое включает эстиматор прямого сигнала/сигнала окружения и экстрактор прямого сигнала/сигнала окружения. Эстиматор прямого сигнала/сигнала окружения формируется, чтобы оценить информацию об уровне прямой части и/или окружающей части многоканального звукового сигнала, основываясь на пространственной параметрической информации. Экстрактор прямого сигнала/сигнала окружения формируется, чтобы извлечь прямую часть сигнала и/или окружающую часть сигнала из сигнала понижающего микширования, основываясь на информации о предполагаемом уровне прямой части или окружающей части. 3 н. и 13 з.п. ф-лы, 19 ил.

Передача длины элемента кадра при кодировании аудио // 2571388

Изобретение относится к кодированию аудиосигнала, в частности к передаче длины элемента кадра. Технический результат - повышение точности кодирования аудиосигнала. Для этого элементы кадра, которые должны быть сделаны доступными для пропуска, могут быть переданы более эффективно посредством компоновки так, что информация длины полезных данных по умолчанию передается отдельно внутри блока конфигурации с информацией длины в элементах кадра, в свою очередь, разделяемой на флаг длины полезных данных по умолчанию, с последующим, если этот флаг длины полезных данных по умолчанию не установлен, значением длины полезных данных, явно кодирующим длину полезных данных соответствующего элемента кадра. Однако, если флаг длины полезных данных по умолчанию установлен, явной передачи длины полезных данных можно избежать. Вместо этого любой элемент кадра, флаг длины полезных данных расширения по умолчанию которого установлен, имеет длину полезных данных по умолчанию, и любой элемент кадра, флаг длины полезных данных расширения по умолчанию которого не установлен, имеет длину полезных данных, соответствующую значению длины полезных данных. 6 н. и 13 з.п. ф-лы, 16 табл., 39 ил.

Устройство и способ для кодирования части аудиосигнала с использованием обнаружения неустановившегося состояния и результата качества // 2573231

Изобретение относится к технологиям кодирования аудиосигналов. Техническим результатом является повышение эффективности кодирования аудиосигналов за счет определения алгоритма кодирования, исходя из обнаружения значения результата качества аудиосигнала и обнаружения неустановившегося состояния. Предложено устройство для кодирования части аудиосигнала для получения кодированного аудиосигнала для части аудиосигнала. Устройство содержит детектор неустановившегося состояния для обнаружения того, располагается ли неустановившийся сигнал в части аудиосигнала, чтобы получать результат обнаружения неустановившегося состояния. Устройство также содержит каскад кодировщика для выполнения первого алгоритма кодирования над аудиосигналом, чтобы получить первое значение результата качества адуиосигнала для упомянутой части аудиосигнала, при этом первый алгоритм кодирования имеет первую характеристику, и для выполнения второго алгоритма кодирования над аудиосигналом, чтобы получить второе значение результата качества аудиосигнала, при этом второй алгоритм кодирования имеет вторую характеристику, которая является отличной от первой характеристики. 3 н. и 12 з.п. ф-лы, 8 ил.

Устройство для оптимизации одного или более параметров представления сигнала повышающего микширования на основе представления сигнала понижающего микширования, декодер аудиосигнала, транскодер аудиосигнала, кодер аудиосигнала, аудиобитстрим, способ и компьютерная программа с использованием объектно-ориентированной параметрической информации // 2573738

Изобретение относится к средствам оптимизации одного и более параметров для формирования представления сигнала повышающего микширования на основе представления сигнала понижающего микширования и объектно-ориентированной параметрической информации. Технический результат заключается в уменьшении акустических искажений при повышающем микшировании аудиосигнала. Средство включает в себя регулятор параметров. Регулятор параметров принимает один или более входных параметров, на основе которых генерирует один или более скорректированных параметров. Регулятор параметров генерирует один или более скорректированных параметров с использованием одного или более входных параметров и объектно-ориентированной параметрической информации таким образом, что искажение представления сигнала повышающего микширования, вызванного использованием неоптимальных параметров, уменьшается по крайней мере для входных параметров, отклоняющихся от оптимальных параметров на величину, превышающую заданный предел отклонений.13 н. и 23 з.п. ф-лы, 12 ил.

Устройство для декодирования сигнала, содержащего переходные процессы, используя блок объединения и микшер // 2573774

Изобретение относится к средствам для генерирования декоррелированного сигнала. Технический результат заключается в повышении эффективности генерирования декоррелированного сигнала. Устройство содержит блок отделения сигнала переходного процесса, декоррелятор переходного процесса, второй декоррелятор, блок объединения и микшер, в котором блок отделения сигнала переходного процесса приспособлен для разделения входного сигнала на первый компонент сигнала и на второй компонент сигнала таким образом, чтобы первый компонент сигнала содержал части сигнала переходного процесса входного сигнала, и таким образом, чтобы второй компонент сигнала содержал части сигнала без переходного процесса входного сигнала. Блок объединения и микшер скомпонованы таким образом, чтобы декоррелированный сигнал из блока объединения выводился в микшер в качестве входного сигнала. 3 н. и 11 з.п. ф-лы, 10 ил.

Устройство и способ для кодирования и декодирования аудиосигнала с использованием выровненной части опережающего просмотра // 2574849

Изобретение относится к средствам кодирования и декодирования аудиосигнала с использованием выровненной части опережающего просмотра. Технический результат заключается в повышении качества кодированного аудиосигнала. Блок применения оконной функции для применения окна анализа кодирования с предсказанием к потоку дискретных значений аудиосигнала для получения обработанных с помощью оконной функции данных для анализа с предсказанием и для применения окна анализа кодирования с преобразованием к потоку дискретных значений аудиосигнала для получения обработанных с помощью оконной функции данных для анализа с преобразованием, при этом окно анализа кодирования с преобразованием связано с дискретными значениями аудиосигнала в пределах текущего кадра дискретных значений аудиосигнала и с дискретными значениями аудиосигнала заданной части будущего кадра дискретных значений аудиосигнала, являющихся частью опережающего просмотра кодирования с преобразованием. Окно анализа кодирования с предсказанием связано с частью дискретных значений аудиосигнала текущего кадра и с дискретными значениями аудиосигнала заданной части будущего кадра, являющегося частью опережающего просмотра кодирования с предсказанием. 6 н. и 20 з.п. ф-лы, 17 ил.

Аудиокодек с преобразованием и способы кодирования и декодирования временного сегмента аудиосигнала // 2574851

Изобретение относится к средствам для кодирования/декодирования временного сегмента аудиосигнала. Технический результат заключается в повышении эффективности кодирования в аудиокодере с преобразованием. Выводят указатель z положения на частотной шкале остаточного вектора, ассоциированного с временным сегментом аудиосигнала. Выводят показатель Ф, относящийся к величине структуры остаточного вектора. Определяют, удовлетворен ли предварительно заданный критерий, предусматривающий показатель Ф, указатель z и предварительно заданный порог θ, что соответствует оценке, будет ли слышно изменение знака по меньшей мере некоторых из ненулевых коэффициентов остаточного вектора после реконструкции временного сегмента аудиосигнала. Кодируется соответствующая амплитуда коэффициентов остаточного вектора, и знаки коэффициентов остаточного вектора кодируются, только когда определено, что критерий удовлетворен и, таким образом, что изменение знака будет слышно. 4 н. и 22 з.п. ф-лы, 8 ил.