Кодирование звука с использованием декоррелированных сигналов

Изобретение относится к кодированию и декодированию многоканальных звуковых сигналов с использованием пространственных параметров и, в частности, к усовершенствованным принципам для формирования и использования декоррелированных сигналов. Многоканальный сигнал, содержащий, по меньшей мере, три канала, может быть реконструирован так, что реконструированные каналы, по меньшей мере, частично декоррелированы друг от друга, с использованием подвергнутого понижающему микшированию сигнала, полученного из исходного многоканального сигнала, и набора декоррелированных сигналов, предоставленных декоррелятором, который извлекает набор декоррелированных сигналов из сигнала понижающего микширования, при этом некоррелированные сигналы в пределах набора декоррелированных сигналов являются по большей части ортогональными друг другу, то есть отношение ортогональности между парами каналов удовлетворено в пределах диапазона допустимых значений ортогональности. Технический результат - обеспечение эффективного формирования одного или более ортогональных сигналов наряду с охранением импульсных свойств и воспринимаемого качества звучания. 8 н. и 13 з.п. ф-лы, 10 ил.

 

Изобретение относится к кодированию многоканальных звуковых сигналов с использованием пространственных параметров и, в частности, к новым усовершенствованным принципам для формирования и использования декоррелированных сигналов.

В последнее время технологии многоканального воспроизведения звука становятся все более и более важными. Ввиду эффективной передачи многоканальных звуковых сигналов, задействующих 5 или более раздельных звуковых каналов, было разработано несколько способов сжатия стереофонических или многоканальных сигналов. Современные подходы к параметрическому кодированию многоканальных звуковых сигналов (параметрическая стереофония (PS), «бинауральное кодирование сигналов» (BCC) и т. п.) представляют многоканальный звуковой сигнал посредством сигнала понижающего микширования (мог бы быть монофоническим или содержать несколько каналов) и дополнительную параметрическую информацию, также указываемую ссылкой как «пространственные сигналы», характеризующие воспринимаемую пространственную фазу звука.

Устройство многоканального кодирования обычно принимает в качестве входного сигнала, по меньшей мере, два канала и выводит один или более каналов несущей и параметрические данные. Параметрические данные извлекаются из условия, чтобы в декодере могла быть рассчитана аппроксимация исходного многоканального сигнала. Обычно канал (каналы) несущей будут включать в себя полосные отсчеты, спектральные коэффициенты, отсчеты временной области и т. д., которые обеспечивают сравнительно точное представление лежащего в основе сигнала, тогда как параметрические данные не включают в себя такие отсчеты спектральных коэффициентов, но взамен включают в себя параметры управления для управления определенным алгоритмом реконструкции. Такая реконструкция могла бы содержать взвешивание посредством умножения, временной сдвиг, частотный сдвиг, фазовый сдвиг и т. п. Таким образом, параметрические данные включают в себя лишь сравнительно грубое представление сигнала или ассоциативно связанного канала.

Технология бинаурального кодирования сигнала (BCC) описана в множестве публикаций, например, в «Binaural Cue Coding applied to Stereo and Multi-Channel Audio Compression» («Бинауральное кодирование сигналов применительно к сжатию стереофонического и многоканального звука») К. Фаллер, Ф. Баумгарте, доклад 5574 на съезде AES, май 2002 года, Мюнхен, в 2 публикациях ICASSP «Estimation of auditory spatial cues for binaural cue coding» («Оценка слуховых пространственных сигналов для бинаурального кодирования сигналов»), и «Binaural cue coding: a normal and efficient representation of spatial audio» («Бинауральное кодирование сигналов: нормальное и рациональное представление пространственного звука»), оба созданные К.Фаллером и Ф.Баумгарте, Орландо, Флорида, май 2002 г.

При BCC-кодировании множество входных звуковых каналов преобразуется в спектральное представление с использованием основанного на ДПФ (дискретном преобразовании Фурье) преобразования с окном перекрытия. Результирующий однородный спектр затем делится на не перекрывающиеся сегменты. Каждый сегмент обладает шириной полосы пропускания, пропорциональной эквивалентной прямоугольной полосе пропускания (ERB). Затем пространственные параметры, называемые ICLD (межканальной разницей уровней) и ICTD (межканальной временной разницей), оцениваются для каждого сегмента. Параметр ICLD описывает разницу уровней между двумя каналами, а параметр ICTD описывает временную разницу (фазовый сдвиг) между двумя сигналами разных каналов. Разницы уровней и временные разницы обычно задаются для каждого канала относительно опорного канала. После извлечения этих параметров, параметры квантуются и в заключение кодируются для передачи.

Хотя параметры ICLD и ICTD представляют наиболее важные параметры местоположения источника звука, пространственное представление, использующее эти параметры, может быть усовершенствовано посредством ввода дополнительных параметров.

Родственная технология, называемая «параметрической стереофонией», описывает параметрическое кодирование двухканального стереофонического сигнала на основании передаваемого монофонического сигнала, а также дополнительной информации параметров. В этом контексте, введены 3 типа пространственных параметров, упомянутых как межканальная разница интенсивности (IID), межканальные разницы фаз (IPD) и межканальная когерентность (ICC). Расширение набора пространственных параметров параметром когерентности (параметром корреляции) дает возможность параметризации воспринимаемой пространственной «диффузности» или пространственной «компактности» звукового каскада. Параметрическая стереофония описана более подробно в: «Parametric Coding of stereo audio» («Параметрическое кодирование стереофонического звука»), Дж. Бребарт, С. Вандепар, А. Кохлрауш, Е. Схейерс ((2005) Eurasip, J. Прикладная обработка сигналов 9, стр. 1305-1322), в «High-Quality Parametric Spatial Audio Coding at Low Bitrates» («Высококачественное параметрическое кодирование звука на низких битовых скоростях»), Дж. Бребарт, С. Вандерпар, А. Кохлрауш, Е. Схейерс, 116-ый съезд AES, препринт 6072, Берлин, май 2004 г., и в «Low Complexity Parametric Stereo Coding» («Параметрическое стереофоническое кодирование низкой сложности»), Е. Схейерс, Дж. Бребарт, Х. Пурнхаген, Дж. Енгдегард, 116-ый съезд AES, прерпринт 6073, Берлин, май 2004 г.

Настоящее изобретение относится к параметрическому кодированию пространственных свойств звукового сигнала. Параметрические многоканальные звуковые декодеры реконструируют N каналов на основании M передаваемых каналов, где N>M, и дополнительных управляющих данных. Дополнительные управляющие данные демонстрируют значительно более низкую скорость передачи данных, чем передача всех N каналов, делая кодирование очень эффективным, наряду с одновременным обеспечением совместимости с по меньшей мере обоими М-канальными устройствами и N-канальными устройствами. Типичными параметрами, используемыми для описания пространственных свойств, являются межканальные разности интенсивности (IID), межканальные временные разности (ITD) и межканальные когерентности (ICC). Для того чтобы реконструировать пространственные параметры на основании этих параметров, требуется способ, который может реконструировать нормальный уровень корреляции между двумя или более каналами согласно параметрам IC. Это достигается посредством способа декорреляции, то есть способа для извлечения декоррелированных сигналов из передаваемых сигналов, чтобы объединять декоррелированные сигналы с передаваемыми сигналами в пределах некоторой последовательности операций повышающего микширования. Способы для повышающего микширования на основании передаваемого сигнала, декоррелированного сигнала и параметров IID/ICC описаны в библиографическом списке, предоставленном выше.

Существует пара способов, имеющихся в распоряжении для создания декоррелированных сигналов. Предпочтительно декоррелированные сигналы имеют подобные или идентичные временные и спектральные огибающие в качестве исходных входных сигналов. В идеале, требуется инвариантная во времени линейная (LTI) функция со сверхширокополосной частотной характеристикой. Один из очевидных способов для достижения таковой состоит в использовании постоянной задержки. Однако использование задержки или любой другой сверхширокополосной LTI-функции будет иметь следствием неширокополосную характеристику после добавления необработанного сигнала. В случае задержки, результатом будет типичный гребенчатый фильтр. Гребенчатый фильтр часто дает нежелательный «металлический» звук, который, даже если может быть эффективным действие стереофонического расширения, сильно уменьшает естественность оригинала. Способ постоянной задержки и другие способы предшествующего уровня техники страдают от неспособности создавать более чем один декоррелированный сигнал наряду с сохранением взаимной декорреляции.

Качество восприятия реконструированного многоканального звукового сигнала, поэтому, строго зависит от действующей концепции, которая предусматривает формирование декоррелированного сигнала из передаваемого сигнала, при котором в идеале декоррелированный сигнал ортогонален сигналу, из которого извлечен, то есть является полностью декоррелированным. Даже если в распоряжении есть полностью декоррелированный сигнал, результат многоканального повышающего микширования, в котором отдельные каналы являются взаимно декоррелированными, не может быть получен с использованием одного декоррелированного сигнала. Во время повышающего микширования реконструированный звуковой канал формируется посредством комбинирования переданного сигнала со сформированным декоррелированным сигналом, тогда как степень, до которой декоррелированный сигнал примешивается к переданному сигналу, типично регулируется передаваемым пространственным звуковым параметром (ICC). Взаимно идеально декоррелированные сигналы, поэтому, не могут быть достигнуты, так как каждый декоррелированный звуковой канал содержит долю одного и того же декоррелированного сигнала.

Задача настоящего изобретения состоит в том, чтобы предоставить более эффективный принцип для создания высоко декоррелированных сигналов.

Эта задача решается устройством согласно п. 1 формулы изобретения или способом согласно п. 15 формулы изобретения.

Настоящее изобретение основано на открытии, что многоканальный сигнал, содержащий по меньшей мере три канала, может быть реконструирован из условия, чтобы реконструированные каналы по меньшей мере частично были декоррелированы друг от друга с использованием подвергнутого понижающему микшированию сигнала, полученного из исходного многоканального сигнала, и набора декоррелированных сигналов, предоставленных декоррелятором, который извлекает набор декоррелированных сигналов из подвергнутого понижающему микшированию сигнала, при этом декоррелированные сигналы в пределах набора декоррелированных сигналов являются приближенно ортогональными друг другу, то есть отношение ортогональности между парами каналов удовлетворено в пределах диапазона допустимых значений ортогональности.

Диапазон допустимых значений ортогональности, например, может быть получен из коэффициента взаимной корреляции, который количественно определяет степень корреляции между двумя сигналами. Коэффициент взаимной корреляции 1 означает полную корреляцию, то есть два идентичных сигнала. С другой стороны, коэффициент взаимной корреляции 0 означает полную антикорреляцию или ортогональность сигналов. Диапазон допустимых значений ортогональности, поэтому, может быть определен в качестве интервала значений коэффициента корреляции, находящегося в диапазоне от 0 до определенного верхнего предела.

Следовательно, настоящее изобретение предоставляет решение задачи эффективного формирования одного или более ортогональных сигналов наряду с сохранением импульсных свойств и воспринимаемого качества звучания.

В одном из вариантов осуществления настоящего изобретения решетчатый БИХ-фильтр (IIR, с бесконечной импульсной характеристикой) реализован в качестве декоррелятора, обладающего коэффициентами фильтра, полученными из псевдошумовой последовательности, а фильтрация выполняется в пределах набора комплекснозначных или вещественнозначных фильтров.

В одном из вариантов осуществления настоящего изобретения способ для реконструирования многоканального сигнала включает в себя способ для создания нескольких ортогональных или близких к ортогональным сигналов посредством использования группы решетчатых БИХ-фильтров.

В дополнительном варианте осуществления настоящего изобретения способ для создания нескольких ортогональных сигналов является содержащим способ для выбора коэффициентов фильтра для достижения ортогональности или приближения ортогональности мотивированным ощущениями образом.

В дополнительном варианте осуществления настоящего изобретения группа решетчатых БИХ-фильтров используется в пределах набора комплекснозначных фильтров во время реконструирования многоканального сигнала.

В дополнительном варианте осуществления настоящего изобретения реализован способ для создания одного или более ортогональных или близких к ортогональным сигналов с использованием одного или более сверхширокополосных БИХ-фильтров на основании решетчатой структуры в пределах пространственного декодера.

В дополнительном варианте осуществления настоящего изобретения вариант осуществления, описанный выше, реализован из условия, чтобы коэффициенты фильтра, используемые для БИХ-фильтрации, были основаны на случайных псевдошумовых последовательностях.

В дополнительном варианте осуществления настоящего изобретения к используемым фильтрам добавлены дополнительные временные задержки.

В дополнительном варианте осуществления настоящего изобретения фильтрация обрабатывается в области набора фильтров.

В дополнительном варианте осуществления настоящего изобретения фильтрация обрабатывается в наборе комплекснозначных фильтров.

В дополнительном варианте осуществления настоящего изобретения ортогональные сигналы, создаваемые посредством фильтрации, смешиваются, чтобы сформировать набор выходных сигналов.

В дополнительном варианте осуществления смешивание ортогональных сигналов является зависящим от передаваемых управляющих данных, дополнительно применяемых к обладающему признаками изобретения декодеру.

В дополнительном варианте осуществления настоящего изобретения обладающий признаками изобретения декодер или обладающий признаками изобретения способ декодирования использует управляющие данные, которые содержат по меньшей мере параметр, указывающий требуемую взаимную корреляцию по меньшей мере двух формируемых выходных сигналов.

В дополнительном варианте осуществления настоящего изобретения 5.1-канальный сигнал объемного звучания подвергается повышающему микшированию из переданного монофонического сигнала посредством извлечения декоррелированных сигналов с использованием идеи изобретения. Монофонический подвергнутый понижающему микшированию сигнал и четыре декоррелированных сигнала затем смешиваются вместе согласно некоторым правилам смешивания, чтобы сформировать выходной 5.1-канальный сигнал. Следовательно, предоставлена возможность формировать выходные сигналы, которые взаимно декоррелированы, так как сигналы, используемые для повышающего микширования, то есть переданный монофонический сигнал и четыре сформированных декоррелированных сигнала, декоррелируются, главным образом, согласно обладающему признаками изобретения формированию.

В дополнительном варианте осуществления настоящего изобретения два индивидуальных канала передаются в виде результата понижающего микширования 5.1-канального сигнала. В одной из реализаций два дополнительных взаимно декоррелированных сигнала извлекаются с использованием идеи изобретения, чтобы предоставить четыре канала в качестве базиса для результата повышающего микширования, который всегда является полностью декоррелированным. В модификации варианта осуществления, описанного выше, три декоррелированных сигнала извлекаются и смешиваются с двумя другими декоррелированными сигналами, чтобы предоставить дополнительный декоррелированный сигнал, имеющийся в распоряжении для последующего повышающего микширования. С использованием этого признака качество восприятия может быть дополнительно улучшено для отдельных каналов, например, центрального канала сигнала объемного звучания 5.1.

В дополнительном варианте осуществления настоящего изобретения пять звуковых каналов подвергаются повышающему микшированию из монофонического передаваемого канала перед извлечением с использованием идеи изобретения четырех декоррелированных сигналов, которые впоследствии комбинируются с четырьмя из пяти вышеупомянутых подвергнутых повышающему микшированию каналов, принимая во внимание критерий пяти выходных звуковых каналов, которые, в основном, взаимно декоррелированы.

В дополнительном варианте осуществления настоящего изобретения звуковые сигналы задерживаются перед или после применения обладающей признаками изобретения основанной на БИХ-фильтре фильтрации. Задержка дополнительно улучшает декорреляцию сформированных сигналов и уменьшает расцвечивание при смешивании сформированных декоррелированных сигналов с подвергнутым понижающему микшированию сигналом.

В дополнительном варианте осуществления настоящего изобретения формирование декоррелированных сигналов выполняется в области поддиапазона (комплексно модулированного) набора фильтров, при этом коэффициенты фильтра, используемые декоррелятором, получены с использованием отдельного индекса набора фильтров из набора фильтров, для которого выводятся декоррелированные сигналы.

В дополнительном варианте осуществления настоящего изобретения декоррелированные сигналы получены с использованием решетчатых БИХ-фильтров, которые выполняют гребенчатую сверхширокополосную БИХ-фильтрацию звукового сигнала. Использование решетчатого БИХ-фильтра обладает большими преимуществами. Экспоненциальное затухание характеристики такого фильтра, который предпочтителен для создания надлежащих декоррелированных сигналов, является неотъемлемым свойством такого фильтра. Более того, требуемое длительное затухание импульсной характеристики фильтра, используемого для формирования декоррелированных сигналов, может быть достигнуто чрезвычайно рациональным по объему памяти и вычислений образом (низкой сложности) посредством использования структуры решетчатого фильтра.

В модификации ранее описанного варианта осуществления настоящего изобретения используемые коэффициенты фильтра (коэффициенты отражения) задаются посредством предоставления коэффициентов фильтра, полученных из псевдошумовых последовательностей. В модификации коэффициенты отражения рассчитываются отдельно на основании индекса подполосы у подполосы, в которой используется решетчатый фильтр для получения декоррелированных сигналов.

В одном из вариантов осуществления настоящего изобретения отфильтрованные сигналы и не модифицированный входной сигнал комбинируются посредством матрицы D смешивания, чтобы сформировать набор выходных сигналов. Матрица D смешивания определяет взаимные корреляции выходных сигналов, а также энергию каждого выходного сигнала. Элементы (веса) матрицы D смешивания предпочтительно являются переменными во времени и зависящими от передаваемых управляющих данных. Параметры управления предпочтительно содержат (требуемые) разности уровней между определенными выходными сигналами и/или параметры удельной взаимной корреляции.

В дополнительном варианте осуществления настоящего изобретения обладающий признаками изобретения звуковой декодер содержится в пределах звукового приемника или устройства воспроизведения для улучшения качества восприятия реконструированного сигнала.

Предпочтительные варианты осуществления настоящего изобретения впоследствии описаны по следующим чертежам, на которых:

фиг. 1 показывает структурную схему идеи изобретения звукового декодирования;

фиг. 2 показывает декодер предшествующего уровня техники, не реализующий идею изобретения;

фиг. 3 показывает 5.1-многоканальный звуковой декодер согласно настоящему изобретению;

фиг. 4 показывает дополнительный 5.1-многоканальный звуковой декодер согласно настоящему изобретению;

фиг. 5 показывает дополнительный обладающий признаками изобретения звуковой декодер;

фиг. 6 показывает дополнительный вариант осуществления обладающего признаками изобретения многоканального звукового декодера;

фиг. 7 схематично показывает формирование декоррелированного сигнала;

фиг. 8 показывает решетчатый БИХ-фильтр, используемый для формирования декоррелированного сигнала;

фиг. 9 показывает приемник или звуковой проигрыватель, содержащий обладающий признаками изобретения звуковой декодер; и

фиг. 10 показывает передачу, имеющую в распоряжении приемник или устройство воспроизведения, содержащие обладающий признаками изобретения звуковой декодер.

Варианты осуществления, описанные ниже, являются только иллюстративными в отношении принципов настоящего изобретения касательно передовых способов для создания ортогональных сигналов. Понятно, что модификации и варианты компоновок и детализаций, описанных в материалах настоящей заявки, будут очевидны специалистам в данной области техники. Поэтому, намерение состоит в том, чтобы ограничиваться только рамками предстоящей формулы изобретения, а не отдельными деталями, представленными в качестве описания и разъяснения вариантов осуществления в материалах настоящей заявки.

Фиг. 1 иллюстрирует обладающее признаками изобретения устройство для декорреляции сигналов, которое используется в параметрической стереофонической или многоканальной системе. Обладающее признаками изобретения устройство включает в себя средство 101 для предоставления множества ортогональных декоррелированных сигналов, полученных из входного сигнала 102. Средство предоставления может быть массивом фильтров декорреляции, основанных на решетчатых БИХ-структурах. Входной сигнал 102 (x) может быть сигналом временной области или одиночным сигналом полосной области, как, например, полученный из набора комплексных QMF (квадратурных зеркальных фильтров). Сигналы, выведенные средством 101, y1-yN, являются результирующими декоррелированными сигналами, все из которых являются взаимно ортогональными или близкими к ортогональным.

Так как для восстановления пространственных свойств параметрической стереофонической или параметрической многоканальной системы жизненно необходимо снижать когерентность между двумя или более каналами, для того чтобы восстановить воспринимаемую широту пространственного образа, результирующий декоррелированный сигнал может использоваться для создания конечного результата повышающего микширования многоканального сигнала. Это может производиться добавлением отфильтрованных вариантов (h1(x)) исходного сигнала (x) в выходные каналы. Следовательно, снижение когерентности между N сигналами с использованием N разных фильтров может быть произведено согласно:

y1 = a·x + b·h1(x)

y2 = a·x + b·h2(x)

yn = a·x + b·hn(x)

где х - исходный сигнал, с y1 по yn - результирующие выходные сигналы, a и b - коэффициенты усиления, управляющие величиной когерентности, и с h1 по hn - разные фильтры декорреляции. В более общем смысле можно записать выходные сигналы yi (i=1...I) в виде линейной комбинации входного сигнала х и входного сигнала х, отфильтрованного фильтрами hj (j=l...N):

Здесь матрица D смешивания определяет взаимные корреляции и выходные уровни выходных сигналов yi.

Для того чтобы предотвратить изменения в тембре, рассматриваемый фильтр предпочтительно должен обладать сверхширокополосной характеристикой. Один из успешных подходов состоит в том, чтобы использовать сверхширокополосные фильтры, подобные используемым для последовательностей операций искусственной реверберации. Алгоритмы искусственной реверберации обычно требуют высокого временного разрешения для обеспечения импульсной характеристики, которая является достаточно распространенной во времени. Один из способов проектирования таких всечастотных фильтров состоит в том, чтобы использовать случайную псевдошумовую последовательность в качестве импульсной характеристики. Фильтр затем легко может быть реализован в виде КИХ-фильтра (с конечной импульсной характеристикой, FIR). Для того чтобы достичь достаточной степени независимости между отфильтрованными выходными сигналами, импульсная характеристика КИХ-фильтра должна быть относительно длинной, следовательно, требующей значительного количества вычислительных усилий для выполнения свертки. Сверхширокополосный БИХ-фильтр предпочтителен для такой цели. БИХ-структура имеет несколько преимуществ, когда она касается разработки фильтров декорреляции:

а) Естественное экспоненциальное затухание, которое является обычным для всей естественной реверберации, является желательным для фильтра декорреляции. Это является неотъемлемым свойством БИХ-фильтров.

b) Касательно длительно затухающих импульсных характеристик БИХ-фильтра, соответствующий КИХ-фильтр обычно является более дорогостоящим в показателях сложности и требует большей памяти.

Однако проектирование сверхширокополосных БИХ-фильтров является менее тривиальным, чем случай КИХ, где любая случайная псевдошумовая последовательность становится вектором коэффициентов. Проектным ограничением при разработке многочисленных фильтров декорреляции также является требуемая возможность сохранять одинаковые свойства затухания для всех фильтров наряду с предоставлением ортогональных выходных сигналов (то есть импульсных характеристик фильтров, которые, по существу, обладают удовлетворительной низкой взаимной корреляцией) по каждому выходному сигналу фильтра. К тому же, в качестве основного требования должна быть достигнута устойчивость.

Настоящее изобретение показывает новый способ для создания многочисленных ортогональных сверхширокополосных фильтров посредством структуры решетчатых БИХ-фильтров. Этот подход имеет несколько преимуществ:

а) Более низкая сложность, чем у КИХ-фильтров (при условии требуемой длины импульсных характеристик).

b) Ограничения по стабильности могут быть легко удовлетворены, так как это достигается автоматически, когда абсолютные значения амплитуд всех коэффициентов отражения являются меньшими, чем единица.

c) Многочисленные ортогональные сверхширокополосные фильтры могут легче проектироваться при одних и тех же свойствах затухания на основании случайных псевдошумовых последовательностей.

d) Высокая устойчивость к ошибкам квантования вследствие эффектов конечной длины слов.

Хотя коэффициенты отражения решетчатого БИХ-фильтра могут быть основаны на случайных псевдошумовых последовательностях, для оптимальных рабочих характеристик эти коэффициенты также должны быть отсортированы более изощренным образом или обработаны неслучайными способами, для того чтобы добиться достаточной ортогональности и других важных свойств. Простой способ состоит в том, чтобы формировать множество векторов случайных коэффициентов отражения, сопровождаемых выбором отдельного набора на основании определенных критериев, таких как общая огибающая затухания, минимизация всех взаимных корреляций импульсных характеристик выбранного набора и тому подобное.

Более конкретно, можно было бы начать с большого набора случайных псевдошумовых последовательностей. Каждая из этих последовательностей используется в качестве коэффициентов отражения в сверхширокополосной секции. Впоследствии, импульсная характеристика результирующей сверширокополосной секции вычисляется для каждой случайной псевдошумовой последовательности. В заключение, выбираются те псевдошумовые последовательности, которые дают взаимно декоррелированные импульсные характеристики.

Огромные преимущества заключены в базировании алгоритма декорреляции на наборе (комплексных) фильтров, таком как набор комплекснозначных QMF. Этот набор фильтров обеспечивает гибкость для предоставления свойствам декоррелятора возможности быть избирательными по частоте в показателях, например, компенсации, времени затухания, импульсной плотности и тембра. Отметим, что многие из этих свойств могут быть изменены, наряду с сохранением сверхширокополосной характеристики. Есть много сведений, имеющих отношение к слуховому восприятию, которое направляет проектирование такого решетчатого БИХ-фильтра. Важным аспектом является длина и форма огибающей затухания импульсной характеристики. Также важна потребность в дополнительной предварительной задержке, по выбору, частотно-зависимой, так как это в значительной степени влияет на то, какой вид характеристики гребенчатого фильтра будет получен при смешивании декоррелированного сигнала с исходным. Для достаточной импульсной плотности основанные на шуме коэффициенты отражения в решетчатом фильтре предпочтительно должны быть разными для разных каналов набора фильтров. Для еще лучшей импульсной плотности могут использоваться приближения дробной задержки в пределах набора фильтров.

Фиг. 2 показывает иерархическую структуру декодирования для получения многоканального сигнала для монофонического сигнала понижающего микширования, переданного посредством являющихся результатом параметрических стереофонических блоков, с использованием одиночного декоррелированного сигнала. Посредством краткого рассмотрения подхода предшествующего уровня техники, снова будет затронута задача, решаемая настоящим изобретением. Декодер 110 канала 1-в-3, показанный на фиг. 2, содержит декоррелятор 112, первый параметрический стереофонический повышающий микшер 114 и второй параметрический стереофонический повышающий микшер 116.

Монофонический входной сигнал 118 вводится в декоррелятор 112, чтобы получить декоррелированный сигнал 120. Получается только один декоррелированный сигнал. Первый параметрический стереофонический повышающий микшер принимает в качестве входного сигнала монофонический сигнал 118 понижающего микширования и декоррелированный сигнал 120. Первый повышающий микшер 114 получает центральный канал 122 и комбинированный канал 124 посредством смешивания монофонического сигнала 118 понижающего микширования и декоррелированного сигнала 120 с использованием параметра 126 декорреляции, который управляет смешиванием каналов.

Комбинированный канал 124, затем, вводится во второй параметрический стереофонический повышающий микшер 116, компонующий второй иерархический уровень звукового декодера. Второй параметрический стереофонический повышающий микшер 116 дополнительно принимает декоррелированный сигнал 129 в качестве входного сигнала и получает левый канал 128 и правый канал 130 посредством смешивания комбинированного канала 124 и декоррелированного сигнала 120.

Принципиально возможно формировать центральный канал 122, который является идеально декоррелированным от комбинированного канала 124, когда декоррелятор 112 способен получать декоррелированный сигнал, который полностью ортогонален монофоническому сигналу 118 понижающего микширования. Почти полная декорреляция может быть достигнута, если управляющая информация 126 указывает повышающее микширование, в котором каждый подвергшийся повышающему микшированию канал является преимущественно содержащим составляющую сигнала, происходящую либо из декоррелированного сигнала 120, либо из монофонического сигнала 118 понижающего микширования. Однако так как один и тот же декоррелированный сигнал 120 затем используется, чтобы получать левый канал 128 и правый канал 130, очевидно, что это будет иметь результатом остаточную корреляцию между центральным каналом 122 и одним из каналов 128 или 130.

Это становится даже более очевидным при рассмотрении крайнего случая, в котором полностью декоррелированные левый канал 128 и правый канал 130 должны быть получены из декоррелированного сигнала 120, который предполагается идеально ортогональным монофоническому сигналу понижающего микширования. Идеальная декорреляция между левым каналом 128 и правым каналом 130 может быть достигнута, когда комбинированный канал 124 удерживает информацию только по монофоническому сигналу 118 понижающего микширования, каковое одновременно означает, что центральный канал 122 содержит в основном декоррелированный сигнал 112. Поэтому декоррелированные левый канал 128 и правый канал 130 могли бы означать, что один из каналов действительно содержит в основном информацию по декоррелированному сигналу 120, а другой канал мог бы содержать в основном комбинированный сигнал 124, который в таком случае является идентичным монофоническому сигналу 118 понижающего микширования. Поэтому единственный путь, которым полностью декоррелируются левый и правый каналы, оказывает воздействие на почти идеальную декорреляцию между центральным каналом 122 и одним из каналов 128 или 130.

Это наиболее нежелательное свойство может быть успешно устранено посредством применения идеи изобретения по формированию разных и взаимно ортогональных декоррелированных сигналов.

Фиг. 3 показывает вариант осуществления обладающего признаками изобретения многоканального звукового декодера 400, содержащего матрицу 401 предварительного декоррелятора, декоррелятор 401 и матрицу 403 смешивания. Обладающий признаками изобретения декодер 400 показывает конфигурацию 1-в-5, где пять звуковых каналов и канал низкочастотного расширения получаются из монофонического сигнала 405 понижающего микширования и дополнительных данных пространственного управления, таких как параметры ICC или ICLD. Они не показаны на принципиальной упрощенной схеме на фиг. 3. Монофонический сигнал 405 понижающего микширования вводится в матрицу 401 предварительного декоррелятора, которая получает четыре промежуточных сигнала 406, каковые служат в качестве входного сигнала для декоррелятора 402, который содержит четыре обладающих признаками изобретения декоррелятора h1-h4. Таковые подают четыре взаимно ортогонально декоррелированных сигнала 408 на выход декоррелятора 402.

Матрица 403 смешивания принимает в качестве входного сигнала четыре взаимно ортогональных декоррелированных сигнала 408 и, в дополнение, сигнал 410 понижающего микширования, полученный из монофонического сигнала 405 понижающего микширования посредством матрицы 401 предварительного декоррелятора.

Матрица 403 смешивания комбинирует монофонический сигнал 410 и четыре декоррелированных сигнала 408, чтобы получить выходной 5.1-сигнал 412, содержащий левый передний канал 414а, левый канал 414b объемного звучания, правый передний канал 414с, правый канал 414d объемного звучания, центральный канал 414e и канал 414f низкочастотного расширения.

Важно отметить, что формирование четырех взаимно ортогональных декоррелированных каналов 408 дает возможность получать пять каналов 5.1-канального сигнала, которые являются по меньшей мере частично декоррелированными. В предпочтительном варианте осуществления настоящего изобретения таковыми являются каналы с 414а по 414е. Канал 414f низкочастотного расширения содержит низкочастотные части многоканального сигнала, которые комбинируются в одном единственном низкочастотном канале для всех каналов с 414а по 414е объемного звучания.

Фиг. 4 показывает обладающий признаками изобретения декодер 2-в-5 для получения 5.1-канального сигнала объемного звучания из двух переданных сигналов.

Многоканальный звуковой декодер 500 содержит матрицу 501 предварительного декоррелятора, декоррелятор 502 и матрицу 503 смешивания. В схеме 2-в-5, два переданных канала, 505а и 505b, вводятся в матрицу предварительного декоррелятора, которая получает промежуточный левый канал 506а, промежуточный правый канал 506b и промежуточный центральный канал 506с, а также два промежуточных канала 506d из представленных каналов 505а и 505b, к тому же, необязательно, с использованием дополнительных управляющих данных, таких как параметры ICC и ICLD.

Промежуточные каналы 506d используются в качестве входного сигнала для декоррелятора 502, который получает два взаимно ортогональных или почти ортогональных декоррелированных сигнала, которые вводятся в матрицу 503 смешивания вместе с промежуточным левым каналом 506а, промежуточным правым каналом 506b и промежуточным центральным каналом 506с.

Матрица 503 смешивания получает окончательный 5.1-канальный звуковой сигнал 508 из ранее упомянутых сигналов, где полученные в заключение звуковые каналы имеют те же полезные свойства, как уже описанные для каналов, полученных посредством многоканального звукового декодера 400 1-в-5.

Фиг. 5 показывает дополнительный вариант осуществления настоящего изобретения, который сочетает признаки многоканальных звуковых декодеров 400 и 500. Многоканальный звуковой декодер 600 содержит матрицу 601 предварительной декорреляции, декоррелятор 602 и матрицу 603 смешивания. Многоканальный звуковой декодер 600 является гибким устройством, предоставляющим возможность работать в разных режимах, в зависимости от конфигурации входных сигналов 605, вводимых в предварительный декоррелятор 601. Вообще предварительный декоррелятор получает промежуточные сигналы 607, которые служат в качестве входного сигнала для декоррелятора 602 и которые частично передаются и изменяются, чтобы скомпоновать входные параметры 608. Входные параметры 608 являются параметрами, вводимыми в матрицу 603 смешивания, которая получает конфигурации 610а или 610b выходного канала, в зависимости от конфигурации входного канала.

В конфигурации 1-в-5 сигнал понижающего микширования и необязательный разностный сигнал подаются в матрицу предварительного декоррелятора, которая получает четыре промежуточных сигнала (с e1 по e4), которые используются в качестве входного сигнала декоррелятора, который получает четыре декоррелированных сигнала (с d1 по d4), которые формируют входные параметры 608 вместе с непосредственно переданным сигналом m, полученным из входного сигнала.

Может быть отмечено, что в случае, когда дополнительный разностный сигнал подается в качестве входного сигнала, декоррелятор 602, который обычно является действующим в полосной области, может функционировать для пересылки разностного сигнала вместо получения декоррелированного сигнала. Это также может производиться выборочным образом только для определенных полос частот.

В конфигурации 2-в-5 входные сигналы 605 содержат левый канал, правый канал и, необязательно, разностный сигнал. В этой конфигурации матрица предварительного декоррелятора получает левый, правый и центральный каналы и в дополнение два промежуточных канала (e1, e2). Следовательно, входные параметры в матрицу 603 смешивания сформированы левым каналом, правым каналом, центральным каналом и двумя декоррелированными сигналами (d1 и d2). В дополнительной модификации матрица предварительного декоррелятора может получать дополнительный промежуточный сигнал (e5), который используется в качестве входного сигнала для декоррелятора (D5), чьи выходные данные являются комбинацией декоррелированного сигнала (d5), полученного из сигнала (e5), и декоррелированных сигналов (d1 и d2). В этом случае между центральным каналом и левым и правым каналами может быть обеспечена дополнительная декорреляция.

Фиг. 6 показывает дополнительный вариант осуществления настоящего изобретения, в котором декоррелированные сигналы комбинируются с отдельными звуковыми каналами после последовательности операций повышающего микширования. В этом альтернативном варианте осуществления монофонический звуковой канал 620 подвергается повышающему микшированию посредством повышающего микшера 624, где повышающее микширование может управляться дополнительными управляющими данными 622. Каналы 630 повышающего микширования содержат пять звуковых каналов, которые коррелированны друг с другом и обычно указываются ссылкой как каналы с плоским звуком. Конечные каналы 632 могут быть получены комбинированием четырех из каналов 630 с плоским звуком с декоррелированными взаимно ортогональными сигналами. Как результат, возможно предоставить пять каналов, которые являются, по меньшей мере, частично декоррелированными друг от друга. Касательно фиг. 3, это может быть рассмотрено в качестве особого случая матрицы смешивания.

Фиг. 7 показывает структурную схему обладающего признаками изобретения декоррелятора 700 для предоставления декоррелированного сигнала. Декоррелятор 700 содержит узел 702 предварительной задержки и узел 704 декорреляции.

Входной сигнал 706 вводится в узел 702 предварительной задержки для задерживания сигнала 706 на предопределенное время. Выход из узла 702 предварительной задержки присоединен к узлу 704 декорреляции, чтобы получать декоррелированный сигнал 708 в качестве выходного сигнала декоррелятора 700.

В предпочтительном варианте осуществления настоящего изобретения узел 704 декорреляции содержит решетчатый сверхширокополосный БИХ-фильтр. В необязательном варианте декоррелятора 700 коэффициенты фильтра (коэффициенты отражения) вводятся в блок 704 декорреляции посредством поставщика коэффициентов 710 фильтра. Когда обладающий признаками изобретения декоррелятор 700 управляется в пределах поддиапазона фильтрации (например, в пределах набора QMF-фильтров), полосный индекс в текущий момент обрабатываемого полосного сигнала может дополнительно вводиться в узел 704 декорреляции. В этом случае, в дополнительной модификации настоящего изобретения, разные коэффициенты фильтра узла 704 декорреляции могут применяться или рассчитываться на основании предоставленного полосного индекса.

Фиг. 8 показывает решетчатый БИХ-фильтр в качестве предпочтительно используемого для формирования декоррелированных сигналов.

БИХ-фильтр 800, показанный на фиг. 8, принимает в качестве входного сигнала звуковой сигнал 802 и получает в качестве выходного сигнала 804 декоррелированный вариант входного сигнала. Большое преимущество при использовании решетчатого БИХ-фильтра состоит в том, что экспоненциально затухающая импульсная характеристика, требуемая для получения надлежащего декоррелированного сигнала, не приносит никаких дополнительных затрат, так как это является неотъемлемым свойством решетчатого БИХ-фильтра. Должно быть отмечено, что необходимо иметь в распоряжении коэффициенты с k(0) по k(M-1) фильтра, абсолютные значения которых являются меньшими, чем единица, чтобы добиться требуемой устойчивости фильтра. Дополнительно, многочисленные ортогональные сверхширокополосные фильтры могут легче проектироваться на основании решетчатых БИХ-фильтров, что является главным преимуществом идеи изобретения о получении многочисленных декоррелированных сигналов из одиночного входного сигнала, при этом разные полученные декоррелированные сигналы должны быть почти идеально декоррелироваными или ортогональными один к другому.

Большие подробности о конструкции и свойствах решетчатых сверхширокополосных фильтров могут быть найдены в «Adaptive Filter Theory» («Теория адаптивных фильтров»), Simon Haykin, ISBN 0-13-090126-1, Prentice-Hall, 2002.

Фиг. 9 показывает обладающий признаками изобретения приемник или звуковой проигрыватель 900, содержащий обладающий признаками изобретения звуковой декодер 902, вход 904 битового потока и звуковой выход 906.

Битовый поток может быть входным сигналом на входе 904 обладающего признаками изобретения приемника/звукового проигрывателя 900. Битовый поток затем декодируется декодером 902, и декодированный сигнал выводится или воспроизводится на выходе 906 обладающего признаками изобретения приемника/звукового проигрывателя 900.

Фиг. 10 показывает систему передачи, содержащую передатчик 908 и обладающий признаками изобретения приемник 900.

Звуковой сигнал, вводимый с входного интерфейса 910 передатчика 908, кодируется и передается с выхода передатчика 908 на вход 904 приемника 900. Приемник декодирует звуковой сигнал и воспроизводит или выводит звуковой сигнал на своем выходе 906.

Настоящее изобретение относится к кодированию многоканальных представлений звуковых сигналов с использованием пространственных параметров. Настоящее изобретение предлагает новые способы декоррелирования сигналов, для того чтобы снижать когерентность между выходными каналами. Не требует доказательств, что, хотя новая идея создания многочисленных декоррелированных сигналов является чрезвычайно полезной в обладающем признаками изобретения звуковом декодере, идея изобретения также может использоваться в любой другой области техники, которая требует рационального формирования таких сигналов.

Несмотря на то, что настоящее изобретение было подробно описано применительно к многоканальному звуковому декодеру, который выполняет повышающее микширование на единственном этапе повышающего микширования, настоящее изобретение, несомненно, также может быть включено в звуковые декодеры, которые основаны на иерархической структуре декодирования, такой как, например, показанная на фиг. 2.

Несмотря на то, что ранее описанные варианты осуществления описывают главным образом получение декоррелированных сигналов из одиночного сигнала понижающего микширования, не требует доказательств, что более чем один звуковой канал также может использоваться в качестве входного сигнала для декорреляторов или матрицы предварительной декорреляции, то есть сигнал понижающего микширования может содержать более чем один подвергнутый понижающему микшированию звуковой канал.

Кроме того, количество декоррелированных сигналов, полученных из одиночного входного сигнала, в сущности является неограниченным, так как порядок фильтра решетчатых фильтров может изменяться без ограничения, и так как возможно находить новый набор коэффициентов фильтра, получающих декоррелированный сигнал, являющийся ортогональным или в основном ортогональным относительно других сигналов в наборе.

В зависимости от конкретных требований реализации обладающих признаками изобретения способов, обладающие признаками изобретения способы могут быть реализованы в аппаратных средствах или в программном обеспечении. Реализация может выполняться c использованием цифрового запоминающего носителя, в частности, диска, DVD (цифрового многофункционального диска) или CD (компакт-диска), содержащего электронным образом считываемые управляющие сигналы, сохраненные на нем, которые взаимодействуют с программируемой компьютерной системой, из условия, чтобы выполнялись обладающие признаками изобретения способы. Вообще настоящим изобретением, поэтому, является компьютерный программный продукт с управляющей программой, сохраненной на машиночитаемом носителе, управляющая программа функционирует для выполнения обладающих признаками изобретения способов, когда компьютерный программный продукт выполняется на компьютере. Другими словами, обладающие признаками изобретения способы, поэтому, являются компьютерной программой, содержащей управляющую программу для выполнения по меньшей мере одного из обладающих признаками изобретения способов, когда компьютерная программа выполняется на компьютере.

Несмотря на то, что вышеизложенное было показано и описано в частности со ссылкой на конкретные варианты осуществления настоящего изобретения, специалистам в данной области техники будет понятно, что различные изменения по форме и существу могут быть сделаны, не выходя за его рамки. Должно быть понятно, что различные изменения могут быть сделаны при приспосабливании к разным вариантам осуществления, не выходя из более широких концепций, раскрытых в материалах настоящей заявки и охваченных формулой изобретения, которая приведена ниже.

1. Многоканальный декодер (400; 500; 600) для формирования реконструкции многоканального сигнала (412; 508; 610а; 610b; 630) с использованием подвергнутого понижающему микшированию сигнала (405; 505a, b; 605; 620), полученного из исходного многоканального сигнала, причем реконструкция многоканального сигнала (412; 508; 610а; 610b; 630) содержит, по меньшей мере, три канала, содержащий:
декоррелятор (402; 502; 602; 700) для получения набора декоррелированных сигналов с использованием правила декорреляции, при этом правило декорреляции таково, что первый декоррелированный сигнал и второй декоррелированный сигнал получаются с использованием сигнала понижающего микширования (405; 505а, b; 605; 620), и что первый декоррелированный сигнал и второй декоррелированный сигнал ортогональны друг другу в пределах диапазона допустимых значений ортогональности; и
вычислитель (403; 503; 603) выходного канала для формирования выходных каналов с использованием сигнала (405; 505а, b; 605; 620) понижающего микширования, первого и второго декоррелированных сигналов и информации повышающего микширования, с тем чтобы, по меньшей мере, три канала по меньшей мере частично были декоррелированы друг от друга.

2. Многоканальный декодер (400; 500; 600) по п.1, в котором правило декорреляции таково, что диапазон допустимых значений ортогональности включает в себя значения ортогональности меньше 0,5, когда значение ортогональности 0 указывает полную ортогональность, а значение ортогональности 1 указывает полную корреляцию.

3. Многоканальный декодер (400; 500; 600) по п.1, в котором правило декодирования таково, что получение первого и второго декоррелированных сигналов содержит фильтрацию звукового канала (406; 506; 607), извлеченного из сигнала (405; 505а, b; 605; 620) понижающего микширования посредством БИХ-фильтра.

4. Многоканальный декодер (400; 500; 600) по п.3, в котором БИХ-фильтром является решетчатый фильтр (704; 800), основанный на решетчатой структуре, обладающей характеристикой сверхширокополосного фильтра.

5. Многоканальный декодер (400; 500; 600) по п.3, в котором БИХ-фильтр (800) содержит
первый сумматор в цепи прямого прогноза фильтра для сложения действующей порции звукового канала и предыдущей порции звукового канала, которая взвешивается первым весовым коэффициентом; и
второй сумматор в цепи обратного прогноза для сложения предыдущей порции звукового канала с действующей порцией, которая взвешивается вторым весовым коэффициентом звукового сигнала; и
при этом абсолютные значения первого и второго весовых коэффициентов равны.

6. Многоканальный декодер (400; 500; 600) по п.5, в котором БИХ-фильтр (704; 800) выполнен с возможностью использования первого и второго весовых коэффициентов, которые получены из случайных псевдошумовых последовательностей.

7. Многоканальный декодер (400; 500; 600) по п.1, в котором правило декорреляции таково, что первый декоррелированный сигнал и второй декоррелированный сигнал получены с использованием задержанного по времени варианта сигнала (405; 505а, b; 605; 620) понижающего микширования.

8. Многоканальный декодер (400; 500; 600) по п.1, в котором правило декодирования таково, что первый и второй декоррелированные сигналы получаются с использованием порции сигнала понижающего микширования, извлеченной из сигнала (405; 505а, b; 605; 620) понижающего микширования посредством набора вещественных или комплекснозначных фильтров.

9. Многоканальный декодер (400; 500; 600) по п.3, дополнительно содержащий устройство (401; 501; 601) разложения канала для извлечения звукового канала из сигнала (405; 505а, b; 605; 620) понижающего микширования с использованием правила извлечения.

10. Многоканальный декодер (400; 500; 600) по п.9, в котором правило извлечения таково, что четыре канала извлекаются из сигнала (405; 505а, b; 605; 620) понижающего микширования, при этом сигнал понижающего микширования содержит информацию об одном исходном канале.

11. Многоканальный декодер (400; 500; 600) по п.9, в котором правило извлечения таково, что два канала извлекаются из сигнала (405; 505а, b; 605; 620) понижающего микширования, при этом сигнал понижающего микширования содержит информацию по двум исходным каналам.

12. Многоканальный декодер (4; 500; 600) по п.1, в котором вычислитель выходного канала выполнен с возможностью формирования пяти выходных каналов из сигнала (405; 505а, b; 605; 620) понижающего микширования, содержащего информацию по одному звуковому каналу, и из четырех декоррелированных сигналов.

13. Многоканальный декодер (400; 500; 600) по п.1, в котором вычислитель выходного канала выполнен с возможностью формирования пяти выходных каналов из сигнала (405; 505а, b; 605; 620) понижающего микширования, содержащего информацию по двум звуковым каналам, и из двух декоррелированных сигналов.

14. Многоканальный декодер (400; 500; 600) по п.1, в котором вычислитель (403; 503; 603) выходных каналов выполнен с возможностью использования информации повышающего микширования, содержащей, по меньшей мере, один параметр, указывающий требуемую корреляцию первого и второго выходных каналов.

15. Способ формирования реконструкции многоканального сигнала с использованием сигнала понижающего микширования, извлеченного из исходного многоканального сигнала, причем реконструкция многоканального сигнала содержит, по меньшей мере, три канала, способ состоит в том, что:
получают набор декоррелированных сигналов с использованием правила декорреляции, при этом правило декорреляции таково, что первый декоррелированный сигнал и второй декоррелированный сигнал получаются с использованием сигнала понижающего микширования и что первый деколлированный сигнал и второй декореллированный сигнал являются ортогональными друг к другу в пределах диапазона допустимых значений ортогональности; и
формируют выходные каналы с использованием сигнала понижающего микширования, первого и второго сигналов декорреляции и информации повышающего микширования, с тем, чтобы, по меньшей мере,три канала, по меньшей мере, частично были декоррелированы друг от друга.

16. Машиночитаемый запоминающий носитель, содержащий сохраненную на нем компьютерную программу для выполнения, когда компьютерная программа выполняется на компьютере, реконструкции многоканального сигнала, содержащего, по меньшей мере, три канала, причем реконструированный многоканальный сигнал реконструируется с использованием сигнала понижающего микширования, извлеченного из исходного многоканального сигнала и первого декоррелированного сигнала, и второго декоррелированного сигнала, полученных с использованием сигнала понижающего микширования, при этом первый декоррелированный сигнал и второй декоррелированный сигнал ортогональны друг другу в пределах диапазона допустимых значений ортогональности.

17. Приемник, причем приемник содержит многоканальный декодер (400; 500; 600) по п.1.

18. Способ приема, причем способ содержит способ для формирования реконструкции многоканального сигнала по п.15.

19. Машиночитаемый запоминающий носитель, содержащий сохраненную на нем компьютерную программу для осуществления, при выполнении ее на компьютере, способа по любому из пп.15 или 18.

20. Звуковой проигрыватель, причем звуковой проигрыватель содержит многоканальный декодер (400; 500; 600) по п.1.

21. Способ звукового воспроизведения, причем способ содержит способ для формирования реконструкции многоканального сигнала по п.15.



 

Похожие патенты:

Изобретение относится к системе контроля уровня звука и может быть использовано, например, в системе домашнего кинротеатра в случае использования тонкой центральной акустической колонки, низкие звуки могут восприниматься на слух, как слышимые из центральной акустической колонки.

Изобретение относится к электроакустике. .

Изобретение относится к области стереофонического звуковоспроизведения и может быть использовано для озвучивания кинотеатральных залов или других помещений большого объема.

Изобретение относится к обработке звукового сигнала, в частности к производству нескольких выходных каналов из меньшего количества входных каналов, например, из одного (моно) канала или двух (стерео) входных каналов

Изобретение относится к средствам воспроизведения трехмерного звукового сопровождения. Технический результат заключается в увеличении точности локализации звукового сигнала. Получают информацию о глубине изображения, указывающую расстояние между, по меньшей мере, одним объектом в сигнале изображения и опорным местоположением. Получают информацию о глубине звука, указывающую расстояние между, по меньшей мере, одним звуковым объектом в звуковом сигнале и опорным местоположением, на основании информации о глубине изображения. Обеспечивают звуковую перспективу для, по меньшей мере, одного звукового объекта на основании информации о глубине звука. 3 н.з. и 18 з.п. ф-лы, 9 ил.

Изобретение относится к средствам воспроизведения стереофонического звука. Технический результат заключается в увеличении точности локализации звукового сигнала. Получают информацию о глубине звука, которая обозначает расстояние между по меньшей мере одним объектом в звуковом сигнале и опорной позицией путем сравнения звуковых сигналов в предыдущей секции и текущей секции. Обеспечивают звуковую перспективу звуковому объекту, выводимому из динамика, на основе информации о глубине звука. Вычисляют мощность каждого частотного диапазона каждой из предыдущих и текущих секций. Подстраивают мощность звукового объекта на основании информации о глубине звука. 3 н. и 12 з.п. ф-лы, 13 ил.

Изобретение относится к аудиосистемам. Технический результат заключается в обеспечении возможности улучшения пространственного восприятия воспроизводимого аудиосистемой аудиосигнала, расширении арсенала доступных аудиоэффектов. Аудиосистема содержит приемник, который принимает входной аудиосигнал. Блок разложения раскладывает аудиосигнал на сигнал переходной составляющей и сигнал непереходной составляющей. Схема вывода затем формирует первый выходной аудиосигнал в ответ на взвешенное объединение сигнала переходной составляющей и сигнала непереходной составляющей. В объединении взвешивание сигнала переходной составляющей отличается от взвешивания сигнала непереходной составляющей. Может быть получен новый сигнал с другим акцентированием конкретных характеристик звука. Подход может быть применен для формирования новых пространственных аудиоканалов из существующего пространственного аудиоканала, как формирования приподнятого канала из аудиосигналов нижнего канала. 2 н. и 11 з.п. ф-лы, 7 ил.

Изобретение относится к средствам для пространственного кодирования аудиообъектов. Технический результат заключается в повышении качества кодирования аудиообъектов. Декодер для генерирования выходного аудиосигнала содержит один или более выходных аудиоканалов, из микшированного с понижением сигнала, содержащего один или более каналов понижающего микширования. Микшированный с понижением сигнал кодирует один или более сигналов аудиообъектов. Декодер содержит определитель порога для определения порогового значения в зависимости от энергии сигнала и/или энергии шума, по меньшей мере, одного из упомянутых одного или более сигналов аудиообъектов и/или в зависимости от энергии сигнала и/или энергии шума, по меньшей мере, одного из упомянутых одного или более каналов понижающего микширования. Более того, декодер содержит блок обработки для генерирования упомянутых одного или более выходных аудиоканалов из упомянутых одного или более каналов понижающего микширования в зависимости от порогового значения. 3 н. и 11 з.п. ф-лы, 4 ил.

Изобретение относится к средствам для представления данных звуковых объектов. Технический результат заключается в улучшении локализации звуковых объектов. Принимают данные звуковоспроизведения, включающие один или несколько звуковых объектов. Звуковые объекты включают звуковые сигналы и связанные метаданные. Метаданные включают по меньшей мере данные положения звукового объекта и данные размера звукового объекта. Вычисляют для звукового объекта значений коэффициента усиления виртуального источника от виртуальных источников при соответствующих местоположениях виртуального источника в пределах области или объема звукового объекта, определенного данными положения звукового объекта и данными размера звукового объекта. Вычисляют набор значений коэффициентов усиления звукового объекта для каждого из множества выходных каналов на основании по меньшей мере частично вычисленных значений коэффициента усиления виртуального источника. Каждый выходной канал соответствует по меньшей мере одному воспроизводящему громкоговорителю. 3 н. и 43 з.п. ф-лы, 22 ил.

Изобретение относится к области обработки информации. Техническим результатом является расширение арсенала технических средств для обработки информации. Система обработки информации включает в себя: модуль распознавания, выполненный с возможностью распознавания первой цели, расположенной в первом месте, на основе множества первых сигналов, детектируемых множеством первых датчиков, размещенных вокруг конкретного пользователя, расположенного во втором месте; модуль идентификации, выполненный с возможностью идентификации первой цели, распознанной модулем распознавания; модуль оценки, выполненный с возможностью оценивать положение конкретного пользователя на основе первого сигнала, детектируемого одним из множества первых датчиков; и модуль обработки сигналов, выполненный с возможностью: модификации каждого из множества вторых сигналов, полученных из множества вторых датчиков, размещенных вокруг первой цели, на основе параметра акустической информации третьего места, отличного от первого и второго места; и вывода модифицированного множества вторых сигналов из множества исполнительных элементов, размещенных вокруг конкретного пользователя, таким образом, что модифицированное множество вторых сигналов локализуется рядом с оцененным положением конкретного пользователя. 4 н. и 13 з.п. ф-лы, 29 ил.

Изобретение относится к акустике, в частности к аудиовизуальным устройствам. Устройство содержит средство формирования изображения, основные и множество вспомогательных громкоговорителей. Вспомогательные громкоговорители расположены наклонно в направлении наружу от секции отображения. Каждый из основных громкоговорителей и вспомогательных громкоговорителей выполнен с возможностью генерирования звука на основе аудиосигналов различных видов. Каждый из вспомогательных громкоговорителей выполнен с возможностью генерирования звука на основе аудиосигналов звукового окружения. Блок обработки выполнен с возможностью генерирования главных аудиосигналов и сигналов звукового окружения. Секция обработки аудиосигнала выполнена с возможностью частичного добавления составляющих аудиосигналов звукового окружения к базовым главным аудиосигналам для генерирования главных аудиосигналов. Устройство выполнено с возможностью регулирования баланса объемного звука между основными и вспомогательными громкоговорителями и содержит блок коррекции для планаризации частотной характеристики, коррекции задержки. При этом громкоговорители расположены по принципу спереди-сзади. Секция коррекции задержки выполнена с возможностью коррекции разницы задержек распространения звука, обусловленной применением фильтра звука. Технический результат – обеспечение системы с эффектом реального звукового окружения. 14 з.п. ф-лы, 24 ил.

Изобретение относится к устройствам декодирования и кодирования информации. Технический результат заключается в повышении эффективности кодирования для получения высококачественного реалистического звука. Устройство кодирования хранит информацию о расположении громкоговорителей в области комментария в РСЕ кодированного битового потока и хранит синхронное слово и идентификационную информацию в области комментария, так что другие публичные комментарии и информация о расположении громкоговорителей, хранящиеся в области комментария, могут различаться друг от друга. Когда кодированный битовый поток декодирован, хранится ли информация о расположении громкоговорителей, определяется на основе синхронного слова и идентификационной информации, хранящихся в области комментария. Аудиоданные, содержащиеся в кодированном битовом потоке, выводятся согласно расположению громкоговорителей в соответствии с результатом определения. 6 н. и 1 з.п. ф-лы, 40 ил.

Изобретение относится к кодированию и декодированию многоканальных звуковых сигналов с использованием пространственных параметров и, в частности, к усовершенствованным принципам для формирования и использования декоррелированных сигналов

Наверх